Müller F, Lemke D
Forschungsartikel in Sammelband (Konferenz) | Peer reviewedHintergrundKrebs-Cluster sind ein wichtiges und sehr kontrovers diskutiertes Thema [1]. Häufig werden epidemiologische Krebsregister mit Cluster-Anfragen aus der Bevölkerung oder von Gesundheitseinrichtungen konfrontiert. Während die Analyse ob es sich bei dem vermuteten Cluster um eine wirkliche, d.h. statistisch signifikante, Inzidenzerhöhung in der Region handelt, standardisiert mit Hilfe der Daten aus den Krebsregistern abläuft, findet die Suche nach potentiellen, räumlichen Ursachen häufig unstrukturiert durch das Zusammentragen von Informationen aus dem Internet statt, wenn das Auftreten der Krebsfälle in dem vermuteten Cluster tatsächlich überzufällig ist. Die Suche nach potentiellen Karzinogenen basiert dabei auf den Arbeiten/Monographien der IARC (International Agency for Research on Cancer) [3], die aber keine direkte räumliche Verknüpfung besitzen. Des Weiteren sind Umweltdaten online verfügbar, die aber häufig unterschiedliches Datenformat aufweisen und von verschiedenen, verteilten Datenquellen kommen. Ziel dieser vorliegenden Arbeit ist es eine prototypische (Web-)Anwendung zu entwickeln, die das Experten-Wissen der IARC Monographien mit epidemiologischen Daten und Umweltdaten mithilfe der semantischen Technologie Linked Data räumlich verknüpft, um ein strukturiertes Vorgehen bei Cluster-Untersuchungen zu ermöglichen.Der entwickelte Prototyp, für die Beispielregion Westfalen-Lippe, dient als Erkundungs- und Informationstool, der per textlichen, grafischen Informationen und dynamischen Geovisualisierungen eine erste Übersicht von epidemiologischen Daten und Umweltdaten bei verdächtigen Krebsclustern in der Region ermöglicht.Daten und MethodenOffene Datenquellen, die Informationen über Faktoren von krebsrelevanten Ursache-Wirkungs-Beziehungen beinhalten, sind über verschiedene Web-Services verfügbar z. B. Emissionsdaten vom LANUV NRW [4]. In der vorliegenden Arbeit sind diese Daten exemplarisch als Linked Data encodiert worden, d. h. im Beispiel Emissionsdaten, dass Ressourcen z. B. eine Industrieanlage und deren dazugehörigen Datenzusammenhänge (z. B. welche Art und welche Menge von Substanzen emittiert werden) als RDF (Resource Description Framework) [9] strukturiert wurden. Darüber hinaus wurden die erstellten Datensätze mit externen Informationen verlinkt z. B. mit Hintergrundinformationen von chemischen Stoffen.Weiterhin ist aus den Klassifikationen der IARC Monographien eine Domain-Ontologie modelliert worden, um Ursache-Wirkungs-Beziehungen über mögliche Karzinogene darzustellen. Bei einer Domain-Ontologie handelt es sich im vorliegenden Kontext allgemein um eine formale Definition der grundlegenden Konzepte eines spezifischen Themengebietes und deren Beziehungen, die maschinell auswertbar ist [6]. Die vorliegende Ontologie repräsentiert dabei Elemente der Ursache-Wirkungs-Kette: Krebstyp, Karzinogene, Emissionsquellen, Emissionsprozesse, Transportwege, exponierte Orte, exponierte Gruppen und Geschlecht.Die Verknüpfung von Datensätzen mit dem strukturiertem Experten-Wissen der IARC über krebsbezogene Ursache-Wirkungs-Beziehungen ermöglicht so gezielte räumliche Abfragen über verdächtige Karzinogene in der betreffenden Region. Die semantische Modellierung der Daten und Integration in die Webanwendung basiert komplett auf Open Source Software (u. a. Protegé [8], Apache Jena [2], OSM [7] & Leaflet [5]).Ergebnisse und SchlussfolgerungDie erstellte Anwendung ermöglicht , aus ursprünglich verteilten, isolierten umweltbezogenen und epidemiologischen Datensätzen, mit Hilfe von Linked Data räumlich und zeitlich fokussierte Abfragen durchzuführen. Die strukturierte Abfragemöglichkeit der Karzinogene (und deren Abstufungen) reduziert die Fehleranfälligkeit bei der Suche nach möglichen Ursachen. Ein weiteres Resultat ist die Domain Ontology, die das Wissen über Ursache-Wirkungs-Beziehungen, aus den IARC Monographien aufzeigt. Die Webanwendung ist auf Github (https://github.com/lodum/CancerExplorer) zugänglich.
Lemke, Dorothea | Fachbereich 14 Geowissenschaften (FB14) |