Lemke D, Hense HW
Research article in edited proceedings (conference) | Peer reviewedHintergrund: Umwandlung von Adressdaten in geographische Koordinaten nimmt eine wichtige Stel-lung im Bereich disease surveillance, individueller Expositionsabschätzung und -modellierung ein. Ziel der Untersuchung ist ein Vergleich der frei verfügbaren Geokodierungsdienste von Google und OSM im Hinblick auf Übereinstimmung und räumliche Präzision (positional accuracy).Methode:Bei den Geokodierungsdiensten handelt es sich Webservices, die mittels eines Client-Programmes (VB, Java oder R) angesprochen werden können. Als Referenzadressen (Goldstandard) wurden bereits von IT.NRW bereinigte und georeferenzierte Adressen (Krebsregister NRW) benutzt. Dieser Datensatz enthält Originaladresse, bereinigte Adresse, Geokoordinaten sowie einen 4-stufigen Qualitätsindikator zur Angabe der Bereinigung. Zusätzlich wurden den Adressen die Angabe: urban oder rural mit Hilfe der CORINE Landnutzungsdaten zugeteilt. Stratifiziert nach Qualität der Adressen und urban/rural-Indikator wurden zufällig jeweils 2500 Adressen gezogen (insgesamt 20 000 Adressen). Für den qualitativen Vergleich wurden die Rate der übereinstimmenden Adressen (matching rate) berechnet sowie die räumliche Abweichungen der Adressen von den Original-Koordinaten.Ergebnisse:Beide Dienste zeigen eine Abnahme der Übereinstimmungsrate und räumlichen Präzision mit Abnahme der Adressqualität und Urbanität. Bei der niedrigsten Qualitätsstufe (Verortung nur auf Gemeindeniveau) war bei beiden Diensten wieder eine Zunahme der Übereinstimmungsrate zu ver-zeichnen nicht aber der räumlichen Präzision. Google zeigt gegenüber OSM eine höhere Überein-stimmung der Adressen (>93% vs.>73%) über alle Qualitätsstufen. Bei der räumliche Abweichung der Koordinaten zeigt Google geringere Werte, im Median: <9m vs.<175.8 in den drei höchsten Quali-tätsstufen (Verortung bis auf Straßenniveau möglich). Bei der niedrigsten Qualitätsstufe (Verortung auf Gemeindeniveau) zeigt Google im ländlichen Raum stärkere Abweichungen als OSM (Median: 2377m vs.1784m).Fazit: Google zeigt eine deutlich höhere Übereinstimmungsrate der Adressen sowie eine höhere räumliche Präzision der Koordinaten gegenüber OSM. Allerdings beschränkt Google die Nutzung seines Dienstes auf 2500 Adressen/Tag. OSM dagegen hat ein unbeschränktes Adressenvolumen und es ist möglich diesen Dienst auf einem lokalen Server laufen zu lassen (sensiblen Daten).
Lemke, Dorothea | FB14 - Faculty of Geosciences (FB14) |