x

Automatische Korrektur von Fehlern in addr:* (1) - Strasse, Str. & Co.


Geschrieben von Oli-Wan (Gast) am 02. Januar 2013 22:11:38: [flux]

Hallo zusammen,

nachdem die Korrektur von Straßennamen an den Straßen selbst nun stabil läuft, möchte ich die nächste Baustelle angehen: Fehler in addr:*. Da die hier aufgelisteten Ideen ein breites Spektrum recht unterschiedlicher Korrekturen umfassen, werde ich jede umsetzungsreife Idee als eigenen Vorschlag hier posten.

In diesem Faden geht es darum, dieselben Korrekturen, die bereits auf name-Tags von Straßen angewandt werden, nun auf addr:street-Tags zu übertragen, im Kern also um die Ersetzung Straße/Str./Str -> Straße, aber auch um die später hinzugefügten Ersetzungsregeln (Stra0e etc.; überflüssiger Leerraum).

Die folgenden Angaben gelten für alle geplanten Korrekturen in addr:*-Tags (führe ich bei den weiteren Vorschlägen nicht mehr auf).

Anwendungsbereich
Alle Objekte mit addr:*-Tags; keine weitere Beschränkung.
Geographisch: Deutschland, grenzgenau. (Technische Details spare ich mir an dieser Stelle; nachzulesen im Faden zu den Straßennamen-Korrekturen.)

Ausführungsmodus und -intervall
Vorerst Probebetrieb mit größenbeschränkten Änderungssätzen (20 Objekte), ca. einer pro Tag. Später im Normalbetreib regelmäßige Ausführung in noch zu bestimmenden Abständen.

Account
Wall·E

Dokumentation
Wikiseite (im Aufbau) und vorläufig dieser Faden
Protokoll unter http://osmac.bplaced.net/wall-e/wall-e-log.txt

Nun zu den spezifischen Einzelheiten dieses Vorschlags.

Ersetzungsregeln
Die Ersetzungsregeln sind völlig analog zu jenen bei den Straßennamen-Korrekturen und betreffen in diesem Fall das addr:street-Tag:

(1)␣Str.␣->␣Straße
(2)␣str.␣->␣straße
(3)␣Strasse/Str␣->␣Straße
(4)␣strasse/str␣->␣straße
(5)␣STraße,␣sTraße␣als␣isoliertes␣Wort␣->␣Straße
(6)␣Stra0e,␣Stra9e,␣Stra-e␣->␣Straße
(7)␣weitere␣Fälle,␣in␣denen␣das␣ß␣in␣Straße␣durch␣ein␣eines␣der␣folgenden␣Zeichen␣ersetzt␣ist:
kleines␣beta,␣großes␣Eszet,␣Unicode␣replacement␣character
->␣Straße

(3) und (4) nur am Wortende; (6) und (7) analog auch für die klein geschriebene Version.

Es gelten die gleichen Ausnahmen wie bei den Straßennamen: Gleistrasse, Gastrasse und eine Reihe von "-strassen", bei denen ein Schreibfehler von -st-gasse vorliegen könnte (auf der Wikiseite im Detail aufgeführt). Ferner wird eine eigene Sperrliste geführt, sodaß jedes Objekt nur einmal angefaßt wird (analog zum Vorgehen bei der Straßennamen-Korrektur).

Wenn addr:street ohnehin bearbeitet wurde, wird in diesem Tag auch überschüssiger Leerraum am Anfang oder Ende des Tags entfernt (unabhängig vom restlichen Inhalt des Tags; die Namen dienen hier nur der Illustration).

(A1)␣"␣A-Straße"␣->␣"A-Straße",␣"B-Straße␣"␣->␣"B-Straße",␣"␣C-Straße␣"␣->␣"C-Straße",
wobei␣der␣Leerraum␣jeweils␣aus␣einem␣oder␣mehreren␣Leerzeichen␣oder␣Tabs␣bestehen␣kann.

Simulation
Hier das Protokoll eines Probelaufs ohne Hochladen. Mehrere Objekte mit dem gleichen Straßennamen habe ich der Übersichtlichkeit halber entfernt. Beim zweiten Eintrag liegt mal wieder der hier nicht darstellbare Unicode replacement character vor; ansonsten ist in diesem kleinen Auszug mit Strasse, Str., Stra0e, Stra9e und Stra-e schon so ziemlich alles dabei.

osm-mechedit-fix-addr␣run␣Wed␣Jan␣02␣22:00:32␣2013
editing␣node␣#308058715,␣http://www.openstreetmap.org/browse/node/308058715
addr:street␣tag␣modified:␣"Ibbenbuerener␣Strasse"␣->␣"Ibbenbuerener␣Straße"
editing␣node␣#559422772,␣http://www.openstreetmap.org/browse/node/559422772
addr:street␣tag␣modified:␣"Obere␣Hindenburgstrae"␣->␣"Obere␣Hindenburgstraße"
editing␣node␣#622142742,␣http://www.openstreetmap.org/browse/node/622142742
addr:street␣tag␣modified:␣"Johannes-Müller-Stra0e"␣->␣"Johannes-Müller-Straße"
editing␣node␣#669135677,␣http://www.openstreetmap.org/browse/node/669135677
addr:street␣tag␣modified:␣"Zedeliusstrasse"␣->␣"Zedeliusstraße"
editing␣node␣#880634927,␣http://www.openstreetmap.org/browse/node/880634927
addr:street␣tag␣modified:␣"Möllner␣Landstrasse␣"␣->␣"Möllner␣Landstraße"
editing␣node␣#891033785,␣http://www.openstreetmap.org/browse/node/891033785
addr:street␣tag␣modified:␣"Baruther␣Stra9e"␣->␣"Baruther␣Straße"
editing␣node␣#950639279,␣http://www.openstreetmap.org/browse/node/950639279
addr:street␣tag␣modified:␣"Frohburger␣Stra-e"␣->␣"Frohburger␣Straße"
editing␣node␣#982867290,␣http://www.openstreetmap.org/browse/node/982867290
addr:street␣tag␣modified:␣"Westendstra0e"␣->␣"Westendstraße"
editing␣node␣#1108925540,␣http://www.openstreetmap.org/browse/node/1108925540
addr:street␣tag␣modified:␣"Flügelstr."␣->␣"Flügelstraße"
editing␣node␣#1138329241,␣http://www.openstreetmap.org/browse/node/1138329241
addr:street␣tag␣modified:␣"Westendstra0e"␣->␣"Westendstraße"
editing␣node␣#1472452401,␣http://www.openstreetmap.org/browse/node/1472452401
addr:street␣tag␣modified:␣"Lerchenstra0e"␣->␣"Lerchenstraße"
addr:street␣tag␣modified:␣"Spielberger␣Stra0e"␣->␣"Spielberger␣Straße"
editing␣node␣#1588224057,␣http://www.openstreetmap.org/browse/node/1588224057
addr:street␣tag␣modified:␣"Kaiserstra0e"␣->␣"Kaiserstraße"
editing␣node␣#1653437795,␣http://www.openstreetmap.org/browse/node/1653437795
addr:street␣tag␣modified:␣"Häherstra0e"␣->␣"Häherstraße"

Edits:
Tippfehler in Regel (4)
Dokumentation


Antworten: