x

osmfilter - Probleme mit Umlauten


  1. osmfilter - Probleme mit Umlauten · Lübeck (Gast) · 28.11.2012 13:40 · [flux]

    Moin !

    kann es sein das osmfilter bei --drops-tags Probleme mit Umlauten hat?

    Bsp

    name=Klärwerk

    Wird nicht gefiltert - ist das Tag in den Daten mit ae und der Filter entsprechend, dann ist ok!

    Win7 64bit utf8 ohne bom

    Gruß Jan (smarty)


    • Re: osmfilter - Probleme mit Umlauten · Marqqs (Gast) · 28.11.2012 17:57 · [flux]

      Hallo Jan,

      bist du sicher, dass das "ä" korrekt als UTF-8 ans Programm übergeben wird? Es besteht aus zwei Bytes, Kodierung 0xc3 0xa4.

      Bei mir unter Linux klappt es. Hast du dir die Eingabe des Suchmusters mal in einem Hex-Editor angeschaut?

      Grüße
      Markus


    • Re: osmfilter - Probleme mit Umlauten · mmd (Gast) · 28.11.2012 18:01 · [flux]

      Hi,

      habe auch gerade mal in Win7 mit dem Beispiel aus dem Wiki getestet:

      osmconvert bayern.osm.pbf -o=bayern.o5m
      osmfilter bayern.o5m --keep="admin_level=6 and name=Nürnberger\ Land" -o=nbg_boundaries.osm

      Ergebnis:
      <?xml version='1.0' encoding='UTF-8'?>
      <osm version="0.6" generator="osmfilter 1.2P">
      <bounds minlat="47.26543" minlon="8.968345" maxlat="50.57129" maxlon="13.84947"/>
      </osm>

      => Klappt wohl nicht - getestet direkt von Kommandozeile + Batchfile mit UTF-8 Encoding ohne BOM.

      Wenn ich nach name=Bad\ Kissingen suche geht's aber. Umlaute scheinen also Probleme zu machen.


    • Re: osmfilter - Probleme mit Umlauten · kellerma (Gast) · 28.11.2012 18:08 · [flux]

      mmd wrote:

      => Klappt wohl nicht.

      Das Beispiel klappt unter Linux.


    • Re: osmfilter - Probleme mit Umlauten · wambacher (Gast) · 28.11.2012 18:36 · [flux]

      kellerma wrote:

      mmd wrote:

      => Klappt wohl nicht.

      Das Beispiel klappt unter Linux.

      wundert das wen? 😉


    • Re: osmfilter - Probleme mit Umlauten · mmd (Gast) · 28.11.2012 18:42 · [flux]

      wambacher wrote:

      kellerma wrote:

      mmd wrote:

      => Klappt wohl nicht.

      Das Beispiel klappt unter Linux.

      wundert das wen? 😉

      Das heißt dann wohl: installier dir endlich mal eine Virtual Machine mit Ubuntu und einer gescheiten Datenbank 😛


    • Re: osmfilter - Probleme mit Umlauten · chris66 (Gast) · 28.11.2012 18:50 · [flux]

      Was ist BOM ?


    • Re: osmfilter - Probleme mit Umlauten · mmd (Gast) · 28.11.2012 18:54 · [flux]

      BOM ist die Byte order mark -> http://de.wikipedia.org/wiki/Byte_Order_Mark


    • Re: osmfilter - Probleme mit Umlauten · Marqqs (Gast) · 28.11.2012 19:15 · [flux]

      mmd wrote:

      BOM ist die Byte order mark -> http://de.wikipedia.org/wiki/Byte_Order_Mark

      Ist zwar in UTF-8 definiert, wird aber so gut wie nicht verwendet, weil sie in Byte-orientierter Übertragung eh ohne Sinn ist. Viele Programme – darunter wohl auch osmfilter – können damit auch nichts anfangen.

      Jan:

      Linux verwendet von Haus aus den ISO-genormten Zeichensatz UTF-8. Windows nutzt meines Wissens normalerweise weder das ebenfalls genormte ASCII-Format noch UTF-8, sondern ein Microsoft-eigenes Format. Bin mir da aber nicht so sicher, weil ich mich nicht so viel mit Windows beschäftige.

      Bist du sicher, dass du UTF-8 verwendest?

      Ich werde gleich mal prüfen, ob das Problem unter Wine ebenfalls auftritt. Vielleicht liegts ja doch an osmfilter, wer weiß das schon zu 100%? :-)


    • Re: osmfilter - Probleme mit Umlauten · chris66 (Gast) · 28.11.2012 19:42 · [flux]

      Marqqs wrote:

      Windows nutzt meines Wissens normalerweise weder das ebenfalls genormte ASCII-Format noch UTF-8, sondern ein Microsoft-eigenes Format.

      In der GUI nutzt Windows mittlerweile auch UTF (16?). Man kann Dateien anlegen, die z.B. Umlaute und russische Zeichen im Dateinamen enthalten.

      In der Shell (cmd) ist standardmäßig allerdings der alte IBM Zeichensatz (ibm850) eingestellt.

      chcp -> 850

      Christian


    • Re: osmfilter - Probleme mit Umlauten · mmd (Gast) · 28.11.2012 19:45 · [flux]

      chris66 wrote:

      In der Shell (cmd) ist standardmäßig allerdings der alte IBM Zeichensatz (ibm850) eingestellt.

      chcp -> 850

      Ich hatte eben auch schonmal chcp 65001 für UTF-8 auf der Kommandozeile probiert, hat aber ebenfalls nicht funktioniert. Weiterhin ohne Erfolg: Umlaut als \c3\a4 angeben.


    • Re: osmfilter - Probleme mit Umlauten · Marqqs (Gast) · 28.11.2012 19:50 · [flux]

      Dann hilft bei Windows wohl nur, die Parameter im UTF-8-Format in eine Datei zu schreiben und mit --parameter-file=... einzubinden. Das jedenfalls hat bei mir unter Wine geklappt:

      --keep=
      name=Klärwerk


    • Re: osmfilter - Probleme mit Umlauten · mmd (Gast) · 28.11.2012 19:58 · [flux]

      Marqqs wrote:

      Dann hilft bei Windows wohl nur, die Parameter im UTF-8-Format in eine Datei zu schreiben und mit --parameter-file=... einzubinden. Das jedenfalls hat bei mir unter Wine geklappt:

      --keep=
      name=Klärwerk

      Confirmed, danke! Das klappt so auch unter Win7:

      osmfilter bayern.o5m --parameter-file=parmfile.txt -o=nbg_boundaries.osm

      parmfile.txt (in utf-8 ohne bom):

      --keep=
      admin_level=6
      name=Nürnberger\␣Land
      

    • Re: osmfilter - Probleme mit Umlauten · chris66 (Gast) · 28.11.2012 20:00 · [flux]

      Eventuell klappt: chcp 1252 (entspricht iso-8859-1) und die Umlaute in ISO einzugeben.

      Wobei man dann natürlich eine kompatible Schriftart z.B. LucidaConsole einstellen sollte.


    • Re: osmfilter - Probleme mit Umlauten · Lübeck (Gast) · 28.11.2012 22:49 · [flux]

      Hi

      Utf-8 ohne bom

      +1

      Sollten wir ins Wiki mit aufnehmen.

      Gruß Jan


    • Re: osmfilter - Probleme mit Umlauten · wambacher (Gast) · 29.11.2012 09:33 · [flux]

      Marqqs wrote:

      Dann hilft bei Windows wohl nur, die Parameter im UTF-8-Format in eine Datei zu schreiben und mit --parameter-file=... einzubinden. Das jedenfalls hat bei mir unter Wine geklappt:

      --keep=
      name=Klärwerk

      wie heißt es so schön: "wir haben die Lösung für die Probleme, die sie nicht hätten, wenn sie nicht unsere Produkte einsetzen würden"

      Gruß,
      Walter