x

Re: PTNA - News: GTFS-Analyse


Geschrieben von ToniE (Gast) am 18. April 2020 12:15:54: [flux]

Als Antwort auf: PTNA - News: GTFS-Analyse geschrieben von ToniE (Gast) am 23. März 2020 16:30:

ToniE wrote:

Aber aber... man könnte auch alle genauen lat/lon in eine Liste ausgeben und dann wird das vergleichen halt aufwendiger... das man erst die anzahl der werte vergleicht und dann alle einzelwerte voneinander abzieht und die abweichung vergleicht..

... was mit einfällt: was nun kommt ist Blödsinn oder bietet zumindest keine brauchbare Lösung, habe ich beim Schreiben bemerkt

es gibt da in Excel ein Add-In ("Solver", aber man muss ja auch nicht Excel nehmen), mit dem man bei gegebenen x,y-Werten (lat,lon) versuchen kann eine Formel zu erstellen, deren Graph möglichst nah an allen Punkten vorbei läuft - sprich: die Standardabweichung ist möglichst klein.

Im einfachsten Fall per Linearer Regression z.B. f(x) = 2 x + 3

oder sehr komplex z.B.: f(x) = 3 x**4 - 5 x**3 + 2 x**2 + 3 x + 3

und vergleichen kann, ob bei GTFS-Points und OSM-Points die selbe Funktion herauskommt.

... und nun gehen die Pferde mit mir durch ... und werfen mich ab ...

Hindernisse: das funktioniert nur, wenn sich der Bus irgendwie nur von West nach Ost bewegt, keine Schleifen bildet, ...
Es sei denn, man sortiert die (lat/lon)-Paare streng nach aufsteigendem 'lat', wodurch man aber die Charakteristik der Buslinie (Reihenfolge der angefahrenen Haltestellen) komplett verändert und sich zwei Buslinien u.U. wiederum kaum von einander unterscheiden würden.

Na ja: wie gesagt Blödsinn oder im besten Fall keine Lösung.

Generell zum dem Thema: Ich hatte eher an Anzahl und 'Name' der Haltestellen gedacht: mit/ohne Ortsname, normalisiert (d.h. str. -> straße), ...