x

Re: Wall·E: Automatische Korrektur allgemeiner Tagging-Tippfehler?


Geschrieben von Oli-Wan (Gast) am 11. Oktober 2013 11:44:04: [flux]

Als Antwort auf: Wall·E: Automatische Korrektur allgemeiner Tagging-Tippfehler? geschrieben von Oli-Wan (Gast) am 07. Oktober 2013 21:10:

Oli-Wan wrote:

wambacher wrote:

PostgreSQL verwendet neben die üblichen Pattern-Mechanismen auch noch andere Fuzzi-Searches: http://www.postgresql.org/docs/current/ … match.html

Nur mal so als Idee was es sonst noch gibt. Ich verwende die natürlich, da ich PostgreSQL benutze, aber das wäre hier wohl etwas zuviel verlangt 😉

Danke für den Tipp. Habe mir gerade mal ein Soundex geschrieben und ausprobiert; leider mit mäßigen Ergebnissen. ... Eventuell ist Metaphone hier besser, werde ich bei Gelegenheit evtl. auch noch ausprobieren.

Gerade getan. Metaphone findet in der Tat weniger totalen Unfug als Soundex, aber die sinnvollen Zuordnungen stehen größtenteils bereits auf der Liste. Insbesondere der Austausch von Vokalen ändert auch den Metaphone-Code häufig überhaupt nicht.
War in jedem Fall interessant, sich einmal mit diesen Algorithmen zu befassen. Eventuell behalte ich Metaphone auch im Programm drin, ein paar Kandidaten hat er ja doch noch geliefert. Hier nochmal einige weitere Ergänzungen für den Regelsatz; die meisten wurden zwar mit den anderen Methoden auch schon gefunden, ich habe sie aber im großen Haufen übersehen.

amnety␣(1)
-->␣amenity␣(1180611)
baoat␣(4)
-->␣boat␣(21156)
cliub␣(1)
-->␣club␣(392)
cuiseine␣(1)
-->␣cuisine␣(53559)
intermittend␣(7)
-->␣intermittent␣(1417)
operater␣(1)
-->␣operator␣(308297)
propsoed␣(1)
-->␣proposed␣(5113)
tactilie_paving␣(8)
-->␣tactile_paving␣(15116)
trycktape␣(2)
-->␣tracktype␣(1551734)
whitwater␣(1)
-->␣whitewater␣(756)
tinnel␣(1)
-->␣tunnel␣(125528)

Zur allgemeinen Unterhaltung auch noch einige ausgewählte Kuriositäten aus dem Hause Metaphone:

bascule␣(1)
-->␣bicycle␣(683084)
bit␣(30)
-->␣boat␣(21156)
casino␣(1)
-->␣cuisine␣(53559)
cats␣(2)
-->␣goods␣(4507)
coins␣(2)
-->␣genus␣(7045)
died␣(3)
-->␣TODO␣(1964)
-->␣todo␣(1212)
diet␣(5)
-->␣TODO␣(1964)
-->␣todo␣(1212)
highres␣(3)
-->␣horse␣(67616)
litter␣(2)
-->␣ladder␣(439)
lotterie␣(1)
-->␣ladder␣(439)
police␣(9)
-->␣place␣(119095)