maettig.com

Thiemos Archiv

Neu in diesem Weblog: Eine Suche nach ähnlich klingenden Einträgen. Dieser Bigramm-Analyse-Kram (siehe auch das entsprechende Filterskript für E-Mailadressen) funktioniert tatsächlich, wie man zum Beispiel sehr schön hier (Einträge zum Thema AOL-CDs) oder hier (Fotos) sehen kann. Achtung! Das Ganze ist experimentell und verdammt rechenintensiv, und sollte deshalb nicht überansprucht werden.
<a href="./?related=1016154600">Hier (Einträge zum 256b.htm-Wettbewerb)</a> noch ein beeindruckendes Beispiel. Wohlgemerkt: In der Datenbank gibt es keinerlei Verknüpfungen zwischen den Texten. Alle Ähnlichkeiten werden auf Anfrage berechnet. Deswegen dauert's auch so lange. :-(
Thiemo
"[...] nobody serious would be doing genetic analysis with PHP" (aus dem PHP-Handbuch). Autsch. ;-)
Thiemo
Ich habe die Funktion entfernt, da sie für die schlechten Ergebnisse, die sie lieferte (abgesehen von obigen Beispielen), viel zu rechenintensiv war.
Thiemo

Kommentare zu diesem Beitrag können per E-Mail an den Autor gesandt werden.

[ ← Zurück zur Übersicht ]

Impressum & Datenschutz