Thiemos Archiv
- Monday, 2003-07-14 21:50
- Neu in diesem Weblog: Eine Suche nach ähnlich klingenden Einträgen. Dieser Bigramm-Analyse-Kram (siehe auch das entsprechende Filterskript für E-Mailadressen) funktioniert tatsächlich, wie man zum Beispiel sehr schön hier (Einträge zum Thema AOL-CDs) oder hier (Fotos) sehen kann. Achtung! Das Ganze ist experimentell und verdammt rechenintensiv, und sollte deshalb nicht überansprucht werden.
- 2003-07-14 23:55
- <a href="./?related=1016154600">Hier (Einträge zum 256b.htm-Wettbewerb)</a> noch ein beeindruckendes Beispiel. Wohlgemerkt: In der Datenbank gibt es keinerlei Verknüpfungen zwischen den Texten. Alle Ähnlichkeiten werden auf Anfrage berechnet. Deswegen dauert's auch so lange. :-(
- Thiemo
- 2003-07-15 09:32
- "[...] nobody serious would be doing genetic analysis with PHP" (aus dem PHP-Handbuch). Autsch. ;-)
- Thiemo
- 2004-06-09 12:44
- Ich habe die Funktion entfernt, da sie für die schlechten Ergebnisse, die sie lieferte (abgesehen von obigen Beispielen), viel zu rechenintensiv war.
- Thiemo
Kommentare zu diesem Beitrag können per E-Mail an den Autor gesandt werden.