Thiemos Archiv
- Friday, 2003-07-11 19:49
- "
Gerade weil Spammer strohdumm sind, glaube ich ja, daß [Fakemail] funktioniert.
"
Der Schockwellenreiter nimmt mir damit - zu Recht - etwas den Wind aus den Segeln, noch bevor ich richtig anfangen konnte. Dass sich seine gefälschten E-Mailadressen mit den einfachsten Mitteln filtern lassen, ist natürlich jedem klar. Wie das aussehen kann, möchte ich hier einmal anhand eines Beispiel-Filterkriptes auf der Basis von PHPs getmxrr() demonstrieren. Flames dazu sind willkommen. ;-)
Übrigens sollte jetzt niemand auf die Idee kommen, E-Mailadressen mit echten Domainnamen zu generieren. Viele Server haben das sogenannte "Fetch all" aktiviert. Das heißt, egal was vor dem "@" steht, alles kommt an. Und genau das soll es ja nicht.
Wesentlich interessanter als Skript 1 ist eine einfache Methode der Textanalyse, die ich vor Jahren verwendet habe, um gut "klingende" Kunstbegriffe zu erzeugen. Das zweite Beispiel-Filterskript auf Basis dieser Textanalyse errechnet sozusagen, wie die E-Mailadressen "klingen". Das Rauschen, das durch die von allen Fakemail-Skripten verwendeten Zufallsfunktionen entsteht, ist typisch und erstaunlich gut zu erkennen.
Doch halt, es geht weiter. Ein Blick in meinen Spamverdachts-Ordner zeigt schnell, dass die Spammer mit den selben Methoden arbeiten. Ihre Absenderadressen haben zwar echte Hostnamen (somit fällt Filtermethode 1 flach), aber der Mailboxname besteht aus Zufallszeichen. Skript 2 kann Spam filtern. Bingo!
Falls jemand eine gute Idee hat, wie man das z.B. in The Bat! einbauen könnte, ...? - 2003-07-14 14:06
- Was ich da mache, so musste ich eben erstaunt feststellen, ist eine N-Gramm-Analyse (genauer: Bigramm). Derartiges findet u.a. in der Kryptographie, der Identifikation unbekannter Sprachen und der Rechtschreibkorrektur Anwendung. Witzig.
- Thiemo
- 2003-07-15 07:50
- Zum Thema Spambots "spammen": Das einzige, was das bewirkt ist höherer Internet-Traffic, ich halte davon gar nichts.
- tom
Kommentare zu diesem Beitrag können per E-Mail an den Autor gesandt werden.