maettig.com

Thiemos Archiv

"Gerade weil Spammer strohdumm sind, glaube ich ja, daß [Fakemail] funktioniert."
Der Schockwellenreiter nimmt mir damit - zu Recht - etwas den Wind aus den Segeln, noch bevor ich richtig anfangen konnte. Dass sich seine gefälschten E-Mailadressen mit den einfachsten Mitteln filtern lassen, ist natürlich jedem klar. Wie das aussehen kann, möchte ich hier einmal anhand eines Beispiel-Filterkriptes auf der Basis von PHPs getmxrr() demonstrieren. Flames dazu sind willkommen. ;-)
Übrigens sollte jetzt niemand auf die Idee kommen, E-Mailadressen mit echten Domainnamen zu generieren. Viele Server haben das sogenannte "Fetch all" aktiviert. Das heißt, egal was vor dem "@" steht, alles kommt an. Und genau das soll es ja nicht.
Wesentlich interessanter als Skript 1 ist eine einfache Methode der Textanalyse, die ich vor Jahren verwendet habe, um gut "klingende" Kunstbegriffe zu erzeugen. Das zweite Beispiel-Filterskript auf Basis dieser Textanalyse errechnet sozusagen, wie die E-Mailadressen "klingen". Das Rauschen, das durch die von allen Fakemail-Skripten verwendeten Zufallsfunktionen entsteht, ist typisch und erstaunlich gut zu erkennen.
Doch halt, es geht weiter. Ein Blick in meinen Spamverdachts-Ordner zeigt schnell, dass die Spammer mit den selben Methoden arbeiten. Ihre Absenderadressen haben zwar echte Hostnamen (somit fällt Filtermethode 1 flach), aber der Mailboxname besteht aus Zufallszeichen. Skript 2 kann Spam filtern. Bingo!
Falls jemand eine gute Idee hat, wie man das z.B. in The Bat! einbauen könnte, ...?
Was ich da mache, so musste ich eben erstaunt feststellen, ist eine N-Gramm-Analyse (genauer: Bigramm). Derartiges findet u.a. in der Kryptographie, der Identifikation unbekannter Sprachen und der Rechtschreibkorrektur Anwendung. Witzig.
Thiemo
Zum Thema Spambots "spammen": Das einzige, was das bewirkt ist höherer Internet-Traffic, ich halte davon gar nichts.
tom

Kommentare zu diesem Beitrag können per E-Mail an den Autor gesandt werden.

[ ← Zurück zur Übersicht ]

Impressum & Datenschutz