maettig.com

Thiemos Archiv

Etwas Statistik zum Thema Referer-Spam.
  • Microsofts Angriff auf die Suchmaschinenfront läuft auf Hochtouren und belastet in erschreckenden Ausmaßen unsere Statistiken. Der msnbot schlug in den vergangenen drei Monaten hier auf meinen Seiten sage und schreibe 51000 mal ein. Das sind zum Teil über 900 Zugriffe pro Tag. Im selben Zeitraum kam der Googlebot dagegen nur 16000 mal vorbei.
  • Frank wird bei der Google Images-Suche nach "doof" auf Seite 3 gefunden.
  • Der weitaus größte Teil meines Referer-Spams (der übrigens nirgends angezeigt wird) enthält als Browserangabe (User-Agent) den real nicht existierenden Text "Internet Explorer 6.0" (sonst nichts). Danach lässt es sich super filtern. Danke, liebe Spammer.
  • Der restliche Spam arbeitet mit verschiedenen Browserbezeichnungen, oftmals "Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)". Einzig erkennbare Regel: Es ist immer Internet Explorer (natürlich).
  • Die Angabe "Accept-Language" ist bei Referer-Spam praktisch immer leer. Dies ist kein sicheres Kriterium, aber zumindest ein Attribut mit einer hohen Trefferwahrscheinlichkeit.
  • Nahezu 100% des Referer-Spams wird auf meinen Artikel abgefeuert, in dem das Wort "Referer" (oder "Referrer") auftaucht. Einige wenige Treffer fallen auch auf die Startseite. Andere Seiten erhalten praktisch keinen Referer-Spam. Tipp: Das Wort nicht verwenden und statt dessen mit "andere Seiten, die auf diesen Artikel verweisen" oder ähnlich umschreiben.
  • Der größte Teil meines Referer-Spams kommt aus dem IP-Bereich 198.26.*.* bzw. von den Maschinen WCS1-MOFFETT.NIPR.MIL und WCS2-MOFFETT.NIPR.MIL ("Nipr.mil is [...] a gateway for hundreds of U.S. military domains in order to hide their identities").
  • Gespamt wird den ganzen Tag, allerdings überdurchschnittlich oft zwischen 21 und 10 Uhr, also nachts.
Spannend wäre auch eine Untersuchung, inwiefern sich aus Klickpfaden (die bei jeder Art von Spam – auch Kommentar-Spam – die Länge 0 haben müssten) etwas ableiten lässt (die entsprechende Auswertung folgt evtl. noch).
MS Suchmaschine...
Kürzlich wurde Pouet.net von MSN, Google und noch ein paar Bots gleichzeitig "beschossen", was dazu führte, daß die Webseiten für eine Stunde vom Netz genommen werden mußten und (juchu positiv) endlich die Querys überarbeitet wurden und jetzt SQL-Caching zum Einsatz kommt.

Microsoft-Suche allgemein... Nunja, erst wird mit einem guten Produkt (manchmal, nicht immer) der Markt aufgemischt, wenn er dann allerdings von MS dominiert wird, fehlt teilweise die Motivation. Windows weißt große Löcher auf, deren Schließung manchmal sehr lange (an-)dauert, einige Funktionen sind arg verbesserungswürdig; der IE war mal ein guter Browser, jetzt ist er nur noch das Tor zum eigenen Rechner - von außen...
Warten wir ab, wie es mit der Suche aussehen wird.

Übrigens, SPAM von .mil? US-Militärrechner? Heftig, erklärt aberauch die Uhrzeiten ein wenig, zieh einfach 6-10 Stunden ab und die Daten relativieren sich ein wenig, vielleicht ein Armeeangehöriger, der den Dienstrechner nach Dienst-/Büroschluß misbraucht.
erstaunteRené

Kommentare zu diesem Beitrag können per E-Mail an den Autor gesandt werden.

[ ← Zurück zur Übersicht ]

Impressum & Datenschutz