Thiemos Archiv
- Tuesday, 2004-12-21 16:30
- Mehr Fremdverweise-Statistik:
- Der Anteil eines Parameters an einer URL lässt sich prozentual ausdrücken. URLs mit sehr vielen, sehr langen Parametern stammen mit hoher Wahrscheinlichkeit von Suchmaschinen oder anderen dynamischen Seiten. Fremdverweise von derartigen Quellen sind (für mich) uninteressant. Ein guter Grenzwert mit praktisch keinen »false positives« ist 38% (gilt nur für meine Seiten). Die uninteressante - da kein »Permalink« auf einen einzelnen Beitrag sondern nur eine Einstiegsseite - Adresse
http://renephoenix.de/index.php?kid=52×tamp=1081786686
besteht z.B. zu 47% aus Parametern (das Fragezeichen mitgerechnet). - Die Länge des Parameters lässt sich auch absolut auswerten. Ein guter Grenzwert sind 24 Zeichen. Dadurch werden u.a. auch Links wie der oben gezeigte sowie Links aus Foren blockiert, was ich jedoch nicht als »false positives« werte.
- Der verrückteste Referer der letzten Wochen kommt vom Literatur-Café.
- Der Anteil eines Parameters an einer URL lässt sich prozentual ausdrücken. URLs mit sehr vielen, sehr langen Parametern stammen mit hoher Wahrscheinlichkeit von Suchmaschinen oder anderen dynamischen Seiten. Fremdverweise von derartigen Quellen sind (für mich) uninteressant. Ein guter Grenzwert mit praktisch keinen »false positives« ist 38% (gilt nur für meine Seiten). Die uninteressante - da kein »Permalink« auf einen einzelnen Beitrag sondern nur eine Einstiegsseite - Adresse
Kommentare zu diesem Beitrag können per E-Mail an den Autor gesandt werden.
Allerdings dürfte im prozentualen Fall einer mit einer kurzen Domain weniger Parameter mitliefern. Ist es in dem Falle nicht sinnvoller die Anzahl der Parameter zu berücksichtigen?
Nächstes Problem: auch Suchmaschinen könnten auf mod_rewrite und Co umsteigen ...
Das tun sie zum Teil schon. Wenn man darüber nachdenkt, macht das allerdings keinen Sinn.
Suchmaschinen und ähnliches werden ohnehin per Blacklist abgedeckt. Mein Ziel ist eine geschickte Kombination mehrere Methoden (u.a. auch MT-Blacklist), um das "Rauschen" in den Fremdverweisen so stark zu reduzieren, dass ich sie mir zur Moderation per E-Mail zusenden lassen kann.
angenommen Zeitstempel wäre eindeutig, könnte man aus dem Zeitstempel die Kategorie entnommen werden. Das Problem hierbei ist allerdings: ich habe vom Kalenderelement auch Links mit Zeitstempeln im Umlauf, die nicht in der DB vorhanden sind.