maettig.com

Thiemos Archiv

Mehr Fremdverweise-Statistik:
  • Der Anteil eines Parameters an einer URL lässt sich prozentual ausdrücken. URLs mit sehr vielen, sehr langen Parametern stammen mit hoher Wahrscheinlichkeit von Suchmaschinen oder anderen dynamischen Seiten. Fremdverweise von derartigen Quellen sind (für mich) uninteressant. Ein guter Grenzwert mit praktisch keinen »false positives« ist 38% (gilt nur für meine Seiten). Die uninteressante - da kein »Permalink« auf einen einzelnen Beitrag sondern nur eine Einstiegsseite - Adresse http://renephoenix.de/index.php?kid=52×tamp=1081786686 besteht z.B. zu 47% aus Parametern (das Fragezeichen mitgerechnet).
  • Die Länge des Parameters lässt sich auch absolut auswerten. Ein guter Grenzwert sind 24 Zeichen. Dadurch werden u.a. auch Links wie der oben gezeigte sowie Links aus Foren blockiert, was ich jedoch nicht als »false positives« werte.
  • Der verrückteste Referer der letzten Wochen kommt vom Literatur-Café.
sollte ich den Namen des Parameters kürzen? time oder ts würde eigentlich auch reichen ...

Allerdings dürfte im prozentualen Fall einer mit einer kurzen Domain weniger Parameter mitliefern. Ist es in dem Falle nicht sinnvoller die Anzahl der Parameter zu berücksichtigen?

Nächstes Problem: auch Suchmaschinen könnten auf mod_rewrite und Co umsteigen ...
René
> Suchmaschinen könnten auf mod_rewrite umsteigen

Das tun sie zum Teil schon. Wenn man darüber nachdenkt, macht das allerdings keinen Sinn.

Suchmaschinen und ähnliches werden ohnehin per Blacklist abgedeckt. Mein Ziel ist eine geschickte Kombination mehrere Methoden (u.a. auch MT-Blacklist), um das "Rauschen" in den Fremdverweisen so stark zu reduzieren, dass ich sie mir zur Moderation per E-Mail zusenden lassen kann.
Thiemo
kid entspricht der Kategorie-ID. Und da der Inhalt in einer Kategorie weiterläuft, gibt es den Zeitstempel. Ein einzelner Beitrag wäre die bid (Beitrags-ID). D.h. nur der Zeitstempel würde zu dieser Unterscheidung nicht reichen ... *überleg*

angenommen Zeitstempel wäre eindeutig, könnte man aus dem Zeitstempel die Kategorie entnommen werden. Das Problem hierbei ist allerdings: ich habe vom Kalenderelement auch Links mit Zeitstempeln im Umlauf, die nicht in der DB vorhanden sind.
René
Wir reden gerade von zwei verschiedenen Dingen. Der oben gezeigte Link ist kein "Permalink" auf einen einzelnen Beitrag (wie ich fälschlicherweise dachte) sondern nur einer, der durch Blättern im Archiv entsteht. Solche Links fallen bei mir ebenfalls in die Kategorie "zu ignorieren". Es gibt also keinen Grund, an dieser URL etwas zu ändern. Im Gegenteil.
Thiemo

Kommentare zu diesem Beitrag können per E-Mail an den Autor gesandt werden.

[ ← Zurück zur Übersicht ]

Impressum & Datenschutz