Wie macht man heute Webstatistik?
Ich erinnere mich noch, wie ich vor vielen Jahren - rund anderthalb Jahrzehnten - das Interesse an damals von mir zum Download bereitgestellten Dateien gemessen habe: Jeden Monat lud ich mir von meinem Webspaceanbieter die dort generierten Logfiles herunter, ließ auf meinem heimischen Rechner ein Auswertungsprogramm laufen und ergänzte liebevoll die Anzahl der jeweiligen Downloads im vergangenen Monat in Klammern hinter dem Namen der Datei. Anfangs fand ich das total spannend, nach einiger Zeit ziemlich nervig, und später bin ich dann auf ein Zählscript umgestiegen (Umleitung des Dateiabrufs über ein PHP-Script, das eine Datenbank fütterte).
Unabhängig davon ist es natürlich weiterhin interessant, wie intensiv die eigene Website von anderen genutzt wird. Insbesondere die Abrufe und Besuche - für diese Metriken gibt es natürlich vielfältige Definitionen - insgesamt, welche Seiten oder Dateien besonders oft aufgerufen werden, welche Suchbegriffe auf die eigenen Seiten führen (auch wenn Google das leider erschwert hat) und - für jede Seite oder Datei - wo diese verlinkt sind (Referrer-Auswertung). Zu diesem Zweck hat man früher [tm] einfach die Logs des Webservers ausgewertet, bspw. mit Webalizer oder AWStats. Heute - eigentlich schon seit vielen Jahren - liest man stattdessen von Google Analytics und Piwik (und den damit verbundenen Datenschutzproblemen).
Weil ich mit der Zeit gehen will, habe ich mir auch einmal Piwik installiert und nutze es bislang im Logdatei-Auswertungs-Modus. Das hat mich allerdings bislang nicht besonders überzeugt; es dauert teilweise gefühlt ewig, bis eine Auswertung vorliegt, und für mich interessante Statistiken - bpsw. die Referrerstatistik: von wo wurden bestimmte Seiten aufgerufen? - habe ich bislang zumindest nicht gefunden. Vielleicht ist das auch einfach der falsche Weg, mit Piwik umzugehen …
Daher die Frage in die Runde und an die geschätzte Leserschaft: Was benutzt der Blogger oder Webpublizist von heute zur Auswertung der Seitenaufrufe? Eher eine Auswertung der Logfiles? Oder eher einen Livedienst wie Google Anlaytics? Was genau benutzt ihr? Wie sind eure Erfahrungen?
Bonusfrage: Wie haltet ihr es mit Datenschutzerwägungen?
Hilfsweise: Welche Newsgroup, welches Forum ist die oder das richtige für solche Fragen?
Über Antworten und Kommentare würde ich mich freuen.
Kommentare
Ansicht der Kommentare: Linear | Verschachtelt
Dirk Deimeke am :
Ich benutze Piwik.
Selbst der Javascript-Part von Piwik generiert kaum mehr Daten als aus den Logdateien des Webservers auslesbar wären. Die IP-Adresse wird verschleiert und wenn sie es nicht wäre, bin ich trotzdem nicht in der Lage, sie personalisiert auszuwerten.
Meiner Meinung nach wird das Thema wirklich unnötig und in Panikmache hochgekocht. Deutlich mehr als 90% aller Nutzer nutzen Google als Suchmaschine und ich bin mir sicher, dass (wenn überhaupt) ein einstelliger Prozentsatz von Leuten das Impressum oder die Datenschutzerklärung der Webseite gelesen hat.
Thomas Hochstein am :
Machst Du mit Piwik eine Auswertung der Logfiles oder arbeitest Du "live", also mit Javascript? Wie bist Du damit zufrieden?
Und kann Piwik neben Suchbegriffen auch anzeigen, mit welchem Referrern bestimmte Seiten aufgerufen werden ("was linkt nach hier")?
Dirk Deimeke am :
Ich arbeite "live" und ich bin sehr zufrieden. Allerdings muss ich zugeben, dass ich nur noch sehr selten in die Statistik schaue.
Als ich begonnen habe, Piwik zu nutzen, gab es die Logfileauswertung noch nicht. Ja, Piwik zeigt Referrer, aber nicht User- oder IP-basiert, das heisst, ich könnte das nicht auswerten.
Jens Kubieziel am :
Es gibt eine Referer-Ansicht. Die sieht ungefähr so aus: http://img.im/i/tor3h8
Die kannst du auch im Dashboard anzeigen lassen.
Thomas Hochstein am :
Gibt’s diese Ansicht nur für die ganze (Sub-)Domain, also die Website, oder auch für einzelne Dateien (also Webseiten)?
Jens Kubieziel am :
Ich habe Piwik ebenfalls eine Zeit lang die Logdateien auswerten lassen. Genau wie bei dir dauerte die Auswertung wie auch die Anzeige gefühlte Ewigkeiten. Daneben fand ich den Informationsgehalt, der dabei entsteht als zu gering. Daher bin ich wieder dazu übergegangen, ein JS-Schnippselchen ins Blog und in einige Unterseiten einzubauen. Da habe ich dann den Überblick, den ich brauche. Andere Informationen hole ich mir durch grep-awk-sed aus dem Log heraus.
Bei einer Auswertung der eigenen Webseite durch Piwik sehe ich weniger Probleme. Sofern aber Dienste wie Google Analytics (GA) ins Spiel kommen, mache ich mir Sorgen. Denn dadurch gibst du die Daten deiner Benutzer in fremde und vermutlich nicht kontrollierbare Hände. GA könnte durch seine große Marktmacht recht gut Nutzerprofile erstellen. Denn die sehen ja manchmal den kompletten Weg, den Nutzer durch das Netz nehmen.
Thomas Hochstein am :
Okay, vielen Dank. - Das ist dann etwas, was ich demnächst auf jeden Fall auch noch einmal ausprobieren muss.
Thomas Hochstein am :
Nachdem ich das mit Piwik jetzt ausprobiert habe, kann ich sagen, dass es tatsächlich sehr viel besser funktioniert als mit der Logfileauswertung.
Dirk Deimeke am :
Schön, dass es für Dich auch so gut funktioniert wie für mich.