Seit einiger Zeit bieten wir, im Rahmen unserer Hosting- und Internetdienstleistungen, natürlich auch die Möglichkeit an die Zugriffe auf eine bei uns liegende Webseite per Webalizer und Google Analytics parallel oder aber nur mit einem von beiden Tools auszuwerten.
Hierbei wird erst einmal allgemein gesehen in beiden Verfahren eine Statistik über Zugriffe auf eine Webseite erstellt. Erfasst werden hierbei neben der reinen Besucherzahl natürlich auch welche Seiten besucht wurden, wie lange, aus welchem Land der Besucher kam usw.
Beides wird optisch aufbereitet mit Diagrammen, Tabellen und Listen. Zugegeben ist hier Google optisch die schönere Variante, es ist neuer und lehnt sich mehr an das berühmte Web 2.0 an, welches im Moment in aller Munde ist. Aber auch Webalizer, wenn auch schon ein wenig in die Jahre gekommen, leistet gute Dienste und bereitet eine Fülle von Informationen grafisch auf. Beiden gemein ist übrigens natürlich das die erfassten Statistiken anonymisiert sind – Rückschlüsse auf die reale Person hinter dem Besucher und vielleicht dessen Vorlieben anhand der besuchten Seiten sind nicht möglich.
Entscheidend zwischen den beiden Tools ist jedoch die Art und Weise wie die Statistiken erstellt werden – führen diese doch mitunter zu ganz unterschiedlichen Zahlen. Vor allem ist immer wieder zu beobachten das hier die Messungen von Google Analytics deutlich niedriger liegen als die von Webalizer.
![]() Beispielansicht Google Analytics |
![]() Beispielansicht Webalizer |
Um dieses zu verstehen muss man zuerst die technischen Grundlagen beider Tools kennen, insbesondere die Art und Weise wie hier die Messung erfolgt.
Ganz schlicht gesagt handelt es sich bei Google Analytics um nichts weiter als ein kleines Stück JavaScript in einer Webseite. Dieses wird von der besuchten Webseite aus bei Google aufgerufen und sendet diverse Informationen mit an Google. Auch hier natürlich anonymisiert, aber auch gefüllt mit Informationen von welcher Seite der Besucher vielleicht kam oder aber welche Suchbegriffe diesen auf die Seite geführt haben.
Webalizer stellt zwar im Endeffekt sehr ähnliche Ergebnisse dar, verwendet aber eine völlig unterschiedliche Technik zur Ermittlung der Werte. Hierbei wird nicht auf eine kleines Stück zusätzlichen JavaScript Code in der Seite gebaut, sondern, da es im Gegensatz zu Analytics auf den Servern des Providers läuft, werden die Logdateien des Webservers verwendet. Jeder Abruf eines Elementes erzeugt einen Eintrag im Logfile des Webservers, mehrere Abrufe in wenigen Sekunden von der selben IP-Adresse aus mit der gleichen Referenz einen Site-Abruf, mehrere Abrufe innerhalb einer definierten Zeitspanne einer einzelnen Quelle (IP-Adresse) einen einzelnen Besuch.
Genauer betrachtet werden einem hierdurch auch sehr schnell erste Vor- und Nachteile klar. Google Analytics muss, als eingebundes JavaScript, immer mehr gegen Schutzmaßnahmen und dem Blocken von JavaScript in Webseiten ankämpfen. Hierzu gibt es inzwischen verschiedenste Lösungen, eine der bekanntesten ist wohl die NoScript Erweiterung im Mozilla Firefox. Diese bietet beispielweise die Möglichkeit der Ausführung von JavaScript komplett, teilweise oder aber auch nur zu bestimmten Scripten (wie z.B. auch das Analytics-Script von Google) zu unterbinden. Auch einfachere Maßnahmen wie z.B. das simple Abschalten der JavaScript-Funktionalität in den Einstellungen des Browsers sind möglich. Andere Maßnahmen mögen ebenfalls greifen wie z.B. Router oder Proxys in Unternehmen, welche den Abruf des JavaScript per Sperre unterbinden, die restliche Seite aber intakt lassen, ebenso z.B. eine Schutzsoftware die geladene Seiten analysiert und z.B. das kleine Stück Google-Code entfernt. Die Folge all dieser Schutzmassnahmen ist einfach: Google Analytics registriert den Besuch nicht – es sieht so aus als wäre nie jemand da gewesen. Auch wird von Analytics nicht erfasst wenn einzelne Inhalte durch ein Suchmaschinenergebnis oder eine andere Verlinkung direkt abgefragt werden. So könnte beispielsweise ein PDF-Dokument direkt abgerufen werden aus einer Suche bei Google heraus oder durch eine Verlinkung einer anderen Webseite. Das PDF jedoch beinhaltet nicht den JavaScript-Aufruf, würde also nicht als Besucher erfasst.
Das könnte zu dem Schluss führen das der Eindruck entsteht Webalizer arbeitet zuverlässiger – und ist damit das bessere Tool. Aber auch dies ist nur der erste Anschein. Ganz klar ist ein Vorteil einer Logauswertung, welche auf Serverlogfiles basiert, die Stelle an welcher Daten erfasst werden. Eine Auswertung des Serverlogfiles ist unbestechlich. Wer die Seite angeschaut hat, musste diese vom Webserver abrufen. Dies führt unweigerlich zu einer Erfassung im Webserverlogfile. Manipulation von außen ausgeschlossen, egal ob JavaScript oder sonstige Elemente geblockt. Soweit – so gut.
Doch wie im wirklichen Leben gibt es auch hier kein Schwarz/Weiss, kein richtig oder falsch, kein zuverlässig oder unzuverlässig. Denn die Stärke Webalizers, die Erfassung der Abrufe, ist auch seine Schwäche. Ebenso die Schwäche von Analytics, die Einbindung per JavaScript, ist auch die Stärke. Den während Analytics nur Browser mit JavaScript-Techniken zählt, zählt Webalizer jeden Abruf – egal welcher Art. Und gerade dies führt mitunter zu den unterschiedlichsten Ergebnissen: Besucht ein automatisiertes System (z.B. Google selbst, Yahoo, Bing oder eine andere Suchmaschine) die Webseite, wird diese geladen um die Inhalte zu erfassen – ergo: Ein Abruf im Webalizer. Aber eine Suchmaschine wertet nicht das enthaltene JavaScript aus – ergo: keine Erfassung in Google Analytics.
Dieses Verhalten führt zu zwei unterschiedlichen Werten z.B. in der Zahl der gesamten Besucher pro Monat. Die Frage für einen Webseitenbetreiber aber ist: Welcher der beiden Werte ist interessanter ? 3000 Besuche der Webseite gesamt, aber auch inkl. der Suchmaschinen oder anderer automatischen Systeme, gezählt im Webalizer – oder aber die 1500 erfassten Besucher in Analytics, die sehr wahrscheinlich “echte” Menschen waren, da die automatisierten Systeme das geladenen JavaScript nicht wie ein Browser ausgewertet haben – dafür aber keine Registrierung vielleicht echter, direkter Abrufe wie z.B. PDF Dokumente. Und arbeitet man mit einer der beiden Zahlen, so muss man noch andere Faktoren gewichten, vor allem soziale. Denken wir nur eine eine sehr IT-affine Seite, die stark von jungen, computererfahrenen Menschen besucht wird. In dieser Zielgruppe wird mit Vorliebe Firefox mit NoScript Plugin und der Einstellung “JavaScript ist nicht gut, das wird erstmal geblockt und nur bei Bedarf aktiviert” gesurft. Daher ist hier der Verlust in der Analytics-Zaehlung sehr hoch. Anders beim Haustierfutter-Shop: Wo der Fabrikarbeiter, die Bürokraft oder der Kellner von nebenan vorbeisurft, ohne besondere Ahnung seines Computers daheim, immernoch mit dem vorinstallierten Standard Internet Explorer mit aktiviertem JavaScript, wird die Zahl der erfassten Besucher nah an der Realität liegen wieviele “echte” Menschen die Seite besucht haben.
Ebenso spielen natürlich auch noch andere Faktoren, sprich: Die jeweiligen Einstellungen der beiden Systeme, eine grosse Rolle. So können z.B. Grundzeiträume ab wann ein nächster Log-Eintrag von der gleichen IP Adresse wieder als neuer Besucher anzusehen ist, zu unterschiedlichen Ergebnissen führen.
Schlussendlich: Beide Systeme haben Ihre Daseinsberechtigung, beide Systeme erbringen auf Ihre Art für den Benutzer verwertbare Informationen. Wichtig ist jedoch, das bei der Betrachtung der Statistiken beider Systeme immer im Hinterkopf behalten wird wie diese erfasst wurden und in welchem Bezug diese, vom jeweiligen System erfassten Werte, auch zu der Webseite und seiner Zielgruppe steht. Nur so haben diese Werte eine gewisse Ausagekraft.
(am)
Tags: Analytics, Statistiken, Webalizer, Webseite


