Die letzte Statistik liegt bereits ein paar Monate, es ist sogar schon ein halbes Jahr, zurück. Heute gibt es einen Überblick über Seitenaufrufe, Besucherzahlen und die beliebtesten Artikel.
Die globalen Zahlen
Im Februar 2010 gab es:
- Webzugriffe: 627228 von 76068 IP-Adressen (8,25 Req/IP)
- Seitenzugriffe: 43760 (ca. 1563/Tag)
- Besucher: 27332 (ca. 976/Tag)
Webzugriffe sind alles, was irgendwie als eine Zeile in der Serverlogdatei steht, also der Aufruf von Artikeln und Seiten, aber auch das Laden von Bildern oder die Anforderung von CSS-Dateien ebenso wie Fehlerseiten, Feeds und Ähnliches. Die Seitenzugriffe hingegen sind nur Zugriffe auf Seiten und Artikel von „normalen“ Benutzern, also keine Suchmaschinenbots oder sonstiges. Besucher sind schließlich unterscheidbare Nutzer, die eine oder mehrere Seiten aufgerufen haben. Im Durchschnitt hat sich jeder Nutzer nur ungefähr 1,6 Seiten angesehen.
Das kaum ein Besucher länger bleibt, wundert mich nicht. Meine Putzlowitscher Zeitung ist ja auch ein unterirdisch schlechtes Käseblatt. :-) Nein, es liegt einfach daran, daß die meisten der Besucher von der Google-Bildersuche kommen und ein konkretes Bild zu finden hoffen. Entweder eine Katze, ein Brot oder Brötchen, eine Banane und so weiter. Sie nehmen das Bild (oder nicht) und sind auch schon wieder weg.
Beliebteste Seiten und Suchbegriffe
Die am häufigsten aufgerufenen Seiten korrelieren recht gut mit den häufigsten Suchbegriffen. Hier die Seiten:
- Obstwoche, heute: Bananen (2211 ≈ 5,1%)
- Birnen rot und gelb (1966 ≈ 4,5%)
- Brot und kleine Brote, die Brötchen (1604 ≈ 3,7%)
- Kaffee und Brot zum Frühstück (1283 ≈ 2,9%)
- Kartoffeln und Kunst (1241 ≈ 2,8%)
- Ich rate zur Tomate (1218 ≈ 2,8%)
- Essen Katzen Brötchen? (1098 ≈ 2,5%)
- Katze suchen und dann nicht wollen (1092 ≈ 2,5%)
- Das vorletzte Gemüse: Aubergine und Fenchel (1078 ≈ 2,5%)
- Is dat ne Möhre (1025 ≈ 2,3%)
- Meine Gurke, Deine Gurke (1006 ≈ 2,3%)
Berücksichtigt habe ich nur Seiten mit Tausend oder mehr Besuchern. Die Startseite liegt mit 548 Besuchern (≈ 1,3%) nur auf Platz 21.
Die beliebtesten Suchbegriffe waren brot (2828), banane (2810), katze (2594), birne (1992), bananen (1362), apfel (1247), gurke (1232), tomaten (1113), kartoffel (1025), salat (785), äpfel (782).
Piwick gegen PHP+Logfile
Um Abschätzen zu können, wie gut oder schlecht ich mit meinen Zahlen liege, die ich per PHP-Skript aus den Serverlogdateien erzeuge, habe ich seit Januar Piwick mitlaufen. Piwick ist ein freies Webstatistik-Werkzeug und überträgt im Unterschied zu Google-Analytics oder auch WordPress Stats keine Daten an fremde Server in anderen Ländern.
Die Logdaten werden von Piwick vielmehr in einer MySQL-Datenbank auf dem Server gespeichert, auf dem z.B. auch die Website läuft. Das kann aber auch Probleme bringen, denn dadurch wird der Server zusätzlich belastet und es fällt doch so einiges an Daten pro Monat an. Im Februar waren es hier z.B. etwa 25 Mbyte. Hier die Daten im Vergleich:
Wert | Piwick | PHP+Log | Abweichung | Fehler % |
---|---|---|---|---|
Seitenzugriffe | 44185 | 43760 | 425 | 1,0 |
Besucher | 25007 | 27332 | -2325 | -9,3 |
brot | 1179 | 2828 | -1649 | -139,9 |
banane | 1110 | 2810 | -1700 | -153,2 |
katze | 1268 | 2594 | -1326 | -104,6 |
birne | 867 | 1992 | -1125 | -129,8 |
bananen | 549 | 1362 | -813 | -148,1 |
apfel | 527 | 1247 | -720 | -136,6 |
gurke | 444 | 1232 | -788 | -177,5 |
tomaten | 484 | 1113 | -629 | -130,0 |
kartoffel | 420 | 1025 | -605 | -144,0 |
salat | 360 | 785 | -425 | -118,1 |
Bei den Seitenzugriffen sieht es mit nur einem Prozent Abweichung recht gut aus, auch die fast 10% bei den Besuchern finde ich akzeptabel. Aber die Suchbegriffe ab Datenzeile 3 weichen erheblich ab. Ich habe da deutlich mehr gesehen, als Piwick, kann aber noch nicht sagen, warum. Das werde ich mir irgendwann mal genauer ansehen.
Letztendlich ist nicht klar, welche Statistik stimmt und ob vielleicht Google-Analytics ganz andere Zahlen liefern würde. Das ist aber auch egal, denn außer als Aufhänger für einen Blogartikel nutzt mir das nicht wirklich etwas.
Wissen ist Macht
Bei meiner eigenen Auswertung weiß ich allerdings sehr genau, wie ich die Daten erhebe, filtere und verrechne, bei Piwick könnte ich zumindest nachsehen. Bei Google-Analytics oder anderen externen Statistik-Tools kann man die Entstehung der angezeigten Daten normalerweise nicht nachvollziehen. Gut, man könnte jetzt diese Tools gewissermaßen als Blackbox betrachten, mit definierten Daten füttern und dann überprüfen, was angezeigt wird. Aber wozu der ganze Aufwand?
Die Serverlogdateien werden ohnehin angelegt, sind weitestgehend unabhängig von den Einstellungen des Webseiten-Besuchers (Javascript oder Cookies aktiviert/deaktivert) und vertstoßen bei anonymisierter IP-Adresse nicht gegen den Datenschutz.
Apropos Datenschutz, durch den Verzicht auf jegliche externe Dienste wie Google-Analytics, Adsense, Blogtoplisten, Akismet (externen Spamschutz) und Ähnliches werden von der Putzlowitscher Zeitung keine Nutzerdaten unbemerkt im Hintergrund an andere Anbieter übertragen. Dafür nehme ich auch ein paar Prozent Statistik-Fehler in Kauf.