Statistik Februar 2010

Statistik Januar/Februar 2010

Die letzte Statistik liegt bereits ein paar Monate, es ist sogar schon ein halbes Jahr, zurück. Heute gibt es einen Überblick über Seitenaufrufe, Besucherzahlen und die beliebtesten Artikel.

Die globalen Zahlen

Im Februar 2010 gab es:

  • Webzugriffe: 627228 von 76068 IP-Adressen (8,25 Req/IP)
  • Seitenzugriffe: 43760 (ca. 1563/Tag)
  • Besucher: 27332 (ca. 976/Tag)

Webzugriffe sind alles, was irgendwie als eine Zeile in der Serverlogdatei steht, also der Aufruf von Artikeln und Seiten, aber auch das Laden von Bildern oder die Anforderung von CSS-Dateien ebenso wie Fehlerseiten, Feeds und Ähnliches. Die Seitenzugriffe hingegen sind nur Zugriffe auf Seiten und Artikel von „normalen“ Benutzern, also keine Suchmaschinenbots oder sonstiges. Besucher sind schließlich unterscheidbare Nutzer, die eine oder mehrere Seiten aufgerufen haben. Im Durchschnitt hat sich jeder Nutzer nur ungefähr 1,6 Seiten angesehen.

Das kaum ein Besucher länger bleibt, wundert mich nicht. Meine Putzlowitscher Zeitung ist ja auch ein unterirdisch schlechtes Käseblatt. :-) Nein, es liegt einfach daran, daß die meisten der Besucher von der Google-Bildersuche kommen und ein konkretes Bild zu finden hoffen. Entweder eine Katze, ein Brot oder Brötchen, eine Banane und so weiter. Sie nehmen das Bild (oder nicht) und sind auch schon wieder weg.

Beliebteste Seiten und Suchbegriffe

Die am häufigsten aufgerufenen Seiten korrelieren recht gut mit den häufigsten Suchbegriffen. Hier die Seiten:

  1. Obstwoche, heute: Bananen (2211 ≈ 5,1%)
  2. Birnen rot und gelb (1966 ≈ 4,5%)
  3. Brot und kleine Brote, die Brötchen (1604 ≈ 3,7%)
  4. Kaffee und Brot zum Frühstück (1283 ≈ 2,9%)
  5. Kartoffeln und Kunst (1241 ≈ 2,8%)
  6. Ich rate zur Tomate (1218 ≈ 2,8%)
  7. Essen Katzen Brötchen? (1098 ≈ 2,5%)
  8. Katze suchen und dann nicht wollen (1092 ≈ 2,5%)
  9. Das vorletzte Gemüse: Aubergine und Fenchel (1078 ≈ 2,5%)
  10. Is dat ne Möhre (1025 ≈ 2,3%)
  11. Meine Gurke, Deine Gurke (1006 ≈ 2,3%)

Berücksichtigt habe ich nur Seiten mit Tausend oder mehr Besuchern. Die Startseite liegt mit 548 Besuchern (≈ 1,3%) nur auf Platz 21.

Die beliebtesten Suchbegriffe waren brot (2828), banane (2810), katze (2594), birne (1992), bananen (1362), apfel (1247), gurke (1232), tomaten (1113), kartoffel (1025), salat (785), äpfel (782).

Piwick gegen PHP+Logfile

Um Abschätzen zu können, wie gut oder schlecht ich mit meinen Zahlen liege, die ich per PHP-Skript aus den Serverlogdateien erzeuge, habe ich seit Januar Piwick mitlaufen. Piwick ist ein freies Webstatistik-Werkzeug und überträgt im Unterschied zu Google-Analytics oder auch WordPress Stats keine Daten an fremde Server in anderen Ländern.

Die Logdaten werden von Piwick vielmehr in einer MySQL-Datenbank auf dem Server gespeichert, auf dem z.B. auch die Website läuft. Das kann aber auch Probleme bringen, denn dadurch wird der Server zusätzlich belastet und es fällt doch so einiges an Daten pro Monat an. Im Februar waren es hier z.B. etwa 25 Mbyte. Hier die Daten im Vergleich:

Wert Piwick PHP+Log Abweichung Fehler %
Seitenzugriffe 44185 43760 425 1,0
Besucher 25007 27332 -2325 -9,3
brot 1179 2828 -1649 -139,9
banane 1110 2810 -1700 -153,2
katze 1268 2594 -1326 -104,6
birne 867 1992 -1125 -129,8
bananen 549 1362 -813 -148,1
apfel 527 1247 -720 -136,6
gurke 444 1232 -788 -177,5
tomaten 484 1113 -629 -130,0
kartoffel 420 1025 -605 -144,0
salat 360 785 -425 -118,1

Bei den Seitenzugriffen sieht es mit nur einem Prozent Abweichung recht gut aus, auch die fast 10% bei den Besuchern finde ich akzeptabel. Aber die Suchbegriffe ab Datenzeile 3 weichen erheblich ab. Ich habe da deutlich mehr gesehen, als Piwick, kann aber noch nicht sagen, warum. Das werde ich mir irgendwann mal genauer ansehen.

Letztendlich ist nicht klar, welche Statistik stimmt und ob vielleicht Google-Analytics ganz andere Zahlen liefern würde. Das ist aber auch egal, denn außer als Aufhänger für einen Blogartikel nutzt mir das nicht wirklich etwas.

Wissen ist Macht

Bei meiner eigenen Auswertung weiß ich allerdings sehr genau, wie ich die Daten erhebe, filtere und verrechne, bei Piwick könnte ich zumindest nachsehen. Bei Google-Analytics oder anderen externen Statistik-Tools kann man die Entstehung der angezeigten Daten normalerweise nicht nachvollziehen. Gut, man könnte jetzt diese Tools gewissermaßen als Blackbox betrachten, mit definierten Daten füttern und dann überprüfen, was angezeigt wird. Aber wozu der ganze Aufwand?

Die Serverlogdateien werden ohnehin angelegt, sind weitestgehend unabhängig von den Einstellungen des Webseiten-Besuchers (Javascript oder Cookies aktiviert/deaktivert) und vertstoßen bei anonymisierter IP-Adresse nicht gegen den Datenschutz.

Apropos Datenschutz, durch den Verzicht auf jegliche externe Dienste wie Google-Analytics, Adsense, Blogtoplisten, Akismet (externen Spamschutz) und Ähnliches werden von der Putzlowitscher Zeitung keine Nutzerdaten unbemerkt im Hintergrund an andere Anbieter übertragen. Dafür nehme ich auch ein paar Prozent Statistik-Fehler in Kauf.

Weitere Artikel mit Bezug zu diesem:
2 Kommentare »

Statistik September 2009 (Bildersuche)

Ein neuer Monat hat begonnen, Zeit für einen Rückblick auf den September und sogar noch weiter zurück. Heute will ich keine absoluten Zahlen wie bei den letzten Auswertungen nennen, sondern mir die Entwicklung der Suchtreffer bei der Google-Bildersuche ansehen. Dafür sind Zahlenkolonnen eher unanschaulich und deshalb habe ich ein paar Diagramme erstellt.

Die Daten erhebe ich aus der Auswertung der Serverlogdateien. Die Suchbegriffe, mit denen die Besucher von der Googlesuche auf eine meiner Seite gelangten, werden aus dem Referer extrahiert. Nachfolgend werden nur Treffer von der Bildersuche berücksichtigt, also auch nicht von der Google-Universal-Search für Bilder.

Suchtreffer pro Tag in den letzten 64 Tagen

Suchtreffer Google-Bildersuche (Tageswert)

Ich hatte es irgendwie schon immer vermutet, die schwarze Kurve vom Tagesgesamtvolumen bestätigt es nun. Am Samstag wird am wenigsten gesucht. Die lokalen Minima sind jeweils Samstage. Wobei sich die Aussage, wie auch die folgenden, nur auf meine Bilder bezieht. Diese sind hauptsächlich Obst- und Gemüsebilder, Brötchen, Kaffee und Ähnliches. Bei anderen Suchbegriffen kann es auch durchaus anders aussehen.

Das erste Einzelbeispiel Brot (rot) zeigt im Verlauf einen Einbruch um den 20. August herum. Genau in dem Zeitraum wurde mein Brotbild auf der 1. Google-Trefferseite durch eine identische Kopie auf einer anderen Seite ersetzt. Logischerweise landen dann die Suchenden zum Stichwort Brot nicht mehr bei mir.

Die paar Suchanfragen, die es immer noch gibt, kommen im wesentlichen durch ein weiteres Brot von mir auf der zweiten Seite und durch Suchanfragen mit anderer Spracheinstellung zustande. Mein Bild wurde nur bei der „deutschen“ Suche durch die Kopie ersetzt, bei Englisch, Französisch oder Russisch wird immer noch mein Brot angezeigt.

Das zweite Beispiel „Birne“ (gelb) zeigt einen signifikanten Anstieg der Suchtreffer ab den 17.09. Was da passiert ist, kann ich aber am nächsten Diagramm besser erklären. Weiter lesen

Weitere Artikel mit Bezug zu diesem:
2 Kommentare »

Statistik August 2009

Es ist mal wieder Zeit für einen kleinen, statistischen Monatsrückblick. Insgesamt sind die Zahlen seit der letzten Auswertung Anfang August (Zahlen vom Juli) in etwa gleich geblieben, aber das dürfte auch an der Ferien- und Urlaubszeit liegen.

Dieses mal habe ich bei den Suchmaschinentreffern nur die Google-Bildersuche unter besonderer Berücksichtigung der Universalsearch betrachtet. Zudem habe ich mal geschaut, ob und wie meine Zahlen von denen der Google-Webmastertools abweichen. Da dort keine absoluten Zahlen genannt werden, kann ich nur dem Trend vergleichen.

Google Bilder- und Universalsuche

Im August kamen 31179 Besucher mit einer Suchanfrage von Google zur Putzlowitscher Zeitung. Das sind fast genau so viele wie im Juli (31821). Davon waren 28436 Treffer Bildersuchergebnisse und 1191 Universalsuchergebnisse, der Anteil der Universalsuche lag damit bei 4%.

Die Top-20 der Suchphrasen sieht so aus:

Suchwort Bilder Univ Gesamt % Univ % Ges Google
banane 1933 179 2112 8,5% 9,1% 1
katzen 1943 1 1944 0,1% 8,4% 2
katze 1783 31 1814 1,7% 7,8% 3
apfel 1059   1059 0,0% 4,6% 5
brot 910 11 921 1,2% 4,0% 45
tomaten 885 7 892 0,8% 3,8% 4
gurke 720   720 0,0% 3,1% 6
erdbeere 537 144 681 21,1% 2,9% 10
bananen 595 3 598 0,5% 2,6% 7
äpfel 546 1 547 0,2% 2,4% 15
brötchen 471 1 472 0,2% 2,0% 11
münzen 428 6 434 1,4% 1,9% 9
fenchel 377 20 397 5,0% 1,7% 12
pflaumen 371   371 0,0% 1,6% 13
aprikosen 314 1 315 0,3% 1,4% 30
pfirsich 312   312 0,0% 1,3% 18
essen 304   304 0,0% 1,3% 23
schwarze katze 299   299 0,0% 1,3% 22
weintrauben 295   295 0,0% 1,3% 14
brokkoli 291   291 0,0% 1,3% 17

In den ersten drei Spalten nach dem Suchwort findet man die absoluten Trefferzahlen. Bei % Univ wird der Anteil der Universalsuche, bei % Ges der Anteil am Gesamtsuchaufkommen der besten 100 Suchanfragen angezeigt. Die letzte Spalte Google enthält den Platz für die Suchanfrage aus den Google- Webmastertools.

Bei den ersten drei Plätzen stimmt meine Statistik bezüglich des Rangs mit Google überein. Bis auf den Ausreißer „brot“ sieht es bis Platz 15 auch nicht so schlecht aus. Allerdings nennt Google andere Anteils-Prozentwerte bei der Click-Through-Rate (banane 12%; katzen, katze und tomaten je 6%; apfel 5%).

Was da mit dem Brot passiert ist, kann ich nicht sagen. Der hohe Anteil am Universalaufkommen bei der Erdbeere von über 20% ist jedoch einfach zu erklären. Das liegt nicht etwa daran, daß die Erdbeere besonders häufig über die normale Suche gesucht wird, sondern daran, daß bei der Bildersuche mein Bild durch eine fremde Kopie ersetzt wurde. So kommen weniger Besucher direkt über die Bildersuche.

Sonstige Besucher

Viele „Besucher“ kamen wieder durch das Hotlinking von Bildern. Das sind also keine Besucher auf meinen Seiten hier, die sehen nur meine Bilder in einer fremden Umgebung. Diesmal hat Team-Ulm den Vogel abgeschossen. Da war irgendjemand auf die Idee gekommen, mein Kartoffelbild (1600x1200er Größe) in sein User-Profil einzubinden und viele haben es gleich mal nachgemacht. So kam mit 17500 Abrufen ein Datenvolumen von gut 2,5 GB zusammen. Dagegen nehmen sich die knapp 11000 Bilderabrufe mit 1,1 GB recht bescheiden aus.

Die meisten echten Besucher (160) kamen wieder vom WordPress-Deutschland-Forum. Immerhin 21 Leute verirrten sich von Twitter hierher, einige (30) kamen vom TagSEOBlog und ein paar (22) auch von „Wir speichern nicht„.

Seitenabrufe und Bots

Seitenabrufe (ohne extra gelisteten Bots) gab es im August etwa 398 Tausend (Juli 395000).
Die Bots der Suchmaschinen war auch im August wieder fleißig, die kennen keinen Urlaub:

Bot Gesamt ges/Tag robots rob/Tag start start/Tag
Googlebot 10234 330,1 34 1,1 41 1,3
Yahoo!Slurp 10010 322,9 212 6,8 102 3,3
MSNBot 8174 263,7 729 23,5 28 0,9
MLBot 2265 73,1 45 1,5 14 0,5
Twiceler 690 22,3 54 1,7 2 0,1
Teoma 444 14,3 86 2,8 4 0,1

In der Tabelle findet man die Gesamtanzahl der Seitenabrufe durch den jeweiligen Bot sowie die Anzahl für die robots.txt und die Startseite. Hinter der absoluten Zahlen steht die Aufrufhäufigkeit pro Tag.

Auffällig ist, daß der MSN-Bot überdurchschnittlich oft die robots-Datei abruft, nämlich mehr als 23 mal am Tag. Aber nach dieser Beobachtung bin ich nicht sicher, ob die Werte stimmen. Seltsam erscheint mir auch die Tatsache, daß der Yahoo-Bot 750 mal im Monat meine CSS-Dateien abruft. Was will er damit?

Wonach richtet sich überhaupt, wie oft ein Bot die einzelnen Seiten abruft? Für den Googlebot sind mit mehr als 41 Abrufen im Monat, und damit häufiger als die Startseite, derzeit folgende Seiten die Favoriten:

Das sind nicht nur alles aktuelle Artikel, da sind auch Sachen dabei, die über ein Jahr alt sind.

Im übrigen ist der Googlebot-Image in letzter Zeit besonders schnell da, wenn es was Neues gibt. Innerhalb von 24 Stunden werden die Bilder von neuen Artikeln erfaßt. Früher hatte das Wochen und Monate gedauert, bis der Bilderbot mal vorbei kam.

Blog-Statistik

Zum Schluß noch schnell die Blog-Statistik. Hier bei Putzlowitsch gibt es derzeit 9 Seiten sowie 663 Artikel in 9 Kategorien und mit 548 Stichworten. Dazu kommen 1346 genehmigte Kommentare.

Weitere Artikel mit Bezug zu diesem:
5 Kommentare »

FaceVZ oder StudiBook, wer ist der Größte im ganzen Land?

Nielsen (die, die, oder die?) hat gemessen und festgestellt, das Facebook mittlerweile zum Marktführer bei den sozialen Netzwerken in Deutschland aufgestiegen ist. Das stimmt aber nur, wenn man die ganzen VZ-Netzwerke einzeln betrachtet, zusammengenommen liegt natürlich VZnet Netzwerke deutlich vorn. Kennt eigentliche jemand „Wer-kennt-wen“?
Mir ist das ziemlich egal, ich frage mich nur, wie sowas gemessen wird.

Wird da etwa bei ausgewählten Nutzern im Browser eine Art Toolbar (wie die Google- oder Alexa-Toolbar) installiert, die dann das Surfverhalten protokolliert und die Daten an das beauftragte Institut schickt? Oder werden Nutzerbefragungen durchgeführt? Aber da kann man eigentlich nicht von „messen“ sprechen.

Na zumindest für die Zugriffszahlen oder die Zahl der angemeldeten Nutzer kann ich mir vorstellen, daß soetwas gemessen werden kann, aber wie wird die durchschnittlichen Verweildauer auf der Seite ermittelt? Oder anders gesagt, was it damit gemeint?

Ich habe mich vorhin nach etwa drei Monaten mal wieder bei meinVZ eingeloggt. Nachdem ich mich etwa 5 Minuten umgesehen und rumgeklickt hatte, waren meine Aktivitäten bereits beendet. Ich hatte mich dann aber nicht abgemeldet und so wurde ich dann nach einer gewissen Zeit automatisch rausgeschmissen. Ist meine Verweildauer nun die aktive Zeit der ersten fünf Minuten oder die ganze halbe Stunde bis zum automatischen Logout?

Interessant finde ich auch diese Aussage:

„… Allerdings hat das schnelle Wachstum die Verweildauer erwartungsgemäß gesenkt, da neue Nutzer meist weniger Zeit auf der Seite verbringen als erfahrene Anwender. …“

Wenn man sich erstmal neu irgendwo anmeldet, ist doch alles noch unbekannt, spannend und eben neu. Da ist die Verweildauer schon allein deshalb größer, weil man sich erstmal umsehen muß, Funktionen ausprobiert, Freunde sucht, sich gewissermaßen einrichtet. Als erfahrener Nutzer weiß man schon, wie alles funktioniert und hat mit wenigen Klicks alles erledigt :-)

Nachdem ich seit April bei meinVZ angemeldet bin, mittlerweile sogar manchmal meinen Twitter-Account als Linkschleuder für eigene Blogartikel nutze, könnte ich mir ja mal Facebook ansehen…

Weitere Artikel mit Bezug zu diesem:
4 Kommentare »

Der Juli 2009 in Zahlen

Juli 2009 in ZahlenEs ist mal wieder Zeit für einen kleinen, statistischen Monatsrückblick. Insgesamt sind die Zahlen seit meiner letzten Auswertung Ende Juni zurückgegangen, aber das dürfte auch an der Ferien- und Urlaubszeit liegen.

Suchmaschinen

Bei den Suchmaschinen liegt immer noch ganz klar Google mit 32292 Besuchern vorn, wenngleich das auch deutlich weniger als die gut 42 Tausend im Juni sind. Bei den anderen Suchdiensten sieht es ähnlich aus, es waren im Juli jeweils weniger Zugriffe als noch im Juni. AOL 172, Yahoo 161, Bing 129, T-Online 77,MSN 63, WEB.DE 9, altavista 5 und sogar 3 vom Suchveteran Fireball. Übrigens kam kein Besucher von Cuil, aber das wird noch, da bin ich sicher :-)

Die Top-Suchbegriffe sind wieder mal Katze (1931), Banane (1850), Katzen (1616), Brot (1330), Erdbeere (1059), Apfel (899), Tomaten (838), Gurke (766), Bananen (620). Auch Michael Jackson brachte einiges an Besuchern (etwas 200), und hier ausnahmsweise mal nicht über die Bildersuche.

Andere Besucher

Andere Besucher kommen z.B. vom WordPress-Deutschland-Forum hierher, im Juli waren es 174, wobei mit 19 Eingängen der Artikel „Online-Zeitung mit WordPress“ gewissermaßen der Hauptlieferant ist. Und tatsächlich gab es schon zwei telefonische Anfragen zur Nachnutzung meines WordPress-Themes. Mußte ich auf Grund des technischen Zustandes aber erstmal abschlägig beantworten.

Der beste Hotlink-Kunden ist wieder Jappy mit 11740 Abrufen und insgesamt 380 MB. Von der Datenmenge gleichauf liegt diesmal Team-Ulm, mit allerdings nur 4924 Aufrufen. Das liegt daran, daß dort auch schon mal meine etwas größeren 1600x1200er-Bilder eingebunden werden und entsprechend mit weniger Aufrufen eine größere Datenmenge anfällt. Aber auch hier sind die Zahlen im Sommerloch geringer als im Vormonat.

Bots und Seitenabrufe

Den Bots der Suchmaschinen sind Sommerloch und Urlaubszeit egal, sie sind unverändert fleißig am Werk.

Im Juli liegt Yahoo!Slurp mit 11704 vorn, dicht gefolgt vom Googlebot mit 11027. Der Msnbot (2101) und Cuil-Twiceler (576) haben sich leicht zurückgenomen, aber der Googlebot-Image hat einen Zahn zugelegt. Im Juli kam er 1357 mal, im Juni waren es nur 938 Zugriffe. Besonders in den letzten 10 Tagen hat er die Schlagzahl erhöht. Waren es davor am Tag etwas 25 bis 30 Bilder, die abgefragt wurden, sind es nun täglich über 50 bis zu 70 oder 80 Bilder.

Ohne die oben genannten Bots bleiben noch etwa gut 420 Tausend Seitenabrufe übrig. Interessant finde ich ja, das sich manche Browser, besonders von mobilen Geräten, einfach mit der Gerätekennung melden. So haben mich z.B. SAMSUNG-SGH-E250, SAMSUNG-SGH-F480, SAMSUNG-SGH-i900, BlackBerry8310, BlackBerry9000, BlackBerry9500, SonyEricssonK610i, SonyEricssonW880, SonyEricssonC905, SonyEricssonW995, Palm850, HTC_Touch und HTC_Touch_Pro_T7272 besucht. Hmmm, der HTC-Touch Pro werde ich wohl selber gewesen sein.

Nachtrag am 3. August 2009:
Ich habe die Statistik nochmal etwas überarbeitet und verbessert. So sind oben schon die Zahlen vom 1. August mit drin, die natürlich nicht zum Juli gehören. Zudem habe ich eigene Zugriffe rausgenommen, das macht bei den Suchbegriffen kaum etwas aus, weil ich normalerweise nicht auf die eigenen Suchergebnisse klicke, bei den Page-Impressions sind es aber immerhin etwa 6%. Von den 420000 bleiben nur noch 395000 übrig.

Hier die Suchmaschinentreffer der letzen 3 Jahre im Juli:

Suchmaschine Juli 2009 Juli 2008 Juli 2007
Alta Vista 5 1
AOL 169 61 25
Bing 124
Google 31821 10114 1589
MSN 63 159 3
T-Online 75 34 8
web.de 9 3 1
Yahoo 155 32 2

Bing gibt es erst seit diesem Jahr, wenn man Bing und MSN 2009 zusammenrechnet, ergibt sich ein vergleichbarer MSN-Gesamtwert.

Die Top-Ten-Suchbegriffe:

Suchphrase Juli 2009 Juli 2007 Juli 2006
katze 1 1895 1 2212 63 2
banane 2 1827 27 62
katzen 3 1578 2 668
brot 4 1321 21 69
erdbeere 5 1049 5 326
apfel 6 879 16 93
tomaten 7 830 6 318 33 4
gurke 8 760 190 3 1 404
bananen 9 612 48 24
münzen 10 485 4 357
schwarze katze 28 252 3 379
brötchen 12 441 7 318 9 15
euroscheine 212 11 8 174
euro 67 66 9 166 8 27
äpfel 13 405 10 161
salat 191 12 89 8 2 258
wetter 37 173 17 88 3 77
schlechtes wetter 65 67 24 65 4 67
spinnen 43 140 18 83 5 42
babybel 138 4 6 38
elektronik 55 97 11 148 7 34
schwerin 86 41 59 16 10 8

In den Spalten zu den Jahren steht vorn der Platz entsprechend der Anzahl und danach die Anzahl der Besucher die von Google kamen.

3 Kommentare »