Gelber als gelb, weißer als weiß: Meine Banane

Banane

Bunte Bilder

Das man bei der Google-Bildersuche seit einiger Zeit die Ergebnisse nach ein paar Farben einschränken kann, ist sicher kein Geheimnis mehr. Geheimnsivoll ist hingegen immer noch, wie Google die Farben aus- und bewertet und welche Seiten mit welchen Bildern auf den Ergebnisseiten dann letztendlich angezeigt werden.

Technisch gesehen ist die Ermittlung von Farbwerten für ein Bild nicht weiter schwierig, man zerlegt die Bildpunkte in Farbwert, Sättigung und Helligkeit und ermittelt die Häufigkeitsverteilung für die jeweiligen Werte. Wenn man diese nun in Bereiche (Klassen) zusammenfaßt und normiert, kann man für jedes Bild einen Wert für jede Klasse speichern und in das Ranking einfließen lassen.

Google-Bildersuche Banane gelb

Farbrang

Die eigentliche Frage ist, wie nun die Farbwerte mit den anderen Rankingkriterien verrechnet werden, um eine Rangfolge zu bestimmen.

Man könnte nun annehmen, daß bei exakt denselben Bildern auch die Farbwerte dieselben sind und somit die Farbe eigentlich keinen Einfluß haben müßte. Wie Ihr Euch schon denken könnt, ist das aber scheinbar nicht der Fall.

Farbwahl

Wenn man keine besondere Farbe auswählt und bei der Bildersuche nach Banane sucht, findet man meine mittlere Banane derzeit auf dem 6. Platz. Wählt man nun oben aus dem Farbwähler „gelb“ aus, verschwindet meine Banane und stattdessen wird eine Kopie auf einer anderen Seite auf Platz 5 angezeigt.

Gelber und weißer

Ist diese Banane irgendwie gelber als meine? Es ist wohlgemerkt eine exakte, auf das Byte übereinstimmende Kopie meines Bildes. Genau so verhält es sich, wenn man „weiß“ als Farbe wählt, dann erscheint die Bananenkopie sogar auf Platz 2. Sie ist scheinbar besonders weiß, zumindest aber weißer, als meine Banane.

Rätselhafte Bildersuche

In den letzten Tagen und Wochen ist mir aufgefallen, daß die Google-Bildersuche bei identischen Bildern jene bevorzugt, die in einem später veröffentlichten Artikel, einer jüngeren Seite zu finden sind. Das ist selbst dann so, wenn das Suchwort überhaupt nicht auf der Seite mit dem Bild zu finden ist.

So funktionierts (vermutlich)

Identische Bilder, die als Kopien mehrfach vorhanden sind, werden nur unter einem Eintrag im Index gespeichert. Damit gibt es für das Bild selbst nur einen Satz Schlüsselwörter, der somit für alle gefundenen Kopien gilt. Das würde auch erklären, warum Bilder von Seiten angezeigt werden, die das Suchwort überhaupt nicht enthalten.

Außerdem gibt es zu jedem Bild eine Liste der Fundorte im Netz nebst Datum und möglicherweise weiteren Werten. Aus dieser Liste wird dann vorzugsweise der „jüngste“ Fundort auf der Ergebnisseite angezeigt.

Fazit

Man muß es mal ganz klar sagen, Google funktioniert in erster Linie für die Benutzer, also die Suchenden, und nicht für die Begehrlichkeiten der Webmaster und SEOs. Das läßt sich gerade bei der Bildersuche sehr gut nachvollziehen, denn wenn jemand ein Bild sucht, ist es ihm wohl ziemlich egal, ob er es bei mir oder woanders findet. Das Bild selbst ist das Suchobjekt, und nicht die schöne Webseite drumrum.

Ich beobachte weiter…

Keine Kommentare »

Der Tanz der Erdbeeren

Google-Bildersuche BrötchenÜber den Tanz der Brötchen und von Mona Lisa hatte ich kürzlich berichtet. Im Moment sind aber nicht die Bilder selbst in Bewegung, sondern nur die Quellenangabe bzw. der Link zum Bild selbst. Mal wird mein Original-Erdbeeren-Bild referenziert, mal die Kopie. Ein System ist nicht zu erkennen.

Nachdem ich am 29. Juni bemerkt hatte, daß da mein Bild durch eine Kopie ersetzt wurde, habe ich mit diesem Erdbeer-Artikel versucht gegenzusteuern. Nach etwa einer Woche konnte ich mir meine Position wieder zurückerobern, allerdings noch nicht sehr stabil.

Aber nicht nur bei den Erdbeeren kann ich das Verhalten beobachten, daß nach etwa 10 bis 14 Tagen mein Bild durch eine Kopie auf einer anderen, neueren Seite ersetzt wird. Ebensu bei Kirschen und bei der Erdbeere ist das im Moment der Fall. Schon längere Zeit sind meine Scheine ausgetauscht worden und bereits seit Februar meine Fahrkarten.

Lustigerweise ist seit ein paar Tagen mit meinem Niveau der umgekehrte Fall passiert. Mein Bild lag lange Zeit auf dem ersten Platz, bis es kopiert wurde und einige Zeit später durch die Kopie ersetzt wurde. Eigentlich hatte ich es schon abgeschrieben und war mit einem neuen Bild (PNG) gestartet.

Lange Zeit war nun das Stadtmenschen-Niveau auf Platz 1 oder 2 und mein Niveau auf der zweiten Seite bei 23 oder so. Nun gab es da einen Tanz, denn die Bilder haben einfach die Plätze getauscht. Mein PNG-Niveau ist nun vorn dabei, die Kopie meines alten JPG-Niveaus hingen auf der zweiten Seite zu finden.

Ich werde das alles mal weiter beobachten.

Weitere Artikel mit Bezug zu diesem:
2 Kommentare »

Der Kampf um das Brötchen

BrötchenDa hatte ich noch kürzlich von meinem erfolgreichen Brötchen berichtet und was ist nun? Das Kochbuch-Brötchen hat sich wieder auf Platz 1 nach vorn geschoben (Screenshot).

Im Moment läuft sowieso einiges bei der Bildersuche nicht rund. So war gestern für einige Zeit die Anzeige der Trefferanzahl, Position und Zeit oben rechts verschwunden. Es scheint wohl im Moment der Praktikant oder die Urlaubsvertretung am System rumzuschrauben :-)

Ein Kommentar »

Den Schein wahren

Ich dachte bisher, ich habe die Google-Bildersuche wenigstens so ein bißchen verstanden. Aber denkste, vielleicht könnte ja ein Experte was dazu sagen.

Es geht um mein Bild von Euro-Scheinen, welches ich zum ersten Mal Ende September 2007 veröffentlicht hatte. Gut 9 Monate später, Anfang Juli 2008, waren die Scheine auf Platz 1 der Google-Bildersuche angekommen und blieben dort recht stabil bis Mitte April 2009. Dann wurde mein Bild gegen eine 1:1-Kopie des Bildes beim Reitverein-Rauxel ausgetauscht. Seitdem residiert das Bild vom RV-Rauxel auf dem ersten Platz für das Suchwort Scheine (Screenshot) bei der Google-Bildersuche.

Die Frage lautet nun, warum ist das so? Auf der Seite vom Reitverein taucht das Wort Scheine nicht ein einziges Mal auf. Die Bedeutung von Seitentitel, Text in der Umgebung des Bildes, Titel- und Alttag scheint hier für das Ranking überhaupt keine Rolle zu spielen, aber was dann? Gut, der Dateiname des Bildes selbst ist die einzige Stelle, wo das Schlüsselwort enthalten ist, aber das ist es bei mir ja auch. Ist schließlich eine 1:1-Kopie meines Bildes :-)

Und versteht mich jetzt bitte nicht falsch. Ich habe nichts dagegen, das der Reitverein Rauxel mein Bild verwendet. Ganz im Gegenteil, es würde mich freuen, wenn der Verein vielleicht auch ein wenig mit Hilfe meines Bildes die Mitglieder, Freunde und Förderer zu einer Spende für die Renovierung des Clubhauses animieren könnte.

Ich wundere mich nur, nach welchen Kriterien hier das Google-Bilderranking funktioniert. So, Sie sind dran, Herr Mißfeldt :-)

6 Kommentare »

Mona Lisa tanzt

Das ich mich hin und wieder mal mit der Google-Bildersuche beschäftige, ist für meine drei Stammleser sicher kein Geheimnis. Vor ein paar Tagen habe ich durch einen Kommentar bemerkt, daß sich andere sogar ernsthaft bis wissenschaftlich mit dem Thema Bildersuche auseinandersetzen. Gestern hat Martin auf seiner Seite tagSEOBlog einen interessanten wie auch unterhaltsamen Artikel zur Bewegung im Ranking bei der Bildersuche veröffentlicht. Unter dem Titel „Google Image Search: Mona Lisa Dance“ zeigt er eine Art Zeitraffervideo der Bewegung von Bilder zur Bildersuche mit dem Begriff Mona Lisa und stellt einige Überlegungen zu den Gründen für diese Bewegungen an.

Die Annahmen über die Beweggründe der Rankingveränderungen der Bildersuche sind aber weitestgehend spekulativ, da kaum gesicherte Erkenntnisse über die Bewertung von Bildern seitens Google bekannt sind. Man kann halt nur beobachten und hin und wieder versuchen, die Vermutungen durch Manipulationen zu untermauern oder eben wieder zu verwerfen. In vielen Punkten decken sich meine Beobachtungen mit denen von tagSEOBlog, in manchen aber auch nicht. Es würde hier jetzt zu weit führen, das zu erläutern, da schreibe ich lieber demnächst einen eigenen Artikel dazu :-)

Weitere Artikel mit Bezug zu diesem:
Keine Kommentare »