Obst ist nicht genug

Gelber als gelb, weißer als weiß: Meine Banane

Banane

Bunte Bilder

Das man bei der Google-Bildersuche seit einiger Zeit die Ergebnisse nach ein paar Farben einschränken kann, ist sicher kein Geheimnis mehr. Geheimnsivoll ist hingegen immer noch, wie Google die Farben aus- und bewertet und welche Seiten mit welchen Bildern auf den Ergebnisseiten dann letztendlich angezeigt werden.

Technisch gesehen ist die Ermittlung von Farbwerten für ein Bild nicht weiter schwierig, man zerlegt die Bildpunkte in Farbwert, Sättigung und Helligkeit und ermittelt die Häufigkeitsverteilung für die jeweiligen Werte. Wenn man diese nun in Bereiche (Klassen) zusammenfaßt und normiert, kann man für jedes Bild einen Wert für jede Klasse speichern und in das Ranking einfließen lassen.

Google-Bildersuche Banane gelb

Farbrang

Die eigentliche Frage ist, wie nun die Farbwerte mit den anderen Rankingkriterien verrechnet werden, um eine Rangfolge zu bestimmen.

Man könnte nun annehmen, daß bei exakt denselben Bildern auch die Farbwerte dieselben sind und somit die Farbe eigentlich keinen Einfluß haben müßte. Wie Ihr Euch schon denken könnt, ist das aber scheinbar nicht der Fall.

Farbwahl

Wenn man keine besondere Farbe auswählt und bei der Bildersuche nach Banane sucht, findet man meine mittlere Banane derzeit auf dem 6. Platz. Wählt man nun oben aus dem Farbwähler „gelb“ aus, verschwindet meine Banane und stattdessen wird eine Kopie auf einer anderen Seite auf Platz 5 angezeigt.

Gelber und weißer

Ist diese Banane irgendwie gelber als meine? Es ist wohlgemerkt eine exakte, auf das Byte übereinstimmende Kopie meines Bildes. Genau so verhält es sich, wenn man „weiß“ als Farbe wählt, dann erscheint die Bananenkopie sogar auf Platz 2. Sie ist scheinbar besonders weiß, zumindest aber weißer, als meine Banane.

Rätselhafte Bildersuche

In den letzten Tagen und Wochen ist mir aufgefallen, daß die Google-Bildersuche bei identischen Bildern jene bevorzugt, die in einem später veröffentlichten Artikel, einer jüngeren Seite zu finden sind. Das ist selbst dann so, wenn das Suchwort überhaupt nicht auf der Seite mit dem Bild zu finden ist.

So funktionierts (vermutlich)

Identische Bilder, die als Kopien mehrfach vorhanden sind, werden nur unter einem Eintrag im Index gespeichert. Damit gibt es für das Bild selbst nur einen Satz Schlüsselwörter, der somit für alle gefundenen Kopien gilt. Das würde auch erklären, warum Bilder von Seiten angezeigt werden, die das Suchwort überhaupt nicht enthalten.

Außerdem gibt es zu jedem Bild eine Liste der Fundorte im Netz nebst Datum und möglicherweise weiteren Werten. Aus dieser Liste wird dann vorzugsweise der „jüngste“ Fundort auf der Ergebnisseite angezeigt.

Fazit

Man muß es mal ganz klar sagen, Google funktioniert in erster Linie für die Benutzer, also die Suchenden, und nicht für die Begehrlichkeiten der Webmaster und SEOs. Das läßt sich gerade bei der Bildersuche sehr gut nachvollziehen, denn wenn jemand ein Bild sucht, ist es ihm wohl ziemlich egal, ob er es bei mir oder woanders findet. Das Bild selbst ist das Suchobjekt, und nicht die schöne Webseite drumrum.

Ich beobachte weiter…

Keine Kommentare »