Mit Google ähnliche Bilder finden

Das ist nicht mehr wirklich neu, denn schon seit April ist die Google-Funktion „Similar Images“ aus dem Google-Labor bekannt. Es wurde auch schon eigehende darüber berichtet und spekuliert (dort unbedingt das Video ansehen!). Ich habe da natürlich auch hin und wieder ein paar meiner Bilder getestet.

Gestolpert bin ich kürzlich über die Ergebnisse zu meinem Bild einer Aubergine (Screenshot). Wenn ich mir das Ergebnis ansehe gewinne ich den Eindruck, das hier tatsächlich die Ähnlichkeit aus dem Bild selbst und nicht irgendwelchen Stichwörtern abgehoben wird. Dabei ist es auch völlig egal, was als eigentliches Suchwort eingegeben wurde. Die Parameter der Abfrage-URL

http://similar-images.googlelabs.com/images?

können auch so aussehen:

q=_&qtype=similar&tbnid=5mi0q0lCyy_RrM

Hinter q= muß zwar irgendetwas stehen, was ist aber egal, es hat keinen Einfluß auf das angezeigte Ergebnis.

Der Parameter tbnid= ist übrigens die eindeutige Bild-ID, bestehend aus 13 Stellen von je 26 Groß- und Kleinbuchstaben, den Ziffern 0 bis 9 sowie dem Bindestrich und Unterstrich, abgeschlossen mit einem großen „M“. Damit ergeben sich pro Stelle 6 Bit, insgesamt also eine 78-Bit ID. Diese ID ist für dieselben Bilder immer gleich, auch wenn es davon mehrere byte-identische Kopien im Netz gibt.

Die ersten drei angezeigten Treffer ähnlicher Bilder sind ja noch brauchbar, wobei der erste ja das Bild selbst ist. Aber dann kommen erstmal seitenweise Schuhe und hier kann ich mir nicht vorstellen, daß da ein beschreibungs- oder sonstwie textbasierter Zusammenhang besteht. Allerdings passen besonders Form und auch Farbe ganz gut. Hier scheint also zumindest teilweise echte Bildverarbeitung am Werk zu sein, so wie bei der Sache mit den Farben meiner Meinung nach auch.

Allerdings lassen andere Ergebnisse auch wieder Zweifel aufkommen.

Naja, ich werde das mal weiter beobachten.

5 Reaktionen zu “Mit Google ähnliche Bilder finden”

  1. Mißfeldt sagt:

    Hi Ingo, super Analyse. War mir gar nicht bewusst, dass Aubergines und Turnschuhe so ähnlich sind.
    Interessant, deine Theorie mit den Bild IDs. Das würde das zeitlich versetzte Ranken von Bildkopien gut erklären.
    Dass Google das irgendwie optisch, und nicht keyword-basiert auswertet, finde ich logisch. Ich vermute, die brechen die Bilder irgendwie runter: so eine Art grobes 255-Farben Bild, wobei jeweils 10 x 10 Piexel zusammengezogen werden. Diese runtergebrochenen Bilder verglеісhen sie dann…
    Bin gespannt, deine Analysen weiter zu verfolgen.
    Gruß, Martin

  2. Putzlowitsch sagt:

    Ja, irgendwie müssen die Bildinformationen stark auf wesentliche Sachen reduziert werden, um sie überhaupt irgendwie verglеісhbar und verrechenbar zu machen.

    Man könnte zum Beispiel Farbflächen extrahieren und deren normierte Größe, den Flächenschwerpunkt und einen Formfaktor speichern und dann irgendwie verrechnen. Die Farben sind für die Farbsuche ja auch schon irgendwie vorhanden.

    Interessant finde ich hier z.B.den vierten Treffer :-)
    http://similar-images.googlela...ilar&tbnid=CIlSwl6TXr5bZM

  3. […] ist und bleibt es aber das selbe Bild – auch wenn es auf einer anderen Website auftaucht. (siehe dazu bei Putzlowitsch) Daher tauscht Google einfach die Ziel-URLs aus. Diejenigen Bilder, die scheinbar lausig optimiert […]

  4. Schnurpsel sagt:

    Mit Google ähnliche Bilder suchen…

    Ganz neu ist sie nicht, seit einiger Zeit gibt es im Google-Labor diese spezielle Suchfunktion bereits. Da nannte sie sich “Similar Images” und hat nun scheinbar den Sprung aus dem Labor in die Weiten des Internets geschafft.
    Heute ist mir …

  5. Schnurpsel sagt:

    Google Bildersuche – ähnliche Bilder aufgefrischt…

    Gestern war es mir bei der Übersicht meiner Putzlowitsch-Bilder vom März 2011 (inurl-Suche) aufgefallen. Unter fast jedem Bild steht nun der Link “Ähnliche Bilder suchen”. Das fand ich allein schon deshalb erstaunlich, weil es sich um Bilde…

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.

Hinweis: Kommentare von bisher unbekannten Schreibern (Name und eMail) oder mit mehr als einem Link werden moderiert.