Ein Bild sagt mehr als tausend Worte

„Ein Bild sagt mehr als tausend Worte“ heißt es in einem Sprichwort, das wohl den Chinesen zugeschrieben wird. Zudem ist die Betrachtungsweise eine Bildes immer subjektiv, ich sehe auf einem Bild möglicherweise etwas anderes als meine kleine Tochter oder die Bundeskanzlerin.

Einen Aspekt hatte ich bei meinem gestrigen Artikel „Das Ende der Google-Bildersuche“ gar nicht weiter beleuchtet, den eigentlichen Inhalt des in den Quellen genannten Urteils des LG Hamburgs.
Der Knackpunkt sind wohl die Thumbnails, also die kleinen Vorsschaubilder, die Google bei den Bildersuchergebnissen anzeigt:

„Anfang 2008 hatte bereits das Oberlandesgericht Jena in einem Berufungsverfahren entschieden, dass die von Google praktizierte Generierung von Thumbnails ohne Zustimmung des Urhebers rechtswidrig sei. Bei der Herstellung eines Thumbnails handele es sich um eine Umgestaltung eines Werkes, die noch dazu dann in der Trefferliste unzulässig verwertet werde, hatten die Jenaer Richter geurteilt.“

Und weiter steht im Heise-Artikel:

„In der Hamburger Verhandlung hat der Richter Prozessbeobachtern zufolge erklärt, Google habe ja die Möglichkeit, anstatt Thumbnails eine textliche Umschreibung der indizierten Abbildungen zu veröffentlichen.“

Erstmal finde ich es ja löblich, daß sich der Richter sogar Gedanken gemacht hat, wie die Urheberrechtsverletzungen zukünftig vermieden werden könnten. Und noch jemand hat sich Gedanken gemacht (via, via), nämlich darüber, wie die Bildersuche zukünftig aussehen könnte.

Ich habe mir nun Gedanken gemacht, ob sowas überhaupt funktionieren kann. Im Prinzip ja, denn der HTML-Standard sieht sogar extra das alt-Attribut für Bilder vor, in dem das Bild kurz beschrieben werden soll. Gedacht ist es als Alternativtext für die Fälle, in denen das Bild nicht angezeigt werden soll oder kann. Zusätzlich gibt es seit HTML 4.0 außerdem noch longdesc, also extra ein Attribut für eine längere Beschreibung. Hier kann ein Verweis auf einen ausführliche Beschreibung hinterlegt werden (nicht die Beschreibung selbst). Das Problem ist auch hier, das viele von den Möglichkeiten nichts wissen und deshalb kaum sinnvolle alt-Texte bei den Bildern zu finden sind, geschweige denn die long description.

Google-Bildersuche: Apfel
Ein weiteres Problem ist die Beschreibung selbst, zumal wenn diese falsch oder ungenau, mithin natürlich immer subjektiv ist. So habe ich mir mal die drei ersten Bilder für die Suche nach apfel hergenommen und mit den Beschreibungen bei „daRONNs ostBLOG“ verglichen.

Bild 1 „Apfel, links rotgefärbt mit rechtswärtigem Verlauf nach grün, kein Stiel, handelsüblich“
Ich hätte eher geschrieben: „Roter Apfel mit etwas gelb, kurzer Stiel, auf Parkett/Laminat-Fußboden, bodenständig“

Bild 2 „Apfel, einfarbig, grün, mit Stiel, Schlagschatten 45°, weißer Hintergrund, 100g“
Also grün sieht mir dieser Apfel nun absolut nicht aus, zudem hätte ich noch das Blatt am Stiel erwähnt.

Bild 3 „Apfel, rot, schön anzuschauen, ohne Hintergrund, noch nicht angebissen“
Gut, das kann man so gelten lassen :-)

Ich denke, daß der vermutlich gut gemeinte Vorschlag des Richters damit in der Realität aber meilenweit am Ziel einer Bildersuche vorbeischießt. Die technischen Möglichkeiten sind eigentlich gegeben, in der Praxis scheitert das aber daran, das kaum jemand sein Bilder sinnvoll beschreibt und zudem Fehler und subjektive Einflüsse die Beschreibung unter Umständen wertlos machen.

Die Chinesen, so sie es denn waren, behalten also recht. Ein Bild sagt mehr als tausend Worte.

Keine Kommentare »

Das Ende der Google-Bildersuche

Klinken putzenDas Ende der Google-Bildersuche steht kurz bevor, könnte man zumindest annehmen, wenn man die Schlagzeile „Google Bildersuche vor dem Aus?“ liest. Auch Heise berichtet nun darüber.

Wenn es tatsächlich so kommt, wäre das ein schwerer Schlag für mein Blog. Worüber soll ich denn noch schreiben, wenn nicht über meine bei Google gut platzierten Bilder oder die lustigsten Suchanfragen.

Bei dem oben verlinkten Artikel vom GoogleWatchBlog hat sich eine Diskussion entwickelt, ob es nun gut und richtig oder schlecht und falsch ist, daß Google einfach alle erreichbaren Inhalte des Webs indiziert und speichert. Als Beispiel wurde das sogenannte Opt-In- bzw. Opt-Out-Verfahren angeführt, welches z.B. im Bereich der E-Mail-Werbung verwendet wird. Vereinfacht gesagt, bedeutet Opt-In, daß ich dem Empfang z.B. eines News-Letters explizit zustimmen muß. Bei Opt-Out ist es hingegen so, daß ich die Sachen erstmal ungefragt zugeschickt bekomme und dann gegebenfalls der weiteren zusendung widersprechen kann. In Deutschland sind z.B. bestimmte Werbemaßnahmen nur nach erklärter oder mutmaßlicher Einwilligung zulässig.

Bezogen auf die Suchmaschinen gibt es zwei große Meinungs-Lager. Die einen sagen, die Suchmaschinen dürfen nicht einfach ungefragt Inhalte abgrasen, speichern und per Suchfunktion zugänglich machen. Die anderen meinen, wer Inhalte ins Web stellt muß davon ausgehen, das sie abgefragt, gespeichert und zugänglich gemacht werden. Wenn man das nicht will, muß man die Sachen halt per Paßwort schützen oder den Suchmaschinen-Robotern die Abfrage z.B. in der Roboter-Steuerdatei robots.txt verbieten. Seriöse Robots halten sich an die Anweisungen in dieser robots.txt-Datei.

Das Problem ist aber, daß die meisten Webseitenbetreiber nichts von den Möglichkeiten und Funktionen zur Steuerung der Webcrawler wissen.

Ich bin im Moment so ein wenig hin und her gerissen, welchem Lager ich mich anschließen soll. Einerseits halte ich die ungefragte Speicherung aller nur irgendwie greifbaren Daten eher für gefährlich und nicht erstrebenswert. Anderseits ist das Opt-Out Verfahren nicht nur im Internet sondern in vielen Lebensbereichen zumindest historisch gesehen die übliche Herangehensweise. Das kann auch gar nicht anders sein, weil zum Beginn einer neuen Entwicklung die möglichen Folgen noch nicht absehbar sind.

Prinzipiell darf man erstmal alles machen, Freiheit ist für viele Menschen das höchste Gut. Diese Freiheit alles zu tun und zu lassen was man will, wird aber durch Normen und Gesetze beschränkt und reglementiert. Anders herum ist das für die meisten kaum vorstellbar, also man darf überhaupt nichts und es werden nur bestimmte Sachen erlaubt. In der Praxis gibt oder gab es aber schon immer beide Varianten. Nehmen wir nur mal die Reisemöglichkeiten eines Deutschen zu DDR-Zeiten, als DDR-Bürger durfte man praktische nicht in andere Länder reisen, außer in ein paar sozialistische Bruderländer. Dem BRD-Bürger hingegen stand praktisch die Welt offen, von ein paar Ausnahmen vielleicht mal abgesehen.

Bei meiner Firewall habe ich für eingehenden Netzwerkverkehr eine Opt-In Strategie eingestellt, es kommt nichts rein, es sei denn, ich habe es explizit erlaubt. In der Gegenrichtung ist es genau anders herum, alles darf raus, nur ein paar Sachen verbiete ich.

Wenn für Suchmschinen schon immer ein „Alles ist verboten, ich darf nur einlesen, wenn es explizit erlaubt ist“ gegolten hätte, wären wir wahrscheinlich suchmaschinentechnisch noch auf dem Stand von vor 15 oder 20 Jahren. Ich hätte viele interessante Seiten überhaupt nicht entdeckt, weil deren Betreiber nicht wissen, daß sie Ihre Inhalte für die Suche erst freigeben müssen.

Andererseits wäre auch denkbar gewesen, das sich in der Anfangszeit der Websuche die Entwickler zusammengetan und auf einen Standard geeinigt hätten, der genau wie jetzt das Einlesen per Steuerdatei verbietet, dieses halt explizit erlauben würde. Das hätte man dann aber auch entsprechend bekannt machen und forcieren müssen.

So war es aber nicht und so muß man nun erstmal mit dem klarkommen, was sich im Laufe der Zeit entwickelt hat. Eine Lösung wäre entweder eine Umkehr der Vorgehensweise seitens der Suchmaschinenbetreiber oder eine stärkere Propagierung der Möglichkeiten, wie man die Suchmaschinen aussperren kann. Ich könnte mir sogar vorstellen, daß Webhoster für ihre Kunden erstmal standardmäßig eine robots.txt konfigurieren, die alles verbietet (und den Kunden natürlich darauf hinweisen), und der Nutzer dann dieses ausdrücklich ändern muß. So kann dann zumindest keiner mehr sagen, er hätte nichts gewußt.

Allerdings sehe ich dann auf die verschiedenen Foren einen großen Batzen Mehrarbeit zukommen, schon heute gibt es z.B. im WPD-Forum immer wieder Anfragen der Art “ Ich habe gestern mein WordPress-Blog online gestellt und werde immer noch nicht von Google gefunden!!!!! Warum?????“

Weitere Artikel mit Bezug zu diesem:
Ein Kommentar »

Der Leitwolf und sein Rudel

Regelmäßig im Netz lese ich eigentlich nur Heise und natürlich die Blogs in meiner Blogroll. Gut, im WordPress-Deutschland-Forum treibe ich mich auch häufig rum und in letzter Zeit schaue ich öfter mal bei Rivva vorbei. Rivva ist ein Neuigkeiten-Ansammler, der sich ein paar etablierte Medien und Blogs hernimmt und daraus Themen und Meldungen extrahiert, die gerade wichtig erscheinen, über die viel geschrieben und diskutiert wird.

Bei Rivva gibt es Leitwölfe, dort werden sie Leitmedien genannt und man kann sich eine Liste der Leitwölfe ansehen. Ein Leitwolf ist ein Medium (Nachrichtendienst/Blog), welches eine neue Geschichte schreibt, also gewissermaßen ganz neu oder zumindest erstmals in Umlauf bringt. Das reicht aber noch nicht für eine Top-Story bei Rivva. Hier kommt nun das Rudel ins Spiel.

Das Rudel sind andere, meist kleinere und unbedeutendere Medien, die ein Thema aufgreifen, auch darüber berichten und auf den Beitrag des Leitwolfes verweisen. Ich bin z.B. einer aus dem Rudel. Aber auch andere Leitwölfe gehören natürlich zum Rudel, so können sie auch Themen der anderen Leitwölfe übernehemen und so zu einen Platz auf der Rivva-Startseite verhelfen.

Wenn ich hier nun fleißig interessante Artikel schreibe, könnte ich sogar zu einem Leitwolf aufsteigen. Dazu müßte ich allerdings ein Rudel hinter mir haben, hab ich aber derzeit (noch :-) nicht.

Viel interessanter ist für mich im Moment die Frage, welchen Einfluß das Rudel hat. Dazu habe ich einfach mal einen Leitwolf-Artikel genommen, der noch nicht bei Rivva zu finden war, und dazu etwas geschrieben. Ich gebe zu, inhaltlich ist es etwas improvisiert, aber egal. Es ging mir ja nur darum zu sehen, ob ich damit den Artikel auf die Rivva-Startseite befördern kann. Ja, es hat geklappt, er hat es zwar nicht zum Top-Artikel ganz oben gebracht, aber so an vierte oder fünfter Stelle war er dann zu finden.

Mein zweiter Versuch war, eine schon etwas ältere Meldung wieder nach oben zu holen. Auch das hat geklappt, allerdings ist der Artikel wieder relativ schnell in der Versenkung verschwunden.

Zudem ist natürlich auch ein gewisser Rückkopplungseffekt zu beobachten. Wenn man es erstmal auf die Startseite geschafft hat, werden andere auf den Artikel aufmerksam und schreiben vielleicht etwas dazu, was dann natürlich wieder die Position stärkt.

Wie in der Natur auch, ist ein Leitwolf ohne Rudel eigentlich nichts wert, oder anders gesagt, wir sind das Volk, oder noch anders gesagt, die Macht geht vom Volke aus, oder noch anders gesagt, wer mit den Wölfen heult, wird sich einen Wolf laufen.

Apropos Wolf, heute morgen beim Frühstück las ich in der SVZ:

Ein wild lebender Wolf wurde erstmals in einem Waldgebiet im Forstamt Neuhaus südlich von Hannover gesichtet.

Ob es wohl ein Leitwolf war?

Weitere Artikel mit Bezug zu diesem:
Ein Kommentar »

Daten von 30 Millionen Handy-Kunden abrufbar

HandysIrgendwie hatte ich die Meldung vor zwei Tagen nicht richtig für voll genommen. Ich dachte, das wäre praktisch genau das gleiche wie die Sache mit den schon vor einiger Zeit geklauten 17 Millionen Kundendaten bei T-Mobile gewesen. War es aber nicht, sondern eine Datenschutzlücke neuen Ausmaßes. Laut Spiegel und Heise waren wohl mehr als 30 Millionen Kundendaten nahazu von jedem einseh- und sogar änderbar.

Weiter steht dann im Spiegel-Artikel:

In einer gewaltigen Hauruck-Aktion schloss die Telekom die gefährliche Sicherheitslücke in der Nacht von Donnerstag auf Freitag – nachdem der SPIEGEL den Konzern mit seinen Recherchen konfrontiert hatte.

Seitdem das Leck geschlossen worden ist, wird Kunden bei einer Änderung ihrer Stammdaten per SMS eine Zahlenkombination (Tan) auf das Handy geschickt. Diese muss dann vom Kundenbearbeiter in den Computer eingegeben werden.

Das kommt mir doch irgendwie bekannt vor, war ich doch vor gut zwei Wochen im Handyladen. Da konnte die freundliche Mitarbeiterin überhaupt erst auf meine Daten zugreifen, nachdem sie einen per SMS an mich geschickten Code eingegeben hätte. Hätte deshalb, weil er bei mir auch nach drei Versuchen nicht ankam, war aber meine Schuld. Das ist doch eigentlich genau das, was oben als neues Sicherheits-Feature genannt wurde, oder doch was anderes?

Jetzt werde ich erstmal nachsehen, ob irgendwer was an meinen Daten geändert hat, man weiß ja nie…

Weitere Artikel mit Bezug zu diesem:
Ein Kommentar »

Podcast 2.0 beta

Studio beta 2.0Da dachte ich mir, nehm ich mal schnell einen Podcast auf, kann ja nicht so schwer sein. Stationäre Aufnahmetechnik ist vorhanden, nur noch flugs die Mikrofone ausgepackt und angeschlossen, Rechner hochgefahren und den Aufnahmeknopf gedrück. Pegel sieht gut aus, also los.

Beim Abhören wurde mein Gesicht aber immer länger, in der Aufnahme sind mehr oder weniger starke Knackser zu hören. Wenn man die Wellenform im Audioeditor auf sichtbare Einzelschwingung aufzieht, sieht man auch, wo das Geknackse herkommt. Es sind ganz einfach Aussetzer, zwar nur von kurzer Dauer, aber es knackt trotzdem ganz ordentlich. So kann ich natürlich nicht „auf Sendung“ gehen, muß ich erstmal Ursachenforschung betreiben.

Vermutlich muß ich am Betriebssystem optimieren, am Besten einfach noch mal neu installieren. Ich hatte in letzter Zeit ziemlich viel Zeugs zum Probieren installiert, sei es nun Google-Chrome, der AVM-Fritz-USB-Netzwerktreiber, VoIP-Software und was nicht alles noch. Da ist bestimmt irgendwas dabei, was kurzzeitig alle Systemrecourcen an sich zieht und schon gibt es Aussetzer in der Aufnahme. Oder ich muß mal den Sample-Buffer wieder etwas großzügiger bemessen, 32 ist vielleicht doch etwas wenig.

So befindet sich mein Podcast also erstmal in der Beta-Phase, mal sehen, ob er die je verlassen wird. Der Trend geht zur Zeit eher in Richtung Dauer-Beta-Phase, meint zumindest Jan beim Upload-Magazin, und da muß ich ihm sogar recht geben. Aber das muß man ja nicht mitmachen. Ich kündige einfach mal noch für dieses Jahr eine richtige Version meines ersten Podcasts an. Obwohl, könnte auch erst nächstes Jahr was werden, oder 2010, oder doch erst…

4 Kommentare »