Man mag sie ja nicht gerne im Blog, im Forum oder im Gästebuch haben, die Spam-Einträge. Dabei gelangt die größte Zahl an Spam über sogenannte Spam-Bots an ihr Ziel. Das sind Programme, die automatisch die Felder in Kommentar- oder Gästebuchformularen ausfüllen und absenden. Meist stehen da dann Verweise auf dubiose Seiten drin, kürzlich hatte ich mal einen Spamkommentar, der im wesentlichen aus 500 Links bestand, alle zeigten auf Google-Groups und dort angelegte Gruppen. Das scheint ein neuer Trend zu sein, damit bei den Links nicht sofort ersichtlich ist, worum es geht. Allerdings schaffte es dieser, wie auch die meisten anderen Spam-Kommentare, noch nicht mal bis zum meinem WordPress vorzudringen. Sie werden quasi gleich vor der Haustür stehengelassen. Zudem sind die meisten Spambots nicht besonders „intelligent“, so daß man sie mit recht einfachen Mitteln wirkungslos machen kann.
Die Grundidee bei der Spamabwehr ist immer, irgendwie herauszubekommen, ob der Kommantar von einer Maschine oder einem Menschen kommt. Das ist im Prinzip gar nicht so schwer, man muß nur etwas finden, was die meisten Menschen probemlos erkennen oder lösen können, bei dem Maschinen aber noch große Probleme haben. Sehr verbreitet ist z.B. das Lösen einer einfachen Rechenaufgabe oder das Lesen von Buchstaben und Zahlen aus einer kleinen Grafik. Die Zeichen werden dabei meist so verzerrt und verändert, daß sie zwar für einen Menschen noch lesbar sind, eine OCR-Saftware aber schlechte Karten hat. Hier mal drei Beispiele:
Die Sache hat eber mindestens einen Haken. Es ist gut möglich, daß auch ein Mensch die Zeichen nicht mehr erkennen kann. Zum einen weil er vielleicht Sehbehindert ist oder weil die Buchstaben und Zahlen zo starkt verändert wurden. Beim ersten Beispiel gab mir das erste Zeichen ein Rätsel auf, sieht aus wie ein spiegelverkehrtes, goßes „P“, aber so was gibt es eigentlich nicht. Später bin ich drauf gekommen, das es wohl eine 9 sein soll. Beim zweiten Bildchen dachte ich im ersten Moment an kyrillische Schriftzeichen, das erste könnte ein Ч (tsch) sein, danach dann wieder das komische gespiegelte P, aber sowas gibt es im kyrillischen Alphabet auch nicht. Beim dritten Bild bereitete mir das letzte Zeichen Schwierigkeiten, eine umgedrehte Stimmgabel, ein Zeichen aus der Mathematik (Schnittmenge) oder was!?
Letztendlich habe ich es kein einziges Mal geschafft, den Code richtig einzugeben. Probieren kann man auch nicht, denn nach einem Fehlversuch kommt ein neues Captcha. Nach 25 oder 30 Versuchen habe ich dann aufgegeben. Dann darf man sich als Blogbetreiber aber auch nicht wunderen, wenn niemend die Beiträge kommentiert.