Serverseitige Bild-Spam-Erkennung mit FuzzyOcr

Freitag, 20 Oktober 2006
0.0/5 Bewertung (0 Stimmen)
Beschreibung

Seit einiger Zeit bekomme ich auf meinen Mailservern immer mehr Spam, bei dem die eigentliche Werbe-Botschaft in Bildern verpackt ist. Der Text dazu ist meist eher zufällig ausgewählt - alles nur um die Spamfilter zu täuschen.
Ich habe dazu das SpamAssassin Plug-in [URL=http://users.own-hero.net/~decoder/fuzzyocr/]Fuzzy-Ocr[/URL] gefunden, das ein freies OCR-Tool in die Filterkette integriert. Dazu gibt es [URL=http://www200.pair.com/mecham/spam/image_spam.html]hier[/URL] eine ziemlich brauchbare Anleitung zur Installation auf Linux-Systemen.
Für OSX müssen lediglich einige Pfade angepasst werden. Die benötigten Bibliotheken und Pakete giflib-bin, netpbm10, netpbm-bin und imagemagick lassen sich bequem mit fink installieren; einige weitere Libraries sind per CPAN zu kriegen (Mail::SpamAssassin: :Timeout, String::Approx und Image::ExifTool::Exif). Dazu braucht”s natürlich noch eine Compiler-Umgebung (zum Beispiel die Developer Tools von Apple) sowie, für die Bildbearbeitungs-Tools und -Libs eine X11-Umgebung - naja, die wird jedenfalls von Fink verlangt, wer sich alles aus den Quellen kompilieren will, kommt unter Umständen drum herum.
Anschliessend kann das Filter-Skript in SpamAssassin eingebunden und bequem per Config-File konfiguriert werden. Sobald eine Mail ein Bild enthält, wird es durch die freie OCR-Software gocr geschickt und dann der Output mit einer bestehenden Liste an »bösen« Wörtern verglichen. Dabei wirkt die Wort-Vergleicherei unscharf, was dem Plug-in wohl auch seinen Namen gegeben hat.
Natürlich sind solche Massnahmen - wie beinahe alle Spamfilter - immer nur »ein Schritt vor den Spammern«, und die werden mit weiteren Tricks nicht lange auf sich warten lassen. Trotzdem - ich habe das Ding mittlerweile auf einigen Geräten (sowohl mit Linux, OSX Server 10.3.x und OSX Server 10.4.x als OS) im Einsatz, und ich bin ziemlich zufrieden damit - der Bildspam-Anteil in den Postfächern der Benutzer hat zufriedenstellend abgenommen.

Spezifikationen

Hits

2614

© by macjaner.ch | Powered by GoeGG-ArT.ch