Glossar: Spamschutz - Bayes’scher Filter


Artikel erschienen in Swiss IT Magazine 2005/08

     

Praktisch in allen Spam-Bekämpfungsmassnahmen kommt auch ein Bayes'scher (oder bayesischer) Filter vor. Dieser beruht auf einem Konzept des englischen Mathematikers Thomas Bayes (ca. 1702 bis 1761), von dem auch der Name abgeleitet ist.
Der bayesische Filter rechnet mit bedingten Wahrscheinlichkeiten, bei dem von einem Ereignis auf seine Ursache geschlossen wird. Im Zusammenhang mit Spam bedeutet dies, dass die Wahrscheinlichkeit, dass eine Nachricht Spam ist, grösser wird, je häufiger bestimmte Wörter darin vorkommen. Überschreitet die Wahrscheinlichkeit eine vorbestimmte Grenze, wird eine Mail als Spam taxiert und von den meisten Antispam-Programmen und Mail-Clients entsprechend gekennzeichnet.
Der grosse Vorteil des bayesischen Filters ist, dass er trainierbar ist – d.h., dass er auf Worthäufigkeiten in bereits erhaltenen und klassifizierten Mails aufbaut. Der Filter erstellt eine Liste mit Schlüsselwörtern aus den unerwünschten Mails und erweitert diese laufend. So werden schon nach der Analyse einiger hundert Mails hohe Trefferquoten erzielt.
Die Spammer kennen mittlerweile verschiedene Methoden, den Filter auszutricksen: Indem die Werbung beispielsweise als Bild angezeigt wird, läuft der Filter ins Leere. Auch können lange, sinnlose Texte oder Zitate aus der Weltliteratur, die gerne in der Hintergrundfarbe geschrieben in der HTML-Mail versteckt sind, die Wahrscheinlichkeitsrechnung täuschen




Artikel kommentieren
Kommentare werden vor der Freischaltung durch die Redaktion geprüft.

Anti-Spam-Frage: Aus welcher Stadt stammten die Bremer Stadtmusikanten?
GOLD SPONSOREN
SPONSOREN & PARTNER