

- Werbung -

SPAM.
Was genau ist "SPAM" nun eigentlich?
"SPAM" ist eine Sammelbezeichnung für unverlangt zugestellte,
unerwünschte und belästigende Nachrichten in Form von Mails oder
Postings im Usenet.

Der Name "SPAM" ist dem bekannten amerikanischen Dosenfleisch SPAM
(Spiced Porc and Ham) der Firma
Hormel Foods entliehen und gelangte wohl durch die Verwendung in einem
Monty-Python
Sketch, der SPAM zum Synonym für ein jede Kommunikation verhinderndes
Informationsrauschen machte, zu seiner heutigen Bedeutung.
Man unterteilt SPAM in folgende Gruppen:
UBE (Unsolicited Bulk E-Mail) d.h. Unerbetene Massen-Mail w.z.b.
Kettenbriefe und Hoaxes (sinnfreie Virenwarnungen).
UCE (Unsolicited Comercial E-Mail) d.h. Unerbetene kommerzielle Mail,
i.d.R. Werbung.
durch Viren initiierte Massen-Mails.
EMP (Excessive Multi-Posting) im Usenet. Dabei wird ein Artikel in
mehreren Kopien ins Usenet gestellt.
ECP (Excessive Cross-Posting) im Usenet. Dabei wird ein Artikel
gleichzeitig in mehreren Newsgroups veröffentlicht.
Für den in Mails auftretenden SPAM hat sich der Begriff Junk-Mail
(Müll-Mail) eingebürgert.
Mit der zunehmenden Anzahl Nutzer im Internet steigt leider auch die Anzahl
dieser unerwünschten Mails, die sich tagtäglich in unseren Mailboxen
einfindet und von denen hier einige
typische Beispiele zu bewundern sind. Zumeist handelt es sich dabei um
Werbung, an der die Empfänger in der Regel keinerlei Interesse haben.
Massen-Mails sind nicht nur für den Empfänger störend, sondern
können erhebliche Probleme für Datenschutz- und Datensicherheit
verursachen:
häufig sind die Mail-Adressen aller angeschriebenen Empfänger im
Header der Mail erkennbar und werden damit quer durchs Netz verteilt.
windige Adressensammler kaufen und verkaufen Mailadressen und sind damit
theoretisch auch in der Lage diverse Interessentenprofile zu erstellen. Ein
Schritt mehr in Richtung "gläserner User"...
durch die Masse unauthorisierter Mails in der Mailbox können wichtige
Mails dazwischen übersehen werden.
durch überlastungsbedingte Ausfälle von Mailservern können
wichtige Mails verloren gehen und erhebliche Kosten entstehen.
SPAM verursacht auch Kosten auf Seiten des Empfängers, denn dieser
finanziert die Bandbreite.
Da das Versenden von Nachrichten in großer Menge einfach und billig ist,
ist es mittlerweilen zu einem ernsthaften Problem geworden. Nach Angaben
verschiedener großer Provider verbrauchen Massen-Mails bereits heute
20-30% der im Internet verfügbaren Bandbreite!!! Allein der weltweite
Download verursacht nach einer Studie der europäischen Gemeinschaft
bereits Kosten in Höhe von 10 Mrd. Euro. In Deutschland sind täglich
etwa 70 - 90 Mio. SPAM-Mails unterwegs...
Woran erkennt man SPAM in Mails?
Mittlerweilen hat sich der Begriff SPAM für jegliche Arten
unerwünschter Mails etabliert. Dazu zählen Mails mit unsinnigem
Inhalt (exzessive Verwendung von HTML-Inhalten), sogenannte Kettenbriefe in
Mailform, Mails mit angehängten oder enthaltenen Viren und anderen
Schadroutinen sowie nicht zuletzt Werbung als größtem Anteil.
Die Kunst besteht nun darin, bestimmte häufig wiederkehrende Muster in
diesen Mails zu erkennen und sie anhand dieser Muster auszufiltern. Bei Mails
mit virösen Inhalten z.b. ist dies aufgrund der typischerweise enthaltenen
Scripte oder Attachments recht einfach, bei Kettenbriefen oder Werbe-SPAM
wird dies schon erheblich komplizierter.
Anfangs versuchte man einzig mittels primitiver Wortfilter dem Problem Herr zu
werden, was auch einige Jahre ganz ordentlich funktionierte. Hierbei wurde
mittels einfacher Wortlisten nach für spamtypischen Worten und
Wortkombinationen w.z.b. "Click here", "Marketing",
"Buy now" o.ä. gesucht.
Mit dem ständigen Ansteigen des SPAM-Volumens wurden diese Filter immer
größer und unhandlicher sodaß man neue Methoden finden
mußte. Eine dieser Methoden soll innerhalb dieses Projektes vorgestellt
werden...
