VOICE Newsletter 12/2003 - Leserbriefe, Addenda, Errata

Virtual OS/2 International Consumer Education

Dezember 2003

[Inhaltsverzeichnis]
[Vorherige Seite] [Nächste Seite]
[Artikelverzeichnis]

Leserbriefe, Addenda, Errata

Wenn Sie irgendwelche Kommentare bezüglich Artikeln oder Tips in dieser oder eine älteren Ausgabe des VOICE Newsletter abgeben wollen, senden Sie sie bitte an editor@os2voice.org. Uns interessiert stets, was unsere Leser zu sagen haben.

Letzten Monat schrieb ich über SPAM und die dadurch verursachten Probleme. Ich bat Sie, unsere Leser, mir über Ihre Erfahrungen mit und Lösungen für SPAM zu schreiben. Interessanterweise setzen Anwender sämtliche Filtertypen, angefangen beim Netzwerkniveau bis zu einfachem Filtern nach Wortlisten auf Anwendungsniveau, mit stark unterschiedlichem Erfolg ein. Es scheint, daß viele zum Reinhalten ihres Postfachs eine Kombination von Filtern verschiedener Niveaus implementiert haben.

Ich möchte mit einem Brief von Phil Parker beginnen, der interessantes darüber zu berichten hat, was uns für SPAM anfällig macht.

Ich denke, dies ist eine Ankündigung wert. Der Teil in geschweiften Klammern unten ist erforderlich, um die Informationen verbreiten zu dürfen.

17. Warum bekomme ich soviel SPAM?: Halbjährlicher Forschungsbericht zu unerwünschter kommerzieller E-Mail
http://www.cdt.org/speech/spam/030319spamreport.shtml

Das Zentrum für Demokratie und Technologie (CDT) stellt diesen aufschlußreichen Bericht vor, in dem einige der Schlüsselfaktoren diskutiert werden, die E-Mail-Nutzer für SPAM anfällig machen. Basierend auf einer vom CDT durchgeführten Studie umreißt der Bericht die SPAM-Quellen und wie Spammer an E-Mail-Adressen herankommen. Durch Einrichtung von 100 verschiedenen E-Mail-Adressen und Nutzung jeder Adresse auf eine bestimmte Art und Weise dokumentierten die Administratoren der Studie das Online-Verhalten, welches zum meisten SPAM-Eingang führte. Der Bericht räumt mit einigen verbreiteten SPAM-Legenden auf und unterbreitet Vorschläge dazu, wie man sich aus den Mailing-Listen der Werbeleute fernhält. Ein Hinweis am Ende des Berichtes empfiehlt ein gratis erhältliches Online-Dienstprogramm, mit dessen Hilfe E-Mail-Adressen bei der Online-Veröffentlichung unkenntlich gemacht werden können. [CL]

{From The NSDL Scout Report for Math, Engineering, and Technology,
Copyright Internet Scout Project 1994-2003. http://scout.wisc.edu/}
Hauptempfehlung: man sollte öffentlich gemachte E-Mail-Adressen als numerische HTML-Equivalente kodieren. Ein Kodierungsprogramm ist gratis erhältlich unter: http://www.wbwip.com/wbw/emailencoder.html
Phil Parker
philDESPAM@math.twsu.edu

Thomas Müller hat den manuellen Weg eingeschlagen, was sicherlich genau ist, aber Anwendern nicht weiterhilft, die pro Tag mehrere hundert SPAM-Nachrichten erhalten.

Hier meine Antwort auf Ihren Artikel: Ich verwende PMMail und dessen "Fernsteuerung", um SPAM auf dem Server meines Providers zu löschen. Das wär's.

Danke für Ihre Arbeit für os2voice.org. Hören Sie nicht damit auf.

Thomas Müller
th.muellerDESPAM@nwn.de

Jim Arnold und Christoph Kloeters verwenden beide eine Web-basierte Methode:

Meine Herren,

für meine persönliche E-Mail setze ich den Mail-Service Netaddres.com ein. Man hat dort einen sehr guten SPAM-Filterungsdienst implementiert, mit dessen Hilfe ich alle SPAM-Nachrichten in einen Papierkorbordner auf deren Server leiten lassen kann. Gelegentlich schaue ich in diesen Ordner und überprüfe, ob sich darin auch keine Mail befindet, die ich gerne lesen würde, und lösche dann sämtliche im Ordner befindlichen Mails. Diese Methode ist Web-basiert. Ich lade nur diejenigen Nachrichten über POP-Zugriff auf meinen lokalen Mail-Client herunter, die sich dann noch in meinem Eingangsfach befinden.

Diese Methode erleichtert zwar mir das Schultern der Last namens SPAM, tut jedoch nichts, um die Belastung des Internet durch SPAM zu vermindern.

Jim
jim.arnoldDESPAM@ec.gc.ca

Christoph Kloeters schreibt:

Ihr fragt im Newsletter nach SPAM-Filter-Lösungen. www.eleven.de bietet fuer Endwanwender einen kostenlosen Filter an. Dieser basiert auf einer E-Mail-Adresse, an die Mail weitergeleitet wird. Außerdem benötigt man entweder ein weiteres Postfach, wohin die gefilterte Mail dann weitergeleitet wird, oder man hat ein Postfach mit guten Filtern (gmx empfohlen!), die die bereits gefilterte Mail nicht wieder an eleven zustellt. Eleven seinerseits markiert die gefilterten Mails nur im Header und löscht selbst nicht, das kann man entweder Client-seitig machen oder - wie ich - dazu die komfortablen Filter von gmx nutzen.

Eleven hat bei mir bislang keine einzige (!) Mail fehlerhaft als SPAM erkannt und läßt bei ca 70-120 SPAMs täglich nur ca. 1-5 SPAMs fehlerhaft durch (teilweise sind das Mails, die durch kein Kriterium zu erkennen sind, beispielsweise leere Adreßverifikations-Mails).

Für den kommerziellen Einsatz kostet eleven allerdings - habe keine Vorstellung, in welchem Rahmen sich die Kosten bewegen.

Schönen Gruß,
Christoph

Matt Walsh verwendet den inhaltbasierten Filter seines Providers, der gute Ergebnisse liefert, hat jedoch Schwierigkeiten dabei, andere Konten mit einem einfachen Wortfilter sauberzuhalten.

Wie Sie schon erwähnten, ist das ganze bei OS/2 nicht lebensgefährlich, nur lästig. Mein Konto bei ATT Global ist mit sehr guten SPAM-Filtern ausgerüstet. Anscheinend benutzt man dort Bright Mail, das im letzten Test des PC Mag am besten abgeschnitten hat. Bei meinen Heimkonten nutze ich PMMail und selbst erstellt Filter, aber es wächst mir über den Kopf, so daß ich wohl bald Junk Spy werde kaufen müssen.

PS: Ich stimme Ihnen zu und wünschte, man könnte dem Abschaum ein "knee capping" zuteil werden lassen oder wenigstens ihre Rechner brutzeln.

Matt
mwalsh1DESPAM@elp.rr.com

Fritz Schori setzt einen Netzwerkfilter zur Virenabwehr ein, plus eine Kombination einfacher Filter auf Wortbasis und statistischer Auswertung des Inhalts.

Hallo,

Ich filtere auf der Injoy Firewall die ersten 16 Bytes des Swen. Dieses Binary-Format wird nur von den Swen-Viren benutzt.

Ich verwende einerseits selbst erstellte Filter in PMMAIL für meinen normalen Account beim Provider. Da ich aber auch meinen eigenen Server habe, verwende ich Weasel mit Weaselfilter. Gut finde ich, daß man mit Weaselfilter einen Grenzwert eingeben kann. Für jeden Filter gibt es einen Wert. Die Werte einer E-Mail werden zusammengezählt und falls die Summe höher ist, wird die Mail abgewiesen.

Gruss Fritz
fritzDESPAM@os2force.ch

Walter Metcalf verwendet einen ähnlichen Ansatz auf Basis von Sundial Systems JunkSpy.

Ich verwende Sundials JunkSpy 2.0, habe diesen aber durch verschiedene eigene Filter ergänzt. Ich erhalte relativ wenige falsche positive Ergebnisse, aber es rutschen noch viel zu viele SPAM-Nachrichten durch. Ich bin daher auf der Suche nach einem besseren Werkzeug.
Walter F. Metcalf
walter.os2DESPAM@rogers.com

James Moe verwendet ebenfalls Junkspy mit Bogofilter und Mike Frys Proxyc.

Hallo,
Ich verwende zwei Programme: Junkspy und bogofilter. Junkspy ist ein kommerzieller POP3-Proxy, der eingehende Nachrichten auf Basis einer inhaltsvergleichenden Datenbank scannt. Er ist durchaus effektiv, besonders wenn man die "blackhole"-Option aktiviert. Er markiert zuverlässig etwa 90-95% des SPAM. Er hat eine Tendenz, eher konservativ zu prüfen, so daß er falsche positive Ergebnisse ausgibt. Es wird auch eine "whitelist"-Option angeboten. (Sie nennen es Global Exceptions). Die Datenbank wird regelmäßig mit neuen und verbesserten Einträgen aktualisiert.
Bogofilter ist ein Bayes-Klassifizierer. (OS/2 Versionen bekommt man auf Hobbes.) Es ist ein eigenständiges Programm, welches durch den E-Mail-Client aktiviert werden muß, um die Nachrichten zu begutachten. Als Ergebnis werden Ja, Nein oder (wahlfrei) Unsicher angegeben. Dieses Ergebnis kann auch dem Nachrichtenkopf (Header) hinzugefüt werden. Wie die meisten Bayes-Filter wird es nach einer anfänglichen Trainingsphase sehr genaue Ergebnisse liefern. Der einzige Nachteil ist seine CPU-intensive Natur: Auf meinem Athlon 1800MHz schafft es nur 4 bis 7 Nachrichten pro Sekunde. Zwischen diesen beiden Programmen schlüpft kein SPAM durch. Im wahrsten Sinne des Wortes! Die gelegentlichen als Unsicher markierten Nachrichten (2 bis 3 pro Woche) sind leicht zu handhaben.
Damit der Einsatz von bogofilter noch besser funktioniert, entwickelt Mike Fry Proxyc (auch auf Hobbes zu bekommen), einen raffinierten POP3-Proxy, der aus bogofilter einen Daemon macht. Dadurch wird das Programm im Speicher gehalten und dessen Klassifizierungsgeschwindigkeit gegenüber der eigenständigen Programmversion verdoppelt. Er reagiert prompt auf Anwenderrückmeldungen.

James Moe
jimoeDESPAM@sohnen-moe.com

Vier weitere Anwender benutzen ausschließlich Filter nach Bayes-Algorithmus.

Bernd Hohmann schreibt:

Hi,
http://www.zerotoaster.net enthält einen Bayes-Filter, einen Zeichenkettenfilter (Stringfilter) und ein AV-Plugin.
Zusammen mit seinem POP3-Fetchmail-Modul kann es den Eingangskasten sauber halten.
Bernd
hohmannDESPAM@harddiskcafe.de

Per Johansson und Niels Jensen setzen beide den Polarbar Mailer ein, mit dem eingebauten Bayes-Filter. Per Johansson schreibt:

Hallo.
Ich setze den PolarbarMailer mit den Bayes-Filtern ein, so daß schlechte Nachrichten in einem speziellen Ordner landen. Dies funktioniert recht gut, mit nur wenigen Fehlern. Da ich eine ADSL-Verbindung habe, ist die SPAM-Downloadzeit kein großes Problem.
Per Johansson
perDESPAM@johansson.name

Von Niels Jensen:

Hi,
Sowohl zuhause wie auch auf der Arbeit setze ich die im Polarbar Mailer enthaltenen stastikbasierten Bayes-Filter ein. Diese Filter schauen nach guten und schlechten Wörtern, basierend auf einem benutzerdefinierten Grundstock aus guten und schlechten E-Mails (dem Inhalt).

Ich schätze das Verhältnis von SPAM zu verwendbarer E-mail auf 1 zu 10. Im Moment fängt der Filter etwa 80% des SPAM. Der Filter verschiebt die SPAM-Mail in einen separaten Ordner, den ich dann etwa monatlich leere. Ich untersuche den Inhalt des SPAM-Ordners nicht, aber eine Reihe anderer Filter arbeiten auf den nicht-SPAM-E-Mails.
In der Grundeinstellung werden alle Nachrichten, die bekanntermaßen gut sind, z.B. Nachrichten von Mtarbeitern (bekannte Domain), Nachrichten von Mailing-Listen (bekannte Adressen), Nachrichten von Personen, mit denen ich zusammenarbeite (bekannte Adressen) herausgefiltert. Durch diese Vorgehensweise werden alle Nachrichten, die wichtig sind, aus dem Eingangsfach in andere Ordner verschoben, und nur die Nachrichten bleiben im Eingangsfach zurück, bei denen es sich entweder um neue Briefpartner handelt, oder um Nachrichten von Personen, bei denen sich die E-Mail-Adresse geändert hat, und um SPAM, die durch die SPAM-Filter durchgerutscht sind.
Das Herausfiltern verlangsamt die Downloadgeschwindigkeiten an meinem Arbeitsplatz - ich benutze ein TP600 mit einem 233MHz-Prozessor. Ich glaube, daß insbesondere der SPAM-Filter Rechenzeit verbraucht.
Zuhause erhalte ich bedeutend weniger SPAM als im Büro. Dies liegt sicherlich daran, daß meine Arbeitsplatz-E-Mail-Adresse von der Unternehmenswebseite aus leicht erhältlich ist, während meine private E-Mail-Adresse nicht im Klartext auf Webseiten erscheint - jedenfalls nicht, daß ich wüßte!
Das SPAM-Problem hat über die letzten 6 bis 12 Monate deutlich zugenommen, und viele meiner Arbeitskollegen, insbesondere die Damen, sind wirklich ein Ziel für diese vielen pornografischen und Viagra-bezogenen Nachrichten geworden. Es gibt dann auch noch ein moralisches Problem: Kann man Mitarbeitern zumuten, persönlich mit diesen Nachrichten umzugehen, wenn sie diese abstoßend finden?
Mit freundlichen Grüßen von Niels Jensen, Slangerup, Denmark
njensenDESPAM@get2net.dk

Schließlich, Steven Zaveloff und Tom Brown verwenden den im Mozilla erst kürzlich implementierten Bayes-Filter. Steven schreibt:

Ich verwende den Mozilla-E-Mail-Client mit aktivierter Junk-Mail-Kontrolle. Ich muß zwar noch prüfen, ob Nicht-Junk-Nachrichten herausgefiltert wurden, aber dies ist ein einfacher Vorgang, indem ich in den Junk-Ordner schaue und die Nachrichten schnell überfliege - wohl nur ein paar Minuten täglich. Natürlich läßt das System ab und zu mal etwas durch, aber die markiere ich dann als Junk und sie werden dann automatisch in den Junk-Ordner verschoben. Alles in allem recht ausgewogen, finde ich.
HTH
Steven H. Zaveloff
zaveloffDESPAM@earthlink.net

Zum Schluß, aber sicherlich nicht als letzter, schreibt Tom Brown:

Als Antwort auf Ihren Aufruf in den Neuigkeiten vom November...
Ich erhalte relativ wenig SPAM auf meinen RoadRunner-Konten. Ich verwende Mozilla 1.5 als E-Mail-Client, und sein Bayes-Filter fängt ungefähr die Hälfte dessen, was hereinkommt, so fünf pro Woche. Das was ich erhalte, markiere und lösche ich, um den Bayes-Filter zu trainieren, sagen sie jedenfalls. Ich habe außerdem noch eigene Filter, Relikte aus vergangenen Tagen, als ich noch andere ISPs hatte.
Ich habe vor einigen Jahren JunkSpy eingesetzt (nicht die aktuelle Version). Es verrichtete seinen Arbeit anständig, aber es ließ einige durchschlüpfen und ergab falsche positive Ergebnisse aufgrund von Wortfragmenten im Nachrichtenkopf (Header). Ich stellte die Verwendung ein, als ich zu Earthlink wechselte, und habe es mit RR nicht mehr gebraucht. Ich habe Earthlinks Spaminator gelegentlich geprüft und niemals falsche positive Ergebnisse gesehen. Ich weiß nicht, wie man RRs Spam-Filter überprüfen kann.
HTH

Tom Brown
thombrownDESPAM@san.rr.com

Nachdem ich die E-Mails gelesen und die verschiedenen Lösungsansätze für ein gemeinsames Problem gesehen hatte, wollte ich mehr über das Filtern wissen.
Die genannten Filterprogramme leisten beim Abfangen von SPAM vernünftige Arbeit, und alle machen es besser als die einfachen Wortlisten (etwas, an das sich die SPAMer angepaßt haben).
Insbesonders war ich neugierig auf die Bayes-Filter und warum sie so erfolgreich sind. Sie haben in kurzer Zeit alle anderen Filtertypen überholt, und sind die von Anwendern bevorzugte Waffe gegen SPAM. About.com hat eine Erklärung zur Funktionsweise der Bayes-Filter parat, auch für Laien verständlich. Für eine detailliertere Erklärung, die für Techniker und Programmierer interessant ist, empfehle ich einen Besuch von Paul Grahams Webseite.

Ob Sie es glauben oder nicht, sogar Microsoft hat sich des Problems SPAM angenommen, obwohl sie faktisch wenig dabei geholfen haben, es aufzuhalten. Dankenswerterweise sind genügend Filter jeder Kategorie für OS/2-Anwender verfügbar.

Hilfreiche Hinweise:

Ein Plan gegen Spam: http://www.paulgraham.com/spam.html
Besseres Bayes-Filtern: http://www.paulgraham.com/better.html
Mozilla Spam Filtern: http://www.mozilla.org/mailnews/spam.html
Was Sie über Bayes-Spam-Filter wissen sollten: http://email.about.com/library/weekly/aa100702a.htm
Wie Bayes-Spam-Filter arbeiten: http://email.about.com/cs/bayesianfilters/
Ein Versuch, Junk-E-Mail nach Bayes zu filtern: http://research.microsoft.com/~horvitz/junkfilter.htm
Bogofilter Homepage: http://sourceforge.net/projects/bogofilter/
Bogofilter bei Hobbes: http://hobbes.nmsu.edu/cgi-bin/h-search?key=bogofilter
Weaselfilter: http://hobbes.nmsu.edu/cgi-bin/h-search?key=weaselfilter
Verwendung des Weaselfilter gegen E-Mail-Anhänge: http://www.os2voice.org/VNL/past_issues/VNL0902H/vnewsf3.htm
PMMail: http://www.pmmail2000.com
InJoy Firewall: http://www.fx.dk/
Sundial Systems Junkspy: http://www.junkspy.com/
Address encoder: http://www.wbwip.com/wbw/emailencoder.html
Eleven Filterservice: http://www.eleven.de
Netaddress Service: http://www.netaddress.com/
POPFile Service: http://popfile.sourceforge.net/

Nachdem dem Interview mit Walter A. Schmidt über VTeX, haben wir Lothar Frommhold gefragt, ob er einige Worte zum Einsatz von und seinen Erfahrungen mit Ian Hutchinsons T_EX to HTML (tth) schreiben könne. Lothar hat mit tth den Interviewtext vom TeX-Format nach HTML gewandelt.

Danke Lothar.

Umwandlung T_EX-Dateien nach HTML

Neulich benötigte ich ein Dokument im HTML-Format, um es im Web veröffentlichen zu können. Diese Dokument war zuvor mit Hilfe von VTeX/2 als mehrseitiger, Nur-Text-Artikel ohne irgendwelche Abbildungen, Tabellen oder mathematische Formeln bei Verwendung einiger Standardschriftschnitte (Fett, Roman, Kursiv) erstellt worden.

Das Dokument war strukturiert in Paragraphen und Listen und enthielt URLs als Refrenzen zu bestimmten Web-Sites. Ein universell einsetzbares, robustes Konvertierungsprogramm von T_EX nach HTML existiert bis jetzt noch nicht, aber es gibt einige Beta-Versionen solcher Konvertierungsprogramme, die nur für einige Dokumentarten funktionieren, leider nicht für alle. (Siehe hierzu: M.Goosens and S.Rahtz, The LaTeX Web Companion, Addison-Wesley 1999).

Ein befreundeter T_EX-Experte schlug vor, ich solle Ian Hutchinsons T_EX nach HTML-Konverter (tth) ausprobieren.

Da es kein ausführbares Programm für OS/2-eCS gab, besorgte ich mir die Quelldatei tth_C.tgz von http://hutchinson.belmont.ma.us/tth/. [Anm.d.Red.: Alexander Mai bietet bereits seit geraumer Zeit eine OS/2-Version des Programms an, allerdings ist seine Homepage umgezogen: http://www.lesstif.org/~amai/os2/html/.]
Mit InfoZip ausgepackt (Eingabe: unzip tth_C.tgz auf der Kommandozeile), wird u.a. tth.c ausgepackt, welches ich dann mit dem Watcom C Compiler, der mit eCS ausgeliefert wird, kompilierte. (Eingabe: wcc386 -k2048k tth.c)

Der Schalter k (-k2048k) ist notwendig, um einen ausreichend großen Stapel für die Ausführung zu reservieren. Das Kompilieren dauerte einige Minuten und erzeugte die ausführbare Datei tth.exe, die dann in ein Unterverzeichnis kopiert werden muß, daß im Pfad (siehe CONFIG.SYS) liegt.

Danach wechselte ich in das Verzeichnis mit der VTeX-Datei und gab ein: tth "name".tex, wobei "name" der Name der VTeX-Datei ist (oder der T_EX, LaTeX-Datei).

Dies erzeugte die Datei "name".html, die im Browser schon recht gut aussah (in meinem Fall der IBM Web-Browser); ein Klick auf einen Link ruft sofort die gewünschte Web-Seite auf.

Es brauchte weniger als 30 Minuten, um tth.exe auf meinem Computer einzurichten; die Umwandlung des 6-seitigen Artikels von VTeX nach HTML dauerte nur wenige Augenblicke.

Ich gebe zu, daß mein Dokument relativ einfach war und vermutlich für eine Umwandlung nach HTML keine große Herausforderung darstellte. Wie dem auch sei, tth.exe behandelt komplexe Tabellen und Farben ziemlich gut, zusammen mit anderen Sachen, und für mathematische Formeln gibt es von der gleichen Quelle das Schwesterprogramm mth.

Es wäre einen Versuch wert, diese Programme mit komplexeren T_EX-Dokumenten auszuprobieren.

Lothar Frommhold

[Artikelverzeichnis]
editor@os2voice.org
[Vorherige Seite] [Inhaltsverzeichnis] [Nächste Seite]
VOICE Homepage: http://de.os2voice.org

Leserbriefe, Addenda, Errata

Umwandlung TEX-Dateien nach HTML

Umwandlung T_EX-Dateien nach HTML