Jump to content

ISO-8859-2 Zeichensatz - kyrillisch - Spamabwehr


Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Empfohlene Beiträge

Moin Community,

 

habe derzeit ein Verständnis-Problem mit den Zeichensätzen der ISO 8859 Familie. Bei der gibt es ja einen Grundseichensatz der identisch mit dem ASCII Satz ist und bis Nummerierung 127 geht. Ab Nummerierung 160 fangen dann die erweiterten Sätze an, die schrift-spezifische Zeichen enthalten. Für westeuropäische und amerikanische Sprachen wird wird der Satz 8859-1 zusätzlich geladen, für kyrillische Zeichen z.B. die 8859-5. Soweit die Theorie.

 

Nun hat ein Kollege ein verstärktes Spam Problem und zwar in der Art, dass er massenhaft e-mails erhält, die mit "fremden" Zeichensätzen erstellt worden sind. Das äußert sich dann in wildem Zeichensalat in den Header- und Textbereichen. Zeichen, welche also z.B. in Russland mit dem kyrillischen Zeichensatz eingegeben worden sind, werden hier mit dem westeuropäischen wieder ausgegeben. Nur unter der entsprechenden Nummerierung in der Zeichentabelle steht natürlich nun ein anderes Zeichen, welches ausgegeben wird - es entsteht Kauderwelsch.

Nun enthalten leider nicht alle e-mails eine zusätzliche Zeichensatzangabe, nach der man den Spam-Filter suchen lassen könnte. Also habe ich versucht, bestimmte außergewöhnliche Zeichen zu suchen (z.B. " À "), welche in den Headerbereichen auch zu sehen sind. Da wir derzeit keine skandinavischen Firmen als Partner haben, dürfte solch ein Zeichen eigentlich nicht auftauchen und sollte deshalb ursprünglich durch die "Übersetzung" der Zeichen aus einem anderen Zeichensatz hervorgerufen worden sein.

Doch leider erkennt der Zeichen-Such-Filter diese nicht, obwohl das richtige Zeichen in der Filterdefinition erscheint und auch in der email enthalten ist.

Desweiteren verstehe ich auch Folgendes nicht: Mitunter erhält man kyrillische emails, welche als Text und zusätzlich auch in html generiert worden sind. Darin kann man nun gut die Zeichen vergleichen, weil der html Text in Russisch ausgegeben wird und der Plain Text in Kauderwelsch. Nun müssten die Nummerierungen der einzelnen Zeichen der verschiedenen Zeichensätze doch übereinstimmen, d.h. ein russisches "Schaa" (200) müsste in unserem Zeichensatz ein " È " ergeben. Tut es aber nicht. :confused:

 

Kann mir einer auf die Sprünge helfen?

 

Ach so: Unser e-mail Client ist Pegasus, welches von Haus aus eigentlich recht ordentliche Filterwerkzeuge mitbringt. Die Zeichensatzproblematik sollte meiner Meinung auch nicht da liegen.

 

Gruß

Mülli

Link zu diesem Kommentar
Der letzte Beitrag zu diesem Thema ist mehr als 180 Tage alt. Bitte erstelle einen neuen Beitrag zu Deiner Anfrage!

Schreibe einen Kommentar

Du kannst jetzt antworten und Dich später registrieren. Falls Du bereits ein Mitglied bist, logge Dich jetzt ein.

Gast
Auf dieses Thema antworten...

×   Du hast formatierten Text eingefügt.   Formatierung jetzt entfernen

  Only 75 emoji are allowed.

×   Dein Link wurde automatisch eingebettet.   Einbetten rückgängig machen und als Link darstellen

×   Dein vorheriger Inhalt wurde wiederhergestellt.   Editor-Fenster leeren

×   Du kannst Bilder nicht direkt einfügen. Lade Bilder hoch oder lade sie von einer URL.

×
×
  • Neu erstellen...