perMail goes Unicode
Aus:
Nr. 3/2005 vom Dezember 2005 - beachten Sie die späteren Ergänzungen.
Voraussichtlich zum Jahreswechsel wird die Version 2.0 unserer Webmail-Software perMail in Betrieb gehen.
Wer die Entwicklung von perMail im ablaufenden Jahr verfolgt hat, dem wird auf https://www.permail.uni-muenster.de/help-de-changes.html immer wieder der Punkt »Vorbereitende Arbeiten für zukünftige Erweiterungen« aufgefallen sein. Diese Erweiterungen lassen sich mit einem Begriff zusammenfassen: Unicode.
Unicode bezeichnet das weltweit einheitliche Kodierungssystem, in dem jedes Zeichen jeder Sprache unabhängig von Spracheinstellungen, Software, Betriebssystem und deren Herstellern eine eindeutige Code-Nummer erhält, welche von allen Unicode-fähigen Datenverarbeitungssystemen gleich verstanden wird (siehe http://www.unicode.org). Durch die Vielfalt älterer Kodierungssysteme konnte es geschehen, dass ein Brite £35 eintippt und der Betrag in Amerika als $35 angezeigt wird; dieser Fauxpas kann mit Unicode nicht mehr passieren.
Selbst wenn Sie von Unicode noch nie etwas gehört haben, haben Sie es wahrscheinlich schon längst verwendet: Aktuelle Windows-Systeme arbeiten intern konsequent mit Unicode, das gleiche gilt für immer mehr Linux-Distributionen, Office-Produkte, WWW- und E-Mail-Programme. Allerdings begegnet man überall noch älterer Software, die noch nicht Unicode-tauglich ist, daher wird leider gerade in E-Mails Unicode noch viel zu selten verwendet.
Auch perMail 1 beherrscht seit Jahren die
Darstellung von Unicode und die Umwandlung zahlreicher älterer
Zeichenkodierungen nach Unicode. Kürzlich wurden noch einige
ISO-2022-Kodierungen ergänzt, so dass jetzt neben üblichen E-Mails mit
verschiedenen lateinischen (wie in Łódź),
griechischen (Ελληνικά),
kyrillischen (Русский),
hebräischen (עברית)
oder chinesischen (中文)
Schriften auch übliche koreanische (한국어)
und japanische (日本語)
E-Mails trotz älterer Kodierung richtig dargestellt werden künnen. Bei
der Einstellung Textsatz=Bild gilt das sogar dann, wenn
Ihr Rechner gar nicht über entsprechende Zeichensätze verfügt.
Was perMail 1 aufgrund früherer Beschränkungen bei HTML-Formularen jedoch noch nicht anbietet, ist das Schreiben von E-Mails mit solchen Schriftzeichen: Ausschließlich Zeichen aus dem westeuropäischen Zeichensatz »ISO 8859-1 Latin 1« können bei der Erstellung von E-Mails verwendet werden. Nicht einmal das Euro-Zeichen gehört zu diesem Zeichensatz; es konnte daher beim Schreiben von E-Mails mit perMail bisher nicht verwendet werden.
Eine Universität mit ihrem weltweiten Kommunikationsbedarf sollte natürlich universellere Möglichkeiten bieten. Daher habe ich bereits vor anderthalb Jahren mit der Umwandlung von perMail 1 in perMail 2 begonnen und sehr viel Freizeit in dieses Projekt investiert. Äußerlich unterscheiden sich beide Versionen nur geringfügig, im Inneren wurde jedoch die komplette Zeichenkettenverarbeitung von ISO 8859-1 (8-Bit-Zeichenkodierung) auf Unicode (32-Bit-Zeichenkodierung UCS-4 und 8-Bit-Transportkodierung UTF-8) umgestellt. Da E-Mail-Verarbeitung nur wenig mehr als eine sehr komplexe Zeichenkettenverarbeitung darstellt, wurde praktisch das komplette Programm umgeschrieben.
Zahlreiche der dabei nötigen Verbesserungen und Neuentwicklungen
sind in den letzten Monaten auch in perMail 1
eingeflossen und werden daher schon intensiv von Ihnen genutzt. Nur in
zwei Punkten bleibt die Unicode-Unterstützung in
perMail 2 zumindest anfangs leider
unvollständig: Reguläre Ausdrücke in den Wegsortierregeln
bleiben auf ISO-8859-1 beschränkt; und die positionssabhängigen
Buchstabenformen im Arabischen und in einigen anderen Schriften werden
zumindest bei Textsatz=Bild noch nicht beachtet.
perMail 2 wird also alle Schriftzeichen in Ihre E-Mails einbauen, die Sie in Ihrem WWW-Programm eintippen können. Uns Europäer interessiert dabei natürlich vor allem das Euro-Zeichen. Um jetzt auch mit einer deutschen Tastatur koreanische oder griechische Schriftzeichen eintippen können, benötigen Sie auf Ihrem Rechner eine entsprechende Software. In aktuellen Betriebssystemen ist solche Software bereits enthalten und muss von Ihnen nur aktiviert werden; suchen Sie dazu bitte in Ihren Hilfeseiten nach IME (Input Method Editor), nach Eingabegebietsschema und/oder nach Tastaturlayout. Für einzelne fremde Schriftzeichen reicht sicherlich auch die Zeichentabelle.
Wenn Sie perMail 2 bereits ausprobieren möchten, können Sie gerne am Testbetrieb teilnehmen: Unter http://www.permail.uni-muenster.de finden Sie die Loginseite. Melden Sie entdeckte Fehler und Unstimmigkeiten bitte an perske@uni-muenster.de.
Teilnehmer am Testbetrieb sollten bitte kurzzeitige Betriebsunterbrechungen nicht als Fehler ansehen und beachten, dass Konfigurations-Textdateien (Fußzeilen, Textbausteine, Wegsortierregeln usw.) von perMail 2 im UTF-8-Format statt wie bisher im ISO-8859-1-Format abgelegt werden. Wenn Sie diese Dateien mit perMail 2 modifizieren und sie anschließend wieder mit perMail 1 verwenden, dann werden Umlaute und einige Sonderzeichen falsch dargestellt bzw. ausgewertet.
Die sonstigen in perMail 1 eingeflossenen Änderungen des ablaufenden Jahres betreffen meist nur Kleinigkeiten: Die Funktion Text ausrichten zur Formatierung einer neuen E-Mail wurde verbessert. Nach dem PGP/MIME-Standard signierte und verschlüsselte E-Mails können jetzt verifiziert bzw. entschlüsselt und weiter verarbeitet werden. Die Verschlüsselungsroutinen wurden an GnuPG 1.4 angepasst. Fehlende PGP-Schlüssel werden automatisch vom Schlüsselserver des DFN nachgeladen. Die Bedienoberfläche kann bereits auf der Loginseite ausgewählt werden. Beim Löschen hinterlegter Dateien wurde eine Sicherheitsabfrage eingebaut. Die Zentrale Nutzerverwaltung Online unter https://user.uni-muenster.de/exec/nutzer bietet die Möglichkeit, ohne erneute Passworteingabe perMail zu nutzen; auch für die Zusammenarbeit mit kommenden Single-Signon- und Portal-Systemen ist perMail jetzt gerüstet.
Selbstverständlich bleibt die Entwicklung nicht bei perMail 2.0 stehen: Eine ganze Reihe sinnvoller Vorschläge aus dem Nutzerkreis, deren Realisierung ich aus Zeitgründen zurückstellen musste, wartet bereits.

