4. Einstellungen für ISO 8859-1 und MIME


Folgende Tips entstammen zu einem gewissen Teil einer Version des Umlaute-FAQ ftp://ftp.cs.tu-berlin.de/projects/umlaute/Installationshilfe. Weitere Tips habe ich u. a. diversen Postings in diversen Gruppen entnommen. Eine Nennung der einzelnen Personen ist dabei leider nicht mehr möglich. Trotzdem vielen Dank an alle!

In diesem Kapitel sind wohl noch die größten Lücken. Bitte schickt mir was immer ihr zu diesem Thema beitragen könnt, damit dieses Teil möglichst vielen Leuten hilft.

Die Reihenfolge der genannten Plattformen ist alphabetisch...

4.1 Acorn RISC OS

Eine der Standard-Zeichenkodierungen ist ISO 8859-1. Eine Zeichenkonvertierung ist daher nicht notwendig.

4.2 Amiga OS

Die Standard-Zeichenkodierung ist ISO 8859-1. Eine Zeichenkonvertierung ist daher nicht notwendig.

4.3 Apple Macintosh (System 7)

Die Zeichenkodierung Apple Roman ist von der Zeichenmenge weitgehend identisch mit ISO 8859-1, jedoch ist eine andere Kodierung vorhanden. Konverter laßen sich leicht mit den in Anhang T genannten Tools erzeugen. Software wie Eudora und Iride unterstützen MIME. News-Reader wie Newswatcher unterstützen ISO 8859-1, rnMac und TheNews arbeiten unter Verwendung von funktionierenden XLATS Resourcen. Weitere Mac-Software, die MIME unterstützt: Claris Emailer, MacSOUP (Newsreader).

4.4 Atari (GEM)

Die Zeichenkodierung des Atari ist weitgehend identisch mit der IBM Codepage 437. Siehe PC. Konverter laßen sich leicht mit den in Anhang T genannten Tools erzeugen. Die gängige Usenet Software für den Atari nimmt diese Konvertierung bereits automatisch vor (z. B. HERMES).

4.5 NeXTSTEP

Der NeXTSTEP Encoding Vector ist von der Zeichenmenge her weitgehend identisch mit ISO 8859-1, jedoch ist eine andere Kodierung vorhanden. Konverter laßen sich leicht mit den in Anhang T genannten Tools erzeugen. NeXTSTEP ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.

Ansonsten läßt sich die ISO 8859-1 Darstellung wie folgt erreichen:

Einloggen via rlogin -8
stty pass8 ; stty pass8out

4.6 PC

PC sind in der Regel mit folgenden Video-Karten bestückt:

MDA, HGC, CGA, EGA und VGA. Die Standard-Zeichenkodierung für diese Videoadapter ist IBM Codepage 437. Diese Zeichenkodierung umfaßt US-ASCII, die für einige europäische Sprachen notwendigen Zeichen, Rahmenzeichen und einiges mehr.

Bei EGA und VGA laßen sich andere Zeichenkodierungen nachladen, was durch manche Betriebssysteme unterstützt wird und durch andere leider nicht.

4.6.1 PC unter Coherent 3.x, 4.x

Benutzt das noch jemand?

Coherent unterstützt 8-bit und die IBM Codepage 437 generell. Für Coherent 4.2 gibt es optional X11. Coherent ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.

4.6.2 PC unter Linux

Linux unterstützt im Console-Betrieb ISO 8859-1 in der Form, daß Linux die in der IBM Codepage 437 vorhandenen Zeichen auf ISO 8859-1 abbildet und umgekehrt. Es gibt auch die Möglichkeit Fonts zu laden (VGA), bitte fragt mich aber nicht wie, ich habe die Fonts nur geliefert. :) Linux ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.

4.6.3 PC unter Minix

Soweit mir bekannt ist, unterstützt Minix 8-bit und die IBM Codepage 437. Es gilt, bis auf den Hinweis zu X11, das gleiche wie beim PC unter Coherent. Minix ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.

4.6.4 PC unter MS-DOS

Die Standard-Zeichenkodierung für MS-DOS in Deutschland ist in der Regel IBM Codepage 437. Seit MS-DOS 5.0 versucht das Installationsprogramm die IBM Codepage 850 zu installieren. Diese hat gegenüber der Codepage 437 den Vorteil, daß sämtliche Zeichen aus ISO 8859-1 vorhanden sind, was aber zu Lasten einiger Rahmenzeichen ging. Weiterhin kosten die entsprechenden Gerätetreiber ein paar KB. Konverter laßen sich leicht mit den im Anhang T genannten Tools erzeugen. Es gibt auch Freeware ISO 8859 Codepages für MS-DOS (z. B. Codepage 819) - siehe Anhang F.

4.6.4.1 PC unter MS-DOS und MS-DOS Waffle 1.65

Für MS-DOS Waffle 1.65 gibt es einen einfachen MIME-Patch. Siehe Anhang T.

4.6.4.2 PC unter MS-DOS mit CrossPoint

CrossPoint arbeitet intern ausschließlich mit Codepage 437, konvertiert diese beim Verarbeiten oder Erzeugen von RFC-Nachrichten aber automatisch nach ISO-8859-1. Nicht vorhandene Zeichen werden dabei in möglichst ähnlich aussehende Zeichen umgewandelt. In Mails werden generell die entsprechenden MIME-Zeilen erzeugt. Für News muß MIME unter Config/Optionen/Netze/Verschiedenes eingeschaltet werden.

4.6.4.3 PC unter MS-DOS und Microsoft Windows

Microsoft Windows verwendet in der Regel Codepage 1252, was im wesentlichen ISO 8859-1 entspricht. Es gibt aber mittlerweile auch Versionen für andere Sprachräume (z. B. Russisch mit kyrillischer Zeichenkodierung).

4.6.5 PC unter OS/2

IBM OS/2 verwendet intern leider immer noch IBM Codepage 850 und nicht ISO 8859-1 aka IBM Codepage 819. Das Windows Sub-System zeigt ISO 8859-1 jedoch korrekt an. Die Konvertierung zwischen IBM Codepage 850 und ISO 8859-1 ist recht einfach und sogar "verlustfrei".

4.6.6 PC unter Microsoft Windows 95

Microsoft Windows 95 verwendet in der Regel Codepage 1252, was im wesentlichen ISO 8859-1 entspricht. Mitgeliefert werden aber auch osteuropäische, griechische, kyrillische und türkische Fonts, welche im wesentlichen ISO 8859-2, -7, -5 und -9 entsprechen.

4.6.7 PC unter Windows NT

Microsoft Windows NT verwendet intern Unicode. Als Untermenge ist daher ISO 8859-1 vorhanden. Die Zeichenkodierung macht hier keine besonderen Probleme. Leider liefert Microsoft auch in der Version 4.x keine auch nur annäherungsweise vollständigen Unicode Fonts mit.

4.7 U*IX Umgebungen

Tip zum Auffinden systemspezifischer Informationen zur Internationalisierung:

man -k locale
man -k international

4.7.1 7-bit Terminal (VT52 oder VT100)

Da hilft dann nur noch das Programm iso2asc von Markus Kuhn (siehe Anhang T)

4.7.2 falsch eingestelltes 8-bit Terminal (VT2xx oder neuer)

Das Terminal muß per Setup eingestellt werden. Bei DEC Terminals geht das in der Regel durch Druck auf die Taste F3. Der Rest ist menügeführt - Speichern nicht vergessen!

4.7.3 BNews lokal oder im Pfad

Das benutzt ja wohl hoffentlich niemand mehr...

Ist es lokal im Einsatz, hilft entweder nur patchen (entfernen von "& 0x7F" aus den Quellen) oder Patches des Binaries oder Installation von z. B. CNews.

Ist BNews auf einem Rechner im Pfad im Einsatz, hilft nur das Aufspüren des entsprechenden Rechners und der Versuch den dortigen System-Admin zu bitten entweder zu patchen oder neu zu installieren. Alternativ kann man auch versuchen, sich andere Feeds für News zu suchen, die keine "Steinzeit-Software" fahren...

4.7.4 7-bit tty

Manche ttys sind default-mäßig auf 7-bit eingestellt. Da hilft meist

BSD : stty pass8
System V: stty -istrip -8

ggf. wird stattdessen benötigt:

stty -istrip cs8

(unter Ultrix 4.2, HP-UX 9.01, SunOS 4.1.1 und 5.3 sowie SysV68). Suns "mögen" in ihrer /etc/gettytab statt ap den Eintrag p8. Manche ttys sollen auch -even -odd benötigen...

4.7.5 auf 7-bit eingestellte Shell

Abhilfe durch: setenv LC_CTYPE iso_8859_1
oder LC_CTYPE=iso_8859_1 ; export LC_CTYPE

Manche Systeme benötigen andere Werte für diese Variable, so ist z.B. unter Ultrix 4.2 LC_CTYPE=GER_DE.8859 angesagt.

4.7.6 less

Abhilfe durch: setenv LESSCHARSET latin1
oder LESSCHARSET=latin1 ; export LESSCHARSET

4.7.7 nn

Man schreibe am besten in die init-Datei der nn-Installation (je nach Installation z. B. /usr/local/lib/nn/init)

set data-bits 8

Wer dafür keine Privilegien hat, kann das auch in die Datei ~/.nn/init schreiben. Dann gilt es nur für diesen Benutzer. Es gibt für 7-bit Terminal Benutzer einen Patch für nn, der iso2asc von Markus Kuhn verwendet um z. B. Umlaute zu konvertieren.

4.7.8 rlogin mit 7-bit

Abhilfe durch: rlogin -L oder rlogin -8

4.7.9 kermit (C-Kermit 5A)

Kermit ist ein Kommunikationsprogramm, mit dem man sich etwa via Modem auf anderen Rechnern einloggen kann. Um eine 8-bit durchlässige Terminal-Session zu bekommen, muß man folgende Befehle etwa per Hand oder in einer Initialisierungsdatei ausführen:

set terminal bytesize 8
set command bytesize 8

4.7.10 emacs (ab Version 19)

Man schreibe am besten in die Datei .../site-lisp/default.el

(standard-display-european 1)
(require 'iso-syntax)

Wenn das nicht geht, sollte das in die Datei ~/.emacs geschrieben werden.

Folgende Zeilen sollen die Eingabe (von Umlauten etc.) erleichtern:

(set-input-mode
(car (current-input-mode))
(nth 1 (current-input-mode))
0)

Ab der Version 19.26 beachtet emacs die Environment-Variable LC_CTYPE. Die oben angegebenen Zeilen sind dann nicht mehr notwendig.

4.7.11 AIX (3.1, 3.2)

Kodierung wird über LANG gesteuert:

1. Buchstabe gross (z.B. En_US) = PC-Kodierung,
1. Buchstabe klein (z.B. en_US) = ISO Kodierung.

Beim Schreiben von Applikationen entsprechenden setlocale Aufruf nicht vergessen, sonst geht die Umlaut-Eingabe nicht.

4.8 VAX/VMS, OpenVMS

VAX/VMS ist 8-bit clean. Alle Transportprotokolle sind in der Regel 8-bit clean. Die Terminals ab VT2xx können 8-bit übertragen. Newsreader und Editoren sind 8-bit clean. Theoretisch sind auch die Mailer 8-bit clean, aber so mancher "Hack" macht dieses Feature wieder unbrauchbar. Die folgende Eingabe stellt ein Terminal auf 8-bit Betrieb:

set terminal /eightbit

Zurück zum Inhaltsverzeichnis


Last modified 2001-01-08 by Kosta Kostis