Folgende Tips entstammen zu einem gewissen Teil einer Version des Umlaute-FAQ ftp://ftp.cs.tu-berlin.de/projects/umlaute/Installationshilfe. Weitere Tips habe ich u. a. diversen Postings in diversen Gruppen entnommen. Eine Nennung der einzelnen Personen ist dabei leider nicht mehr möglich. Trotzdem vielen Dank an alle!
In diesem Kapitel sind wohl noch die größten Lücken. Bitte schickt mir was immer ihr zu diesem Thema beitragen könnt, damit dieses Teil möglichst vielen Leuten hilft.
Die Reihenfolge der genannten Plattformen ist alphabetisch...
Eine der Standard-Zeichenkodierungen ist ISO 8859-1. Eine Zeichenkonvertierung ist daher nicht notwendig.
Die Standard-Zeichenkodierung ist ISO 8859-1. Eine Zeichenkonvertierung ist daher nicht notwendig.
Die Zeichenkodierung Apple Roman ist von der Zeichenmenge weitgehend identisch mit ISO 8859-1, jedoch ist eine andere Kodierung vorhanden. Konverter laßen sich leicht mit den in Anhang T genannten Tools erzeugen. Software wie Eudora und Iride unterstützen MIME. News-Reader wie Newswatcher unterstützen ISO 8859-1, rnMac und TheNews arbeiten unter Verwendung von funktionierenden XLATS Resourcen. Weitere Mac-Software, die MIME unterstützt: Claris Emailer, MacSOUP (Newsreader).
Die Zeichenkodierung des Atari ist weitgehend identisch mit der IBM Codepage 437. Siehe PC. Konverter laßen sich leicht mit den in Anhang T genannten Tools erzeugen. Die gängige Usenet Software für den Atari nimmt diese Konvertierung bereits automatisch vor (z. B. HERMES).
Der NeXTSTEP Encoding Vector ist von der Zeichenmenge her weitgehend identisch mit ISO 8859-1, jedoch ist eine andere Kodierung vorhanden. Konverter laßen sich leicht mit den in Anhang T genannten Tools erzeugen. NeXTSTEP ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
Ansonsten läßt sich die ISO 8859-1 Darstellung wie folgt erreichen:
Einloggen via rlogin -8
stty pass8 ; stty pass8out
PC sind in der Regel mit folgenden Video-Karten bestückt:
MDA, HGC, CGA, EGA und VGA. Die Standard-Zeichenkodierung für diese Videoadapter ist IBM Codepage 437. Diese Zeichenkodierung umfaßt US-ASCII, die für einige europäische Sprachen notwendigen Zeichen, Rahmenzeichen und einiges mehr.
Bei EGA und VGA laßen sich andere Zeichenkodierungen nachladen, was durch manche Betriebssysteme unterstützt wird und durch andere leider nicht.
Benutzt das noch jemand?
Coherent unterstützt 8-bit und die IBM Codepage 437 generell. Für Coherent 4.2 gibt es optional X11. Coherent ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
Linux unterstützt im Console-Betrieb ISO 8859-1 in der Form, daß Linux die in der IBM Codepage 437 vorhandenen Zeichen auf ISO 8859-1 abbildet und umgekehrt. Es gibt auch die Möglichkeit Fonts zu laden (VGA), bitte fragt mich aber nicht wie, ich habe die Fonts nur geliefert. :) Linux ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
Soweit mir bekannt ist, unterstützt Minix 8-bit und die IBM Codepage 437. Es gilt, bis auf den Hinweis zu X11, das gleiche wie beim PC unter Coherent. Minix ist in diesem Zusammenhang als U*IX-Derivat zu betrachten.
Die Standard-Zeichenkodierung für MS-DOS in Deutschland ist in der Regel IBM Codepage 437. Seit MS-DOS 5.0 versucht das Installationsprogramm die IBM Codepage 850 zu installieren. Diese hat gegenüber der Codepage 437 den Vorteil, daß sämtliche Zeichen aus ISO 8859-1 vorhanden sind, was aber zu Lasten einiger Rahmenzeichen ging. Weiterhin kosten die entsprechenden Gerätetreiber ein paar KB. Konverter laßen sich leicht mit den im Anhang T genannten Tools erzeugen. Es gibt auch Freeware ISO 8859 Codepages für MS-DOS (z. B. Codepage 819) - siehe Anhang F.
Für MS-DOS Waffle 1.65 gibt es einen einfachen MIME-Patch. Siehe Anhang T.
CrossPoint arbeitet intern ausschließlich mit Codepage 437,
konvertiert diese beim Verarbeiten oder Erzeugen von RFC-Nachrichten
aber automatisch nach ISO-8859-1.
Nicht vorhandene Zeichen werden dabei in möglichst ähnlich
aussehende Zeichen umgewandelt. In Mails werden generell die
entsprechenden MIME-Zeilen erzeugt. Für News muß MIME unter Config/Optionen/Netze/Verschiedenes
eingeschaltet werden.
Microsoft Windows verwendet in der Regel Codepage 1252, was im wesentlichen ISO 8859-1 entspricht. Es gibt aber mittlerweile auch Versionen für andere Sprachräume (z. B. Russisch mit kyrillischer Zeichenkodierung).
IBM OS/2 verwendet intern leider immer noch IBM Codepage 850 und nicht ISO 8859-1 aka IBM Codepage 819. Das Windows Sub-System zeigt ISO 8859-1 jedoch korrekt an. Die Konvertierung zwischen IBM Codepage 850 und ISO 8859-1 ist recht einfach und sogar "verlustfrei".
Microsoft Windows 95 verwendet in der Regel Codepage 1252, was im wesentlichen ISO 8859-1 entspricht. Mitgeliefert werden aber auch osteuropäische, griechische, kyrillische und türkische Fonts, welche im wesentlichen ISO 8859-2, -7, -5 und -9 entsprechen.
Microsoft Windows NT verwendet intern Unicode. Als Untermenge ist daher ISO 8859-1 vorhanden. Die Zeichenkodierung macht hier keine besonderen Probleme. Leider liefert Microsoft auch in der Version 4.x keine auch nur annäherungsweise vollständigen Unicode Fonts mit.
Tip zum Auffinden systemspezifischer Informationen zur Internationalisierung:
man -k locale
man -k international
Da hilft dann nur noch das Programm iso2asc von Markus Kuhn (siehe Anhang T)
Das Terminal muß per Setup eingestellt werden. Bei DEC
Terminals geht das in der Regel durch Druck auf die Taste F3
.
Der Rest ist menügeführt - Speichern nicht vergessen!
Das benutzt ja wohl hoffentlich niemand mehr...
Ist es lokal im Einsatz, hilft entweder nur patchen (entfernen von "& 0x7F" aus den Quellen) oder Patches des Binaries oder Installation von z. B. CNews.
Ist BNews auf einem Rechner im Pfad im Einsatz, hilft nur das Aufspüren des entsprechenden Rechners und der Versuch den dortigen System-Admin zu bitten entweder zu patchen oder neu zu installieren. Alternativ kann man auch versuchen, sich andere Feeds für News zu suchen, die keine "Steinzeit-Software" fahren...
Manche ttys sind default-mäßig auf 7-bit eingestellt. Da hilft meist
BSD : stty pass8
System V: stty -istrip -8
ggf. wird stattdessen benötigt:
stty -istrip cs8
(unter Ultrix 4.2, HP-UX 9.01, SunOS 4.1.1 und 5.3 sowie SysV68).
Suns "mögen" in ihrer /etc/gettytab
statt
ap
den Eintrag p8
. Manche ttys sollen
auch -even -odd
benötigen...
Abhilfe durch: setenv LC_CTYPE iso_8859_1
oder LC_CTYPE=iso_8859_1 ; export LC_CTYPE
Manche Systeme benötigen andere Werte für diese Variable, so ist z.B. unter Ultrix 4.2 LC_CTYPE=GER_DE.8859 angesagt.
Abhilfe durch: setenv LESSCHARSET latin1
oder LESSCHARSET=latin1 ; export LESSCHARSET
Man schreibe am besten in die init-Datei der nn-Installation (je
nach Installation z. B. /usr/local/lib/nn/init
)
set data-bits 8
Wer dafür keine Privilegien hat, kann das auch in die Datei ~/.nn/init
schreiben. Dann gilt es nur für diesen Benutzer. Es gibt für 7-bit
Terminal Benutzer einen Patch für nn, der iso2asc
von Markus Kuhn verwendet um z. B. Umlaute zu konvertieren.
Abhilfe durch: rlogin -L
oder rlogin -8
Kermit ist ein Kommunikationsprogramm, mit dem man sich etwa via Modem auf anderen Rechnern einloggen kann. Um eine 8-bit durchlässige Terminal-Session zu bekommen, muß man folgende Befehle etwa per Hand oder in einer Initialisierungsdatei ausführen:
set terminal bytesize 8
set command bytesize 8
Man schreibe am besten in die Datei .../site-lisp/default.el
(standard-display-european 1)
(require 'iso-syntax)
Wenn das nicht geht, sollte das in die Datei ~/.emacs
geschrieben werden.
Folgende Zeilen sollen die Eingabe (von Umlauten etc.) erleichtern:
(set-input-mode
(car (current-input-mode))
(nth 1 (current-input-mode))
0)
Ab der Version 19.26 beachtet emacs die Environment-Variable LC_CTYPE
.
Die oben angegebenen Zeilen sind dann nicht mehr notwendig.
Kodierung wird über LANG
gesteuert:
1. Buchstabe gross (z.B. En_US
) = PC-Kodierung,
1. Buchstabe klein (z.B. en_US
) = ISO Kodierung.
Beim Schreiben von Applikationen entsprechenden setlocale Aufruf nicht vergessen, sonst geht die Umlaut-Eingabe nicht.
VAX/VMS ist 8-bit clean. Alle Transportprotokolle sind in der Regel 8-bit clean. Die Terminals ab VT2xx können 8-bit übertragen. Newsreader und Editoren sind 8-bit clean. Theoretisch sind auch die Mailer 8-bit clean, aber so mancher "Hack" macht dieses Feature wieder unbrauchbar. Die folgende Eingabe stellt ein Terminal auf 8-bit Betrieb:
set terminal /eightbit
Last modified 2001-01-08 by Kosta Kostis