[an error occurred while processing this directive]

Einführung in die Zeichencodierung und die Vorgeschichte des Codes ASCII im Rahmen der Lehre der Codierung. [] (ASCII-Code, Fernschreiber, Geschichte), Lektion, Seite 720928
https://www.purl.org/stefan_ram/pub/code_ascii_vorgeschichte_de (Permalink) ist die kanonische URI dieser Seite.
Stefan Ram

Die Vorgeschichte des ASCII -Codes

>721304 Der ASCII-Code von 1963
>720066 Tabelle des ASCII -Codes von 1968

Symbole

Menschen können Informationen in einer Sprache vorwiegend als Klang (gesprochene Sprache) oder als Schriftbild (geschriebene Sprache) wahrnehmen. Die Information kann aber nicht immer direkt  als Klang‑ oder Textbild übertragen werden. Dann ist es nötig, mit bestimmten Bedeutungen versehene und auf dem jeweiligen Signalweg übertragbare Symbole  zu verwenden. Solche Symbole können beispielsweise Rauchzeichen oder Klopfzeichen sein. Die Verschlüsselung  oder Codierung  ist die Umwandlung eines schon bisher verständlichen sprachlichen Gebildes in eine auf dem Signalweg übertragbare Struktur von Symbolen. Bei der Entschlüsselung  oder Decodierung  wird die Symbolstruktur dann wieder in ein schon bisher verständliches Gebilde zurückübersetzt. Zur Ver- und Entschlüsselung bedient man sich eines Schlüssels  oder Codes, der die zu übertragenden sprachliche Gebilde und das ihnen entsprechende Symbol willkürlich einander zuordnet.

Julius Caesar  erdachte den vielleicht ersten Zeichenersetzungscode. Ein Buchstabe des Alphabetes wird dabei zyklisch durch einen um eine bestimmte Anzahl von Positionen weiter hinten stehenden Buchstaben ersetzt. Ein solcher Code kann beispielsweise wie folgt aussehen.

caesar.tab
"Zeichen", "Code" 
"A", "S" 
"B", "T" 
"C", "V" 
"D", "Y" 
"E", "A" 
"F", "B" 
"G", "C" 
"H", "D" 
"I", "E" 
"K", "F" 
"L", "G" 
"M", "H" 
"N", "I" 
"O", "K" 
"P", "L" 
"Q", "M" 
"R", "N" 
"S", "O" 
"T", "P" 
"V", "Q" 
"Y", "R"

Solche Codes wurden auch im Mittelalter verwendet. In der Mitte des 13. Jahrhunderts schrieb der Mönch Roger Bacon  das Werk “Concerning the Marvelous Power of Art and of Nature and Concerning the Nullity of Magic ”, in dem er verschiedene Codes beschrieb.

Erwähnenswert ist in diesem Zusammenhang auch die Erfindung des zeichenbasierten Druckens von Johannes Gensfleisch  („Gutenberg “, 14001468-02-03). Gedruckt wurde schon vor Gensfleisch  von Holzstöcken. Gensfleisch s Verdienst bestand in der Auflösung des Textes in einzelne Zeichen  (Lettern). So wurde der Druck effizienter. Hier zeigt sich, daß es von Vorteil war, einen Text nicht als ganzen zu behandeln, sondern zur technischen Verarbeitung in einzelne Teile zu zerlegen und zwar in die elementaren Zeichen und nicht etwa in Wörter.

Zweizustands-Systeme

Im Alter von 17 Jahren erfand 1605 der damals im diplomatischen Dienst am französischen Hofe stehende Sir Francis Bacon  (15611626) den Code “omnia per omnia ”. Bacon  schrieb “by this Art ... a man may expresse the intentions of his minde at any distance ... by objects ... capable of a twofold difference onely; as by Bells by Trumpets by Lights and Torches ... and any instruments of like nature.” und kann damit als Erfinder der heute für Rechner fundamentalen zweiwertigen  Zeichencodierung angesehen werden.

Bacon  veranschaulichte dies mit dem Textbeispiel "maNeRE te VOlo DOnec Venero". Dort sind die Buchstaben aus verschiedenen Schriften (jedes Zeichen kann durch eines von zwei verschiedenen Glyphen dargestellt werden) gewählt. Hier ist durch die Verwendung von Versalien (durch die Groß- und Kleinschreibung) der Unterschied zwischen den beiden Schrifttypen deutlich erkennbar. Im Original ist es viel weniger auffällig, daß in dem Text noch eine Information versteckt ist, weil die beiden Schriftarten optisch so ähnlich sind, daß sie erst mit einer weiteren Tabelle beider Schriftarten voneinander unterschieden werden können. Daher ist die Nachricht auch ein Beispiel für Steganographie, also dem Verstecken einer geheimen Botschaft in unauffälliger Weise.

Stellt man nun eine der Schriften mit dem Zeichen "a" und die andere mit dem Zeichen "b" dar, so erhält man "aabab baabb aabba aabaa aaa". Mit der folgenden Codetafel kann die enthaltene Nachricht entschlüsselt werden. (Das Ergebnis ist allerdings einem heutigen Leser auch nicht mehr unbedingt verständlich, weil es auch noch Kenntnisse im Lateinischen und dessen Schreibweise verlangt. „Manere te volo donec venero “ bedeutet sinngemäß „Warte, bis ich Dich hole.“, während die verschlüsselte Nachricht und ihre Erklärung ihrer Bedeutung am Ende dieser Lektion gegeben wird, damit der Leser Gelegenheit hat, sie zunächst selber zu dechiffrieren.)

bacon.tab
"Zeichen", "Code" 
"A", "aaaaa" 
"B", "aaaab" 
"C", "aaaba" 
"D", "aaabb" 
"E", "aabaa" 
"F", "aabab" 
"G", "aabba" 
"H", "aabbb" 
"I", "abaaa" 
"K", "abaab" 
"L", "ababa" 
"M", "ababb" 
"N", "abbaa" 
"O", "abbab" 
"P", "abbba" 
"Q", "abbbb" 
"R", "baaaa" 
"S", "baaab" 
"T", "baaba" 
"V", "baabb" 
"W", "babaa" 
"X", "babab" 
"Y", "babba" 
"Z", "babbb"

Ein System mit zwei möglichen Zuständen nennt man auch ein Bit, die beiden möglichen Zustände sind die Bitwerte. Eine Aufeinanderfolge einer bestimmten Anzahl von n  Dingen, wird auch als n -Tupel bezeichnen. So bilden 5 Bit beispielsweise ein 5-Tupel, das auch Bitquintupel oder kurz Quintett  genannt wird. Der Code von Bacon  mit dem Zeichen "a" und dem Zeichen "b" ist also ein Bitcode.

Zweiwertige Codes wurden auch 1617 von Napier in seiner Rabdologiae  und 1671 von Leibniz  beschrieben. Aber auch das mindestens 2000 Jahre alte chinesische Orakelbuch I Ging  kennt Hexagramme, die man als 6-Tupel von Bits ansehen kann.

In der Technik sind zweiwertige Codes beliebt, weil sich die beiden Möglichkeiten mit einfachen Mitteln darstellen lassen, wie etwa „Loch“ oder „kein Loch“, „Strom“ oder „kein Strom“, u.s.w. und die beiden Möglichkeiten deutlich unterschieden werden können.

Fernschreiber

Samuel Morse  verwendete 1837 zur Übertragung von Texten ein Symbol für jedes Wort . Der Bediener mußte also ein spezielles Wörterbuch verwenden. Demgegenüber setzte sich schon bald die Verwendung eines Symbols pro Zeichen  auf den Morsegeräten durch. Diese Vorgehensweise stammt zwar nicht von Morse, ist uns aber trotzdem heute als Morsekode bekannt. Auch hier zeigt sich wieder, wie schon beim oben beschriebenen Drucken nach Gensfleisch, der Vorteil der Zerlegung des Text in einzelne Zeichen zum Zwecke der technischen Verarbeitung und Übermittlung. In der Mitte des 19. Jahrhunderts hatten große Unternehmen Mitarbeiter, deren Aufgabe nur darin bestand, Nachrichten durch Morsen zu übertragen.

1871 oder 1874 erfand Jean-Maurice-Émile Baudot  (18451903) ein Gerät für die zeitgeteilte Nutzung einer elektrischen Leitung. Beim Sender und Empfänger kreist ein System von Metallbürstenabnehmern synchron über einem metallischen Ring mit Kontakten, die offen oder geschlossen sein konnten. So ergeben sich hier wieder zwei Möglichkeiten, also realisiert ein Kontakt jeweils ein Bit. Dadurch konnten mehrere Teilnehmer eine Leitung fast zeitgleich teilen und jeweils ein Quintett senden oder empfangen. Der verwendete Zeichencode stammte von Baudot s Zeitgenossen Johann Gauss  and Wilhelm Weber  und geht auf den oben beschriebenen für Geheimhaltungszwecke verwendeten Code von Sir Francis Bacon  zurück.

Der Code von Baudot  aus dem Jahre 1871 zur zeitgeteilten Nutzung einer elektrischen Leitung war so festgelegt, daß er möglichst bequem mit den Händen auf einer Tastatur eingegeben werden konnte, wenn jeder Finger einen Bitwert eingibt.

Zwischen 1899 und 1901 entwickelte Donald Murray  eine Zeichentastatur. Da die Bit-Darstellung nun nicht mehr direkt eingegeben werden mußte, konnte sie so festgelegt werden, daß sie für die Geräte  gut zu verarbeiten ist. So hatte das häufige Zeichen "E" einen Codewert mit nur einem  auf den Bitwert 1 gesetzten Bit, so daß weniger Löcher gestanzt werden müssen und die Abnutzung verringert wurde. Eine leicht veränderte Abart diese Codes wurde von der Western Union Telegraph Company bis 1950 verwendet. Ab 1930 wurde der Code unter dem Namen ITA2  standardisiert.

Dabei wurden erstmals Steuerzeichen  für Wagenrücklauf, Zeilenvorschub und Glockenklang eingeführt und die im Code vorhandenen speziellen französischen und europäischen Zeichen wurden entfernt. Während ein normales Zeichen dem Ausgabentext als Schriftzeichen hinzugefügt wird, bewirkt ein Steuerzeichen beim Empfänger statt dessen einen bestimmten anderen Vorgang, wie beispielsweise das Läuten einer Glocke.

Sollte eine Nachricht auf Papier wie früher nur einem menschlichen  Leser übermittelt werden, ohne daß diese beim Empfänger wieder automatisch in ein Schriftzeichen umgewandelt werden sollen, so reichte es aus, alle Schriftzeichen des Klartextes (einschließlich der Leerzeichen) zu verschlüsseln. Zeilenenden  mußten nicht besonders markiert werden, da diese zum Verständnis der Nachricht entbehrlich sind. Ja, selbst die Leerräume zwischen den Wörtern können oft entfallen. Ist nun aber eine Maschine, also hier ein Fernschreiber, der erste Empfänger der Nachricht, so ist es wünschenswert und teilweise nötig, diesen weitergehende Hinweise zur Darstellung der Nachricht zu geben. So wird der Leerraum zwischen zwei Wörtern als ein spezielles Zeichen, das Leerzeichen, übertragen und am Ende einer Zeile werden Zeichen übertragen, die nicht zum Ausdruck eines Schriftzeichens führen, sondern bewirken, daß eine Zeile abgeschlossen und eine neue Zeile begonnen wird.

Ein Fernschreiber hat ein Schreibsystem, das sich über einer Folie (meist aus Papier) bewegt und dabei den Teil der Folie, über dem es gerade positioniert ist, teilweise in der Form eines bestimmten Zeichens umfärben (beschriften) kann. Bei der Ausgabe einer Zeile bewegt sich das Schreibsystem (auch Wagen genannt) normalerweise schrittweise von links nach rechts (in englischsprachigen oder europäischen Kulturen) über die Folie. Bei jedem Schritt (bei jeder Position) kann dann ein Zeichen ausgegeben werden. Eine Zeile besteht typischerweise aus ca. 80 Zeichenpositionen. Ist eine Zeile fertig beschrieben, kann der Wagen relativ schnell wieder an den Anfang der Zeile fahren. Soll dann die nächste Zeile beschrieben werden, so wird das Papier dabei gleichzeitig entsprechend weiter transportiert.

Um diese Abläufe zu steuern, gibt es die „Steuerzeichen“, die nicht ein bestimmtes Schriftzeichen bedeuten, sondern deren Aufgabe es ist, den Druckablauf gezielt zu beeinflussen.

Die folgende Tabelle zeigt den von vielen Fernschreibern verwendeten Code ITA2. (Die Bits des Quintupels werden manchmal auch in umgekehrter Reihenfolge angegeben.)

ita2.tab
"Code",       "Z1",      "Z2" 
"11000", "A", "-"  
"10011", "B", "?"  
"01110", "C", ":"  
"10010", "D", "WAY"  
"10000", "E", "3"  
"10110", "F", "NA" 
"01011", "G", "NA" 
"00101", "H", "NA"  
"01100", "I", "8" 
"11010", "J", "bell"  
"11110", "K", "(" 
"01001", "L", ")" 
"00111", "M", "." 
"00110", "N", "," 
"00011", "O", "9" 
"01101", "P", "0" 
"11101", "Q", "1"  
"01010", "R", "4"  
"10100", "S", "'"  
"00001", "T", "5" 
"11100", "U", "7" 
"01111", "V", "=" 
"11001", "W", "2" 
"10111", "X", "/" 
"10101", "Y", "6" 
"10001", "Z", "+" 
"00010", "CR", "CR"  
"01000", "LF", "LF"  
"11111", "LS", "LS" 
"11011", "FS", "FS" 
"00100", " ", " " 
"00000", "NA", "NA"

Die in der folgenden Tabelle erklärten Zeichen sind keine Schriftzeichen, sondern Steuerzeichen. Mit dem SteuerzeichenLS 〉 und dem SteuerzeichenFS 〉 schaltete man zwischen den beiden möglichen Seiten des Codes, also den beiden rechten Spalten der obigen Tabelle, um.

control_ita2.tab
"Name",    "Ausgeschrieben",  "Erklaerung" 
"WAY", "who are you?", "Identifizierungsersuchen an Gegenstelle" 
"NA", "not assigned", "Codepunkt ist nicht belegt" 
"bell", "bell", "Glockenklang ausloesen" 
"CR", "carriage return", "Wagenruecklauf" 
"LF", "line feed", "Zeilenvorschub" 
"LS", "letter shift", "Umschaltung auf Buchstabenseite" 
"FS", "figure shift", "Umschaltung auf Ziffernseite"

Die Fernschreiber druckten eintreffende Nachrichten auf Papierrollen. Die Zentrale eines Unternehmens war mit mehreren Zweigstellen verbunden. Dabei waren fernere Zweigstellen nur indirekt angebunden: Ein Nachricht wurde dann von der Firma zunächst zur Weiterleitung an eine direkt angeschlossene Zweigstelle geschickt. Dort wurde die Nachricht gelesen und erneut in einen Fernschreiber getippt, der mit der weiter entfernt liegenden Zweigstelle verbunden war. (Unter Umständen mußte ein Fernschreiben auf diese Weise sogar wiederholt weitergeleitet werden.)

In der Bundesrepublik Deutschland  wurden meist Gemeine zur Ausgabe verwendet, im Telegrammdienst der Bundespost auf Streifendruckern und in den Vereinigten Staaten von Amerika  jedoch Versalien.

Die Zeichen werden im Takt einzelner Schritte  übertragen. Eine Sekunde enthält oft 40 bis 75 Schritte. Die Zahl der Schritte pro Sekunde wird auch durch die Einheit Baud  beschrieben. Auf einer Fernschreiberleitung fließt normalerweise ein Strom von etwa 45 mA. Soll ein Zeichen übertragen werden, so wird der Strom zunächst für die Dauer eines Schrittes unterbrochen, um den Anfang des Zeichens zu kennzeichnen. Das Zeichen wird dann als Folge von fünfmal jeweils “mark ” (Strom) oder “space ” (kein Strom) übertragen. Es folgt Strom für 1,5 Schritte.

Um das Abschreiben bei der Weiterleitung überflüssig zu machen, wurden Lochstreifenleser  und Lochstreifenschreiber  erfunden. Während die elektrischen Leitungen Bits durch „Strom“ oder „kein Strom“ darstellten, wurde auf den Lochstreifen ein „Loch“ oder „kein Loch“ an einer bestimmten Position gemacht, um ein Bit zu realisieren. Ein empfangener Lochstreifen konnte dann von einem weiteren Fernschreiber zur Weiterleitung maschinell gelesen werden. Man konnte nun auch eine Nachricht ohne Verbindung (off-line ) mit einem anderen Fernschreiber zunächst in Ruhe lokal auf einen Lochstreifen schreiben.

1963-06-17 verabschiedete die ASA  (American Standards Organization ) den Code ASCII. Es ist ein Sieben-Bit-Code, der einen Kompromiß zwischen den Anforderungen der Datenübertragungstechnik und der Einfachheit der Datenverschlüsselung darstellt. Bei Verwendung des Codes ASCII  bestand die Möglichkeit, fehlerhafte Zeichen mit dem durch sieben Löcher dargestellten ZeichenDEL 〉 zu überschreiben. Von dem Lochstreifen konnte dann bei Bedarf auch eine lokale Kopie der Nachricht gedruckt werden. Während der teueren Verbindungszeit (on-line -Zeit) konnte die auf dem Lochstreifen schon vorbereitete Nachricht dann schnell übertragen werden.

Es wurden später auch mehrere Fernschreiber auf einer längeren Strecke an eine Leitung angeschlossen und eine Nachricht wurde dann auf jedem  Fernschreiber an der Strecke ausgegeben (multipoint [transmission] lines, multidrop lines ). Zur Erhöhung der Datensicherheit konnte dann später ein Steuerfernschreiber einzelne Fernschreiber gezielt nach Nachrichten fragen (polling ). Später wurde von AT&T  das öffentliche Fernschreibernetz TWX  (teletypewriter exchange) eingeführt, daß es auch verschiedenen  Unternehmen erlaubte, untereinander  Nachrichten auszutauschen.

Auswirkungen

Obwohl zur Zeit der Niederschrift dieses Textes Fernschreiber nicht mehr so verbreitet sind und auch der Code ASCII  nicht mehr in der Version von 1963 gebräuchlich ist, sind die Spuren der Fernschreibertechnik noch an vielen Stellen der Datenverarbeitungstechnik und der Kommunikationstechnik erkennbar.

In der Zeit um das Jahr 1965 wäre es unverhältnismäßig aufwendig gewesen, zur Bedienung von Rechenanlagen spezielle Schnittstellengeräte für Menschen aufzubauen. Statt dessen wurden oft einfach die ja schon vorhandenen Fernschreiber mit den Rechnern verbunden. Beispielsweise verwendeten Dennis Ritchie und Ken Thompson 1970 zwei Teletype-33  (ASR33 ?) an einer PDP -11, als sie UNIX  von der PDP -7 portierten. Die Lochstreifen konnten dann sogar gleich als Speichermedium für Daten und Programme genutzt werden. Allerdings war der direkte Zugang zu einem Rechner per Fernschreiberkonsole schon oft ein besonderer Luxus, der nur den Mitarbeitern eines Rechenzentrums vorbehalten war, während viele Benutzer Lochkartenstapel abgaben, um am nächsten Tag die Ausgabe ihres Programms abholen zu können.

Einige Auswirkungen der Fernschreibertechnik im Rechnerbereich, die noch zur Zeit der Niederschrift dieses Textes vorhanden sind, sollen im folgenden genannt werden.

Das Kürzel "mfg" („Mit freundlichen Grüßen“) stammt wohl aus der Fernschreiberzeit. Seltener verwendet werden heute die damals gebräuchlichen Kürzel "sgduh" („Sehr geehrte Damen und Herren“) sowie "mombi" („Moment, bitte!“). Die Kürzel sollten wohl Übertragungszeit und -kosten sparen.

Übungsfragen

Wortcodes
Welche Vor- und Nachteile hat die Verwendung eines Zeichencodes (ein Symbol pro Zeichen) gegenüber einem Wortcode (ein Symbol pro Wort)?
ROT-13
Was versteht man unter ROT -13? (Zur Recherche kann eine Suchmaschine verwendet werden.)
Fachbegriffe
Was bedeuten die Worte „diskret“, „digital“ und „binär“? Was ist der Unterschied zwischen „digital“ und „binär“?

Erklärung zur geheimen Nachricht

Die in dem weiter oben zitiertem "maNeRE te VOlo DOnec Venero" enthaltene geheime Nachricht lautet zunächst "FVGE". Die letzten drei "a" sind bedeutungslose Füllzeichen. Das "V" kann aber bei den lateinischen Großbuchstaben auch für ein "U" stehen: So ergibt sich "FUGE", auf deutsch „Flieh!“.

Del.icio.us   |   Seiteninformationen und Impressum   |   Mitteilungsformular  |   "ram@zedat.fu-berlin.de" (ohne die Anführungszeichen) ist die Netzpostadresse von Stefan Ram.   |   Von der Stefan-Ram-Startseite ausgehend finden sich oft noch mehr Informationen zu Themen, die auf einer Seite angesprochen wurden. (Eine Verbindung zur Stefan-Ram-Startseite befindet sich ganz oben auf dieser Seite.)  |   Der Urheber dieses Textes ist Stefan Ram. Alle Rechte sind vorbehalten. Diese Seite ist eine Veröffentlichung von Stefan Ram. slrprd, PbclevtugFgrsnaEnz