[an error occurred while processing this directive]

Lektion zur Formatierung von XML-Quelltext. [] (XML: Leerraum, Formatierung), Lektion, Seite 721286
http://www.purl.org/stefan_ram/pub/xml_formatierungsregel_de ist die kanonische URI dieser Seite.
Stefan Ram

Formatierung von XML -Dokumenten

Leerraum

Leerraum wird in vielen formalen Sprachen und auch in XML  zur Trennung lexikalischer Einheiten, die in etwa Wörtern entsprechen, verwendet. Zwischen zwei lexikalischen Einheiten kann  oft Leeraum stehen—wenn die beiden lexikalischen Einheiten sonst nicht mehr erkennbar getrennt wären, dann muß  sogar Leerraum zwischen ihnen stehen.

Ein einzelnes Leerraum-Zeichen wird in XML 1.0  durch ein Leerzeichen, (horizontales) Tabulatorzeichen, Wagenrücklaufzeichen  oder Neuzeilenzeichen  gebildet.

whitespace 〉 ::=
%d9 | %d32 | %d10 | %d13.

Leerraum  besteht in XML  aus mindestens einem Leerraum-Zeichen, dem dann noch beliebig viele andere Leerraum-Zeichen direkt folgen können.

S 〉 ::=
whitespace 〉 {〈whitespace 〉}.

Das bedeutet, daß sich der Autor eines XML -Dokuments zur Realisierung von Leerraum eine beliebige Kombination dieser Zeichen aussuchen kann. Um eine neue Zeile zu beginnen, kann also irgendeine Kombination von Wagenrücklaufzeichen und Zeilenendzeichen verwendet werden. Leerzeichen können in bestimmten Kontexten durch Zeilentrennungen ersetzt werden oder umgekehrt, ohne daß sich dadurch die Interpretation als Leerraum ändert. (Die Verwendung von Tabulatorzeichen wird von Stefan Ram  nicht empfohlen.)

In bestimmten Kontexten gilt diese allgemeine Regel aber nicht: Dann stehen Leerzeichen und Zeilenenden für sich selbst, beispielsweise, wenn ein Text mit Leerzeichen und Zeilenumbrüchen an genau bestimmten Stellen dargestellt werden soll. Wodurch diese Kontexte bestimmt sind, wird in anderen Lektionen behandelt.

Umformatieren
Ersetzen Sie in dem folgenden Beispiel eines XML -Dokuments einige Formen von Leerraum durch andere Formen, z.B. ein Leerzeichen durch eine Zeilentrennung oder durch mehrere Leerzeichen. Prüfen Sie Bedeutung und Validität des XML -Dokuments mithilfe von XHTML-1.0 Anzeigeprogrammen und Validatoren. Ist es möglich, es so zu bestimmen, ob und wie ein XHTML-1.0 Anzeigeprogramm, den Text "Erste Zeile, Zweite Zeile, Dritte Zeile" auf mehrere Zeilen aufteilt?
Hallo.html
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">
<head> 
<title>Beispielseite</title> 
</head>
<body> 
<p>Erste Zeile, Zweite Zeile, Dritte Zeile</p> 
</body>
</html>

Kommentare

In ein XML -Dokument können Kommentare eingefügt werden. Sie können bei der weiteren maschinellen Verarbeitung ignoriert werden. Ein Kommentar beginnt mit dem Token "<!--" und endet mit dem Token "-->". Direkt vor dem schließenden Token "-->" darf das Zeichen "-" nicht stehen und der gesamte Kommentar zwischen dem Token "<!--" und dem Token "-->" darf die Zeichenfolge "--" nicht enthalten. Die Zeichenfolge "<!-- Kommentar -->" ist also ein Kommentar, während die Zeichenfolge "<!-- Hallo -- Kommentar --->" kein Kommentar ist.

Kommentar.html
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">
<head> 
<title>Beispielseite</title> 
</head>
<body> 
<p>Hallo!</p> 
<!-- Hier sollte spaeter noch mehr geschrieben werden! 
Das Wort "Hallo!" ist noch nicht sehr informativ. --> 
</body>
</html>
<!-- Nicht vergessen, Herrn Schubert noch anzurufen! -->

Ein Kommentar darf allerdings nicht an jeder beliebigen Stelle in einem XML -Quelltext stehen, beispielsweise nicht in Literalen. Die Details zu diesem Aspekt werden aber in dieser Lektion noch nicht behandelt, weil hier noch nicht zu viel Wissen über die Struktur eines XML -Quelltexts vorausgesetzt werden soll.

Seiteninformationen und Impressum   |   Mitteilungsformular  |   "ram@zedat.fu-berlin.de" (ohne die Anführungszeichen) ist die Netzpostadresse von Stefan Ram.   |   Von der Stefan-Ram-Startseite ausgehend finden sich oft noch mehr Informationen zu Themen, die auf einer Seite angesprochen wurden. (Eine Verbindung zur Stefan-Ram-Startseite befindet sich ganz oben auf dieser Seite.)  |   Der Urheber dieses Textes ist Stefan Ram. Alle Rechte sind vorbehalten. Diese Seite ist eine Veröffentlichung von Stefan Ram. slrprd, PbclevtugFgrsnaEnz