Formatierung von XML -Dokumenten
Leerraum
Leerraum wird in vielen formalen Sprachen und auch in XML zur Trennung lexikalischer Einheiten, die in etwa Wörtern entsprechen, verwendet. Zwischen zwei lexikalischen Einheiten kann oft Leeraum stehen—wenn die beiden lexikalischen Einheiten sonst nicht mehr erkennbar getrennt wären, dann muß sogar Leerraum zwischen ihnen stehen.
Ein einzelnes Leerraum-Zeichen wird in XML 1.0 durch ein Leerzeichen, (horizontales) Tabulatorzeichen, Wagenrücklaufzeichen oder Neuzeilenzeichen gebildet.
- 〈whitespace 〉 ::=
- %d9 | %d32 | %d10 | %d13.
Leerraum besteht in XML aus mindestens einem Leerraum-Zeichen, dem dann noch beliebig viele andere Leerraum-Zeichen direkt folgen können.
- 〈S 〉 ::=
- 〈whitespace 〉 {〈whitespace 〉}.
Das bedeutet, daß sich der Autor eines XML -Dokuments zur Realisierung von Leerraum eine beliebige Kombination dieser Zeichen aussuchen kann. Um eine neue Zeile zu beginnen, kann also irgendeine Kombination von Wagenrücklaufzeichen und Zeilenendzeichen verwendet werden. Leerzeichen können in bestimmten Kontexten durch Zeilentrennungen ersetzt werden oder umgekehrt, ohne daß sich dadurch die Interpretation als Leerraum ändert. (Die Verwendung von Tabulatorzeichen wird von Stefan Ram nicht empfohlen.)
In bestimmten Kontexten gilt diese allgemeine Regel aber nicht: Dann stehen Leerzeichen und Zeilenenden für sich selbst, beispielsweise, wenn ein Text mit Leerzeichen und Zeilenumbrüchen an genau bestimmten Stellen dargestellt werden soll. Wodurch diese Kontexte bestimmt sind, wird in anderen Lektionen behandelt.
- Umformatieren
- Ersetzen Sie in dem folgenden Beispiel eines XML -Dokuments einige Formen von Leerraum durch andere Formen, z.B. ein Leerzeichen durch eine Zeilentrennung oder durch mehrere Leerzeichen. Prüfen Sie Bedeutung und Validität des XML -Dokuments mithilfe von XHTML-1.0‑ Anzeigeprogrammen und Validatoren. Ist es möglich, es so zu bestimmen, ob und wie ein XHTML-1.0‑ Anzeigeprogramm, den Text "Erste Zeile, Zweite Zeile, Dritte Zeile" auf mehrere Zeilen aufteilt?
Hallo.html
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">
<head>
<title>Beispielseite</title>
</head>
<body>
<p>Erste Zeile, Zweite Zeile, Dritte Zeile</p>
</body>
</html>
Kommentare
In ein XML -Dokument können Kommentare eingefügt werden. Sie können bei der weiteren maschinellen Verarbeitung ignoriert werden. Ein Kommentar beginnt mit dem Token "<!--" und endet mit dem Token "-->". Direkt vor dem schließenden Token "-->" darf das Zeichen "-" nicht stehen und der gesamte Kommentar zwischen dem Token "<!--" und dem Token "-->" darf die Zeichenfolge "--" nicht enthalten. Die Zeichenfolge "<!-- Kommentar -->" ist also ein Kommentar, während die Zeichenfolge "<!-- Hallo -- Kommentar --->" kein Kommentar ist.
Kommentar.html
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">
<head>
<title>Beispielseite</title>
</head>
<body>
<p>Hallo!</p>
<!-- Hier sollte spaeter noch mehr geschrieben werden!
Das Wort "Hallo!" ist noch nicht sehr informativ. -->
</body>
</html>
<!-- Nicht vergessen, Herrn Schubert noch anzurufen! -->
Ein Kommentar darf allerdings nicht an jeder beliebigen Stelle in einem XML -Quelltext stehen, beispielsweise nicht in Literalen. Die Details zu diesem Aspekt werden aber in dieser Lektion noch nicht behandelt, weil hier noch nicht zu viel Wissen über die Struktur eines XML -Quelltexts vorausgesetzt werden soll.