Das Wichtigste zu XML in Kürze [] (Das Wichtigste zu XML in Kürze), Lektion, Seite 722590
https://www.purl.org/stefan_ram/pub/kurz_xml (Permalink) ist die kanonische URI dieser Seite.
Stefan Ram

XML  - Das Wichtigste in Kürze

Diese kurze Einführung in XML  stellt nur einige der wichtigsten Aspekte von XML  in teilweise vereinfachter Weise dar.

XML-Dokumente

Ein XML-Dokument ist eine Folge von Zeichen, die gewissen Regeln genügt.

Ein einfaches XML-Dokument

Wir zeigen hier zunächst ein einfaches XML-Dokument in der Quelltextdarstellung. Der Quelltext beginnt mit »<?xml version="1.0" encoding="utf-8"?>« und endet mit »</main>«.

Example.xml
<?xml version="1.0" encoding="utf-8"?>
<main><action mode="a0">example</action></main>

XML-Deklaration

Die XML-Deklaration am Anfang besagt, daß es sich um ein XML-Dokument handelt, und enthält Informationen zur verwendete XML-Version und der verwendeten Zeicenkodierung.

Eine XML-Deklaration
<?xml version="1.0" encoding="utf-8"?>

Texte

In einem XML-Dokument sind »<«, »>«, »"«, »'« und »&« Spezialzeichen, die nur in kontrollierter Weise verwendet werden dürfen.

Ein Zeichen, das kein Spezialzeichen ist, nennen wir ein Textzeichen.

Eine Folge von Textzeichen nennen wir einen Text.

Der Dokumentinhalt

Ein Dokument besteht hauptsächlich aus Elementen, die mit einer Anfangsmarke beginnen und mit einer Endmarke enden.

Zwischen einer Anfangsmarke und der dazugehörigen Endmarke kann eine Folge von Elemente und Standardzeichen stehen.

Ein Dokumentinhalt
<main><action mode="a0">example</action></main>
Seiteninhalt

main-Anfangsmarke main-Endmarke
| |
| action-Anfangsmarke action-Endmarke|
| | | |
| | | |
v v v v
.----..----------------. .-------..-----.

<main><action mode="a0">example</action></main>

| '--------------------------------' |
'---------------------------------------------'
^ ^ ^ ^
| | | |
| '------- action-Element ---------' |
| |
'--------------- main-Element ----------------'

Verschachtelung der Elemente
<main>---------------------------------------------------------------.
| |
| |
| |
| <action>-------------------------------------------------. |
| | | |
| | name = "a0" | |
| | | |
| '-----------------------------------------------------</a> |
| |
| |
'-----------------------------------------------------------------</p>

Anfangsmarken

Eine Anfangsmarke, wie beispielsweise »<main>« oder »<action mode="a0">« besteht aus einer spitzen Klammern auf »<«, einem Namen, dem noch weitere Angaben folgen können, und einer spitzen Klammer zu »>«.

Eine Anfangsmarke
<action mode="a0">

Endmarken

Eine Endmarke, wie beispielsweise »</main>« oder »</action>« besteht aus einer spitzen Klammern auf »<«, einem Schrägstrich »/«, einer Folge von Buchstaben, und einer spitzen Klammer zu »>«. Wir sagen auch, daß eine Endmarke eine Anfangsmarke schließen kann oder zu diesem paßt, wenn es dieselbe Folge von Buchstaben enthält wie die Anfangsmarke.

Eine Endmarke
</action>

Elemente

Ein Folge aus einer Anfangsmarke, Text und einer passenden Endmarke wird ein Element  genannt.

Der Typ eines Elements  ist der Name ganz am Anfang seiner Anfangsmarke. Eine Element mit dem Typ »x « nennen wir auch ein x -Element.

Beispielsweise ist »<action mode="a0">example</action>« ein Element (ein action-Element).

Der Inhalt eines Elements  ist das, was sich zwischen seiner Anfangs- und seiner Endmarke befindet.

Ein in einem Element enthaltenes Element nennen wir ein Unterelement  des enthaltenden Elements.

Der Text innerhalb eines Elements darf auch andere Elemente enthalten, wie beispielsweise in dem Element »<main><action mode="a0">example</action></main>«, wo ein action-Element in einem main-Element enthalten ist.

Der Text in dem Element wird mit dem Elementtyp gekennzeichnet. Beispielsweise ist das Element »<action mode="a0">example</action>« ein action-Element, weil der Elementtyp »action« lautet.

Beispiele für Elemente

<main><action mode="a0">example</action></main>

<action mode="a0">example</action>

Attribute

Ein Paar aus zwei Texten wird Attribut  genannt. Den ersten Text nennen wir auch den Namen  des Attributs, den zweiten den Wert  des Attributes. Der Name darf nur Buchstaben enthalten. Ein solches Attribut kann noch Informationen zu einem Element hinzufügen, die normalerweise nicht ausgegeben werden, aber die Art der Darstellung auf indirekte Weise beeinflussen können oder unter bestimmten Umständen doch noch ausgegeben werden könnten oder durch Programme ausgewertet werden könnten.

Ein Attribut besteht aus einem Leerzeichen, einem Namen, einem Gleichheitszeichen »=«, einem Anführungszeichen »"«, einem Text, und einem Anführungszeichen »"«.

Ein Attribut
  Name         Wert
| |
mode="a0"

Ein Attribut kann nach seinem Namen benannt  werden, so spricht man beispielsweise von einem „mode-Attribut“.

Attribute in Elementen

Ein Element kann mit einem Attribut versehen werden, indem eine Attributfestlegung vor die schließende Spitze Klammer »>« seiner Anfangsmarke eingefügt wird.

Beispiele für Anfangsmarken mit Attributen
<action mode="a0">

Wohlgeformtheit

Ein XML-Dokument muß bestimmten Regeln genügen, um als wohlgeformt zu gelten. Ein XML-Dokument muß wohlgeformt sein. Wir geben hier keine vollständige Definition von Wohlgeformtheit an, aber nennen als Beispiele:

Gültigkeit

Ein Dokument kann ein Dokumenttyp oder Schema angeben, das Regeln für die Gültigkeit  des Dokumentes enthält. In dem obenstehenden Beispieldokument wird davon aber kein Gebrauch gemacht.

Beispiele für Gültigkeitsregeln:

Bedeutung

Durch die XML-Spezifikation erhält ein XML-Dokument noch keine Bedeutung. Die Bedeutung eines XML-Dokumentes wird von Fall zu Fall gesondert vereinbart.

Numerische Entitäten für Sonderzeichen

Zeichenfolgen können in XML  als Werte von Attributen (in den Anführungszeichen »"« rechts vom Gleichheitszeichen »=«) oder als Inhalte von Elementen vorkommen.

Verschiedene Spezialzeichen, die in XML  eine besondere Bedeutung haben, oder Sonderzeichen, die nicht in der Dokumentenkodierung vorkommen, können durch ein kommerzielles Und-Zeichen »&«, ein Nummernzeichen »#«, die Kennzahl des Zeichens und ein Semikolon »;« in einem Text dargestellt werden. (Diese Darstellung könnte auch allgemein für alle Zeichen verwendet werden, die wörtlich dargestellt werden sollen. Beispielsweise steht »&#65;« für das Zeichen »A«, aber dieses Zeichen kann auch kürzer direkt als »A« geschrieben werden.)

Auswahl einiger Spezialzeichen
&&#38;
<&#60;
>&#62;
Auswahl einiger Sonderzeichen
Ä &#196;
Ö &#214;
Ü &#220;
ß &#223;
ä &#228;
ö &#246;
ü &#252;

Spezialzeichen und Sonderzeichen

Verschiedene Spezialzeichen, die in der Anzeige eine Webseite erscheinen sollen aber die in XML  eine besondere Bedeutung haben, oder Sonderzeichen, die nicht in der Dokumentenkodierung vorkommen, können in Text durch ein kommerzielles Und-Zeichen »&«, eine Buchstabenfolge und ein Semikolon »;«.dargestellt werden.

Auswahl einiger Spezialzeichen
&&amp;
<&lt;
>&gt;
"&quot;
'&apos;

Ein Dokumenttyp kann auch zusätzliche solcher Namen für Zeichen festlegen.

Codierungen

In der obigen XML -Quelle wird in der XML-Deklaration mit »encoding="utf-8"« die Dokumentkodierung als »UTF-8« festgelegt.

Es ist darauf zu achten, die Quelle dann auch in der angegebenen Kodierung abzuspeichern.

Bei Verwendung der Dokumentkodierung »ISO-8859-1«, »UTF-8« oder »UTF-16« können die Umlaute und das Eszett direkt als solche geschrieben werden; nur bei Verwendung der Kodierung »US-ASCII« ist es nötig, sie unter Verwendung ihrer Kennzahl zu schreiben. Bei Verwendung von »UTF-8« oder »UTF-16« können auch weitere Sonderzeichen (etwa chinesische) direkt eingegeben werden. In jeder Dokumentkodierung kann aber jedes Zeichen auch unter Verwendung seiner Kennzahl geschrieben werden.

Sichtweisen auf Dokumentauszüge

Ausschnitt aus dem Dokument
<main>
<action mode="a0">example</action>
<action mode="a1">example</action>
<action mode="a0">example</action></main>
Behälterdarstellung des Ausschnitts (Es werden nur Elemente gezeigt)
                   .------------------------------------------.
| main O------------------------------- Behälter
| .-----------. .----------. .-----------. |
Inhalt 0 ------o action | | action o | | action o-------- Inhalt 2
(erster Inhalt) | '-----------' '-----|----' '-----------' | (letzter Inhalt)
'---------------------|--------------------'
|
Inhalt 1

Neben den Elementen enthält der Dokumentausschnitt noch weitere Bestandteile, welche hier zur Vereinfachung nicht in den Abbildungen dargestellt werden.

Das Dokument als Baum von Elementen
   action    action    action
| | |
'---------:---------'
|
main
Das Dokument als Baum (Stammbaumdarstellung) von Elementen
              main
|
.---------:---------.
| | |
action action action

Namensräume

Um Elementtypen und Attributnamen kann ein Namensraum  vorangestellt werden. Es handelt sich dabei praktisch um eine vorangestellte Verlängerung des Namens, durch die der Name eindeutig gemacht wird. Eine Namen mit einem vorangestellten Namensraum nennen wir auch einen vollständig qualifizierten Namen.

Im folgenden Beispiel wird der Namensraum »http://schemas.android.com/apk/res/android« als »android« bezeichnet und dann dem Elementtyp »activitiy« und dem Attributnamen »mode« vorangestellt.

Example.xml
<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:android="http://schemas.android.com/apk/res/android"
package="com.example">
<android:activity
android:mode="com.example.MainActivity">
</activity></application></manifest>

Es ergibt sich effektive der lange und weltweit eindeutige vollständig qualifizierte Name »http://schemas.android.com/apk/res/android/activity« beziehungsweise »http://schemas.android.com/apk/res/android/mode«.

Die Wahl der Bezeichnung des Namensraums hat also für den eindeutigen Namen keine Bedeutung. So hat also das folgende Dokument dieselbe Bedeutung wie das voranstehende.

Example1.xml
<?xml version="1.0" encoding="utf-8"?>
<manifest xmlns:a="http://schemas.android.com/apk/res/android"
package="com.example">
<a:activity
a:mode="com.example.MainActivity">
</activity></application></manifest>

Der Namensraum »""« ist dasselbe wie kein Namensraum.

Fehlnamensräume

Durch »xmlns=« kann ein Fehlnamensraum für Elementtypen  angegeben werden. Dieser gilt dann für alle Elementtypen  von Unterelementen, denen eine Namensraumangabe fehlt.

Attributnamen sind hingegen nur dann in einem Namensraum, wenn diese auch am Anfang des Attributnamens ausdrücklich angegeben ist. Fehlnamensräume werden nicht  auf sie angewendet.

Fehlnamensräume gelten für Elementtypen, nicht  für Attribute.

(Die Angaben von Fehlnamensräumen können in Unterelementen durch Angaben von Fehlnamensräumen verdeckt werden.)

Seiteninformationen und Impressum   |   Mitteilungsformular  |   "ram@zedat.fu-berlin.de" (ohne die Anführungszeichen) ist die Netzpostadresse von Stefan Ram.   |   Eine Verbindung zur Stefan-Ram-Startseite befindet sich oben auf dieser Seite hinter dem Text "Stefan Ram".)  |   Der Urheber dieses Textes ist Stefan Ram. Alle Rechte sind vorbehalten. Diese Seite ist eine Veröffentlichung von Stefan Ram. Schlüsselwörter zu dieser Seite/relevant keywords describing this page: Stefan Ram Berlin slrprd slrprd stefanramberlin spellched stefanram722590 stefan_ram:722590 Das Wichtigste zu XML in Kürze Stefan Ram, Berlin, and, or, near, uni, online, slrprd, slrprdqxx, slrprddoc, slrprd722590, slrprddef722590, PbclevtugFgrsnaEnz Erklärung, Beschreibung, Info, Information, Hinweis,

Der Urheber dieses Textes ist Stefan Ram. Alle Rechte sind vorbehalten. Diese Seite ist eine Veröffentlichung von Stefan Ram.
https://www.purl.org/stefan_ram/pub/kurz_xml