10.1.2 XML-Datenspeicherung


XML steht für eXtensible Markup Language und ist eine Beschreibungs-Sprache, mit welcher Daten organisiert in einer Textdatei gespeichert werden können.

Beispiel: In einer Textdatei sollen Daten über Personen gespeichert werden. Damit die verschiedenen Eigenschaften von einem Programm verarbeitet werden können, werden diese zwischen XML-Tags gesetzt:

<person>
    <name>Max Mustermann</name>
    <alter>30</alter>
    <beruf>Webentwickler</beruf>
</person>

XML ist:

  • Selbstbeschreibend: Die XML-Tags sollen vom Autor so definiert sein, dass die Datenstruktur und die Bedeutung der Daten aus dem Dokument selbst hervorgehen.

  • Hierarchisch: XML-Daten sind in einer Baumstruktur organisiert, so dass komplexe Datenstrukturen abgebildet werden können.

  • Plattformunabhängig: XML-Daten sind als einfache Textdatei gespeichert, so dass sie auf jeder Plattform gelesen und geschrieben werden können.

  • Unterstützung für Unicode: XML unterstützt alle Unicode-Zeichen, so dass Daten in Textform in jeder Sprache gespeichert werden können.


XML-Codierung eines Microsoft-Word-Dokuments

Ein Microsoft-Word-Dokument speichert Text, Medien und Formatierungen eines Dokuments, z.B. den Text "Hallo Welt!". Wenn man das Dokument unter einem bestimmten Namen speichert, dann findet man z.B. die Datei "hallowelt.docx".

halloweltdocx.png

Die Datei "hallowelt.docx" ist keine einzelne Datei, sondern ein Archiv von Dateien das komprimiert wurde. Mit dem Tool "7Zip" kann man diese Datei entpacken. Im Ordner, welcher die entpackten Dateien enthält, findet man den Unterordner "word" mit folgendem Inhalt:

docxunzip.png

Öffnet man die Datei "document.xml" in einem Web-Browser dann sieht man folgenden Inhalt:

docxxml.png

Eine Microsoft-Word-Datei ist ein Archiv von XML-Dateien und Medien-Dateien. Die XML-Dateien enthalten im Textformat die Informationen, wie der Text im Dokument gestaltet sein soll.


XML-Codierung eines LibreOffice Writer-Dokuments

Ein LibreOffice-Writer-Dokument speichert Text, Medien und Formatierungen eines Dokuments, z.B. den Text "Hallo Welt!". Wenn man das Dokument unter einem bestimmten Namen speichert, dann findet man z.B. die Datei "hallowelt.odt".

halloweltodt.png

Die Datei "hallowelt.odt" ist keine einzelne Datei, sondern ein Archiv von Dateien das komprimiert wurde. Mit dem Tool "7Zip" kann man diese Datei entpacken. Im Ordner, welcher die entpackten Dateien enthält, findet man folgenden Inhalt:

odtunzip.png

Öffnet man die Datei "content.xml" in einem Web-Browser dann sieht man folgenden Inhalt:

odtxml.png

Eine LibreOffice-Writer-Datei ist ein Archiv von XML-Dateien und Medien-Dateien. Die XML-Dateien enthalten im Textformat die Informationen, wie der Text im Dokument gestaltet sein soll.


Auch die Dateien, welche mit dem Präsentations-Tool oder der Tabellenkalkulation gespeichert werden, sind Archive von Medien- und XML-Dateien.