10.1.2 Office-Dokumente


XML-Codierung eines Microsoft-Word-Dokuments

Ein Microsoft-Word-Dokument speichert Text, Medien und Formatierungen eines Dokuments, z.B. den Text "Hallo Welt!". Wenn man das Dokument unter einem bestimmten Namen speichert, dann findet man z.B. die Datei "hallowelt.docx".

halloweltdocx.png

Die Datei "hallowelt.docx" ist keine einzelne Datei, sondern ein Archiv von Dateien das komprimiert wurde. Mit dem Tool "7Zip" kann man diese Datei entpacken. Im Ordner, welcher die entpackten Dateien enthält, findet man den Unterordner "word" mit folgendem Inhalt:

docxunzip.png

Öffnet man die Datei "document.xml" in einem Web-Browser dann sieht man folgenden Inhalt:

docxxml.png

Eine Microsoft-Word-Datei ist ein Archiv von XML-Dateien und Medien-Dateien. Die XML-Dateien enthalten im Textformat die Informationen, wie der Text im Dokument gestaltet sein soll.


XML-Codierung eines LibreOffice Writer-Dokuments

Ein LibreOffice-Writer-Dokument speichert Text, Medien und Formatierungen eines Dokuments, z.B. den Text "Hallo Welt!". Wenn man das Dokument unter einem bestimmten Namen speichert, dann findet man z.B. die Datei "hallowelt.odt".

halloweltodt.png

Die Datei "hallowelt.odt" ist keine einzelne Datei, sondern ein Archiv von Dateien das komprimiert wurde. Mit dem Tool "7Zip" kann man diese Datei entpacken. Im Ordner, welcher die entpackten Dateien enthält, findet man folgenden Inhalt:

odtunzip.png

Öffnet man die Datei "content.xml" in einem Web-Browser dann sieht man folgenden Inhalt:

odtxml.png

Eine LibreOffice-Writer-Datei ist ein Archiv von XML-Dateien und Medien-Dateien. Die XML-Dateien enthalten im Textformat die Informationen, wie der Text im Dokument gestaltet sein soll.


Auch die Dateien, welche mit dem Präsentations-Tool oder der Tabellenkalkulation gespeichert werden, sind Archive von Medien- und XML-Dateien.