XML-Dateiformate in Office 2010 (Übersicht)

 

Gilt für: Office 2010

Letztes Änderungsdatum des Themas: 2011-08-05

Microsoft Office 2010 und 2007 Microsoft Office System unterstützen leistungsfähige XML-Dateiformate, die den Datenaustausch zwischen Office-Anwendungen und Unternehmenssystemen vereinfachen. Diese auf offenen Standards basierenden XML-Dateiformate ermöglichen das schnelle Erstellen von Dokumenten aus verschiedenen Datenquellen und beschleunigen die Dokumentzusammenstellung, das Data Mining und die Wiederverwendung von Inhalten.

2007 Office System unterstützt den ECMA-376 Office Open XML-Formate-Standard, der später bei ISO/IEC eingereicht und Ende 2008 als ISO/IEC 29500 Office Open XML Formate-Standard veröffentlicht wurde. Office 2010 kann ECMA-376 lesen, ISO/IEC 29500 Transitional lesen und schreiben sowie ISO/IEC 29500 Strict lesen.

Dokumentation für die ISO/IEC 29500 Office Open XML-Formate ist von ISO/IEC erhältlich, und Dokumentation für ECMA-376 ist von Ecma International erhältlich. Ausführliche Informationen zur Unterstützung dieser Formate in Office 2010 und 2007 Office System finden Sie unter Dokumente zu den Microsoft Office-Dateiformaten (https://go.microsoft.com/fwlink/?linkid=191143\&clcid=0x407) auf MSDN.

Inhalt dieses Artikels:

  • Vorteile der Open XML-Formate

  • Struktur der Open XML-Formate

Vorteile der Open XML-Formate

Die Open XML-Formate bieten Entwicklern, IT-Spezialisten und Benutzern die folgenden Vorteile:

  • Kompaktes Dateiformat   Dokumente werden automatisch um bis zu 75 % komprimiert.

  • Verbesserte Wiederherstellung beschädigter Dateien   Mit der modularen Datenspeicherung können Dateien geöffnet werden, selbst wenn eine Komponente innerhalb der Datei, wie z. B. ein Diagramm oder eine Tabelle, beschädigt ist.

  • Sicherere Dokumente   Eingebetteter Code, wie z. B. OLE-Objekte oder Microsoft VBA-Code (Visual Basic for Applications) wird in einem separaten Abschnitt der Datei gespeichert und kann deshalb auf einfache Weise für die spezielle Verarbeitung identifiziert werden. IT-Administratoren können Dokumente, die unerwünschte Makros oder Steuerelemente enthalten, blockieren. Dokumente werden dadurch beim Öffnen durch die Benutzer sicherer.

  • Einfachere Integration   Entwickler haben direkten Zugriff auf bestimmte Inhalte in der Datei, wie z. B. Diagramme, Kommentare und Dokumentmetadaten.

  • Transparenz und verbesserte Informationssicherheit   Dokumente können vertraulich gemeinsam genutzt werden, da personenbezogene Informationen und für das Unternehmen sensible Informationen, wie z. B. Benutzernamen, Kommentare, Überarbeitungen und Dateipfade problemlos identifiziert und entfernt werden können.

  • Kompatibilität   Durch die Installation des Microsoft Office Compatibility Pack können Benutzer von Microsoft Office 2000, Microsoft Office XP und Microsoft Office 2003 Dokumente in einem der neuen XML-Formate öffnen, bearbeiten und speichern.

Struktur der Open XML-Formate

Die grundlegende Struktur der Open XML-Formate besteht aus den folgenden fünf Elementen, die in den nachfolgenden Abschnitten ausführlicher beschrieben werden.

  • Startkomponente   Die Komponente der obersten Ebene in der Hierarchie.

  • XML-Komponenten   Dateien oder Ordner mit XML-Code, der den Inhalt der Datei darstellt.

  • Nicht-XML-Komponenten   Komponenten, die keinen XML-Code darstellen und bei denen es sich im Allgemeinen um Bilder oder OLE-Objekte handelt.

  • Beziehungskomponente   Ein Komponententyp, der im Allgemeinen auf andere Komponenten verweist, um die Beziehungshierarchie der Komponentenstruktur zu definieren.

  • ZIP-Paket   Fasst Komponenten in einer einzigen Datei zusammen.

Startkomponente

Die Startkomponente – eine XML-Komponente die eine Beziehungskomponente darstellt und als die Komponente der obersten Ebene betrachtet werden könnte – bestimmt den Dateityp. Wenn z. B. der Name des zentralen Containers "WordDoc" heißt, lautet die Dateinamenerweiterung DOCX.

XML-Komponenten

Wenn eine Office-Datei im XML-Format in Office 2010 oder 2007 Office System gespeichert wird, wird die Datei in logische Komponenten unterteilt, die die gesamte Datei beschrieben. Für Microsoft Word kann durch das Unterteilen der Datei in diese Komponenten die Datei auf einfache Weise außerhalb der ursprünglichen Office-Anwendung abgefragt oder geändert werden.

Beispielsweise ist es für einen Entwickler einfacher, Dokumenteigenschaften aus einer Datei zu entfernen, da die Eigenschaften in einer einzelnen Komponente platziert sind, und die Komponente kann im Dokumentcontainer gelöscht werden, indem die Komponente gelöscht wird. Bei WordprocessingML (in Office 2003 als optionales XML-Dateiformat bereitgestellt) musste zum Entfernen von Kommentaren die gesamte Datei analysiert werden, um den XML-Code, der den Inhalt der Kommentare repräsentiert, zu suchen und zu entfernen. Mit dem neuen Dateiformat werden featurebezogene Daten in Komponenten unterteilt. Kommentare, Links, Kopfzeilen, Fußzeilen und sonstige Daten befinden sich in separaten Komponenten, die entfernt werden können. Sie müssen nicht das gesamte Word-Dokument analysieren.

Nicht-XML-Komponenten

Nicht-XML-Komponenten sind im Allgemeinen Bilder und OLE-Objekte. Jeder Dateityp, der binären Inhalt oder keinen XML-Code verwendet, wird als Nicht-XML-Komponente identifiziert. Eine Nicht-XML-Komponente ist gewöhnlich eine Datei, die an ein Dokument angefügt oder in ein Dokument eingebettet ist. In der Dokumentation für das Word-XML-Formatschema werden die von Word für solche Dateitypen verwendete Literalbeziehung und Schemahierarchie erläutert.

Beziehungskomponente

Eine Beziehungskomponente ist eine XML-Komponente, der auf andere Komponenten verweist und die Beziehungshierarchie der Komponenten definiert. Die meisten XML-Komponenten auf hoher Ebene sind Beziehungskomponenten. XML-Komponenten, die Daten enthalten und nicht auf andere Komponenten verweisen, werden auch als einfache Komponenten bezeichnet und weisen in der Regel den Inhaltstyp "application/xml" auf.

ZIP-Paket

Die Verwendung eines ZIP-Pakets bietet in allen Anwendungen die folgenden Vorteile:

  • Offener Standard   Der ZIP-Komprimierungsalgorithmus ist ein eindeutig definierter offener Standard.

  • Geringere Dateigröße   Dateien sind im Allgemeinen kleiner als eine entsprechende Binärdatei. Word Open XML-Dateien sind in Abhängigkeit von der Anzahl der Bilder durchschnittlich 75 % kleiner als die entsprechenden Binärdateien.

  • Höhere Robustheit   Dateien sind robuster und im Hinblick auf potenzielle Fehler in der Datei nicht so anfällig. Früher musste die Datei vollständig intakt sein, um ordnungsgemäß ausgeführt zu werden.

Die Verwendung eines ZIP-Pakets bedeutet zwar, dass es sich bei der Datei um eine Binärdatei handelt, aber die WinFX-Anwendungsprogrammierschnittstelle (Application Programming Interface, API) bietet die systemeigene Unterstützung für das Paketformat im Namespace System.IO.Packaging. Auf diese Weise können Entwickler Tools erstellen, die das Format verarbeiten und das logische Modell (die Komponenten) direkt verwenden, ohne das Paket erweitern oder komprimieren zu müssen.