Vue d’ensemble des formats de fichier XML dans Office System 2007

Mis à jour: janvier 2009

S'applique à: Office Resource Kit

 

Dernière rubrique modifiée : 2009-01-07

Microsoft Office System 2007 introduit de nouveaux formats de fichier XML robustes et basés sur des standards ouverts. Les nouveaux formats de fichier XML permettent la création rapide de documents à partir de sources de données disparates, accélérant l’assemblage de documents, le datamining et la réutilisation de contenu. Les formats simplifient l’échange de données entre les applications Office System 2007 et les systèmes professionnels d’entreprise.

Vous pouvez créer un document dans les nouveaux formats XML avec n’importe quels outil et technologie standard : Office System 2007 n’est pas requis. Les utilisateurs peuvent améliorer la productivité en publiant, explorant et réutilisant les informations de façon plus rapide et plus précise dans l’environnement de leur choix.

Les nouveaux formats XML reposent sur les technologies de référence XML et ZIP, prennent en charge l’intégration complète par n’importe quel fournisseur de technologie et sont disponibles via une licence libre de droits. La spécification du format de fichier XML sera publiée et mise à disposition sous la même licence libre de droits que celle qui régit les schémas de référence Microsoft Office 2003 et est ouvertement proposée et mise à disposition pour une large utilisation par l’industrie.

Avantages des nouveaux formats de fichier XML

Les nouveaux formats XML offrent une série d’avantages pour les développeurs, les professionnels de l’informatique et les utilisateurs. Ces avantages sont les suivants :

  • Format de fichier compact. Les documents sont automatiquement compressés et leur réduction peut atteindre 75 %.

  • Récupération améliorée des fichiers endommagés. Le stockage de données modulaire permet à un fichier de s’ouvrir même si un composant à l’intérieur de celui-ci, tel qu’un graphique ou une table, est endommagé.

  • Documents sécurisés. Le code incorporé, tel que les objets OLE ou le code Microsoft Visual Basic pour Applications (VBA), est stocké dans une section distincte à l’intérieur du fichier, si bien qu’il est facilement identifié comme devant faire l’objet d’un traitement spécial. Les administrateurs informatiques peuvent bloquer les documents qui contiennent des macros ou des contrôles non désirés, rendant les documents plus sûrs pour les utilisateurs lorsqu’ils sont ouverts.

  • Intégration plus facile. Les développeurs disposent d’un accès direct aux contenus spécifiques au sein d’un fichier, tels que les graphiques, les commentaires et les métadonnées du document.

  • Transparence et sécurité des informations améliorée. Vous pouvez partager les documents de manière confidentielle, car les informations d’identification personnelle et confidentielles, telles que les noms d’utilisateur, les commentaires, les révisions et les chemins d’accès aux fichiers, sont facilement identifiées et supprimées.

  • Compatibilité. En installant une simple mise à jour, les utilisateurs des éditions Microsoft Office 2000, Microsoft Office XP et Office 2003 peuvent ouvrir, modifier et enregistrer les documents dans l’un des nouveaux formats XML.

Structure des nouveaux formats de fichier XML

La structure de base de tous les formats XML dans Office System 2007 se compose de cinq éléments :

  • Partie de départ. Partie occupant la position la plus élevée dans la hiérarchie.

  • Parties XML. Fichiers ou dossiers composés de données XML représentant le contenu du fichier.

  • Parties non-XML. Parties qui ne sont pas des données XML et qui, généralement, sont des images ou des objets OLE.

  • Partie relationnelle. Type de partie qui, généralement, pointe vers d’autres parties pour définir la hiérarchie relationnelle de la structure des parties.

  • Package ZIP. Rassemble les parties en un fichier unique.

Partie de départ

La partie de départ, partie XML qui est une partie relationnelle et qui pourrait être considérée comme la partie la plus élevée, détermine le type de fichier. Par exemple, si le nom du conteneur principal est WordDoc, l’extension du nom de fichier est .docx.

Parties XML

Lorsqu’un fichier au format Office XML est enregistré dans Office System 2007, le fichier est subdivisé en un ensemble de parties logiques qui décrit la totalité du fichier. Pour Office Word 2007, la subdivision du fichier en parties de ce type facilite l’interrogation ou la modification du fichier en dehors de l’application Office d’origine.

Par exemple, il est plus facile pour un développeur de supprimer les propriétés de document d’un fichier, car les propriétés sont placées dans une partie unique qui, en tant que telle, peut être supprimée du conteneur de document. Avec la technologie WordprocessingML (fournie en tant que format de fichier XML facultatif dans Microsoft Office 2003), la suppression de commentaires impliquait l’analyse de la totalité du fichier en vue de la recherche et de la suppression des données XML représentant le contenu du commentaire. Grâce au nouveau format de fichier, les données liées aux fonctionnalités sont subdivisées en parties. Les commentaires, les liens, les en-têtes, les pieds de page et autres données se trouvent dans des parties distinctes qui peuvent être supprimées. Vous n’avez pas besoin d’analyser la totalité du document Word.

Parties non-XML

Les parties non-XML sont généralement des images et des objets OLE. Tout type de fichier qui utilise du contenu binaire ou n’utilise pas de données XML est identifié en tant que type de fichier non-XML. Une partie non-XML est, en règle générale, un fichier attaché à un document ou incorporé dans un document. La documentation du schéma du format XML Office Word 2007 explique la hiérarchie schématique et relationnelle littérale utilisée par Word pour les fichiers de ce type.

Partie relationnelle

Une partie relationnelle est une partie XML qui pointe vers d’autres parties et définit leur hiérarchie relationnelle. Les parties XML les plus élevées sont les parties relationnelles. Les parties XML qui contiennent des données et ne pointent pas vers d’autres parties sont également appelées primitives et leur contenu est généralement de type application/xml.

Package ZIP

L’utilisation d’un package ZIP offre les avantages suivants dans toutes les applications :

  • Standard ouvert. L’algorithme de compression ZIP est un standard ouvert correctement défini.

  • Taille de fichier réduite. Les fichiers sont généralement plus petits que les fichiers binaires équivalents. En moyenne, les fichiers Office Word 2007 sont 75 % plus petits que leurs équivalents binaires, suivant le nombre d’images.

  • Robustesse accrue. Les fichiers sont plus robustes et moins sensibles aux erreurs potentielles qu’ils peuvent recéler. Les fichiers antérieurs devaient être complètement intacts pour fonctionner correctement.

Bien que l’utilisation d’un package ZIP signifie que le fichier est binaire, le jeu d’API WinFX permet la prise en charge native du format du package dans l’espace de noms System.IO.Packaging. Cela permet aux développeurs de créer des outils qui traitent le format et travaillent directement par rapport au modèle logique (les parties) sans prendre en compte la décompression ou la compression du package.

Télécharger ce livre

Cette rubrique est incluse dans le livre téléchargeable suivant pour une lecture et une impression plus faciles :