Share via


2007 Office system の XML ファイル形式の概要

更新日: 2009年1月

適用対象: Office Resource Kit

 

トピックの最終更新日: 2009-01-07

2007 Microsoft Office system では、堅牢でオープン スタンダードに基づく新しい XML ファイル形式が導入されています。新しい XML ファイル形式によって、さまざまなデータ ソースから迅速にドキュメントを作成できるので、ドキュメントの組み立て、データ マイニング、およびコンテンツの再利用が促進されます。このファイル形式を使用すると、2007 Office system およびエンタープライズ ビジネス システムのアプリケーション間でのデータ交換が容易になります。

新しい XML 形式のドキュメントは、標準的なツールやテクノロジを使用して作成できます。2007 Office system は必須ではありません。選択した環境で情報をより迅速かつ正確に、公開、検索、再利用することによって、生産性を向上させることができます。

新しい XML 形式は、業界標準の XML および ZIP テクノロジに基づいて、あらゆるテクノロジ プロバイダによる完全な統合をサポートしており、無償のライセンスを通じて利用できます。この XML ファイル形式の仕様は公開され、Microsoft Office 2003 リファレンス スキーマと同じ無償のライセンスの下で入手できるようになる予定で、業界で広く使用できるようにオープンに提供されます。

新しい XML ファイル形式の利点

新しい XML 形式には、開発者、IT 担当者、およびユーザーにとってのさまざまな利点があります。たとえば、次のような利点が含まれます。

  • コンパクトなファイル形式。ドキュメントは自動的に圧縮され、サイズが最大で 75% 小さくなります。

  • 破損したファイルの回復の強化。モジュール化されたデータの格納によって、グラフ、表などのファイル内のコンポーネントが破損してもファイルを開くことができます。

  • より安全なドキュメント。OLE オブジェクト、Microsoft Visual Basic for Applications (VBA) コードなどの埋め込みコードは、ファイル内の独立したセクションに格納されるので、容易に識別して特別な処理を実行できます。IT 管理者は、不要なマクロやコントロールを含むドキュメントをブロックできるので、ユーザーがドキュメントを開くときの安全性が向上します。

  • 容易になった統合。開発者は、ファイル内のグラフ、コメント、ドキュメント メタデータなどの特定の内容に直接アクセスできます。

  • 透過性および情報のセキュリティの向上。ユーザー名、コメント、変更履歴、ファイルのパスなど、個人を特定できる情報や企業の機密情報を容易に識別して削除できるので、ドキュメントを安全に共有できます。

  • 互換性。簡単な更新プログラムをインストールすることによって、Microsoft Office 2000、Microsoft Office XP、および Office 2003 のユーザーは、新しい XML 形式のドキュメントを開いて、編集し、保存できるようになります。

新しい XML ファイル形式の構造

2007 Office system のすべての XML 形式の基本的な構造は、5 つの要素で構成されます。

  • 開始パーツ。階層の最上位のパーツです。

  • XML パーツ。ファイルの内容を構成する XML を含むファイルまたはフォルダです。

  • 非 XML パーツ。XML ではないパーツで、通常は画像または OLE オブジェクトです。

  • リレーションシップ パーツ。一般的に他のパーツを指す種類のパーツで、パーツ構造の関係の階層を定義します。

  • ZIP パッケージ。パーツを単一のファイルにまとめます。

開始パーツ

開始パーツは、リレーションシップ パーツであり、最上位のパーツと見なすことができる XML パーツで、ファイルの種類を決定します。たとえば、コア コンテナの名前が WordDoc である場合、ファイル名の拡張子は .docx になります。

XML パーツ

2007 Office system で Office XML 形式のファイルを保存すると、ファイルはファイル全体を表す論理パーツのセットに分割されます。Office Word 2007 では、ファイルをパーツに分割することによって、元の Office アプリケーションの外部で容易にファイルを検索または編集できます。

たとえば、プロパティは単一のパーツに配置され、このパーツを削除することによってドキュメント コンテナからパーツを削除できるので、開発者はファイルから容易にドキュメントのプロパティを削除できます。WordprocessingML (Microsoft Office 2003 のオプションの XML ファイル形式) では、コメントを削除するには、ファイル全体を解析し、コメントの内容を表す XML を検索して削除する必要がありました。新しいファイル形式では、機能に関連するデータはパーツに分割されています。コメント、リンク、ヘッダー、フッター、およびその他のデータは、削除できる個別のパーツに格納されます。Word 文書全体を解析する必要はありません。

非 XML パーツ

非 XML パーツは、一般的に画像および OLE オブジェクトです。バイナリ コンテンツを使用し、XML を使用しないファイルの種類はすべて、非 XML として識別されます。非 XML パーツは、通常、ドキュメントに添付されたファイルまたは埋め込まれたファイルです。Office Word 2007 XML 形式のスキーマ ドキュメントでは、Word でこのような種類のファイルを処理するために使用されるリテラルの関係とスキーマの階層について説明しています。

リレーションシップ パーツ

リレーションシップ パーツは、他のパーツを指す XML パーツで、パーツのリレーションシップ階層を定義します。最上位の XML パーツはリレーションシップ パーツです。データを含み、他のパーツを指し示さない XML パーツはプリミティブと呼ばれ、通常、コンテンツの種類は application/xml になります。

ZIP パッケージ

ZIP パッケージを使用すると、すべてのアプリケーションで以下の利点があります。

  • オープン スタンダード。ZIP 圧縮アルゴリズムは、明確に定義されたオープン スタンダードです。

  • ファイル サイズの削減。同じ内容のバイナリ ファイルに比べて、一般的にファイルのサイズが小さくなります。画像の数にもよりますが、Office Word 2007 のファイルはバイナリ ファイルよりも平均で 75% サイズが小さくなります。

  • 堅牢性の向上。ファイルの堅牢性が向上し、ファイル内のエラーの影響を受けにくくなっています。以前の形式のファイルは、正常に機能するにはエラーがまったく含まれていない必要がありました。

ZIP パッケージの使用は、ファイルがバイナリ形式であることを意味しますが、WinFX アプリケーション プログラミング インターフェイス (API) セットによって、System.IO.Packaging 名前空間のパッケージ形式がネイティブにサポートされます。これによって、開発者はパッケージの展開や圧縮を考慮することなく、この形式を処理したり、論理モデル (パーツ) を直接操作するツールを作成できます。

このドキュメントをダウンロードする

このトピックは、簡単に読んだり印刷したりできるように、次のダウンロード可能なドキュメントに収められています。