Office 2010 的 XML 檔案格式概觀

 

適用版本: Office 2010

上次修改主題的時間: 2016-11-29

Microsoft Office 2010 及 2007 Microsoft Office 系統支援穩定的 XML 檔案格式,可簡化 Office 應用程式與企業商務系統之間的資料交換。根據開放式標準,這些 XML 檔案格式可讓您從不同的資料來源快速建立文件,並加速文件集合、資料採礦及內容重複使用。

2007 Office System 支援 ECMA-376 Office Open XML 格式標準 (稍後提交至 ISO/IEC,並且在 2008 年底發佈為 ISO/IEC 29500 Office Open XML 格式標準)。Office 2010 提供 ECMA-376 的讀取支援、ISO/IEC 29500 Transitional 的讀取/寫入支援,以及 ISO/IEC 29500 Strict 的讀取支援。

ISO/IEC 29500 Office Open XML 格式的文件可向 ISO/IEC 取得,而 ECMA-376 的文件可向 Ecma International 取得。如需在 Office 2010 與 2007 Office System 如何支援這些格式的詳細資訊,請參閱 MSDN 上的 Microsoft Office 檔案格式文件 (可能為英文網頁) (https://go.microsoft.com/fwlink/?linkid=191143\&clcid=0x404) (可能為英文網頁)。

本文內容:

  • Open XML 格式的優點

  • Open XML 格式的結構

Open XML 格式的優點

Open XML 格式為開發人員、IT 專業人員及使用者提供數項優點。這些優點包括下列各項:

  • 壓縮檔格式   文件會自動壓縮,最多可壓縮 75%。

  • 增進損毀檔案復原   即使檔案中的元件損毀 (例如圖表或表格),模組化資料存放區仍可讓檔案開啟。

  • 文件更安全   內嵌程式碼,例如 OLE 物件或 Microsoft Visual Basic for Applications (VBA) 程式碼,儲存在檔案的不同區段中,所以可以輕易識別,以進行特殊處理。IT 管理員可以封鎖含有不想要的巨集或控制項文件。如此可以在開啟文件時,為使用者保護文件的安全。

  • 整合更容易   開發人員可以直接存取檔案中的特定內容,例如圖表、註解及文件中繼資料。

  • 透明度及增進的資訊安全性   可以機密地共用文件,因為可以輕易地識別及移除可識別的個人資訊,以及商業機密資訊,例如使用者名稱、註解、追蹤的變更,以及檔案路徑。

  • 相容性   藉由安裝 Microsoft Office 相容性套件,Microsoft Office 2000、Microsoft Office XP 及 Microsoft Office 2003 版的使用者可以開啟、編輯及儲存其中一種新 XML 格式的文件。

Open XML 格式的結構

Open XML 格式的基本結構包含下列五種元素,在後面的段落中會進一步詳細說明。

  • 開始組件   階層中最高的順序組件。

  • XML 組件   由包含檔案內容之 XML 組成的檔案或資料夾。

  • 非 XML 組件   非 XML 的組件,通常不是圖像,就是 OLE 物件。

  • 關係組件   通常會指向其他組件,以定義組件結構關聯性階層的一種組件類型。

  • ZIP 套件   可將各組件包含在單一檔案中。

開始組件

開始組件 (作為關係組件的 XML 組件,並可視為最高的順序組件) 可判斷檔案類型。例如,如果核心容器的名稱為 WordDoc,則副檔名為 .docx。

XML 組件

當 Office XML 格式的檔案儲存在 Office 2010 或 2007 Office System 中時,該檔案會劃分成一組邏輯組件,用以說明整個檔案。針對 Microsoft Word,將檔案劃分成這些組件,可讓您在原始 Office 應用程式外部輕鬆地查詢或修改檔案。

例如,開發人員更容易移除檔案的文件屬性,因為這些屬性放在單一組件中,而且刪除組件就可以將該組件從文件容器中刪除。若是使用 WordprocessingML (在 Office 2003 中是以選用性 XML 檔案格式提供),在移除註解時,會需要剖析整個檔案以尋找及移除代表註解內容的 XML。若是使用新檔案格式,與功能相關的資料會劃分成數個組件。註解、連結、頁首、頁尾及其他資料都位在可以移除的不同組件中。您不需要剖析整個 Word 文件。

非 XML 組件

非 XML 組件通常是圖像與 OLE 物件。使用二進位內容或非使用 XML 的任何檔案類型,都會識別為非 XML。非 XML 組件通常是附加或內嵌在文件中的檔案。Word XML 格式結構描述文件會說明 Word 用於這種類型之檔案的字面關係與結構描述階層。

關係組件

關係組件是指向其他組件,並定義組件關聯性階層的 XML 組件。最高層的 XML 組件是關係組件。包含資料以及未指向其他組件的 XML 組件亦稱為原始組件,而且通常會有應用程式/xml 的內容類型。

ZIP 套件

使用 ZIP 套件可在所有的應用程式中提供下列優點:

  • 開放式標準   ZIP 壓縮演算法是定義完善的開放式標準。

  • 縮減檔案大小   檔案通常會比同等的二進位檔案小。一般而言,Word Open XML 檔案會比其二進位的對等項目小 75% (視圖像數目而定)。

  • 穩定度增加   檔案更為穩定,且對檔案中潛在的錯誤較不敏感。之前的檔案需要完整無缺的檔案,才能正確運作。

雖然使用 ZIP 套件代表檔案為二進位,但是 WinFX 應用程式開發介面 (API) 組合提供 System.IO.Packaging 命名空間中的套件格式原生支援。這樣可以讓開發人員建立工具以處理格式,並直接對邏輯模型 (組件) 運作,而不需要考量套件的擴充或壓縮。