Office 2010의 XML 파일 형식 개요

 

적용 대상: Office 2010

마지막으로 수정된 항목: 2016-11-29

Microsoft Office 2010 및 2007 Microsoft Office 시스템에서는 Office 응용 프로그램과 엔터프라이즈 비즈니스 시스템 사이의 데이터 교환을 간소화하는 강력한 XML 파일 형식이 지원됩니다. 개방형 표준을 기반으로 하는 이러한 XML 파일 형식은 서로 다른 데이터 원본으로부터 문서를 신속하게 생성하고 문서 어셈블리, 데이터 마이닝 및 콘텐츠 다시 사용 속도를 높여 줍니다.

2007 Office System에서는 이후에 ISO/IEC로 제출되었고 2008년 후반 ISO/IEC 29500 Office Open XML 형식 표준으로 게시된 ECMA-376 Office Open XML 형식 표준이 지원됩니다. Office 2010에서는 ECMA-376에 대한 읽기 지원, ISO/IEC 29500 Transitional에 대한 읽기/쓰기 지원 및 ISO/IEC 29500 Strict에 대한 읽기 지원이 제공됩니다.

ISO/IEC 29500 Office Open XML 형식에 대한 설명서는 ISO/IEC에서 제공되며, ECMA-376에 대한 설명서는 Ecma International에서 제공됩니다. 이러한 형식이 Office 2010 및 2007 Office System에서 지원되는 방식에 대한 자세한 내용은 MSDN에서 Microsoft Office 파일 형식 문서(영문일 수 있음)(https://go.microsoft.com/fwlink/?linkid=191143\&clcid=0x412)(영문일 수 있음)를 참조하십시오.

이 문서의 내용

  • Open XML 형식의 이점

  • Open XML 형식의 구조

Open XML 형식의 이점

Open XML 형식은 개발자, IT 전문가 및 사용자에게 몇 가지 이점을 제공합니다. 이러한 이점은 다음과 같습니다.

  • 압축 파일 형식   문서는 최대 75%까지 자동으로 압축됩니다.

  • 손상된 파일 복구 기능 향상   모듈식 데이터 저장 방식으로 차트, 테이블 등 파일 내의 구성 요소가 손상된 경우에도 파일을 열 수 있습니다.

  • 보다 안전한 문서 OLE 개체 또는 Microsoft Visual Basic for Applications(VBA) 코드와 같은 포함된 코드는 특수 처리를 위해 쉽게 식별할 수 있도록 파일 내 별도의 섹션에 저장됩니다. IT 관리자는 원치 않는 매크로 또는 컨트롤이 포함되는 문서를 쉽게 차단할 수 있습니다. 그러므로 사용자는 보다 안전한 방식으로 파일을 열 수 있습니다.

  • 보다 쉬운 통합   개발자가 차트, 주석 및 문서 메타데이터와 같은 파일 내 특정 콘텐츠에 직접 액세스할 수 있습니다.

  • 투명성 및 향상된 정보 보안   사용자 이름, 주석, 변경 내용 추적, 파일 경로 등 개인을 식별할 수 있는 정보 및 중요 비즈니스 정보를 쉽게 식별하고 제거할 수 있기 때문에 문서를 보다 안전하게 공유할 수 있습니다.

  • 호환성   Microsoft Office 호환 기능 팩을 설치하여 Microsoft Office 2000, Microsoft Office XP 및 Microsoft Office 2003 버전 사용자가 새 XML 형식 중 하나로 문서를 열고, 편집하고, 저장할 수 있습니다.

Open XML 형식의 구조

Open XML 형식의 기본 구조는 다음과 같은 다섯 가지 요소로 구성되며, 이에 대해서는 이후 섹션에서 보다 자세하게 설명합니다.

  • 시작 부분   계층 구조에서 가장 높은 순서의 부분입니다.

  • XML 부분   파일 내용을 이루는 XML로 구성된 파일 또는 폴더입니다.

  • XML이 아닌 부분   XML이 아닌 부분이며, 일반적으로 이미지 또는 OLE 개체입니다.

  • 관계 부분   일반적으로 부분 구조의 관계 계층 구조를 정의하기 위해 다른 부분을 가리키는 부분 유형입니다.

  • ZIP 패키지   각 부분을 단일 파일로 묶습니다.

시작 부분

관계 부분이고 가장 높은 순서의 부분으로 고려될 수 있는 시작 부분은 파일 형식을 결정합니다. 예를 들어 핵심 컨테이너의 이름이 WordDoc인 경우 파일 이름 확장명은 .docx입니다.

XML 부분

Office XML 형식으로 지정된 파일을 Office 2010 또는 2007 Office System에서 저장하면 파일이 전체 파일을 설명하는 논리적 부분의 집합으로 분할됩니다. Microsoft Word의 경우 파일을 이러한 부분으로 분할하면 원래 Office 응용 프로그램 외부에서도 파일을 쉽게 쿼리하거나 수정할 수 있습니다.

예를 들어 속성이 단일 부분에 배치되고, 문서 컨테이너 내에서 해당 부분만 삭제할 수 있기 때문에 개발자가 파일에서 문서 속성을 보다 쉽게 제거할 수 있습니다. WordprocessingML(Office 2003에서 선택적인 XML 파일 형식으로 제공됨)을 사용할 경우 주석을 제거하면 전체 파일을 구문 분석하여 해당 주석의 내용을 나타내는 XML을 찾아서 제거할 수 있습니다. 새 파일 형식에서는 기능 관련 데이터가 여러 부분으로 분할됩니다. 주석, 링크, 머리글, 바닥글 및 기타 데이터는 각각 제거할 수 있는 별개의 부분에 배치됩니다. 전체 Word 문서를 구문 분석할 필요가 없습니다.

XML이 아닌 부분

XML이 아닌 부분은 일반적으로 이미지와 OLE 개체입니다. 이진 콘텐츠를 사용하거나 XML을 사용하지 않는 모든 파일 형식은 XML이 아닌 파일로 식별됩니다. XML이 아닌 부분은 일반적으로 문서에 첨부되었거나 문서 내에 포함된 파일입니다. Word XML 형식 스키마 설명서에서는 이러한 형식의 파일에 대해 Word에서 사용되는 리터럴 관계 및 스키마 계층 구조에 대해 설명합니다.

관계 부분

관계 부분은 다른 부분을 가리키고 각 부분의 관계적인 계층 구조를 정의하는 XML 부분입니다. 가장 높은 수준의 XML 부분은 관계 부분입니다. 데이터를 포함하고 다른 부분을 가리키지 않는 XML 부분은 원시 부분이라고도 부르며, 일반적으로 application/xml의 콘텐츠 형식을 포함합니다.

ZIP 패키지

ZIP 패키지를 사용하면 모든 응용 프로그램에서 다음과 같은 이점을 얻을 수 있습니다.

  • 개방형 표준   ZIP 압축 알고리즘은 잘 정의된 개방형 표준입니다.

  • 파일 크기 감소 파일은 일반적으로 원래의 이진 파일보다 크기가 작아집니다. 평균적으로 Word Open XML 파일은 이미지 수에 따라 해당 이진 파일보다 약 75%까지 크기가 작아집니다.

  • 향상된 견고성 파일이 보다 강력해지며, 파일의 잠재적인 오류에 대해 덜 영향을 받습니다. 이전 파일들은 오류가 전혀 없어야 올바르게 작동했습니다.

ZIP 패키지를 사용하면 파일이 이진 상태가 되지만 WinFX API(응용 프로그래밍 인터페이스) 집합은 System.IO.Packaging 네임스페이스에서 패키지 형식에 대한 기본 지원을 제공합니다. 따라서 개발자는 패키지의 확장 또는 압축을 고려하지 않고도 해당 형식을 처리하고 논리적 모델(각 부분)에 대해 직접 작업을 수행하는 도구를 만들 수 있습니다.