2007 Office System의 XML 파일 형식 개요

업데이트 날짜: 2009년 1월

적용 대상: Office Resource Kit

 

마지막으로 수정된 항목: 2009-01-07

2007 Microsoft Office 시스템에는 개방형 표준을 기반으로 하는 강력한 새 XML 파일 형식이 도입되었습니다. 새로운 Xml 파일 형식을 사용하면 여러 데이터 원본에서 문서를 빠르게 만들 수 있으므로 문서 어셈블리, 데이터 마이닝 및 콘텐츠 다시 사용이 가속화됩니다. 또한 이 새로운 형식은 2007 Office System 및 엔터프라이즈 비즈니스 시스템의 응용 프로그램 간 데이터 교환을 간소화합니다.

모든 표준 도구 및 기술을 사용하여 새로운 XML 형식 문서를 만들 수 있으며 2007 Office System이 반드시 필요한 것은 아닙니다. 사용자는 원하는 환경에서 정보를 보다 빠르고 정확하게 게시, 검색 및 다시 사용함으로써 생산성을 높일 수 있습니다.

새로운 XML 형식은 업계 표준 XML 및 ZIP 기술을 기반으로 하고, 모든 기술 공급자와 완벽하게 통합되며, 무료 라이선스를 통해 사용할 수 있습니다. XML 파일 형식 사양은 Microsoft Office 2003 참조 스키마용으로 제공되는 것과 같은 무료 라이선스 하에 게시 및 제공될 예정이며, 업계에서 광범위하게 사용할 수 있도록 개방하여 제공됩니다.

새로운 XML 파일 형식의 이점

새로운 XML 형식은 개발자, IT 전문가 및 사용자에게 다음과 같은 다양한 이점을 제공합니다.

  • 작은 파일 형식. 문서가 자동으로 압축되므로 최대 75%까지 크기가 작아집니다.

  • 손상된 파일 복구 기능 개선. 모듈식 데이터 저장소가 사용되므로 차트나 테이블과 같은 파일 내의 구성 요소가 손상된 경우에도 파일을 열 수 있습니다.

  • 문서 안전성 향상. OLE 개체 또는 Microsoft VBA(Visual Basic for Applications) 코드와 같은 포함된 코드가 파일 내의 별도 섹션에 저장되므로 특수 처리를 위해 쉽게 식별할 수 있습니다. IT 관리자는 원치 않는 매크로나 컨트롤이 포함된 문서를 차단할 수 있으므로 사용자가 문서를 보다 안전하게 열 수 있습니다.

  • 손쉬운 통합. 개발자는 차트, 주석, 문서 메타데이터 등 파일 내의 특정 콘텐츠에 직접 액세스할 수 있습니다.

  • 투명성 및 개선된 정보 보안. 사용자 이름, 메모, 추적된 변경 내용, 파일 경로 등 개인 식별이 가능한 정보 및 업무에 중요한 정보를 쉽게 식별 및 제거할 수 있으므로 문서의 기밀을 유지하여 공유할 수 있습니다.

  • 호환성. 간단한 업데이트를 설치하면 Microsoft Office 2000, Microsoft Office XP 및 Office 2003 버전 사용자도 새로운 XML 형식 중 하나로 문서를 열고 편집 및 저장할 수 있습니다.

새로운 XML 파일 형식의 구조

2007 Office System에서 모든 XML 형식의 기본 구조는 다음의 5가지 요소로 구성됩니다.

  • 시작 요소. 계층 구조에서 순서가 가장 높은 요소입니다.

  • XML 요소. XML을 구성하는 파일 또는 폴더가 파일의 내용이 됩니다.

  • 비 XML 요소. XML이 아니며 일반적으로 이미지 또는 OLE 개체인 요소입니다.

  • 관계 요소. 일반적으로 다른 요소를 가리켜 요소 구조의 관계 계층 구조를 정의하는 요소 유형입니다.

  • ZIP 패키지. 모든 요소를 단일 파일로 묶습니다.

시작 요소

관계 요소이며 순서가 가장 높은 요소로 간주할 수 있는 XML 요소인 시작 요소는 파일 형식을 결정합니다. 예를 들어 핵심 컨테이너의 이름이 WordDoc인 경우 파일 이름 확장명은 .docx가 됩니다.

XML 요소

Office XML로 서식이 지정된 파일을 2007 Office System에서 저장하면 해당 파일은 전체 파일을 설명하는 논리적 요소 집합으로 구분됩니다. Office Word 2007의 경우 파일을 이러한 요소로 구분하면 원래 Office 응용 프로그램 외부에서도 파일을 쉽게 쿼리 또는 수정할 수 있습니다.

예를 들어 개발자는 파일에서 문서 속성을 보다 쉽게 제거할 수 있습니다. 속성이 단일 요소에 배치되며 해당 요소를 삭제하려면 문서 컨테이너 내에서 요소를 삭제하면 되기 때문입니다. Microsoft Office 2003에서 선택적 XML 파일 형식으로 제공되는 WordProcessingML을 사용하는 경우 주석을 제거하려면 전체 파일을 구문 분석하여 주석 내용을 나타내는 XML을 찾아 제거해야 했습니다. 그러나 새로운 파일 형식을 사용하는 경우 기능 관련 데이터가 여러 요소로 구분됩니다. 즉, 주석, 링크, 머리글, 바닥글 및 기타 데이터가 제거 가능한 별도의 요소에 배치되므로 전체 Word 문서를 구문 분석할 필요가 없습니다.

비 XML 요소

비 XML 요소는 보통 이미지 및 OLE 개체입니다. 이진 콘텐츠를 사용하거나 XML을 사용하지 않는 모든 파일 형식은 비 XML 요소로 식별됩니다. 가장 일반적인 비 XML 요소는 문서 내에 포함되거나 문서에 첨부되는 파일입니다. Office Word 2007 XML 형식 스키마 설명서에는 이러한 형식의 파일에 대해 Word에서 사용되는 리터럴 관계 및 스키마 계층 구조가 설명되어 있습니다.

관계 요소

관계 요소는 다른 요소를 가리키며 요소의 관계 계층을 정의하는 XML 요소입니다. 수준이 높은 XML 요소는 대부분 관계 요소입니다. 데이터를 포함하며 다른 요소를 가리키지 않는 XML 요소는 원시 요소라고도 하며, 이러한 요소의 콘텐츠 형식은 보통 응용 프로그램/xml입니다.

ZIP 패키지

ZIP 패키지를 사용하면 모든 응용 프로그램에서 다음과 같은 이점이 있습니다.

  • 개방형 표준. ZIP 압축 알고리즘은 효율적으로 정의된 개방형 표준입니다.

  • 작은 파일 크기. 파일 크기가 일반적으로 동등한 이진 파일보다 작습니다. 평균적으로 Office Word 2007 파일은 이미지 수에 따라 해당하는 이진 항목에 비해 크기가 75%까지 작습니다.

  • 보다 강력한 기능. 파일이 보다 강력한 기능을 제공하며 발생 가능한 오류의 영향을 적게 받습니다. 이전 파일의 경우 파일 전체가 전혀 변경되지 않은 경우에만 제대로 작동했습니다.

ZIP 패키지를 사용하는 경우 파일은 이진 파일이지만, WinFX API(응용 프로그램 프로그래머 인터페이스) 집합에서는 System.IO.Packaging 네임스페이스의 패키지 형식을 기본적으로 지원합니다. 따라서 개발자는 해당 형식을 처리하는 도구를 만들어 패키지 확장 또는 압축을 고려하지 않고 논리적 모델(요소)에 대해 직접 작업을 수행할 수 있습니다.

이 문서의 다운로드

이 항목은 다운로드 가능한 다음 문서에도 포함되어 있어 더 쉽게 읽고 인쇄할 수 있습니다.