아티클
04/01/2012

SQL Server의 XML 이해

이 항목에서는 SQL Server에서 XML을 사용해야 하는 이유에 대해 간단히 설명합니다. 또한 네이티브 XML 저장소 및 XML 뷰 기술 선택을 위한 지침을 제공하고 데이터 모델링 방식을 제안합니다.

관계형 데이터 모델 또는 XML 데이터 모델

데이터가 알려진 스키마로 복잡하게 구조화된 경우 관계형 모델이 데이터 저장소에 가장 적합할 수 있습니다. SQL Server는 사용자에게 필요한 기능 및 도구를 제공합니다. 반면에 반구조화되어 있거나 구조화되지 않았거나 구조화 상태를 알 수 없는 경우에는 이러한 데이터의 모델링을 고려해야 합니다.

구조적 및 의미적 태그를 사용하여 데이터의 이동성을 보장하기 위해 플랫폼 독립적인 모델이 필요한 경우에는 XML이 좋은 대안입니다. 또한 XML은 다음과 같은 상황에서도 적절한 대안이 될 수 있습니다.

데이터가 산발적이거나 데이터 구조를 알 수 없거나 데이터 구조가 이후에 크게 변경될 수 있습니다.
데이터가 엔터티 간 참조 대신 포함 계층을 나타내며 재귀적일 수 있습니다.
데이터에 정렬이 내재되어 있습니다.
데이터 구조를 기반으로 데이터를 쿼리하거나 데이터 일부를 업데이트하고자 합니다.

이러한 상황에 하나도 해당되지 않으면 관계형 데이터 모델을 사용해야 합니다. 예를 들어 데이터가 XML 형식으로 되어 있지만 응용 프로그램에서 데이터의 저장 및 검색을 위해서만 데이터베이스를 사용하는 경우에는 [n]varchar(max) 열만 있으면 됩니다. XML 열에 데이터를 저장하면 추가 이점이 있습니다. 이러한 이점에 대한 예로, 엔진에서 데이터가 잘 작성되었거나 유효한지 여부를 확인할 수 있으며, XML 데이터의 세부적 쿼리 및 업데이트가 지원됩니다.

SQL Server에서 XML 데이터를 저장하는 이유

다음은 파일 시스템에서 XML 데이터를 관리하는 대신 SQL Server에서 네이티브 XML 기능을 사용하는 몇 가지 이유입니다.

효율적이고 실용적인 방식으로 XML 데이터를 공유, 쿼리 및 수정하고자 합니다. 세부적 데이터 액세스는 응용 프로그램에 중요한 요소입니다. 예를 들어 XML 문서 내에서 일부 섹션을 추출하거나 전체 문서를 바꾸지 않고 새 섹션을 삽입합니다.
관계형 데이터 및 XML 데이터가 있고 응용 프로그램 내에서 관계형 데이터 및 XML 데이터 사이의 호환성이 필요합니다.
도메인 간 응용 프로그램에서 쿼리 및 데이터 수정을 위한 언어 지원이 필요합니다.
서버의 데이터가 잘 작성되도록 보장하고 선택적으로 XML 스키마에 따라 데이터의 유효성을 검사고자 합니다.
효율적인 쿼리 처리 및 확장성을 위해 XML 데이터를 인덱싱하고 최상의 쿼리 최적화 프로그램을 사용하고자 합니다.
XML 데이터에 대한 SOAP, ADO.NET 및 OLE DB 액세스가 필요합니다.
XML 데이터 관리를 위해 데이터베이스 서버의 관리 기능을 사용하고자 합니다. 예를 들어 이러한 기능에는 백업, 복구 및 복제가 포함될 수 있습니다.

이러한 상황에 하나도 해당되지 않으면 [n]varchar(max) 또는 varbinary(max)와 같은 비-XML의 큰 개체 형식으로 데이터를 저장하는 것이 좋습니다.

XML 저장소 옵션

SQL Server의 XML 저장소 옵션에는 다음이 포함됩니다.

xml 데이터 형식의 네이티브 저장소

데이터의 XML 내용을 보존하는 내부 표현으로 데이터가 저장됩니다. 이러한 내부 표현에는 포함 계층, 문서 순서, 요소 및 특성 값에 대한 정보가 포함됩니다. 특히 XML 데이터의 InfoSet 내용이 보존됩니다. InfoSet에 대한 자세한 내용은 http://www.w3.org/TR/xml-infoset을 방문하십시오. InfoSet 내용은 다음 정보가 포함되지 않기 때문에 테스트 XML의 동일 복사본이 될 수 없습니다. 제외되는 정보는 중요하지 않은 공백, 특성 순서, 네임스페이스 접두사 및 XML 선언입니다.

XML 스키마에 바인딩된 xml 데이터 형식인 형식화된 xml 데이터 형식에 대해 PSVI(Post-Schema Validation InfoSet)는 InfoSet에 유형 정보를 추가하고 내부 표현으로 인코딩됩니다. 이렇게 하면 구문 분석 속도가 크게 향상됩니다. 자세한 내용은 http://www.w3.org/TR/xmlschema-1 및 http://www.w3.org/TR/xmlschema-2에서 W3C XML 스키마 사양을 참조하십시오.
XML 및 관계형 저장소 간 매핑

XML은 AXSD(주석 지정 스키마)를 사용하여 하나 이상의 테이블에 있는 열로 분해됩니다. 이렇게 하면 관계형 수준에서 데이터의 정확성이 보존됩니다. 그 결과 요소 간 순서가 무시되더라도 계층적 구조가 보존됩니다. 스키마는 재귀적일 수 없습니다.
큰 개체 저장소 [n]varchar(max) 및 varbinary(max)

데이터의 동일 복사본이 저장됩니다. 이 옵션은 법률 문서와 같은 특수한 용도의 응용 프로그램에 유용합니다. 대부분의 응용 프로그램에는 정확한 복사본이 필요하지 않으며 XML 내용만으로도 충분합니다(InfoSet 정확성).

일반적으로 이러한 접근 방식을 조합해서 사용해야 할 수 있습니다. 예를 들어 xml 데이터 형식의 열에 XML 데이터를 저장하고 XML 열에서 관계형 열로 속성을 승격해야 할 수 있습니다. 또는 비-XML 열에 비재귀적인 부분을 저장하고 재귀적인 부분만 xml 데이터 형식의 열에 저장하는 매핑 기술을 사용할 수 있습니다.

XML 기술 선택

네이티브 XML과 XML 뷰 간의 XML 기술 선택은 일반적으로 다음 요소에 따라 달라집니다.

저장소 옵션

XML 데이터는 큰 개체 저장소에 적합하거나(예: 제품 설명서) 관계형 열에 있는 저장소에 더 적합할 수 있습니다(예: XML로 변환된 라인 항목). 각 저장소 옵션은 서로 다른 수준의 문서 정확성을 보존합니다.
쿼리 기능

쿼리의 특성과 XML 데이터를 쿼리하는 정도에 따라 적합한 저장소 옵션을 찾을 수 있습니다. XML 노드에 대한 조건자 평가와 같은 세부적인 XML 데이터 쿼리는 두 개의 저장소 옵션에서 서로 다르게 지원됩니다.
XML 데이터 인덱싱

XML 쿼리 성능의 속도를 높이기 위해 XML 데이터를 인덱싱할 수 있습니다. 인덱싱 옵션은 스토리지 옵션별로 다르므로 작업을 최적화할 수 있는 적합한 옵션을 선택해야 합니다.
데이터 수정 기능

일부 작업에는 XML 데이터에 대한 세부적인 수정 작업이 포함됩니다. 예를 들어 특정 작업에는 문서 내의 새 섹션 추가 작업이 포함되지만 웹 콘텐츠와 같은 다른 작업에는 이러한 작업이 포함되지 않습니다. 데이터 수정 언어 지원은 응용 프로그램에 있어서 중요한 요소입니다.
스키마 지원

XML 데이터를 스키마에 의해 기술할 수 있으며 이러한 스키마는 XML 스키마 문서일 수도 혹은 아닐 수도 있습니다. 스키마 바인딩 XML 지원은 XML 기술에 따라 달라집니다.

선택한 옵션에 따라 성능 특성이 달라집니다.

네이티브 XML 저장소

서버에서 xml 데이터 형식의 열에 XML 데이터를 저장할 수 있습니다. 이 옵션은 다음과 같은 상황에서 적절한 대안이 될 수 있습니다.

서버에 XML 데이터를 저장하고 동시에 문서 순서 및 문서 구조를 보존할 수 있는 직관적인 방식이 필요합니다.
XML 데이터에 대한 스키마가 있거나 없습니다.
XML 데이터를 쿼리하고 수정해야 합니다.
신속한 쿼리 처리를 위해 XML 데이터를 인덱싱해야 합니다.
XML 데이터 및 XML 스키마를 관리하려면 응용 프로그램에 시스템 카탈로그 뷰가 필요합니다.

네이티브 XML 저장소는 구조 범위가 포함된 XML 문서가 있거나 관계형 구조로 매핑하기 어려운 여러 스키마 또는 복잡한 스키마에 해당하는 XML 문서가 있는 경우에 유용합니다.

예: xml 데이터 형식을 사용하여 XML 데이터 모델링

각 항목에 대한 별도의 장으로 구성되어 있고 각 장 내에 여러 섹션이 포함된 XML 형식의 제품 설명서를 가정해 보십시오. 하나의 섹션에는 하위 섹션이 포함될 수 있습니다. 따라서 <section>은 재귀적 요소입니다. 제품 설명서에는 다량의 콘텐츠, 다이어그램 및 기술 자료가 혼합되어 있으며 데이터는 반구조적입니다. 사용자는 "인덱싱" 장에서 "클러스터형 인덱스" 섹션을 검색하는 것과 같이 원하는 항목을 문맥에 따라 검색하고 많은 기술 자료를 쿼리할 수 있습니다.

XML 문서에 적합한 저장소 모델은 xml 데이터 형식의 열입니다. 이 모델은 XML 데이터에 대한 InfoSet 내용을 보존합니다. XML 열을 인덱싱하면 쿼리 성능이 높아집니다.

예: XML 데이터에 대한 정확한 복사본 유지

이해를 돕기 위해 정부 규제에 따라 XML 문서에 대한 정확한 텍스트 복사본을 유지해야 한다고 가정해 보십시오. 예를 들어 여기에는 서명된 문서, 법률 문서 또는 상품 거래 주문 내역 등이 포함될 수 있습니다. 문서를 [n]varchar(max) 열에 저장할 수 있습니다.

쿼리를 위해서는 데이터를 런타임에 xml 데이터 형식으로 변환하고 여기에서 Xquery를 실행합니다. 런타임 변환은 특히 문서가 큰 경우 비용이 많이 듭니다. 쿼리를 자주 수행하는 경우 xml 데이터 형식의 열에 문서를 중복해서 저장하고 [n]varchar(max) 열에서 정확한 문서 복사본을 반환하는 동안 이를 인덱싱할 수 있습니다.

XML 열은 [n]varchar(max) 열을 기반으로 계산을 수행하는 계산 열일 수 있습니다. 그러나 XML 계산 열에서는 XML 인덱스를 만들 수 없으며 [n]varchar(max) 또는 varbinary(max) 열을 기반으로 XML 인덱스를 작성할 수도 없습니다.

XML 뷰 기술

데이터베이스에 있는 테이블과 XML 스키마 간의 매핑을 정의하면 영구적 데이터에 대한 "XML 뷰"를 만들 수 있습니다. XML 대량 로드를 사용하면 XML 뷰를 사용하여 기본 테이블을 채울 수 있습니다. XML 뷰는 XPath 버전 1.0을 사용하여 쿼리할 수 있으며, 이 쿼리는 테이블에서 SQL 쿼리로 변환됩니다. 이와 마찬가지로 이들 테이블에 업데이트를 전파할 수도 있습니다.

이 기술은 다음과 같은 경우 유용합니다.

기존 관계형 데이터에 대해 XML 뷰를 사용하는 XML 중심 프로그래밍 모델을 갖고자 합니다.
외부 파트너가 제공한 XML 데이터에 대한 스키마(XSD, XDR)가 있습니다.
데이터에서 순서가 중요하지 않거나, 쿼리 테이블 데이터가 재귀적이지 않거나, 최대 재귀 깊이가 미리 알려져 있습니다.
XPath 버전 1.0을 사용하여 XML 뷰를 통해 데이터를 쿼리 및 수정해야 합니다.
XML 데이터를 대량 로드하고 XML 뷰를 사용하여 기본 테이블로 분해해야 합니다.

이러한 예로는 데이터 교환 및 웹 서비스에 대해 XML로 제공된 관계형 데이터와 고정 스키마가 포함된 XML 데이터가 있습니다. 자세한 내용은 MSDN Online Library를 참조하십시오.

예: AXSD(주석 지정 XML 스키마)를 사용하여 데이터 모델링

이해를 돕기 위해 고객, 주문 및 라인 항목 등과 같은 기존 관계형 데이터가 있고 이를 XML로 처리하려는 경우를 가정해 보십시오. 관계형 데이터에 대해 AXSD를 사용하여 XML 뷰를 정의합니다. XML 뷰를 사용하면 XML 데이터를 테이블에 대량 로드하고 XML 뷰를 사용하여 관계형 데이터를 쿼리 및 업데이트할 수 있습니다. 이 모델은 XML 태그가 포함된 데이터를 다른 응용 프로그램과 교환하고 SQL 응용 프로그램을 방해 받지 않고 실행해야 하는 경우에 유용합니다.

하이브리드 모델

관계형 및 xml 데이터 형식의 열을 조합하면 데이터 모델링에 적합한 경우가 많습니다. XML 데이터의 일부 값은 관계형 열에 저장하고 나머지 값이나 전체 XML 값은 XML 열에 저장할 수 있습니다. 이렇게 하면 관계형 열에서 만든 인덱스와 잠금 특성을 더욱 자세히 제어할 수 있다는 점에서 성능이 향상됩니다.

관계형 열에 저장하는 값은 작업에 따라 달라집니다. 예를 들어 경로 식 /Customer/@CustId에 따라 모든 XML 값을 검색하는 경우 CustId 특성의 값을 관계형 열로 승격하고 이를 인덱싱하면 쿼리 속도가 빨라집니다. 반면에 XML 데이터가 관계형 열로 포괄적으로 중복되지 않게 분해된 경우 리어셈블리 비용이 상당히 높을 수 있습니다.

예를 들어 구조화 수준이 높은 XML 데이터의 경우 테이블의 내용이 XML로 변환되어 모든 값을 관계형 열로 매핑하고 XML 뷰 기술을 사용할 수 있습니다.

XML 데이터의 세분성

XML 열에 저장된 XML 데이터의 세분성은 잠금에 있어서 매우 중요하며, 업데이트에 대해서도 역시 중요합니다. SQL Server는 XML 및 비-XML 데이터에 대해서 모두 같은 잠금 메커니즘을 사용합니다. 따라서 행 수준의 잠금으로 인해 행에 있는 모든 XML 인스턴스가 잠깁니다. 세분성이 큰 경우 업데이트를 위해 큰 XML 인스턴스를 잠그면 다중 사용자 환경에서 처리량이 줄어듭니다. 반면에 심각한 분해 작업을 수행하면 개체 캡슐화가 손실되며 리어셈블리 비용이 증가합니다.

데이터 모델링 요구 사항과 잠금 및 업데이트 특성 간의 균형은 훌륭한 디자인을 위해 중요한 요소입니다. 하지만 SQL Server에서 실제 저장된 XML 인스턴스의 크기는 그렇게 중요하지 않습니다.

예를 들어 XML 인스턴스에 대한 업데이트는 저장된 기존 XML 인스턴스가 해당 업데이트된 버전과 비교되는 부분적 BLOB(Binary Large Object) 업데이트와 부분적 인덱스 업데이트에 대한 새로운 지원을 사용하여 수행됩니다. 부분적 BLOB(Binary Large Object) 업데이트는 두 개의 XML 인스턴스 간의 차등 비교를 수행하고 다른 점만 업데이트합니다. 부분적 인덱스 업데이트는 XML 인덱스에서 변경되어야 하는 행만 수정합니다.

섹션 내용

항목	설명
XML 데이터 로드	XML 데이터를 SQL Server로 전송하는 방법에 대해 설명합니다.
비즈니스 논리 추가	비즈니스 논리를 XML 데이터로 추가하는 방법에 대해 설명합니다.