1단원: 공급자 DQS 기술 자료 만들기
이 단원에서는 공급자 데이터에 대한 지식(메타데이터)이 포함된 Suppliers라는 DQS 기술 자료를 만듭니다. 이 기술 자료는 입력 공급자 데이터에 대해 정리 및 일치 작업을 수행하는 데 사용됩니다. 정리 작업은 잘못된/올바르지 않은 데이터를 식별하고, 잘못된 데이터를 수정하고, 수정/제안을 제공하고, 데이터를 표준화하고, 자세한 정보를 사용해서 데이터를 강화합니다. 일치 작업은 데이터를 비교하고 데이터에서 중복 항목을 제거하는 데 도움이 될 수 있도록 데이터에서 비슷하지만 약간 다른 레코드를 식별합니다.
대화형 및 컴퓨터 기반 프로세스를 모두 사용해서 기술 자료를 만들고, 빌드 및 관리할 수 있습니다. 기술 자료에서 지식은 도메인에서 유지 관리되며 이러한 각 기술 자료는 정리 및/또는 일치 작업을 수행하려는 데이터의 특정 데이터 필드와 관련이 있습니다.
이 단원에서는 다음 작업을 수행하여 Suppliers 기술 자료를 만듭니다.
Suppliers라는 DQS 기술 자료를 만듭니다. 기술 자료는 여러 가지 방법으로 만들 수 있습니다. 기술 자료는 처음부터 새로 만들거나, 기존 기술 자료를 기반으로 해서 만들거나, 미리 작성되어 내보낸 기술 자료가 포함된 DQS 파일(.dqs)을 가져와서 만들거나, 예제 데이터에 대해 기술 자료 검색 작업을 수행하여 만들 수 있습니다. 이 자습서에서는 기술 자료를 처음부터 새로 만듭니다.
중복 항목을 식별할 수 있도록 데이터 정리 및 데이터 일치 작업에 사용하는 도메인을 Suppliers 기술 자료에 만듭니다. 데이터의 모든 데이터 필드가 아니라 정리 및 일치 작업에 사용하려는 데이터 필드에 대해 도메인을 만듭니다.
값을 수동으로 추가하거나, Excel 파일에서 값을 가져오거나, 예제 데이터에 대해 기술 자료 검색 작업을 수행하거나, 정리 프로젝트에서 프로젝트 값을 가져와서 도메인에 값을 추가합니다. 또한 이 자습서에서 수행하지 않는 도메인 속성 및 값이 포함된 DQS 파일을 가져와서 도메인 값을 가져올 수도 있습니다.
도메인에 대한 규칙을 설정합니다. 도메인 규칙은 DQS에서 도메인 값의 유효성 검사, 수정 및 표준화를 수행하는 데 사용되는 조건입니다.
도메인에 대한 용어 기반 관계를 설정합니다. 용어 기반 관계를 사용하면 도메인에서 값의 일부인 용어를 수정할 수 있습니다. 예를 들어 **Contoso Inc.라는 값에서 Inc.**는 Incorporated로 정의될 수 있는 용어입니다. 이렇게 하면 중복 항목을 식별하는 것뿐만 아니라 데이터를 표준화하는 데에도 도움이 됩니다. 예를 들어 **Contoso Inc.**와 Contoso Incorporated는 중복 항목으로 고려될 수 있습니다.
도메인 값에 동의어를 지정합니다. 두 개 이상의 값을 동의어로 설정하고 이중 하나를 데이터 표준화를 위한 정리 작업 중 해당 동의어 값 대신 사용되는 선행 값으로 설정할 수 있습니다.
Address line, City, State 및 Zip 도메인으로 구성되는 Address Validation이라는 복합 도메인을 만듭니다. 복합 도메인은 하나 이상의 단일 도메인으로 구성된 도메인입니다. 복합 도메인을 사용하면 여러 도메인에 관련된 규칙을 만들 수 있습니다. 예를 들어 City 및 State가 두 개의 개별 도메인이라고 가정할 때 City가 Los Angeles이면 State가 CA여야 하는 규칙을 정의할 수 있습니다.
참조 데이터 서비스를 구성하고 사용합니다. DQS(Data Quality Services)의 참조 데이터 서비스 기능을 사용하면 타사 참조 데이터 공급자를 구독하고 고품질 데이터를 기준으로 비즈니스 데이터의 유효성을 검사하여 비즈니스 데이터를 정리하고 강화할 수 있습니다. 정리 프로세스가 진행되는 동안 DQS 내에서 유명 DQS 공급자의 서비스를 사용하여 데이터를 표준화, 수정 또는 강화할 수 있습니다. 이 자습서에서는 Windows Azure 마켓플레이스에서 참조 데이터 서비스를 사용하도록 DQS 환경을 구성하고 Address Validation 복합 도메인과 연관된 서비스를 사용해서 주소 데이터를 정리하는 방법에 대해 알아봅니다.
정리 및 일치 작업에서 기술 자료를 사용할 수 있도록 기술 자료를 게시합니다.