도메인 속성 설정

이 항목에서는 DQS(Data Quality Services)에서 도메인 속성을 설정하는 방법에 대해 설명합니다.

항목 내용

  • 시작하기 전 주의 사항

    필수 구성 요소

    보안

  • 도메인 속성 설정

  • 후속 작업: 도메인 속성 설정 후

  • 도메인 속성

    도메인 이름 및 설명

    데이터 형식

    선행 값 사용

    문자열 정규화

    출력 형식

    언어

    맞춤법 검사기 설정

    구문 오류 알고리즘 해제

시작하기 전 주의 사항

필수 구성 요소

도메인의 속성을 설정하려면 기술 자료와 도메인을 만들어 두어야 합니다.

보안

사용 권한

도메인의 속성을 설정하려면 DQS_MAIN 데이터베이스에 대한 dqs_kb_editor 또는 dqs_administrator 역할이 있어야 합니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

도메인 속성 설정

  1. 도메인 관리 작업에서 기술 자료를 연 후(기술 자료 열기 참조) 도메인 목록에서 적절한 도메인을 선택하여 기존 도메인의 속성을 설정합니다. 기본적으로 도메인 속성 페이지가 표시됩니다.

  2. 도메인 만들기에 설명된 대로 새 도메인을 만든 후 속성을 설정합니다.

  3. 마침을 클릭하여 도메인 관리 작업 종료에 설명된 대로 도메인 관리 작업을 완료합니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

후속 작업: 도메인 속성을 설정한 후

도메인 속성을 설정한 후 도메인에 대해 다른 도메인 관리 태스크를 수행하거나, 기술 자료 검색을 수행하여 도메인에 정보를 추가하거나, 도메인에 일치 정책을 추가할 수 있습니다. 자세한 내용은 기술 자료 검색 수행, 도메인 관리 또는 일치 정책 만들기를 참조하십시오.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]

도메인 속성

도메인 이름 및 설명

도메인이 생성된 후 도메인 이름 또는 설명을 변경할 수 있습니다. 도메인 이름은 기술 자료에 대해 고유해야 합니다. 설명은 최대 256자까지 지정할 수 있습니다.

데이터 형식

도메인을 만들 때 도메인의 값에 대해 문자열(기본값), 날짜, 정수 또는 10진수 데이터 형식 중 하나를 선택합니다. 도메인을 만든 후 데이터 형식을 볼 수 있지만 변경할 수는 없습니다. 도메인에 대해 선택한 데이터 형식에 따라 도메인에 매핑할 수 있는 원본 데이터가 정의됩니다. DQS에서 4개의 도메인 데이터 형식 각각에 대해 지원되는 데이터 형식에 대한 자세한 내용은 DQS 도메인에 대해 지원되는 SQL Server 및 SSIS 데이터 형식을 참조하십시오.

선행 값 사용

동의어 값 대신 동의어 그룹의 선행 값이 출력되도록 지정하려면 이 확인란을 선택합니다. 각 동의어 값이 올바른 형식 또는 수정된 형식으로 출력되고 동의어 그룹의 선행 값으로 바뀌지 않도록 지정하려면 선행 값 사용을 선택 취소합니다.

문자열 정규화

데이터 형식이 문자열인 경우 이 확인란을 선택하여 원본 데이터의 특수 문자를 무시합니다. DQS는 날짜가 도메인에 로드될 때 내부적으로 특수 문자를 null 또는 공백으로 바꿉니다. 콜론, 하이픈, 마침표, 큰따옴표 또는 세미콜론이 공백으로 바뀝니다. 작은따옴표는 null로 바뀝니다. null을 사용하면 문자열의 두 부분이 결합됩니다.

문자열 값의 특수 문자를 무시하면 일치 정확도가 증가할 수 있습니다. 특수 문자를 null 또는 공백으로 바꾸면 두 문자열 간의 유사성 점수가 높아질 수 있습니다. 문장 부호 또는 다른 기호는 여러 문자열에서 서로 다를 가능성이 높습니다. 내부적으로 특수 문자를 바꾸면 점수가 DQS의 최소 일치 임계값을 초과하여 이전에 일치한 적 없는 두 문자열이 일치 항목으로 간주될 수 있습니다. 그러나 일치 작업을 수행할 데이터 형식에 따라 특수 문자를 무시하도록 선택할지 여부를 결정해야 합니다. 예를 들어 영어로 된 측정 시스템의 데이터를 작업 중일 때 제품 데이터에서 큰따옴표가 인치를 의미하고, 작은따옴표가 피트를 의미할 경우 제품 데이터의 큰따옴표와 작은따옴표를 무시하면 거짓 긍정이 발생할 수 있습니다.

검색, 일치 정책, 일치 프로젝트 및 정리 프로젝트 작업의 데이터 처리 단계에서 데이터가 로드되고 인덱싱될 때 정규화가 수행됩니다. 설정된 경우 정규화와 용어 기반 관계 변환은 모두 분석 전 전처리 단계에서 완료됩니다. 문자열 간의 유사성을 계산하는 알고리즘이 적용되기 전에 각 도메인에 대해 실행됩니다. 복합 도메인 구문 분석이 요청된 경우 구분 기호 구문 분석 시 기호가 필요하므로 이 작업이 정규화 및 용어 기반 관계 변환보다 먼저 수행됩니다. 도메인 규칙 및 도메인 값 변경과 같은 다른 작업은 이러한 변환 후에 수행됩니다. 결과 데이터의 DQS 특수 문자는 내부적으로 바뀌지 않습니다.

출력 형식

도메인의 데이터 값이 출력될 때 적용할 서식을 선택합니다. 서식은 다음 목록에 표시된 것처럼 선택한 데이터 형식에 따라 달라집니다. 없음을 선택하면 목록의 아무런 서식도 적용되지 않습니다.

  • 문자열 값의 경우 문자열이 대문자, 소문자로 출력되거나 앞 글자만 대문자로 출력되도록 지정할 수 있습니다.

  • 날짜 값의 경우 년, 월, 일 형식으로 지정할 수 있습니다.

  • 정수 값의 경우 적용할 서식 마스크의 유형을 지정할 수 있습니다.

  • 10진수 값의 경우 적용할 서식 마스크의 유형과 정확도를 지정할 수 있습니다.

언어

데이터 형식이 문자열인 경우 맞춤법 검사기 작업에서 도메인과 연결할 언어를 선택합니다. 이 선택 항목은 맞춤법 검사기에만 적용됩니다. 맞춤법 검사기 결과는 사용하는 언어에 따라 달라지기 때문입니다. 선택 항목은 데이터 형식이 문자열인 단일 도메인에만 적용됩니다. 언어 속성은 복합 도메인과는 관련이 없습니다. 복합 도메인에서 각 부분의 언어는 관련 단일 도메인에 의해 결정됩니다.

기본 언어는 한국어(Korean)입니다. 언어 속성을 기타로 설정하면 도메인에 대해 맞춤법 검사기가 해제됩니다.

팁

언어가 언어 드롭다운 목록에 나열되지 않는 경우 기타를 선택해야 합니다. 이렇게 하면 DQS는 도메인에서 사용 가능한 정보(도메인 규칙, 도메인 값, TBR, 일치 규칙)를 기반으로 나열되지 않는 언어 데이터에 대한 중복을 정리하여 제거합니다. 나열되지 않는 언어 정리 및 일치에 대한 자세한 내용은 블로그 게시물 정리 및 일치에 대해 DQS에서 지원하는 언어를 참조하십시오.

맞춤법 검사기 설정

데이터 형식이 문자열인 경우 도메인에 대해 DQS 맞춤법 검사기를 설정하려면 클릭합니다. 맞춤법 검사기는 문자열 데이터 형식인 도메인에 대해서만 작동합니다. 맞춤법 검사기 사용 확인란은 확인란과 관련된 단일 도메인에 대해서만 맞춤법 검사기를 설정합니다. 복합 도메인에는 이 확인란이 적용되지 않습니다.

맞춤법 검사기는 도메인 값에 대한 구문 및 유효성 검사 수정 사항을 제안합니다. 자세한 내용은 DQS 맞춤법 검사기 사용을 참조하십시오.

구문 오류 알고리즘 해제

데이터 형식이 문자열인 경우 정리 작업 시 DQS에서 도메인의 구문 오류를 식별하지 않도록 지정하려면 선택합니다. 해당 도메인의 구문 오류 식별이 무의미한 경우 이 확인란을 선택합니다. 예를 들어 일련 번호의 경우 구문 오류 식별이 중요하지 않을 수 있습니다. 이 컨트롤은 문자열 데이터 형식에만 사용할 수 있습니다. DQS는 문자열이 아닌 데이터 형식에서 구문 오류를 검사하지 않습니다.

맨 위로 이동 링크와 함께 사용되는 화살표 아이콘[맨 위]