조회 변환

적용 대상: Azure Data Factory의 SQL Server SSIS Integration Runtime

조회 변환은 입력 열의 데이터를 참조 데이터 세트의 열과 조인하여 조회를 수행합니다. 조회를 사용하여 공통 열의 값을 기반으로 하는 관련 테이블의 추가 정보에 액세스합니다.

참조 데이터 세트는 캐시 파일, 기존 테이블 또는 뷰, 새 테이블 또는 SQL 쿼리의 결과일 수 있습니다. 조회 변환은 OLE DB 연결 관리자 또는 캐시 연결 관리자를 사용하여 참조 데이터 세트에 연결합니다. 자세한 내용은 OLE DB 연결 관리자캐시 연결 관리자 참조하세요.

다음과 같은 방법으로 조회 변환을 구성할 수 있습니다.

  • 사용하려는 연결 관리자를 선택합니다. 데이터베이스에 연결하려면 OLE DB 연결 관리자를 선택합니다. 캐시 파일에 연결하려면 캐시 연결 관리자를 선택합니다.

  • 참조 데이터 세트가 포함된 테이블 또는 뷰를 지정합니다.

  • SQL 문을 지정하여 참조 데이터 세트를 생성합니다.

  • 입력과 참조 데이터 세트 간의 조인을 지정합니다.

  • 참조 데이터 세트의 열을 조회 변환 출력에 추가합니다.

  • 캐싱 옵션을 구성합니다.

조회 변환은 OLE DB 연결 관리자에 대해 다음 데이터베이스 공급자를 지원합니다.

  • SQL Server

  • Oracle

  • DB2

조회 변환은 변환 입력 값과 참조 데이터 세트 값 간에 동등 조인을 수행합니다. (등가 조인은 변환 입력의 각 행이 참조 데이터 세트에서 하나 이상의 행과 일치해야 함을 의미합니다.) 동등 조인을 사용할 수 없는 경우 조회 변환은 다음 작업 중 하나를 수행합니다.

  • 참조 데이터 세트에 일치하는 항목이 없으면 조인이 발생하지 않습니다. 기본적으로 조회 변환은 일치하는 항목이 없는 행을 오류로 간주합니다. 그러나 조회 변환을 구성하여 이러한 행을 일치 없음 출력으로 리디렉션할 수 있습니다.

  • 참조 테이블에 일치하는 항목이 여러 개 있을 경우 조회 변환은 조회 쿼리에서 반환된 첫 번째 일치 항목만 반환합니다. 일치하는 항목이 여러 개 있으면 조회 변환은 변환이 모든 참조 데이터 세트를 캐시에 로드하도록 구성된 경우에만 오류 또는 경고를 생성합니다. 이 경우 조회 변환은 변환이 캐시를 채울 때 여러 일치 항목을 검색할 때 경고를 생성합니다.

조인은 복합 조인일 수 있습니다. 즉, 변환 입력의 여러 열을 참조 데이터 세트의 열에 조인할 수 있습니다. 이 변환은 DT_R4, DT_R8, DT_TEXT, DT_NTEXT 또는 DT_IMAGE를 제외한 모든 데이터 형식의 조인 열을 지원합니다. 자세한 내용은 Integration Services 데이터 형식을 참조 하세요.

일반적으로 참조 데이터 세트의 값이 변환 출력에 추가됩니다. 예를 들어 조회 변환은 입력 열의 값을 사용하여 테이블에서 제품 이름을 추출한 다음 변환 출력에 제품 이름을 추가할 수 있습니다. 참조 테이블의 값은 열 값을 바꾸거나 새 열에 추가할 수 있습니다.

조회 변환에서 수행하는 조회는 대/소문자를 구분합니다. 데이터의 대/소문자 차이로 인해 발생하는 조회 오류를 방지하려면 먼저 문자 맵 변환을 사용하여 데이터를 대문자 또는 소문자로 변환합니다. 그런 다음 참조 테이블을 생성하는 SQL 문에 UPPER 또는 LOWER 함수를 포함합니다. 자세한 내용은 문자표 변환, UPPER(Transact-SQL)LOWER(Transact-SQL)를 참조하세요.

조회 변환에는 다음과 같은 입력 및 출력이 있습니다.

  • 입력.

  • 일치 항목 출력. 일치 출력은 참조 데이터 세트의 하나 이상의 항목과 일치하는 변환 입력의 행을 처리합니다.

  • 불일치 항목 출력. no match 출력은 참조 데이터 세트의 하나 이상의 항목과 일치하지 않는 입력의 행을 처리합니다. 일치하는 항목이 없는 행을 오류로 처리하도록 조회 변환을 구성하면 행이 오류 출력으로 리디렉션됩니다. 그렇지 않으면 변환에서 해당 행을 일치 없음 출력으로 리디렉션합니다.

  • 오류 출력입니다.

참조 데이터 세트 캐싱

메모리 내 캐시는 참조 데이터 세트를 저장하고 데이터를 인덱싱하는 해시 테이블을 저장합니다. 패키지 실행이 완료될 때까지 캐시가 메모리에 다시 기본. 캐시를 캐시 파일(.caw)로 저장할 수 있습니다.

캐시를 파일에 유지하면 시스템에서 캐시를 더 빠르게 로드합니다. 이렇게 하면 조회 변환 및 패키지의 성능이 향상됩니다. 캐시 파일을 사용하는 경우 데이터베이스의 데이터만큼 최신이 아닌 데이터로 작업합니다.

캐시를 파일에 유지할 경우의 추가 이점은 다음과 같습니다.

  • 여러 패키지에서 캐시 파일을 공유합니다. 자세한 내용은 캐시 연결 관리자를 사용하여 전체 캐시 모드에서 조회 변환 구현을 참조하세요.

  • 패키지를 사용하여 캐시 파일을 배포합니다. 그런 다음, 여러 컴퓨터에서 데이터를 사용할 수 있습니다. 자세한 내용은 조회 변환을 위한 캐시 만들기 및 배포를 참조하세요.

  • 원시 파일 원본을 사용하여 캐시 파일에서 데이터를 읽습니다. 그런 다음 다른 데이터 흐름 구성 요소를 사용하여 데이터를 변환하거나 이동할 수 있습니다. 자세한 내용은 원시 파일 원본을 참조 하세요.

    참고 항목

    캐시 연결 관리자는 원시 파일 대상을 사용하여 만들거나 수정한 캐시 파일을 지원하지 않습니다.

  • 파일 시스템 태스크를 사용하여 작업을 수행하고 캐시 파일에서 특성을 설정합니다. 자세한 내용은 파일 시스템 태스크를 참조하세요.

캐싱 옵션은 다음과 같습니다.

  • 참조 데이터 세트는 조회 변환이 실행되기 전에 테이블, 뷰 또는 SQL 쿼리를 사용하여 생성되고 캐시에 로드됩니다. OLE DB 연결 관리자를 사용하여 데이터 세트에 액세스합니다.

    이 캐싱 옵션은 SQL Server 2005 Integration Services(SSIS)의 조회 변환에 사용할 수 있는 전체 캐싱 옵션과 호환됩니다.

  • 참조 데이터 세트는 데이터 흐름의 연결된 데이터 원본 또는 캐시 파일에서 생성되며 조회 변환이 실행되기 전에 캐시에 로드됩니다. 캐시 연결 관리자 및 선택적으로 캐시 변환을 사용하여 데이터 세트에 액세스합니다. 자세한 내용은 Cache Connection ManagerCache Transform를 참조하세요.

  • 조회 변환이 실행되는 동안 테이블, 뷰 또는 SQL 쿼리를 사용하여 참조 데이터 세트가 생성됩니다. 참조 데이터 세트에 일치하는 항목이 있는 행과 데이터 세트의 일치하는 항목이 없는 행은 캐시에 로드됩니다.

    캐시의 메모리 크기를 초과하면 조회 변환은 캐시에서 가장 자주 사용되지 않는 행을 자동으로 제거합니다.

    이 캐싱 옵션은 SQL Server 2005 Integration Services(SSIS)의 조회 변환에 사용할 수 있는 부분 캐싱 옵션과 호환됩니다.

  • 조회 변환이 실행되는 동안 테이블, 뷰 또는 SQL 쿼리를 사용하여 참조 데이터 세트가 생성됩니다. 데이터가 캐시되지 않습니다.

    이 캐싱 옵션은 SQL Server 2005 Integration Services(SSIS)의 조회 변환에 사용할 수 있는 캐싱 없음 옵션과 호환됩니다.

Integration Services와 SQL Server는 문자열을 비교하는 방식이 다릅니다. 조회 변환이 조회 변환을 실행하기 전에 참조 데이터 세트를 캐시에 로드하도록 구성된 경우 Integration Services는 캐시에서 조회 비교를 수행합니다. 그렇지 않으면 조회 작업은 매개 변수가 있는 SQL 문을 사용하고 SQL Server는 조회 비교를 수행합니다. 이는 캐시 유형에 따라 조회 변환이 동일한 조회 테이블에서 다른 개수의 일치하는 항목을 반환할 수 있다는 것을 의미합니다.

SSIS 디자이너를 사용하거나 프로그래밍 방식으로 속성을 설정할 수 있습니다. 자세한 내용은 다음 항목을 참조하세요.

조회 변환 편집기(일반 페이지)

조회 변환 편집기 대화 상자의 일반 페이지를 사용하여 캐시 모드를 선택하고, 연결 유형을 선택하고, 일치하는 항목이 없는 행을 처리하는 방법을 지정합니다.

옵션

참고 항목

일치 출력은 전체 캐시 모드, 캐시 모드 없음 또는 부분 캐시 모드 사용 여부에 따라 다를 수 있습니다.

  • 전체 캐시 모드에서 데이터베이스는 데이터 흐름의 사전 실행 단계에서 한 번 쿼리되고 전체 참조 집합이 메모리로 끌어온다. 즉, 대/소문자를 구분하고 후행 공백에 민감하며 숫자의 정밀도 및 배율에 민감한 SSIS 엔진의 일치 규칙을 사용합니다.
  • 그러나 캐시 또는 부분 캐시 모드가 사용되지 않는 경우 사전 실행 단계에서는 캐싱이 수행되지 않습니다. 즉, 원본 데이터베이스의 일치 규칙을 사용합니다. 예를 들어 원본이 SQL Server 데이터베이스이고 열 데이터 정렬이 대/소문자를 구분하지 않는 경우 일치하는 규칙도 대/소문자를 구분하지 않아야 합니다.

전체 캐시
조회 변환이 실행되기 전에 참조 데이터 세트를 생성하고 캐시에 로드합니다.

부분 캐시
조회 변환을 실행하는 동안 참조 데이터 세트를 생성합니다. 참조 데이터 세트에 일치하는 항목이 있는 행과 데이터 세트에 일치하는 항목이 없는 행을 캐시에 로드합니다.

캐시 없음
조회 변환을 실행하는 동안 참조 데이터 세트를 생성합니다. 캐시에 데이터가 로드되지 않습니다.

캐시 연결 관리자
캐시 연결 관리자를 사용하도록 조회 변환을 구성합니다. 이 옵션은 전체 캐시 옵션을 선택한 경우에만 사용할 수 있습니다.

OLE DB 연결 관리자
조회 변환이 OLE DB 연결 관리자를 사용하도록 구성합니다.

일치하는 항목이 없는 행을 처리하는 방법 지정
참조 데이터 세트에서 하나 이상의 항목과 일치하지 않는 행을 처리하는 옵션을 선택합니다.

일치하는 출력이 없도록 행 리디렉션을 선택하면 행이 일치 없음 출력으로 리디렉션되고 오류로 처리되지 않습니다. 조회 변환 편집기 대화 상자의 오류 출력 페이지에서 오류 옵션을 사용할 수 없습니다.

일치하는 항목 목록 상자가 없는 행을 처리하는 방법 지정에서 다른 옵션을 선택하면 행이 오류로 처리됩니다. 오류 출력 페이지에 있는 오류 옵션을 사용할 수 있습니다.

외부 리소스

blogs.msdn.com의 블로그 항목 - 조회 캐시 모드

조회 변환 편집기(커넥트온 페이지)

조회 변환 편집기 대화 상자의 연결 페이지를 사용하여 연결 관리자를 선택할 수 있습니다. OLE DB 연결 관리자를 선택하는 경우 쿼리, 테이블 또는 뷰를 선택하여 참조 데이터 세트를 생성합니다.

옵션

조회 변환 편집기 대화 상자의 일반 페이지에서 전체 캐시캐시 연결 관리자선택할 때 사용할 수 있는 옵션은 다음과 같습니다.

캐시 연결 관리자
목록에서 기존 캐시 연결 관리자를 선택하거나 새로 만들기를 클릭하여 새 연결을 만듭니다.

New
캐시 연결 관리자 편집기 대화 상자를 사용하여 새 연결을 만듭니다.

다음 옵션은 조회 변환 편집기 대화 상자의 일반 페이지에서 전체 캐시, 부분 캐시 또는 캐시 없음 및 OLE DB 연결 관리자선택할 때 사용할 수 있습니다.

OLE DB 연결 관리자
목록에서 기존 OLE DB 연결 관리자를 선택하거나 새로 만들기를 클릭하여 새 연결을 만듭니다.

New
OLE DB 연결 관리자 구성 대화 상자를 사용하여 새 연결을 만듭니다.

테이블 또는 뷰 사용
목록에서 기존 테이블 또는 뷰를 선택하거나 새로 만들기를 클릭하여 새 테이블을 만듭니다.

참고 항목

조회 변환 편집기고급페이지에서 SQL 문을 지정하는 경우 해당 SQL 문이 여기서 선택한 테이블 이름을 재정의하고 대체합니다. 자세한 내용은 조회 변환 편집기(고급 페이지)를 참조하세요.

New
테이블 만들기 대화 상자를 사용하여 새 테이블을 만듭니다.

SQL 쿼리 결과 사용
기존 쿼리로 이동하고, 새 쿼리를 작성하고, 쿼리 구문을 검사 쿼리 결과를 미리 보려면 이 옵션을 선택합니다.

빌드 쿼리
데이터를 찾아보는 방법으로 쿼리를 만드는 데 사용되는 그래픽 도구인 쿼리 작성기를 사용하여 실행할 Transact-SQL 문을 만듭니다.

찾아보기
이 옵션을 사용하여 파일로 저장된 기존 쿼리를 찾습니다.

쿼리 구문 분석
쿼리의 구문을 확인합니다.

미리 보기
쿼리 결과 미리 보기 대화 상자를 사용하여 결과를 미리 봅니다. 이 옵션은 최대 200개의 행을 표시합니다.

외부 리소스

blogs.msdn.com의 블로그 항목 - 조회 캐시 모드

조회 변환 편집기(열 페이지)

조회 변환 편집기 대화 상자의 페이지를 사용하여 원본 테이블과 참조 테이블 간의 조인을 지정하고 참조 테이블에서 조회 열을 선택할 수 있습니다.

옵션

사용 가능한 입력 열
사용 가능한 입력 열 목록을 표시합니다. 입력 열은 연결된 원본의 데이터 흐름에 있는 열입니다. 입력 열 및 조회 열에는 일치하는 데이터 형식이 있어야 합니다.

끌어서 놓기 작업을 사용하여 사용 가능한 입력 열을 조회 열에 매핑합니다.

또한 키보드로 사용 가능한 입력 열 테이블의 열을 강조 표시하고 애플리케이션 키를 누른 다음 매핑 편집을 클릭하여 입력 열을 조회 열에 매핑할 수도 있습니다.

사용 가능한 조회 열
조회 열 목록을 봅니다. 조회 열은 입력 열과 일치하는 값을 조회하려는 참조 테이블의 열입니다.

끌어서 놓기 작업을 사용하여 사용 가능한 조회 열을 입력 열에 매핑합니다.

검사 상자를 사용하여 조회 작업을 수행할 참조 테이블에서 조회 열을 선택합니다.

사용 가능한 조회 열 테이블의 열을 강조 표시하고 애플리케이션 키를 누른 다음 매핑 편집을 클릭하여 키보드를 사용하여 조회 열을 입력 열에 매핑할 수도 있습니다.

조회 열
선택한 조회 열을 표시합니다. 선택 내용에 따라 사용 가능한 조회 열 테이블의 확인란이 달라집니다.

조회 작업
조회 열에서 수행할 조회 작업을 목록에서 선택합니다.

출력 별칭
각 조회 열에 대한 출력의 별칭을 입력합니다. 기본값은 조회 열의 이름입니다. 그러나 고유한 설명이 포함된 이름을 선택할 수 있습니다.

조회 변환 편집기(고급 페이지)

조회 변환 편집기 대화 상자의 고급 페이지를 사용하여 부분 캐싱을 구성하고 조회 변환에 대한 SQL 문을 수정할 수 있습니다.

옵션

캐시 크기(32비트)
32비트 컴퓨터의 캐시 크기(MB)를 조정합니다. 기본값은 5MB입니다.

캐시 크기(64비트)
64비트 컴퓨터의 캐시 크기(MB)를 조정합니다. 기본값은 5MB입니다.

일치하는 항목이 없는 행에 캐시 사용
참조 데이터 세트에 일치하는 항목이 없는 행을 캐시합니다.

캐시에서 할당
참조 데이터 세트에 일치하는 항목이 없는 행에 할당할 캐시의 백분율을 지정합니다.

SQL 문 수정
참조 데이터 세트를 생성하는 데 사용되는 SQL 문을 수정합니다.

참고 항목

이 페이지에서 지정한 선택적 SQL 문은 조회 변환 편집기의 커넥트 페이지에서 지정한 테이블 이름을 재정의하고 바꿉니다. 자세한 내용은 조회 변환 편집기(연결 페이지)를 참조하세요.

매개 변수 설정
쿼리 매개 변수 설정 대화 상자를 사용하여 입력 열을 매개 변수에 매핑합니다.

외부 리소스

blogs.msdn.com의 블로그 항목 - 조회 캐시 모드

참고 항목

유사 항목 조회 변환
용어 조회 변환
데이터 흐름
Integration Services 변환