데이터 마이닝과 함께 Integration Services 사용

데이터 마이닝을 흔히 동작 가능한 유효 정보를 큰 데이터베이스에서 추출하는 프로세스라고 설명합니다. 즉, 데이터 마이닝은 데이터에서 패턴 및 추세를 찾는 데 도움을 줍니다. Microsoft SQL ServerAnalysis Services는 이러한 패턴을 추출 및 분석하기 위한 강력한 데이터 마이닝 기능과 도구를 제공합니다. Integration Services는 이러한 데이터 마이닝 모델의 관리 및 쿼리를 지원하기 위한 다양한 구성 요소를 제공합니다.

SQL ServerAnalysis Services의 데이터 마이닝 기능에 대한 자세한 내용은 개요(Analysis Services - 데이터 마이닝)데이터 마이닝 프로젝트(Analysis Services - 데이터 마이닝)을 참조하십시오.

[!참고]

이 항목에 설명된 일부 Integration Services 구성 요소는 SQL Server Enterprise Edition 및 Developer Edition에서만 사용할 수 있습니다.

연결 관리자

연결 관리자는 데이터 원본에 대한 연결을 논리적으로 나타낸 것입니다. Analysis Services 연결 관리자를 사용하여 마이닝 구조 및 모델이 저장되는 Analysis Services 데이터베이스에 연결할 수 있습니다. 이 항목에 설명된 모든 태스크와 데이터 흐름 구성 요소에는 Analysis Services 연결 관리자가 필요합니다.

Analysis Services 연결 관리자

Analysis Services 연결 관리자를 사용하면 패키지에서 Analysis Services 데이터베이스를 실행하는 서버 또는 마이닝 구조 및 모델에 대한 액세스를 제공하는 Analysis Services 프로젝트에 연결할 수 있습니다. Business Intelligence Development Studio에서 패키지를 개발하는 동안에는 Analysis Services 프로젝트에만 연결할 수 있습니다. 런타임에는 사용자가 Analysis Services를 배포하는 서버 및 데이터베이스에 패키지가 연결됩니다.

자세한 내용은 Analysis Services 연결 관리자를 참조하십시오.

태스크

태스크는 패키지에서 수행되는 작업 단위를 정의하는 제어 흐름 요소입니다. 다음 태스크를 사용하여 데이터 마이닝 구조나 모델을 생성 또는 수정하고 모델을 처리 또는 쿼리할 수 있습니다.

Analysis Services DDL 실행 태스크

Analysis Services DDL 실행 태스크는 마이닝 구조와 모델을 생성, 삭제 또는 변경할 수 있는 DDL(데이터 정의 언어) 문을 실행합니다. DDL 문은 ASSL(Analysis Services Scripting Language) 문으로 표현되고 XMLA(XML for Analysis) 명령에 포함됩니다.

이 태스크에 대한 자세한 내용은 Analysis Services DDL 실행 태스크를 참조하십시오. XMLA를 사용하여 Analysis Services 개체를 생성 및 변경하는 방법은 개체 만들기 및 변경(XMLA)을 참조하십시오.

Analysis Services 처리 태스크

Analysis Services 처리 태스크는 마이닝 모델과 같은 Analysis Services 개체의 처리를 자동화합니다.

이 태스크에 대한 자세한 내용은 Analysis Services 처리 태스크를 참조하십시오. Analysis Services 개체를 처리하는 방법은 Analysis Services 개체 처리를 참조하십시오.

데이터 마이닝 쿼리 태스크

데이터 마이닝 쿼리 태스크는 Analysis Services에서 작성된 데이터 마이닝 모델을 기반으로 예측 쿼리를 실행합니다. 예측 쿼리는 마이닝 모델을 사용하여 새 데이터에 대한 예측을 만들고 해당 출력을 테이블에 저장합니다.

이 태스크에 대한 자세한 내용은 데이터 마이닝 쿼리 태스크을 참조하십시오. DMX를 사용하여 데이터 마이닝 모델을 쿼리하는 방법은 DMX 예측 쿼리 만들기를 참조하십시오.

데이터 흐름 변환

변환은 패키지의 데이터 흐름에서 데이터를 집계, 병합, 배포 및 수정하는 구성 요소입니다.

데이터 마이닝 쿼리 변환

데이터 마이닝 쿼리 변환은 데이터 마이닝 모델과 비교해서 예측 쿼리를 수행합니다. 이 변환에는 DMX(Data Mining Extensions) 쿼리를 만들기 위한 쿼리 작성기가 포함되어 있습니다. 쿼리 작성기를 사용하면 DMX 언어를 사용하는 기존 마이닝 모델과 비교해서 변환 입력 데이터를 평가하는 사용자 지정 문을 만들 수 있습니다. 출력을 테이블에 직접 저장하는 데이터 마이닝 쿼리 태스크와 달리 데이터 마이닝 쿼리 변환은 패키지 데이터 흐름의 다운스트림 구성 요소에 해당 출력을 사용할 수 있게 합니다.

이 변환에 대한 자세한 내용은 데이터 마이닝 쿼리 변환을 참조하십시오. DMX를 사용하여 데이터 마이닝 모델을 쿼리하는 방법은 DMX 예측 쿼리 만들기를 참조하십시오.

데이터 흐름 대상

대상은 데이터 흐름의 출력을 다른 유형의 데이터 원본으로 로드하거나 메모리 내 데이터 집합을 만드는 데이터 흐름 구성 요소입니다.

데이터 마이닝 모델 학습 대상

데이터 마이닝 모델 학습 대상은 데이터 마이닝 모델 알고리즘을 통해 대상에서 수신하는 데이터를 전달함으로써 데이터 마이닝 모델을 학습합니다. 학습 프로세스 진행 중 이 알고리즘은 데이터 요소 간의 패턴과 관계를 계산합니다. 새 마이닝 모델의 성향을 습득한 후에는 모델을 사용하여 예측 쿼리를 실행할 수 있습니다.

자세한 내용은 데이터 마이닝 모델 학습 대상을 참조하십시오.

데이터 마이닝을 위한 다른 Integration Services 구성 요소

Integration Services에는 데이터 마이닝 솔루션의 일부로 유용할 수 있는 여러 다른 구성 요소가 있습니다.

  • 데이터 하위 집합을 가진 데이터 마이닝 모델에 대한 학습 또는 테스트를 수행하려면 다음을 사용합니다.

    • **행 샘플링 변환.   **지정한 개수를 기준으로 행의 하위 집합만 복사합니다. 자세한 내용은 행 샘플링 변환을 참조하십시오.

    • **비율 샘플링 변환.   **지정한 비율을 기준하여 행의 하위 집합만 복사합니다. 자세한 내용은 비율 샘플링 변환을 참조하십시오.

  • 중복 항목을 제거하고 값을 표준화하여 데이터를 정리하려면 다음을 사용합니다.

  • 텍스트 마이닝을 수행하려면 다음을 사용합니다.

    • **용어 추출 변환.   **표준 및 사용자 정의된 의미 없는 단어를 필터링한 후에 원본에서 검색된 용어의 테이블을 만듭니다. 자세한 내용은 용어 추출 변환을 참조하십시오.

    • **용어 조회 변환.   **입력 용어를 참조 테이블의 용어와 일치시킵니다. 자세한 내용은 용어 조회 변환을 참조하십시오.

Integration Services 아이콘(작은 아이콘) Integration Services 관련 최신 정보 얻기

Microsoft의 최신 다운로드, 아티클, 예제 및 비디오와 커뮤니티의 정선된 솔루션을 보려면 MSDN 또는 TechNet의 Integration Services 페이지를 방문하십시오.

이러한 업데이트에 대한 자동 알림을 받으려면 해당 페이지에서 제공하는 RSS 피드를 구독하십시오.