중급 데이터 마이닝 자습서(Analysis Services - 데이터 마이닝)

MicrosoftAnalysis Services는 데이터 마이닝 모델을 만들고 작업하기 위한 통합 환경을 제공합니다. 데이터 원본에 쉽게 바인딩하고, 여러 모델을 만들어 같은 데이터에 대해 테스트하고, 예측 분석에 사용할 모델을 배포할 수 있습니다.

기본 데이터 마이닝 자습서에서는 Business Intelligence Development Studio를 사용하여 데이터 마이닝 솔루션을 만드는 방법을 학습하고, 고객 구매 행동을 분석하고 잠재적인 구매자를 대상으로 하는 대상 메일 캠페인을 지원하는 3개의 모델을 작성했습니다.

이 자습서에서는 기본 데이터 마이닝 자습서에서 소개한 마이닝 모델 뷰어 및 데이터 마이닝 도구에 대해 설명합니다. 이 중급 자습서는 이러한 기본 자습서를 기반으로 작성되었으며 예측 및 장바구니 분석을 비롯하여 여러 가지 새로운 시나리오를 소개합니다. 시계열 모델, 연결 모델 및 시퀀스 클러스터링 모델을 만드는 방법에 대해 설명합니다. 또한 모델에서 중첩 테이블을 사용하고 중첩 테이블에 필터를 만드는 방법에 대해 설명합니다.

모든 시나리오는 AdventureWorksDW2008 데이터 원본을 사용하지만 시나리오마다 다른 데이터 원본 뷰를 만듭니다. 데이터 원본을 먼저 만들면 순서에 관계없이 단원을 학습할 수 있습니다.

단원은 독립적이며 별도로 완료할 수 있습니다.

단원 시나리오

대상 메일 캠페인이 성공하면 비즈니스 계획에 사용하기 위해 여러 새로운 모델을 개발하는 데 학습한 데이터 마이닝 정보를 적용할 것인지 묻는 메시지가 표시됩니다. 여기에는 다음과 같은 새로운 모델 유형이 포함됩니다.

  • 전세계의 여러 지역에서 제품 판매를 예측하는 시계열 모델. 각 지역에 대한 개별 모델과 교차 예측에 사용할 수 있는 일반 모델을 개발합니다.

  • Adventure Works Cycles 전자 상거래 사이트를 방문하는 동안 구매한 제품 그룹을 분석하는 연결 모델. 이 장바구니 모델을 기반으로 하여 고객에게 제품을 권장할 수 있습니다.

  • 고객이 제품을 구매한 순서를 분석하는 시퀀스 클러스터링 모델. 이 모델을 기반으로 하여 웹 사이트 디자인 또는 새 제품의 변경 사항을 계획할 수 있습니다.

학습 내용

이 자습서에서는 여러 유형의 데이터 마이닝 알고리즘을 만들고 작업하는 방법에 대해 설명합니다. 이 자습서에서는 다음 개념도 설명합니다.

  • 중첩 테이블을 사용하여 모델 작성

  • 중첩 테이블 키, 시계열 키 또는 시퀀스 키 선택

  • 모델을 만들거나 예측을 수행할 때 중첩 테이블 필터링

  • 모델을 지원할 데이터가 충분한지 판단

  • 일반 모델을 작성하여 여러 데이터 집합에 적용

이 자습서는 다음 단원으로 이루어져 있습니다.

요구 사항

다음이 설치되어 있어야 합니다.

  • MicrosoftSQL Server 2008

  • MicrosoftSQL ServerAnalysis Services

  • AdventureWorks DW2008 데이터베이스가 있는 SQL Server

보안을 위해 예제 데이터베이스는 기본적으로 설치되지 않습니다. MicrosoftSQL Server의 공식 데이터베이스를 설치하려면 Microsoft SQL Sample Databases 페이지에서 AdventureWorksDW2008을 선택합니다.

[!참고]

문서 뷰어 도구 모음에 다음 항목 단추 및 이전 항목 단추를 추가하면 단계의 앞뒤로 편리하게 이동할 수 있어 자습서를 더 쉽게 진행할 수 있습니다. 자세한 내용은 도움말에 다음 및 이전 단추 추가를 참조하십시오.