기본 데이터 마이닝 자습서

 

적용 대상: SQL Server 2016 Preview

Microsoft Analysis Services 기본 데이터 마이닝 자습서를 시작합니다. Microsoft SQL Server 는 데이터 마이닝 모델을 만들고 예측하기 위한 통합 환경을 제공합니다. 이 자습서에서는 시스템 학습을 사용하여 고객 구매 행동을 분석하고 예측하는 타겟 메일링 캠페인 시나리오를 완료합니다. 이 자습서에서는 가장 중요한 세 가지 데이터 마이닝 알고리즘인 클러스터링, 의사 결정 트리 및 Naive Bayes를 사용하는 방법을 보여 줍니다. 또한 마이닝 모델 뷰어를 사용하여 결과를 분석하는 방법과 Microsoft SQL Server Analysis Services에 포함된 데이터 마이닝 도구를 사용하여 예측과 정확도 차트를 만드는 방법도 알아봅니다. 모든 예에 가상 회사인 Adventure Works Cycles가 사용됩니다.

데이터 마이닝 도구를 사용 하는 것이 편한 경우도 완료 하는 것이 좋습니다는 중급 데이터 마이닝 자습서 및 #40; Analysis Services-데이터 마이닝 및 #41;합니다. 해당 단원에서는 예측, 시장 바구니 분석, 시계열, 연결 모델, 중첩 테이블 및 시퀀스 클러스터링을 사용하는 방법을 보여 줍니다.

자습서 시나리오

이 자습서에서는 사용자가 구매 기록을 기반으로 회사의 고객에 대해 학습한 다음 해당 기록 데이터를 사용하여 마케팅에 사용할 수 있는 예측을 만드는 태스크를 수행하는 Adventure Works Cycles 의 직원이라고 가정합니다. 이 회사는 이전에 데이터 마이닝을 수행한 적이 없기 때문에 사용자는 특히 데이터 마이닝을 위한 새 데이터베이스를 만들고 여러 데이터 마이닝 모델을 설정해야 합니다.

학습 내용

이 자습서에서는 여러 종류의 시스템 학습 방법을 만들고 작업하는 방법을 배웁니다. 또한 마이닝 모델의 복사본을 만들고 입력 데이터에 필터를 적용하여 여러 가지 결과를 얻는 방법도 알아봅니다. 이후에 리프트 차트를 사용하여 두 모델의 결과를 비교할 수 있습니다. 마지막으로 드릴스루를 사용하여 기본 마이닝 구조에서 추가 데이터를 검색합니다.

Microsoft Analysis Services 데이터 마이닝에는 여러 예측 모델을 쉽게 개발하고 비교한 다음 결과에 대해 조치를 취하는 데 도움이 되는 다음과 같은 기능이 포함됩니다.

  • 홀드 아웃 테스트 집합-를 학습 집합과 테스트 집합으로 마이닝 구조의 데이터를에서 나눌 수는 마이닝 구조를 만들 때. 이렇게 하면 비슷한 데이터 집합에서 모델을 테스트하고 관련 모델의 정확도를 비교할 수 있습니다.

  • 마이닝 모델 필터-마이닝 모델에 필터를 연결 하 고 학습 및 테스트 하는 동안 필터를 적용할 수 있습니다. 이렇게 하면 데이터의 여러 하위 집합을 기반으로 관련 모델을 쉽게 작성할 수 있습니다.

  • 구조 사례 및 구조 열으로 드릴스루 이제 쉽게 이동할 수 있습니다 마이닝 모델의 일반적인 패턴에서 데이터 원본의 조치 가능한 세부 정보로 합니다.

이 자습서는 다음 단원으로 이루어져 있습니다.

1 단원: Analysis Services 데이터베이스 ( 준비 기본 데이터 마이닝 자습서 및 #41;
이 단원에서는 새 Analysis Services 데이터베이스를 만들고 데이터 원본과 데이터 원본 뷰를 추가하며 데이터 마이닝에 사용할 새 데이터베이스를 준비하는 방법을 배웁니다.

2 단원: 대상된 메일 구조 ( 구축 기본 데이터 마이닝 자습서 및 #41;
이 단원에서는 대상 메일 시나리오의 일부로 사용할 수 있는 마이닝 모델 구조를 만드는 방법을 배웁니다.

3단원: 모델 추가 및 처리
이 단원에서는 구조에 모델을 추가하는 방법을 배웁니다. 사용자가 만드는 모델은 다음 알고리즘을 사용하여 생성됩니다.

  • Microsoft 의사 결정 트리

  • Microsoft 클러스터링

  • Microsoft Naive Bayes

4 단원: 대상된 메일 모델 ( 탐색 기본 데이터 마이닝 자습서 및 #41;
이 단원에서는 뷰어를 사용하여 각 모델의 결과를 탐색하고 해석하는 방법을 배웁니다.

5 단원: 모델 및 #40; 테스트 기본 데이터 마이닝 자습서 및 #41;
이 단원에서는 대상 메일 모델 중 하나의 복사본을 만들고, 마이닝 모델 필터를 추가하여 학습 데이터를 특정 고객 집합으로 제한한 다음 모델의 실행 가능성을 평가합니다.

6단원: 예측 만들기 및 작업(기본 데이터 마이닝 자습서)
기본 데이터 마이닝 자습서의 이 마지막 단원에서는 모델을 사용하여 자전거를 구매할 가능성이 가장 높은 고객을 예측합니다. 그런 다음 기본 사례로 드릴스루하여 연락처 정보를 얻습니다.

요구 사항

다음이 설치되어 있어야 합니다.

  • Microsoft SQL Server 2016

  • Microsoft SQL Server Analysis Services 다차원 모드에서

  • AdventureWorksDW2012 데이터베이스.

보안을 위해 예제 데이터베이스는 SQL Server과 함께 설치되지 않습니다. Microsoft SQL Server의 공식 데이터베이스를 설치하려면 Microsoft SQL 예제 데이터베이스 페이지에서 SQL Server 2016를 선택합니다.

관련 항목:

데이터 마이닝 솔루션
마이닝 모델 태스크 및 방법
DMX를 사용하여 데이터 마이닝 모델 만들기 및 쿼리: 자습서(Analysis Services - 데이터 마이닝)