중급 데이터 마이닝 자습서(Analysis Services - 데이터 마이닝)

 

적용 대상: SQL Server 2016 Preview

Microsoft Analysis Services 는 데이터 마이닝 모델을 만들고 작업하기 위한 통합 환경을 제공합니다. 데이터 원본에 쉽게 바인딩하고, 여러 모델을 만들어 같은 데이터에 대해 테스트하고, 예측 분석에 사용할 모델을 배포할 수 있습니다.

기본 데이터 마이닝 자습서에서는 SQL Server Data Tools(SSDT) 를 사용하여 데이터 마이닝 솔루션을 만드는 방법을 학습하고, 고객 구매 행동을 분석하고 잠재적인 구매자를 대상으로 하는 타겟 메일링 캠페인을 지원하는 3개의 모델을 작성했습니다.

이 중급 자습서는 이러한 기본 자습서를 기반으로 작성되었으며 예측 및 시장 바구니 분석과 같은 일반적인 비즈니스 요구 사항을 포함하여 여러 가지 새로운 시나리오를 소개합니다. 시계열 모델, 연결 모델 및 시퀀스 클러스터링 모델을 만드는 방법에 대해 설명합니다. 마지막으로 신경망을 사용하여 데이터의 상관 관계를 탐색하는 방법과 로지스틱 회귀를 사용하여 예측하는 방법을 배웁니다.

단원은 독립적이며 별도로 완료할 수 있습니다.

다음 자습서를 완료하려면 기본 데이터 마이닝 자습서에서 소개한 마이닝 모델 뷰어 및 데이터 마이닝 도구에 익숙해야 합니다.

모든 시나리오는 AdventureWorksDW2012 데이터 원본을 사용하지만 시나리오마다 다른 데이터 원본 뷰를 만듭니다. 데이터 원본을 먼저 만들면 순서에 관계없이 단원을 학습할 수 있습니다.

단원 시나리오

타겟 메일링 캠페인이 성공하면 비즈니스 계획에 사용하기 위해 여러 새로운 모델을 개발하는 데 학습한 데이터 마이닝 정보를 적용할 것인지 묻는 메시지가 표시됩니다. 다음과 같은 태스크가 있습니다.

  • 예측: 전세계 여러 지역에서 제품 판매를 예측하는 시계열 모델을 만듭니다. 각 지역에 대해 개별 모델을 개발 하 고 사용 하는 방법에 알아봅니다 됩니다 교차 예측합니다.

  • 시장 바구니 분석: 만듭니다는 연결 모델, 그룹 방문 하는 동안 구매한 제품을 분석 하는 Adventure Works Cycles 전자 상거래 사이트입니다. 이 시장 바구니 모델을 기반으로 하여 고객에게 제품을 권장할 수 있습니다.

  • 시퀀스 분석: 고객이 제품을 구매한 순서를 분석하는 시퀀스 클러스터링 모델을 작성합니다. 이 모델을 기반으로 하여 웹 사이트 디자인 또는 새 제품의 변경 사항을 계획할 수 있습니다.

  • 요소 분석: 신경망 모델을 사용하여 콜 센터 데이터에서 서비스 품질 불량의 가능한 원인을 탐색합니다. 예비 모델이 나타내는 정보를 기반으로 사용자 환경을 개선하기 위한 전략을 예측하는 로지스틱 회귀 모델 을 만듭니다.

학습 내용

이 자습서에서는 여러 유형의 데이터 마이닝 알고리즘을 만들고 작업하는 방법에 대해 설명합니다. 이 자습서는 다음 단원으로 이루어져 있습니다.

1 단원: 중간 데이터 마이닝 솔루션 ( 중급 데이터 마이닝 자습서 ) 만들기
이 단원에서는 여러 가지 새로운 데이터 원본 뷰 및 기타 여러 마이닝 모델을 지원할 AdventureWorksDW2012 데이터베이스를 기반으로 새 프로젝트를 만듭니다.

2 단원: 예측 시나리오 ( 중급 데이터 마이닝 자습서 ) 구축
이 단원에서는 예측 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. 또한 Microsoft 시계열 알고리즘으로 작성한 마이닝 모델을 탐색합니다.

각 지역에 대한 개별 모델과 교차 예측에 사용할 수 있는 일반 모델을 작성합니다.

3단원: 시장 바구니 시나리오 구축(중급 데이터 마이닝 자습서)
이 단원에서는 새 데이터 원본 뷰를 추가한 다음 중첩 테이블과 키 사용 방법에 대해 설명합니다. 이 데이터를 기반으로 시장 바구니 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. 또한 Microsoft 연결 알고리즘으로 작성한 마이닝 모델을 탐색합니다.

4 단원: 시퀀스 클러스터링 시나리오 ( 중급 데이터 마이닝 자습서 ) 구축
이 단원에서는 시퀀스 클러스터링 시나리오의 일부로 사용할 수 있는 마이닝 모델을 만듭니다. Microsoft 시퀀스 클러스터링 알고리즘으로 구축된 마이닝 모델을 탐색하는 방법도 배웁니다.

5단원: 신경망 및 로지스틱 회귀 모델 작성(중급 데이터 마이닝 자습서)
이 단원에서는 Microsoft 신경망 및 Microsoft 로지스틱 회귀 알고리즘을 사용하여 여러 관련된 마이닝 모델을 만듭니다. 또한 데이터 원본 뷰를 사용하여 모델의 기본이 되는 데이터를 탐색하는 방법도 배웁니다.

요구 사항

다음이 설치되어 있어야 합니다.

  • Microsoft SQL Server 2016

  • Microsoft SQL Server Analysis Services

  • SQL Server 데이터베이스가 있는 AdventureWorksDW2012

보안을 위해 예제 데이터베이스는 기본적으로 설치되지 않습니다. Microsoft SQL Server의 공식 데이터베이스를 설치하려면 Microsoft SQL 예제 데이터베이스 페이지를 방문하고 해당 버전의 예제 데이터베이스를 선택합니다.

관련 항목:

기본 데이터 마이닝 자습서
Bike Buyer DMX 자습서
Market Basket DMX 자습서