필터링된 모델 테스트(기본 데이터 마이닝 자습서)

TM_Decision_Tree 모델이 가장 정확한 모델임을 확인했으므로 Adventure Works Cycles 타겟 메일링 캠페인의 맥락에서 해당 모델을 평가해야 합니다. Adventure Works Cycles 마케팅 부서에서는 남성 자전거 구매 고객과 여성 자전거 구매 고객 간에 차이점이 있는지 파악하려고 합니다. 이러한 마케팅 부서에서 이 정보를 사용하면 광고를 게재할 잡지와 메일에서 특별히 홍보할 제품을 쉽게 결정할 수 있습니다.

이 단원에서는 성별로 필터링되는 모델을 만듭니다. 그러면 해당 모델의 복사본을 쉽게 만들고, 필터 조건만 변경하여 다른 성을 기반으로 하는 새 모델을 생성할 수 있습니다.

필터에 대한 자세한 내용은 마이닝 모델에 대한 필터(Analysis Services - 데이터 마이닝)를 참조하십시오.

필터 사용

필터링을 사용하면 데이터의 하위 집합을 기반으로 하는 모델을 쉽게 만들 수 있습니다. 필터는 모델에만 적용되고 기본 데이터 원본을 변경하지는 않습니다. 중첩 테이블에 필터를 적용하는 방법은 중급 데이터 마이닝 자습서(Analysis Services - 데이터 마이닝)를 참조하십시오.

사례 테이블에 대한 필터

먼저 TM_Decision_Tree 모델의 복사본을 만듭니다.

의사 결정 트리 모델을 복사하려면

  1. SQL Server Data Tools(SSDT)의 솔루션 탐색기에서 BasicDataMining을 선택합니다.

  2. 마이닝 모델 탭을 클릭합니다.

  3. TM_Decision_Tree 모델을 마우스 오른쪽 단추로 클릭하고 새 마이닝 모델을 선택합니다.

  4. 모델 이름 필드에 TM_Decision_Tree_Male을 입력합니다.

  5. 확인을 클릭합니다.

다음으로 해당 성을 기반으로 하는 모델에 대한 고객을 선택하는 필터를 만듭니다.

마이닝 모델에 사례 필터를 만들려면

  1. TM_Decision_Tree_Male 마이닝 모델을 마우스 오른쪽 단추로 클릭하여 바로 가기 메뉴를 엽니다.

    - 또는 -

    모델을 선택합니다. 마이닝 모델 메뉴에서 모델 필터 설정을 선택합니다.

  2. 모델 필터 대화 상자의 마이닝 구조 열 입력란에서 표의 첫 행을 클릭합니다.

    드롭다운 목록에서 해당 테이블에 있는 열의 이름만 표시합니다.

  3. 마이닝 구조 열 입력란에서 성별을 선택합니다.

    입력란의 왼쪽에 있는 아이콘이 변경되어 선택한 항목이 테이블인지 또는 열인지를 나타냅니다.

  4. 연산자 입력란을 클릭하고 목록에서 같음(=) 연산자를 선택합니다.

  5. 입력란을 클릭하고 M을 입력합니다.

  6. 표에서 다음 행을 클릭합니다.

  7. 확인을 클릭하여 모델 필터 대화 상자를 닫습니다.

    속성 창에 필터가 표시됩니다. 또는 속성 창에서 모델 필터 대화 상자를 시작할 수 있습니다.

  8. 위 단계를 반복하지만 이번에는 모델 이름을 TM_Decision_Tree_Female로 지정하고 입력란에 F를 입력합니다.

이제 마이닝 모델 탭에 두 개의 새 모델이 표시됩니다.

필터링된 모델 처리

모델은 배포 및 처리될 때까지 사용할 수 없습니다. 모델 처리 방법은 대상 메일 구조에서 모델 처리(기본 데이터 마이닝 자습서)를 참조하십시오.

필터링된 모델을 처리하려면

  1. TM_Decision_Tree_Male 모델을 마우스 오른쪽 단추로 클릭하고 마이닝 구조 및 모든 모델 처리를 선택합니다.

  2. 실행을 클릭하여 새 모델을 처리합니다.

  3. 처리가 완료된 후 두 처리 창에서 닫기를 클릭합니다.

결과 평가

이전 세 개의 모델에 대해 수행했던 방식과 거의 동일한 방식으로 결과를 검토하고 필터링된 모델의 정확도를 평가합니다. 자세한 내용은 다음 항목을 참조하십시오.

의사 결정 트리 모델 탐색(기본 데이터 마이닝 자습서)

리프트 차트를 사용하여 정확도 테스트(기본 데이터 마이닝 자습서)

필터링된 모델을 탐색하려면

  1. 데이터 마이닝 디자이너에서 마이닝 모델 뷰어 탭을 선택합니다.

  2. 마이닝 모델 상자에서 TM_Decision_Tree_Male을 선택합니다.

  3. 수준 표시 슬라이더를 3으로 이동합니다.

  4. 배경 값을 1로 변경합니다.

  5. 레이블이 모두인 노드 위에 커서를 두고 자전거 구매자와 자전거 비구매자의 수를 확인합니다.

  6. TM_Decision_Tree_Female에 대해 1-5단계를 반복합니다.

  7. TM_Decision_Tree에 대한 결과 및 성별에 대해 필터링된 모델을 탐색합니다. 모든 자전거 구매자와 비교해 볼 때 남성 자전거 구매자와 여성 자전거 구매자는 필터링되지 않은 자전거 구매자와 동일한 특징을 일부 공유하지만 이 세 범주의 구매자에게는 흥미로운 차이점도 있습니다. 이는 Adventure Works Cycles에서 마케팅 캠페인을 개발할 때 사용할 수 있는 유용한 정보입니다.

필터링된 모델의 리프트를 테스트하려면

  1. SQL Server Data Tools(SSDT) 데이터 마이닝 디자이너의 마이닝 정확도 차트 탭으로 전환하고 입력 선택 탭을 선택합니다.

  2. 정확도 차트에 사용할 데이터 집합을 선택하십시오 그룹 상자에서 마이닝 구조 테스트 사례 사용을 선택합니다.

  3. 데이터 마이닝 디자이너의 입력 선택 탭에 있는 리프트 차트에 표시할 예측 가능한 마이닝 모델 열 선택에서 예측 열과 값 동기화 확인란을 선택합니다.

  4. 예측 가능한 열 이름 열에서 각 모델에 대해 Bike Buyer를 선택했는지 확인합니다.

  5. 표시 열에서 각 모델을 선택합니다.

  6. 예측 값 열에서 1을 선택합니다.

  7. 리프트 차트 탭을 선택하여 리프트 차트를 표시합니다.

    세 가지 의사 결정 트리 모델은 모두 임의 추측 모델과 비교했을 때 유효한 리프트를 제공할 뿐만 아니라 클러스터링 및 Naive-Bayes 모델보다 성능이 뛰어납니다.

단원의 이전 태스크

리프트 차트를 사용하여 정확도 테스트(기본 데이터 마이닝 자습서)

다음 단원

6단원: 예측 만들기 및 작업(기본 데이터 마이닝 자습서)

참고 항목

태스크

마이닝 모델에서 필터 삭제

개념

중급 데이터 마이닝 자습서(Analysis Services - 데이터 마이닝)

마이닝 모델에 대한 필터(Analysis Services - 데이터 마이닝)

관련 자료

마이닝 모델 태스크 및 방법