예측 만들기(기본 데이터 마이닝 자습서)

마이닝 모델의 정확도를 테스트하여 만족했으면 데이터 마이닝 디자이너의 마이닝 모델 예측 탭에서 예측 쿼리 작성기를 사용하여 DMX(Data Mining Extensions) 예측 쿼리를 만들 수 있습니다.

예측 쿼리 작성기에는 세 가지 뷰가 있습니다. 디자인쿼리 뷰를 사용하여 쿼리를 작성하고 검사할 수 있습니다. 그런 다음 쿼리를 실행하고 결과 뷰에서 결과를 볼 수 있습니다.

예측 쿼리 작성기를 사용하는 방법은 DMX 예측 쿼리 만들기를 참조하십시오.

쿼리 만들기

예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델과 입력 테이블을 선택하는 것입니다.

모델과 입력 테이블을 선택하려면

  1. 데이터 마이닝 디자이너의 마이닝 모델 예측 탭에 있는 마이닝 모델 상자에서 모델 선택을 클릭합니다.

  2. 마이닝 모델 선택 대화 상자에 있는 트리에서 Targeted Mailing 구조로 이동하여 구조를 확장하고 TM_Decision_Tree를 선택한 다음 확인을 클릭합니다.

  3. 입력 테이블 선택 상자에서 사례 테이블 선택을 클릭합니다.

  4. 테이블 선택 대화 상자의 데이터 원본 목록에서 Adventure Works DW2008R2를 선택합니다.

  5. 테이블/뷰 이름에서 ProspectiveBuyer (dbo) 테이블을 선택한 다음 확인을 클릭합니다.

    ProspectiveBuyer 테이블은 vTargetMail 사례 테이블과 가장 비슷합니다.

열 매핑

입력 테이블을 선택하면 열 이름을 기반으로 마이닝 모델과 입력 테이블 간에 기본 매핑이 만들어집니다. 구조의 열 중 적어도 하나 이상의 열이 외부 데이터의 열과 일치해야 합니다.

중요 정보중요

모델의 정확도를 결정하는 데 사용하는 데이터에는 예측 가능한 열에 매핑될 수 있는 열이 포함되어 있어야 합니다.

구조 열을 입력 테이블 열에 매핑하려면

  1. 마이닝 모델 창을 입력 테이블 선택 창에 연결하는 선을 마우스 오른쪽 단추로 클릭하고 연결 수정을 선택합니다.

    모든 열이 매핑되지는 않았습니다. 여러 테이블 열에 대한 매핑을 추가합니다.

  2. 테이블 열 아래에서 Bike Buyer 셀을 클릭하고 드롭다운에서 ProspectiveBuyer.Unknown을 선택합니다.

    이는 예측 가능한 열인 [Bike Buyer]를 입력 테이블 열에 매핑합니다.

  3. 확인을 클릭합니다.

  4. 솔루션 탐색기에서 Targeted Mailing 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭하고 뷰 디자이너를 선택합니다.

  5. ProspectiveBuyer 테이블 제목을 마우스 오른쪽 단추로 클릭하고 새 명명된 계산을 선택합니다.

  6. 이름 상자에 calcAge를 입력합니다.

  7. 상자에 DATEDIFF(YYYY,[BirthDate],getdate())를 입력한 다음 확인을 클릭합니다.

    입력 테이블에 해당하는 Age 열이 없습니다. 이 식은 입력 테이블 BirthDate 열에서 고객 나이를 계산합니다. Age가 자전거 구매 예측에 가장 큰 영향을 주는 열로 식별되었으므로 모델과 입력 테이블에 모두 있어야 합니다.

  8. 데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 선택하고 연결 수정 창을 다시 엽니다.

  9. 테이블 열 아래에서 Age 셀을 클릭하고 드롭다운에서 ProspectiveBuyer.calcAge를 선택합니다.

  10. 확인을 클릭합니다.

예측 쿼리 디자인

예측 쿼리를 디자인하려면

  1. 마이닝 모델 예측 탭의 도구 모음에 있는 첫 번째 단추는 디자인 뷰로 전환/결과 뷰로 전환/쿼리 뷰로 전환 단추입니다. 이 단추의 아래쪽 화살표를 클릭하고 디자인을 선택합니다.

  2. 마이닝 모델 예측 탭의 표에 있는 원본 열에서 첫 번째 빈 행의 셀을 클릭한 다음 예측 함수를 선택합니다.

    이렇게 하면 PredictProbability 함수의 대상 열이 지정됩니다. 함수에 대한 자세한 내용은 DMX(Data Mining Extensions) 함수 참조를 참조하십시오.

  3. 예측 함수 행의 필드 열에서 PredictProbability를 선택합니다.

  4. 위의 마이닝 모델 창에서 [Bike Buyer]를 선택하여 조건/인수 셀로 끕니다.

    이렇게 하면 조건/인수 셀에 [TM_Decision_Tree].[Bike Buyer]가 나타납니다.

  5. 원본 열에서 다음 빈 행을 클릭한 다음 TM_Decision_Tree를 선택합니다.

  6. TM_Decision_Tree 행의 필드 열에서 Bike Buyer를 선택합니다.

  7. TM_Decision_Tree 행의 조건/인수 열에서 =1을 입력합니다.

  8. 원본 열에서 다음 빈 행을 클릭한 다음 ProspectiveBuyer를 선택합니다.

  9. ProspectiveBuyer 행의 필드 열에서 ProspectiveBuyerKey를 선택합니다.

    이렇게 하면 자전거 구매 가능성이 있는 고객과 구매 가능성이 없는 고객을 식별할 수 있도록 예측 쿼리에 고유 식별자가 추가됩니다.

  10. 표에 5개의 행을 더 추가합니다. 각 행에 대해 ProspectiveBuyer원본으로 선택한 다음 필드 셀에 다음 열을 추가합니다.

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

마지막으로 쿼리를 실행하고 결과를 찾아봅니다.

쿼리를 실행하고 결과를 확인하려면

  1. 마이닝 모델 예측 탭에서 결과 단추를 선택합니다.

  2. 쿼리가 실행되고 결과가 표시되면 해당 결과를 검토할 수 있습니다.

    마이닝 모델 예측 탭은 자전거 구매자가 될 가능성이 있는 잠재 고객에 대한 연락처 정보를 표시합니다. 열은 올바른 것으로 간주되는 예측의 확률을 나타냅니다. 이러한 결과를 사용하여 메일 대상으로 삼을 잠재 고객을 결정할 수 있습니다.

  3. 저장을 클릭하여 결과를 저장합니다.