예측 만들기(기본 데이터 마이닝 자습서)

마이닝 모델의 정확도를 테스트하여 만족했으면 데이터 마이닝 디자이너의 마이닝 모델 예측 탭에서 예측 쿼리 작성기를 사용하여 예측 쿼리를 만들 수 있습니다. 이 인터페이스는 DMX(Data Mining Extensions) 언어로 쿼리를 작성하는 데 도움이 됩니다. DMX의 구문은 T-SQL의 구문과 비슷하지만 데이터 마이닝 개체에 대한 쿼리에 실행됩니다.

예측 쿼리 작성기에는 세 가지 뷰가 있습니다. 디자인쿼리 뷰를 사용하여 쿼리를 작성하고 검사할 수 있습니다. 그런 다음 쿼리를 실행하고 결과 뷰에서 결과를 볼 수 있습니다.

예측 쿼리 작성기를 사용하는 방법은 데이터 마이닝 쿼리 인터페이스를 참조하십시오.

쿼리 만들기

예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델과 입력 테이블을 선택하는 것입니다.

모델과 입력 테이블을 선택하려면

  1. 데이터 마이닝 디자이너의 마이닝 모델 예측 탭에 있는 마이닝 모델 상자에서 모델 선택을 클릭합니다.

  2. 마이닝 모델 선택 대화 상자에 있는 트리에서 Targeted Mailing 구조로 이동하여 구조를 확장하고 TM_Decision_Tree를 선택한 다음 확인을 클릭합니다.

  3. 입력 테이블 선택 상자에서 사례 테이블 선택을 클릭합니다.

  4. 테이블 선택 대화 상자의 데이터 원본 목록에서 Adventure Works DW Multidimensional 2012 를 선택합니다.

  5. 테이블/뷰 이름에서 ProspectiveBuyer (dbo) 테이블을 선택한 다음 확인을 클릭합니다.

    ProspectiveBuyer 테이블은 vTargetMail 사례 테이블과 가장 비슷합니다.

열 매핑

입력 테이블을 선택하면 열 이름을 기반으로 마이닝 모델과 입력 테이블 간에 기본 매핑이 만들어집니다. 구조의 열 중 적어도 하나 이상의 열이 외부 데이터의 열과 일치해야 합니다.

중요 정보중요

모델의 정확도를 결정하는 데 사용하는 데이터에는 예측 가능한 열에 매핑될 수 있는 열이 포함되어 있어야 합니다. 이러한 열이 존재하지 않는 경우 빈 값으로 열을 만들 수 있지만 이 열은 예측 가능한 열과 동일한 데이터 형식을 사용해야 합니다.

구조 열을 입력 테이블 열에 매핑하려면

  1. 마이닝 모델 창을 입력 테이블 선택 창에 연결하는 선을 마우스 오른쪽 단추로 클릭하고 연결 수정을 선택합니다.

    모든 열이 매핑되지는 않았습니다. 여러 테이블 열에 대한 매핑을 추가합니다. 또한 열이 더 잘 일치하도록 현재 날짜 열을 기반으로 새 생년월일 열을 생성합니다.

  2. 테이블 열 아래에서 Bike Buyer 셀을 클릭하고 드롭다운에서 ProspectiveBuyer.Unknown을 선택합니다.

    이는 예측 가능한 열인 [Bike Buyer]를 입력 테이블 열에 매핑합니다.

  3. 확인을 클릭합니다.

  4. 솔루션 탐색기에서 Targeted Mailing 데이터 원본 뷰를 마우스 오른쪽 단추로 클릭하고 뷰 디자이너를 선택합니다.

  5. ProspectiveBuyer 테이블을 마우스 오른쪽 단추로 클릭하고 새 명명된 계산을 선택합니다.

  6. 명명된 계산 만들기 대화 상자의 열 이름에 calcAge을 입력합니다.

  7. 설명에 Calculate age based on birthdate를 입력합니다.

  8. 상자에 DATEDIFF(YYYY,[BirthDate],getdate())를 입력한 다음 확인을 클릭합니다.

    입력 테이블에는 모드의 열에 해당하는 Age 열이 없기 때문에 이 식을 사용하여 입력 테이블의 BirthDate 열에서 고객 나이를 계산할 수 있습니다. Age가 자전거 구매 예측에 가장 큰 영향을 주는 열로 식별되었으므로 모델과 입력 테이블에 모두 있어야 합니다.

  9. 데이터 마이닝 디자이너에서 마이닝 모델 예측 탭을 선택하고 연결 수정 창을 다시 엽니다.

  10. 테이블 열 아래에서 Age 셀을 클릭하고 드롭다운에서 ProspectiveBuyer.calcAge를 선택합니다.

    주의 사항주의

    목록에 열이 표시되지 않는 경우 디자이너에 로드되는 데이터 원본 뷰의 정의를 새로 고쳐야 할 수 있습니다. 이렇게 하려면 파일 메뉴에서 모두 저장을 선택한 다음 디자이너에서 프로젝트를 닫았다가 다시 엽니다.

  11. 확인을 클릭합니다.

예측 쿼리 디자인

예측 쿼리를 디자인하려면

  1. 마이닝 모델 예측 탭의 도구 모음에 있는 첫 번째 단추는 디자인 뷰로 전환/결과 뷰로 전환/쿼리 뷰로 전환 단추입니다. 이 단추의 아래쪽 화살표를 클릭하고 디자인을 선택합니다.

  2. 마이닝 모델 예측 탭의 표에 있는 원본 열에서 첫 번째 빈 행의 셀을 클릭한 다음 예측 함수를 선택합니다.

  3. 예측 함수 행의 필드 열에서 PredictProbability를 선택합니다.

    동일한 행의 별칭 열에 Probability of result를 입력합니다.

  4. 위의 마이닝 모델 창에서 [Bike Buyer]를 선택하여 조건/인수 셀로 끕니다.

    이렇게 하면 조건/인수 셀에 [TM_Decision_Tree].[Bike Buyer] 가 나타납니다.

    이렇게 하면 PredictProbability 함수의 대상 열이 지정됩니다. 함수에 대한 자세한 내용은 DMX(Data Mining Extensions) 함수 참조를 참조하십시오.

  5. 원본 열에서 다음 빈 행을 클릭한 다음 TM_Decision_Tree mining model를 선택합니다.

  6. TM_Decision_Tree 행의 필드 열에서 Bike Buyer를 선택합니다.

  7. TM_Decision_Tree 행의 조건/인수 열에서 =1을 입력합니다.

  8. 원본 열에서 다음 빈 행을 클릭한 다음 ProspectiveBuyer table를 선택합니다.

  9. ProspectiveBuyer 행의 필드 열에서 ProspectiveBuyerKey를 선택합니다.

    이렇게 하면 자전거 구매 가능성이 있는 고객과 구매 가능성이 없는 고객을 식별할 수 있도록 예측 쿼리에 고유 식별자가 추가됩니다.

  10. 표에 5개의 행을 더 추가합니다. 각 행에 대해 ProspectiveBuyer table원본으로 선택한 다음 필드 셀에 다음 열을 추가합니다.

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

마지막으로 쿼리를 실행하고 결과를 찾아봅니다.

쿼리를 실행하고 결과를 확인하려면

  1. 마이닝 모델 예측 탭에서 결과 단추를 선택합니다.

  2. 쿼리가 실행되고 결과가 표시되면 해당 결과를 검토할 수 있습니다.

    마이닝 모델 예측 탭은 자전거 구매자가 될 가능성이 있는 잠재 고객에 대한 연락처 정보를 표시합니다. Probability of result 열은 올바른 것으로 간주되는 예측의 확률을 나타냅니다. 이러한 결과를 사용하여 메일 대상으로 삼을 잠재 고객을 결정할 수 있습니다.

  3. 이때 결과를 저장할 수 있습니다. 세 가지 옵션이 있습니다.

    • 결과의 데이터 행을 마우스 오른쪽 단추로 클릭하고 복사를 선택하여 해당 값(및 열 머리글)만 클립보드에 저장합니다.

    • 결과의 아무 행이나 마우스 오른쪽 단추로 클릭하고 모두 복사를 선택하여 전체 결과 집합(열 머리글 포함)을 클립보드에 저장합니다.

    • 쿼리 결과 저장을 클릭하여 다음과 같이 결과를 데이터베이스에 직접 저장합니다.

      1. 데이터 마이닝 쿼리 결과 저장 대화 상자에서 데이터 원본을 선택하거나 새 데이터 원본을 정의합니다.

      2. 쿼리 결과를 포함할 테이블의 이름을 입력합니다.

      3. DSV에 추가 옵션을 사용하여 테이블을 만들고, 기존 데이터 원본 뷰에 추가합니다. 이는 학습 데이터, 예측 원본 데이터, 쿼리 결과와 같은 모델에 대한 모든 관련 테이블을 동일한 데이터 원본 뷰에 유지하려는 경우에 유용합니다.

      4. 기존 항목 덮어쓰기 옵션을 사용하여 기존 테이블을 최신 결과로 업데이트합니다.

        예측 쿼리에 열을 추가한 경우, 예측 쿼리에서 열의 이름 또는 데이터 형식을 변경한 경우, 대상 테이블에서 ALTER 문을 실행한 경우 테이블을 덮어 쓰려면 이 옵션을 사용해야 합니다.

        또한 여러 열의 이름이 동일한 경우(예: 기본 열 이름인 사용) 중복된 이름의 열에 대해 별칭을 만들어야 합니다. 그렇지 않으면 디자이너가 결과를 SQL Server에 저장하려고 시도할 때 오류가 발생합니다. 그 이유는 SQL Server가 여러 열에서 동일한 이름을 갖도록 허용하지 않기 때문입니다.

        자세한 내용은 데이터 마이닝 쿼리 결과 저장 대화 상자(마이닝 모델 예측 뷰)을 참조하십시오.

단원의 다음 태스크

구조 데이터에 드릴스루 사용(기본 데이터 마이닝 자습서)

참고 항목

태스크

예측 쿼리 작성기를 사용하여 예측 쿼리 만들기

관련 자료

예측 쿼리 작성기를 사용하여 DMX 예측 쿼리 만들기