대상 메일 마이닝 모델 구조 만들기(데이터 마이닝 자습서)

대상 메일 시나리오를 만드는 첫 번째 단계는 Business Intelligence Development Studio에서 데이터 마이닝 마법사를 사용하여 새 마이닝 구조와 의사결정 트리 마이닝 모델을 만드는 것입니다.

참조 항목

데이터 마이닝 마법사, 데이터 마이닝 디자이너, Microsoft 의사결정 트리 알고리즘

대상 메일 시나리오의 마이닝 구조를 만들려면

  1. 솔루션 탐색기에서 마이닝 구조를 마우스 오른쪽 단추로 클릭하고 새 마이닝 구조를 선택합니다.

    데이터 마이닝 마법사가 열립니다.

  2. 데이터 마이닝 마법사 시작 페이지에서 다음을 클릭합니다.

  3. 정의 방법 선택 페이지에서 기존 관계형 데이터베이스 또는 데이터 웨어하우스 사용이 선택되었는지 확인한 후 다음을 클릭합니다.

  4. 데이터 마이닝 기술 선택 페이지의 사용할 데이터 마이닝 기술을 선택하십시오에서 Microsoft 의사결정 트리를 선택합니다.

    이 자습서에서는 이 초기 마이닝 구조를 기반으로 여러 모델을 만듭니다. 첫 번째 모델은 마법사를 완료할 때 구조와 함께 만들어지며 Microsoft 의사결정 트리 알고리즘을 기반으로 합니다.

  5. 다음을 클릭합니다.

  6. 데이터 원본 뷰 선택 페이지에서 Adventure Works DW가 기본적으로 선택되어 있는지 확인합니다. 찾아보기를 클릭하여 데이터 원본 뷰에서 테이블을 확인한 다음 닫기를 클릭하여 마법사로 돌아갑니다.

  7. 다음을 클릭합니다.

  8. 테이블 유형 지정 페이지에서 vTargetMail 테이블 옆의 사례 열에 있는 확인란을 선택하고 다음을 클릭합니다.

  9. 성향 습득 데이터 지정 페이지의 CustomerKey 열 옆에서 열의 확인란이 선택되어 있는지 확인합니다.

    데이터 원본 뷰의 원본 테이블이 키를 나타내면 데이터 마이닝 마법사에서 해당 열이 모델의 키로 자동 선택됩니다.

  10. BikeBuyer 열 옆의 입력예측 가능을 선택합니다.

    예측 가능한 열임을 나타내면 제안 단추가 활성화됩니다. 제안을 클릭하면 예측 가능한 열에 가장 밀접하게 관련된 열을 나열하는 관련 열 제안 대화 상자가 열립니다.

    관련 열 제안 대화 상자에서는 예측 가능한 특성과의 상관 관계순으로 특성이 정렬됩니다. 값이 0.05보다 큰 열이 자동으로 선택되어 모델에 포함됩니다. 제안 사항에 동의하면 확인을 클릭합니다. 그러면 선택한 열이 마법사에서 입력 열로 표시됩니다. 이 자습서에서는 취소를 클릭하여 제안 사항을 무시합니다.

  11. 다음 열 옆의 입력 확인란을 선택합니다.

    • Age
    • CommuteDistance
    • EnglishEducation
    • EnglishOccupation
    • FirstName
    • Gender
    • GeographyKey
    • HouseOwnerFlag
    • LastName
    • MaritalStatus
    • NumberCarsOwned
    • NumberChildrenAtHome
    • Region
    • TotalChildren
    • YearlyIncome

    Shift 키를 사용하여 여러 열을 선택할 수 있습니다.

  12. 다음을 클릭합니다.

  13. 열 내용 및 데이터 형식 지정 페이지에서 검색을 클릭합니다.

    숫자 데이터를 샘플링하여 숫자 열에 연속 값이 포함되는지 또는 불연속 값이 포함되는지 결정하는 알고리즘이 실행됩니다. 예를 들어 열에 급여 정보가 실제 급여 값(연속 값)으로 포함되거나 1 = < $25,000, 2 = $25,000 ~ $50,000 같이 인코딩된 급여 범위를 나타내는 정수(불연속 값)가 포함될 수 있습니다.

  14. 검색을 클릭한 다음 내용 유형데이터 형식 열의 항목 설정이 다음 표에 나열된 것과 같은지 확인합니다.

    내용 유형 데이터 형식

    Age

    Continuous

    Long

    BikeBuyer

    Discrete

    Long

    CommuteDistance

    Discrete

    Text

    CustomerKey

    Key

    Long

    EnglishEducation

    Discrete

    Text

    EnglishOccupation

    Discrete

    Text

    FirstName

    Discrete

    Text

    Gender

    Discrete

    Text

    GeographyKey

    Discrete

    Text

    HouseOwnerFlag

    Discrete

    Text

    LastName

    Discrete

    Text

    MaritalStatus

    Discrete

    Text

    NumberCarsOwned

    Discrete

    Long

    NumberChildrenAtHome

    Discrete

    Long

    Region

    Discrete

    Text

    TotalChildren

    Discrete

    Long

    YearlyIncome

    Continuous

    Double

[!참고] 데이터 마이닝 알고리즘은 숫자 값만을 근거로 하여 GeographyKey 열에 연속 숫자가 포함되어 있음을 알려 줍니다. 그러나 우편 번호와 같은 숫자의 경우에는 수치 연산이 무의미하므로 일반적으로 연속 숫자 값이 아닌 불연속 숫자로 취급해야 합니다.

  1. 다음을 클릭합니다.
  2. 마법사 완료 페이지의 마이닝 구조 이름Targeted Mailing을 입력합니다.
  3. 마이닝 모델 이름TM_Decision_Tree를 입력합니다.
  4. 드릴스루 허용 확인란을 선택합니다.
  5. 마침을 클릭합니다.

단원의 다음 작업

대상 메일 모델 수정(데이터 마이닝 자습서)