시퀀스 클러스터링 마이닝 모델 구조 만들기(중급 데이터 마이닝 자습서)

시퀀스 클러스터링 마이닝 모델을 만드는 첫 번째 단계는 데이터 마이닝 마법사를 사용하여 Microsoft 시퀀스 클러스터링 알고리즘을 기반으로 하는 새 마이닝 구조 및 마이닝 모델을 만드는 것입니다.

시장 바구니 분석에 사용된 동일한 데이터 원본 뷰를 사용하지만 sequence 식별자가 포함되어 있는 열을 추가합니다. 이 시나리오에서 시퀀스는 고객이 시장 바구니에 항목을 추가한 순서를 의미합니다.

또한 고객을 인구 통계별로 그룹화하는 모델 중 하나에 사용되는 일부 열을 추가합니다.

시퀀스 클러스터링 구조 및 모델을 만들려면

  1. Business Intelligence Development Studio의 솔루션 탐색기에서 마이닝 구조를 마우스 오른쪽 단추로 클릭하고 새 마이닝 구조를 선택합니다.

  2. 데이터 마이닝 마법사 시작 페이지에서 다음을 클릭합니다.

  3. 정의 방법 선택 페이지에서 기존 관계형 데이터베이스 또는 데이터 웨어하우스 사용이 선택되었는지 확인한 후 다음을 클릭합니다.

  4. 데이터 마이닝 구조 만들기 페이지에서 마이닝 모델을 포함하는 마이닝 구조 만들기 옵션이 선택되어 있는지 확인합니다. 그런 다음 사용할 데이터 마이닝 기술 선택 옵션의 드롭다운 목록을 클릭하고 Microsoft 시퀀스 클러스터링을 선택합니다. 다음을 클릭합니다.

    데이터 원본 뷰 선택 페이지가 표시됩니다. 사용 가능한 데이터 원본 뷰 아래에서 Orders를 선택합니다.

    Orders는 시장 바구니 시나리오에 사용한 동일한 데이터 원본 뷰입니다. 이 데이터 원본 뷰를 만들지 않은 경우에는 중첩 테이블이 있는 데이터 원본 뷰 추가(중급 데이터 마이닝 자습서)을 참조하십시오.

  5. 다음을 클릭합니다.

  6. 테이블 유형 지정 페이지에서 vAssocSeqOrders 테이블 옆에 있는 사례 확인란, vAssocSeqLineItems 테이블 옆에 있는 중첩 확인란을 차례로 선택합니다. 다음을 클릭합니다.

    [!참고]

    사례 또는 중첩 확인란을 선택할 때 오류가 발생하는 경우 데이터 원본 뷰의 조인이 올바르지 않기 때문일 수 있습니다. 중첩 테이블 vAssocSeqLineItems는 다 대 일 조인으로 사례 테이블 vAssocSeqOrders에 연결되어야 합니다. 조인 선을 마우스 오른쪽 단추로 클릭한 다음 조인 방향을 반대로 바꿔 관계를 편집할 수 있습니다. 자세한 내용은 관계 만들기/편집 대화 상자(Analysis Services - 다차원 데이터)를 참조하십시오.

  7. 학습 데이터 지정 페이지에서 다음과 같이 확인란을 선택하여 모델에 사용할 열을 선택합니다.

    • IncomeGroup    입력 확인란을 선택합니다.

      이 열에는 클러스터링에 사용할 수 있는 고객에 대한 유용한 정보가 들어 있습니다. 첫 번째 모델에서 이 열을 사용한 다음 두 번째 모델에서 무시합니다.

    • OrderNumber    키 확인란을 선택합니다.

      이 필드는 사례 테이블에 대한 식별자인 Key로 사용됩니다. 일반적으로 키에 클러스터링에 유용하지 않은 고유 값이 포함되어 있으므로 사례 테이블의 키 필드를 입력으로 사용할 수 없습니다.

    • Region    입력 확인란을 선택합니다.

      이 열에는 클러스터링에 사용할 수 있는 고객에 대한 유용한 정보가 들어 있습니다. 첫 번째 모델에서 이 열을 사용한 다음 두 번째 모델에서 무시합니다.

    • LineNumber   키입력 확인란을 선택합니다.

      LineNumber 필드가 중첩 테이블에 대한 식별자인 Sequence Key로 사용됩니다. 중첩 테이블의 키는 항상 입력으로 사용해야 합니다.

    • Model   입력예측 가능 확인란을 선택합니다.

    선택이 올바른지 확인하고 다음을 클릭합니다.

  8. 열 내용 및 데이터 형식 지정 페이지에서 표에 다음 표에 나오는 열, 내용 유형 및 데이터 형식이 있는지 확인하고 다음을 클릭합니다.

    테이블/열

    내용 유형

    데이터 형식

    IncomeGroup

    불연속

    텍스트

    OrderNumber

    텍스트

    Region

    불연속

    텍스트

    vAssocSeqLineItems

      

      

    Line Number

    키 시퀀스

    Long

    Model

    불연속

    텍스트

  9. 테스트 집합 만들기 페이지에서 테스트용 데이터 비율을 20으로 변경한 후 다음을 클릭합니다.

  10. 마법사 완료 페이지에서 마이닝 구조 이름에 Sequence Clustering with Region을 입력합니다.

  11. 마이닝 모델 이름에 Sequence Clustering with Region을 입력합니다.

  12. 드릴스루 허용 상자를 선택한 다음 마침을 클릭합니다.

단원의 다음 태스크

시퀀스 클러스터링 모델 처리