시퀀스 클러스터링 마이닝 모델 구조 만들기(중급 데이터 마이닝 자습서)

 

적용 대상: SQL Server 2016 Preview

시퀀스 클러스터링 마이닝 모델을 만드는 첫 번째 단계는 데이터 마이닝 마법사를 사용하여 Microsoft 시퀀스 클러스터링 알고리즘을 기반으로 하는 새 마이닝 구조 및 마이닝 모델을 만드는 것입니다.

시장 바구니 분석에 사용한 동일한 데이터 원본 뷰를 사용 합니다 하지만 포함 된 열을 추가 합니다는 시퀀스 식별자입니다. 이 시나리오에서 시퀀스는 고객이 시장 바구니에 항목을 추가한 순서를 의미합니다.

또한 고객을 인구 통계별로 그룹화하는 모델 중 하나에 사용되는 일부 열을 추가합니다.

시퀀스 클러스터링 구조 및 모델을 만들려면

  1. 솔루션 탐색기에서 SQL Server Data Tools(SSDT), 를 마우스 오른쪽 단추로 클릭 마이닝 구조 선택한 새 마이닝 구조합니다.

  2. 데이터 마이닝 마법사 시작 페이지에서 다음을 클릭합니다.

  3. 정의 방법 선택 페이지에서 기존 관계형 데이터베이스 또는 데이터 웨어하우스 로부터 을 선택한 다음 클릭 다음합니다.

  4. 데이터 마이닝 구조 만들기 페이지에서 옵션 마이닝 구조에 마이닝 모델 만들기 을 선택 합니다. 그런 다음, 드롭다운 목록에서 옵션에 대 한 클릭 사용할 데이터 마이닝 기술을 사용 하 시겠습니까?, 선택한 Microsoft 시퀀스 클러스터링합니다. 다음을 클릭합니다.

    데이터 원본 뷰 선택 페이지가 나타납니다. 아래에서 사용 가능한 데이터 원본 뷰, 선택, 주문합니다.

    Orders는 시장 바구니 시나리오에 사용한 동일한 데이터 원본 뷰입니다. 이 데이터 원본 뷰를 만들지 않은 경우 참조 중첩 된 테이블 및 #40, 중급 데이터 마이닝 자습서 및 #41; 데이터 원본 뷰 추가합니다.

  5. 다음을 클릭합니다.

  6. 테이블 유형 지정 페이지에서는 사례 옆에 vAssocSeqOrders 테이블을 마우스 선택는 중첩 옆에 vAssocSeqLineItems 테이블입니다. 다음을 클릭합니다.

    참고


    선택할 때 오류가 발생 하는 경우는 사례 또는 중첩 확인란는 것이 데이터 원본 뷰의 조인이 올바르지 않습니다. 중첩된 테이블 vAssocSeqLineItems, 사례 테이블에 연결 해야 vAssocSeqOrders를 다 대 일 조인으로 합니다. 조인 선을 마우스 오른쪽 단추로 클릭한 다음 조인 방향을 반대로 바꿔 관계를 편집할 수 있습니다. 자세한 내용은 참조 만들기 또는 관계 편집 대화 상자 및 #40; Analysis Services-다차원 데이터 및 #41;합니다.

  7. 학습 데이터 지정 페이지에서 다음과 같이 확인란을 선택 하 여 모델에 사용할 열을 선택 합니다.

    • IncomeGroup선택은 입력 확인란입니다.

      이 열에는 클러스터링에 사용할 수 있는 고객에 대한 유용한 정보가 들어 있습니다. 첫 번째 모델에서 이 열을 사용한 다음 두 번째 모델에서 무시합니다.

    • OrderNumber선택은 확인란입니다.

      이 필드는 식별자로 사례 테이블 또는 합니다. 일반적으로 키에 클러스터링에 유용하지 않은 고유 값이 포함되어 있으므로 사례 테이블의 키 필드를 입력으로 사용할 수 없습니다.

    • 지역선택은 입력 확인란입니다.

      이 열에는 클러스터링에 사용할 수 있는 고객에 대한 유용한 정보가 들어 있습니다. 첫 번째 모델에서 이 열을 사용한 다음 두 번째 모델에서 무시합니다.

    • LineNumber선택은 입력 확인란입니다.

      LineNumber 중첩된 테이블에 대 한 필드를 식별자로 사용 됩니다 또는 시퀀스 키합니다. 중첩 테이블의 키는 항상 입력으로 사용해야 합니다.

    • 모델선택은 입력예측 가능 확인란입니다.

    선택 항목 올바른지를 클릭 한 다음 확인 다음합니다.

  8. 지정 열 내용 및 데이터 형식을 페이지, 모눈 열, 콘텐츠 형식 및 다음 표에 표시 된 데이터 형식이 포함 되어 있는지 확인 한 다음 클릭 다음합니다.

    테이블/열 내용 유형 데이터 형식
    IncomeGroup 불연속 텍스트
    OrderNumber Key 텍스트
    Region 불연속 텍스트
    vAssocSeqLineItems
    Line Number 키 시퀀스 Long
    Model 불연속 텍스트
  9. 테스트 집합 만들기 페이지에서 변경 된 테스트용 데이터 비율 을 20으로 클릭 한 다음 다음합니다.

  10. 마법사 완료 페이지에 대 한는 마이닝 구조 이름, 형식 Sequence Clustering with Region합니다.

  11. 에 대 한는 마이닝 모델 이름, 형식 Sequence Clustering with Region합니다.

  12. 확인은 드릴스루 허용 상자를 선택한 다음 클릭 마침합니다.

단원의 다음 태스크

시퀀스 클러스터링 모델 처리

관련 항목:

데이터 마이닝 디자이너
Microsoft 시퀀스 클러스터링 알고리즘