클러스터링 모델 탐색(기본 데이터 마이닝 자습서)

 

적용 대상: SQL Server 2016 Preview

Microsoft 클러스터링 알고리즘 비슷한 특성을 포함 하는 클러스터에 사례를 그룹화 합니다. 이러한 그룹화는 데이터 탐색, 데이터 내 잘못된 부분 식별, 예측 만들기 등에 유용합니다.

Microsoft 클러스터 뷰어는 클러스터링 마이닝 모델 탐색 시 사용할 수 있는 다음과 같은 탭을 제공합니다.

클러스터 다이어그램

클러스터 프로필

클러스터 특징

클러스터 판별

클러스터 다이어그램 탭

클러스터 다이어그램 탭에서는 마이닝 모델에 있는 클러스터를 모두 표시합니다. 클러스터 사이의 선은 "일치 정도"를 나타내며 클러스터가 얼마나 비슷한지에 따라 음영 처리됩니다. 각 클러스터의 실제 색은 클러스터에 있는 변수와 상태의 빈도를 나타냅니다.

클러스터 다이어그램 탭에서 모델을 탐색하려면

  1. 사용 된 마이닝 모델 목록 맨 위에 있는 마이닝 모델 뷰어 탭으로 전환 하는 TM_Clustering 모델입니다.

  2. 뷰어 목록에서 Microsoft 클러스터 뷰어합니다.

  3. 음영 변수 상자 Bike Buyer합니다.

    기본 변수는 채우기, 하지만 원하는 특성이 있는 멤버를 포함 하는 클러스터를 검색 하는 모델의 모든 특성을 변경할 수 있습니다.

  4. 선택 1상태 자전거를 구매한 경우 탐색 하는 상자입니다.

    밀도 범례에서는 음영 변수 및 상태에서 선택한 특성 상태 쌍의 밀도 설명 합니다. 이 예제를 보여 줍니다 clusterwith 가장 짙은 음영이 자전거 구매자의 가장 높은 백분율에 있습니다.

  5. 음영이 가장 짙은 클러스터 위에 마우스를 놓습니다.

    특성을 가진 사례의 백분율을 표시 하는 도구 설명이 Bike Buyer = 1합니다.

  6. 밀도가 가장 높은, 선택, 클러스터를 마우스 오른쪽 단추로 클릭 하는 클러스터를 선택 합니다. 클러스터 이름 바꾸기 유형과 Bike Buyers High 나중에 식별에 대 한 합니다. 확인을 클릭합니다.

  7. 음영이 가장 밝고 밀도가 가장 낮은 클러스터를 찾습니다. 클러스터를 마우스 오른쪽 단추로 클릭, 선택 클러스터 이름 바꾸기 유형과 Bike Buyers Low합니다. 확인을 클릭합니다.

  8. 클릭 하 고 Bike Buyers High 클러스터와 연결을 다른 클러스터 보다 효과적인 보기를 얻을 수 있는 창 영역으로 끕니다.

    클러스터를 선택하면 이 클러스터를 다른 클러스터에 연결하는 선이 강조 표시되므로 이 클러스터에 대한 모든 관계를 쉽게 볼 수 있습니다. 클러스터를 선택하지 않은 경우 다이어그램에 있는 모든 클러스터 간 관계의 밀접도는 선이 짙은 정도로 알 수 있습니다. 음영이 옅거나 없으면 두 클러스터가 그다지 유사하지 않은 것입니다.

  9. 네트워크 왼쪽의 슬라이더를 사용하여 약한 링크를 필터로 제외시키고 가장 밀접한 관계가 있는 클러스터를 찾을 수 있습니다. Adventure Works Cycles 마케팅 부서에서 대상 메일을 배달하기 위한 최상의 방법을 결정할 때 유사한 클러스터를 함께 결합할 수 있습니다.

맨 위로 이동

클러스터 프로필 탭

클러스터 프로필 의 전체 보기를 제공 하는 탭은 TM_Clustering 모델입니다. 클러스터 프로필 탭에는 모델의 각 클러스터에 대 한 열이 포함 되어 있습니다. 첫 번째 열에는 적어도 하나의 클러스터와 연결된 특성이 나열됩니다. 뷰어의 나머지 부분에는 각 클러스터에 대한 특성의 상태 분포가 있습니다. 불연속 변수의 분포에 표시 되는 막대의 최대 수와 함께 색이 지정 된 막대로 표시 됩니다는 히스토그램 막대 목록입니다. 연속 특성은 각 클러스터의 평균과 표준 편차를 나타내는 다이아몬드 차트를 사용하여 표시됩니다.

클러스터 프로필 탭에서 모델을 탐색하려면

  1. 설정 히스토그램 막대를 5합니다.

    이 모델에서 5는 어느 한 변수의 상태에 지정할 수 있는 최대값입니다.

  2. 경우는 마이닝 범례 의 표시를 차단 된 프로필 특성, 방해가 옮기십시오.

  3. 선택의 Bike Buyers High 열 오른쪽으로 끌어서는 채우기 열입니다.

  4. 선택 된 Bike Buyers Low 열 오른쪽으로 끌어서는 Bike Buyers High 열.

  5. 클릭 하 고 Bike Buyers High 열입니다.

    변수 열이 해당 클러스터에 대 한 중요도 순으로 정렬 합니다. 열을 스크롤하고 Bike Buyer High 클러스터의 특징을 검토합니다. 예를 들어 이 클러스터에 속한 사람들은 통근 거리가 짧을 가능성이 더 많습니다.

  6. 두 번 클릭은 시대 셀에 Bike Buyers High 열입니다.

    마이닝 범례 에서 보다 자세하게 표시 보기와 있습니다 평균 뿐만 아니라 이러한 고객의 연령 범위를 볼 수 있습니다.

  7. 마우스 오른쪽 단추로 클릭는 Bike Buyers Low 열과 선택 열 숨기기합니다.

맨 위로 이동

클러스터 특징 탭

클러스터 특징 탭을 검사할 수 있습니다 자세히 클러스터를 구성 하는 특성입니다. 클러스터 프로필 탭에서 모든 클러스터의 특징을 비교하는 대신 한 번에 하나의 클러스터를 탐색할 수 있습니다. 예를 들어, 선택 하는 경우 Bike Buyers High 에서 클러스터 목록에서이 클러스터의 고객 특징을 볼 수 있습니다. 클러스터 프로필 뷰어와 다르게 표시되지만 결과는 동일합니다.

참고


초기 값을 설정 하지 않으면 holdoutseed, 결과 모델을 처리할 때마다 달라 집니다. 자세한 내용은 참조 HoldoutSeed 요소

맨 위로 이동

클러스터 판별 탭

클러스터 판별 탭에서 다른 클러스터를 구별 하는 특징을 탐색할 수 있습니다. 두 클러스터를 선택한 후의 클러스터 1 목록 및에서 Cluster 2 목록에서 뷰어 클러스터 간의 차이 계산 하 고 가장 클러스터를 구별 하는 특성의 목록이 표시 됩니다.

클러스터 판별 탭에서 모델을 탐색하려면

  1. 클러스터 1 상자 Bike Buyers High합니다.

  2. Cluster 2 상자 Bike Buyers Low합니다.

  3. 클릭 변수 사전순으로 정렬 합니다.

    고객 간에 보다 큰 차이점 중 일부는 Bike Buyers LowBike Buyers High 클러스터 나가, 자동차 소유 여부, 지역 및 자식의 수를 포함 합니다.

관련 작업

다른 마이닝 모델을 탐색 하려면 다음 항목을 참조 하십시오.

단원의 다음 태스크

Naive Bayes 모델 ( 탐색 기본 데이터 마이닝 자습서 및 #41;

단원의 이전 태스크

의사 결정 트리 모델 ( 탐색 기본 데이터 마이닝 자습서 및 #41;

관련 항목:

Microsoft 클러스터 뷰어를 사용하여 모델 찾아보기
클러스터 판별 탭(마이닝 모델 뷰어)
클러스터 프로필 탭(마이닝 모델 뷰어)
클러스터 특징 탭(마이닝 모델 뷰어)
클러스터 다이어그램 탭(마이닝 모델 뷰어)