장바구니 모델 탐색(데이터 마이닝 자습서)

업데이트: 2007년 9월 15일

이제 Association 모델을 구축했으므로 데이터 마이닝 디자이너의 마이닝 모델 뷰어 탭에 있는 Microsoft 연결 뷰어를 사용하여 탐색할 수 있습니다. 모델을 탐색하면 함께 나타나는 경향이 있는 제품을 손쉽게 확인하고 항목 간의 관계를 탐색할 수 있습니다. 또한 필터링을 통해 약한 연결을 제외하고 최신 패턴에 대한 전반적인 개념을 얻을 수 있습니다.

Microsoft 연결 뷰어에는 항목 집합, 규칙종속성 네트워크의 세 탭이 있습니다. 이 뷰어에 대한 자세한 내용은 Microsoft 연결 규칙 뷰어를 사용하여 마이닝 모델 보기를 참조하십시오.

항목 집합 탭

항목 집합 탭에는 Microsoft 연결 알고리즘에서 검색하는 항목 집합과 관련된 세 가지 중요 정보인 지원(항목 집합이 발생하는 트랜잭션 수), 크기(항목 집합에 있는 항목 수) 및 항목 집합의 실제 구성이 표시됩니다. 알고리즘 매개 변수 설정 방법에 따라 알고리즘에서 많은 수의 항목 집합을 생성할 수 있습니다. 항목 집합 탭 맨 위의 컨트롤을 사용하면 뷰어를 필터링하여 지정한 최소 지원과 항목 집합 크기를 포함하는 항목 집합만 표시할 수 있습니다.

항목 집합 필터 상자를 사용하여 뷰어에 표시되는 항목 집합을 필터링할 수도 있습니다. 예를 들어 Mountain-200 자전거에 대한 정보를 포함하는 항목 집합만 표시하려면 항목 집합 필터Mountain-200을 입력합니다. 뷰어에서 볼 수 있듯이 "Mountain-200"이라는 단어를 포함하는 항목 집합만 표시됩니다. 뷰어에 반환되는 각 항목 집합에는 Mountain-200 자전거가 판매된 트랜잭션 정보가 포함됩니다. 예를 들어 지원 열에 값 710을 포함하는 항목 집합은 모든 트랜잭션 중에서 Mountain-200 자전거를 구입한 710명이 Sport-100 자전거도 구입했음을 나타냅니다.

규칙 탭

규칙 탭에는 알고리즘에서 찾는 규칙과 관련된 다음 정보가 표시됩니다.

  • 확률
    규칙이 발생할 가능성입니다.
  • 중요도
    규칙의 유용성을 나타내는 척도로, 값이 높을수록 더 나은 규칙을 의미합니다. 확률만 보면 오해가 발생할 수 있습니다. 예를 들어 모든 트랜잭션이 x 항목을 포함하는 경우 y 규칙은 x의 확률이 1(x가 항상 발생함)이라고 예측합니다. 규칙의 정확도가 매우 좋더라도 모든 트랜잭션이 y와 관계없이 x를 포함하므로 그다지 많은 정보가 릴레이되지 않습니다.
  • 규칙
    규칙에 대한 정의입니다.

항목 집합 탭과 마찬가지로 가장 관심 있는 규칙만 표시되도록 규칙을 필터링할 수 있습니다. 예를 들어 Mountain-200 자전거를 포함하는 규칙만 표시하려면 규칙 필터 상자에 Mountain-200을 입력합니다. 그러면 뷰어에 "Mountain-200"이라는 단어를 포함하는 규칙만 표시됩니다. 각 규칙을 사용하여 다른 항목의 존재를 기반으로 트랜잭션에 있는 특정 항목의 존재 여부를 예측할 수 있습니다. 예를 들어 첫 번째 규칙은 Mountain-200 자전거와 물병을 구입한 사람이 Mountain 물병 케이지도 함께 구입할 확률이 1임을 나타냅니다.

종속성 네트워크 탭

종속성 네트워크 탭을 사용하여 모델에 있는 여러 항목의 상호 작용을 조사할 수 있습니다. 뷰어의 각 노드는 항목을 나타냅니다. 예를 들어 Mountain-200 = Existing 노드는 트랜잭션에 Mountain-200이 존재함을 나타냅니다. 노드를 선택하면 탭 맨 아래의 색 범례를 사용하여 다른 항목이 모델의 다른 항목을 결정하는지 또는 모델의 다른 항목에 의해 결정되는지 확인할 수 있습니다.

슬라이더는 규칙의 확률과 연결됩니다. 슬라이더를 위나 아래로 이동하여 필터로 약한 연결을 제외할 수 있습니다. 예를 들어 표시 상자에서 특성 이름만 표시를 선택한 다음 Mountain Bottle Cage 노드를 클릭합니다. 뷰어는 Mountain 물병 케이지가 물병과 Mountain-200 자전거를 예측할 뿐 아니라 이들 항목에 의해 예측되기도 함을 보여 줍니다. 이는 이러한 항목이 트랜잭션에 함께 나타날 가능성이 높음을 의미합니다. 즉, 자전거를 구입하는 고객이 물병 케이지와 물병을 함께 구입할 가능성이 높습니다.

다음 단원

5단원: 시퀀스 클러스터링 시나리오 구축