시장 바구니 모델 탐색(중급 데이터 마이닝 자습서)

이제 Association 모델을 구축했으므로 데이터 마이닝 디자이너의 마이닝 모델 뷰어 탭에 있는 Microsoft 연결 뷰어를 사용하여 탐색할 수 있습니다. 이 자습서는 뷰어를 사용하여 항목 간 관계를 탐색하는 단계를 안내합니다. 뷰어에서는 함께 나타나는 경향이 있는 제품을 한 눈에 확인하고, 나타나는 패턴을 파악할 수 있습니다.

Microsoft 연결 뷰어에는 세 개의 탭인 규칙, 항목 집합종속성 네트워크가 있습니다. 각 탭에서 데이터를 약간씩 다르게 표시하기 때문에 모델을 탐색할 때는 일반적으로 내용을 제대로 파악하기 위해 서로 다른 창을 여러 번 앞뒤로 이동합니다.

  • 종속성 네트워크 탭

  • 항목 집합 탭

  • 규칙 탭

  • 일반 콘텐츠 뷰

이 자습서에서는 종속성 네트워크 탭에서 시작하여 규칙 탭 및 항목 집합 탭을 사용하여 뷰어에 표시된 관계에 대해 보다 자세히 알아봅니다. 또한 Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 개별 규칙 또는 항목 집합에 대한 세부 통계를 검색합니다.

종속성 네트워크 탭

종속성 네트워크 탭을 사용하여 모델에 있는 여러 항목의 상호 작용을 조사할 수 있습니다. 뷰어의 각 노드는 항목을 나타내고 항목 사이의 선은 규칙을 나타냅니다. 노드를 선택하면 선택된 항목을 예측하는 다른 노드나 현재 항목이 예측하는 항목을 확인할 수 있습니다. 항목 간에 양방향 연결이 있는 경우(같은 트랜잭션에 자주 나타남)도 있습니다. 탭 아래쪽에 있는 색 범례를 참조하여 연결의 방향을 확인할 수 있습니다.

두 항목을 연결하는 선은 이러한 항목이 트랜잭션에 함께 나타날 가능성이 높음을 의미합니다. 즉, 고객이 이러한 항목을 함께 구매할 가능성이 높음을 의미합니다. 슬라이더는 규칙의 확률과 연결됩니다. 슬라이더를 위나 아래로 이동하여 필터로 약한 연결(확률이 낮은 규칙)을 제외할 수 있습니다.

종속성 네트워크 그래프에서는 논리적으로 A->B로 나타낼 수 있는 두 개의 항목으로 구성된 규칙 쌍을 보여 줍니다. A->B는 제품 A를 구매한 경우 제품 B를 구매할 확률이 높음을 의미합니다. 그래프에서는 AB->C 형식의 규칙은 표시하지 않습니다. 모든 규칙을 표시하기 위해 슬라이더를 이동하지만 그래프에 어떤 선도 표시되지 않는 경우 알고리즘 매개 변수의 조건에 맞는 규칙 쌍이 없음을 의미합니다.

또한 특성 이름의 첫 문자를 입력하여 이름별로 노드를 찾을 수 있습니다. 자세한 내용은 노드 찾기 대화 상자(마이닝 모델 뷰어)를 참조하십시오.

Microsoft 연결 규칙 뷰어에서 연결 모드를 열려면

  1. 솔루션 탐색기에서 Association 구조를 두 번 클릭합니다.

  2. 데이터 마이닝 디자이너에서 마이닝 모델 뷰어 탭을 클릭합니다.

  3. 마이닝 모델 드롭다운 목록의 마이닝 모델 목록에서 Association을 선택합니다.

종속성 그래프를 탐색하고 특정 노드를 찾으려면

  1. 마이닝 모델 뷰어 탭에서 종속성 네트워크 탭을 클릭합니다.

  2. 각 노드에 대한 레이블을 쉽게 볼 수 있을 때까지 확대를 여러 번 클릭합니다.

    기본적으로 모든 노드가 표시되어 있는 그래프가 나타납니다. 복잡한 모델에서는 노드 수가 많아 각 노드의 크기가 매우 작을 수 있습니다.

  3. 뷰어의 오른쪽 아래 모퉁이에서 + 기호를 클릭하고 마우스 단추를 누른 채로 그래프의 위/아래로 이동합니다.

  4. 뷰어의 왼쪽에서 슬라이더를 아래로 끌어 모든 링크(기본값)에서 슬라이더 컨트롤 아래로 이동합니다.

  5. 뷰어는 그래프를 업데이트하여 가장 강력한 연결인 Touring Tire 항목과 Touring Tire Tube 항목 간의 연결만 표시합니다.

  6. Touring Tire Tube = Existing이라는 레이블이 지정된 노드를 클릭합니다.

    그래프가 업데이트되어 이 항목과 강력하게 연결되는 항목만 강조 표시합니다. 두 항목 사이의 화살표 방향을 확인하십시오.

  7. 뷰어의 왼쪽에서 슬라이더를 다시 위로 끌어 아래에서 중간 근처로 이동합니다.

    두 항목을 연결하는 화살표의 변경 내용을 확인하십시오.

  8. 종속성 네트워크 창의 맨 위에 있는 드롭다운 목록에서 특성 이름만 표시를 선택합니다.

    그래프의 텍스트 레이블이 업데이트되어 모델 이름만 표시합니다.

맨 위로 이동

항목 집합 탭

다음으로 Touring Tire 및 Touring Tire Tube 제품에 대한 모델로 생성된 규칙 및 항목 집합에 대해 좀 더 자세히 배웁니다. 항목 집합 탭에는 Microsoft 연결 알고리즘에서 검색하는 항목 집합과 관련된 다음과 같은 세 가지 중요 정보가 표시됩니다.

  • **지원:    **항목 집합이 발생하는 트랜잭션 수입니다.

  • **크기:    **항목 집합에 있는 항목 수입니다.

  • **항목:    **각 항목 집합에 포함된 항목 목록입니다.

알고리즘 매개 변수가 설정된 방식에 따라 알고리즘에서 많은 항목 집합을 생성할 수 있습니다. 뷰어에 반환되는 각 항목 집합은 항목이 판매된 트랜잭션을 나타냅니다. 항목 집합 탭 맨 위의 컨트롤을 사용하면 뷰어를 필터링하여 지정된 최소 지원 및 항목 집합 크기를 포함하는 항목 집합만 표시할 수 있습니다.

다른 마이닝 모델을 사용하고 있는데 항목 집합이 나열되지 않는 경우 알고리즘 매개 변수의 조건에 맞는 항목 집합이 없기 때문입니다. 이러한 시나리오에서는 지원이 낮은 항목 집합을 허용하도록 알고리즘 매개 변수를 변경할 수 있습니다.

뷰어에 표시되는 항목 집합을 이름별로 필터링하려면

  1. 뷰어의 항목 집합 탭을 클릭합니다.

  2. 항목 집합 필터 상자에서 Touring Tire를 입력한 다음 상자 바깥쪽을 클릭합니다.

    필터가 이 문자열이 포함된 항목을 모두 반환합니다.

  3. 표시 목록에서 특성 이름만 표시를 선택합니다.

  4. 긴 이름 표시 확인란을 선택합니다.

    항목 집합 목록이 업데이트되어 Touring Tire라는 문자열이 있는 항목 집합만 표시합니다. 항목 집합의 긴 이름에는 각 항목에 대한 특성 및 값이 들어 있는 테이블의 이름이 포함되어 있습니다.

  5. 긴 이름 표시 확인란의 선택을 취소합니다.

    항목 집합 목록이 업데이트되어 짧은 이름만 표시합니다.

지원 열의 값은 각 항목 집합에 대한 트랜잭션 수를 나타냅니다. 항목 집합에 대한 트랜잭션은 항목 집합의 모든 항목이 포함된 구매를 의미합니다.

기본적으로 뷰어는 항목 집합을 지원별로 내림차순으로 나열합니다. 열 머리글을 클릭하여 항목 집합 크기 또는 이름과 같은 다른 열별로 정렬할 수 있습니다. 항목 집합에 포함된 개별 트랜잭션에 대해 좀 더 자세히 알아보려는 경우 항목 집합에서 개별 사례로 드릴스루할 수 있습니다. 드릴스루 결과의 구조 열은 모델에 사용되지 않은 고객의 소득 수준 및 고객 ID입니다.

항목 집합의 정보를 보려면

  1. 항목 집합 목록에서 이름별로 정렬할 항목 집합 열 머리글을 클릭합니다.

  2. Touring Tire 항목(두 번째 항목 없음)을 찾습니다.

  3. Touring Tire 항목을 마우스 오른쪽 단추로 클릭하고 드릴스루를 선택한 다음 모델 및 구조 열을 선택합니다.

    드릴스루 대화 상자에서 이 항목 집합에 대한 지원으로 사용되는 개별 트랜잭션을 표시합니다.

  4. 중첩 테이블 vAssocSeqLineItems를 확장하여 트랜잭션에 있는 구매의 실제 목록을 확인합니다.

항목 집합을 지원 또는 크기별로 필터링하려면

  1. 항목 집합 필터 상자에 있을 수 있는 텍스트를 지웁니다. 텍스트 필터와 숫자 필터를 함께 사용할 수 없습니다.

  2. 최소 지원 상자에서 100을 입력한 다음 뷰어의 배경을 클릭합니다.

    항목 집합 목록이 업데이트되어 적어도 100개 이상 지원되는 항목 집합만 표시합니다.

맨 위로 이동

규칙 탭

규칙 탭에는 알고리즘에서 찾는 규칙과 관련된 다음 정보가 표시됩니다.

  • **확률:    **왼쪽 항목에 대한 오른쪽 항목의 확률로 정의되는 규칙의 유사도입니다.

  • **중요도:    **규칙 유용성을 나타내는 척도로 값이 클수록 더 나은 규칙을 의미합니다.

    중요도는 확률만 보면 오해가 발생할 수 있으므로 규칙의 유용성을 측정할 수 있도록 제공됩니다. 예를 들어 모든 트랜잭션에 물병이 포함되어 있는 경우(물병이 홍보의 일환으로 각 고객의 시장 바구니에 자동으로 추가된 경우) 모델은 물병의 확률이 1이라고 예측하는 규칙을 만듭니다. 확률만 봐서는 이 규칙이 매우 정확하지만 유용한 정보를 제공하지는 않습니다.

  • **규칙:    **규칙에 대한 정의입니다. 시장 바구니 모델의 경우 규칙은 항목의 특정 조합을 설명합니다.

각 규칙을 사용하여 다른 항목의 존재를 기반으로 트랜잭션에 있는 특정 항목의 존재 여부를 예측할 수 있습니다. 항목 집합 탭과 마찬가지로 가장 관심 있는 규칙만 표시되도록 규칙을 필터링할 수 있습니다. 규칙이 없는 마이닝 모델을 사용하고 있는 경우 알고리즘 매개 변수를 변경하여 규칙에 대한 확률 임계값을 낮게 설정할 수 있습니다.

Mountain-200 자전거를 포함하는 규칙만 표시하려면

  1. 마이닝 모델 뷰어 탭에서 규칙 탭을 클릭합니다.

  2. 규칙 필터 상자에 Mountain-200을 입력합니다.

    긴 이름 표시 확인란의 선택을 취소합니다.

  3. 표시 목록에서 특성 이름만 표시를 선택합니다.

    그러면 뷰어에 "Mountain-200"이라는 단어를 포함하는 규칙만 표시됩니다. 규칙의 확률은 Mountain-200 자전거를 구매한 사람이 나열된 다른 제품도 구매할 가능성을 표시합니다.

규칙은 확률별로 내림차순으로 정렬되지만 열 머리글을 클릭하여 정렬 순서를 변경할 수 있습니다. 특정 규칙에 대한 자세한 내용을 확인하려면 드릴스루를 사용하여 지원하는 사례를 봅니다.

특정 규칙을 지원하는 사례를 보려면

  1. 규칙 탭에서 볼 규칙을 마우스 오른쪽 단추로 클릭합니다.

  2. 드릴스루를 선택한 다음 모델 열만 또는 모델 및 구조 열을 선택합니다.

    드릴스루 대화 상자는 창의 맨 위에 규칙에 대한 요약을 제공하고 규칙에 대한 지원 데이터로 사용된 모든 사례의 목록을 제공합니다.

맨 위로 이동

일반 콘텐츠 트리 뷰어

이 뷰어는 알고리즘이나 모델 유형에 관계없이 모든 모델에 사용할 수 있습니다. Microsoft 일반 콘텐츠 트리 뷰어뷰어 드롭다운 목록에서 사용할 수 있습니다.

콘텐츠 트리는 마이닝 모델을 일련의 노드로 표시합니다. 여기서 각 노드는 데이터의 일부 하위 집합에 대해 배운 정보를 나타냅니다. 노드에는 패턴, 일련의 규칙, 클러스터 또는 일부 특징을 공유하는 날짜 범위의 정의가 포함될 수 있습니다. 노드의 정확한 콘텐츠는 예측 가능한 특성의 유형 및 알고리즘에 따라 다르지만 콘텐츠의 일반적인 표시는 동일합니다. 각 노드를 확장하여 세부 수준을 높이고 노드의 콘텐츠를 클립보드로 복사할 수 있습니다.

콘텐츠 뷰어를 사용하여 규칙에 대한 자세한 내용을 확인하려면

  1. 마이닝 모델 뷰어 탭의 뷰어 목록에서 Microsoft 일반 콘텐츠 트리 뷰어를 선택합니다.

  2. 노드 캡션 창에서 목록의 맨 아래로 스크롤하고 마지막 노드를 클릭합니다.

    뷰어는 먼저 항목 집합을 표시하고 그 다음으로 규칙을 표시하지만 이들을 그룹화하지 않습니다. 특정 노드를 가장 쉽게 찾는 방법은 내용 쿼리를 만드는 것입니다. 자세한 내용은 연결 모델 쿼리 예제를 참조하십시오.

  3. 노드 정보 창에서 NODE_TYPE 및 NODE_DESCRIPTION에 대한 값을 검토합니다.

    노드 유형 8은 규칙이고 노드 유형 7은 항목 집합입니다. 규칙에서 NODE_DESCRIPTION 값은 규칙을 구성하는 조건을 표시합니다. 항목 집합에서 NODE_DESCRIPTION 값은 항목 집합에 포함된 항목을 표시합니다.

또한 내용 쿼리를 만들어 규칙에 대한 자세한 통계를 가져올 수 있습니다. 마이닝 모델 콘텐츠 및 이를 해석하는 방법은 연결 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하십시오.

맨 위로 이동

단원의 다음 태스크

마이닝 모델의 중첩 테이블 필터링(중급 데이터 마이닝 자습서)

참고 항목

참조

Microsoft 연결 알고리즘 기술 참조

개념

3단원: 시장 바구니 시나리오 구축(중급 데이터 마이닝 자습서)

4단원: 시퀀스 클러스터링 시나리오 구축(중급 데이터 마이닝 자습서)

Microsoft 연결 알고리즘