시장 바구니 모델 탐색(중급 데이터 마이닝 자습서)

 

적용 대상: SQL Server 2016 Preview

작성 한 했으므로 연결 모델을 탐색할 수 있습니다를 사용 하 여는 Microsoft 연결 뷰어를는 마이닝 모델 뷰어 데이터 마이닝 디자이너의 탭 합니다. 이 자습서는 뷰어를 사용하여 항목 간 관계를 탐색하는 단계를 안내합니다. 뷰어에서는 함께 나타나는 경향이 있는 제품을 한 눈에 확인하고, 나타나는 패턴을 파악할 수 있습니다.

Microsoft 연결 뷰어에: 규칙, 항목 집합, 및 종속성 네트워크합니다. 각 탭에서 데이터를 약간씩 다르게 표시하기 때문에 모델을 탐색할 때는 일반적으로 내용을 제대로 파악하기 위해 서로 다른 창을 여러 번 앞뒤로 이동합니다.

  • 종속성 네트워크 탭

  • 항목 집합 탭

  • 규칙 탭

  • 일반 콘텐츠 뷰

이 자습서에서는 먼저에 종속성 네트워크 탭을 사용 하 여는 규칙 탭 및 항목 집합 탭 뷰어에 표시 된 관계 이해 합니다. 사용할 수는 Microsoft 일반 콘텐츠 트리 뷰어 개별 규칙 또는 항목 집합에 대 한 자세한 통계를 검색할 수 있습니다.

종속성 네트워크 탭

종속성 네트워크 탭에서 모델의 다른 항목의 상호 작용을 조사할 수 있습니다. 뷰어의 각 노드는 항목을 나타내고 항목 사이의 선은 규칙을 나타냅니다. 노드를 선택하면 선택된 항목을 예측하는 다른 노드나 현재 항목이 예측하는 항목을 확인할 수 있습니다. 항목 간에 양방향 연결이 있는 경우(같은 트랜잭션에 자주 나타남)도 있습니다. 탭 아래쪽에 있는 색 범례를 참조하여 연결의 방향을 확인할 수 있습니다.

두 항목을 연결하는 선은 이러한 항목이 트랜잭션에 함께 나타날 가능성이 높음을 의미합니다. 즉, 고객이 이러한 항목을 함께 구매할 가능성이 높음을 의미합니다. 슬라이더는 규칙의 확률과 연결됩니다. 슬라이더를 위나 아래로 이동하여 필터로 약한 연결(확률이 낮은 규칙)을 제외할 수 있습니다.

종속성 네트워크 그래프에서는 논리적으로 A->B로 나타낼 수 있는 두 개의 항목으로 구성된 규칙 쌍을 보여 줍니다. A->B는 제품 A를 구매한 경우 제품 B를 구매할 확률이 높음을 의미합니다. 그래프에서는 AB->C 형식의 규칙은 표시하지 않습니다. 모든 규칙을 표시하기 위해 슬라이더를 이동하지만 그래프에 어떤 선도 표시되지 않는 경우 알고리즘 매개 변수의 조건에 맞는 규칙 쌍이 없음을 의미합니다.

또한 특성 이름의 첫 문자를 입력하여 이름별로 노드를 찾을 수 있습니다. 자세한 내용은 노드 찾기 대화 상자(마이닝 모델 뷰어)를 참조하세요.

Microsoft 연결 규칙 뷰어에서 연결 모드를 열려면

  1. 솔루션 탐색기, 연결 구조를 두 번 클릭 합니다.

  2. 데이터 마이닝 디자이너에서 마이닝 모델 뷰어 탭을 클릭합니다.

  3. 마이닝 모델 목록에서 연결을 선택 된 마이닝 모델 드롭다운 목록입니다.

종속성 그래프를 탐색하고 특정 노드를 찾으려면

  1. 마이닝 모델 뷰어 탭을 클릭 하는 종속성 네트워크 탭 합니다.

  2. 클릭 확대 여러 번까지 각 노드에 대 한 레이블을 쉽게 볼 수 있습니다.

    기본적으로 모든 노드가 표시되어 있는 그래프가 나타납니다. 복잡한 모델에서는 노드 수가 많아 각 노드의 크기가 매우 작을 수 있습니다.

  3. 클릭 된 + 그래프에서 이동 하 고 마우스 단추를 누르고 뷰어의 오른쪽 아래 모서리에 로그인 합니다.

  4. 뷰어의 왼쪽에서 슬라이더를 아래로 이동 끌어 모든 링크 (기본값)의 슬라이더 컨트롤의 아래쪽에 있습니다.

  5. 뷰어는 그래프를 업데이트하여 가장 강력한 연결인 Touring Tire 항목과 Touring Tire Tube 항목 간의 연결만 표시합니다.

  6. 레이블이 지정 된 노드를 클릭 Touring Tire Tube = Existing합니다.

    그래프가 업데이트되어 이 항목과 강력하게 연결되는 항목만 강조 표시합니다. 두 항목 사이의 화살표 방향을 확인하십시오.

  7. 뷰어의 왼쪽에서 슬라이더를 다시 위로 끌어 아래에서 중간 근처로 이동합니다.

    두 항목을 연결하는 화살표의 변경 내용을 확인하십시오.

  8. 선택 특성 이름만 표시 종속성 네트워크 창의 맨 위에 있는 드롭다운 목록에서.

    그래프의 텍스트 레이블이 업데이트되어 모델 이름만 표시합니다.

맨 위로 이동

항목 집합 탭

다음으로 Touring Tire 및 Touring Tire Tube 제품에 대한 모델로 생성된 규칙 및 항목 집합에 대해 좀 더 자세히 배웁니다. 항목 집합 탭 하는 항목 집합과 관련 된 정보의 세 가지 중요 한 부분을 표시 하는 Microsoft 연결 알고리즘에서 검색:

  • **지원:**항목 집합이 발생 하는 트랜잭션의 수입니다.

  • **크기:**항목 집합의 항목 수입니다.

  • **항목:**각 항목 집합에 포함 된 항목의 목록이 있습니다.

알고리즘 매개 변수가 설정된 방식에 따라 알고리즘에서 많은 항목 집합을 생성할 수 있습니다. 뷰어에 반환되는 각 항목 집합은 항목이 판매된 트랜잭션을 나타냅니다. 맨 위에 있는 컨트롤을 사용 하 여는 항목 집합 탭에서 뷰어는 지정된 된 최소 지원 및 항목 집합 크기를 포함 하는 항목 집합만 표시 하도록 필터링 할 수 있습니다.

다른 마이닝 모델을 사용하고 있는데 항목 집합이 나열되지 않는 경우 알고리즘 매개 변수의 조건에 맞는 항목 집합이 없기 때문입니다. 이러한 시나리오에서는 지원이 낮은 항목 집합을 허용하도록 알고리즘 매개 변수를 변경할 수 있습니다.

뷰어에 표시되는 항목 집합을 이름별로 필터링하려면

  1. 클릭 하 고 항목 집합 뷰어 탭 합니다.

  2. 항목 집합 필터 상자에 입력 합니다 Touring Tire, 다음 상자 바깥쪽을 클릭 합니다.

    필터가 이 문자열이 포함된 항목을 모두 반환합니다.

  3. 표시 목록에서 특성 이름만 표시합니다.

  4. 선택 된 긴 이름 표시 확인란입니다.

    항목 집합 목록이 업데이트되어 Touring Tire라는 문자열이 있는 항목 집합만 표시합니다. 항목 집합의 긴 이름에는 각 항목에 대한 특성 및 값이 들어 있는 테이블의 이름이 포함되어 있습니다.

  5. 지우기는 긴 이름 표시 확인란입니다.

    항목 집합 목록이 업데이트되어 짧은 이름만 표시합니다.

값은 지원 열의 각 항목 집합에 대 한 트랜잭션 수를 나타냅니다. 항목 집합에 대한 트랜잭션은 항목 집합의 모든 항목이 포함된 구매를 의미합니다.

기본적으로 뷰어는 항목 집합을 지원별로 내림차순으로 나열합니다. 열 머리글을 클릭하여 항목 집합 크기 또는 이름과 같은 다른 열별로 정렬할 수 있습니다. 항목 집합에 포함된 개별 트랜잭션에 대해 좀 더 자세히 알아보려는 경우 항목 집합에서 개별 사례로 드릴스루할 수 있습니다. 드릴스루 결과의 구조 열은 모델에 사용되지 않은 고객의 소득 수준 및 고객 ID입니다.

항목 집합의 정보를 보려면

  1. 항목 집합 목록에서 클릭 된 항목 집합 이름별로 정렬 하려면 열 머리글입니다.

  2. 해당 항목을 찾습니다 Touring Tire (으로 두 번째 항목 없음).

  3. 해당 항목을 마우스 오른쪽 단추로 클릭 Touring Tire, 선택, 드릴스루, 를 선택한 다음 모델 및 구조 열합니다.

    드릴스루 대화 상자에는이 항목 집합에 대 한 지원으로 사용 되는 개별 트랜잭션을 표시 됩니다.

  4. 중첩 테이블 vAssocSeqLineItems를 확장하여 트랜잭션에 있는 구매의 실제 목록을 확인합니다.

항목 집합을 지원 또는 크기별로 필터링하려면

  1. 일반에 있을 수 있는 모든 텍스트는 항목 집합 필터 상자입니다. 텍스트 필터와 숫자 필터를 함께 사용할 수 없습니다.

  2. 최소 지원 상자 100을 입력 한 다음 뷰어의 배경을 클릭 합니다.

    항목 집합 목록이 업데이트되어 적어도 100개 이상 지원되는 항목 집합만 표시합니다.

맨 위로 이동

규칙 탭

규칙 탭 알고리즘에서 발견 되는 규칙에 관련 된 다음 정보를 표시 합니다.

  • **확률:**는 가능성 에 왼쪽 항목을 따른 오른쪽 항목의 확률으로 정의 되는 규칙입니다.

  • **중요도:**규칙의 유용성에 대 한 측정입니다. 값이 클수록 더 나은 규칙을 의미합니다.

    중요도는 확률만 보면 오해가 발생할 수 있으므로 규칙의 유용성을 측정할 수 있도록 제공됩니다. 예를 들어 모든 트랜잭션에 물병이 포함되어 있는 경우(물병이 홍보의 일환으로 각 고객의 시장 바구니에 자동으로 추가된 경우) 모델은 물병의 확률이 1이라고 예측하는 규칙을 만듭니다. 확률만 봐서는 이 규칙이 매우 정확하지만 유용한 정보를 제공하지는 않습니다.

  • **규칙:**규칙의 정의입니다. 시장 바구니 모델의 경우 규칙은 항목의 특정 조합을 설명합니다.

각 규칙을 사용하여 다른 항목의 존재를 기반으로 트랜잭션에 있는 특정 항목의 존재 여부를 예측할 수 있습니다. 과 같이 항목 집합 탭에서 가장 흥미로운 규칙만 표시 되도록 규칙을 필터링 할 수 있습니다. 규칙이 없는 마이닝 모델을 사용하고 있는 경우 알고리즘 매개 변수를 변경하여 규칙에 대한 확률 임계값을 낮게 설정할 수 있습니다.

Mountain-200 자전거를 포함하는 규칙만 표시하려면

  1. 마이닝 모델 뷰어 탭을 클릭 하는 규칙 탭 합니다.

  2. 필터 규칙 상자에 입력 합니다 mountain-200합니다.

    지우기는 긴 이름 표시 확인란입니다.

  3. 표시 목록에서 특성 이름만 표시합니다.

뷰어를 이라는 단어를 포함 하는 규칙만 표시 한 다음 "**mountain-200**"입니다. 규칙의 확률 되었다는 가능성 있는 구매한는 **mountain-200** 자전거를 해당 사용자 나열 된 다른 제품을 구입도 합니다.  

규칙은 확률별로 내림차순으로 정렬되지만 열 머리글을 클릭하여 정렬 순서를 변경할 수 있습니다. 특정 규칙에 대한 자세한 내용을 확인하려면 드릴스루를 사용하여 지원하는 사례를 봅니다.

특정 규칙을 지원하는 사례를 보려면

  1. 규칙 탭에서 보려는 하는 규칙을 마우스 오른쪽 단추로 클릭 합니다.

  2. 선택 드릴스루, 를 선택한 다음 모델 열만, 또는 모델 및 구조 열합니다.

    드릴스루 대화 상자는 규칙에 대 한 지원 데이터로 사용 된 모든 경우의 목록과 다음 창의 맨 위에 규칙의 요약을 제공 합니다.

맨 위로 이동

일반 콘텐츠 트리 뷰어

이 뷰어는 알고리즘이나 모델 유형에 관계없이 모든 모델에 사용할 수 있습니다. Microsoft 일반 콘텐츠 트리 뷰어 에서 사용할 수는 뷰어 드롭 다운 목록입니다.

콘텐츠 트리는 마이닝 모델을 일련의 노드로 표시합니다. 여기서 각 노드는 데이터의 일부 하위 집합에 대해 배운 정보를 나타냅니다. 노드에는 패턴, 일련의 규칙, 클러스터 또는 일부 특징을 공유하는 날짜 범위의 정의가 포함될 수 있습니다. 노드의 정확한 콘텐츠는 예측 가능한 특성의 유형 및 알고리즘에 따라 다르지만 콘텐츠의 일반적인 표시는 동일합니다. 각 노드를 확장하여 세부 수준을 높이고 노드의 콘텐츠를 클립보드로 복사할 수 있습니다.

콘텐츠 뷰어를 사용하여 규칙에 대한 자세한 내용을 확인하려면

  1. 마이닝 모델 뷰어 탭에서 Microsoft 일반 콘텐츠 트리 뷰어 에서 뷰어 목록입니다.

  2. 노드 캡션 창에서 목록의 맨 아래로 스크롤하고 마지막 노드를 클릭합니다.

    뷰어는 먼저 항목 집합을 표시하고 그 다음으로 규칙을 표시하지만 이들을 그룹화하지 않습니다. 특정 노드를 가장 쉽게 찾는 방법은 내용 쿼리를 만드는 것입니다. 자세한 내용은 연결 모델 쿼리 예제를 참조하세요.

  3. 노드 정보 창에서 NODE_TYPE 및 NODE_DESCRIPTION에 대한 값을 검토합니다.

    노드 유형 8은 규칙이고 노드 유형 7은 항목 집합입니다. 규칙에서 NODE_DESCRIPTION 값은 규칙을 구성하는 조건을 표시합니다. 항목 집합에서 NODE_DESCRIPTION 값은 항목 집합에 포함된 항목을 표시합니다.

또한 내용 쿼리를 만들어 규칙에 대한 자세한 통계를 가져올 수 있습니다. 마이닝 모델 콘텐츠 및 해석 하는 방법에 대 한 자세한 내용은 참조 연결 모델 및 #40;에 대 한 마이닝 모델 콘텐츠 Analysis Services-데이터 마이닝 및 #41;합니다.

맨 위로 이동

단원의 다음 태스크

마이닝 모델 ( 중급 데이터 마이닝 자습서 )의 중첩된 테이블 필터링

관련 항목:

3단원: 시장 바구니 시나리오 구축(중급 데이터 마이닝 자습서)
4 단원: 시퀀스 클러스터링 시나리오 ( 중급 데이터 마이닝 자습서 ) 구축
Microsoft 연결 알고리즘
Microsoft 연결 알고리즘 기술 참조