4 단원: Market Basket 예측 실행

 

적용 대상: SQL Server 2016 Preview

이 단원에서는 사용 하 여 DMX 선택 에서 만든 연결을 기반으로 예측을 만드는 문을 모델링 2 단원: 시장 바구니 마이닝 구조에 마이닝 모델 추가합니다. 예측 쿼리는 DMX를 사용 하 여 만들어집니다 선택 문을 추가 하는 PREDICTION JOIN 절. 예측 조인의 구문에 대 한 자세한 내용은 참조 SELECT FROM &# 60까지; 모델 > 예측 조인 ( DMX )합니다.

SELECT FROM PREDICTION JOIN 형태의 선택 문을 세 부분으로 이루어져:

  • 결과 집합에 반환된 마이닝 모델 열 및 예측 함수 목록. 이 목록에는 원본 데이터의 입력 열도 포함될 수 있습니다.

  • 예측을 만드는 데 사용되는 데이터를 정의하는 원본 쿼리. 예를 들어 일괄 처리로 많은 예측을 만드는 경우 원본 쿼리가 고객 목록을 검색할 수 있습니다.

  • 마이닝 모델 열과 원본 데이터 간의 매핑. 열 이름이 일치 하는 경우 사용할 수 있습니다는 NATURAL PREDICTION JOIN 구문 및 열 매핑을 생략할 합니다.

예측 함수를 사용하여 쿼리를 개선할 수 있습니다. 예측 함수는 예측 사항의 발생 확률과 같은 추가 정보를 제공하거나 학습 데이터 집합의 예측에 대한 지원을 제공합니다. 예측 함수에 대 한 자세한 내용은 참조 함수 ( DMX )합니다.

SQL Server Data Tools(SSDT)에서 예측 쿼리 작성기를 사용하여 예측 쿼리를 만들 수도 있습니다.

첫 번째 단계는 단일 쿼리를 사용 하 여 만드는 SELECT FROM PREDICTION JOIN 구문 및 값의 단일 집합을 입력으로 제공 합니다. 다음은 단일 문의 일반적인 예입니다.

SELECT <select list>  
    FROM [<mining model>]   
[NATURAL] PREDICTION JOIN  
(SELECT '<value>' AS [<column>],   
    (SELECT 'value' AS [<nested column>] UNION  
        SELECT 'value' AS [<nested column>] ...)   
    AS [<nested table>])  
AS [<input alias>]  

코드의 첫 번째 줄에서는 쿼리가 반환하는 마이닝 모델의 열을 정의하고 예측을 생성하는 데 사용되는 마이닝 모델의 이름을 지정합니다.

SELECT <select list> FROM [<mining model>]   

코드의 다음 줄은 수행할 작업을 나타냅니다. 각 열에 값을 지정 하 고 모델과 일치 하도록 정확한 열 이름을 입력을 사용할 수 있습니다는 NATURAL PREDICTION JOIN 구문입니다. 그러나 열 이름이 다른 경우, 해야 추가 하 여 새 데이터에서 모델의 열과 열 간의 매핑을 지정 하는 ON 절.

[NATURAL] PREDICTION JOIN  

코드의 다음 줄에서는 고객이 추가할 추가 제품 예측에 사용할 시장 바구니 제품을 정의합니다.

(SELECT '<value>' AS [<column>],   
    (SELECT 'value' AS [<nested column>] UNION  
        SELECT 'value' AS [<nested column>] ...)   
    AS [<nested table>])  

이 단원에서는 다음 태스크를 수행합니다.

  • 시장 바구니에 이미 있는 항목을 기반으로 고객이 구매할 가능성이 높은 다른 항목을 예측하는 쿼리를 만듭니다. 기본 마이닝 모델을 사용 하 여이 쿼리를 만듭니다 MINIMUM_PROBABILITY합니다.

  • 시장 바구니에 이미 있는 항목을 기반으로 고객이 구매할 가능성이 높은 다른 항목을 예측하는 쿼리를 만듭니다. 이 쿼리는 다른 모델을 기반으로 MINIMUM_PROBABILITY 가 0.01로 설정 되었습니다. 기본 값을 포함 하기 때문에 MINIMUM_PROBABILITY 연결 모델에서은 0.3,이 모델에 대 한 쿼리는 기본 모델에서 쿼리보다 가능성이 높은 항목을 반환 해야 합니다.

연결 쿼리를 만들려면

  1. 개체 탐색기, 의 인스턴스를 마우스 오른쪽 단추로 클릭 Analysis Services, 가리킨 새 쿼리, 를 클릭 하 고 DMX 쿼리 편집기를 엽니다.

  2. 일반적인 예 복사는 PREDICTION JOIN 를 빈 쿼리에 문입니다.

  3. 다음 내용을

    <select list>   
    
    

    다음 구문으로 바꿉니다.

    PREDICT([Default Association].[Products],INCLUDE_STATISTICS,3)  
    
    

    열 이름 [Products]를 포함할 수 있습니다을 사용 하 여는 Predict ( DMX ) 함수를 3 개로 알고리즘에 의해 반환 되는 제품의 수를 제한할 수 있습니다. 사용할 수도 있습니다 INCLUDE_STATISTICS, 지원, 확률 및 각 제품에 대 한 조정 된 확률을 반환 하는 합니다. 이러한 통계를 사용하면 예측 정확도의 등급을 매길 수 있습니다.

  4. 다음 내용을

    [<mining model>]   
    
    

    다음 구문으로 바꿉니다.

    [Default Association]  
    
    
  5. 다음 내용을

    (SELECT '<value>' AS [<column>],   
        (SELECT 'value' AS [<nested column>] UNION  
            SELECT 'value' AS [<nested column>] ...)   
        AS [<nested table>])  
    
    

    다음 구문으로 바꿉니다.

    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]  
      UNION SELECT 'Mountain Tire Tube' AS [Model]  
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t  
    
    

    이 문을 사용 하는 UNION 예측 된 제품과 함께 시장 바구니에 포함 해야 하는 세 가지 제품을 지정 하는 문입니다. 모델 열에는 선택 문은 중첩 된 제품 테이블에 포함 된 모델 열에 해당 합니다.

    이제 전체 문이 다음과 같아야 합니다.

    SELECT  
      PREDICT([Default Association].[Products],INCLUDE_STATISTICS,3)  
    From  
      [Default Association]  
    NATURAL PREDICTION JOIN  
    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]  
      UNION SELECT 'Mountain Tire Tube' AS [Model]  
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t  
    
    
  6. 파일 메뉴에서 다른 이름으로 DMXQuery1.dmx 저장을 클릭합니다.

  7. 다른 이름으로 저장 대화 상자에서 적절 한 폴더로 이동 하 고 파일 이름을 Association Prediction.dmx합니다.

  8. 도구 모음에서 실행 단추를 클릭합니다.

    세 가지 제품을 포함 하는 테이블을 반환 하는 쿼리: HL Mountain Tire, Fender 설정-Mountain 및 ML Mountain Tire 합니다. 테이블에는 반환된 이러한 제품이 확률 순서대로 나열됩니다. 반환된 제품 중 쿼리에 지정된 세 개의 제품과 동일한 시장 바구니에 포함될 가능성이 가장 높은 제품이 테이블 맨 위에 표시됩니다. 그 다음에 오는 두 개의 제품은 시장 바구니에 포함될 가능성이 다음으로 높은 제품입니다. 이 테이블은 예측의 정확도를 설명하는 통계도 포함합니다.

연결 쿼리를 만들려면

  1. 개체 탐색기, 의 인스턴스를 마우스 오른쪽 단추로 클릭 Analysis Services, 가리킨 새 쿼리, 를 클릭 하 고 DMX쿼리 편집기를 엽니다.

  2. 일반적인 예 복사는 PREDICTION JOIN 를 빈 쿼리에 문입니다.

  3. 다음 내용을

    <select list>   
    
    

    다음 구문으로 바꿉니다.

    PREDICT([Modified Association].[Products],INCLUDE_STATISTICS,3)  
    
    
  4. 다음 내용을

    [<mining model>]   
    
    

    다음 구문으로 바꿉니다.

    [Modified Association]  
    
    
  5. 다음 내용을

    (SELECT '<value>' AS [<column>],   
        (SELECT 'value' AS [<nested column>] UNION  
            SELECT 'value' AS [<nested column>] ...)   
        AS [<nested table>])  
    
    

    다음 구문으로 바꿉니다.

    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]  
      UNION SELECT 'Mountain Tire Tube' AS [Model]  
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t  
    
    

    이 문을 사용 하는 UNION 예측 된 제품과 함께 시장 바구니에 포함 해야 하는 세 가지 제품을 지정 하는 문입니다. [Model] 열에는 선택 문은 중첩 된 제품 테이블의 열에 해당 합니다.

    이제 전체 문이 다음과 같아야 합니다.

    SELECT  
      PREDICT([Modified Association].[Products],INCLUDE_STATISTICS,3)  
    From  
      [Modified Association]  
    NATURAL PREDICTION JOIN  
    (SELECT (SELECT 'Mountain Bottle Cage' AS [Model]  
      UNION SELECT 'Mountain Tire Tube' AS [Model]  
      UNION SELECT 'Mountain-200' AS [Model]) AS [Products]) AS t  
    
    
  6. 파일 메뉴에서 다른 이름으로 DMXQuery1.dmx 저장을 클릭합니다.

  7. 다른 이름으로 저장 대화 상자에서 적절 한 폴더로 이동 하 고 파일 이름을 Association Prediction.dmx 수정합니다.

  8. 도구 모음에서 실행 단추를 클릭합니다.

    세 가지 제품을 포함 하는 테이블을 반환 하는 쿼리: HL Mountain Tire, Water Bottle 및 Fender 산 설정 합니다. 테이블에는 이러한 제품이 확률 순서대로 나열됩니다. 테이블 맨 위에 나타나는 제품은 쿼리에 지정된 세 개의 제품과 동일한 시장 바구니에 포함될 가능성이 가장 높은 제품입니다. 나머지 제품은 시장 바구니에 포함될 가능성이 다음으로 높은 제품입니다. 이 테이블은 예측의 정확도를 설명하는 통계도 포함합니다.

    볼 수 있듯이 쿼리의이 결과의 값은 MINIMUM_PROBABILITY 매개 변수가 있는 쿼리에 의해 반환 된 결과 영향을 줍니다.

이 단원은 Market Basket 자습서의 마지막 단계입니다. 이제 고객이 동시에 구매할 수 있는 제품을 예측하는 데 사용할 수 있는 모델 집합이 완료되었습니다.

다른 예측 시나리오에서 DMX를 사용 하는 방법을 알아보려면 다음을 참조 Bike Buyer DMX 자습서합니다.

연결 모델 쿼리 예제
데이터 마이닝 쿼리 도구

표시: