1단원: Bike Buyer 마이닝 구조 만들기

이 단원에서는 Adventure Works Cycles의 잠재 고객이 자전거를 구입할 것인지 여부를 예측할 수 있는 마이닝 구조를 만듭니다. 마이닝 구조와 데이터 마이닝에서의 마이닝 구조 역할에 익숙하지 않은 경우 마이닝 구조(Analysis Services - 데이터 마이닝)를 참조하십시오.

이 단원에서 만들 Bike Buyer 마이닝 구조는 Microsoft 클러스터링 알고리즘Microsoft 의사 결정 트리 알고리즘 기반 마이닝 모델 추가 작업을 지원합니다. 이후 단원에서는 클러스터링 마이닝 모델을 사용하여 고객을 그룹화할 수 있는 다양한 방법을 탐색하고 의사 결정 트리 마이닝 모델을 사용하여 잠재 고객이 자전거를 구입할 것인지 여부를 예측합니다.

CREATE MINING STRUCTURE 문

마이닝 구조를 만들려면 CREATE MINING STRUCTURE(DMX) 문을 사용합니다. 이 문의 코드는 다음 부분으로 나눌 수 있습니다.

  • 구조 이름을 지정합니다.

  • 키 열을 정의합니다.

  • 마이닝 열을 정의합니다.

  • 선택적 테스트 데이터 집합을 정의합니다.

다음은 CREATE MINING STRUCTURE 문의 일반적인 예입니다.

CREATE MINING STRUCTURE [<mining structure name>]
(
    <key column>,
    <mining structure columns>
) 
WITH HOLDOUT (<holdout specifier>)

코드의 첫 번째 줄에서는 구조의 이름을 정의합니다.

CREATE MINING STRUCTURE [<mining structure name>]

DMX(Data Mining Extensions)에서 개체 이름을 지정하는 방법은 식별자(DMX)를 참조하십시오.

코드의 다음 줄에서는 원본 데이터의 엔터티를 고유하게 식별하는 마이닝 구조에 대한 키 열을 정의합니다.

<key column>,

마이닝 구조에서 원본 데이터의 엔터티를 정의하는 고객 식별자(CustomerKey)를 만듭니다.

코드의 다음 줄은 마이닝 구조와 연결된 마이닝 모델에서 사용할 마이닝 열을 정의하는 데 사용됩니다.

<mining structure columns>

<mining structure columns> 내에 다음 구문과 같은 DISCRETIZE 함수를 사용하여 연속 열을 불연속화할 수 있습니다.

DISCRETIZE(<method>,<number of buckets>)

열 분할 방법은 분할 방법(데이터 마이닝)을 참조하십시오. 정의할 수 있는 마이닝 구조 열 유형에 대한 자세한 내용은 마이닝 구조 열을 참조하십시오.

코드의 마지막 줄에서는 마이닝 구조의 선택적 파티션을 정의합니다.

WITH HOLDOUT (<holdout specifier>)

구조와 관련된 테스트 마이닝 모델에 사용할 일부 데이터를 지정하면 나머지 데이터는 모델 학습에 사용됩니다. 기본적으로 Analysis Services는 모든 사례 데이터의 30%를 포함하는 테스트 데이터 집합을 만듭니다. 테스트 데이터 집합이 사례의 30%(최대 1000개의 사례)를 포함해야 하는 사양을 추가합니다. 사례의 30%가 1000개보다 작으면 테스트 데이터 집합에 보다 적은 양이 포함됩니다.

단원 태스크

이 단원에서는 다음 태스크를 수행합니다.

  • 비어 있는 새 쿼리를 만듭니다.

  • 마이닝 구조를 만들기 위해 쿼리를 변경합니다.

  • 쿼리를 실행합니다.

쿼리 만들기

첫 번째 단계는 Analysis Services 인스턴스에 연결하고 SQL Server Management Studio에서 새 DNX 쿼리를 만드는 것입니다.

SQL Server Management Studio에서 새 DMX 쿼리를 만들려면

  1. SQL Server Management Studio를 엽니다.

  2. 서버에 연결 대화 상자에서 서버 유형으로 Analysis Services를 선택합니다. 서버 이름에 LocalHost를 입력하거나 이 단원에서 연결할 Analysis Services 인스턴스의 이름을 입력합니다. 연결을 클릭합니다.

  3. 개체 탐색기에서 Analysis Services의 인스턴스를 마우스 오른쪽 단추로 클릭하고 새 쿼리를 가리킨 다음 DMX를 클릭하여 쿼리 편집기와 비어 있는 새 쿼리를 엽니다.

쿼리 변경

다음 단계는 Bike Buyer 마이닝 구조를 만들기 위해 위에서 설명한 CREATE MINING STRUCTURE 문을 수정하는 것입니다.

CREATE MINING STRUCTURE 문을 사용자 지정하려면

  1. 쿼리 편집기에서 CREATE MINING STRUCTURE 문의 일반적인 예를 빈 쿼리에 복사합니다.

  2. 다음 내용을

    [<mining structure>] 
    

    다음 구문으로 바꿉니다.

    [Bike Buyer]
    
  3. 다음 내용을

    <key column> 
    

    다음 구문으로 바꿉니다.

    CustomerKey LONG KEY
    
  4. 다음 내용을

    <mining structure columns> 
    

    다음 구문으로 바꿉니다.

       [Age] LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned] LONG DISCRETE,
       [Number Children At Home] LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    
  5. 다음 내용을

    WITH HOLDOUT (holdout specifier>)
    

    다음 구문으로 바꿉니다.

    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    

    이제 전체 문이 다음과 같아야 합니다.

    CREATE MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key] LONG KEY,
       [Age]LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned]LONG DISCRETE,
       [Number Children At Home]LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    )
    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    
  6. 파일 메뉴에서 다른 이름으로 DMXQuery1.dmx 저장을 클릭합니다.

  7. 다른 이름으로 저장 대화 상자에서 해당 폴더로 이동한 다음 파일 이름을 Bike Buyer Structure.dmx로 지정합니다.

쿼리 실행

마지막 단계는 쿼리를 실행하는 것입니다. 쿼리를 만들고 저장한 다음에는 해당 쿼리를 실행해야 합니다. 즉, 서버에 마이닝 구조를 만들려면 해당 문을 실행해야 합니다. 쿼리 편집기에서 쿼리를 실행하는 방법은 데이터베이스 엔진 쿼리 편집기(SQL Server Management Studio)를 참조하십시오.

쿼리를 실행하려면

  • 쿼리 편집기의 도구 모음에서 실행을 클릭합니다.

    문의 실행이 끝나면 쿼리 상태가 쿼리 편집기 아래쪽의 메시지 탭에 표시됩니다. 메시지는 다음과 같아야 합니다.

    Executing the query 
    Execution complete
    

    이제 Bike Buyer라는 새 구조가 서버에 있습니다.

다음 단원에서는 방금 만든 구조에 마이닝 모델을 추가합니다.

다음 단원

2단원: Bike Buyer 마이닝 구조에 마이닝 모델 추가