CREATE MINING MODEL(DMX)

적용 대상: SQL Server Analysis Services

데이터베이스에 새 마이닝 모델과 마이닝 구조를 모두 만듭니다. 문에서 새 모델을 정의하거나 PMML(예측 모델 태그 언어)을 사용하여 모델을 만들 수 있습니다. 이 두 번째 옵션은 고급 사용자만을 위한 것입니다.

마이닝 구조는 모델 이름에 "_structure"를 추가하여 이름을 지정합니다. 그러면 구조체 이름이 모델 이름과 고유합니다.

기존 마이닝 구조에 대한 마이닝 모델을 만들려면 ALTER MINING STRUCTURE(DMX) 문을 사용합니다.

구문

  
CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>  

인수

model
모델의 고유 이름입니다.

열 정의 목록
열 정의의 쉼표로 구분된 목록입니다.

알고리즘
현재 공급자가 정의한 데이터 마이닝 알고리즘의 이름입니다.

참고 항목

현재 공급자가 지원하는 알고리즘 목록은 DMSCHEMA_MINING_SERVICES 행 집합을 사용하여 검색할 수 있습니다. Analysis Services의 현재 인스턴스에서 지원되는 알고리즘을 보려면 데이터 마이닝 속성을 참조 하세요.

매개 변수 목록
선택 사항. 알고리즘에 대한 공급자 정의 매개 변수의 쉼표로 구분된 목록입니다.

XML 문자열
(고급 용도로만 해당) XML로 인코딩된 모델(PMML)입니다. 문자열을 작은따옴표(')로 묶어야 합니다.

SESSION 절을 사용하면 연결이 닫히거나 세션 시간이 초과될 때 서버에서 자동으로 제거되는 마이닝 모델을 만들 수 있습니다. SESSION 마이닝 모델은 사용자가 데이터베이스 관리자가 될 필요가 없으며 연결이 열려 있는 한 디스크 공간만 사용하기 때문에 유용합니다.

WITH DRILLTHROUGH 절을 사용하면 새 마이닝 모델을 드릴스루할 수 있습니다. 드릴스루는 모델을 만들 때만 사용할 수 있습니다. 일부 모델 형식의 경우 사용자 지정 뷰어에서 모델을 찾아보려면 드릴스루가 필요합니다. Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 예측 또는 모델을 탐색하는 데 드릴스루가 필요하지 않습니다.

CREATE MINING MODEL 문은 열 정의 목록, 알고리즘 및 알고리즘 매개 변수 목록을 기반으로 하는 새 마이닝 모델을 만듭니다.

열 정의 목록

각 열에 대해 다음 정보를 포함하여 열 정의 목록을 사용하는 모델 구조를 정의합니다.

  • 이름(필수)

  • 데이터 형식(필수)

  • 배포

  • 모델링 플래그 목록

  • 내용 유형(필수)

  • PREDICT 또는 PREDICT_ONLY 절로 표시된 이 열을 예측하는 알고리즘을 나타내는 예측 요청

  • RELATED TO 절로 표시된 특성 열에 대한 관계(적용되는 경우에만 필수)

열 정의 목록에 다음 구문을 사용하여 단일 열을 정의합니다.

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]   

열 정의 목록에 다음 구문을 사용하여 중첩 테이블 열을 정의합니다.

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )  

모델링 플래그를 제외하고 특정 그룹에서 하나의 절만 사용하여 열을 정의할 수 있습니다. 열에 대한 여러 모델링 플래그를 정의할 수 있습니다.

열을 정의하는 데 사용할 수 있는 데이터 형식, 콘텐츠 형식, 열 배포 및 모델링 플래그 목록은 다음 항목을 참조하세요.

문에 절을 추가하여 두 열 간의 관계를 설명할 수 있습니다. Analysis Services는 다음 <열 관계> 절의 사용을 지원합니다.

관련 항목
이 양식은 값 계층 구조를 나타냅니다. RELATED TO 열의 대상은 중첩 테이블의 키 열, 사례 행의 불연속 값 열 또는 RELATED TO 절이 있는 다른 열(중첩된 열을 나타냄)일 수 있습니다.

예측 절을 사용하여 예측 열이 사용되는 방법을 설명합니다. 다음 표에서는 사용 가능한 두 가지 절을 설명합니다.

<prediction> 절 설명
예측 이 열은 모델에 의해 예측될 수 있으며 다른 예측 가능 열 값을 예측하기 위해 입력 사례에 제공될 수 있습니다.
PREDICT_ONLY 이 열은 모델에 의해 예측될 수 있지만 이 열의 값을 입력 사례에 사용하여 다른 예측 가능 열 값을 예측할 수는 없습니다.

매개 변수 정의 목록

매개 변수 목록을 사용하여 마이닝 모델의 성능과 기능을 조정할 수 있습니다. 매개 변수 목록의 구문은 다음과 같습니다.

[<parameter> = <value>, <parameter> = <value>,...]  

각 알고리즘과 연결된 매개 변수 목록은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하세요.

설명

기본 제공 테스트 데이터 집합이 있는 모델을 만들려면 CREATE MINING STRUCTURE 문과 ALTER MINING STRUCTURE를 사용해야 합니다. 그러나 모든 모델 형식이 홀드아웃 데이터 집합을 지원하는 것은 아닙니다. 자세한 내용은 DMX(CREATE MINING STRUCTURE)를 참조하세요.

CREATEMODEL 문을 사용하여 마이닝 모델을 만드는 방법에 대한 연습은 시계열 예측 DMX 자습서를 참조 하세요.

Naive Bayes 예제

다음 예제에서는 Microsoft Naive Bayes 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. Bike Buyer 열은 예측 가능한 특성으로 정의됩니다.

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes  

연결 모델 예제

다음 예제에서는 Microsoft Association 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. 이 문은 테이블 열을 사용하여 모델 정의 내에 테이블을 중첩하는 기능을 활용합니다. 모델은 MINIMUM_PROBABILITY 및 MINIMUM_SUPPORT 매개 변수를 사용하여 수정됩니다.

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)  

시퀀스 클러스터링의 예

다음 예제에서는 Microsoft 시퀀스 클러스터링 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. 모델을 정의하는 데 두 개의 키가 사용됩니다. OrderNumber 열은 사례 키로 사용되며 개별 주문을 지정합니다. LineNumber 열은 중첩된 테이블 키로 사용되며 항목이 주문에 추가된 시퀀스를 지정합니다.

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering  

시계열 예

다음 예제에서는 Microsoft Times Series 알고리즘을 사용하여 ARTxp 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. ReportingDate는 시계열의 키 열이고 ModelRegion은 데이터 계열의 키 열입니다. 이 예제에서는 데이터의 주기가 12개월마다라고 가정합니다. 따라서 PERIODICITY_HINT 매개 변수는 12로 설정됩니다.

참고 항목

중괄호 문자를 사용하여 PERIODICITY_HINT 매개 변수를 지정해야 합니다. 또한 값은 문자열이므로 작은따옴표로 묶어야 합니다. "{<numeric value>}".

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')  

참고 항목

DMX(데이터 마이닝 확장) 데이터 정의 문
DMX(데이터 마이닝 확장) 데이터 조작 문
DMX(Data Mining Extensions) 문 참조