CREATE MINING MODEL(DMX)

 

이 항목은 다음에 적용됩니다.예SQL Server(2008부터 시작)아니요Azure SQL 데이터베이스아니요Azure SQL 데이터 웨어하우스아니요병렬 데이터 웨어하우스

데이터베이스에 새 마이닝 모델과 마이닝 구조를 만듭니다. 이 문에서 새 모델을 정의하거나 PMML(Predictive Model Markup Language)을 사용하여 모델을 만들 수 있습니다. 두 번째 옵션은 고급 사용자만 사용해야 합니다.

모델 이름에 "_structure"가 추가되어 마이닝 구조의 이름이 정해지므로 구조 이름이 모델 이름과 달리 고유합니다.

사용 하 여 기존 마이닝 구조에 대 한 마이닝 모델을 만들려면는 ALTER 마이닝 구조 (DMX) 문입니다.

  
CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>  

모델
모델의 고유 이름입니다.

열 정의 목록
쉼표로 구분된 열 정의 목록입니다.

알고리즘
현재 공급자가 정의한 데이터 마이닝 알고리즘 이름입니다.

System_CAPS_ICON_note.jpg 참고


현재 공급자에서 지 원하는 알고리즘의 목록을 사용 하 여 검색할 수 DMSCHEMA_MINING_SERVICES 행 집합합니다. 현재 인스턴스에 지원 되는 알고리즘을 보려면 Analysis Services, 참조 데이터 마이닝 속성합니다.

매개 변수 목록
(선택 사항) 알고리즘에 대해 공급자가 정의한 매개 변수의 쉼표로 구분된 목록입니다.

XML 문자열
고급 사용자만 사용해야 합니다. XML 인코딩 모델(PMML)이며 문자열을 작은따옴표(')로 묶어야 합니다.

세션 절을 사용 하면 연결이 종료 되거나 세션 제한 시간이 초과 하는 경우 서버에서 자동으로 제거 하는 마이닝 모델을 만들 수 있습니다. 세션 마이닝 모델은 데이터베이스 관리자가 될 사용자 필요 없이 연결이 열려 있는으로 디스크 공간을 사용 하므로 유용 합니다.

WITH DRILLTHROUGH 절을 사용 하면 새 마이닝 모델에서 드릴스루 합니다. 드릴스루는 모델을 만들 때만 사용할 수 있습니다. 일부 모델 유형의 경우 사용자 지정 뷰어에서 모델을 찾아보는 데 드릴스루가 필요합니다. 드릴스루는 예측 또는 Microsoft 일반 콘텐츠 트리 뷰어를 사용하여 모델을 찾는 데 필요하지 않습니다.

마이닝 모델 만들기 문은 열 정의 목록, 알고리즘 및 알고리즘 매개 변수 목록을 기반으로 하는 새 마이닝 모델을 만듭니다.

열 정의 목록

각 열에 대해 다음 정보를 포함하여 열 정의 목록을 사용하는 모델 구조를 정의합니다.

  • 이름(필수)

  • 데이터 형식(필수)

  • 배포

  • 모델링 플래그 목록

  • 내용 유형(필수)

  • 이 열을 예측 하는 알고리즘을 나타내는 예측 요청으로 표시 된 PREDICT 또는 PREDICT_ONLY

  • 으로 표시 되는 특성 열 (필수 적용 되는 경우에)의 관계는 관련

열 정의 목록에 대해 다음 구문을 사용하여 단일 열을 정의합니다.

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]   

열 정의 목록에 대해 다음 구문을 사용하여 중첩 테이블 열을 정의합니다.

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )  

모델링 플래그를 제외하고 특정 그룹에서 하나의 절만 사용하여 열을 정의할 수 있습니다. 열 하나에 대해 여러 개의 모델링 플래그를 정의할 수 있습니다.

열을 정의하는 데 사용할 수 있는 데이터 형식, 내용 유형, 열 배포 및 모델링 플래그 목록은 다음 항목을 참조하십시오.

문에 절을 추가하여 두 열 간의 관계를 설명할 수 있습니다. Analysis Services다음의 사용을 지원 > 절.

관련 된
이 형식은 값 계층 구조를 나타냅니다. RELATED TO 열의 대상은 중첩 테이블의 키 열, 사례 행의 불연속 값 열 또는 RELATED TO 절이 있는 다른 열(중첩된 열을 나타냄)일 수 있습니다.

예측 절을 사용하여 예측 열의 사용 방법을 설명합니다. 다음 표에서는 사용 가능한 두 가지 절을 설명합니다.

<>>절Description
예측이 열은 모델에 의해 예측될 수 있으며 다른 예측 가능 열 값을 예측하기 위해 입력 사례에 제공될 수 있습니다.
PREDICT_ONLY이 열은 모델에 의해 예측될 수 있지만 이 열의 값을 입력 사례에 사용하여 다른 예측 가능 열 값을 예측할 수는 없습니다.

매개 변수 정의 목록

매개 변수 목록을 사용하여 마이닝 모델의 성능과 기능을 조정할 수 있습니다. 매개 변수 목록의 구문은 다음과 같습니다.

[<parameter> = <value>, <parameter> = <value>,…]  

각 알고리즘에 연관 된 매개 변수 목록을 참조 하십시오. 데이터 마이닝 알고리즘 (Analysis Services-데이터 마이닝)합니다.

기본 제공 테스트 데이터 집합이 있는 모델을 만들려는 경우 CREATE MINING STRUCTURE 문과 ALTER MINING STRUCTURE 문을 차례로 사용해야 합니다. 그러나 모든 모델 유형이 홀드아웃 데이터 집합을 지원하는 것은 아닙니다. 자세한 내용은 CREATE MINING STRUCTURE(DMX)를 참조하세요.

CREATEMODEL 문을 사용 하 여 마이닝 모델을 만드는 방법의 연습을 참조 하십시오. 시계열 예측 DMX 자습서합니다.

다음 예에서는 Microsoft Naive Bayes 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. Bike Buyer 열은 예측 가능한 특성으로 정의됩니다.

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes  

다음 예에서는 Microsoft 연결 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. 이 문은 테이블 열을 사용하여 모델 정의 안에 테이블을 중첩하는 기능을 사용합니다. 사용 하 여 모델 수정 되는 MINIMUM_PROBABILITYMINIMUM_SUPPORT 매개 변수입니다.

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)  

다음 예에서는 Microsoft 시퀀스 클러스터링 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. 두 개의 키를 사용하여 모델을 정의합니다. OrderNumber 열은 사례 키로 사용되며 주문 순서를 지정합니다. LineNumber 열은 중첩된 테이블 키로 사용되며 항목이 주문에 추가된 시퀀스를 지정합니다.

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering  

다음 예에서는 Microsoft 시계열 알고리즘을 사용하여 ARTxp 알고리즘을 사용함으로써 새 마이닝 모델을 만듭니다. ReportingDate는 시계열의 키 열이고 ModelRegion은 데이터 계열의 키 열입니다. 이 예에서는 데이터 주기를 매 12개월로 가정하므로 따라서는 PERIODICITY_HINT 매개 변수는 12로 설정 됩니다.

System_CAPS_ICON_note.jpg 참고


지정 해야는 PERIODICITY_HINT 중괄호를 사용 하 여 매개 변수입니다. 또한 값은 문자열, 묶어야 작은따옴표로: "{>}"입니다.

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')  

Data Mining Extensions (DMX) 데이터 정의 문
Data Mining Extensions (DMX) 데이터 조작 문
Data Mining Extensions (DMX) 문 참조

커뮤니티 추가 항목

추가
표시: