CREATE MINING MODEL(DMX)

데이터베이스에 새 마이닝 모델과 마이닝 구조를 만듭니다. 이 문에서 새 모델을 정의하거나 PMML(Predictive Model Markup Language)을 사용하여 모델을 만들 수 있습니다. 두 번째 옵션은 고급 사용자만 사용해야 합니다.

모델 이름에 "_structure"가 추가되어 마이닝 구조의 이름이 정해지므로 구조 이름이 모델 이름과 달리 고유합니다.

기존 마이닝 구조에 대해 마이닝 모델을 만들려면 ALTER MINING STRUCTURE(DMX) 문을 사용합니다.

구문

CREATE [SESSION] MINING MODEL <model>
(
    [(<column definition list>)]
)
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]
CREATE MINING MODEL <model> FROM PMML <xml string>

인수

model

모델의 고유 이름입니다.

column definition list

쉼표로 구분된 열 정의 목록입니다.

algorithm

공급자가 정의한 데이터 마이닝 공급자 이름입니다.

parameter list

선택 사항입니다. 알고리즘에 대해 공급자가 정의한 매개 변수의 쉼표로 구분된 목록입니다.

XML string

고급 사용자만 사용해야 합니다. XML 인코딩 모델(PMML)이며 문자열을 작은따옴표(')로 묶어야 합니다.

주의

SESSION 절을 사용하면 연결이 종료되거나 세션 제한 시간이 만료될 때 자동으로 서버에서 제거되는 마이닝 모델을 만들 수 있습니다. SESSION 마이닝 모델은 데이터베이스 관리자가 아니더라도 사용할 수 있으며 연결되어 있는 동안에만 디스크 공간을 사용하므로 매우 유용합니다.

WITH DRILLTHROUGH 절을 사용하면 새 마이닝 모델에서 드릴스루를 사용할 수 있습니다. 드릴스루는 모델을 만들 때만 사용할 수 있습니다.

CREATE MINING MODEL 문은 열 정의 목록, 알고리즘 및 알고리즘 매개 변수 목록을 기반으로 새 마이닝 모델을 만듭니다.

열 정의 목록

각 열에 대해 다음 정보를 포함하여 열 정의 목록을 사용하는 모델 구조를 정의합니다.

  • 이름(필수)
  • 데이터 형식(필수)
  • 배포
  • 모델링 플래그 목록
  • 내용 유형(필수)
  • 이 열을 예측할 알고리즘에 표시하며 PREDICT 또는 PREDICT_ONLY 절로 표시되는 예측 요청
  • RELATED TO 절로 표시되는 특성 열과의 관계(적용되는 경우에만 필수)

열 정의 목록에 대해 다음 구문을 사용하여 단일 열을 정의합니다.

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>] 

열 정의 목록에 대해 다음 구문을 사용하여 중첩 테이블 열을 정의합니다.

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )

모델링 플래그를 제외하고 특정 그룹에서 하나의 절만 사용하여 열을 정의할 수 있습니다. 열에 대해 여러 개의 모델링 플래그를 정의할 수 있습니다.

열을 정의하는 데 사용할 수 있는 데이터 형식, 내용 유형, 열 배포 및 모델링 플래그 목록은 다음 항목을 참조하십시오.

문에 절을 추가하여 두 열 간의 관계를 설명할 수 있습니다. Analysis Services에서는 다음 <Column relationship> 절을 사용할 수 있습니다.

RELATED TO

이 형식은 값 계층 구조를 나타냅니다. RELATED TO 열의 대상은 중첩 테이블의 키 열, 사례 행의 불연속 값 열 또는 RELATED TO 절이 있는 다른 열(중첩된 열을 나타냄)일 수 있습니다.

예측 절을 사용하여 예측 열의 사용 방법을 설명합니다. 다음 표에서는 사용 가능한 두 가지 절을 설명합니다.

<prediction> 절 설명

PREDICT

이 열은 모델에 의해 예측될 수 있으며 다른 예측 가능 열 값을 예측하기 위해 입력 사례에 제공될 수 있습니다.

PREDICT_ONLY

이 열은 모델에 의해 예측될 수 있지만 이 열의 값을 입력 사례에 사용하여 다른 예측 가능 열 값을 예측할 수는 없습니다.

매개 변수 정의 목록

매개 변수 목록을 사용하여 마이닝 모델의 성능과 기능을 조정할 수 있습니다. 매개 변수 목록의 구문은 다음과 같습니다.

[<parameter> = <value>, <parameter> = <value>,?

각 알고리즘에 연관된 매개 변수 목록은 데이터 마이닝 알고리즘을 참조하십시오.

Naive Bayes 예

다음 예에서는 Microsoft Naive Bayes 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. Bike Buyer 열은 예측 가능한 특성으로 정의됩니다.

CREATE MINING MODEL [NBSample]
(
    CustomerKey LONG KEY, 
    Gender TEXT DISCRETE,
    [Number Cars Owned] LONG DISCRETE,
    [Bike Buyer] LONG DISCRETE PREDICT
)
Using Microsoft_Naive_Bayes

연결 모델의 예

다음 예에서는 Microsoft 연결 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. 이 문은 테이블 열을 사용하여 모델 정의 안에 테이블을 중첩하는 기능을 사용합니다. 이 모델은 Minimum_ProbabilityMinimum_Support 매개 변수에 따라 수정됩니다.

CREATE MINING MODEL MyAssociationModel (
    OrderNumber TEXT KEY,
    [Products] TABLE PREDICT (
        [Model] TEXT KEY
    )
)
Using Microsoft_Association_Rules (Minimum_Probability = 0.1, Minimum_Support = 0.01)

시퀀스 클러스터링의 예

다음 예에서는 Microsoft 시퀀스 클러스터링 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. 두 개의 키를 사용하여 모델을 정의합니다. Order Number에서는 개별 주문을 지정합니다. Line Number에서는 주문에 항목이 추가된 시퀀스를 지정합니다.

CREATE MINING MODEL BuyingSequence (
    [Order Number] TEXT KEY,
    [Products] TABLE (
        [Line Number] LONG KEY SEQUENCE,
        [Model] TEXT DISCRETE PREDICT
)
)
Using Microsoft_Sequence_Clustering

시계열의 예

다음 예에서는 Microsoft 시계열 알고리즘을 사용하여 새 마이닝 모델을 만듭니다. 시계열 모델에는 여러 키를 포함할 수 있으므로 TimeIndex 및 ModelRegion 모두가 키 열로 지정됩니다. 이 예에서는 데이터 주기를 매 12개월로 가정하므로 PERIODICITY_HINT 매개 변수는 12로 설정됩니다.

[!참고] 중괄호"{}"를 사용하여 PERIODICITY_HINT 매개 변수를 지정해야 합니다.

CREATE MINING MODEL SalesForcast (
        TimeIndex LONG KEY TIME,
        ModelRegion TEXT KEY,
        Amount LONG CONTINUOUS PREDICT,
        Quantity LONG CONTINUOUS PREDICT
)
Using Microsoft_Time_Series (PERIODICITY_HINT = '{12}')

참고 항목

참조

DMX(데이터 마이닝 확장) 데이터 정의 문
DMX(데이터 마이닝 확장) 데이터 조작 문
DMX(데이터 마이닝 확장) 문 참조

도움말 및 정보

SQL Server 2005 지원 받기