マイニングモデルの作成 (DMX)

[アーティクル]
06/02/2023

適用: SQL Server Analysis Services

新しいマイニングモデルとマイニング構造の両方をデータベースに作成します。モデルは、ステートメントで新しいモデルを定義するか、予測モデルマークアップ言語 (PMML) を使用して作成できます。後者については、詳しい知識のあるユーザーのみ使用してください。

マイニング構造には、モデル名の後に「_structure」を追加した名前を付けます。これにより、構造名がモデル名から一意であることが保証されます。

既存のマイニング構造のマイニングモデルを作成するには、 ALTER MINING STRUCTURE (DMX) ステートメントを使用します。

構文

  
CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>

引数

model
モデルの一意の名前です。

列定義リスト
列定義のコンマ区切りのリスト。

アルゴリズム
現在のプロバイダーによって定義された、データマイニングアルゴリズムの名前です。

注意

現在のプロバイダーでサポートされているアルゴリズムの一覧は、 DMSCHEMA_MINING_SERVICES行セットを使用して取得できます。 Analysis Services の現在のインスタンスでサポートされているアルゴリズムを表示するには、「データマイニングプロパティ」を参照してください。

パラメーターリスト
省略可能。アルゴリズムのプロバイダー定義パラメーターのコンマ区切りのリスト。

XML 文字列
(高度な使用のみ)。XML エンコードモデル (PMML)。文字列は、単一引用符 (') で囲む必要があります。

SESSION 句を使用すると、接続が閉じるかセッションがタイムアウトしたときにサーバーから自動的に削除されるマイニングモデルを作成できます。SESSION マイニングモデルは、ユーザーがデータベース管理者である必要はないため、接続が開いている限りディスク領域のみを使用するため便利です。

WITH DRILLTHROUGH 句を使用すると、新しいマイニングモデルをドリルスルーできます。ドリルスルーは、モデルの作成時にのみ可能です。一部のモデルの種類では、カスタムビューアーでモデルを参照するためにドリルスルーが必要です。 Microsoft 汎用コンテンツツリービューアーを使用してモデルを予測または参照する場合は、ドリルスルーは必要ありません。

CREATE MINING MODEL ステートメントは、列定義リスト、アルゴリズム、およびアルゴリズムパラメーターリストに基づく新しいマイニングモデルを作成します。

列定義リスト

列定義リストを使用するモデルの構造を定義する場合は、各列に次の情報を含めます。

名前 (必須)
データ型 (必須)
Distribution
モデリングフラグの一覧
コンテンツタイプ (必須)
PREDICT 句または PREDICT_ONLY 句によって示される、この列を予測するアルゴリズムを示す予測要求
RELATED TO 句で示される属性列とのリレーションシップ (該当する場合にのみ必須)

1 つの列を定義するには、列定義リストに次の構文を使用します。

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]

入れ子になったテーブル列を定義するには、列定義リストに次の構文を使用します。

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )

モデリングフラグを除き、特定のグループから句を 1 つだけ使用して列を定義します。列には複数のモデリングフラグを定義できます。

列の定義に使用できるデータ型、コンテンツタイプ、列分布、モデリングフラグの一覧については、次のトピックを参照してください。

句をステートメントに追加して、2 つの列間のリレーションシップを記述できます。 Analysis Services では、次 <の Column リレーションシップ> 句の使用がサポートされています。

関連
この形式は値の階層を示します。 RELATED TO 列のターゲットには、入れ子になったテーブル内のキー列、ケース行の個別値列、またはより深い階層を示す RELATED TO 句を含む別の列を指定できます。

予測列の使用方法を説明するには、予測句を使用します。次の表では、考えられる 2 つの句について説明します。

<prediction> 句	説明
PREDICT	この列はモデルによって予測でき、他の予測可能な列の値を予測するために入力ケースで指定できます。
PREDICT_ONLY	この列はモデルによって予測できますが、その値を入力ケースで使用して、他の予測可能な列の値を予測することはできません。

パラメーター定義リスト

パラメーターリストを使用して、マイニングモデルのパフォーマンスと機能を調整できます。パラメーターリストの構文は次のとおりです。

[<parameter> = <value>, <parameter> = <value>,...]

各アルゴリズムに関連付けられているパラメーターの一覧については、「データマイニングアルゴリズム (Analysis Services - データマイニング)」を参照してください。

注釈

組み込みのテストデータセットを持つモデルを作成する場合は、ステートメント CREATE MINING STRUCTURE の後に ALTER MINING STRUCTURE を使用する必要があります。ただし、すべての種類のモデルで予約データセットがサポートされるわけではありません。詳細については、「 CREATE MINING STRUCTURE (DMX)」を参照してください。

CREATEMODEL ステートメントを使用してマイニングモデルを作成する方法のチュートリアルについては、「 Time Series Prediction DMX Tutorial」を参照してください。

Naive Bayes の例

次の例では、Microsoft Naive Bayes アルゴリズムを使用して新しいマイニングモデルを作成します。 Bike Buyer 列は、予測可能な属性として定義されます。

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes

アソシエーションモデルの例

次の例では、Microsoft Association アルゴリズムを使用して新しいマイニングモデルを作成します。ステートメントは、テーブル列を使用してモデル定義内にテーブルを入れ子にする機能を利用します。モデルは、 MINIMUM_PROBABILITY パラメーターと MINIMUM_SUPPORT パラメーターを使用して変更されます。

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)

シーケンスクラスタリングの例

次の例では、Microsoft シーケンスクラスタリングアルゴリズムを使用して新しいマイニングモデルを作成します。モデルを定義するには、2 つのキーが使用されます。 OrderNumber 列はケースキーとして使用され、個々の注文を指定します。 LineNumber 列は、入れ子になったテーブルのキーとして使用され、注文が追加されたアイテムのシーケンスを指定します。

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering

時系列の例

次の例では、Microsoft Times Series アルゴリズムを使用して、ARTxp アルゴリズムを使用して新しいマイニングモデルを作成します。 ReportingDate は時系列のキー列で、ModelRegion はデータ系列のキー列です。この例では、データの周期を 12 か月としています。したがって、 PERIODICITY_HINT パラメーターは 12 に設定されます。

注意

中かっこ文字を使用して 、PERIODICITY_HINT パラメーターを指定する必要があります。また、値は文字列であるため、"{<numeric value>}" という単一引用符で囲む必要があります。

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')

参照

データマイニング拡張機能 (DMX) データ定義ステートメント
 データマイニング拡張機能 (DMX) データ操作ステートメント
 データマイニング拡張機能 (DMX) ステートメントリファレンス

マイニングモデルの作成 (DMX)

構文

引数

列定義リスト

パラメーター定義リスト

注釈

Naive Bayes の例

アソシエーションモデルの例

シーケンスクラスタリングの例

時系列の例

参照

フィードバック

フィードバック

その他のリソース

マイニング モデルの作成 (DMX)

構文

引数

列定義リスト

パラメーター定義リスト

注釈

Naive Bayes の例

アソシエーション モデルの例

シーケンス クラスタリングの例

時系列の例

参照

フィードバック

フィードバック

その他のリソース

マイニングモデルの作成 (DMX)

アソシエーションモデルの例

シーケンスクラスタリングの例