レッスン 4: Bike Buyer マイニング モデルの参照

 

対象: SQL Server 2016 Preview

このレッスンでは使用して、 SELECT (DMX) デシジョン ツリー モデルとマイニングをクラスターでコンテンツを参照するステートメントをモデル化で作成した レッスン 2: 予測のマイニング構造にマイニング モデルの追加します。

マイニング モデルに含まれる列は、マイニング構造で定義されている列ではなく、アルゴリズムによって検出された傾向とパターンを記述している、特定の列のセットです。 これらのマイニング モデル列のとおり、 DMSCHEMA_MINING_MODEL_CONTENT Rowset スキーマ行セット。 たとえば、コンテンツ スキーマ行セットの MODEL_NAME 列には、マイニング モデルの名前が含まれます。 クラスター マイニング モデルの場合、NODE_CAPTION 列には各クラスターの名前が含まれ、NODE_DESCRIPTION 列には各クラスターの特性の説明が含まれます。 SELECT FROM を使用してこれらの列を参照する です。DMX でコンテンツのステートメント。 このステートメントを使用すると、マイニング モデルの作成に使用されたデータを調査することもできます。 このステートメントを使用するには、マイニング構造上でドリルスルーを有効にする必要があります。 ステートメントの詳細については、次を参照してください。 SELECT FROM &#60";"モデル"&"#62;。ケースと #40; DMX )します。

SELECT DISTINCT ステートメントを使用することにより、不連続列のすべての状態を返すこともできます。 たとえば、性別の列でこの操作を実行する場合は返さ 男性女性します。

このレッスンの作業

このレッスンでは、次の作業を行います。

  • マイニング モデルに含まれる内容の調査

  • マイニング モデルのトレーニングに使用されたソース データからケースを返す

  • 特定の不連続列に対して可能な状態の調査

マイニング モデルの内容を返す

このレッスンで使用して、 SELECT FROM &#60";"モデル"&"#62;。コンテンツおよび #40; DMX ) ステートメントをクラスタ リング モデルのコンテンツを取得します。

SELECT FROM の汎用例を次に示します します。コンテンツ ステートメント:

SELECT <select list> FROM [<mining model>].CONTENT  
WHERE <where clause>  

コードの 1 行目では、マイニング モデルの内容から返す列と、それらの列が関連付けられているマイニング モデルを定義します。

SELECT <select list> FROM [<mining model].CONTENT  

マイニング モデル名の後の .CONTENT 句は、マイニング モデルから内容を返すことを示します。 マイニング モデルに含まれる列の詳細については、次を参照してください。 DMSCHEMA_MINING_MODEL_CONTENT Rowsetします。

コードの最終行では、ステートメントで返される結果をフィルター選択します。この行は省略可能です。

WHERE <where clause>  

たとえば、クエリの結果を制限して、多数のケースが含まれるクラスターのみを返すようにする場合は、SELECT ステートメントに次の WHERE 句を追加します。

WHERE NODE_SUPPORT > 100  

詳細については、WHERE ステートメントを使用して、次を参照してください。 選択 #40; DMX )します。

クラスター マイニング モデルの内容を返すには

  1. オブジェクト エクスプ ローラー, のインスタンスを右クリックして Analysis Services, 、指す 新しいクエリ, 、順にクリック DMXします。
クエリ エディターが開き、新しい空のクエリが表示されます。  
  1. SELECT FROM の汎用例をコピー します。空のクエリにコンテンツ ステートメントです。

  2. 次の部分を探します。

    <select list>   
    

    これを次の文字列に置き換えます。

    置換することもできます * に含まれている列のいずれかの一覧で、 DMSCHEMA_MINING_MODEL_CONTENT Rowsetします。

  3. 次の部分を探します。

    [<mining model>]   
    

    これを次の文字列に置き換えます。

    [Clustering]  
    

    最終的なステートメントは次のようになります。

    SELECT * FROM [Clustering].CONTENT  
    
  4. ファイル ] メニューのをクリックして 付けて DMXQuery1.dmx を保存します。

  5. 名前を付けて保存 ダイアログ ボックスで、適切なフォルダーに移動し、ファイル名 SELECT_CONTENT.dmxします。

  6. ツールバーで、 Execute ] ボタンをクリックします。

    クエリが実行され、マイニング モデルの内容が返されます。

ドリルスルーの使用

次の手順では、ドリルスルー ステートメントを使用して、デシジョン ツリー マイニング モデルのトレーニングに使用されたケースの一部を返します。 このレッスンで使用して、 SELECT FROM &#60";"モデル"&"#62;。ケースと #40; DMX ) ステートメントをデシジョン ツリー モデルのコンテンツを取得します。

SELECT FROM の汎用例を次に示します します。ステートメントの場合:

SELECT <select list>   
FROM [<mining model>].CASES  
WHERE IsInNode('<node id>')  

コードの 1 行目では、ソース データから返す列と、それらの列が含まれるマイニング モデルを定義します。

SELECT <select list> FROM [<mining model>].CASES  

.CASES 句は、ドリルスルー クエリを実行することを示します。 ドリルスルーを使用するには、マイニング モデルの作成時にドリルスルーを有効にする必要があります。

コードの最終行では、ケースを要求するマイニング モデル内のノードを指定します。この行は省略可能です。

WHERE IsInNode
('<node id>')  

IsInNode で WHERE ステートメントを使用する方法の詳細については、次を参照してください。 SELECT FROM &#60";"モデル"&"#62;。ケースと #40; DMX )します。

マイニング モデルのトレーニングに使用されたケースを返すには

  1. オブジェクト エクスプ ローラー, のインスタンスを右クリックして Analysis Services, 、指す 新しいクエリ, 、順にクリック DMXします。
クエリ エディターが開き、新しい空のクエリが表示されます。  
  1. SELECT FROM の汎用例をコピー します。空のクエリに CASES ステートメントです。

  2. 次の部分を探します。

    <select list>   
    

    これを次の文字列に置き換えます。

    • は、ソース データ内に含まれる任意の列の一覧 ([Bike Buyer] など) に置き換えることもできます。
  3. 次の部分を探します。

    [<mining model>]   
    

    これを次の文字列に置き換えます。

    [Decision Tree]  
    

    最終的なステートメントは次のようになります。

    SELECT *   
    FROM [Decision Tree].CASES  
    
  4. ファイル ] メニューのをクリックして 付けて DMXQuery1.dmx を保存します。

  5. 名前を付けて保存 ダイアログ ボックスで、適切なフォルダーに移動し、ファイル名 SELECT_DRILLTHROUGH.dmxします。

  6. ツールバーで、 Execute ] ボタンをクリックします。

    クエリが実行され、デシジョン ツリー マイニング モデルのトレーニングに使用されたソース データが返されます。

マイニング モデルの不連続列の状態を返す

次の手順では、SELECT DISTINCT ステートメントを使用して、指定されたマイニング モデル列に対して可能な状態を返します。

SELECT DISTINCT ステートメントの汎用例を次に示します。

SELECT DISTINCT [<column>]   
FROM [<mining model>]  

コードの 1 行目では、状態を返すマイニング モデル列を定義します。

SELECT DISTINCT [<column>]   

列のすべての状態を返すには、DISTINCT を含める必要があります。 DISTINCT を指定しない場合は、ステートメント全体が予測用のショートカットとなり、指定した列で最も可能性の高い状態が返されます。 詳細については、「SELECT (DMX)」を参照してください。

不連続列の状態を返すには

  1. オブジェクト エクスプ ローラー, のインスタンスを右クリックして Analysis Services, 、指す 新しいクエリ, 、順にクリック DMXします。
クエリ エディターが開き、新しい空のクエリが表示されます。  
  1. 上の SELECT Distinct ステートメントの汎用例を空のクエリにコピーします。

  2. 次の部分を探します。

    [<column,name>   
    

    これを次の文字列に置き換えます。

    [Bike Buyer]  
    
  3. 次の部分を探します。

    [<mining model>]   
    

    これを次の文字列に置き換えます。

    [Decision Tree]  
    

    最終的なステートメントは次のようになります。

    SELECT DISTINCT [Bike Buyer]   
    FROM [Decision Tree]  
    
  4. ファイル ] メニューのをクリックして 付けて DMXQuery1.dmx を保存します。

  5. 名前を付けて保存 ダイアログ ボックスで、適切なフォルダーに移動し、ファイル名 SELECT_DISCRETE.dmxします。

  6. ツールバーで、 Execute ] ボタンをクリックします。

    クエリが実行され、Bike Buyer 列の可能な状態が返されます。

次のレッスンでは、デシジョン ツリー マイニング モデルを使用して、潜在顧客が自転車の購入者になるかどうかを予測します。

次のレッスン

レッスン 5: 予測クエリの実行