レッスン 2: Bike Buyer マイニング構造へのマイニング モデルの追加

このレッスンでは、「レッスン 1: Bike Buyer マイニング構造の作成」で作成した Bike Buyer マイニング構造に 2 つのマイニング モデルを追加します。これら 2 つのマイニング モデルを追加すると、一方のモデルでデータを調査でき、もう一方のモデルで予測を作成できます。

潜在顧客を特性ごとにどのように分類できるかを調べるには、Microsoft クラスタリング アルゴリズムに基づくマイニング モデルを作成します。後のレッスンでは、類似した特性を持つ顧客グループがこのアルゴリズムでどのように特定されるかについて学習します。たとえば、ある特定の顧客グループは、住居が近く、自転車で通勤し、学歴が類似しているといった情報を得られる可能性があります。このような分類を基にさまざまな顧客の関連性を把握し、この情報を使用して特定顧客をターゲットとしたマーケティング戦略を立てることができます。

潜在顧客が自転車を購入する可能性を予測するには、Microsoft デシジョン ツリー アルゴリズムに基づくマイニング モデルを作成します。このアルゴリズムではそれぞれの潜在顧客に関連付けられている情報を基に、自転車を購入するかどうかの予測に役立つ特性を見つけることができます。特性が見つかったら、以前自転車を購入した顧客と新しい潜在顧客の特性値を比較して、新しい潜在顧客が自転車を購入する可能性を判定することができます。

ALTER MINING STRUCTURE ステートメント

マイニング モデルをマイニング構造に追加するには、ALTER MINING STRUCTURE (DMX) ステートメントを使用します。ステートメントのコードは次の部分に分けられます。

  • マイニング構造の指定

  • マイニング モデルの名前指定

  • キー列の定義

  • 入力列と予測可能列の定義

  • アルゴリズムとパラメータ変更の指定

ALTER MINING MODEL ステートメントの汎用例を次に示します。

ALTER MINING STRUCTURE [<mining structure name>]
ADD MINING MODEL [<mining model name>]
(
    [<key column>],
    <mining model columns>,
) USING <algorithm name>( <algorithm parameters> )
WITH FILTER (<expression>)

コードの最初の行では、マイニング モデルの追加先となる既存のマイニング構造を指定します。

ALTER MINING STRUCTURE [<mining structure name>]

コードの次の行では、マイニング構造に追加するマイニング モデルを指定します。

ADD MINING MODEL [<mining model name>]

DMX でオブジェクトに名前を付ける方法については、「識別子 (DMX)」を参照してください。

コードの次の数行では、マイニング モデルで使用するマイニング構造の列を定義します。

[<key column>],
<mining model columns>

使用できるのは、マイニング構造内に既に存在する列だけです。一覧の最初の列は、マイニング構造のキー列にする必要があります。

コードの次の行では、マイニング モデルを生成するマイニング アルゴリズムと、アルゴリズムに設定できるアルゴリズム パラメータを定義します。

) USING <algorithm name>( <algorithm parameters> )

設定できるアルゴリズム パラメータの詳細については、「Microsoft デシジョン ツリー アルゴリズム」および「Microsoft クラスタリング アルゴリズム」を参照してください。

次の構文で、マイニング モデルの列を予測に使用するよう指定できます。

<mining model column> PREDICT

コードの最後の行 (省略可能) では、モデルの学習およびテストを行う際に適用するフィルタを定義します。マイニング モデルにフィルタを適用する方法の詳細については、「マイニング モデルのフィルターの作成 (Analysis Services - データ マイニング)」を参照してください。

このレッスンの作業

このレッスンでは、次の作業を行います。

  • Microsoft デシジョン ツリー アルゴリズムを使用して、デシジョン ツリー マイニング モデルを Bike Buyer 構造に追加。

  • Microsoft クラスタリング アルゴリズムを使用して、クラスタリング マイニング モデルを Bike Buyer 構造に追加。

  • すべてのケースの結果を表示する必要があるため、どちらのモデルにもまだフィルタを追加しません。

構造へのデシジョン ツリー マイニング モデルの追加

最初に、Microsoft デシジョン ツリー アルゴリズムに基づくマイニング モデルを追加します。

デシジョン ツリー マイニング モデルを追加するには

  1. オブジェクト エクスプローラで、Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして [DMX] をクリックすると、クエリ エディタが開き、新しい空のクエリが表示されます。

  2. 上の ALTER MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。

  3. 次の部分を探します。

    <mining structure name> 
    

    これを次の文字列に置き換えます。

    [Bike Buyer]
    
  4. 次の部分を探します。

    <mining model name> 
    

    これを次の文字列に置き換えます。

    Decision Tree
    
  5. 次の部分を探します。

    <mining model columns>,
    

    これを次の文字列に置き換えます。

    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    

    この場合、[Bike Buyer] 列は PREDICT 列として指定されています。

  6. 次の部分を探します。

    USING <algorithm name>( <algorithm parameters> ) 
    

    これを次の文字列に置き換えます。

    Using Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    

    WITH DRILLTHROUGH ステートメントを指定すると、マイニング モデルの構築に使用されたケースを閲覧できます。

    これで、ステートメントは次のようになります。

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Decision Tree]
    (
       CustomerKey,
       [Age],
       [Bike Buyer] PREDICT,
       [Commute Distance],
       [Education],
       [Gender],
       [House Owner Flag],
       [Marital Status],
       [Number Cars Owned],
       [Number Children At Home],
       [Occupation],
       [Region],
       [Total Children],
       [Yearly Income]
    ) USING Microsoft_Decision_Trees
    WITH DRILLTHROUGH
    
  7. [ファイル] メニューで、[名前を付けて DMXQuery1.dmx を保存] をクリックします。

  8. [名前を付けて保存] ダイアログ ボックスで、適切なフォルダを参照して指定し、ファイルに「DT_Model.dmx」という名前を付けます。

  9. ツール バーの [実行] ボタンをクリックします。

構造へのクラスタ マイニング モデルの追加

次に、Microsoft クラスタリング アルゴリズムに基づくマイニング モデルを、Bike Buyer マイニング構造に追加します。クラスタ マイニング モデルでは、マイニング構造に定義されている列をすべて使用します。したがって、マイニング列の定義を省略して、この構造にモデルを追加できます。

クラスタ マイニング モデルを追加するには

  1. オブジェクト エクスプローラで、Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして [DMX] をクリックすると、クエリ エディタが開き、新しい空のクエリが表示されます。

  2. 上の ALTER MINING STRUCTURE ステートメントの汎用例を空のクエリにコピーします。

  3. 次の部分を探します。

    <mining structure name> 
    

    これを次の文字列に置き換えます。

    [Bike Buyer]
    
  4. 次の部分を探します。

    <mining model> 
    

    これを次の文字列に置き換えます。

    Clustering Model
    
  5. 次の部分を削除します。

    (
        [<key column>],
        <mining model columns>,
    )
    
  6. 次の部分を探します。

    USING <algorithm name>( <algorithm parameters> )
    

    これを次の文字列に置き換えます。

    USING Microsoft_Clustering
    

    最終的なステートメントは次のようになります。

    ALTER MINING STRUCTURE [Bike Buyer]
    ADD MINING MODEL [Clustering]
    USING Microsoft_Clustering 
    
  7. [ファイル] メニューで、[名前を付けて DMXQuery1.dmx を保存] をクリックします。

  8. [名前を付けて保存] ダイアログ ボックスで、適切なフォルダを参照して指定し、ファイルに「Clustering_Model.dmx」という名前を付けます。

  9. ツール バーの [実行] ボタンをクリックします。

次のレッスンでは、モデルとマイニング構造を処理します。