マーケット バスケット モデルの検証 (中級者向けデータ マイニング チュートリアル)

 

対象: SQL Server 2016 Preview

これでビルドした、 アソシエーション モデルを検証を使用して、 Microsoft アソシエーション ビューアー、 マイニング モデル ビューアー データ マイニング デザイナーのタブをクリックします。 このチュートリアルでは、ビューアーを使用してアイテム間の関係を検証する方法を、順を追って学習します。 ビューアーを使用すると、どの製品とどの製品がよく一緒に表示されるかが一目でわかるほか、新たなパターンの概観も可能です。

Microsoft アソシエーション ビューアーには、3 つのタブが含まれています: ルール, 、アイテム セット, 、および 依存関係ネットワークします。 これらのタブにはデータがそれぞれ少しずつ異なる形で表示されるため、モデルを検証する際には、異なるペインの間を何度も切り替えながら調査を進めるのが一般的です。

  • [依存関係ネットワーク] タブ](#bkmk_DepNet)

  • [アイテム セット] タブ](#bkmk_Itemsets)

  • [規則] タブ

  • 汎用コンテンツ ツリー ビューアー

このチュートリアルで開始、 依存関係ネットワーク タブをクリックしを使用して、 ルール ] タブをクリックし、 アイテム セット 、ビューアーに表示された関係の理解を深める] タブをクリックします。 使用する、 Microsoft 汎用コンテンツ ツリー ビューアー を個々 のルールやアイテム セットの詳細な統計情報を取得します。

[依存関係ネットワーク] タブ

依存関係ネットワーク ] タブで、モデル内の別のアイテムの相互作用を調査することができます。 ビューアーの各ノードはアイテムを表し、アイテム間を結ぶ線はルールを表します。 ノードを選択すると、選択したアイテムが他のどのノードによって予測されるか、また現在のアイテムがどのアイテムを予測するかがわかります。 アイテム間に双方向の関係がある (つまり同一トランザクション内に発生する可能性が高い) 場合もあります。 タブの下部にある色の凡例を参照すると、関係の方向を確認できます。

2 つのアイテムを結ぶ線は、それらのアイテムが同じトランザクションに含まれる可能性が高いことを示しています。 つまり、顧客がそれらのアイテムをまとめて購入する可能性が高いということになります。 スライダーはルールの確率に関連付けられています。 スライダーを下方向に移動すると、緊密な関係 (確率の高いルール) のみが表示されます。

依存関係ネットワークのグラフには、"A->B" として論理的に表現できる 1 対 1 のルールが表示されます。これは、製品 A が購入された場合は製品 B も購入される可能性が高いことを表します。 このグラフでは、AB->C のようなルールを表示することはできません。 すべてのルールが表示される位置までスライダーを動かしてもグラフに線が表示されない場合は、アルゴリズム パラメーターの条件を満たす 1 対 1 のルールが存在しないことになります。

属性名の最初の数文字を入力してノードを名前で検索することもできます。 詳細については、「[ノードの検索] ダイアログ ボックス (マイニング モデル ビューアー)」を参照してください。

Microsoft アソシエーション ルール ビューアーで Association モデルを開くには

  1. ソリューション エクスプ ローラー, 、アソシエーションの構造をダブルクリックします。

  2. データ マイニング デザイナーで、 [マイニング モデル ビューアー] タブをクリックします。

  3. 内のマイニング モデルの一覧から関連付けを選択して、 マイニング モデル ボックスの一覧です。

依存関係のグラフを操作して特定のノードを見つけるには

  1. マイニング モデル ビューアー ] タブをクリックして、 依存関係ネットワーク ] タブをクリックします。

  2. をクリックして ズームイン 数回、各ノードのラベルを簡単に表示できます。

    既定では、すべてのノードが見えるようにグラフが表示されます。 複雑なモデルでは、ノードの数が多いためにそれぞれのノードが非常に小さくなることがあります。

  3. クリックして、 + ビューアーの右下隅にサインインし、グラフの周りをパンするマウス ボタンを押したままです。

  4. ビューアーの左側にあるスライダーを移動することから、下にドラッグ すべてのリンク (既定)、スライダーのつまみの下にします。

  5. グラフが更新されて、最も強いアソシエーション (Touring Tire と Touring Tire Tube の間のアソシエーション) のみが表示されます。

  6. というラベルが付いたノードをクリックして Touring Tire Tube = Existingします。

    グラフが更新されて、このアイテムとの間に強い関連があるアイテムのみが強調表示されます。 2 つのアイテム間の矢印の向きに注目してください。

  7. ビューアーの左側で、スライダーをドラッグして一番下から真ん中あたりまで戻します。

    2 つのアイテムを結ぶ矢印の変化に注目してください。

  8. 選択 属性名のみを表示する 依存関係ネットワーク] ウィンドウの上部にあるドロップダウン リストからです。

    グラフのテキスト ラベルが更新されて、モデル名のみが表示されます。

トップに戻る

[アイテムセット] タブ

次に、Touring Tire と Touring Tire Tube という 2 つの製品についてモデルによって生成された、ルールとアイテムセットの詳細を調べます。 アイテム セット ] タブには、アイテム セットに関連する情報の 3 つの重要な情報が表示されますが、 Microsoft アソシエーション アルゴリズムは、検出します。

  • サポート:、アイテム セットが発生したトランザクションの数。

  • **サイズ:**アイテム セット内の項目の数。

  • **アイテム:**各アイテム セットに含まれるアイテムの一覧です。

アルゴリズム パラメーターの設定方法によっては、多数のアイテムセットが生成される場合があります。 ビューアーに返される各アイテムセットは、アイテムが販売されたトランザクションを表します。 上部にあるコントロールを使用して、 アイテム セット ] タブで、指定された最小のサポートとアイテム セット サイズを含むアイテム セットのみを表示するビューアーをフィルター処理できます。

別のマイニング モデルを使用していてアイテムセットが表示されない場合、それは、アルゴリズム パラメーターの条件を満たすアイテムセットが存在しないからです。 そのような場合は、サポートの値がもっと低いアイテムセットが許可されるようにアルゴリズム パラメーターを変更できます。

ビューアーに表示されるアイテムセットを名前で絞り込むには

  1. クリックして、 アイテム セット ビューアーのタブをクリックします。

  2. アイテム セットのフィルター ボックスに、入力 Touring Tire, 、ボックスの外側をクリックします。

その文字列を含むすべてのアイテムが返されます。  
  1. 表示 一覧で、[ 属性名のみを表示するです。

  2. 選択、 長い名前を表示する チェック ボックスをオンします。

    アイテムセットの一覧が更新されて、"Touring Tire" という文字列を含むアイテムセットのみが表示されます。 アイテムセットの長い名前には、各アイテムの属性と値を含むテーブルの名前が含まれます。

  3. クリア、 長い名前を表示する チェック ボックスをオンします。

    アイテムセットの一覧が更新されて、短い名前のみが表示されます。

値、 サポート 列は、各アイテム セットのトランザクションの数を指定します。 アイテムセットのトランザクションとは、アイテムセット内のすべてのアイテムを含む購入のことです。

既定では、アイテムセットはサポートの降順でビューアーに表示されます。 列のヘッダーをクリックすると、アイテムセットを別の列 (アイテムセットのサイズや名前など) で並べ替えることができます。 アイテムセットに含まれる個々のトランザクションの詳細に関心がある場合は、アイテムセットから個々のケースにドリルスルーすることもできます。 ドリルスルーの結果には、モデルでは使用されなかった顧客の収入レベルと顧客 ID の構造列が含まれます。

アイテムセットの詳細を表示するには

  1. アイテム セットの一覧でクリックして、 アイテム セット 名で並べ替えるには列見出し。

  2. 項目を見つけ Touring Tire (2 番目のアイテムを含まない)。

  3. 項目を右クリックして Touring Tire, [ ドリル スルー, 、し、[ モデルおよび構造列します。

    ドリル スルー ] ダイアログ ボックスには、このアイテム セットのサポートとして使用される個々 のトランザクションが表示されます。

  4. 入れ子になったテーブル vAssocSeqLineItems を展開して、トランザクションの実際の購入の一覧を表示します。

アイテムセットをサポートまたはサイズで絞り込むには

  1. 可能性のあるテキストをクリア、 アイテム セットのフィルター ボックス。 テキスト フィルターと数値フィルターを同時に使用することはできません。

  2. 最小のサポート ボックスに、100 を入力し、ビューアーの背景をクリックします。

アイテムセットの一覧が更新されて、サポートが 100 以上のアイテムセットのみが表示されます。  

トップに戻る

[ルール] タブ

ルール ] タブには、アルゴリズムが検出されたルールに関連する次の情報が表示されます。

  • 確率:尤度 の左側にある項目を指定した右辺のアイテムの確率として定義された規則。

  • 重要:、ルールの有用性の測定値。 この値が大きいほどルールの有効性が高くなります。

    ルールの有効性を判断するための基準として重要度が用意されているのは、確率だけでは誤った判断を招く可能性があるためです。 たとえば、プロモーションの一環として各顧客のカートに自動的に水筒が追加される場合は、すべてのトランザクションに水筒が含まれるため、水筒の確率を 1 として予測するルールがモデルによって作成されます。 このルールは、確率に基づく限りはきわめて正確ですが、有用な情報にはなりません。

  • **ルール:**ルールの定義。 マーケット バスケット モデルのルールでは、アイテムの特定の組み合わせを記述します。

各ルールを使用すると、他のアイテムが存在するかどうかに基づいて、あるアイテムがトランザクションに含まれるかどうかを予測することができます。 ように、 アイテム セット ] タブで、最も注目すべきルールのみが表示されるようにルールをフィルター処理することができます。 使用しているマイニング モデルにルールが 1 つもない場合は、アルゴリズム パラメーターを変更して、ルールの確率のしきい値を下げることができます。

Mountain-200 という自転車を含むルールのみを表示するには

  1. マイニング モデル ビューアー ] タブをクリックして、 ルール ] タブをクリックします。

  2. フィルタの規則 ボックスに、入力 マウンテン-200します。

クリア、 **長い名前を表示する** チェック ボックスをオンします。  
  1. 表示 一覧で、[ 属性名のみを表示するです。
ビューアーは、単語を含むルールのみを表示し、"**mountain-200**"です。 ルールの確率する可能性はどのはこれが示しているだれかが購入するとき、 **マウンテン-200** 自転車、そのユーザーは、他の製品を購入してもします。  

ルールは確率の降順で表示されますが、列見出しをクリックして並べ替え順を変更できます。 特定のルールの詳細に関心がある場合は、ドリルスルーを使用して、そのルールをサポートするケースを表示することもできます。

特定のルールをサポートするケースを表示するには

  1. ルール ] タブで、表示するルールを右クリックします。

  2. 選択 ドリル スルー, 、し、[ モデル列のみ, 、または モデルおよび構造列します。

    ドリル スルー ] ダイアログ ボックスは、ウィンドウの上部とルールのサポート データとして使用されたすべてのケースの一覧にルールの概要を示します。

トップに戻る

汎用コンテンツ ツリー ビューアー

このビューアーは、アルゴリズムやモデルの種類に関係なく、すべてのモデルで使用できます。 Microsoft 汎用コンテンツ ツリー ビューアー から利用できる、 ビューアー ボックスの一覧です。

コンテンツ ツリーは、マイニング モデルを一連のノードで表したものです。各ノードは、データのサブセットに関する学習済みの知識を表します。 ノードには、いくつかの特徴が共通するパターン、一連のルール、クラスター、または日付範囲の定義を含めることができます。 ノードの正確な内容はアルゴリズムや予測可能な属性の種類に応じて変わりますが、内容の全体的な表示は同じです。 各ノードを展開して、より詳細なレベルで表示したり、任意のノードの内容をクリップボードにコピーしたりできます。

コンテンツ ビューアーを使用してルールの詳細を表示するには

  1. マイニング モデル ビューアー ] タブで [ Microsoft 汎用コンテンツ ツリー ビューアー から、 ビューアー ] ボックスの一覧です。

  2. [ノードのキャプション] ペインで、一覧を一番下までスクロールして最後のノードをクリックします。

    ビューアーでは、最初にアイテムセット、次にルールが表示されますが、グループ化はされていません。 特定のノードを見つけるには、コンテンツ クエリを作成するのが最も簡単です。 詳細については、「結合モデルのクエリ例」を参照してください。

  3. [ノードの詳細] ペインで、NODE_TYPE と NODE_DESCRIPTION の値を確認します。

    ルールのノードの種類は 8 で、アイテムセットのノードの種類は 7 です。 ルールの NODE_DESCRIPTION の値は、ルールを構成する条件を表します。 アイテムセットの NODE_DESCRIPTION の値は、アイテムセットに含まれるアイテムを表します。

コンテンツ クエリを作成してルールの詳細な統計情報を取得することもできます。 マイニング モデル コンテンツおよびその解釈方法の詳細については、次を参照してください #40; (&)、アソシエーション モデルのマイニング モデル コンテンツ。Analysis Services - データ マイニング )します。

トップに戻る

このレッスンの次の作業

マイニング モデルと #40; 中級者向けデータ マイニング チュートリアル ) で入れ子になったテーブルをフィルター処理

参照

レッスン 3: マーケット バスケット シナリオの作成 (中級者向けデータ マイニング チュートリアル)
レッスン 4: シーケンス クラスタ リングのシナリオと #40; 中級者向けデータ マイニング チュートリアル ) の作成
Microsoft アソシエーション アルゴリズム
Microsoft アソシエーション アルゴリズム テクニカル リファレンス