Share via


Naive Bayes モデルの検証 (基本的なデータ マイニング チュートリアル)

Microsoft Naive Bayes アルゴリズムには、自転車購入と入力属性の相互関係を表示するための手段がいくつか用意されています。

Microsoft Naive Bayes ビューアーには、Naive Bayes マイニング モデルを調べるための次のタブがあります。

依存関係ネットワーク

属性のプロファイル

属性の特性

属性の識別

他のマイニング モデルを検証する方法については、次のセクションで説明します。

依存関係ネットワーク

この [依存関係ネットワーク] タブは、Microsoft ツリー ビューアーの [依存関係ネットワーク] タブと同じ機能を持っています。ビューアーの各ノードは属性を表し、ノード間を結ぶ線は関係を表します。このビューアーでは、予測可能属性 Bike Buyer の状態に影響を与えるすべての属性を確認できます。

[依存関係ネットワーク] タブでモデルを調査するには

  1. TM_NaiveBayes モデルに切り替えるには、[マイニング モデル ビューアー] タブの上部にある [マイニング モデル] ボックスの一覧を使用します。

  2. [Microsoft Naive Bayes ビューアー] に切り替えるには、[ビューアー] ボックスの一覧を使用します。

  3. [Bike Buyer] ノードをクリックしてこのノードの依存関係を特定します。

    ピンクの網掛けは、すべての属性が自転車の購入に影響を与えることを表します。

  4. スライダーを調整して、最も影響の大きい属性を特定します。

    スライダーを下方向へ動かすと、[Bike Buyer] 列に最も大きな影響を与える属性のみが表示されます。スライダーを調整することにより、所有する車の台数、通勤距離、子供の数などが影響の大きい属性であることがわかります。

トップに戻る

属性のプロファイル

[属性のプロファイル] タブは、入力属性の各状態が予測可能属性の結果にどのように影響するかを示します。

[属性のプロファイル] タブでモデルを調査するには

  1. [予測可能] ボックスで、[Bike Buyer] が選択されていることを確認します。

  2. [マイニング凡例][属性のプロファイル] の表示を妨げている場合は、[マイニング凡例] を他の場所に移動します。

  3. [ヒストグラム] バーのボックスで、[5] を選択します。

    このモデルでは、1 つの変数に対する状態の最大数が 5 になります。

    この予測可能属性の状態に影響を与える属性の一覧が表示されます。さらに、それぞれの入力属性について、各状態の値、および予測可能属性の各状態に対する影響分布も表示されます。

  4. [属性] 列で、[Number Cars Owned] を見つけます。自転車の購入者 (1 のラベルが付けられた列) と非購入者 (0 のラベルが付けられた列) について、ヒストグラムで違いを確認できます。車の台数が 0 または 1 の人は、自転車を購入する可能性が高くなります。

  5. 自転車の購入者の列 (1 のラベルが付けられた列) の [Number Cars Owned] セルをダブルクリックします。

    [マイニング凡例] に詳細が表示されます。

トップに戻る

属性の特性

[属性の特性] タブでは、選択した属性が選択した値をとるために、その他の属性がどの程度の確率で影響するかを確認できます。

[属性の特性] タブでモデルを調査するには

  1. [属性] ボックスの一覧で、[Bike Buyer] が選択されていることを確認します。

  2. [値][1] に設定します。

    このビューアーで見ると、自転車を購入する可能性が高いのは、北米地域に在住し、子供と同居しておらず、通勤距離が短い顧客であることがわかります。

トップに戻る

属性の識別

[属性の識別] タブでは、自転車の購入の 2 つの値とその他の属性との関係を確認できます。TM_NaiveBayes モデルには 1 と 0 の 2 つの状態しかないため、ビューアーを変更する必要がありません。

このビューアーでは、車を所有していない人が自転車を購入する傾向にあり、車を 2 台所有している人は自転車を購入しない傾向にあることがわかります。