[アーティクル]
04/01/2012

Microsoft アソシエーションアルゴリズム

Microsoft アソシエーションアルゴリズムは、Analysis Services で提供されているアソシエーションアルゴリズムであり、推奨エンジンで使用できます。推奨エンジンでは、顧客が既に購入した製品または興味を示した製品に基づいて、顧客に製品が推奨されます。また、Microsoft アソシエーションアルゴリズムは、マーケットバスケット分析にも使用できます。マーケットバスケット分析の例については、データマイニングチュートリアルの「レッスン 3: マーケットバスケットシナリオの作成 (中級者向けデータマイニングチュートリアル)」を参照してください。

アソシエーションモデルは、個々のケースの識別子とケース内のアイテムの識別子を含んでいるデータセットに基づいて作成されています。ケース内のアイテムのグループは、アイテムセットと呼ばれます。アソシエーションモデルは、一連のアイテムセットと、ケース内でアイテムをグループ化する方法を示すルールで構成されています。アルゴリズムによって識別されるルールは、顧客の買い物かごに既に存在する製品に基づいて、顧客の将来の購入を予測するために使用できます。次の図は、アイテムセットの一連のルールを示しています。

例

Adventure Works Cycle 社では、Web サイトの機能を再設計しています。再設計の目的は、製品の販売を増やすことです。この会社ではトランザクションデータベースで各売上を記録しているので、Microsoft アソシエーションアルゴリズムを使用して、一緒に購入される傾向がある製品のセットを特定できます。その後、顧客の買い物かごに既にある製品に基づいて、顧客が興味を持ちそうな他の製品を予測できます。

アルゴリズムの動作

Microsoft アソシエーションアルゴリズムでは、データセットをスキャンして、ケース内で一緒に表示するアイテムが検索されます。このアルゴリズムは、少なくとも MINIMUM_SUPPORT パラメーターで指定された数のケースに表示される関連アイテムをアイテムセットにグループ化します。たとえば、アイテムセットが "Mountain 200=Existing, Sport 100=Existing" であり、サポートが 710 であるとします。その場合、アルゴリズムはアイテムセットからルールを生成します。これらのルールは、アルゴリズムが重要と識別する他の特定のアイテムの存在に基づいて、データベース内のアイテムの存在を予測するために使用されます。たとえば、ルールが "if Touring 1000=existing and Road bottle cage=existing, then Water bottle=existing" であり、確率が 0.812 であるとします。この例では、アルゴリズムは買い物かごに、Touring 1000 と water bottle cage が入っていることを識別し、買い物かごに water bottle も入っている可能性があることを予測します。

アルゴリズムの詳細と、アルゴリズムの動作のカスタマイズやマイニングモデルの結果の制御のためのパラメーターの一覧については、「Microsoft アソシエーションアルゴリズムテクニカルリファレンス」を参照してください。

アソシエーションモデルに必要なデータ

アソシエーションルールモデルで使用するデータを用意する際には、必要なデータ量やデータの使用方法など、このアルゴリズムにおける要件を把握しておいてください。

アソシエーションルールモデルの要件は次のとおりです。

1 つの key 列 : それぞれのモデルには、各レコードを一意に識別する数値列またはテキスト列が 1 つ含まれている必要があります。複合キーは使用できません。
1 つの予測可能列 : アソシエーションモデルで使用できる予測可能列は 1 つだけで、通常は、入れ子になったテーブルのキー列 (購入された製品の一覧を含むフィールドなど) になります。値は不連続値または分離された値である必要があります。
入力列 : 入力列は不連続である必要があります。アソシエーションモデルの入力データは、通常 2 つのテーブルに格納されています。たとえば、1 つのテーブルに顧客情報が格納されており、もう 1 つのテーブルに顧客が購入した製品が格納されている場合があります。入れ子になったテーブルを使用して、このデータをモデルに入力できます。入れ子になったテーブルの詳細については、「入れ子になったテーブル (Analysis Services - データマイニング)」を参照してください。

アソシエーションモデルでサポートされるコンテンツの種類とデータ型の詳細については、「Microsoft アソシエーションアルゴリズムテクニカルリファレンス」の「必要条件」を参照してください。

アソシエーションモデルの表示

モデルを参照するには、Microsoft アソシエーションビューアーを使用します。アソシエーションモデルを表示すると、さまざまな角度から相関関係が示されるため、データ内で見つかった関係とルールをより深く理解することができます。ビューアーの [アイテムセット] ペインには、最も一般的な組み合わせ (アイテムセット) の詳細な内訳が表示されます。[ルール] ペインには、データから導き出されたルールの一覧が表示され、確率の計算が追加されます。また、ルールが相対的な重要度で順位付けされます。依存関係ネットワークビューアーを使用すると、個々のアイテムがどのように関連付けられているのかを視覚的に調べることができます。詳細については、「Microsoft クラスタビューアを使用したマイニングモデルの表示」を参照してください。

特定のアイテムセットやルールの詳細を調べるには、Microsoft 汎用コンテンツツリービューアーでモデルを参照してください。モデルに保存される内容には、各アイテムセットのサポートや、各ルールのスコアなどの統計情報などが含まれます。詳細については、「アソシエーションモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

予測の作成

モデルの処理が完了したら、ルールとアイテムセットを使用して予測を実行できます。アソシエーションモデルでは、指定したアイテムが存在する場合に発生する可能性があるアイテムを予測できます。この予測には、確率、サポート、重要度などの情報を含めることができます。アソシエーションモデルに対するクエリの作成方法の例については、「アソシエーションモデルのクエリ (Analysis Services - データマイニング)」を参照してください。

データマイニングモデルに対するクエリの作成方法に関する一般情報については、「データマイニングモデルのクエリ (Analysis Services - データマイニング)」を参照してください。

パフォーマンス

アイテムセットを作成して相関関係をカウントするというプロセスには時間がかかる場合があります。Microsoft アソシエーションルールアルゴリズムでは、領域の節約と処理の高速化のための最適化の手法が使用されていますが、次のような状況ではパフォーマンスの問題が発生する可能性があります。

多数のアイテムを含む大きなデータセットを使用する場合。
アイテムセットの最小サイズの設定が低すぎる場合。

処理時間を最小限に抑え、アイテムセットの複雑さを軽減するには、データを分析する前に、関連するアイテムをカテゴリ別にグループ化してみてください。

解説

Predictive Model Markup Language (PMML) を使用したマイニングモデルの作成はサポートされていません。
ドリルスルーがサポートされています。
OLAP マイニングモデルの使用がサポートされています。
データマイニングディメンションの作成がサポートされています。

Microsoft アソシエーションアルゴリズム

例

アルゴリズムの動作

アソシエーションモデルに必要なデータ

アソシエーションモデルの表示

予測の作成

パフォーマンス

解説

関連項目

参照

概念

その他のリソース

Microsoft アソシエーション アルゴリズム

例

アルゴリズムの動作

アソシエーション モデルに必要なデータ

アソシエーション モデルの表示

予測の作成

パフォーマンス

解説

関連項目

参照

概念

その他のリソース

Microsoft アソシエーションアルゴリズム

アソシエーションモデルに必要なデータ

アソシエーションモデルの表示