マーケット バスケット DMX のチュートリアル

このチュートリアルでは、データ マイニング拡張機能 (DMX) クエリ言語を使用して、マイニング モデルを作成、トレーニング、および調査する方法を学習します。その後、このマイニング モデルを使用して、同時に購入される傾向が高い製品を示す予測を作成します。

マイニング モデルは、AdventureWorksDW2008R2 サンプル データベース内のデータから作成します。このサンプル データベースには、架空の企業である Adventure Works Cycles のデータが格納されています。Adventure Works Cycles は、多国籍の大規模な製造企業であり、北米、ヨーロッパ、およびアジアの市場向けに、金属製自転車や複合材製自転車の製造および販売を行っています。企業の拠点は従業員 290 人を擁する米国ワシントン州ボセルで、また各国の市場の拠点として、複数の地域販売チームが配置されています。

チュートリアルのシナリオ

Adventure Works Cycles は、データ マイニング機能を用いたカスタム アプリケーションを作成して、同時に購入する傾向が高い製品の種類を予測することにしました。このカスタム アプリケーションの目標は、一連の製品を指定できるようにし、指定した製品と共に購入される追加製品を予測できるようにすることです。Adventure Works Cycles はこれらの情報を使用して、企業の Web サイトで "お勧め" の製品を表示すると共に、顧客によりわかりやすく情報を表示したいと考えています。

Microsoft SQL Server Analysis Services は、このタスクを遂行できる以下のツールを備えています。

Analysis Services で提供されるデータ マイニング拡張機能 (DMX) は、マイニング モデルの作成と作業に使用できるクエリ言語です。Microsoft アソシエーション アルゴリズムでは、まとめて購入される可能性が高い製品を予測するモデルを作成できます。

このチュートリアルの目標は、カスタム アプリケーションで使用する DMX クエリを設定することです。

詳細については、データ マイニング プロジェクト (Analysis Services - データ マイニング)」を参照してください。

マイニング構造とマイニング モデル

DMX ステートメントを作成するにあたっては、Analysis Services がマイニング モデルの作成に使用する主なオブジェクトを理解しておくことが重要です。マイニング構造は、マイニング モデルの作成元のデータ ドメインを定義するデータ構造です。1 つのマイニング構造には、同じドメインを共有する複数のマイニング モデルを含めることができます。マイニング モデルは、マイニング構造によって表されるデータにマイニング モデル アルゴリズムを適用します。

マイニング構造の構成要素は、データ ソースに格納されているデータについて記述したマイニング構造列です。マイニング構造列には、データ型、コンテンツの種類、データの配布方法などの情報が格納されます。

マイニング モデルには、マイニング構造で記述されたキー列と、残りの列のサブセットが含まれる必要があります。マイニング モデルでは、各列の使用法と、マイニング モデルの作成に使用するアルゴリズムを定義します。たとえば、DMX では列がキー列または PREDICT 列であることを指定できます。指定されない列は入力列として扱われます。

DMX でマイニング モデルを作成するには、2 つの方法があります。1 つは、CREATE MINING MODEL ステートメントを使用して、マイニング構造とそれに関連するマイニング モデルを一度に作成する方法です。もう 1 つは、最初に CREATE MINING STRUCTURE ステートメントを使用してマイニング構造を作成し、ALTER STRUCTURE ステートメントを使用してマイニング モデルを追加する方法です。これらの方法について次に説明します。

  • CREATE MINING MODEL
    このステートメントを使用すると、マイニング構造とそれに関連するマイニング モデルを一度に、同じ名前を使って作成できます。マイニング構造と区別するため、マイニング モデルの名前には "Structure" という文字列が付加されます。

    このステートメントは、1 つのマイニング モデルを含むマイニング構造を作成する場合に便利です。

    詳細については、「CREATE MINING MODEL (DMX)」を参照してください。

  • CREATE MINING STRUCTURE
    新しいマイニング構造をモデルなしで作成するには、このステートメントを使用します。

    CREATE MINING STRUCTURE を使用すると、提示されたデータ セットも作成できます。提示されたデータ セットは、同一のマイニング構造に基づくすべてのモデルをテストするために使用できます。

    詳細については、「CREATE MINING STRUCTURE (DMX)」を参照してください。

  • ALTER MINING STRUCTURE
    このステートメントを使用すると、サーバー上に既に存在するマイニング構造にマイニング モデルを追加できます。

    1 つのマイニング構造に複数のマイニング モデルを追加すると、いくつかの作業に役立ちます。たとえば、異なるアルゴリズムを使用して複数のマイニング モデルを作成し、最適なアルゴリズムを見つけ出すことができます。また、同じアルゴリズムでそれぞれ異なるパラメーターを設定して複数のマイニング モデルを作成し、パラメーターの最適な設定を見つけ出すことができます。

    詳細については、「ALTER MINING STRUCTURE (DMX)」を参照してください。

このチュートリアルでは複数のマイニング モデルを含むマイニング構造を作成します。したがって、2 つ目の方法を使用します。

詳細については、次を参照してください。

データ マイニング拡張機能 (DMX) リファレンス, 選択ステートメント (DMX) について, 予測クエリ (DMX)

学習する内容

このチュートリアルは次のレッスンで構成されています。

必要条件

このチュートリアルを行う前に、次のソフトウェアがインストールされていることを確認してください。

  • Microsoft SQL Server 

  • Microsoft SQL Server Analysis Services 

  • AdventureWorksDW2008R2 データベース

セキュリティ強化のため、既定ではサンプル データベースがインストールされません。Microsoft SQL Server の公式サンプル データベースをインストールするには、https://www.CodePlex.com/MSFTDBProdSamples にアクセスするか、Microsoft SQL Server のサンプルとコミュニティのプロジェクトのホーム ページにある Microsoft SQL Server の製品サンプルのセクションにアクセスします。 [Databases] をクリックし、[Releases] タブをクリックして目的のデータベースを選択します。

注意

チュートリアルを行うときは、ドキュメント ビューアーのツール バーに [次のトピック] ボタンと [前のトピック] ボタンを追加することをお勧めします。詳細については、「ヘルプへの [次のトピック] ボタンと [前のトピック] ボタンの追加」を参照してください。