マーケット バスケット DMX のチュートリアル

 

対象: SQL Server 2016 Preview

このチュートリアルでは、作成、トレーニング、およびデータ マイニング拡張機能 (DMX) クエリ言語を使用してマイニング モデルを調査する方法を学習します。 その後、このマイニング モデルを使用して、同時に購入される傾向が高い製品を示す予測を作成します。

マイニング モデルは、AdventureWorksDW2012 サンプル データベース内のデータから作成します。このサンプル データベースには、架空の企業である Adventure Works Cycles のデータが格納されています。 Adventure Works Cycles 多国籍の大規模な製造企業です。 北米、ヨーロッパ、およびアジアの市場向けに、金属製自転車や複合材製自転車の製造および販売を行っています。 企業の拠点は従業員 290 人を擁する米国ワシントン州ボセルで、また各国の市場の拠点として、複数の地域販売チームが配置されています。

チュートリアルのシナリオ

Adventure Works Cycles 同時に購入する傾向が高い製品の種類を予測するデータ マイニング機能を用いたカスタム アプリケーションを作成することにしました。 このカスタム アプリケーションの目標は、一連の製品を指定できるようにし、指定した製品と共に購入される追加製品を予測できるようにすることです。 Adventure Works Cycles この情報の web サイトに「お勧め」の機能を追加し、お客様に情報を提供する方法をよりよく整理使用されます。

Microsoft SQL Server Analysis Services このタスクの実行に使用できるいくつかのツールを提供します。

Analysis Services で提供されるデータ マイニング拡張機能 (DMX) は、マイニング モデルの作成と作業に使用できるクエリ言語です。 Microsoft アソシエーション アルゴリズムを一緒に購入される可能性が高い製品を予測するモデルを作成します。

このチュートリアルの目標は、カスタム アプリケーションで使用する DMX クエリを設定することです。

詳細については:データ マイニング ソリューション

マイニング構造とマイニング モデル

DMX ステートメントを作成するにあたっては、Analysis Services がマイニング モデルの作成に使用する主なオブジェクトを理解しておくことが重要です。 マイニング構造 マイニング モデルの作成元となるデータ ドメインを定義するデータ構造です。 1 つのマイニング構造は、複数を含めることができます マイニング モデル 、同じドメインを共有します。 マイニング モデルは、マイニング構造によって表されるデータにマイニング モデル アルゴリズムを適用します。

マイニング構造の構成要素は、データ ソースに格納されているデータについて記述したマイニング構造列です。 マイニング構造列には、データ型、コンテンツの種類、データの配布方法などの情報が格納されます。

マイニング モデルには、マイニング構造で記述されたキー列と、残りの列のサブセットが含まれる必要があります。 マイニング モデルでは、各列の使用法と、マイニング モデルの作成に使用するアルゴリズムを定義します。 たとえば、DMX では列がキー列または PREDICT 列であることを指定できます。 指定されない列は入力列として扱われます。

DMX でマイニング モデルを作成するには、2 つの方法があります。 作成することも、マイニング構造と関連するマイニング モデル化を使用して、 CREATE MINING MODEL ステートメント、または、最初に作成できますマイニング構造を使用して、 CREATE MINING STRUCTURE ステートメントを使用して、構造にマイニング モデルを追加、 ALTER STRUCTURE ステートメントです。 これらの方法について次に説明します。

CREATE MINING MODEL
このステートメントを使用すると、マイニング構造とそれに関連するマイニング モデルを一度に、同じ名前を使って作成できます。 マイニング構造と区別するため、マイニング モデルの名前には "Structure" という文字列が付加されます。

このステートメントは、1 つのマイニング モデルを含むマイニング構造を作成する場合に便利です。

詳細については、「CREATE MINING MODEL (DMX)」を参照してください。

CREATE MINING STRUCTURE
新しいマイニング構造をモデルなしで作成するには、このステートメントを使用します。

CREATE MINING STRUCTURE を使用すると、予約データ セットも作成できます。予約データ セットは、同一のマイニング構造に基づくすべてのモデルをテストするために使用できます。

詳細については、「CREATE MINING STRUCTURE (DMX)」を参照してください。

ALTER MINING STRUCTURE
このステートメントを使用すると、サーバー上に既に存在するマイニング構造にマイニング モデルを追加できます。

1 つのマイニング構造に複数のマイニング モデルを追加すると、いくつかの作業に役立ちます。 たとえば、異なるアルゴリズムを使用して複数のマイニング モデルを作成し、最適なアルゴリズムを見つけ出すことができます。 代わりに、同じアルゴリズムを使用して複数のマイニング モデルを作成するが、パラメーターを持つ異なる設定をそのパラメーターの最適な設定を検索するには、各マイニング モデル可能性があります。

詳細については、次を参照してください。 ALTER MINING STRUCTURE #40; DMX )します。

このチュートリアルでは複数のマイニング モデルを含むマイニング構造を作成します。したがって、2 つ目の方法を使用します。

詳細情報

データ マイニング拡張機能と #40; DMX & #41 です。参照, 、Select ステートメントを DMX を理解する, 、構造と DMX 予測クエリの使用方法

学習する内容

このチュートリアルは次のレッスンで構成されています。

レッスン 1: Market Basket マイニング構造の作成
このレッスンでは、使用する方法を学習します、 作成 マイニング構造を作成するステートメントです。

レッスン 2: Market Basket マイニング構造へのマイニング モデルの追加
このレッスンでは、使用する方法を学習します、 ALTER ステートメントにマイニング構造にマイニング モデルを追加します。

レッスン 3: Market Basket マイニング構造の処理
このレッスンでは、使用する方法を学習します、 INSERT INTO マイニング構造とそれに関連するマイニング モデルを処理するステートメントです。

レッスン 4: マーケット バスケット予測の実行
このレッスンでは、使用する方法を学習します、 PREDICTION JOIN マイニング モデルに対する予測を作成するステートメントです。

必要条件

このチュートリアルを行う前に、次のソフトウェアがインストールされていることを確認してください。

  • Microsoft SQL Server

  • Microsoft SQL Server Analysis Services

  • AdventureWorksDW2012 データベース

セキュリティ強化のため、既定ではサンプル データベースがインストールされません。 公式サンプル データベースをインストールする Microsoft SQL Server, に進み、 https://www.CodePlex.com/MSFTDBProdSamples または Microsoft SQL Server の製品サンプルのセクションで、Microsoft SQL Server のサンプルとコミュニティのプロジェクトのホーム ページにします。 をクリックして データベース, 、クリックして、 リリース タブし、データベースを選択します。

注意


追加することをお勧めのチュートリアルを確認するときに 次のトピック「前のトピック ドキュメント ビューアーのツールバーのボタンです。

参照

Bike Buyer DMX のチュートリアル
基本的なデータ マイニング チュートリアル
レッスン 3: マーケット バスケット シナリオの作成 (中級者向けデータ マイニング チュートリアル)