Bike Buyer DMX のチュートリアル

 

対象: SQL Server 2016 Preview

このチュートリアルでは、データ マイニング拡張機能 (DMX) クエリ言語を使用して、マイニング モデルを作成、トレーニング、および調査する方法を学習します。 その後、これらのマイニング モデルを使用して、顧客が自転車を購入するかどうかを判断する予測を作成します。

マイニング モデルは、AdventureWorksDW2012 サンプル データベース内のデータから作成します。このサンプル データベースには、架空の企業である Adventure Works Cycles のデータが格納されています。 Adventure Works Cycles 多国籍の大規模な製造企業です。 北米、ヨーロッパ、およびアジアの市場向けに、金属製自転車や複合材製自転車の製造および販売を行っています。 基本操作は、ワシントン州のボセル従業員 290 人にあり、各国の市場の拠点にある複数の地域販売チームがあります。 詳細については、 AdventureWorksDW2012 サンプル データベースは、「 データ マイニング ソリューションします。

チュートリアルのシナリオ

Adventure Works Cycles データ マイニング機能を使用するカスタム アプリケーションを作成することで、データ分析を拡張することにしました。 このカスタム アプリケーションでは、次の機能を実現することを目標にします。

  • 潜在顧客の特性を入力し、潜在顧客が自転車を購入するかどうかを予測する。

  • 特性の他に潜在顧客の一覧も入力し、どの顧客が自転車を購入するかを予測する。

1 つ目のケースでは、顧客登録ページから顧客データを取得し、2 つ目のケースでは、Adventure Works Cycles のマーケティング部門が潜在顧客の一覧を提供するようにします。

マーケティング部門には、さらに住所、子どもの数、通勤距離などの特性に基づいて既存の顧客を分類するという要求が出されています。 この分類を使用して、特定の種類の顧客に的を絞ることができるかどうか確認することが求められています。 これには、追加のマイニング モデルが必要です。

Microsoft SQL Server Analysis Services これらのタスクを実行するために使用できるいくつかのツールを提供します。

Analysis Services で提供されるデータ マイニング拡張機能 (DMX) は、マイニング モデルの作成と作業に使用できるクエリ言語です。 Microsoft デシジョン ツリー アルゴリズムを使用すると、顧客が自転車を購入するかどうかの予測に使用できるモデルを作成できます。 作成したモデルには、個別の顧客または複数の顧客のテーブルを入力できます。 Microsoft クラスタリング アルゴリズムを使用すると、共通の特性に基づいて顧客のグループを作成できます。 このチュートリアルの目標は、カスタム アプリケーションで使用する DMX スクリプトを設定することです。

詳細については:データ マイニング ソリューション

マイニング構造とマイニング モデル

DMX ステートメントを作成するにあたっては、Analysis Services がマイニング モデルの作成に使用する主なオブジェクトを理解しておくことが重要です。 マイニング構造は、マイニング モデルの作成元のデータ ドメインを定義するデータ構造です。 1 つのマイニング構造には、同じドメインを共有する複数のマイニング モデルを含めることができます。 マイニング モデルは、マイニング構造によって表されるデータにマイニング モデル アルゴリズムを適用します。

マイニング構造の構成要素は、データ ソースに格納されているデータについて記述したマイニング構造列です。 マイニング構造列には、データ型、コンテンツの種類、データの配布方法などの情報が格納されます。

マイニング モデルには、マイニング構造で記述されたキー列と、残りの列のサブセットが含まれる必要があります。 マイニング モデルでは、各列の使用法と、マイニング モデルの作成に使用するアルゴリズムを定義します。 たとえば、DMX では列がキー列または PREDICT 列であることを指定できます。 指定されない列は入力列として扱われます。

DMX でマイニング モデルを作成するには、2 つの方法があります。 1 つは、CREATE MINING MODEL ステートメントを使用して、マイニング構造とそれに関連するマイニング モデルを一度に作成する方法です。もう 1 つは、最初に CREATE MINING STRUCTURE ステートメントを使用してマイニング構造を作成し、ALTER STRUCTURE ステートメントを使用してマイニング モデルを追加する方法です。 次の表でこれらの方法について説明します。

CREATE MINING MODEL
このステートメントを使用すると、マイニング構造とそれに関連するマイニング モデルを一度に、同じ名前を使って作成できます。 マイニング構造と区別するため、マイニング モデルの名前には "Structure" という文字列が付加されます。 このステートメントは、1 つのマイニング モデルを含むマイニング構造を作成する場合に便利です。

詳細については、「CREATE MINING MODEL (DMX)」を参照してください。

ALTER MINING STRUCTURE
このステートメントを使用すると、サーバー上に既に存在するマイニング構造にマイニング モデルを追加できます。 このステートメントは、複数の異なるマイニング モデルを含むマイニング構造を作成する場合に便利です。 1 つのマイニング構造に複数のマイニング モデルを追加すると、いくつかの作業に役立ちます。 たとえば、異なるアルゴリズムを使用する複数のマイニング モデルを作成し、最適なアルゴリズムを見つけ出すことができます。 また、同じアルゴリズムでそれぞれ異なるパラメーターを設定して複数のマイニング モデルを作成し、パラメーターの最適な設定を見つけ出すことができます。

詳細については、次を参照してください。 ALTER MINING STRUCTURE #40; DMX )します。

このチュートリアルでは複数のマイニング モデルを含むマイニング構造を作成します。したがって、2 つ目の方法を使用します。

詳細情報

データ マイニング拡張機能と #40; DMX & #41 です。参照, 、Select ステートメントを DMX を理解する, 、構造と DMX 予測クエリの使用方法

学習する内容

このチュートリアルは次のレッスンで構成されています。

レッスン 1: Bike Buyer マイニング構造の作成
このレッスンでは、使用する方法を学習します、 作成 マイニング構造を作成するステートメントです。

レッスン 2: Bike Buyer マイニング構造へのマイニング モデルの追加
このレッスンでは、使用する方法を学習します、 ALTER ステートメントにマイニング構造にマイニング モデルを追加します。

レッスン 3: Bike Buyer マイニング構造の処理
使用する方法について説明するこのレッスンでは、 INSERT INTO マイニング構造とそれに関連するマイニング モデルを処理するステートメントです。

レッスン 4: Bike Buyer マイニング モデルの参照
このレッスンでは、使用する方法を学習します、 選択 マイニング モデルのコンテンツを参照するステートメントです。

レッスン 5: 予測クエリの実行
このレッスンでは、使用する方法を学習します、 PREDICTION JOIN マイニング モデルに対する予測を作成するステートメントです。

必要条件

このチュートリアルを行う前に、次のソフトウェアがインストールされていることを確認してください。

  • Microsoft SQL Server

  • Microsoft SQL Server 2005 Analysis Services (SSAS), SQL Server 2008 Analysis Services (SSAS), SQL Server 2016 Analysis Services (SSAS), or SQL Server Analysis Services

  • AdventureWorksDW2012 データベース。 セキュリティ強化のため、既定ではサンプル データベースがインストールされません。 公式サンプル データベースをインストールする Microsoft SQL Server, を参照してください、 Microsoft SQL Sample Databases ページし、インストールするデータベースを選択します。 サンプル データベースをインストールする方法の詳細については、次を参照してください。 最初のインストール (Analysis Services)します。

参照

マーケット バスケット DMX のチュートリアル
基本的なデータ マイニング チュートリアル