Microsoft SQL Server 2008 Analysis Services (SSAS) の「基本的なデータ マイニング チュートリアル」へようこそ。Microsoft SQL Server には、データ マイニング モデルを作成し、データ マイニング モデルを使用して作業を行うための統合環境が用意されています。「基本的なデータ マイニング チュートリアル」では、顧客の購買行動を分析して見込み客を絞り込むための 3 つのモデルを作成することで、絞り込みメール配信キャンペーンのためのシナリオを完成させます。このチュートリアルでは、Microsoft SQL Server Analysis Services に付属するデータ マイニング アルゴリズム、マイニング モデル ビューア、データ マイニング ツールの使用方法を示します。すべての例で、架空の企業である Adventure Works Cycles を使用します。
「データ マイニング ツールの操作に精通している場合は、「中級者向けデータ マイニング チュートリアル」も実行することをお勧めします。「中級者向けデータ マイニング チュートリアル」では、予測、マーケット バスケット分析、時系列、アソシエーション モデル、入れ子になったテーブル、およびシーケンス クラスタの使用方法について説明します。

チュートリアルのシナリオ
このチュートリアルでは、購買履歴に基づいて会社の顧客について調査するよう命じられた Adventure Works Cycles の従業員になったつもりで、履歴データからマーケティングに利用できる予測を行います。会社はこれまでデータ マイニングを行ったことがなかったので、データ マイニング専用の新しいデータベースを作成し、データ マイニング モデルを設定する必要があります。

学習する内容
このチュートリアルでは、複数種のデータ マイニング モデルの作成方法と使用方法を説明します。また、マイニング モデルのコピーを作成し、マイニング モデルにフィルタを適用する方法についても説明します。次に、新しいモデルを処理し、リフト チャートを使用してモデルを評価します。モデルが完成したら、ドリルスルーを使用して、基になるマイニング構造から追加のデータを取得します。
Microsoft は、ユーザーがカスタム データ マイニング モデルを作成し、その結果をより効果的に利用するのに役立ついくつかの新機能を SQL Server 2008 に組み込んでいます。
-
提示されたテスト セット: マイニング構造を作成する際に、マイニング構造のデータをトレーニング セットとパーマネント テスト セットに分割できるようになりました。
-
マイニング モデル フィルタ: フィルタをマイニング モデルにアタッチし、トレーニングとテストの両方にフィルタを適用できるようになりました。
-
構造ケースおよび構造列へのドリルスルー: マイニング モデルの一般的なパターンからデータ ソースの実用的な詳細に簡単に移動できるようになりました。
このチュートリアルは次のレッスンで構成されています。
-
レッスン 1: Analysis Services データベースの準備 (基本的なデータ マイニング チュートリアル)
-
このレッスンでは、新しい Analysis Services データベースを作成する方法、データ ソースとデータ ソース ビューを追加する方法、およびデータ マイニングで使用する新しいデータベースを準備する方法を学習します。
-
レッスン 2: 絞り込みメール配信構造の作成 (基本的なデータ マイニング チュートリアル)
-
このレッスンでは、絞り込みメール配信シナリオの一部として使用できるマイニング モデル構造の作成方法を学習します。
-
レッスン 3: モデルの追加と処理
-
このレッスンでは、構造にモデルを追加する方法を学習します。モデルの作成には、次のアルゴリズムを使用します。
-
Microsoft デシジョン ツリー
-
Microsoft クラスタ
-
Microsoft Naive Bayes
-
レッスン 4: 絞り込みメール配信モデルの検証 (基本的なデータ マイニング チュートリアル)
-
このレッスンでは、ビューアを使用して各モデルの結果を調査および解釈する方法を学習します。
-
レッスン 5: モデルのテスト (基本的なデータ マイニング チュートリアル)
-
このレッスンでは、いずれかの絞り込みメール配信モデルのコピーを作成し、トレーニング データを制限するためのマイニング モデル フィルタを特定の顧客のセットに追加し、モデルの実行可能性を評価します。
-
レッスン 6: 予測の作成と操作 (基本的なデータ マイニング チュートリアル)
-
「基本的なデータ マイニング チュートリアル」の最後のレッスンでは、モデルを使用して、自転車を購入する可能性が最も高い顧客を予測します。次に、基になるケースをドリルスルーして連絡先情報を取得します。

必要条件
次のソフトウェアがインストールされていることを確認してください。
-
Microsoft SQL Server 2008
-
Microsoft SQL Server Analysis Services
-
AdventureWorks2008 データベース
セキュリティ強化のため、サンプル データベースは SQL Server 2008 と一緒にインストールされません。Microsoft SQL Server の公式データベースをインストールするには、Microsoft SQL Sample Databases ページにアクセスし、AdventureWorksDW20088c4c2af8-f2ed-4559-b5d2-984a9f7ce5ca を選択してください。

参照