Share via


データ マイニング ウィザード

Microsoft SQL Server 2005 Analysis Services (SSAS) のデータ マイニング ウィザードは、新しいマイニング構造をデータ マイニング プロジェクトに追加するたびに起動します。このウィザードでは、新しい構造が定義され、構造ごとに初期マイニング モデルも定義されます。テーブルや列などの初期モデルの構造は、既存のデータ ソース ビューまたはキューブから取得されます。

データ マイニング ウィザードでは、次のタスクを実行できます。

  • データ マイニング構造およびモデルを、リレーショナル データベースから作成するか、OLAP データベースの既存のキューブから作成するかを指定する。
  • 初期モデルの作成に使用するアルゴリズムを指定する。
  • モデルを作成するトレーニング データが含まれているデータ ソース ビューまたはキューブ ディメンションを指定する。
  • リレーショナル データ ソースからケース テーブルおよび入れ子になったテーブルを指定するか、OLAP データ ソースからケース キーおよびケース レベル列を指定して、ケース セットを定義する。
  • ケース セットの列の使用法を定義する。
  • 列のコンテンツの種類およびデータ型を自動検出して設定する。
  • マイニング モデルが OLAP データ ソースに基づいている場合は、キューブをスライスする。
  • 新しいマイニング構造と初期マイニング モデルに名前を付ける。
  • マイニング モデルが OLAP データ ソースに基づいている場合は、新しいデータ マイニング ディメンションを作成する。

データ マイニング ウィザードを完了したら、データ マイニング デザイナを使用してマイニング構造およびモデルを変更し、モデルに対する参照および予測を行います。

詳細情報 :データ マイニング デザイナ

データ マイニング ウィザードの使用

データ マイニング ウィザードを起動するには、ソリューション エクスプローラまたは Business Intelligence Development Studio の [プロジェクト] メニューを使用して、新しいマイニング構造を Analysis Services プロジェクトに追加します。

データ マイニング ウィザードには、データ ソースの種類ごとに 1 つずつ、2 つの分岐があります。

  • リレーショナル マイニング モデル
  • OLAP マイニング モデル

リレーショナル マイニング モデル

Analysis Services のリレーショナル データ ソースからマイニング モデルを作成する場合は、まずデータ マイニング ウィザードで、既存のリレーショナル データベースを使用してモデルの構造を定義することを指定します。次に、目的のデータ マイニング分析の種類に最適なアルゴリズムを選択して、使用するデータ マイニング技法を指定します。

詳細情報 :データ マイニング アルゴリズム

データ ソース ビューとテーブルの種類の指定

次に、ウィザードで、マイニング構造を定義するための特定のデータ ソース ビューを選択し、ケース テーブルを指定します。ケース テーブルには、マイニング モデルをトレーニングするためのトレーニング データが含まれています。データが複数のテーブルに含まれている場合は、ケース テーブル内で入れ子にするテーブルを指定することもできます。

詳細情報 :入れ子になったテーブル

列の使用法の指定

ケース テーブルと入れ子になったテーブルを指定したら、マイニング構造に含めるテーブルの列ごとに使用法を決定します。列の使用法を指定しないと、列はマイニング構造に含まれません。データ マイニング列は、キー列、入力列、予測可能列、または入力列と予測可能列の組み合わせの 4 種類のいずれかです。キー列には、テーブルの行ごとに一意識別子が含まれます。シーケンス クラスタ モデルやタイム シリーズ モデルなど、複数のキー列を含めることができるマイニング モデルもあります。入力列は、予測を行うための情報を提供します。予測可能列には、マイニング モデルで予測しようとする情報が含まれています。

たとえば、一連のテーブルに、顧客 ID、人口統計情報、および特定の店で各顧客が使う金額を含めることができます。顧客 ID では、顧客が一意に識別され、ケース テーブルが入れ子になったテーブルに関連付けられるので、キー列として使用します。人口統計情報からの選択した列を入力列として使用し、各顧客が使う金額を示す列を予測可能列として使用できます。これにより、顧客が 1 つの店で使う金額に人口統計を関連付けるマイニング モデルを作成できます。このモデルはターゲット マーケティングのベースとして使用できます。

データ マイニング ウィザードでは、予測可能列を選択した場合に使用できる [候補検索] 機能が提供されています。多くの場合、データセットには、マイニング モデルの作成に使用する列よりも多くの列が含まれます。[候補検索] 機能では、データセット内の各列と予測可能列の間のリレーションシップを説明する 0 ~ 1 の数値スコアが計算されます。このスコアに基づいて、マイニング モデルの入力として使用する列が提示されます。[候補検索] 機能を使用する場合は、提示された列を使用するか、必要に応じて選択を変更するか、または提示を無視することができます。

コンテンツの種類とデータ型の指定

1 つまたは複数の予測可能列と入力列を選択したら、列ごとにコンテンツの種類とデータ型を指定できます。

詳細情報 :データ型 (データ マイニング)」、「コンテンツの種類 (データ マイニング)

ウィザードの完了

ウィザードでの最後の手順として、マイニング構造と関連マイニング モデルに名前を付けます。[ドリルスルーを許可する] を選択すると、ドリルスルー機能がモデルで有効になります。この機能を使用すると、モデルの作成に使用するソース データを調査できます。

トップに戻る

OLAP マイニング モデル

Analysis Services の OLAP データ ソースから多次元マイニング モデルを作成する場合は、まずデータ マイニング ウィザードで、既存のキューブを使用してモデルの構造を定義する必要があることを指定します。次に、目的のデータ マイニング分析の種類に最適なアルゴリズムを選択して、使用するデータ マイニング技法を指定します。

詳細情報 :データ マイニング アルゴリズム

データ ソースとケース キーの指定

次に、マイニング構造を定義するためのデータ ソースとして使用するキューブ ディメンションを選択します。マイニング モデルのキー (ケース キー) として使用する属性を選択します。

ms175645.note(ja-jp,SQL.90).gifメモ :
作成する OLAP マイニング モデルと、モデルの作成に使用するソース キューブは、同じ Analysis Services データベースに含まれている必要があります。

ケース レベル列と列の使用法の指定

ケース キーを選択すると、そのキーに関連付けられている属性およびメジャーが、ウィザードの次のページにあるツリー ビューに表示されます。この一覧から、構造の列として使用する属性およびメジャーを選択します。これらの列は、ケース レベル列と呼ばれます。リレーショナル モデルと同様に、ウィザードの次のページで、構造での各列の使用法も指定する必要があります。列は、キー列、入力列、予測可能列、入力列および予測可能列、または未選択にすることができます。

入れ子になったテーブルの追加

データ マイニング ウィザードの OLAP 分岐には、入れ子になったテーブルをマイニング モデル構造に追加するためのオプションが含まれています。ウィザードの [マイニング モデル列の使用法の指定] ページで、[入れ子になっているテーブルの追加] をクリックして、入れ子になったテーブルを追加する手順を案内する、別のダイアログ ボックスを開きます。ディメンションに適用されるメジャー グループのみが表示されます。ケース ディメンションの外部キーを含むメジャー グループを選択します。次に、メジャー グループの各列の使用法を、入力列または予測可能列に指定します。ウィザードによって、入れ子になったテーブルがケース テーブルに追加されます。入れ子になったテーブルの既定の名前は、入れ子になったディメンション名ですが、入れ子になったテーブルとその列は名前を変更できます。詳細情報 :入れ子になったテーブル

コンテンツの種類とデータ型の指定

1 つまたは複数の予測可能列と入力列を選択したら、列ごとにコンテンツの種類とデータ型を指定できます。

詳細情報 :データ型 (データ マイニング)」、「コンテンツの種類 (データ マイニング)

ソース キューブのスライス

ウィザードの OLAP 分岐で、マイニング モデルをトレーニングする前にソース キューブをスライスすることによって、マイニング モデルのスコープを制限できます。キューブのスライスは、SQL ステートメントへの WHERE 句の追加に似ています。たとえば、キューブに製品の購入に関する情報が含まれている場合、年齢の属性を 31 歳以上、性別の列を女性のみ、購入日を 2000 年 3 月以降に制限できます。このようにすると、年齢が 31 歳以上で、2000 年 3 月以降に製品を購入した女性のスコープが対象になるようにモデルを制限できます。

ウィザードの完了

ウィザードでの最後の手順として、マイニング構造と関連マイニング モデルに名前を付けます。[ドリルスルーを許可する] を選択すると、ドリルスルー機能がモデルで有効になります。この機能を使用すると、モデルの作成に使用するソース データを検索できます。マイニング モデルに基づいて、新しいディメンションをソース キューブに追加するか、マイニング モデルから新しいキューブを作成するかを指定することもできます。

トップに戻る

参照

概念

新しいマイニング構造の作成
データ マイニング デザイナでのマイニング モデルの管理
データ マイニングの概念
データ マイニング ツールの使用
データ マイニングの操作

その他の技術情報

[マイニング構造] タブについて

ヘルプおよび情報

SQL Server 2005 の参考資料の入手