[アーティクル]
04/01/2012

新しいマイニング構造の作成

Microsoft SQL Server Analysis Services でデータマイニングソリューションを作成する場合は、まず Business Intelligence Development Studio のデータマイニングウィザード (Analysis Services - データマイニング)を使用してマイニング構造を作成します。マイニング構造では、マイニングモデルの作成元となるデータドメインが定義されます。すべてのマイニングモデルは構造に基づいています。

マイニング構造は、リレーショナルデータソースまたはオンライン分析処理 (OLAP) データソースを使用します。リレーショナルマイニング構造は、データソースビューとして定義され、テーブル、ファイル、およびリレーショナルデータベースシステムに格納されているデータに基づいています。OLAP マイニング構造は、そのマイニング構造と同じデータベースに存在する OLAP キューブのディメンションおよび関連メジャーに基づいています。

詳細情報 :「データベースのデザイン」、「Analysis Services 多次元データベースオブジェクトの設計」

データマイニングウィザードでは、自動的にマイニング構造が定義され、初期マイニングモデルをその構造に追加できるようになります。マイニング構造には複数のマイニングモデルを含めることができるため、データマイニングデザイナを使用して、その構造にマイニングモデルをさらに追加できます。

次のセクションでは、データマイニングウィザードを使用して新しいマイニング構造を作成する方法について説明します。また、テストセットの作成やマイニング構造内のデータに対するクエリの実行に使用するオプションをマイニング構造に設定する方法についても説明します。

リレーショナルマイニング構造の作成
OLAP マイニング構造の作成
ドリルスルーと提示データの有効化

リレーショナルマイニング構造の作成

リレーショナルマイニング構造は、OLE DB データソースで使用可能なすべてのデータに基づいて作成できます。ソースデータが複数のテーブルに格納されている場合は、必要に応じてテーブルと列が連結されたデータソースビューを作成できます。テーブルに 1 対多のリレーションシップが含まれている場合 (分析対象の顧客ごとに複数の購入レコードがある場合など)、両方のテーブルを追加し、1 つのテーブルをケーステーブルとして使用し、"多" の側のリレーションシップからのデータを入れ子になったテーブルとして使用できます。

詳細情報 : 「入れ子になったテーブル (Analysis Services - データマイニング)」

データマイニングウィザードでは、次の手順に従って新しいマイニングモデルの構造を作成します。

データソースの種類 (この場合はリレーショナルデータベース) を選択します。
構造のみを作成するか、構造と共にマイニングモデルも作成するかを決定します。
モデルのアルゴリズムを選択します。
データソースを選択します。
ケーステーブル (必要に応じて、入れ子になったテーブル) を選択します。
各列の種類 (予測可能列、入力列、またはキー列) を選択します。
列のコンテンツの種類を指定します。
提示されたデータセットを指定します (省略可)。
構造のドリルスルーを有効にし、新しいマイニング構造と関連マイニングモデルに名前を付けて保存します。

詳細情報 : 「データマイニングアルゴリズム (Analysis Services - データマイニング)」、「マイニングモデル列」、「マイニング構造列」、「データ型 (データマイニング)」、「コンテンツの種類 (データマイニング)」

OLAP マイニング構造の作成

OLAP キューブには多数のメンバーおよびディメンションが含まれていることが多く、データマイニングをどこから始めたらよいか判断するのが難しい場合があります。キューブ内のパターンを手動で識別しやすくするには、通常、目的のディメンションを 1 つ特定してから、そのディメンションに関連するパターンを調べます。次の表は、一般的な OLAP データマイニングタスクの一覧で、各タスクを適用できるサンプルシナリオの説明、各タスクに使用するデータマイニングアルゴリズムを示しています。

タスク	サンプルシナリオ	アルゴリズム
クラスターへのメンバーのグループ化	顧客メンバーのプロパティ、顧客が購入する製品、顧客が費やす金額に基づいて顧客ディメンションを分割します。	Microsoft クラスタリングアルゴリズム
興味深いメンバーまたは異常なメンバーの検索	売上、利益、店舗の場所、店舗の規模に基づいて、Store ディメンション内の興味深い店舗または異常な店舗を識別します。	Microsoft デシジョンツリーアルゴリズム
興味深いセルまたは異常なセルの検索	一般的な傾向に反している店舗売上を識別します。	Microsoft タイムシリーズアルゴリズム

データマイニングウィザードでは、次の手順に従って新しいマイニングモデルの構造を作成します。

データソースの種類 (この場合はキューブ) を選択します。

注
OLAP キューブはマイニング構造と同じデータベース内に存在する必要があります。PowerPivot for Excel アドインにより作成されたキューブは、データマイニング用のソースとして使用できません。

アルゴリズムを選択します。
ソースキューブのディメンションを選択します。
ケースキーを選択します。
ケース列を選択します。
入れ子になったテーブルを選択します。
各列の使用法 (予測可能列、入力列、またはキー列) を選択します。
列のコンテンツの種類を指定します。
ソースキューブをスライスします。
テストデータセットを作成します (省略可)。
新しいマイニング構造と関連するマイニングモデルに名前を付けて保存します。

ウィザードの最後のページでは、次のオプションを設定できます。

[ドリルスルーを許可する]
[マイニングモデルディメンションを作成する]
[マイニングモデルディメンションを使用してキューブを作成する]

ソースキューブ内に新しいマイニングモデルディメンションを作成する場合は、データマイニングアルゴリズムによって OLAP データソース内で検索される情報を含めることができます。マイニングモデルディメンションを作成すると、ディメンションの形式で格納されているモデル内容の参照やクエリを実行できます。このオプションは、Microsoft クラスタリング、Microsoft デシジョンツリー、Microsoft アソシエーションルールの各アルゴリズムに基づいて作成されたモデルに対して使用できます。

新しいキューブを作成するオプションを選択した場合、新しいキューブはそのマイニングモデルディメンション (および場合によっては関連ディメンション) を含んでいるデータベース上に定義されます。これにより、マイニングモデルにより検出された階層でファクトデータをスライスできるようになります。

ドリルスルーと提示データの有効化

マイニング構造の作成時には、データの操作に関する 2 つの重要なオプションについても設定する必要があります。提示データとドリルスルーです。提示データとは、マイニング構造内のデータをトレーニングセットとテストセットにパーティション分割して、その構造に関連付けられたすべてのモデルで使用できるようにする機能です。詳細については、「トレーニングセットとテストセットへのデータのパーティション分割 (Analysis Services - データマイニング)」を参照してください。

ドリルスルーを使用すると、マイニングモデルにクエリを実行することにより、マイニング構造内のソースデータを表示できます。これは、マイニングモデルの結果を表示する際、基になるケースの詳細も必要な場合に便利です。たとえば、特定のクラスターのトレーニングに使用されたケースである連絡先情報が必要な場合などです。ドリルスルーを使用するには、マイニング構造の作成時に有効にする必要があります。後から有効にすることはできません。詳細については、「マイニングモデルとマイニング構造におけるドリルスルーの使用 (Analysis Services - データマイニング)」を参照してください。

新しいマイニング構造の作成

リレーショナルマイニング構造の作成

OLAP マイニング構造の作成

ドリルスルーと提示データの有効化

関連項目

概念

その他の技術情報

その他のリソース

新しいマイニング構造の作成

リレーショナル マイニング構造の作成

OLAP マイニング構造の作成

ドリルスルーと提示データの有効化

関連項目

概念

その他の技術情報

その他のリソース

リレーショナルマイニング構造の作成