[アーティクル]
04/01/2012

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングは、複数のコンポーネントの相互作用を伴うプロセスです。SQL Server データベース内のデータのソースまたはその他のデータソースにアクセスし、トレーニング、テスト、または予測に使用します。データマイニング構造とデータマイニングモデルは、Business Intelligence Development Studio または Visual Studio 2005 を使用して定義します。SQL Server Management Studio では、データマイニングオブジェクトを管理したり、予測やクエリを作成したりできます。ソリューションが完成したら、Analysis Services のインスタンスにそのソリューションを配置します。

データマイニングソリューションおよびプロジェクト

データマイニングプロジェクトを作成するには、データソース、データマイニング構造、およびデータマイニングモデルを定義する必要があります。作成するデータマイニングプロジェクトに、モデルの検証に使用するテストセットを含めることもできます。プロジェクトをサーバーに配置した後に、元のソリューションで新しいモデルの開発とテストを継続できます。

データマイニングソースデータ

データマイニングを実行するためにキューブまたはその他の特殊なデータソースを使用する必要ありません。データマイニングはリレーショナルデータテーブルや、Analysis Services のデータソースビューとして定義されているその他のデータソースに対して、すばやく簡単に実行できます。データマイニングで使用するデータは、データマイニングソリューションに格納されません。バインドのみが格納されます。データは前のバージョンの SQL Server、CRM システム、またはフラットファイルで作成されたデータベースにも存在する場合があります。Analysis Services データソースビューでは、複数のテーブル間の結合を指定してさまざまなデータソースを組み合わせることができます。また、多対一のリレーションシップを持つテーブルを追加して、入れ子になったテーブル列を作成することもできます。

データマイニングソリューションでデータを使用する必要がある場合、Analysis Services ではソースからデータを読み込み、使用される集計およびその他の情報のキャッシュを生成します。キャッシュされた情報を維持し、その情報を使用して新しいデータマイニングモデルを作成できます。または、それらの情報を削除してストレージ領域を節約することもできます。

データマイニングソリューションは、新しいデータで継続的に更新できます。また、正しく機能するモデルが見つかった場合は、そのモデルをそのまま配置して、新しいデータをそのモデルに追加しないようにすることもできます。

SQL Server 2008 Analysis Services には、データをトレーニングおよびテストデータセットに分割する機能もあります。この機能を使用して、代表的な、ランダムに選択したデータのセットでマイニングモデルをテストできます。

Analysis Services データソースおよびデータソースビューの作成と使用の詳細については、「データソースの定義 (Analysis Services)」を参照してください。

データマイニング構造

データマイニング構造は、マイニングモデルの作成元のデータドメインを定義する論理データ構造です。1 つのマイニング構造には、同じドメインを共有する複数のマイニングモデルを含めることができます。データの割合または量を HOLDOUT として指定して、データマイニング構造をトレーニングセットとテストセットにパーティション分割することもできます。このパーティション分割は、データマイニング構造を定義するときに自動的に実行できます。

詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

データマイニング構造には、入れ子になったテーブルを含めることができます。入れ子になったテーブルは、プライマリデータテーブルでモデル化されているケースに関する追加の詳細情報を提供します。詳細については、「入れ子になったテーブル (Analysis Services - データマイニング)」を参照してください。

データマイニングモデル

データマイニングモデルは、データ、データマイニングアルゴリズム、および使用されるデータに影響するパラメータとフィルタ設定のコレクション、およびデータの処理方法の組み合わせを表したものです。詳細については、「マイニングモデル (Analysis Services - データマイニング)」を参照してください。

データマイニングモデルを定義するには、データマイニング拡張機能 (DMX) 言語または BI Development Studio のデータマイニングウィザードを使用します。データマイニングウィザードの使用方法については、「データマイニングウィザード (Analysis Services - データマイニング)」を参照してください。DMX の使用方法の詳細については、「データマイニング拡張機能 (DMX) リファレンス」を参照してください。

マイニングモデルの構造を定義したら、それを処理して、そのモデルを表現するパターンを空の構造に入れます。これは、モデルのトレーニングと呼ばれます。パターンは、数学的アルゴリズムを使用して元のデータを渡すことによって見つかります。パラメータを使用して各アルゴリズムを調整できます。データマイニングアルゴリズムを選択する方法の詳細については、「データマイニングアルゴリズム (Analysis Services - データマイニング)」を参照してください。個々のデータマイニングアルゴリズムにパラメータを設定してモデルの結果を微調整する方法の詳細については、「データマイニングモデルのカスタマイズ (Analysis Services - データマイニング)」を参照してください。

新しいデータマイニングモデルを作成したら、予測を作成してそれらを繰り返しテストし、変更を加えて結果を向上させます。モデルを追加したり、データに合うようにモデルのパラメータを変更したりなどの変更を行います。予測の精度のテストの詳細については、「データマイニングモデルの検証 (Analysis Services - データマイニング)」を参照してください。

配置

データマイニング開発の最終的な目標は、エンドユーザーやアナリストが予測の作成および詳細な分析に使用できるモデルを作成することです。したがって、モデルによって生成された結果に満足できる場合は、モデルを運用環境に配置します。運用環境では、マイニングモデルを必要に応じてさまざまな用途で使用できます。次のリストに、データマイニングモデルを使用して実行できるタスクの例をいくつか示します。

モデルを使用して予測を作成します。これは、業務上の意志決定に使用できます。SQL Server では、予測クエリを作成するための DMX 言語と、クエリを作成するための予測クエリビルダが提供されています。
データマイニング機能をアプリケーションに直接埋め込みます。マイニング構造とマイニングモデルを作成、変更、処理、および削除するためにアプリケーションで使用できる一連のオブジェクトを含んでいる分析管理オブジェクト (AMO) またはアセンブリを含めることができます。または、XML for Analysis (XMLA) メッセージを Analysis Services のインスタンスに直接送信できます。
Integration Services を使用してパッケージを作成します。ここで、マイニングモデルは、入力されたデータを複数のテーブルに適切に分割するために使用されます。たとえば、潜在的な顧客に関してデータベースが継続的に更新される場合は、Integration Services と共にマイニングモデルを使用して、入力されるデータを製品を購入する可能性のある顧客と製品を購入する可能性のない顧客に分割できます。
ユーザーが既存のマイニングモデルに対して直接クエリを実行できるレポートを作成します。さまざまな予測を作成する必要があるユーザーや、マイニングモデルコンテンツに直接アクセスする必要があるアナリストは、データ内の興味深いパターンを探索できます。

モデルの更新は、配置方法の一部です。組織に入ってくるデータが多くなればなるほど、モデルを再処理して効果を向上させる必要があります。詳細については、「配置 (Analysis Services - データマイニング)」および「DMX 予測クエリの作成」を参照してください。

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソリューションおよびプロジェクト

データマイニングソースデータ

データマイニング構造

データマイニングモデル

配置

関連項目

参照

概念

その他のリソース

論理アーキテクチャ (Analysis Services - データ マイニング)

データ マイニング ソリューションおよびプロジェクト

データ マイニング ソース データ

データ マイニング構造

データ マイニング モデル

配置

関連項目

参照

概念

その他のリソース

論理アーキテクチャ (Analysis Services - データマイニング)

データマイニングソリューションおよびプロジェクト

データマイニングソースデータ

データマイニング構造

データマイニングモデル