[アーティクル]
04/01/2012

マイニングモデルコンテンツ (Analysis Services - データマイニング)

基になるマイニング構造のデータを使用してマイニングモデルをデザインおよび処理したら、マイニングモデルが完成し、そのモデルにはマイニングモデルコンテンツが含まれます。このコンテンツを使用して、予測やデータの分析を行うことができます。

マイニングモデルコンテンツには、モデルに関するメタデータ、データに関する統計、およびマイニングアルゴリズムによって検出されたパターンが含まれます。使用されたアルゴリズムに応じて、モデルコンテンツには、回帰式、ルールとアイテムセットの定義、または重みやその他の統計情報が含まれます。

使用されたアルゴリズムに関係なく、マイニングモデルコンテンツは標準の構造で表されます。この構造は、Business Intelligence Development Studio で提供されている Microsoft 汎用コンテンツツリービューアーで参照でき、いずれかのカスタムビューアーに切り替えて情報がモデルの種類ごとにどのように解釈およびグラフィカル表示されるかを確認できます。また、MINING_MODEL_CONTENT スキーマ行セットをサポートするクライアントを使用して、マイニングモデルコンテンツに対するクエリを作成することもできます。詳細については、「データマイニングモデルの使用に関するトピック (Analysis Services - データマイニング)」を参照してください。

ここでは、すべての種類のマイニングモデルに対して提供されているコンテンツの基本構造について説明します。また、すべてのマイニングモデルコンテンツに共通するノードの種類、および情報を解釈する方法について説明します。

マイニングモデルコンテンツの構造

ノード

アルゴリズムの種類別のマイニングモデルコンテンツ

マイニングモデルコンテンツを表示するためのツール

マイニングモデルコンテンツにクエリを実行するためのツール

マイニングモデルコンテンツの構造

各モデルのコンテンツは、一連のノードとして表示されます。ノードは、モデルの一部に関するメタデータおよび情報を含むマイニングモデル内のオブジェクトです。ノードは階層として配置されます。階層内でのノードの正確な配置および階層の意味は、使用したアルゴリズムによって異なります。たとえば、デシジョンツリーモデルを作成した場合は、モデルには、モデルルートにすべて接続された複数のツリーが含まれます。ニューラルネットワークモデルを作成した場合は、モデルには、1 つ以上のネットワークと統計ノードが含まれます。

各モデルの最初のノードは、ルートノードまたはモデルの親ノードと呼ばれます。すべてのモデルにルートノード (NODE_TYPE = 1) があります。通常、ルートノードには、モデルや子ノード数に関する一部のメタデータが含まれていますが、モデルで検出されたパターンに関する追加情報はほとんど含まれません。

ルートノードに含まれる子ノードの数は、モデルの作成に使用したアルゴリズムによって異なります。アルゴリズムやデータの深さおよび複雑さによって子ノードの意味は異なり、子ノードに含まれるコンテンツも異なります。

トップに戻る

ノード

マイニングモデルでは、ノードは、モデルの全体または一部に関する情報を格納する汎用コンテナーです。各ノードの構造は常に同じで、この構造にはデータマイニングスキーマ行セットで定義される列が含まれます。詳細については、「DMSCHEMA_MINING_MODEL_CONTENT 行セット」を参照してください。

各ノードには、各モデル内で一意な識別子、親ノードの ID、ノードに含まれている子ノードの数などのノードに関するメタデータが含まれています。メタデータによって、ノードが属しているモデルおよびその特定のモデルが格納されているデータベースカタログが識別されます。ノードに含まれる追加コンテンツは、モデルの作成に使用したアルゴリズムの種類によって異なります。追加コンテンツには次のようなものがあります。

トレーニングデータ内のケースのうち、特定の予測値をサポートするケースの数
平均、標準偏差、分散などの統計情報
係数と数式
ルールおよびラテラルポインターの定義
モデルの一部を記述する XML フラグメント

ノードの種類の一覧

次の表に、データマイニングモデルで出力されるさまざまな種類のノードを示します。アルゴリズムごとに情報の処理方法が異なるので、各モデルでは特定の数種類のノードのみが生成されます。アルゴリズムを変更すると、ノードの種類も変更されることがあります。また、モデルを再処理すると、各ノードのコンテンツが変更されることがあります。

注
SQL Server 2008 Analysis Services で提供されるものとは異なるデータマイニングサービスを使用する場合、または独自のプラグインアルゴリズムを作成する場合は、他の種類のカスタムノードを利用できることがあります。

NODE_TYPE ID	ノードラベル	ノードのコンテンツ
1	Model	メタデータおよびルートコンテンツノード。すべての種類のモデルに適用されます。
2	Tree	分類ツリーのルートノード。デシジョンツリーモデルに適用されます。
3	Interior	ツリーの内部分割ノード。デシジョンツリーモデルに適用されます。
4	Distribution	ツリーの末端のノード。デシジョンツリーモデルに適用されます。
5	Cluster	アルゴリズムにより検出されたクラスター。クラスターモデルとシーケンスクラスターモデルに適用されます。
6	Unknown	不明なノードの種類。
7	ItemSet	アルゴリズムにより検出されたアイテムセット。アソシエーションモデルまたはシーケンスクラスターモデルに適用されます。
8	AssociationRule	アルゴリズムにより検出されたアソシエーションルール。アソシエーションモデルまたはシーケンスクラスターモデルに適用されます。
9	PredictableAttribute	予測可能な属性。すべての種類のモデルに適用されます。
10	InputAttribute	入力属性。デシジョンツリーと Naïve Bayes モデルに適用されます。
11	InputAttributeState	入力属性の状態の統計。デシジョンツリーと Naïve Bayes モデルに適用されます。
13	Sequence	シーケンスクラスターの Markov モデルコンポーネントの最上位ノード。シーケンスクラスターモデルに適用されます。
14	Transition	Markov 遷移マトリックス。シーケンスクラスターモデルに適用されます。
15	TimeSeries	時系列ツリーの非ルートノード。タイムシリーズモデルだけに適用されます。
16	TsTree	予測可能な時系列に対応する、時系列ツリーのルートノード。タイムシリーズモデルに適用されます。また、モデルが MIXED パラメーターを使用して作成された場合にのみ適用されます。
17	NNetSubnetwork	1 つのサブネットワーク。ニューラルネットワークモデルに適用されます。
18	NNetInputLayer	入力層のノードが含まれているグループ。ニューラルネットワークモデルに適用されます。
19	NNetHiddenLayer	非表示の層を示すノードが含まれているグループ。ニューラルネットワークモデルに適用されます。
21	NNetOutputLayer	出力層のノードが含まれているグループ。ニューラルネットワークモデルに適用されます。
21	NNetInputNode	入力属性とそれに対応する状態に一致する入力層のノード。ニューラルネットワークモデルに適用されます。
22	NNetHiddenNode	非表示の層のノード。ニューラルネットワークモデルに適用されます。
23	NNetOutputNode	出力層のノード。このノードは、通常、出力属性とそれに対応する状態に一致します。ニューラルネットワークモデルに適用されます。
24	NNetMarginalNode	トレーニングセットのマージナル統計。ニューラルネットワークモデルに適用されます。
25	RegressionTreeRoot	回帰ツリーのルート。線形回帰モデル、および連続する入力属性が含まれているデシジョンツリーモデルに適用されます。
26	NaiveBayesMarginalStatNode	トレーニングセットのマージナル統計。 Naïve Bayes モデルに適用されます。
27	ArimaRoot	ARIMA モデルのルートノード。 ARIMA アルゴリズムを使用するタイムシリーズモデルだけに適用されます。
28	ArimaPeriodicStructure	ARIMA モデルの周期構造。 ARIMA アルゴリズムを使用するタイムシリーズモデルだけに適用されます。
29	ArimaAutoRegressive	ARIMA モデルの 1 つの項の自己回帰係数。 ARIMA アルゴリズムを使用するタイムシリーズモデルだけに適用されます。
30	ArimaMovingAverage	ARIMA モデルの 1 つの項の移動平均係数。 ARIMA アルゴリズムを使用するタイムシリーズモデルだけに適用されます。
1000	CustomBase	カスタムノード型の開始位置。カスタムノード型は、この定数より値の大きい整数でなければなりません。カスタムプラグインアルゴリズムを使用して作成されたモデルに適用されます。

ノード ID、名前、キャプション、および記述

モデルのルートノードの一意な ID (NODE_UNIQUE_NAME) は、常に 0 です。ノード ID はすべて Analysis Services によって自動的に割り当てられ、変更することはできません。

また、各モデルのルートノードには、モデルに関するいくつかの基本的なメタデータが含まれています。このメタデータには、モデルが格納されている Analysis Services データベース (MODEL_CATALOG)、スキーマ (MODEL_SCHEMA)、モデルの名前 (MODEL_NAME) などがあります。ただし、この情報はモデルのすべてのノードで重複するので、ルートノードに対してクエリを行ってこのメタデータを取得する必要はありません。

各ノードには、一意識別子として使用される名前以外にも名前 (NODE_NAME) があります。この名前は表示目的でアルゴリズムによって自動的に作成され、編集することはできません。

注
Microsoft クラスタリングアルゴリズムを使用すると、ユーザーは各クラスターに表示名を割り当てることができます。ただし、この表示名はサーバーに保存されないので、モデルを再処理するとアルゴリズムによって新しいクラスター名が生成されます。

各ノードのキャプションと説明は、アルゴリズムによって自動的に生成され、ノードのコンテンツの把握に役立つラベルとして機能します。フィールドごとに生成されるテキストは、モデルの種類によって異なります。名前、キャプション、および説明がまったく同じ文字列である場合もありますが、モデルによっては、説明に追加情報が示される場合もあります。実装の詳細については、各種モデルに関するトピックを参照してください。

注
Analysis Services サーバーでは、名前の変更を実装するカスタムプラグインアルゴリズムを使用してモデルを構築する場合にのみノード名の変更がサポートされます。名前の変更を有効にするには、プラグインアルゴリズムの作成時にメソッドをオーバーライドする必要があります。

親ノード、子ノード、およびノードの基数

ツリー構造での親ノードと子ノードのリレーションシップは、PARENT_UNIQUE_NAME 列の値によって決まります。この値は子ノードに格納されており、親ノードの ID を示します。次に、この情報の使用方法の例を示します。

PARENT_UNIQUE_NAME が NULL の場合、ノードはモデルの最上位ノードです。
PARENT_UNIQUE_NAME の値が 0 の場合、ノードはモデルの最上位ノードの直接の子孫である必要があります。これは、ルートノードの ID が常に 0 であるためです。
データマイニング拡張機能 (DMX) クエリ内で関数を使用して、特定のノードの子孫または親を検出することができます。クエリでの関数の使用の詳細については、「データマイニングモデルのクエリ (Analysis Services - データマイニング)」を参照してください。

基数は、セット内の項目数を指します。処理済みのマイニングモデルのコンテキストでは、基数は特定のノードの子の数を表します。たとえば、デシジョンツリーモデルに [年収] というノードがあり、そのノードに条件 [年収] = 高と条件 [年収] = 低という 2 つの子ノードがある場合、[年収] ノードの CHILDREN_CARDINALITY の値は 2 になります。

注
Analysis Services では、ノードの基数の計算時には直接の子ノードのみがカウントされます。ただし、カスタムプラグインアルゴリズムを作成する場合は、CHILDREN_CARDINALITY をオーバーロードして異なる方法で基数をカウントすることができます。これは、直接の子だけでなく子孫の総数をカウントする場合などに役立ちます。

Analysis Services では、ノードの基数の計算時には直接の子ノードのみがカウントされます。ただし、カスタムプラグインアルゴリズムを作成する場合は、CHILDREN_CARDINALITY をオーバーロードして異なる方法で基数をカウントすることができます。これは、直接の子だけでなく子孫の総数をカウントする場合などに役立ちます。

基数はすべてのモデルで同様にカウントされますが、基数の値の解釈方法または使用方法はモデルの種類によって異なります。たとえば、クラスターモデルでは、最上位ノードの基数は検出されたクラスターの総数を示します。その他の種類のモデルでは、ノードの種類によっては基数が常に設定値である場合があります。基数の解釈方法の詳細については、各種モデルに関するトピックを参照してください。

注
モデル全体のトレーニングデータに関する説明的な統計情報を提供する特殊なノードが追加で含まれるモデルもあります (Microsoft ニューラルネットワークアルゴリズムによって作成されたモデルなど)。定義上、このようなノードに子ノードはありません。

ノード分布

NODE_DISTRIBUTION 列には、アルゴリズムで検出されたパターンに関する重要な詳細情報を多くのノードで示す入れ子になったテーブルが含まれています。このテーブルに示される正確な統計は、モデルの種類、ツリー内のノードの位置、および予測可能な属性が連続する数値か不連続値かによって異なりますが、統計には、属性の最小値と最大値、値に割り当てられた重み、ノード内のケース数、回帰式で使用される係数、標準偏差や分散のような統計的尺度などが含まれます。ノード分布の解釈方法の詳細については、扱っている特定の種類のモデルに関するトピックを参照してください。

注
NODE_DISTRIBUTION テーブルは、ノードの種類によっては空の場合もあります。たとえば、詳細な統計を含む子ノードのコレクションを整理するためだけのノードもあります。

入れ子になったテーブル NODE_DISTRIBUTION には、常に次の列が含まれています。各列のコンテンツは、モデルの種類によって異なります。特定の種類のモデルの詳細については、「アルゴリズムの種類別のマイニングモデルコンテンツ」を参照してください。

ATTRIBUTE_NAME
コンテンツは、アルゴリズムによって異なります。予測可能な属性などの列、ルール、アイテムセット、または数式の一部などのアルゴリズムの内部情報の名前を指定できます。

この列には、属性と値のペアも格納できます。
ATTRIBUTE_VALUE
ATTRIBUTE_NAME で指定した属性の値。

属性名が列の場合、最も簡単な例では、ATTRIBUTE_VALUE にはその列の不連続値のいずれかが格納されます。

アルゴリズムによる値の処理方法によっては、ATTRIBUTE_VALUE には、属性の値が存在するかどうかを示すフラグ (Existing) または値が NULL かどうかを示すフラグ (Missing) も格納できます。

たとえば、特定の品目を 1 回以上購入したことがある顧客を検出するようにモデルが設定されている場合、ATTRIBUTE_NAME 列には Model = 'Water bottle' などの目的の品目を定義する属性と値のペアが格納され、ATTRIBUTE_VALUE 列にはキーワード Existing または Missing のみが格納されます。

SUPPORT
この属性と値のペアを含むケースまたはこのアイテムセットまたはルールを含むケースの数。

一般に、各ノードのサポート値は、現在のノードに含まれるトレーニングセット内のケースの数を示します。ほとんどの種類のモデルでは、サポートは正確なケース数を表します。サポート値は、トレーニングデータに対してクエリを実行しなくてもトレーニングケース内のデータの分布を確認できるので便利です。 Analysis Services サーバーでも、この格納された値を使用して、格納された確率と前の確率の比較を計算することで、推定が強いか弱いかが判断されます。

たとえば、分類ツリーでは、サポート値は記述された属性の組み合わせを含むケースの数を表します。

デシジョンツリーでは、ツリーの各レベルのサポートの合計は、その親ノードのサポートになります。たとえば、1200 個のケースを含むモデルが性別に基づいて均等に分割され、さらに Income の 3 つの値 Low、Medium、および High に基づいて均等に分割される場合、ノード (2) の子ノードであるノード (4)、(5)、および (6) の合計は、常にノード (2) のケース数と同じ数になります。

ノード ID およびノード属性	サポート数
(1) モデルルート	1200
(2) Gender = Male (3) Gender = Female	600 600
(4) Gender = Male かつ Income = High (5) Gender = Male かつ Income = Medium (6) Gender = Male かつ Income = Low	200 200 200
(7) Gender = Female かつ Income = High (8) Gender = Female かつ Income = Medium (9) Gender = Female かつ Income = Low	200 200 200

(1) モデルルート

1200

(2) Gender = Male

(3) Gender = Female

600

(4) Gender = Male かつ Income = High

(5) Gender = Male かつ Income = Medium

(6) Gender = Male かつ Income = Low

200

(7) Gender = Female かつ Income = High

(8) Gender = Female かつ Income = Medium

(9) Gender = Female かつ Income = Low

200

クラスターモデルの場合は、サポート数に重み付けして複数のクラスターに属する確率を含めることができます。複数のクラスターメンバーシップは、既定のクラスタリング手法です。この場合は、各ケースが 1 つのクラスターだけに属するとは限らないので、このようなモデルのサポートを合計しても、すべてのクラスターで 100% にはならない場合があります。

PROBABILITY
モデル全体におけるこの特定のノードの確率を示します。

一般に、確率は、この特定の値のサポートをノード内のケースの総数 (NODE_SUPPORT) で除算した値を表します。

ただし、確率を多少調整して、データの不足値が原因で生じるバイアスを回避します。

たとえば、[子供の総数] の現在の値が 1 および 2 である場合に、子供がいないこと、または子供が 3 人いることが起こり得ないと予測するモデルを作成しないようにするとします。不足値がありそうにないがあり得なくはないという状態にするために、アルゴリズムによって、属性の実際の値の数に常に 1 が加算されます。

例 :

[子供の総数 = 1] の確率 = [子供の総数 = 1 であるケースの数] + 1/[すべてのケースの数] + 3

[子供の総数 = 2] の確率 = [子供の総数 = 2 であるケースの数] + 1/[すべてのケースの数] + 3

注

調整値 3 は、既存の値の総数 n に 1 を加算して算出したものです。

調整後も、すべての値の確率を合計すると 1 になります。データがない値の確率 (この例では [子供の総数 = 0、3、またはその他の値]) は、非常に低い 0 以外のレベルから始まり、ケースの追加に合わせて緩やかに増加します。
VARIANCE
ノード内の値の分散を示します。不連続値の場合は、定義上、分散は常に 0 になります。モデルで連続値がサポートされる場合、分散は、分母 n またはノード内のケースの数を使用して (シグマ) として計算されます。

一般に、標準偏差 (StDev) を表すために使用される定義は 2 つあります。一方の標準偏差の計算方法ではバイアスが考慮され、他方ではバイアスを使用せずに標準偏差が計算されます。通常、Microsoft データマイニングアルゴリズムでは、標準偏差の計算時にバイアスは使用されません。

NODE_DISTRIBUTION テーブルに示される値は、すべての不連続属性と分離された属性の実際の値、および連続値の平均です。

注
調整値 3 は、既存の値の総数 n に 1 を加算して算出したものです。

VALUE_TYPE
値または属性のデータ型、および値の使用法を示します。特定の値の型は、特定の種類のモデルにのみ適用されます。

VALUE_TYPE ID	値のラベル	値の型名
1	Missing	ケースデータにこの属性の値が含まれていないことを示します。 Missing 状態は、値を持つ属性とは別に計算されます。
2	Existing	ケースデータにこの属性の値が含まれていることを示します。
3	Continuous	属性の値が連続する数値であるため、分散および標準偏差と共に平均で表すことができることを示します。
4	Discrete	不連続値として扱われる値 (数値またはテキスト) を示します。注不連続値は不足値にすることもできます。ただし、計算時の処理方法は異なります。詳細については、「不足値 (Analysis Services - データマイニング)」を参照してください。
5	Discretized	属性に分離された数値が含まれていることを示します。値は、分離するためのバケットを示す書式設定された文字列です。
6	Existing	属性の値が連続する数値で、値がデータで指定されていることを示します (不足値または推定値と比較)。
7	Coefficient	係数を表す数値を示します。係数は、従属変数の値の計算時に適用される値です。たとえば、年齢に基づいて収入を予測する回帰式をモデルで作成する場合は、年齢を収入に関連付ける式で係数が使用されます。
8	Score gain	属性のスコアゲインを表す数値を示します。
9	Statistics	リグレッサの統計を表す数値を示します。
10	Node unique name	値を数値または文字列として扱わずに、モデルの別のコンテンツノードの一意識別子として扱うことを示します。たとえば、ニューラルネットワークモデルでは、ID によって、出力層のノードから非表示層のノード、および非表示層のノードから入力層のノードへのポインターが提供されます。
11	Intercept	回帰式における切片を表す数値を示します。
12	Periodicity	値がモデルの周期構造を表すことを示します。 ARIMA モデルを含むタイムシリーズモデルだけに適用されます。注 Microsoft タイムシリーズアルゴリズムでは、周期構造はトレーニングデータに基づいて自動的に検出されます。したがって、最終的なモデルの周期性には、モデルの作成時にパラメーターとして指定しなかった周期性の値が含まれる場合があります。
13	Autoregressive order	値が自己回帰系列の数を表すことを示します。 ARIMA アルゴリズムを使用するタイムシリーズモデルに適用されます。
14	Moving average order	系列の移動平均の数を表す値を表します。 ARIMA アルゴリズムを使用するタイムシリーズモデルに適用されます。
15	Difference order	系列が区別される回数を示す値を表します。 ARIMA アルゴリズムを使用するタイムシリーズモデルに適用されます。
16	Boolean	Boolean 型を表します。
17	Other	アルゴリズムで定義されたカスタム値を表します。
18	Prerendered string	アルゴリズムによって文字列として表示されるカスタム値を表します。オブジェクトモデルによって書式設定は適用されませんでした。

値の型は、ADMOMD.NET 列挙体から派生します。詳細については、「MiningValueType」を参照してください。

ノードスコア

ノードスコアの意味はモデルの種類によって異なり、ノードの種類によっても変わる可能性があります。各種モデルおよびノードに関する NODE_SCORE の計算方法の詳細については、「アルゴリズムの種類別のマイニングモデルコンテンツ」を参照してください。

ノードの確率と周辺確率

マイニングモデルスキーマ行セットには、すべての種類のモデルで列 NODE_PROBABILITY および MARGINAL_PROBABILITY が含まれます。これらの列には、確率値に意味があるノードの値のみが格納されます。たとえば、モデルのルートノードに確率スコアが格納されることはありません。

確率スコアを提供するノードでは、ノードの確率と周辺確率は異なる計算を表します。

周辺確率は、親からそのノードに到達する確率です。
ノードの確率は、ルートからそのノードに到達する確率です。
ノードの確率は、常に周辺確率以下になります。

たとえば、デシジョンツリー内のすべての顧客が性別に基づいて均等に分割される場合 (不足値はないものとする)、子ノードの確率は 0.5 になります。ただし、性別の各ノードが収入レベル High、Medium、および Low に基づいて均等に分割されるとします。この場合、各子ノードの MARGINAL_PROBABILITY のスコアは常に 0.33 になりますが、NODE_PROBABILTY の値はそのノードに到達するすべての確率の積になるので、常に MARGINAL_PROBABILITY の値より小さくなります。

ノードまたは属性と値のレベル	周辺確率	ノードの確率
モデルルートすべての対象顧客	1	1
性別に基づいて分割された対象顧客	.5	.5
性別に基づいて分割され、収入に基づいて 3 つの方法で再度分割された対象顧客	.33	.5 * .33 = .165

モデルルート

すべての対象顧客

性別に基づいて分割された対象顧客

性別に基づいて分割され、収入に基づいて 3 つの方法で再度分割された対象顧客

.33

.5 * .33 = .165

ノードルールとマージナルルール

マイニングモデルスキーマ行セットには、すべての種類のモデルで列 NODE_RULE および MARGINAL_RULE も含まれます。これらの列には、モデルをシリアル化するため、またはモデル構造の一部を表すために使用できる XML フラグメントが格納されます。ノードによっては、これらの列は空白になる場合もあります (値が無意味である場合)。

確率値が 2 種類あるのと同様に、XML ルールも 2 種類用意されています。 MARGINAL_RULE の XML フラグメントでは現在のノードの属性と値を定義し、NODE_RULE の XML フラグメントではモデルルートから現在のノードへのパスを示します。

トップに戻る

アルゴリズムの種類別のマイニングモデルコンテンツ

各アルゴリズムには、コンテンツスキーマの一部としてさまざまな種類の情報が格納されます。たとえば、Microsoft クラスタリングアルゴリズムでは多数の子ノードが生成され、それぞれが有効なクラスターを表します。各クラスターノードには、クラスター内のアイテムによって共有される特性を記述するルールが含まれます。一方、Microsoft 線形回帰アルゴリズムには子ノードがありません。代わりに、モデルの親ノードには、分析で検出された線形の関係を表す式が含まれます。

次の表に、各種アルゴリズムのトピックへのリンクを示します。

モデルコンテンツのトピック : 各種アルゴリズムの各種ノードの意味について説明し、どのノードが特定の種類のモデルで最も重要かについて説明します。
クエリのトピック : 特定の種類のモデルに対するクエリの例を示し、結果の解釈方法について説明します。

アルゴリズムまたはモデルの種類	モデルコンテンツ	マイニングモデルのクエリ
アソシエーションルールモデル	アソシエーションモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	アソシエーションモデルのクエリ (Analysis Services - データマイニング)
クラスターモデル	デシジョンツリーモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	クラスターモデルのクエリ (Analysis Services - データマイニング)
デシジョンツリーモデル	デシジョンツリーモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	デシジョンツリーモデルのクエリ (Analysis Services - データマイニング)
線形回帰モデル	線形回帰モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	線形回帰モデルのクエリ (Analysis Services - データマイニング)
ロジスティック回帰モデル	ロジスティック回帰モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	線形回帰モデルのクエリ (Analysis Services - データマイニング)
Naïve Bayes モデル	Naive Bayes モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	Naive Bayes モデルのクエリ (Analysis Services - データマイニング)
ニューラルネットワークモデル	ニューラルネットワークモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	ニューラルネットワークモデルのクエリ (Analysis Services - データマイニング)
シーケンスクラスター	シーケンスクラスターモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	シーケンスクラスターモデルのクエリ (Analysis Services - データマイニング)
タイムシリーズモデル	タイムシリーズモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)	タイムシリーズモデルのクエリ (Analysis Services - データマイニング)

マイニングモデルコンテンツを表示するためのツール

Business Intelligence Development Studio でモデルを参照または調査する場合、Microsoft 汎用コンテンツツリービューアーで情報を表示できます。このビューアーは、Business Intelligence Development Studio と SQL Server Management Studio の両方で使用できます。

Microsoft 汎用コンテンツビューアーは、マイニングモデルのコンテンツスキーマ行セットで使用できる同じ情報を使用して、列、ルール、プロパティ、属性、ノードなどのモデルのコンテンツを表示します。コンテンツスキーマ行セットは、データマイニングモデルのコンテンツに関する詳細情報を表すための汎用フレームワークです。モデルコンテンツは、階層的な行セットをサポートしているすべてのクライアントで表示できます。 Business Intelligence Development Studio のビューアーは、すべてのモデルを一貫した形式で示す HTML テーブルビューアーにこの情報を表示して、作成するモデルの構造をわかりやすくしています。詳細については、「Microsoft 汎用コンテンツツリービューアを使用したモデルの詳細の表示」を参照してください。

トップに戻る

マイニングモデルコンテンツにクエリを実行するためのツール

マイニングモデルコンテンツを取得するには、データマイニングモデルに対するクエリを作成する必要があります。

コンテンツクエリを作成する最も簡単な方法は、SQL Server Management Studio で次の DMX ステートメントを実行することです。

SELECT * FROM [<mining model name>].CONTENT

詳細については、「データマイニングモデルのクエリ (Analysis Services - データマイニング)」を参照してください。

マイニングモデルコンテンツに対するクエリは、データマイニングスキーマ行セットを使用して実行することもできます。スキーマ行セットは、マイニング構造およびモデルに関する情報の検出、参照、およびクエリのためにクライアントで使用される標準の構造です。スキーマ行セットに対するクエリは、XMLA、Transact-SQL、または DMX ステートメントを使用して実行することができます。

また、SQL Server 2008 では、Analysis Services サーバーへの接続を開き、システムテーブルにクエリを実行することにより、データマイニングスキーマ行セットの情報にアクセスできます。 SELECT ステートメントを使用してデータマイニングスキーマ行セットに対してクエリを実行する方法の詳細については、「トラブルシューティングツール (Analysis Services - データマイニング)」を参照してください。

トップに戻る

マイニングモデルコンテンツ (Analysis Services - データマイニング)

マイニングモデルコンテンツの構造

ノード

ノードの種類の一覧

ノード ID、名前、キャプション、および記述

親ノード、子ノード、およびノードの基数

ノード分布

ノードスコア

ノードの確率と周辺確率

ノードルールとマージナルルール

アルゴリズムの種類別のマイニングモデルコンテンツ

マイニングモデルコンテンツを表示するためのツール

マイニングモデルコンテンツにクエリを実行するためのツール

関連項目

参照

概念

その他のリソース

マイニング モデル コンテンツ (Analysis Services - データ マイニング)

マイニング モデル コンテンツの構造

ノード

ノードの種類の一覧

ノード ID、名前、キャプション、および記述

親ノード、子ノード、およびノードの基数

ノード分布

ノード スコア

ノードの確率と周辺確率

ノード ルールとマージナル ルール

アルゴリズムの種類別のマイニング モデル コンテンツ

マイニング モデル コンテンツを表示するためのツール

マイニング モデル コンテンツにクエリを実行するためのツール

関連項目

参照

概念

その他のリソース

マイニングモデルコンテンツ (Analysis Services - データマイニング)

マイニングモデルコンテンツの構造

ノードスコア

ノードルールとマージナルルール

アルゴリズムの種類別のマイニングモデルコンテンツ

マイニングモデルコンテンツを表示するためのツール

マイニングモデルコンテンツにクエリを実行するためのツール