[アーティクル]
04/01/2012

予測モデルの検証 (中級者向けデータマイニングチュートリアル)

予測マイニングモデルが作成できたので、次は、データマイニングデザイナーの [マイニングモデルビューアー] タブを使用して結果を検証してみましょう。Microsoft タイムシリーズビューアーには、[グラフ] タブと [モデル] タブがあります。

ここで作成した予測マイニングモデルは、3 つの地域 (ヨーロッパ、北米、および太平洋) における 2005 ～ 2010 年の製品売上を示すモデルです。したがって、Microsoft タイムシリーズアルゴリズムでは、地域、製品、および予測可能な属性のそれぞれ異なる組み合わせを含む複数のツリーから成る 1 つの時系列モデルが作成されます。

ビューアーの各タブでは、完全な時系列モデルの情報をそれぞれ異なる方法で表示します。

[グラフ] タブ
[モデル] タブ
汎用コンテンツツリービューアー

[グラフ] タブ

Microsoft タイムシリーズビューアーの [グラフ] タブには、アルゴリズムによって作成された各ツリーがグラフィカルに表示されます。各時系列ツリーには、製品、地域、および予測可能な属性の一意の組み合わせが含まれます。

ビューアーの右側の凡例には、ドロップダウンリストで選択したすべての時系列が表示されます。さらに、各時系列の横にはチェックボックスが表示されます。凡例で、これらのチェックボックスをオンまたはオフにして、ビューアーに表示する時系列を指定できます。

各時系列に対して使用する色などの表示オプション、またはグラフの点に値を表示するかどうかを変更することもできます。

時系列を選択するには

[マイニングモデルビューアー] タブの [グラフ] タブをクリックします (表示されていない場合)。
グラフビューの右側にあるドロップダウンリストをクリックし、すべてのチェックボックスをオンにします。グラフに 24 本の異なる系列線が表示されます。
[OK] をクリックします。
グラフの右側にあるチェックボックスをオフにして、Amount に基づくすべての系列の線を一時的に非表示にします。
次に、R750 と R250 という自転車に関連するチェックボックスをオフにします。

これで、グラフに含まれる系列線は次の 6 つだけになるため、M200 と T1000 という自転車の傾向を比較しやすくなります。
- M200 Europe: Quantity
- M200 North America: Quantity
- M200 Pacific: Quantity
- T1000 Europe: Quantity t
- T1000 North America: Quantity
- T1000 Pacific: Quantity

M200 および T1000 の数量を予測するシリーズ

グラフには、履歴データと予測データの両方が表示されます。履歴データと区別できるよう、予測データの部分は網掛けされています。個々の系列を比較しやすくするために、グラフのそれぞれの線に関連付けられている色を変更することもできます。詳細については、「データマイニングビューアで使用する色を変更する方法」を参照してください。

これらの傾向線からは、どの地域でも総売上がしだいに増加しており、12 か月目 (つまり 12 月) でピークに達していることがわかります。予測値は通常、この傾向に基づいて算出されます。またグラフでは、T1000 という自転車のデータが他の製品系列のデータより大幅に遅れて始まっていることも示されています。

Analysis Services では、各時系列について既定で 5 つの予測期間が表示されます。この値を変更して、表示する予測期間を増減することもできます。また、グラフに誤差範囲を追加して、予測の標準偏差をグラフィカルに表示することもできます。

グラフビューの予測オプションと表示オプションを変更するには

[予測期間] の値を 5 から 10 まで徐々に変更してから 6 に戻します。

注

履歴データでの変動幅が大きい傾向線では、予測時に変動が増幅されています。
[偏差の表示] チェックボックスをオンにします。
M200 系列の誤差範囲にマウスカーソルを置きます。
T1000 Pacific 系列の誤差範囲にマウスカーソルを置きます。

注
履歴データでの変動幅が大きい傾向線では、予測時に変動が増幅されています。

これらの結果を使用してさらなる調査を行った後、すべての地域を平均して変動の影響を小さくしたモデルを開発します。

トップに戻る

[モデル] タブ

データマイニングデザイナーで、Microsoft タイムシリーズビューアーの [モデル] タブを使用して、時系列をデシジョンツリーグラフとして表示できます。モデルに含まれている系列ごとに個別のツリーが計算されます。時系列モデルでは、デシジョンツリーグラフに単一のノードが含まれる場合もあれば (時系列が線形の場合)、通常のデシジョンツリーのように、各分岐に関連付けられた複数のノードと条件が含まれる場合もあります。

時系列に対応するデシジョンツリーグラフのノードには、次のいくつかの情報が含まれます。

予測可能な属性の状態を [背景] で指定している場合は、そのノードにおけるケースの集中度。ツリーの各オブジェクトの正確なケース数は凡例ウィンドウに表示されます。また、ツリーのオブジェクト上にマウスカーソルを置くと、そのオブジェクトに関する情報が表示されます。
ノードの回帰式。ARTxp 回帰式はリーフノードでのみ使用できます。ARIMA 式はツリーのルートノードで使用できます。
属性の範囲を表すダイヤモンドグラフ。このダイヤモンドはノードの平均位置に配置され、ダイヤモンドの幅はそのノードにおける属性の分布 (ばらつき) を表します。

時系列モデルに対応するデシジョンツリーを表示するには

タイムシリーズビューアーの [モデル] タブをクリックし、[ツリー] ボックスの一覧で [M200 North America: Amount] 系列を選択します。

グラフに単一のノードが表示されます。
そのノードの上にマウスカーソルを置きます。

[すべて] ノードについて表示されるツールヒントには、系列全体のケースの数や、データの分析から得られた時系列式などの情報が含まれます。
ノードをクリックして [マイニング凡例] を表示します。

[マイニング凡例] にはツールヒントと同じような情報が含まれていますが、そのほかに、値のヒストグラムなどの詳細情報も表示されます。
タイムシリーズビューアーの [モデル] タブをクリックし、[ツリー] ボックスの一覧で [M200 Pacific: Amount] 系列を選択します。

この時点で、ツリーグラフには [すべて] ノードと 2 つの子ノードが含まれています。子ノードのテキストは、ツリーを分割する条件の説明です。
いずれかの子ノードの上にマウスカーソルを置いてツールヒントの内容を確認します。または、ノードをクリックして [マイニング凡例] を表示します。

子ノードの説明には、ツリーの各分岐のケースの数や、ツリーが分割される原因になった追加の条件などの情報が含まれます。

トップに戻る

汎用コンテンツツリービューアー

Analysis Services には、時系列用のカスタムビューアーのほかに、Microsoft 汎用コンテンツツリービューアーが用意されています。このビューアーは、使用したアルゴリズムに関係なく、すべてのデータマイニングモデルで使用できます。汎用コンテンツツリービューアーは、[ビューアー] ドロップダウンリストから起動できます。

このビューアーでは各マイニングモデルが、分析に使用したデータやアルゴリズムに関係なく、一連のノードを含むツリーとして表されます。各ノードは、データのサブセットに関する情報を表します。ノードの正確な内容はアルゴリズムや予測可能な属性の種類に応じて変わりますが、内容の全体的なスキーマは同じです。

ここで作成したデータマイニングモデルは ARTXP と ARIMA の両方のアルゴリズムを組み合わせた混合モデルなので、Analysis Services により、各アルゴリズムを使用して各時系列の ARTXP モデルと ARIMA モデルが個別に作成されます。Microsoft タイムシリーズビューアーを使用して予測マイニングモデルを参照すると、Analysis Services によって 2 つのアルゴリズムの結果が組み合わされて、マイニングモデルが 1 つのツリーとして表示されます。ツリーの各ノードには、2 つのアルゴリズムの一部の内容が含まれます。

一方、Microsoft 汎用コンテンツツリービューアーを使用すると、各アルゴリズムによって生成された内容が予測マイニングモデル内の 2 種類のノードとして表示されます。ARTXP または ARIMA のいずれかのバージョンのモデルを使用してドリルダウンすると、より詳細な情報を取得できます。

汎用コンテンツビューアーで特定のデータ系列の詳細を表示するには

[マイニングモデルビューアー] タブの [ビューアー] ボックスの一覧で、[Microsoft 汎用コンテンツツリービューアー] を選択します。
[ノードのキャプション] ペインで最上位ノード ([すべて]) をクリックします。
[ノードの詳細] ペインで ATTRIBUTE_NAME の値を表示します。

この値から、このノードにどの系列 (製品と地域の組み合わせ) が含まれているかがわかります。AdventureWorks の例では、最上位ノードは M200 Europe 系列のノードです。
[ノードのキャプション] ペインで、子ノードがある最初のノードを見つけます。

系列のノードに子がある場合は、Microsoft タイムシリーズビューアーの [モデル] タブに表示されるツリービューにも分岐構造が含まれます。
ノードを展開し、いずれかの子ノードをクリックします。

スキーマの NODE_DESCRIPTION 列に、ツリーが分割される原因になった条件が含まれています。
[ノードのキャプション] ペインで最上位の ARIMA ノードをクリックし、すべての子ノードが表示されるまでそのノードを展開します。
[ノードの詳細] ペインで ATTRIBUTE_NAME の値を表示します。

この値から、このノードに含まれている時系列がわかります。ARIMA セクションの最上位ノードは [(すべて)] セクションの最上位ノードと一致するはずです。AdventureWorks の例では、このノードには M200 Europe 系列に対する ARIMA 分析が含まれています。

詳細については、「タイムシリーズモデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)」を参照してください。

トップに戻る

このレッスンの次の作業

時系列予測の作成 (中級者向けデータマイニングチュートリアル)

Share via

予測モデルの検証 (中級者向けデータマイニングチュートリアル)

[グラフ] タブ

時系列を選択するには

グラフビューの予測オプションと表示オプションを変更するには

[モデル] タブ

時系列モデルに対応するデシジョンツリーを表示するには

汎用コンテンツツリービューアー

汎用コンテンツビューアーで特定のデータ系列の詳細を表示するには

このレッスンの次の作業

関連項目

参照

概念

その他のリソース

Share via

予測モデルの検証 (中級者向けデータ マイニング チュートリアル)

[グラフ] タブ

時系列を選択するには

グラフ ビューの予測オプションと表示オプションを変更するには

[モデル] タブ

時系列モデルに対応するデシジョン ツリーを表示するには

汎用コンテンツ ツリー ビューアー

汎用コンテンツ ビューアーで特定のデータ系列の詳細を表示するには

このレッスンの次の作業

関連項目

参照

概念

その他のリソース

予測モデルの検証 (中級者向けデータマイニングチュートリアル)

グラフビューの予測オプションと表示オプションを変更するには

時系列モデルに対応するデシジョンツリーを表示するには

汎用コンテンツツリービューアー

汎用コンテンツビューアーで特定のデータ系列の詳細を表示するには