[アーティクル]
09/28/2010

新機能 (Analysis Services - データマイニング)

この最新リリースの MicrosoftSQL ServerAnalysis Services では、新機能や機能強化が導入されています。

提示されたテストセットの作成

マイニング構造を作成する際に、マイニング構造のデータをトレーニングセットとテストセットに分割できるようになりました。パーティションの定義は構造で保存されるため、この構造に基づいたすべてのマイニングモデルでトレーニングセットおよびテストセットを再利用できます。

データは、トレーニングパーティションとテストパーティションの間でランダムに分割されますが、パーティションを再作成する必要がある場合は、パーティションの作成に使用するシードを指定することもできます。

テストセットのサイズを指定する場合、行の総数に対する割合または最大行数として指定するか、これらの要件を組み合わせて指定します。トレーニングデータセットとテストデータセットを使用する方法の詳細については、「トレーニングセットとテストセットへのデータのパーティション分割 (Analysis Services - データマイニング)」を参照してください。

SQL Server 2008 にあるすべてのモデル検証機能の詳細については、「データマイニングモデルの検証 (Analysis Services - データマイニング)」を参照してください。

モデルケースのフィルタ選択

フィルタをマイニングモデルにアタッチし、トレーニングとテストの両方にフィルタを適用できるようになりました。フィルタをモデルに適用すると、モデルのトレーニングに使用するデータを制御でき、データのサブセットでモデルのパフォーマンスをより簡単に評価できます。

たとえば、一定の収入レベル以上の顧客のみに対するメーリング対象モデルの精度を知る必要がある場合です。リフトチャートを作成する際に、マイニングモデルの Income 列にフィルタを適用すると、指定した人口統計情報のみの結果を表示できます。

Business Intelligence Development Studio では、ケーステーブルと入れ子になったテーブルの両方に適用できる複合条件を構築するのに役立つ、新しいフィルタエディタも用意されています。

マイニングモデルフィルタを作成する方法の詳細については、「マイニングモデルのフィルタの作成 (Analysis Services - データマイニング)」を参照してください。

マイニングモデルテスト用データのフィルタ選択の詳細については、「モデルの精度をグラフ化するためのツール (Analysis Services - データマイニング)」を参照してください。

複数のマイニングモデルのクロス検証

クロス検証は、データマイニングモデルの精度を評価するための確立された方法です。クロス検証では、マイニング構造データをサブセットに繰り返しパーティション分割し、サブセットのモデルを構築してから、各パーティションのモデルの精度を測定します。返される統計情報を確認することで、マイニングモデルがどの程度信頼性が高いのかを判断し、同じ構造に基づいたモデルをより簡単に比較できます。

クロス検証は、データマイニングデザイナの [マイニング精度チャート] ビューで使用できます。Analysis Services のストアドプロシージャを使用して、マイニング構造をパーティション分割し、複数のマイニングモデルをテストして、分析を生成することもできます。

SQL Server 2008 でクロス検証レポートを生成するには、マイニング構造および予測可能な属性を指定してから、ケースデータの分割先となるフォールドの数を指定します。

Analysis Services では、個別のパーティションの確率値または 2 乗平均平方根誤差、集計モデルに対するすべてのメジャーの平均および標準偏差などの統計情報をレポートするテーブルを返します。詳細については、「相互検証 (Analysis Services - データマイニング)」を参照してください。

Office 2007 用データマイニングアドインのサポート

SQL Server 2008 では、Office 2007 用 SQL Server 2008 データマイニングアドインを使用する場合、Microsoft Excel からのデータマイニングモデルの作成、管理、および使用をサポートしています。一般的に使用されているこの無料のアドインの最新バージョンは、サーバー側のトレーニングパーティションとテストパーティション、相互検証、および買い物かご分析や印刷可能な予測計算などの新しい分析ツールのサポートの追加によって機能が強化されました。

また、ドキュメントモデルウィザードを使用することによって、SQL Server 2008 のインスタンスに保存される構造とモデルのドキュメンテーションを容易に作成できます。アドインの詳細については、「Office 2007 用データマイニングアドイン」を参照してください。

Microsoft タイムシリーズアルゴリズムの機能強化

タイムシリーズモデルで予測の精度および安定性を向上させるために、新しいアルゴリズムが Microsoft タイムシリーズアルゴリズムに追加されました。よく知られた ARIMA アルゴリズムに基づき、新しいアルゴリズムでは、Analysis Services で使用されてきた ARTxp アルゴリズムよりも正確に長期的な予測を行うことができます (ARTxp は、1 つのタイムスライスまたは短期間の予測のいずれかに最適化されている自己回帰ツリーアルゴリズムです)。

既定では、Microsoft タイムシリーズアルゴリズムの新しい実装を使用すると、ARTxp アルゴリズムによってモデルの 1 つのバージョンがトレーニングされ、ARIMA アルゴリズムによってモデルの別のバージョンがトレーニングされます。次に、アルゴリズムによって、これらの 2 つのモデルの結果が重み付けられ、必要な予測の特性が示されます。この既定の実装を使用しない場合は、Microsoft タイムシリーズアルゴリズムで ARTxp アルゴリズムまたは ARIMA アルゴリズムのいずれかのみを使用するように指定できます。SQL Server 2008 Enterprise では、アルゴリズムにカスタムの重み付けを指定して、可変期間に最適な予測を行うことができます。

また、Microsoft タイムシリーズアルゴリズムでは、予測時にデータを受け取ることで、新しいビジネスシナリオを想定できるようになりました。たとえば、製品、領域の集計、または他の大きなデータセットの範囲の平均に基づいて、収益予測モデルを作成できます。その後、個別の製品の販売を示すタイムシリーズにこのモデルを適用できます。汎用モデルを適用すると、集計データの安定性および可用性を利用でき、予測を個別の製品に対してカスタマイズできます。

複数のシリーズを使用してモデルをトレーニングし、モデルを新しいデータに適用して "what if" シナリオを予測することもできます。

タイムシリーズマイニングモデルの詳細については、「Microsoft タイムシリーズアルゴリズム」および「PredictTimeSeries (DMX)」を参照してください。

構造ケースおよび構造列へのドリルスルー

SQL Server 2008 では、マイニング構造でドリルスルーを有効にすると、マイニング構造をクエリし、トレーニングとテストの両方で使用されるケースに関する詳細を確認できます。データマイニング拡張機能 (DMX) を使用して、構造に対してドリルスルークエリを作成できます。

さらに、ドリルスルーがマイニングモデルおよび関連するマイニング構造で有効な場合は、基になるマイニング構造からデータの列を取得するクエリを作成できます。これは、特定のノードのケースに関する詳細情報を確認する場合に便利です。たとえば、特定のクラスタにある顧客の連絡先情報を取得できます。

詳細については、「マイニングモデルとマイニング構造におけるドリルスルーの使用 (Analysis Services - データマイニング)」を参照してください。

マイニング構造に対する DMX クエリの例については、「SELECT FROM <structure>.CASES」を参照してください。

モデルから構造データへのドリルスルーの例については、「SELECT FROM <model>.CASES (DMX)」を参照してください。

マイニングモデルの列の別名定義

マイニングモデルにある列に別名を追加して、列の内容を理解したり、DMX ステートメントで列を参照しやすくなりました。

たとえば、同じデータの連続バージョンおよび離散化バージョンを含むマイニング構造を構築する場合、より簡単な比較を行うために両方の列を同じ名前に指定することもできます。

別名の管理および表示方法の詳細については、「マイニングモデルのプロパティの設定」または「モデル列の別名を作成する方法」を参照してください。

DMX を使用した列の別名の作成方法については、「ALTER MINING STRUCTURE (DMX)」を参照してください。

データマイニングスキーマ行セットのクエリ

SQL Server 2008 では、既存の OLE DB データマイニングスキーマ行セットの多くが DMX ステートメントを使用して容易にクエリできるシステムテーブルのセットとして公開されています。これによって、モデルおよび構造に関連するメタデータの取得、マイニングモデルコンテンツからの詳細の抽出、Analysis Services インスタンスまたはサービスの監視が容易になります。

詳細については、「データマイニングスキーマ行セットのクエリ (Analysis Services - データマイニング)」を参照してください。

サンプルの場所の変更

SQL Server のサンプルデータベースおよびサンプルアプリケーションは、オンラインブックに含まれなくなりました。これらのサンプルデータベースおよびサンプルアプリケーションは、SQL Server のサンプルの Web サイトからダウンロードできます。この Web サイトでは、これらのサンプルが見つけやすくなり、MicrosoftSQL Server とビジネスインテリジェンスに関連する新しいサンプルが追加されました。SQL Server のサンプルの Web サイトでは、次の操作を行うことができます。

開発者、ユーザー、および Microsoft Most Valuable Professional (MVP) コミュニティから提供されたサンプルの参照
サンプルデータベースとコードプロジェクトのダウンロード
各技術領域に関するサンプルについての問題を報告したり、質問したりできる掲示板の閲覧とコメントの投稿

SQL Server 2005 Analysis Services とのサイドバイサイドインストール

SQL Server 2008Analysis Services は、SQL Server 2005 Analysis Services (SSAS) とサイドバイサイドでインストールできるようになりました。詳細については、「SQL Server の複数のバージョンおよびインスタンスの使用」を参照してください。

Analysis Services に影響するサイドバイサイドインストールの重要な問題については、このリリースに付属の Readme を参照してください。

Analysis Services データベースのバックアップと復元

Analysis Services データベースをバックアップおよび復元する機能が強化されています。データベースのサイズに関する制限が減り、バックアップ操作および復元操作に必要な時間が大幅に短縮されます。

詳細については、「新機能 (Analysis Services - 多次元データベース)」を参照してください。

Analysis Services に関するその他の機能強化

Analysis Services を使用してデータマイニングにも使用する OLAP キューブを作成する際、ディメンションおよび関連した階層と属性の設計がはるかに簡単になっています。ディメンションデザイナには、属性リレーションシップの設計と、属性リレーションシップが推奨事項に従っていることの確認に役立つ、新しい属性リレーションシップデザイナが用意されています。

詳細については、「新機能 (Analysis Services - 多次元データベース)」を参照してください。

新機能 (Analysis Services - データマイニング)

提示されたテストセットの作成

モデルケースのフィルタ選択

複数のマイニングモデルのクロス検証

Office 2007 用データマイニングアドインのサポート

Microsoft タイムシリーズアルゴリズムの機能強化

構造ケースおよび構造列へのドリルスルー

マイニングモデルの列の別名定義

データマイニングスキーマ行セットのクエリ

サンプルの場所の変更

SQL Server 2005 Analysis Services とのサイドバイサイドインストール

Analysis Services データベースのバックアップと復元

Analysis Services に関するその他の機能強化

関連項目

概念

その他の技術情報

その他のリソース

新機能 (Analysis Services - データ マイニング)

提示されたテスト セットの作成

モデル ケースのフィルタ選択

複数のマイニング モデルのクロス検証

Office 2007 用データ マイニング アドインのサポート

Microsoft タイム シリーズ アルゴリズムの機能強化

構造ケースおよび構造列へのドリルスルー

マイニング モデルの列の別名定義

データ マイニング スキーマ行セットのクエリ

サンプルの場所の変更

SQL Server 2005 Analysis Services とのサイド バイ サイド インストール

Analysis Services データベースのバックアップと復元

Analysis Services に関するその他の機能強化

関連項目

概念

その他の技術情報

その他のリソース

新機能 (Analysis Services - データマイニング)

提示されたテストセットの作成

モデルケースのフィルタ選択

複数のマイニングモデルのクロス検証

Office 2007 用データマイニングアドインのサポート

Microsoft タイムシリーズアルゴリズムの機能強化

マイニングモデルの列の別名定義

データマイニングスキーマ行セットのクエリ

SQL Server 2005 Analysis Services とのサイドバイサイドインストール