新機能 (Analysis Services - データ マイニング)

この最新リリースの MicrosoftSQL ServerAnalysis Services では、新機能や機能強化が導入されています。

提示されたテスト セットの作成

マイニング構造を作成する際に、マイニング構造のデータをトレーニング セットとテスト セットに分割できるようになりました。パーティションの定義は構造で保存されるため、この構造に基づいたすべてのマイニング モデルでトレーニング セットおよびテスト セットを再利用できます。

データは、トレーニング パーティションとテスト パーティションの間でランダムに分割されますが、パーティションを再作成する必要がある場合は、パーティションの作成に使用するシードを指定することもできます。

テスト セットのサイズを指定する場合、行の総数に対する割合または最大行数として指定するか、これらの要件を組み合わせて指定します。トレーニング データ セットとテスト データ セットを使用する方法の詳細については、「トレーニング セットとテスト セットへのデータのパーティション分割 (Analysis Services - データ マイニング)」を参照してください。

SQL Server 2008 にあるすべてのモデル検証機能の詳細については、「データ マイニング モデルの検証 (Analysis Services - データ マイニング)」を参照してください。

モデル ケースのフィルタ選択

フィルタをマイニング モデルにアタッチし、トレーニングとテストの両方にフィルタを適用できるようになりました。フィルタをモデルに適用すると、モデルのトレーニングに使用するデータを制御でき、データのサブセットでモデルのパフォーマンスをより簡単に評価できます。

たとえば、一定の収入レベル以上の顧客のみに対するメーリング対象モデルの精度を知る必要がある場合です。リフト チャートを作成する際に、マイニング モデルの Income 列にフィルタを適用すると、指定した人口統計情報のみの結果を表示できます。

Business Intelligence Development Studio では、ケース テーブルと入れ子になったテーブルの両方に適用できる複合条件を構築するのに役立つ、新しいフィルタ エディタも用意されています。

マイニング モデル フィルタを作成する方法の詳細については、「マイニング モデルのフィルタの作成 (Analysis Services - データ マイニング)」を参照してください。

マイニング モデル テスト用データのフィルタ選択の詳細については、「モデルの精度をグラフ化するためのツール (Analysis Services - データ マイニング)」を参照してください。

複数のマイニング モデルのクロス検証

クロス検証は、データ マイニング モデルの精度を評価するための確立された方法です。クロス検証では、マイニング構造データをサブセットに繰り返しパーティション分割し、サブセットのモデルを構築してから、各パーティションのモデルの精度を測定します。返される統計情報を確認することで、マイニング モデルがどの程度信頼性が高いのかを判断し、同じ構造に基づいたモデルをより簡単に比較できます。

クロス検証は、データ マイニング デザイナの [マイニング精度チャート] ビューで使用できます。Analysis Services のストアド プロシージャを使用して、マイニング構造をパーティション分割し、複数のマイニング モデルをテストして、分析を生成することもできます。

SQL Server 2008 でクロス検証レポートを生成するには、マイニング構造および予測可能な属性を指定してから、ケース データの分割先となるフォールドの数を指定します。

Analysis Services では、個別のパーティションの確率値または 2 乗平均平方根誤差、集計モデルに対するすべてのメジャーの平均および標準偏差などの統計情報をレポートするテーブルを返します。詳細については、「相互検証 (Analysis Services - データ マイニング)」を参照してください。

Office 2007 用データ マイニング アドインのサポート

SQL Server 2008 では、Office 2007 用 SQL Server 2008 データ マイニング アドインを使用する場合、Microsoft Excel からのデータ マイニング モデルの作成、管理、および使用をサポートしています。一般的に使用されているこの無料のアドインの最新バージョンは、サーバー側のトレーニング パーティションとテスト パーティション、相互検証、および買い物かご分析や印刷可能な予測計算などの新しい分析ツールのサポートの追加によって機能が強化されました。

また、ドキュメント モデル ウィザードを使用することによって、SQL Server 2008 のインスタンスに保存される構造とモデルのドキュメンテーションを容易に作成できます。アドインの詳細については、「Office 2007 用データ マイニング アドイン」を参照してください。

Microsoft タイム シリーズ アルゴリズムの機能強化

タイム シリーズ モデルで予測の精度および安定性を向上させるために、新しいアルゴリズムが Microsoft タイム シリーズ アルゴリズムに追加されました。よく知られた ARIMA アルゴリズムに基づき、新しいアルゴリズムでは、Analysis Services で使用されてきた ARTxp アルゴリズムよりも正確に長期的な予測を行うことができます (ARTxp は、1 つのタイム スライスまたは短期間の予測のいずれかに最適化されている自己回帰ツリー アルゴリズムです)。

既定では、Microsoft タイム シリーズ アルゴリズムの新しい実装を使用すると、ARTxp アルゴリズムによってモデルの 1 つのバージョンがトレーニングされ、ARIMA アルゴリズムによってモデルの別のバージョンがトレーニングされます。次に、アルゴリズムによって、これらの 2 つのモデルの結果が重み付けられ、必要な予測の特性が示されます。この既定の実装を使用しない場合は、Microsoft タイム シリーズ アルゴリズムで ARTxp アルゴリズムまたは ARIMA アルゴリズムのいずれかのみを使用するように指定できます。SQL Server 2008 Enterprise では、アルゴリズムにカスタムの重み付けを指定して、可変期間に最適な予測を行うことができます。

また、Microsoft タイム シリーズ アルゴリズムでは、予測時にデータを受け取ることで、新しいビジネス シナリオを想定できるようになりました。たとえば、製品、領域の集計、または他の大きなデータ セットの範囲の平均に基づいて、収益予測モデルを作成できます。その後、個別の製品の販売を示すタイム シリーズにこのモデルを適用できます。汎用モデルを適用すると、集計データの安定性および可用性を利用でき、予測を個別の製品に対してカスタマイズできます。

複数のシリーズを使用してモデルをトレーニングし、モデルを新しいデータに適用して "what if" シナリオを予測することもできます。

タイム シリーズ マイニング モデルの詳細については、「Microsoft タイム シリーズ アルゴリズム」および「PredictTimeSeries (DMX)」を参照してください。

構造ケースおよび構造列へのドリルスルー

SQL Server 2008 では、マイニング構造でドリルスルーを有効にすると、マイニング構造をクエリし、トレーニングとテストの両方で使用されるケースに関する詳細を確認できます。データ マイニング拡張機能 (DMX) を使用して、構造に対してドリルスルー クエリを作成できます。

さらに、ドリルスルーがマイニング モデルおよび関連するマイニング構造で有効な場合は、基になるマイニング構造からデータの列を取得するクエリを作成できます。これは、特定のノードのケースに関する詳細情報を確認する場合に便利です。たとえば、特定のクラスタにある顧客の連絡先情報を取得できます。

詳細については、「マイニング モデルとマイニング構造におけるドリルスルーの使用 (Analysis Services - データ マイニング)」を参照してください。

マイニング構造に対する DMX クエリの例については、「SELECT FROM <structure>.CASES」を参照してください。

モデルから構造データへのドリルスルーの例については、「SELECT FROM <model>.CASES (DMX)」を参照してください。

マイニング モデルの列の別名定義

マイニング モデルにある列に別名を追加して、列の内容を理解したり、DMX ステートメントで列を参照しやすくなりました。

たとえば、同じデータの連続バージョンおよび離散化バージョンを含むマイニング構造を構築する場合、より簡単な比較を行うために両方の列を同じ名前に指定することもできます。

別名の管理および表示方法の詳細については、「マイニング モデルのプロパティの設定」または「モデル列の別名を作成する方法」を参照してください。

DMX を使用した列の別名の作成方法については、「ALTER MINING STRUCTURE (DMX)」を参照してください。

データ マイニング スキーマ行セットのクエリ

SQL Server 2008 では、既存の OLE DB データ マイニング スキーマ行セットの多くが DMX ステートメントを使用して容易にクエリできるシステム テーブルのセットとして公開されています。これによって、モデルおよび構造に関連するメタデータの取得、マイニング モデル コンテンツからの詳細の抽出、Analysis Services インスタンスまたはサービスの監視が容易になります。

詳細については、「データ マイニング スキーマ行セットのクエリ (Analysis Services - データ マイニング)」を参照してください。

サンプルの場所の変更

SQL Server のサンプル データベースおよびサンプル アプリケーションは、オンライン ブックに含まれなくなりました。これらのサンプル データベースおよびサンプル アプリケーションは、SQL Server のサンプルの Web サイトからダウンロードできます。この Web サイトでは、これらのサンプルが見つけやすくなり、MicrosoftSQL Server とビジネス インテリジェンスに関連する新しいサンプルが追加されました。SQL Server のサンプルの Web サイトでは、次の操作を行うことができます。

  • 開発者、ユーザー、および Microsoft Most Valuable Professional (MVP) コミュニティから提供されたサンプルの参照

  • サンプル データベースとコード プロジェクトのダウンロード

  • 各技術領域に関するサンプルについての問題を報告したり、質問したりできる掲示板の閲覧とコメントの投稿

SQL Server 2005 Analysis Services とのサイド バイ サイド インストール

SQL Server 2008Analysis Services は、SQL Server 2005 Analysis Services (SSAS) とサイド バイ サイドでインストールできるようになりました。詳細については、「SQL Server の複数のバージョンおよびインスタンスの使用」を参照してください。

Analysis Services に影響するサイド バイ サイド インストールの重要な問題については、このリリースに付属の Readme を参照してください。

Analysis Services データベースのバックアップと復元

Analysis Services データベースをバックアップおよび復元する機能が強化されています。データベースのサイズに関する制限が減り、バックアップ操作および復元操作に必要な時間が大幅に短縮されます。

詳細については、「新機能 (Analysis Services - 多次元データベース)」を参照してください。

Analysis Services に関するその他の機能強化

Analysis Services を使用してデータ マイニングにも使用する OLAP キューブを作成する際、ディメンションおよび関連した階層と属性の設計がはるかに簡単になっています。ディメンション デザイナには、属性リレーションシップの設計と、属性リレーションシップが推奨事項に従っていることの確認に役立つ、新しい属性リレーションシップ デザイナが用意されています。

詳細については、「新機能 (Analysis Services - 多次元データベース)」を参照してください。