データ マイニング モデルのカスタマイズ (Analysis Services - データ マイニング)

現在のビジネス ニーズに合ったアルゴリズムを選択した後、マイニング モデルを次の方法でカスタマイズできます。モデルをカスタマイズすると、より良い結果を得られる場合があります。

  • モデルで使用するデータ列、または列の使用法やコンテンツの種類を変更する。

  • マイニング モデルに対するフィルターを作成して、モデルのトレーニングに使用するデータを制限する。

  • アルゴリズム パラメーターを設定して、しきい値やツリーの分割などの条件を制御する。

  • データの分析や予測に使用される既定のアルゴリズムを変更する。

モデルで使用するデータの変更

モデルで使用するデータ列や、そのデータの使用方法および処理方法に関する決定は、分析の結果に大きく影響します。以下のトピックには、それらの選択に役立つ情報が含まれています。

データ マイニング ウィザードを使用する場合は、特定のモデルを作成するうえで最も役に立つデータが自動的に選択されるようにすることもできます。

アルゴリズムの設定のカスタマイズ

アルゴリズムの選択によって、どのような結果が得られるかが決まります。特定のアルゴリズムがどのように動作し、どのようなビジネス シナリオで役立つかについては、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。

Analysis Services で提供されるデータ マイニング アルゴリズムは、広範なカスタマイズにも対応しています。アルゴリズムのパラメーターを設定することにより、そのアルゴリズムの動作やデータの処理方法を制御できます。各アルゴリズムがサポートするパラメーターの詳細については、次のトピックを参照してください。

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft Naive Bayes アルゴリズム テクニカル リファレンス

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

Microsoft シーケンス クラスタ アルゴリズム テクニカル リファレンス (Analysis Services - データ マイニング)

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft 線形回帰アルゴリズム テクニカル リファレンス

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

これらのトピックには、それぞれのアルゴリズムに基づくモデルで使用できる予測関数の一覧も含まれています。

アルゴリズム パラメーターの一覧

各アルゴリズムでは、アルゴリズムの動作をカスタマイズしたり、モデルの結果を細かく調整したりするために使用できるパラメーターがサポートされています。各パラメーターの使用方法については、以下のトピックを参照してください。

プロパティ名

適用対象

AUTO_DETECT_PERIODICITY

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

CLUSTER_COUNT

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft シーケンス クラスタ アルゴリズム テクニカル リファレンス (Analysis Services - データ マイニング)

CLUSTER_SEED

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

CLUSTERING_METHOD

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

COMPLEXITY_PENALTY

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

FORCE_REGRESSOR

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft 線形回帰アルゴリズム テクニカル リファレンス

モデリング フラグ (データ マイニング)

FORECAST_METHOD

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

HIDDEN_NODE_RATIO

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

HISTORIC_MODEL_COUNT

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

HISTORICAL_MODEL_GAP

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

HOLDOUT_PERCENTAGE

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

注意
このパラメーターは、マイニング構造に適用される提示割合の値とは異なります。

HOLDOUT_SEED

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

注意
このパラメーターは、マイニング構造に適用される提示されたシードの値とは異なります。

INSTABILITY_SENSITIVITY

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

MAXIMUM_INPUT_ATTRIBUTES

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft 線形回帰アルゴリズム テクニカル リファレンス

Microsoft Naive Bayes アルゴリズム テクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

MAXIMUM_ITEMSET_COUNT

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

MAXIMUM_ITEMSET_SIZE

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

MAXIMUM_OUTPUT_ATTRIBUTES

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft 線形回帰アルゴリズム テクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft Naive Bayes アルゴリズム テクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

MAXIMUM_SEQUENCE_STATES

Microsoft シーケンス クラスタ アルゴリズム テクニカル リファレンス (Analysis Services - データ マイニング)

MAXIMUM_SERIES_VALUE

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

MAXIMUM_STATES

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

Microsoft シーケンス クラスタ アルゴリズム テクニカル リファレンス (Analysis Services - データ マイニング)

MAXIMUM_SUPPORT

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

MINIMUM_IMPORTANCE

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

MINIMUM_ITEMSET_SIZE

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

MINIMUM_DEPENDENCY_PROBABILITY

Microsoft Naive Bayes アルゴリズム テクニカル リファレンス

MINIMUM_PROBABILITY

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

MINIMUM_SERIES_VALUE

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

MINIMUM_SUPPORT

Microsoft アソシエーション アルゴリズム テクニカル リファレンス

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

Microsoft シーケンス クラスタ アルゴリズム テクニカル リファレンス (Analysis Services - データ マイニング)

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

MISSING_VALUE_SUBSTITUTION

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

MODELLING_CARDINALITY

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

PERIODICITY_HINT

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

PREDICTION_SMOOTHING

Microsoft タイム シリーズ アルゴリズム テクニカル リファレンス

SAMPLE_SIZE

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス

Microsoft ニューラル ネットワーク アルゴリズム テクニカル リファレンス

SCORE_METHOD

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

SPLIT_METHOD

Microsoft デシジョン ツリー アルゴリズム テクニカル リファレンス

STOPPING_TOLERANCE

Microsoft クラスタリング アルゴリズム テクニカル リファレンス

その他の要件

データの選択と準備は、データ マイニング プロセスの重要な部分です。たとえば、Microsoft が提供するアルゴリズムでは、重複するキーは使用できません。各モデルで必要となるデータの種類は、アルゴリズムによって異なります。詳細については、次のトピックの「必要条件」を参照してください。

クエリと予測関数による結果のカスタマイズ

モデルを作成して処理したら、それぞれのモデルの種類に固有のビューアーを使用して情報を表示できます。また、データ マイニング拡張機能 (DMX) を使用してカスタム クエリを作成すると、データ内で検出されたパターンについてより詳細な情報を入手することができます。

モデル コンテンツを返すクエリの作成方法については、「データ マイニング モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。

関数を使用して、マイニング モデルによって返される結果を拡張できます。結果の確率を表す統計やその他のスコアを返す関数もあります。さらに、個々のアルゴリズムでサポートされている追加の関数もあります。たとえば、クラスタリングを使用するマイニング モデルでは、特殊な関数を使用して、クラスターに関する情報を見つけることができます。一方、時系列アルゴリズムに基づくモデルでは、また別の関数を使用して、予測やモデル コンテンツのクエリを実行することができます。詳細については、各アルゴリズムのテクニカル リファレンス トピックを参照してください。

マイニング モデルのクエリを実行する方法の例や、特定の種類のモデル用の予測関数を使用する方法の例については、「データ マイニング モデルのクエリ (Analysis Services - データ マイニング)」を参照してください。

すべてのアルゴリズムの種類でサポートされている予測関数の一覧については、「クエリ型への関数のマップ (DMX)」を参照してください。

モデルの変更の評価

ビジネス上の問題を解決するためにさまざまなモデルをテストしたり、モデルのバリエーションを作成したりするときは、各モデルの精度を測定し、さらに、各モデルがビジネス上の問題の解決策としてどの程度適しているかを評価する必要があります。データ マイニング モデルの評価に関する一般的な情報については、「データ マイニング モデルの検証 (Analysis Services - データ マイニング)」を参照してください。さまざまなマイニング モデルの精度をグラフ化する方法の詳細については、「モデルの精度をグラフ化するためのツール (Analysis Services - データ マイニング)」を参照してください。