Share via


Microsoft ロジスティック回帰アルゴリズム

Microsoft ロジスティック回帰アルゴリズムは、Microsoft ニューラル ネットワーク アルゴリズムを変形したものです。ロジスティック回帰は、"はい" と "いいえ" の 2 値による結果など、バイナリ結果のモデリングに使用される代表的な統計手法です。

ロジスティック回帰は柔軟性に優れ、あらゆる種類の入力を取得し、次に示すような分析タスクをサポートします。

  • 人口統計を使用して、特定の病気のリスクなど、結果に関する予測を行う。

  • 結果に影響する要素を探索し、重み付けを行う。たとえば、顧客が店舗を繰り返し訪れる要因となる要素を求める。

  • 多くの属性を持つドキュメント、電子メール、またはその他のオブジェクトを分類する。

類似の人口統計情報を共有し、Adventure Works 社から製品を購入する人々のグループがあるとします。データをモデリング特定の結果 (対象製品の購入など) に関連付けると、人工統計情報が人々の対象製品を購入する確率にどのようにかかわるかを確認できます。

アルゴリズムの動作

ロジスティック回帰は、結果のペアに対する複数の要素の影響を確認するために使用される代表的な統計手法です。Microsoft による実装では、変更されたニューラル ネットワークを使用して入力と出力の関係をモデル化します。出力における各入力の影響が評価され、完成したモデルではさまざまな入力が重み付けされます。ロジスティック回帰という名前は、極端な値の影響を最小限に抑えるためにロジスティック変換を使用してデータ曲線が圧縮されるという事実に基づいています。この実装、およびアルゴリズムをカスタマイズする方法の詳細については、「Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス」を参照してください。

ロジスティック回帰モデルに必要なデータ

ロジスティック回帰モデルのトレーニングに使用するデータを用意する際には、必要なデータ量やデータの使用方法など、このアルゴリズムにおける要件を把握しておいてください。

ロジスティック回帰モデルの要件は次のとおりです。

単一キー列 : それぞれのモデルには、各レコードを一意に識別する数値列またはテキスト列が 1 つ含まれている必要があります。複合キーは使用できません。

入力列 : 各モデルには、分析の要素として使用される値が含まれた入力列が 1 つ以上必要です。入力列はいくつあってもかまいませんが、各列内の値の数によっては、列を追加するとモデルのトレーニングにかかる時間が長くなる場合があります。

1 つ以上の予測可能列 : モデルには、連続する数値データを含む任意のデータ型の予測可能列が 1 つ以上必要です。予測可能列の値は、モデルへの入力として扱うことも、予測のみに使用するよう指定することもできます。入れ子になったテーブルは予測可能列では使用できませんが、入力としては使用できます。

ロジスティック回帰モデルでサポートされるコンテンツの種類とデータ型の詳細については、「Microsoft ロジスティック回帰アルゴリズム テクニカル リファレンス」の「必要条件」を参照してください。

ロジスティック回帰モデルの表示

モデルを参照するには、Microsoft ニューラル ネットワーク ビューアまたは Microsoft 汎用コンテンツ ツリー ビューアを使用できます。

Microsoft ニューラル ネットワーク ビューアを使用してモデルを表示すると、Analysis Services には、特定の結果に影響する要素がその重要度で順位付けされて表示されます。比較する属性と値を選択できます。詳細については、「Microsoft ニューラル ネットワーク ビューアを使用したマイニング モデルの表示」を参照してください。

さらに詳細を知るには、Microsoft 汎用コンテンツ ツリー ビューアを使用してモデルの詳細を参照できます。ロジスティック回帰モデルのモデル コンテンツには、モデルに使用されるすべての入力を示すマージナル ノード、および予測可能な属性を表すサブネットワークが含まれます。詳細については、「ロジスティック回帰モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。

予測の作成

モデルのトレーニング後、モデル コンテンツに対するクエリを作成して回帰係数およびその他の詳細を取得したり、モデルを使用して予測を作成したりできます。

説明

  • ドリルスルーはサポートされていません。これは、マイニング モデルのノードの構造がその基になるデータと必ずしも直接対応しているわけではないからです。

  • データ マイニング ディメンションの作成はサポートされていません。

  • OLAP マイニング モデルの使用がサポートされています。

  • Predictive Model Markup Language (PMML) を使用したマイニング モデルの作成はサポートされていません。