[アーティクル]
04/01/2012

列の分布 (データマイニング)

Microsoft SQL Server Analysis Services では、マイニング構造内の列の分布を定義して、マイニングモデルの作成時にこれらの列のデータがアルゴリズムによってどのように処理されるかを指定できます。アルゴリズムによっては、列に値の共通の分布が含まれていることがわかっている場合、モデルを処理する前に連続列の分布を定義すると便利です。分布を定義しない場合、データを解釈するためのアルゴリズム内の情報は少なくなるので、結果として得られるマイニングモデルによって、分布を定義した場合よりも精度の低い予測が生成される場合があります。

Analysis Services で使用できるアルゴリズムでは、次の分布の種類がサポートされています。

Normal
連続列の値は、正規分布のヒストグラムを形成します。
Log Normal
連続列の値は、曲線が上端で長くなり、下端に向かってスキューされるヒストグラムを形成します。
Uniform
連続列の値はフラット曲線を形成し、すべての値が等しくなります。

Analysis Services で提供されているアルゴリズムの詳細については、「データマイニングアルゴリズム (Analysis Services - データマイニング)」を参照してください。

列の分布 (データマイニング)

関連項目

参照

概念

その他の技術情報

その他のリソース

列の分布 (データ マイニング)

関連項目

参照

概念

その他の技術情報

その他のリソース

列の分布 (データマイニング)