Распределения столбцов (интеллектуальный анализ данных)

В службах Microsoft SQL Server Службы Analysis Services можно определить распределения столбцов в структуре интеллектуального анализа данных, чтобы влиять на то, как алгоритмы обрабатывают данные в этих столбцах при создании моделей интеллектуального анализа данных. В некоторых алгоритмах полезно задавать распределение любых непрерывных столбцов до начала обработки модели, при этом должно быть известно, что эти столбцы содержат общие распределения значений. Если распределения не заданы, то получившиеся модели интеллектуального анализа данных могут предоставлять менее точные прогнозы, чем с заданными распределениями, поскольку у алгоритмов будет меньший объем сведений, из которых можно интерпретировать данные.

Алгоритмы, доступные в службах Службы Analysis Services, поддерживают следующие типы распределения.

  • Normal
    Значения для непрерывного столбца формируют гистограмму с нормальным распределением.

    Гистограмма с нормальным распределением

  • Log Normal
    Значения для непрерывного столбца формируют гистограмму, вытянутую в верхнем конце и скошенную в нижнем конце.

    Гистограмма с логарифмически нормальным распределением

  • Uniform
    Значения непрерывного столбца формируют пологую кривую, в которой все значения являются равновероятными.

    Гистограмма с равномерным распределением

Дополнительные сведения об алгоритмах служб Службы Analysis Services см. в разделе Алгоритмы интеллектуального анализа данных (службы Analysis Services — интеллектуальный анализ данных).