Distribuciones de columnas (minería de datos)

En Microsoft SQL Server Analysis Services puede definir distribuciones de columnas en una estructura de minería de datos para modificar la forma en que los algoritmos procesan los datos de estas columnas cuando se crean modelos de minería de datos. Para algunos algoritmos, resulta útil definir la distribución de las columnas continuas antes de procesar el modelo, si se sabe que las columnas contienen distribuciones de valores comunes. Si no define las distribuciones, los modelos resultantes pueden producir predicciones menos precisas que si las distribuciones hubieran sido definidas, ya que los algoritmos tendrán menos información a partir de la cual interpretar los datos.

Los algoritmos que están disponibles en Analysis Services admiten los siguientes tipos de distribución:

  • Normal
    Los valores de la columna continua forman un histograma con una distribución normal.

    Histograma con distribución normal

  • Log Normal
    Los valores de la columna continua forman un histograma, donde la curva se alarga en el extremo superior y se desvía hacia el extremo inferior.

    Histograma con distribución normal del registro

  • Uniform
    Los valores de la columna continua forman una curva plana, en la que todos los valores son iguales.

    Histograma con distribución uniforme

Para obtener más información sobre los algoritmos que proporciona Analysis Services, vea Algoritmos de minería de datos (Analysis Services: Minería de datos).