Distribuciones (DMX)

En Microsoft SQL Server Analysis Services, puede definir el contenido de las columnas de una estructura de minería de datos para influir en cómo los algoritmos procesan los datos de esas columnas al crear modelos de minería de datos.Para algunos algoritmos, resulta útil definir la distribución de las columnas continuas antes de procesar el modelo, si se sabe que las columnas contienen distribuciones de valores comunes. Si no define las distribuciones, los modelos de minería de datos resultantes podrían generar predicciones menos precisas que si se definieran las distribuciones porque los algoritmos disponen de menos información con la que interpretar los datos.

Los algoritmos de minería de datos de Microsoft admiten los siguientes tipos de distribución:

  • NORMAL
    Los valores de la columna continua forman un histograma con una distribución gaussiana normal.

  • Log Normal
    Los valores de la columna continua forman un histograma en el que el logaritmo de los valores tiene una distribución normal.

  • UNIFORM
    Los valores de la columna continua forman una curva plana, en la que todos los valores tienen la misma probabilidad.

Para obtener más información acerca de los algoritmos de minería de datos de Microsoft, vea Algoritmos de minería de datos (Analysis Services: Minería de datos). Los proveedores de algoritmos de terceros podrían admitir tipos de distribución adicionales. Para determinar los tipos de distribución que admite un algoritmo, use el conjunto de filas de esquema SUPPORTED_DISTRIBUTION_FLAGS.

Para obtener más información acerca de los tipos de distribución, vea Distribuciones de columnas (minería de datos).