Personalizar un modelo de minería de datos (Analysis Services - Minería de datos)

Después de seleccionar un algoritmo que satisfaga sus necesidades empresariales, puede personalizar el modelo de minería de datos de las maneras siguientes para intentar mejorar los resultados.

  • Utilice columnas de datos diferentes en el modelo o cambie el uso o los tipos de contenido de las columnas.

  • Cree filtros en el modelo de minería de datos para restringir los datos que se usan al entrenarlo.

  • Establezca parámetros del algoritmo para controlar los umbrales, las divisiones del árbol y otras condiciones.

  • Cambie el algoritmo predeterminado que se utiliza para analizar datos o realizar predicciones.

Cambiar los datos que usa el modelo

Las decisiones que tome sobre qué columnas de datos se han de utilizar en el modelo, y cómo usar y procesar esos datos, pueden afectar en gran medida a los resultados del análisis. Los temas siguientes proporcionan información para ayudar a entender estas opciones.

Si utiliza el Asistente para minería de datos, también puede hacer que Analysis Services seleccione automáticamente los datos que sean más útiles para generar un modelo determinado.

Personalizar la configuración del algoritmo

La elección de algoritmo determina qué tipo de resultados se van a obtener. Para obtener información general sobre cómo funciona un algoritmo concreto o sobre los escenarios empresariales donde se beneficiaría del uso de un algoritmo determinado, vea Algoritmos de minería de datos (Analysis Services: Minería de datos).

Los algoritmos de minería de datos que se proporcionan en Analysis Services también se pueden personalizar en gran medida. Puede establecer los parámetros del algoritmo para controlar su comportamiento y cómo procesa los datos. En los temas siguientes se proporciona información detallada sobre los parámetros que admite cada algoritmo.

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de clústeres de Microsoft

Referencia técnica del algoritmo Bayes naive de Microsoft

Referencia técnica del algoritmo de asociación de Microsoft

Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)

Referencia técnica del algoritmo de red neuronal de Microsoft

Referencia técnica del algoritmo de regresión logística de Microsoft

Referencia técnica del algoritmo de regresión lineal de Microsoft

Referencia técnica del algoritmo de serie temporal de Microsoft

El tema correspondiente a cada tipo de algoritmo también enumera las funciones de predicción que se pueden utilizar con modelos basados en ese algoritmo.

Lista de parámetros del algoritmo

Cada algoritmo admite parámetros que sirven para personalizar su comportamiento y ajustar los resultados del modelo. Para obtener información sobre cómo se utiliza cada parámetro, consulte los temas siguientes:

Nombre de la propiedad

Se aplica a

AUTO_DETECT_PERIODICITY

Referencia técnica del algoritmo de serie temporal de Microsoft

CLUSTER_COUNT

Referencia técnica del algoritmo de clústeres de Microsoft

Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)

CLUSTER_SEED

Referencia técnica del algoritmo de clústeres de Microsoft

CLUSTERING_METHOD

Referencia técnica del algoritmo de clústeres de Microsoft

COMPLEXITY_PENALTY

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de serie temporal de Microsoft

FORCE_REGRESSOR

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de regresión lineal de Microsoft

Marcas de modelado (Minería de datos)

FORECAST_METHOD

Referencia técnica del algoritmo de serie temporal de Microsoft

HIDDEN_NODE_RATIO

Referencia técnica del algoritmo de red neuronal de Microsoft

HISTORIC_MODEL_COUNT

Referencia técnica del algoritmo de serie temporal de Microsoft

HISTORICAL_MODEL_GAP

Referencia técnica del algoritmo de serie temporal de Microsoft

HOLDOUT_PERCENTAGE

Referencia técnica del algoritmo de regresión logística de Microsoft

Referencia técnica del algoritmo de red neuronal de Microsoft

NotaNota
Este parámetro es diferente del valor de porcentaje de exclusión que se aplica a una estructura de minería de datos.

HOLDOUT_SEED

Referencia técnica del algoritmo de regresión logística de Microsoft

Referencia técnica del algoritmo de red neuronal de Microsoft

NotaNota
Este parámetro es diferente del valor de inicialización de exclusión que se aplica a una estructura de minería de datos.

INSTABILITY_SENSITIVITY

Referencia técnica del algoritmo de serie temporal de Microsoft

MAXIMUM_INPUT_ATTRIBUTES

Referencia técnica del algoritmo de clústeres de Microsoft

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de regresión lineal de Microsoft

Referencia técnica del algoritmo Bayes naive de Microsoft

Referencia técnica del algoritmo de red neuronal de Microsoft

Referencia técnica del algoritmo de regresión logística de Microsoft

MAXIMUM_ITEMSET_COUNT

Referencia técnica del algoritmo de asociación de Microsoft

MAXIMUM_ITEMSET_SIZE

Referencia técnica del algoritmo de asociación de Microsoft

MAXIMUM_OUTPUT_ATTRIBUTES

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de regresión lineal de Microsoft

Referencia técnica del algoritmo de regresión logística de Microsoft

Referencia técnica del algoritmo Bayes naive de Microsoft

Referencia técnica del algoritmo de red neuronal de Microsoft

MAXIMUM_SEQUENCE_STATES

Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)

MAXIMUM_SERIES_VALUE

Referencia técnica del algoritmo de serie temporal de Microsoft

MAXIMUM_STATES

Referencia técnica del algoritmo de clústeres de Microsoft

Referencia técnica del algoritmo de red neuronal de Microsoft

Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)

MAXIMUM_SUPPORT

Referencia técnica del algoritmo de asociación de Microsoft

MINIMUM_IMPORTANCE

Referencia técnica del algoritmo de asociación de Microsoft

MINIMUM_ITEMSET_SIZE

Referencia técnica del algoritmo de asociación de Microsoft

MINIMUM_DEPENDENCY_PROBABILITY

Referencia técnica del algoritmo Bayes naive de Microsoft

MINIMUM_PROBABILITY

Referencia técnica del algoritmo de asociación de Microsoft

MINIMUM_SERIES_VALUE

Referencia técnica del algoritmo de serie temporal de Microsoft

MINIMUM_SUPPORT

Referencia técnica del algoritmo de asociación de Microsoft

Referencia técnica del algoritmo de clústeres de Microsoft

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)

Referencia técnica del algoritmo de serie temporal de Microsoft

MISSING_VALUE_SUBSTITUTION

Referencia técnica del algoritmo de serie temporal de Microsoft

MODELLING_CARDINALITY

Referencia técnica del algoritmo de clústeres de Microsoft

PERIODICITY_HINT

Referencia técnica del algoritmo de serie temporal de Microsoft

PREDICTION_SMOOTHING

Referencia técnica del algoritmo de serie temporal de Microsoft

SAMPLE_SIZE

Referencia técnica del algoritmo de clústeres de Microsoft

Referencia técnica del algoritmo de regresión logística de Microsoft

Referencia técnica del algoritmo de red neuronal de Microsoft

SCORE_METHOD

Referencia técnica del algoritmo de árboles de decisión de Microsoft

SPLIT_METHOD

Referencia técnica del algoritmo de árboles de decisión de Microsoft

STOPPING_TOLERANCE

Referencia técnica del algoritmo de clústeres de Microsoft

Requisitos adicionales

La elección y preparación de los datos constituye una parte importante del proceso de minería de datos. Por ejemplo, los algoritmos que Microsoft proporciona no admiten claves duplicadas. El tipo de datos que se requiere para cada modelo difiere dependiendo del algoritmo. Para obtener más información, consulte la sección Requisitos de los temas siguientes:

Personalizar los resultados mediante el uso de funciones de predicción y consultas

Una vez que el modelo ha sido generado y procesado, puede ver la información utilizando uno de los visores específicos de cada tipo de modelo. También puede escribir consultas personalizadas utilizando Extensiones de minería de datos (DMX) para obtener información detallada o más avanzada sobre los patrones encontrados en los datos.

Para obtener información sobre cómo crear consultas que devuelvan el contenido del modelo, vea Consultar modelos de minería de datos (Analysis Services - Minería de datos).

Puede utilizar funciones para ampliar los resultados que devuelve un modelo de minería de datos. Algunas funciones también devuelven estadísticas que representan la probabilidad de un resultado, u otras puntuaciones. Además, algunos algoritmos también son compatibles con funciones adicionales. Por ejemplo, si un modelo de minería de datos utiliza agrupaciones en clústeres, puede utilizar funciones especiales para buscar información sobre ellos. Sin embargo, si un modelo se basa en el algoritmo de serie temporal, se dispone de un conjunto de funciones diferente para realizar predicciones y consultar el contenido del modelo. Para obtener más información, vea el tema de referencia técnica de cada algoritmo.

Para obtener ejemplos de cómo consultar un modelo de minería de datos y utilizar las funciones de predicción diseñadas para cada tipo de modelo concreto, vea Consultar modelos de minería de datos (Analysis Services - Minería de datos).

Para obtener una lista de funciones de predicción admitidas para todos los tipos de algoritmo, vea Asignar funciones a tipos de consulta (DMX).

Evaluar los cambios en un modelo

Al experimentar con modelos diferentes para resolver un problema empresarial, o crear variaciones sobre un modelo, debe medir la exactitud de cada modelo y evaluar la capacidad de cada modelo de resolver el problema empresarial. Para obtener información general sobre cómo evaluar modelos de minería de datos, vea Validar modelos de minería de datos (Analysis Services - Minería de datos). Para obtener más información sobre cómo representar mediante un gráfico la exactitud de modelos de minería de datos diferentes, veaHerramientas de gráficos de precisión de modelos (Analysis Services - Minería de datos).