Artículo
03/30/2012

Personalizar un modelo de minería de datos (Analysis Services - Minería de datos)

Después de seleccionar un algoritmo que satisfaga sus necesidades empresariales, puede personalizar el modelo de minería de datos de las maneras siguientes para intentar mejorar los resultados.

Utilice columnas de datos diferentes en el modelo o cambie el uso o los tipos de contenido de las columnas.
Cree filtros en el modelo de minería de datos para restringir los datos que se usan al entrenarlo.
Establezca parámetros del algoritmo para controlar los umbrales, las divisiones del árbol y otras condiciones.
Cambie el algoritmo predeterminado que se utiliza para analizar datos o realizar predicciones.

Cambiar los datos que usa el modelo

Las decisiones que tome sobre qué columnas de datos se han de utilizar en el modelo, y cómo usar y procesar esos datos, pueden afectar en gran medida a los resultados del análisis. Los temas siguientes proporcionan información para ayudar a entender estas opciones.

Modelos de minería de datos (Analysis Services - Minería de datos)

Proporciona información general de la arquitectura de un modelo de minería de datos, incluida la estructura de minería de datos subyacente y la elección de columnas de minería de datos.
Crear filtros para modelos de minería de datos (Analysis Services - Minería de datos)

Explica cómo se pueden crear filtros que se aplican a un modelo de minería de datos, para crear modelos basados en un subconjunto de los datos de la estructura de minería de datos.
Selección de características en minería de datos.

Explica cómo Analysis Services utiliza un proceso denominado selección de características para seleccionar sólo los atributos más útiles e incorporarlos a un modelo. Reducir el número de columnas y atributos puede mejorar el rendimiento y la calidad del modelo. Los métodos de selección de características disponibles difieren dependiendo del algoritmo que se elija.

Si utiliza el Asistente para minería de datos, también puede hacer que Analysis Services seleccione automáticamente los datos que sean más útiles para generar un modelo determinado.

Personalizar la configuración del algoritmo

La elección de algoritmo determina qué tipo de resultados se van a obtener. Para obtener información general sobre cómo funciona un algoritmo concreto o sobre los escenarios empresariales donde se beneficiaría del uso de un algoritmo determinado, vea Algoritmos de minería de datos (Analysis Services: Minería de datos).

Los algoritmos de minería de datos que se proporcionan en Analysis Services también se pueden personalizar en gran medida. Puede establecer los parámetros del algoritmo para controlar su comportamiento y cómo procesa los datos. En los temas siguientes se proporciona información detallada sobre los parámetros que admite cada algoritmo.

Referencia técnica del algoritmo de árboles de decisión de Microsoft

Referencia técnica del algoritmo de clústeres de Microsoft

Referencia técnica del algoritmo Bayes naive de Microsoft

Referencia técnica del algoritmo de asociación de Microsoft

Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)

Referencia técnica del algoritmo de red neuronal de Microsoft

Referencia técnica del algoritmo de regresión logística de Microsoft

Referencia técnica del algoritmo de regresión lineal de Microsoft

Referencia técnica del algoritmo de serie temporal de Microsoft

El tema correspondiente a cada tipo de algoritmo también enumera las funciones de predicción que se pueden utilizar con modelos basados en ese algoritmo.

Lista de parámetros del algoritmo

Cada algoritmo admite parámetros que sirven para personalizar su comportamiento y ajustar los resultados del modelo. Para obtener información sobre cómo se utiliza cada parámetro, consulte los temas siguientes:

Nombre de la propiedad	Se aplica a
AUTO_DETECT_PERIODICITY	Referencia técnica del algoritmo de serie temporal de Microsoft
CLUSTER_COUNT	Referencia técnica del algoritmo de clústeres de Microsoft Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)
CLUSTER_SEED	Referencia técnica del algoritmo de clústeres de Microsoft
CLUSTERING_METHOD	Referencia técnica del algoritmo de clústeres de Microsoft
COMPLEXITY_PENALTY	Referencia técnica del algoritmo de árboles de decisión de Microsoft Referencia técnica del algoritmo de serie temporal de Microsoft
FORCE_REGRESSOR	Referencia técnica del algoritmo de árboles de decisión de Microsoft Referencia técnica del algoritmo de regresión lineal de Microsoft Marcas de modelado (Minería de datos)
FORECAST_METHOD	Referencia técnica del algoritmo de serie temporal de Microsoft
HIDDEN_NODE_RATIO	Referencia técnica del algoritmo de red neuronal de Microsoft
HISTORIC_MODEL_COUNT	Referencia técnica del algoritmo de serie temporal de Microsoft
HISTORICAL_MODEL_GAP	Referencia técnica del algoritmo de serie temporal de Microsoft
HOLDOUT_PERCENTAGE	Referencia técnica del algoritmo de regresión logística de Microsoft Referencia técnica del algoritmo de red neuronal de Microsoft Nota Este parámetro es diferente del valor de porcentaje de exclusión que se aplica a una estructura de minería de datos.
HOLDOUT_SEED	Referencia técnica del algoritmo de regresión logística de Microsoft Referencia técnica del algoritmo de red neuronal de Microsoft Nota Este parámetro es diferente del valor de inicialización de exclusión que se aplica a una estructura de minería de datos.
INSTABILITY_SENSITIVITY	Referencia técnica del algoritmo de serie temporal de Microsoft
MAXIMUM_INPUT_ATTRIBUTES	Referencia técnica del algoritmo de clústeres de Microsoft Referencia técnica del algoritmo de árboles de decisión de Microsoft Referencia técnica del algoritmo de regresión lineal de Microsoft Referencia técnica del algoritmo Bayes naive de Microsoft Referencia técnica del algoritmo de red neuronal de Microsoft Referencia técnica del algoritmo de regresión logística de Microsoft
MAXIMUM_ITEMSET_COUNT	Referencia técnica del algoritmo de asociación de Microsoft
MAXIMUM_ITEMSET_SIZE	Referencia técnica del algoritmo de asociación de Microsoft
MAXIMUM_OUTPUT_ATTRIBUTES	Referencia técnica del algoritmo de árboles de decisión de Microsoft Referencia técnica del algoritmo de regresión lineal de Microsoft Referencia técnica del algoritmo de regresión logística de Microsoft Referencia técnica del algoritmo Bayes naive de Microsoft Referencia técnica del algoritmo de red neuronal de Microsoft
MAXIMUM_SEQUENCE_STATES	Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)
MAXIMUM_SERIES_VALUE	Referencia técnica del algoritmo de serie temporal de Microsoft
MAXIMUM_STATES	Referencia técnica del algoritmo de clústeres de Microsoft Referencia técnica del algoritmo de red neuronal de Microsoft Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos)
MAXIMUM_SUPPORT	Referencia técnica del algoritmo de asociación de Microsoft
MINIMUM_IMPORTANCE	Referencia técnica del algoritmo de asociación de Microsoft
MINIMUM_ITEMSET_SIZE	Referencia técnica del algoritmo de asociación de Microsoft
MINIMUM_DEPENDENCY_PROBABILITY	Referencia técnica del algoritmo Bayes naive de Microsoft
MINIMUM_PROBABILITY	Referencia técnica del algoritmo de asociación de Microsoft
MINIMUM_SERIES_VALUE	Referencia técnica del algoritmo de serie temporal de Microsoft
MINIMUM_SUPPORT	Referencia técnica del algoritmo de asociación de Microsoft Referencia técnica del algoritmo de clústeres de Microsoft Referencia técnica del algoritmo de árboles de decisión de Microsoft Referencia técnica del algoritmo de clústeres de secuencia de Microsoft (Analysis Services - Minería de datos) Referencia técnica del algoritmo de serie temporal de Microsoft
MISSING_VALUE_SUBSTITUTION	Referencia técnica del algoritmo de serie temporal de Microsoft
MODELLING_CARDINALITY	Referencia técnica del algoritmo de clústeres de Microsoft
PERIODICITY_HINT	Referencia técnica del algoritmo de serie temporal de Microsoft
PREDICTION_SMOOTHING	Referencia técnica del algoritmo de serie temporal de Microsoft
SAMPLE_SIZE	Referencia técnica del algoritmo de clústeres de Microsoft Referencia técnica del algoritmo de regresión logística de Microsoft Referencia técnica del algoritmo de red neuronal de Microsoft
SCORE_METHOD	Referencia técnica del algoritmo de árboles de decisión de Microsoft
SPLIT_METHOD	Referencia técnica del algoritmo de árboles de decisión de Microsoft
STOPPING_TOLERANCE	Referencia técnica del algoritmo de clústeres de Microsoft

Requisitos adicionales

La elección y preparación de los datos constituye una parte importante del proceso de minería de datos. Por ejemplo, los algoritmos que Microsoft proporciona no admiten claves duplicadas. El tipo de datos que se requiere para cada modelo difiere dependiendo del algoritmo. Para obtener más información, consulte la sección Requisitos de los temas siguientes:

Algoritmo de árboles de decisión de Microsoft	Algoritmo de serie temporal de Microsoft
Algoritmo de clústeres de Microsoft	Algoritmo de red neuronal de Microsoft (Analysis Services - Minería de datos)
Algoritmo Bayes naive de Microsoft	Algoritmo de regresión logística de Microsoft
Algoritmo de asociación de Microsoft	Algoritmo de regresión lineal de Microsoft
Algoritmo de clústeres de secuencia de Microsoft

Personalizar los resultados mediante el uso de funciones de predicción y consultas

Una vez que el modelo ha sido generado y procesado, puede ver la información utilizando uno de los visores específicos de cada tipo de modelo. También puede escribir consultas personalizadas utilizando Extensiones de minería de datos (DMX) para obtener información detallada o más avanzada sobre los patrones encontrados en los datos.

Para obtener información sobre cómo crear consultas que devuelvan el contenido del modelo, vea Consultar modelos de minería de datos (Analysis Services - Minería de datos).

Puede utilizar funciones para ampliar los resultados que devuelve un modelo de minería de datos. Algunas funciones también devuelven estadísticas que representan la probabilidad de un resultado, u otras puntuaciones. Además, algunos algoritmos también son compatibles con funciones adicionales. Por ejemplo, si un modelo de minería de datos utiliza agrupaciones en clústeres, puede utilizar funciones especiales para buscar información sobre ellos. Sin embargo, si un modelo se basa en el algoritmo de serie temporal, se dispone de un conjunto de funciones diferente para realizar predicciones y consultar el contenido del modelo. Para obtener más información, vea el tema de referencia técnica de cada algoritmo.

Para obtener ejemplos de cómo consultar un modelo de minería de datos y utilizar las funciones de predicción diseñadas para cada tipo de modelo concreto, vea Consultar modelos de minería de datos (Analysis Services - Minería de datos).

Para obtener una lista de funciones de predicción admitidas para todos los tipos de algoritmo, vea Asignar funciones a tipos de consulta (DMX).

Evaluar los cambios en un modelo

Al experimentar con modelos diferentes para resolver un problema empresarial, o crear variaciones sobre un modelo, debe medir la exactitud de cada modelo y evaluar la capacidad de cada modelo de resolver el problema empresarial. Para obtener información general sobre cómo evaluar modelos de minería de datos, vea Validar modelos de minería de datos (Analysis Services - Minería de datos). Para obtener más información sobre cómo representar mediante un gráfico la exactitud de modelos de minería de datos diferentes, veaHerramientas de gráficos de precisión de modelos (Analysis Services - Minería de datos).

Vea también

Conceptos

Algoritmos de minería de datos (Analysis Services: Minería de datos)

Arquitectura física (Analysis Services - Minería de datos)