Agregar modelos de minería de datos a una estructura (Analysis Services - Minería de datos)

Mientras que una estructura de minería de datos define el dominio de datos, un modelo de minería de datos define el modo de aplicar los datos de ese dominio a un problema determinado. Una vez creada una estructura de minería de datos, puede agregar varios modelos de minería de datos a dicha estructura. Cada vez que cree un modelo, puede orientarlo hacia un problema empresarial diferente. Por ejemplo, puede cambiar los parámetros para utilizar un enfoque ligeramente diferente, o utilizar otro subconjunto de datos para obtener resultados distintos o extraer patrones específicos para una población de destino determinada.

Para obtener más información:Crear una nueva estructura de minería de datos, Asistente para minería de datos (Analysis Services - Minería de datos), Administrar estructuras de minería de datos en el Diseñador de minería de datos

Crear un nuevo modelo de minería de datos

Hay dos métodos para generar modelos de minería de datos. Puede definir la estructura de minería de datos y, a continuación, experimentar con distintos modelos que también utilicen esa estructura. También puede crear el modelo que desee y, a continuación, usar la estructura que se genera para crear modelos adicionales.

Si utiliza el Asistente para minería de datos para crear un nuevo modelo de minería de datos, primero debe crear una estructura de minería de datos. El asistente proporciona la opción de agregar un modelo de minería de datos inicial a la estructura y de configurar un conjunto de datos de prueba y entrenamiento dentro de esa estructura. Sin embargo, no es necesario crear un modelo de manera inmediata. Si sólo crea la estructura, no necesita tomar una decisión sobre qué columna debe utilizar como atributo de predicción, o sobre cómo utilizar los datos en un modelo determinado. En su lugar, sólo tiene que establecer la estructura de datos general que desea utilizar en el futuro; más adelante puede utilizar Diseñador de minería de datos para agregar nuevos modelos de minería de datos basados en dicha estructura.

Si ya sabe el tipo de modelo de minería de datos que desea generar, puede generar la estructura y, a continuación, utilizar el Asistente para minería de datos para agregar el primer modelo a la estructura de minería de datos. Puede agregar más modelos a la estructura después de que el asistente haya finalizado.

Nota

En DMX, la instrucción CREATE MINING MODEL comienza con el modelo de minería de datos. Es decir, debe definir la opción de modelo de minería de datos que desee y Analysis Services generará automáticamente la estructura subyacente. Después puede continuar agregando nuevos modelos de minería de datos a esa estructura con la instrucción ALTER STRUCTURE… ADD MODEL.

Para obtener más información:Administrar modelos de minería de datos en el Diseñador de minería de datos

Definición de un modelo de minería de datos

  1. Después de haber definido el dominio de datos, indique a Analysis Services cómo debe utilizar cada columna de los datos especificando el contenido y el uso de la misma. No es necesario utilizar en el nuevo modelo de minería de datos todas las columnas de la estructura de minería de datos. Incluso si dos modelos están basados en la misma estructura, puede indicar a Analysis Services que omita una columna determinada en uno de ellos. Para obtener más información, vea Arquitectura lógica (Analysis Services - Minería de datos).

Elegir un algoritmo

Al agregar un modelo a una estructura, debe seleccionar el algoritmo de minería de datos que desea utilizar en ese modelo. Cada algoritmo realiza un tipo diferente de análisis y algunos tienen requisitos diferentes en cuanto al número y el tipo de columnas de datos utilizados para las entradas o las predicciones.

Por consiguiente, dependiendo del algoritmo que seleccione, se pueden omitir algunas de las columnas de datos que incluyó en la estructura de minería de datos, o puede que sea necesario convertirlas en otro tipo de datos o quitar sus valores. El Asistente para minería de datos cambiará automáticamente algunos valores para que el modelo funcione. Sin embargo, en otros casos, recomendará corregir primero los datos o agregar una columna necesaria, como una clave de caso.

En algunos casos se puede cambiar el algoritmo que se utiliza en un modelo, pero la mayoría de los cambios de la definición del modelo requieren volver a procesar el modelo y sus datos. Generalmente, cada vez que cambie el algoritmo utilizado en un modelo, deberá considerarlo como un modelo totalmente nuevo que se deberá volver a procesar.

Para obtener más información:Algoritmos de minería de datos (Analysis Services: Minería de datos)

Especificar el uso de columnas

Después de haber seleccionado un algoritmo, debe especificar el modo en que éste debe procesar los datos de la estructura. Esto incluye seleccionar una o varias columnas de predicción si el modelo lo requiere, seleccionar columnas que actúen como entradas, y especificar una clave de tabla anidada o de casos. Estas definiciones de columna pueden variar para cada modelo, incluso si los modelos utilizan los mismos datos, ya que los requisitos para cada algoritmo son diferentes. Se recomienda intentar seleccionar sólo las columnas que son más útiles para el análisis, porque la inclusión de datos innecesarios aumenta el tiempo de procesamiento y puede afectar a la calidad de los resultados. El Asistente para minería de datos incluye una característica Sugerir opcional que analiza las columnas incluidas en la estructura y recomienda las columnas que proporcionan la mayor cantidad de información, utilizando una puntuación basada en la entropía.

Para obtener más información:Columnas del modelo de minería de datos, Establecer propiedades en un modelo de minería de datos

Especificar el contenido de las columnas

  1. Para algunas columnas, también puede ser necesario especificar el contenido de la columna. En la minería de datos de SQL Server, la propiedad Tipo de contenido de cada columna de datos indica al algoritmo cómo debe procesar los datos de esa columna. Por ejemplo, si los datos tienen una columna Ingresos con valores variables, debe especificar que la columna contiene números continuos estableciendo el tipo de contenido en Continuous. Sin embargo, también puede especificar que los números de la columna Ingresos se agrupen en depósitos estableciendo el tipo de contenido en Discretized y, opcionalmente, especificando el número exacto de depósitos. Puede crear distintos modelos que procesen las columnas de manera diferente: por ejemplo, puede probar un modelo que agrupe clientes en tres depósitos en función de la edad, y otro modelo que los agrupe en 10 depósitos en función de la edad.

Para obtener más información:Tipos de datos (minería de datos), Tipos de contenido (minería de datos)