Proyectos de minería de datos (Analysis Services - Minería de datos)

Cuando desarrolle una solución de minería de datos en Analysis Services, primero cree un proyecto de Analysis Services. Dentro de este proyecto, define el origen de datos que utilizará para el análisis y, a continuación, configura un modelo que incluye un algoritmo y las instrucciones personalizadas para administrar los datos. También puede continuar probando y refinando el modelo dentro del proyecto. Cuando la solución le satisfaga, puede implementarla en otro servidor o usarla en una aplicación para proporcionar predicciones y análisis.

Las secciones siguientes describen las herramientas y procesos para crear una solución de minería de datos y proporcionan vínculos a los recursos que se van a usar en cada paso.

Crear un proyecto de Analysis Services

Al desarrollar una solución de minería de datos, primero debe crear un proyecto nuevo de Analysis Services utilizando Business Intelligence Development Studio. Cada proyecto de minería de datos contiene los cuatro tipos siguientes de objetos: orígenes de datos; vistas del origen de datos, que se basan en los orígenes de datos; estructuras de minería de datos, que definen cómo se utilizan los datos en el modelo; y modelos de minería de datos, que crean y almacenan los patrones.

Para obtener más información, vea: Definir un proyecto de Analysis Services, Definir un origen de datos usando el Asistente para orígenes de datos (Analysis Services)

Definir un origen de datos

El origen de datos define la cadena de conexión e información de autenticación que el servidor Analysis Services utilizará para conectarse al origen de datos. El origen de datos puede contener varias tablas o vistas. Analysis Services puede usar los conjuntos de datos tanto de bases de datos relacionales como de Procesamiento analítico en línea (OLAP) o de proveedores externos.

Después de definir esta conexión a un origen de datos, crea una vista que identifica los datos concretos pertinentes para el modelo. La vista del origen de datos también le permite personalizar la manera en que los datos del origen de datos se proporcionan al modelo de minería de datos. Puede modificar la estructura de los datos para hacerla más pertinente para el proyecto o elegir únicamente ciertos tipos de datos. Si desea filtrar los datos, puede hacerlo en la vista del origen de datos o en filtros que se aplican en el nivel del modelo.

La cantidad de datos que necesitará y cómo se deberían limpiar y dar formato, diferirá en función del algoritmo que use para investigar esos datos.

Para obtener más información, vea Definir una vista de origen de datos (Analysis Services)

Agregar estructuras de minería de datos a un proyecto de Analysis Services

Cuando tenga bastantes datos para comenzar el análisis, seleccione las columnas de datos que sean más pertinentes para el problema de negocio y agregue las estructuras de minería de datos al proyecto. Una estructura de minería de datos define las columnas de datos y las columnas con tablas anidadas, que se obtienen de la vista del origen de datos o de un cubo OLAP en el proyecto.

Para agregar una nueva estructura de minería de datos, inicia el Asistente para minería de datos, que le dirige por el proceso de definir los datos y crear, si lo desea, un modelo de minería de datos inicial. Al crear una estructura, también puede crear particiones en los datos para incluir un conjunto de datos de aprendizaje, que se usa para generar los modelos, y un conjunto de datos de prueba, que se puede usar para probar o validar todos los modelos de minería de datos que están basados en esa estructura. Puede usar la pestaña Estructura de minería de datos del Diseñador de minería de datos para modificar las estructuras existentes, incluidas la agregación de columnas y las tablas anidadas.

Para obtener más información:Crear una nueva estructura de minería de datos, Diseñador de minería de datos, Asistente para minería de datos (Analysis Services - Minería de datos)

Trabajar con modelos de minería de datos

Por cada estructura de minería de datos, agregue uno o varios modelos de minería de datos. El modelo de minería de datos define el algoritmo o método de análisis que utilizará en los datos. Procesa cada modelo ejecutando los datos en la vista del origen de datos a través del algoritmo, que genera un modelo matemático de los datos. Este proceso también se conoce como entrenar el modelo.

Una vez procesado el modelo, a continuación puede explorar visualmente el modelo de minería de datos y crear las consultas de predicción con él.

Analysis Services proporciona varias opciones para procesar los objetos del modelo de minería de datos, incluida la capacidad de controlar qué objetos se procesan y cómo. Por ejemplo, puede procesar una estructura y almacenar en memoria caché los datos y, a continuación, continuar agregando modelos nuevos a la estructura. Si los datos están almacenados en la memoria caché, puede usar las consultas de obtención de detalles para devolver información detallada sobre los casos que se usan en el modelo.

Para obtener más información:Algoritmos de minería de datos (Analysis Services: Minería de datos), Procesar objetos de Analysis Services, Usar la obtención de detalles en los modelos y estructuras de minería (Analysis Services - Minería de datos).

Validar modelos de minería de datos

Después de crear un modelo, puede investigar los resultados y decidir qué modelos se comportan mejor. En la ficha Visor de modelos de minería de datos en el Diseñador de minería de datos, Analysis Services proporciona visores para cada tipo de modelo de minería de datos, que puede usar para explorar los modelos.

En la ficha Gráfico de precisión de minería de datos del diseñador, Analysis Services proporciona herramientas que puede usar para comparar directamente los modelos de minería de datos y elegir el más preciso o útil. Estas herramientas incluyen un gráfico de elevación, un gráfico de beneficios y una matriz de clasificación. 

También puede usar el informe de validación cruzada, nuevo en SQL Server 2008, para realizar un submuestreo reiterativo de los datos y determinar si el modelo se inclina a un conjunto determinado de datos. Las estadísticas que el informe proporciona se pueden usar para comparar objetivamente los modelos y evalúa la calidad de los datos de aprendizaje.

Para obtener más información:Ver un modelo de minería de datos, Validar modelos de minería de datos (Analysis Services - Minería de datos).

Crear predicciones

El objetivo principal de la mayoría de los proyectos de minería de datos es usar un modelo de minería de datos para crear predicciones. Después de explorar y comparar los modelos de minería de datos, puede usar una de las diferentes herramientas de creación de predicciones. Analysis Services ofrece un lenguaje de consulta denominado Extensiones de minería de datos (DMX) que es la base para la creación de predicciones y es fácilmente convertible en script. Para ayudar a generar consultas de predicción DMX, SQL Server proporciona un generador de consultas, disponible en SQL Server Management Studio y Business Intelligence Development Studio, y plantillas DMX para el editor de consultas de Management Studio. Dentro de BI Development Studio, puede obtener acceso al generador de consultas desde la ficha Predicción de modelo de minería de datos del Diseñador de minería de datos.

Para obtener más información:Crear consultas de predicción DMX, Referencia de instrucciones de Extensiones de minería de datos (DMX).

SQL Server Management Studio

Después de usar BI Development Studio para crear modelos para su proyecto de minería de datos, puede administrar y trabajar con los modelos y crear predicciones en Management Studio. Utilizando las herramientas de consulta de SQL Server Management Studio, puede explorar los datos en los modelos, crear consultas de contenido complejas o administrar los objetos de minería de datos almacenados en una instancia de SQL Server.

Para obtener más información:Minería de datos en SQL Server Management Studio, Minería de datos en SQL Server Management Studio

SQL Server Reporting Services

Después de crear un modelo de minería de datos, es posible que desee distribuir los resultados a una audiencia mayor. Dado que los resultados de la minería de datos están almacenados en un esquema coherente que es accesible directamente a través de consultas de base de datos, puede usar diversas herramientas de cliente para presentar los resultados de análisis, explorar los patrones del modelo o realizar predicciones.

Puede usar el Diseñador de informes de Microsoft SQL Server Reporting Services para crear informes que presenten la información que contiene un modelo de minería de datos. Puede usar el resultado de cualquier consulta DMX como base de un informe y hacer uso de las características de uso de parámetros y formato disponibles en Reporting Services.

Para obtener más información:Tipo de conexión de Analysis Services para DMX (SSRS), Integrar Reporting Services en las aplicaciones

Trabajar con minería de datos mediante programación

Analysis Services ofrece varias herramientas para trabajar con minería de datos mediante programación. El lenguaje DMX (Extensiones de minería de datos) ofrece instrucciones para crear, entrenar y usar los modelos de minería de datos. También puede llevar a cabo estas tareas mediante una combinación de XML for Analysis (XMLA) y ASSL (Lenguaje de scripts de Analysis Services), o bien usando Objetos de administración de análisis (AMO).

Puede tener acceso a todos los metadatos asociados con la minería de datos utilizando conjuntos de filas de esquema de minería de datos. Por ejemplo, puede usar conjuntos de filas de esquema para determinar los tipos de datos que admite un algoritmo o los nombres de los modelos que existen en una base de datos.

Para obtener más información:Referencia de Extensiones de minería de datos (DMX), Conjuntos de filas de esquema de minería de datos, Usar XML for Analysis en Analysis Services (XMLA)