Tutorial básico de minería de datos

 

Se aplica a: SQL Server 2016 Preview

Este es el Tutorial básico de minería de datos de Microsoft Analysis Services . Microsoft SQL Server proporciona un entorno integrado para crear modelos de minería de datos y realizar predicciones. En este tutorial, completará un escenario de una campaña de envío de correo directo en el que se utiliza aprendizaje automático para analizar y predecir el comportamiento de compra de los clientes. En el tutorial se muestra cómo utilizar tres de los algoritmos más importantes de minería de datos: agrupación en clústeres, árboles de decisión y Bayes Naive. También aprenderá a analizar los hallazgos con los visores de modelo de minería de datos, y crear predicciones y gráficos de precisión con las herramientas de minería de datos que se incluyen en Microsoft SQL Server Analysis Services. La compañía ficticia, Adventure Works Cycles, se utiliza en todos los ejemplos.

Cuando se sienta cómodo con las herramientas de minería de datos, se recomienda que complete también el Tutorial intermedio de minería de datos ( Analysis Services: minería de datos y nº 41;. En las lecciones se muestra cómo utilizar el pronóstico, análisis de la cesta de compras, series temporales, modelos de asociación, tablas anidadas y clústeres de secuencia.

Escenario del tutorial

En este tutorial, será un empleado de Adventure Works Cycles con la tarea de obtener más información sobre los clientes de la compañía basándose en el historial de compras y utilizando a continuación ese datos históricos para realizar predicciones que se puedan utilizar en el mercado. La compañía no ha trabajado previamente con minería de datos, por lo que debe crear una nueva base de datos específica para minería de datos y configurar varios modelos de minería de datos.

Aprendizaje

Este tutorial le enseña a crear diferentes tipos de métodos de aprendizaje automático y a trabajar con ellos. También aprenderá a crear una copia de un modelo de minería de datos y aplicar un filtro a los datos de entrada para obtener resultados diferentes. Después, puede comparar los resultados de ambos modelos mediante un gráfico de elevación. Por último, utilizará la obtención de detalles para recuperar datos adicionales de la estructura de minería de datos subyacente.

Microsoft Analysis Services incluye las siguientes características que ayudan con facilidad a desarrollar y comparar varios modelos predictivos y a tomar medidas posteriormente en función de los resultados:

  • Conjuntos de pruebas de exclusión -cuando se crea una estructura de minería de datos, ahora puede dividir los datos en la estructura de minería de datos en entrenamiento y conjuntos de pruebas. Esto permite probar modelos en conjuntos de datos similares y comparar la precisión de los modelos relacionados.

  • -Los filtros de modelo de minería de datosahora puede adjuntar filtros a un modelo de minería de datos y aplicar el filtro durante el entrenamiento y prueba. Esto permite con facilidad generar modelos relacionados en diferentes subconjuntos de datos.

  • Obtención de detalles para casos de estructura y columnas de estructura - ahora puede cambiar fácilmente de los patrones generales del modelo de minería de datos al detalle procesable en el origen de datos.

El tutorial está compuesto por las lecciones siguientes:

Lección 1: Preparar la base de datos de Analysis Services ( Tutorial de minería de datos básicos y nº 41;
En esta lección, aprenderá a crear una nueva base de datos de Analysis Services, agregar un origen de datos y una vista del origen de datos, y preparar la nueva base de datos que se va a utilizar para la minería de datos.

Lección 2: Creación de una estructura de distribución de correo directo ( Tutorial de minería de datos básicos y nº 41;
En esta lección, aprenderá a crear una estructura de modelos de minería de datos que se puede utilizar como parte de un escenario de distribución de correo directo.

Lección 3: Agregar y procesar los modelos
En esta lección obtendrá información sobre cómo agregar modelos a una estructura. Los modelos que crea se generan con los algoritmos siguientes:

  • Microsoft Árboles de decisión

  • Microsoft Agrupación en clústeres

  • Microsoft Bayes naive

Lección 4: Explorar los modelos de correo directo ( Tutorial de minería de datos básicos y nº 41;
En esta lección obtendrá información sobre cómo explorar e interpretar los hallazgos de cada modelo usando los visores.

Lección 5: Probar modelos ( Tutorial de minería de datos básicos y nº 41;
En esta lección, realiza una copia de uno de los modelos de distribución de correo directo, agrega un filtro de modelo de minería de datos para restringir los datos de entrenamiento a un conjunto determinado de clientes y, a continuación, evalúa la viabilidad del modelo.

Lección 6: Crear y trabajar con predicciones (Tutorial básico de minería de datos)
En esta lección final del Tutorial básico de minería de datos, utiliza el modelo para predecir qué clientes tienen más probabilidad de comprar una bicicleta. A continuación, obtendrá detalles de los casos subyacentes para conseguir información de contacto.

Requisitos

Asegúrese de que los siguientes componentes estén instalados:

  • Microsoft SQL Server 2016

  • Microsoft SQL Server Analysis Services en modo multidimensional

  • La base de datos AdventureWorksDW2012 .

Con el objeto de mejorar la seguridad, las bases de datos de ejemplo no se instalan con SQL Server. Para instalar las bases de datos oficiales para Microsoft SQL Server, visite la página Bases de datos de ejemplo de Microsoft SQL y seleccione SQL Server 2016.

Vea también

Soluciones de minería de datos
Tareas y procedimientos de los modelos de minería de datos
Crear y consultar modelos de minería de datos con DMX: tutoriales (Analysis Services - minería de datos)