Compartir a través de


Crear predicciones (Tutorial básico de minería de datos)

Una vez que haya probado la precisión de los modelos de minería de datos y esté satisfecho con los resultados, puede crear consultas de predicción por medio del Generador de consultas de predicción en la pestaña Predicción de modelo de minería de datos del Diseñador de minería de datos. Esta interfaz le ayuda a generar consultas en DMX o el lenguaje de Extensiones de Minería de Datos (DMX). DMX tiene una sintaxis similar a la de T-SQL, pero se utiliza con consultas en objetos de minería de datos.

El Generador de consultas de predicción tiene tres vistas. Mediante las vistas Diseño y Consulta, puede crear y examinar una consulta. A continuación, puede ejecutar la consulta y ver los resultados en la vista Resultado.

Para obtener más información acerca de cómo utilizar el Generador de consultas de predicción, vea Interfaces de consultas de minería de datos.

Crear la consulta

El primer paso para crear una consulta de predicción consiste en seleccionar un modelo de minería de datos y una tabla de entrada.

Para seleccionar un modelo de minería de datos y una tabla de entrada

  1. En la pestaña Predicción de modelo de minería de datos del Diseñador de minería de datos, en el cuadro Modelo de minería de datos, haga clic en Seleccionar modelo.

  2. En el cuadro de diálogo Seleccionar modelo de minería de datos, navegue por el árbol hasta la estructura Targeted Mailing, expándala, seleccione TM_Decision_Tree y, a continuación, haga clic en Aceptar.

  3. En el cuadro Seleccionar tabla(s) de entrada, haga clic en Seleccionar tabla de casos.

  4. En el cuadro de diálogo Seleccionar tabla, en la lista Origen de datos, seleccione Adventure Works DW Multidimensional 2012 .

  5. En la lista Nombre de tabla o vista, seleccione la tabla ProspectiveBuyer (dbo) y, a continuación, haga clic en Aceptar.

    La tabla ProspectiveBuyer se parece mucho a la tabla de casos vTargetMail.

Asignar las columnas

Después de seleccionar la tabla de entrada, el Generador de consultas de predicción crea una asignación predeterminada entre el modelo de minería de datos y la tabla de entrada, en función de los nombres de las columnas. Al menos una columna de la estructura debe coincidir con una columna de los datos externos.

Nota importanteImportante

Los datos que use para determinar la precisión de los modelos deben contener una columna que se pueda asignar a la columna de predicción. Si no existe esa columna, puede crear una con valores vacíos, pero debe tener el mismo tipo de datos que la columna de predicción.

Para asignar las columnas de la estructura a las columnas de la tabla de entrada

  1. Haga clic con el botón secundario en las líneas que conectan la ventana Modelo de minería de datos a la ventana Seleccionar tabla de entrada y seleccione Modificar conexiones.

    Observe que no todas las columnas están asignadas. Agregaremos asignaciones para varias Columnas de tabla. También generaremos una columna de fecha de nacimiento nueva en función de la columna de fecha actual, para que la coincidencia de las columnas sea mejor.

  2. En Columna de la tabla, haga clic en la celda Bike Buyer y seleccione ProspectiveBuyer.Unknown en el cuadro desplegable.

    De esta forma, se asigna la columna de predicción, [Bike Buyer], a una columna de la tabla de entrada.

  3. Haga clic en Aceptar.

  4. En el Explorador de soluciones, haga clic con el botón secundario en la vista del origen de datos Targeted Mailing y seleccione Diseñador de vistas.

  5. Haga clic con el botón secundario del mouse en la tabla ProspectiveBuyer y seleccione Nuevo cálculo con nombre.

  6. En el cuadro de diálogo Crear cálculo con nombre, en Nombre de columna, escriba calcAge.

  7. En Descripción, escriba Calcular la edad en función de la fecha de nacimiento.

  8. En el cuadro Expresión, escriba DATEDIFF(AAAA,[BirdthDate],getdate()) y haga clic en Aceptar.

    Dado que la tabla de entrada no tiene ninguna columna Age que se corresponda con una del modelo, puede utilizar esta expresión para calcular la edad del cliente a partir de la columna BirthDate en la tabla de entrada. Puesto que Age se identificó como la columna más influyente para predecir la compra de una bicicleta, debe existir en el modelo y en la tabla de entrada.

  9. En el Diseñador de minería de datos, seleccione la pestaña Predicción de modelo de minería de datos y vuelva a abrir la ventana Modificar conexiones.

  10. En Columna de la tabla, haga clic en la celda Age y seleccione ProspectiveBuyer.calcAge en el cuadro desplegable.

    Nota de advertenciaAdvertencia

    Si no ve la columna en la lista, puede que tenga que actualizar la definición de la vista del origen de datos que se ha cargado en el diseñador. Para ello, en el menú Archivo, seleccione Guardar todo y luego cierre y abra de nuevo el proyecto en el diseñador.

  11. Haga clic en Aceptar.

Diseñar la consulta de predicción

Para diseñar la consulta de predicción

  1. El primer botón de la barra de herramientas de la pestaña Predicción de modelo de minería de datos es el botón Cambiar a vista de diseño de consulta / Cambiar a vista de resultado / Cambiar a vista de consulta. Haga clic en la flecha abajo en este botón y seleccione Diseño.

  2. En la cuadrícula de la pestaña Predicción de modelo de minería de datos, haga clic en la celda de la primera fila vacía de la columna Origen y, a continuación, seleccione Función de predicción.

  3. En la fila Función de predicción, de la columna Campo, seleccione PredictProbability.

    En la columna Alias de la misma fila, escriba Probabilidad de resultado.

  4. En la ventana Modelo de minería de datos anterior, seleccione y arrastre [Bike Buyer]] a la celda Criterios o argumento.

    A continuación, aparece [TM_Decision_Tree].[Bike Buyer] en la celda Criterios o argumento.

    De esta forma, se especificará la columna de destino para la función PredictProbability. Para obtener más información acerca de las funciones, vea Referencia de funciones de Extensiones de minería de datos (DMX).

  5. Haga clic en la siguiente fila vacía de la columna Origen y, a continuación, seleccione TM_Decision_Tree mining model**.**

  6. En la fila TM_Decision_Tree, en la columna Campo, seleccione Bike Buyer.

  7. En la fila TM_Decision_Tree, en la columna Criterios o argumento, escriba = 1.

  8. Haga clic en la siguiente fila vacía de la columna Origen y, a continuación, seleccione la tabla ProspectiveBuyer.

  9. En la fila ProspectiveBuyer de la columna Campo, seleccione ProspectiveBuyerKey.

    De esta forma, se agregará un identificador único a la consulta de predicción para que pueda identificar quién es más y menos probable que compre una bicicleta.

  10. Agregue cinco filas más a la cuadrícula. Para cada fila, seleccione la tabla ProspectiveBuyer como Origen y, a continuación, agregue las columnas siguientes en las celdas Campo:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Finalmente, ejecute la consulta y examine los resultados.

Para ejecutar la consulta y ver los resultados

  1. En la pestaña Predicción de modelo de minería de datos, seleccione el botón Resultado.

  2. Una vez que la consulta se ejecute y se muestren los resultados, puede revisarlos.

    La pestaña Predicción de modelo de minería de datos muestra información de contacto para los clientes potenciales que son probables compradores de bicicletas. La columna Probabilidad de resultado indica la probabilidad de que la predicción sea correcta. Puede utilizar estos resultados para determinar a qué clientes potenciales debe dirigirse en el correo.

  3. En este punto, puede guardar los resultados. Tiene tres opciones:

    • Haga clic con el botón secundario en una fila de datos en los resultados y seleccione Copiar para guardar solo el valor (y el encabezado de columna) en el Portapapeles.

    • Haga clic con el botón secundario en cualquier fila de resultados y seleccione Copiar todo para copiar el conjunto de resultados completo, incluidos los encabezados de columna, en el Portapapeles.

    • Haga clic en Guardar resultado de la consulta para guardar los resultados directamente en una base de datos como sigue:

      1. En el cuadro de diálogo Guardar resultado de consulta de minería de datos, seleccione un origen de datos o defina un nuevo origen de datos.

      2. Escriba un nombre para la tabla que contendrá los resultados de la consulta.

      3. Utilice la opción Agregar a vista del origen de datos para crear la tabla y agregarla a una vista del origen de datos existente. Esto es útil si desea conservar todas las tablas relacionadas para un modelo, como los datos de entrenamiento, los datos del origen de predicción y los resultados de la consulta, en la misma vista del origen de datos.

      4. Utilice la opción Sobrescribir si existe para actualizar una tabla existente con los últimos resultados.

        Debe utilizar la opción de sobrescribir la tabla si ha agregado algunas columnas a la consulta de predicción, cambiado los nombres o los tipos de datos de las columnas en la consulta de predicción, o si ha ejecutado alguna instrucción ALTER en la tabla de destino.

        Además, si varias columnas tienen el mismo nombre (por ejemplo, el nombre de columna predeterminado Expresión) debe crear un alias para las columnas con nombres duplicados o se producirá un error cuando el diseñador intente guardar los resultados en SQL Server. La razón es que SQL Server no permite que varias columnas tengan el mismo nombre.

        Para obtener más información, vea Guardar resultado de consulta de minería de datos (cuadro de diálogo de la vista Predicción de modelo de minería de datos).

Siguiente tarea de la lección

Usar la obtención de detalles en datos de estructura (Tutorial básico de minería de datos)

Vea también

Tasks

Crear una consulta de predicción con el Generador de consultas de predicción

Otros recursos

Usar el Generador de consultas de predicción para crear consultas de predicción DMX