Crear predicciones (Tutorial básico de minería de datos)

Una vez que haya probado la precisión de los modelos de minería de datos y esté satisfecho con los resultados, puede crear consultas de predicción de Extensiones de minería de datos (DMX) por medio del Generador de consultas de predicción en la ficha Predicción de modelo de minería de datos del Diseñador de minería de datos.

El Generador de consultas de predicción tiene tres vistas. Mediante las vistas Diseño y Consulta, puede crear y examinar una consulta. A continuación, puede ejecutar la consulta y ver los resultados en la vista Resultado.

Para obtener más información acerca de cómo utilizar el Generador de consultas de predicción, vea Crear consultas de predicción DMX.

Crear la consulta

El primer paso para crear una consulta de predicción consiste en seleccionar un modelo de minería de datos y una tabla de entrada.

Para seleccionar un modelo de minería de datos y una tabla de entrada

  1. En la ficha Predicción de modelo de minería de datos del Diseñador de minería de datos, en el cuadro Modelo de minería de datos, haga clic en Seleccionar modelo.

  2. En el cuadro de diálogo Seleccionar modelo de minería de datos, navegue por el árbol hasta la estructura Targeted Mailing, expándala, seleccione TM_Decision_Tree y, a continuación, haga clic en Aceptar.

  3. En el cuadro Seleccionar tabla(s) de entrada, haga clic en Seleccionar tabla de casos.

  4. En el cuadro de diálogo Seleccionar tabla, en la lista Origen de datos, seleccione Adventure Works DW2008R2.

  5. En la lista Nombre de tabla o vista, seleccione la tabla ProspectiveBuyer (dbo) y, a continuación, haga clic en Aceptar.

    La tabla ProspectiveBuyer se parece mucho a la tabla de casos vTargetMail.

Asignar las columnas

Después de seleccionar la tabla de entrada, el Generador de consultas de predicción crea una asignación predeterminada entre el modelo de minería de datos y la tabla de entrada, en función de los nombres de las columnas. Al menos una columna de la estructura debe coincidir con una columna de los datos externos.

Nota importanteImportante

Los datos que usa para determinar la precisión de los modelos deben contener una columna que se puede asignar a la columna de predicción.

Para asignar las columnas de la estructura a las columnas de la tabla de entrada

  1. Haga clic con el botón secundario en las líneas que conectan la ventana Modelo de minería de datos a la ventana Seleccionar tabla de entrada y seleccione Modificar conexiones.

    Observe que no todas las columnas están asignadas. Agregaremos las asignaciones para varias Columnas de tabla.

  2. En Columna de la tabla, haga clic en la celda Bike Buyer y seleccione ProspectiveBuyer.Unknown en el cuadro desplegable.

    De esta forma se asigna la columna de predicción, [Bike Buyer], a una columna de la tabla de entrada.

  3. Haga clic en Aceptar.

  4. En el Explorador de soluciones, haga clic con el botón secundario en la vista del origen de datos Targeted Mailing y seleccione Diseñador de vistas.

  5. Haga clic con el botón secundario en el título de la tabla ProspectiveBuyer y seleccione Nuevo cálculo con nombre.

  6. En el cuadro de nombre Columna, escriba calcAge.

  7. En el cuadro Expresión, escriba DATEDIFF(AAAA,[BirdthDate],getdate()) y haga clic en Aceptar.

    La tabla de entrada no tiene ninguna columna Antigüedad correspondiente. Esta expresión calculará la edad del cliente a partir de la columna de fecha de nacimiento de la tabla de entrada. Puesto que Antigüedad se identificó como la columna más influyente para predecir la compra de una bicicleta, debe existir en el modelo y en la tabla de entrada.

  8. En el Diseñador de minería de datos, seleccione la ficha Predicción de modelo de minería de datos y vuelva a abrir la ventana Modificar conexiones.

  9. En Columna de la tabla, haga clic en la celda Antigüedad y seleccione ProspectiveBuyer.calcAge en el cuadro desplegable.

  10. Haga clic en Aceptar.

Diseñar la consulta de predicción

Para diseñar la consulta de predicción

  1. El primer botón de la barra de herramientas de la ficha Predicción de modelo de minería de datos es el botón Cambiar a vista de diseño de consulta / Cambiar a vista de resultado / Cambiar a vista de consulta. Haga clic en la flecha abajo en este botón y seleccione Diseño.

  2. En la cuadrícula de la ficha Predicción de modelo de minería de datos, haga clic en la celda de la primera fila vacía de la columna Origen y, a continuación, seleccione Función de predicción.

    De esta forma, se especificará la columna de destino para la función PredictProbability. Para obtener más información acerca de las funciones, vea Referencia de funciones de Extensiones de minería de datos (DMX).

  3. En la fila Función de predicción, de la columna Campo, seleccione PredictProbability.

  4. En la ventana Modelo de minería de datos anterior, seleccione y arrastre [Bike Buyer] a la celda Criterios o argumento.

    Cuando lo coloca, [TM_Decision_Tree].[Bike Buyer] aparece en la celda Criterios o argumento.

  5. Haga clic en la siguiente fila vacía de la columna Origen y, a continuación, seleccione TM_Decision_Tree.

  6. En la fila TM_Decision_Tree, en la columna Campo, seleccione Bike Buyer.

  7. En la fila TM_Decision_Tree, en la columna Criterios o argumento, escriba = 1.

  8. Haga clic en la siguiente fila vacía de la columna Origen y, a continuación, seleccione ProspectiveBuyer.

  9. En la fila ProspectiveBuyer, en la columna Campo, seleccione ProspectiveBuyerKey.

    De esta forma, se agregará un identificador único a la consulta de predicción para que pueda identificar quién es más y menos probable que compre una bicicleta.

  10. Agregue cinco filas más a la cuadrícula. Para cada fila, seleccione ProspectiveBuyer como Origen y, a continuación, agregue las columnas siguientes en las celdas Campo:

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Finalmente, ejecute la consulta y examine los resultados.

Para ejecutar la consulta y ver los resultados

  1. En la ficha Predicción de modelo de minería de datos, seleccione el botón Resultado.

  2. Una vez que la consulta se ejecute y se muestren los resultados, puede revisarlos.

    La ficha Predicción de modelo de minería de datos muestra información de contacto para los clientes potenciales que son probables compradores de bicicletas. La columna Expresión indica la probabilidad de que la predicción sea correcta. Puede utilizar estos resultados para determinar a qué clientes potenciales debe dirigirse en el correo.

  3. Haga clic en el botón Guardar para guardar los resultados.