Crear una estructura del modelo de minería de datos de distribución de correo directo (Tutorial básico de minería de datos)

El primer paso para crear un escenario de correo directo (Targeted Mailing) consiste en utilizar el Asistente para minería de datos de Business Intelligence Development Studio con el fin de crear una estructura de minería de datos y un modelo de minería de datos de árbol de decisión.

En esta tarea creará la estructura de minería de datos inicial, basada en el algoritmo de árboles de decisión de Microsoft. Para crear la estructura, primero seleccionará las tablas y vistas, y a continuación identificará qué columnas se utilizarán para el entrenamiento y cuáles para pruebas.

Para crear una estructura de minería de datos para un escenario de distribución de correo directo

  1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos para iniciar el Asistente para minería de datos.

  2. En la página de inicio del Asistente para minería de datos, haga clic en Siguiente.

  3. En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o un almacén de datos se ha seleccionado y, a continuación, haga clic en Siguiente.

  4. En la página Crear la estructura de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Árboles de decisión de Microsoft.

    Nota

    Si aparece una advertencia de que no se puede encontrar ningún algoritmo de minería de datos, puede que las propiedades del proyecto no estén configuradas correctamente. Esta advertencia se produce cuando el proyecto intenta recuperar una lista de algoritmos de minería de datos del servidor de Analysis Services y no puede encontrarlo. De forma predeterminada, BI Development Studio utilizará el host local como servidor. Si está utilizando una instancia diferente o una instancia con nombre, debe cambiar las propiedades del proyecto. Para obtener más información, vea Crear un proyecto de Analysis Services (Tutorial básico de minería de datos).

  5. Haga clic en Siguiente.

  6. En la página Seleccionar vista del origen de datos, en el panel Vistas del origen de datos disponibles, seleccione Targeted Mailing. Puede hacer clic en Explorar para ver las tablas de la vista del origen de datos y, a continuación, hacer clic en Cerrar para volver al asistente.

  7. Haga clic en Siguiente.

  8. En la página Especificar tipos de tablas, active la casilla de la columna Caso, correspondiente a vTargetMail para usarla como tabla de casos y, a continuación, haga clic en Siguiente. Utilizará la tabla ProspectiveBuyer posteriormente para pruebas; pásela por alto por ahora.

  9. En la página Especificar los datos de aprendizaje, identificará al menos una columna de predicción, una columna de clave y una columna de entrada para el modelo. Active la casilla de la columna De predicción en la fila BikeBuyer.

    Nota

    Observe la advertencia en la parte inferior de la ventana. No podrá navegar a la página siguiente hasta que seleccione una columna De predicción y Entrada, como mínimo.

  10. Haga clic en Sugerir para abrir el cuadro de diálogo Sugerir columnas relacionadas.

    El botón Sugerir está habilitado siempre que se haya seleccionado al menos un atributo predecible. El cuadro de diálogo Sugerir columnas relacionadas enumera en una lista las columnas más relacionadas con la columna predecible y ordena los atributos por su correlación con el atributo predecible. Las columnas con una correlación significativa (con una confianza mayor del 95%) se seleccionan automáticamente para incluirse en el modelo.

    Revise las sugerencias y, a continuación, haga clic en Cancelar para omitirlas.

    Nota

    Si hace clic en Aceptar, todas las sugerencias enumeradas se marcarán como columnas de entrada en el asistente. Si está de acuerdo sólo con algunas de las sugerencias, debe cambiar los valores manualmente.

  11. Compruebe que la casilla de la columna Key está seleccionada en la fila CustomerKey.

    Nota

    Si la tabla de origen de la vista de origen de datos muestra una clave, el Asistente para minería de datos elegirá automáticamente esa columna como clave para el modelo.

  12. Active las casillas de la columna Entrada en las filas siguientes. Puede activar varias columnas resaltando un rango de celdas y presionando CTRL mientras activa una casilla.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Region

    • TotalChildren

    • YearlyIncome

  13. En la columna izquierda de la página, active las casillas de las filas siguientes.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName.

    Asegúrese de que estas filas sólo tienen marcas en la columna izquierda. Estas columnas se agregarán a la estructura pero no se incluirán en el modelo. Sin embargo, una vez generado el modelo, estarán disponibles para la obtención de detalles y las pruebas. Para obtener más información acerca de la obtención de detalles, vea Usar la obtención de detalles en los modelos y estructuras de minería (Analysis Services - Minería de datos).

  14. Haga clic en Siguiente.