Share via


Crear una estructura del modelo de minería de datos de distribución de correo directo (Tutorial básico de minería de datos)

El primer paso para crear un escenario de correo directo (Targeted Mailing) consiste en usar el Asistente para minería de datos de SQL Server Data Tools (SSDT) con el fin de crear una estructura de minería de datos y un modelo de minería de datos de árbol de decisión. 

En esta tarea configurará una nueva estructura de minería de datos y agregará un modelo de minería de datos inicial basándose en el algoritmo de Árboles de decisión de Microsoft. Para crear la estructura, primero seleccionará las tablas y las vistas, y a continuación identificará qué columnas se usarán para el entrenamiento y cuáles para las pruebas.

Para crear una estructura de minería de datos para un escenario de distribución de correo directo

  1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos para iniciar el Asistente para minería de datos.

  2. En la página de inicio del Asistente para minería de datos, haga clic en Siguiente.

  3. En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o del almacenamiento de datos se ha seleccionado y, a continuación, haga clic en Siguiente.

  4. En la página Crear la estructura de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Árboles de decisión de Microsoft.

    [!NOTA]

    Si aparece una advertencia de que no se puede encontrar ningún algoritmo de minería de datos, puede que las propiedades del proyecto no estén configuradas correctamente. Esta advertencia se produce cuando el proyecto intenta recuperar una lista de algoritmos de minería de datos del servidor de Analysis Services y no puede encontrarlo. De forma predeterminada, SQL Server Data Tools utilizará el host local como servidor. Si está utilizando una instancia diferente o una instancia con nombre, debe cambiar las propiedades del proyecto. Para obtener más información, vea Crear un proyecto de Analysis Services (Tutorial básico de minería de datos).

  5. Haga clic en Siguiente.

  6. En la página Seleccionar vista del origen de datos, en el panel Vistas del origen de datos disponibles, seleccione Targeted Mailing. Puede hacer clic en Explorar para ver las tablas de la vista del origen de datos y, a continuación, hacer clic en Cerrar para volver al asistente.

  7. Haga clic en Siguiente.

  8. En la página Especificar tipos de tablas, active la casilla de la columna Caso, correspondiente a vTargetMail para usarla como tabla de casos y, a continuación, haga clic en Siguiente. Utilizará la tabla ProspectiveBuyer posteriormente para pruebas; olvídese de ella por ahora.

  9. En la página Especificar los datos de aprendizaje, identificará al menos una columna de predicción, una columna de clave y una columna de entrada para el modelo. Active la casilla de la columna De predicción en la fila BikeBuyer.

    [!NOTA]

    Observe la advertencia en la parte inferior de la ventana. No podrá navegar a la página siguiente hasta que seleccione una columna De predicción y Entrada, como mínimo.

  10. Haga clic en Sugerir para abrir el cuadro de diálogo Sugerir columnas relacionadas.

    El botón Sugerir está habilitado siempre que se haya seleccionado al menos un atributo predecible. El cuadro de diálogo Sugerir columnas relacionadas enumera en una lista las columnas más relacionadas con la columna predecible y ordena los atributos por su correlación con el atributo predecible. Las columnas con una correlación significativa (con una confianza mayor del 95%) se seleccionan automáticamente para incluirse en el modelo.

    Revise las sugerencias y, a continuación, haga clic en Cancelar paraomitirlas.

    [!NOTA]

    Si hace clic en Aceptar, todas las sugerencias enumeradas se marcarán como columnas de entrada en el asistente. Si está de acuerdo con solamente algunas de las sugerencias, debe cambiar los valores manualmente.

  11. Compruebe que la casilla de la columna Key está seleccionada en la fila CustomerKey.

    [!NOTA]

    Si la tabla de origen de la vista del origen de datos muestra una clave, el Asistente para minería de datos elegirá automáticamente esa columna como clave para el modelo.

  12. Active las casillas de la columna Entrada en las filas siguientes. Puede activar varias columnas resaltando un rango de celdas y presionando CTRL mientras activa una casilla.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Region

    • TotalChildren

    • YearlyIncome

  13. En la columna izquierda de la página, active las casillas de las filas siguientes.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName

    Asegúrese de que estas filas solo tienen marcas en la columna izquierda. Estas columnas se agregarán a la estructura, pero no se incluirán en el modelo. Sin embargo, una vez generado el modelo, estarán disponibles para la obtención de detalles y las pruebas. Para obtener más información acerca de la obtención de detalles, vea Consultas de obtención de detalles (minería de datos).

  14. Haga clic en Siguiente.

Siguiente tarea de la lección

Especificar el tipo de datos y el tipo de contenido (Tutorial básico de minería de datos)

Vea también

Referencia

Especificar tipos de tablas (Asistente para minería de datos)

Conceptos

Diseñador de minería de datos

Algoritmo de árboles de decisión de Microsoft