Compartir a través de


Crear una estructura del modelo de minería de datos Targeted Mailing (tutorial de minería de datos)

El primer paso para crear un escenario de correo directo (Targeted Mailing) consiste en utilizar el Asistente para minería de datos de Business Intelligence Development Studio con el fin de crear una estructura de minería de datos y un modelo de minería de datos de árbol de decisión.

Para obtener más información

Asistente para minería de datos, Diseñador de minería de datos, Algoritmo de árboles de decisión de Microsoft

Para crear una estructura de minería de datos para un escenario de correo directo

  1. En el Explorador de soluciones, haga clic con el botón secundario en Estructuras de minería de datos y seleccione Nueva estructura de minería de datos.

    Se abrirá el Asistente para minería de datos.

  2. En la página de inicio del Asistente para minería de datos, haga clic en Siguiente.

  3. En la página Seleccionar el método de definición, compruebe que la opción A partir de una base de datos relacional o un almacén de datos se ha seleccionado y, a continuación, haga clic en Siguiente.

  4. En la página Seleccionar la técnica de minería de datos, en ¿Qué técnica de minería de datos desea utilizar?, seleccione Árboles de decisión de Microsoft.

    En este tutorial, creará varios modelos basados en esta estructura inicial de minería de datos. El primer modelo se creará junto con la estructura una vez que el asistente finalice y se basará en el algoritmo de árboles de decisión de Microsoft.

  5. Haga clic en Siguiente.

  6. En la página Seleccionar vista de origen de datos, observe que Adventure Works DW se ha seleccionado de forma predeterminada. Haga clic en Explorar para ver las tablas de la vista de origen de datos y, a continuación, haga clic en Cerrar para volver al asistente.

  7. Haga clic en Siguiente.

  8. En la página Especificar tipos de tablas, active la casilla de verificación de la columna Escenario, situada junto a la tabla vTargetMail; a continuación, haga clic en Siguiente.

  9. En la página Especificar los datos de entrenamiento, compruebe que la casilla de verificación de la columna Clave junto a la columna CustomerKey está activada.

    Si la tabla de origen de la vista de origen de datos muestra una clave, el Asistente para minería de datos elegirá automáticamente esa columna como clave para el modelo.

  10. Active las casillas de verificación Entrada y De predicción, situadas junto a la columna BikeBuyer.

    Al indicar que una columna es de predicción, se habilita el botón Sugerir. Si hace clic en Sugerir, se abrirá el cuadro de diálogo Sugerir columnas relacionadas, que enumera las columnas que están más ligadas a la columna de predicción.

    El cuadro de diálogo Sugerir columnas relacionadas ordena los atributos según la relación que tengan con el atributo de predicción. Las columnas cuyo valor es mayor que 0,05 se seleccionan automáticamente para ser incluidas en el modelo. Si las sugerencias le parecen bien, haga clic en Aceptar para que las columnas seleccionadas se marquen como columnas de entrada en el asistente. Para este tutorial, omita las sugerencias haciendo clic en Cancelar.

  11. Active las casillas de verificación Entrada que hay junto a las columnas siguientes:

    • Age
    • CommuteDistance
    • EnglishEducation
    • EnglishOccupation
    • FirstName
    • Gender
    • GeographyKey
    • HouseOwnerFlag
    • LastName
    • MaritalStatus
    • NumberCarsOwned
    • NumberChildrenAtHome
    • Region
    • TotalChildren
    • YearlyIncome

    Puede seleccionar varias columnas si mantiene presionada la tecla MAYÚS.

  12. Haga clic en Siguiente.

  13. En la página Especificar el contenido y el tipo de datos de las columnas, haga clic en Detectar.

    Un algoritmo ejecutará los datos numéricos de los ejemplos y determinará si las columnas numéricas contienen valores continuos o discretos. Por ejemplo, una columna puede contener información salarial como valores de sueldo actuales, que son continuos, o bien integrales que representan rangos de sueldo codificados, como 1 = < $25.000; 2 = de $25.000 a $50.000, que son discretos.

  14. Después de hacer clic en Detectar, compruebe que las entradas de las columnas Tipo de contenido y Tipo de datos tengan la configuración especificada en la siguiente tabla.

    Columna Tipo de contenido Tipo de datos

    Age

    Continuous

    Long

    BikeBuyer

    Discrete

    Long

    CommuteDistance

    Discrete

    Text

    CustomerKey

    Key

    Long

    EnglishEducation

    Discrete

    Text

    EnglishOccupation

    Discrete

    Text

    FirstName

    Discrete

    Text

    Gender

    Discrete

    Text

    GeographyKey

    Discrete

    Text

    HouseOwnerFlag

    Discrete

    Text

    LastName

    Discrete

    Text

    MaritalStatus

    Discrete

    Text

    NumberCarsOwned

    Discrete

    Long

    NumberChildrenAtHome

    Discrete

    Long

    Region

    Discrete

    Text

    TotalChildren

    Discrete

    Long

    YearlyIncome

    Continuous

    Double

[!NOTA] Basándose únicamente en los valores numéricos, el algoritmo de minería de datos sugiere que la columna GeographyKey contiene números continuos. Sin embargo, algunos números como los códigos postales deben tratarse normalmente como discretos y no como valores numéricos continuos, ya que las operaciones matemáticas que usan estos números carecen de significado.

  1. Haga clic en Siguiente.
  2. En la página Finalización del asistente, en Nombre de la estructura de minería de datos, escriba Targeted Mailing.
  3. En Nombre del modelo de minería de datos, escriba TM_Decision_Tree.
  4. Active la casilla de verificación Permitir obtención de detalles.
  5. Haga clic en Finalizar.

Siguiente tarea de la lección

Modificar el modelo Targeted Mailing (tutorial de minería de datos)