Probar un modelo filtrado (Tutorial básico de minería de datos)

Ahora que ha determinado que el modelo TM_Decision_Tree es el más preciso, debería evaluarlo en el contexto de la campaña de distribución de correo directo de Adventure Works Cycles. El departamento de marketing de desea saber si hay alguna diferencia en las características de los compradores y las compradoras de bicicletas. Esta información les ayudará a decidir qué revistas utilizar para los anuncios y qué productos ofrecer en sus campañas.

En esta lección, crearemos un modelo que se filtra por el género. A continuación, puede realizar fácilmente una copia de ese modelo y cambiar la condición de filtro para generar un nuevo modelo basado en el género.

Para obtener más información sobre los filtros, vea Crear filtros para modelos de minería de datos (Analysis Services - Minería de datos).

Usar filtros

El filtrado permite crear con facilidad modelos basados en subconjuntos de datos. El filtro se aplica sólo al modelo y no cambia el origen de datos subyacente. Para obtener información sobre cómo aplicar filtros a tablas anidadas, vea Tutorial intermedio de minería de datos (Analysis Services - Minería de datos).

Filtros en tablas de casos

Primero realizará una copia del modelo TM_Decision_Tree.

Para copiar el modelo del árbol de decisión

  1. En Business Intelligence Development Studio, en el Explorador de soluciones, seleccione ASDataMining2008.

  2. Haga clic en la ficha Modelos de minería de datos.

  3. Haga clic con el botón secundario en el modelo TM_Decision_Tree y seleccione Nuevo modelo de minería de datos.

  4. En el campo Nombre del modelo, escriba TM_Decision_Tree_Male.

  5. Haga clic en Aceptar.

Luego, cree un filtro para seleccionar los clientes para el modelo basados en su género.

Para crear un filtro de casos en un modelo de minería de datos

  1. Haga clic con el botón secundario en el modelo de minería de datos TM_Decision_Tree_Male para abrir el menú contextual.

    O bien

    Seleccione el modelo. En el menú Minería de datos, seleccione Establecer filtro de modelos.

  2. En el cuadro de diálogo Filtro del modelo, haga clic en la fila superior de la cuadrícula en el cuadro de texto Columna de la estructura de minería de datos.

    La lista desplegable muestra sólo los nombres de las columnas de esa tabla.

  3. En el cuadro de texto Columna de la estructura de minería de datos, seleccione Gender.

    El icono en la parte izquierda del cuadro de texto cambia para indicar que el elemento seleccionado es una tabla o una columna.

  4. Haga clic en el cuadro de texto Operador y seleccione el operador igual (=) en la lista.

  5. Haga clic en el cuadro de texto Valor y escriba M.

  6. Haga clic en la siguiente fila de la cuadrícula.

  7. Haga clic en Aceptar para cerrar el filtro del modelo.

    El filtro se muestra en la ventana Propiedades. Como alternativa, puede iniciar el cuadro de diálogo Filtro del modelo de la ventana Propiedades.

  8. Repita los pasos anteriores, pero esta vez asigne al modelo el nombre TM_Decision_Tree_Female y escriba F en el cuadro de texto Valor.

Ahora tiene dos modelos nuevos que se muestran en la ficha Modelos de minería de datos.

Procesar los modelos filtrados

Los modelos no se pueden utilizar hasta que se hayan implementado y procesado. Para obtener más información acerca de los modelos de procesamiento, vea Procesar los modelos de la estructura de distribución de correo directo (Tutorial básico de minería de datos).

Para procesar el modelo filtrado

  1. Hacer clic con el botón secundario en el modelo TM_Decision_Tree_Male y seleccione Procesar estructura de minería de datos y todos los modelos.

  2. Haga clic en Ejecutar para procesar los nuevos modelos.

  3. Una vez completado el procesamiento, haga clic en Cerrar en ambas ventanas de procesamiento.

Evaluar los resultados

Vea los resultados y evalúe la exactitud de los modelos filtrados de la misma manera que hizo con los tres modelos anteriores. Para obtener más información, vea:

Explorar el modelo de árbol de decisión (tutorial básico de minería de datos)

Probar la exactitud con gráficos de mejora respecto al modelo predictivo (Tutorial básico de minería de datos)

Para explorar los modelos filtrados

  1. Seleccione la ficha Visor de modelo de minería de datos en Diseñador de minería de datos.

  2. En el cuadro Modelo de minería de datos, seleccione TM_Decision_Tree_Male.

  3. Deslice Mostrar nivel hasta 3.

  4. Cambie el valor de la lista Fondo por 1.

  5. Coloque el cursor sobre el nodo con la etiqueta Todos para ver el número de compradores de bicicleta con respecto a los no compradores.

  6. Repita los pasos 1 al 5 con TM_Decision_Tree_Female.

  7. Explore los resultados para TM_Decision_Tree y los modelos filtrados por el género. Si se comparan todos los compradores de bicicletas, los compradores masculinos y femeninos comparten algunas de las mismas características de los compradores de bicicletas sin filtrar, pero los tres también presentan diferencias interesantes. Ésta es información útil que Adventure Works Cycles puede utilizar para desarrollar su campaña de marketing.

Para probar la mejora en la predicción de los modelos filtrados

  1. Cambie a la ficha Gráfico de precisión de minería de datos del Diseñador de minería de datos de Business Intelligence Development Studio y seleccione la ficha Selección de entrada.

  2. En el cuadro de grupo Seleccionar un conjunto de datos para usarlo en un gráfico de precisión, seleccione Usar casos de prueba de estructura de minería de datos.

  3. En la ficha Selección de entrada del Diseñador de minería de datos, en Seleccione las columnas del modelo de minería de datos de predicción que se mostrarán en el gráfico de elevación, active la casilla correspondiente a Sincronizar valores y columnas de predicción.

  4. En la columna Nombre de columna de predicción, compruebe que Bike Buyer está seleccionado para cada modelo.

  5. En la columna Mostrar, seleccione cada uno de los modelos.

  6. En la columna Valor de predicción, seleccione 1.

  7. Seleccione la ficha Gráfico de mejora respecto al modelo predictivo para mostrar el gráfico de mejora.

    Observará ahora que los tres modelos de árbol de decisión proporcionan una mejora significativa respecto al modelo de predicción de suposición aleatoria, además de superar a los modelos de clústeres y Bayes naive.