Explorar los modelos Targeted Mailing (tutorial de minería de datos)

Artículo
12/15/2008

Una vez que se procesen los modelos de su proyecto, podrá verlos utilizando la ficha Visor de modelos de minería de datos del Diseñador de minería de datos. Puede utilizar la lista Modelos de minería de datos, ubicada en la parte superior de la ficha, para examinar los modelos individuales en la estructura de minería de datos.

Las secciones siguientes describen cómo explorar los modelos de minería de datos en los visores.

Modelo Microsoft Decision Tree
Modelo Microsoft Clustering
Modelo Microsoft Naive Bayes

Modelo Microsoft Decision Tree

Cuando cambie a la ficha Visor de modelos de minería de datos en el Diseñador de minería de datos para el proyecto del tutorial Adventure Works DM, el diseñador se abre con el modelo de minería de datos de correo directo (Targeted Mailing), que es el primero de la estructura. Cada algoritmo utilizado para crear un modelo en Analysis Services aporta diferentes resultados. Por tanto, Analysis Services ofrece un visor independiente para cada algoritmo. Cuando se examina un modelo de minería de datos, el modelo se muestra en la ficha Visor de modelos de minería de datos utilizando el visor apropiado para el modelo. En este caso, para el modelo de árbol de decisión, se utiliza el Visor de árboles de Microsoft. Este visor contiene dos fichas: Árbol de decisión y Red de dependencias.

Árbol de decisión

En la ficha Árbol de decisión, puede examinar los tres modelos de árbol que componen un modelo de minería de datos. Dado que el modelo de correo directo incluido en este proyecto de tutorial contiene un único atributo de predicción (Bike Buyer), sólo hay un árbol para ver. Si hubiera más árboles, podría utilizar el cuadro Árbol para elegir uno diferente.

De manera predeterminada, el Visor de árboles de Microsoft sólo muestra los primeros tres niveles del árbol. Si el árbol contiene menos de tres niveles, el visor mostrará sólo los niveles existentes. Puede ver más niveles utilizando el control deslizante Mostrar nivel o la lista Expansión predeterminada. Para obtener más información acerca de cómo configurar el visor, vea Ver un modelo de minería de datos con el Visor de árboles de Microsoft.

Para modificar el árbol

Deslice Mostrar nivel hasta 5.
Cambie la lista Fondo a 1.

Al cambiar la configuración de Fondo, podrá ver rápidamente el número de escenarios para Bike Buyer que son igual a 1 y que existen en cada nodo. Cuanto más oscuro sea el sombreado del nodo, más escenarios incluirá.

Cada nodo del árbol de decisión muestra la siguiente información:

La condición necesaria para alcanzar el nodo desde el nodo anterior. Puede ver la ruta completa del nodo en la Leyenda de minería de datos o deteniendo el puntero sobre un nodo para ver un recuadro informativo.
Un histograma que describe la distribución de estados de la columna de predicción por orden de popularidad. Puede decidir cuántos estados aparecerán en el histograma mediante el control Histogramas.
La concentración de escenarios, si el estado del atributo de predicción se ha especificado en el control Fondo.

Puede ver los escenarios de entrenamiento que cada nodo admite haciendo clic con el botón secundario en el nodo y, a continuación, seleccionando Obtener detalles.

Red de dependencias

La ficha Red de dependencias muestra las relaciones entre los atributos que contribuyen a la capacidad de predicción del modelo de minería de datos.

El nodo central para la red de dependencia, Bike Buyer, representa el atributo de predicción del modelo de minería de datos. Cada nodo adyacente representa un atributo que afecta al resultado del atributo de predicción. Puede utilizar el control deslizante situado en la parte izquierda de la ficha para controlar la intensidad de los vínculos que se muestran. Si desplaza el control deslizante hacia abajo, sólo se mostrarán los vínculos de mayor intensidad.

Haga clic en un nodo de la red y, a continuación, consulte la leyenda de color situada en la parte inferior de la ficha para ver cuáles son los nodos predichos por el nodo seleccionado o los nodos que predicen al nodo seleccionado.

Modelo Microsoft Clustering

Utilice la lista Modelo de minería de datos de la parte superior de la ficha Visor de modelos de minería de datos para cambiar al modelo TM_Clustering. El visor de este modelo, el Visor de clústeres de Microsoft, contiene cuatro fichas: Diagrama del clúster, Perfiles del clúster, Características del clúster y Distinción del clúster. De forma predeterminada, el visor muestra la ficha Diagrama del clúster cuando se abre por primera vez.

Para obtener más información acerca de cómo configurar el Visor de clústeres de Microsoft, vea Ver un modelo de minería de datos con el Visor de clústeres de Microsoft.

Diagrama del clúster

La ficha Diagrama del clúster permite explorar las relaciones entre los clústeres detectados por el algoritmo. Las líneas entre los clústeres representan la "proximidad" y aparecen sombreadas en función de la similitud entre los clústeres. El color de cada clúster representa la frecuencia de la variable y el estado del clúster. Puede seleccionar la variable y el estado en los cuadros Variable de sombreado y Estado de la parte superior del nodo. La variable predeterminada es Llenado, pero puede cambiarla a cualquier atributo del modelo con el fin de determinar los clústeres que contienen miembros con los atributos que desea. Si utiliza el control deslizante situado en la parte izquierda de la red, puede filtrar los vínculos de menor intensidad y encontrar los clústeres con las relaciones más próximas.

Por ejemplo, establezca Variable de sombreado en Bike Buyer y Estado en 1. Observará que el clúster 5 es el que contiene la mayor densidad de compradores de bicicleta (Bike Buyer) y que la relación más fuerte existe entre el clúster 4 y el clúster 7.

Perfiles del clúster

La ficha Perfiles del clúster proporciona una vista global del modelo TM_Clustering. Como podrá ver en el visor, la ficha Perfiles del clúster contiene una columna por cada clúster del modelo. La primera columna enumera los atributos asociados a un clúster como mínimo. El resto del visor contiene la distribución de estados de un atributo por cada clúster. La distribución de una variable discreta se muestra como una barra coloreada y el número máximo de barras aparece en la lista Barras de histograma. Los atributos continuos se muestran con un diagrama de rombo, que representa la desviación media y estándar en cada clúster.

Características del clúster

La ficha Características del clúster le permite examinar con más detalle las características que forman un clúster. Por ejemplo, si utiliza la lista Clúster para mostrar el clúster 5 en el escenario de este tutorial, podrá ver que las personas de este clúster, que son clientes que han comprado una bicicleta en el pasado, tienden a compartir las mismas características: viajan todos los días entre 0 y 1 millas, no tienen coche y están casados.

Distinción del clúster

La ficha Distinción del clúster le permite explorar las características que diferencian a un clúster de otro. Después de seleccionar dos clústeres de los cuadros Clúster 1 y Clúster 2, el visor determinará las diferencias entre los clústeres y las mostrará según el orden de los atributos que más distinguen a los clústeres.

Por ejemplo, compare el clúster 5 y el clúster 7 del modelo TM_Clustering. El clúster 5 contiene la mayor densidad de compradores de bicicleta y el clúster 7 contiene la menor densidad. Las personas del clúster 7 son normalmente de Norteamérica y son más jóvenes, entre 23 y 31 años, mientras que las personas del clúster 5 suelen ser de Europa y recorren una distancia menor, entre 0 y 1 millas.

Modelo Microsoft Naive Bayes

Utilice la lista Modelo de minería de datos de la parte superior de la ficha Visor de modelos de minería de datos para cambiar al modelo TM_NaiveBayes. El visor de este modelo, el Visor Bayes naive de Microsoft, contiene cuatro fichas: Red de dependencias, Perfiles del atributo, Características del atributo y Distinción del atributo.

Para obtener más información acerca de cómo utilizar el Visor Bayes naive de Microsoft, vea Ver un modelo de minería de datos con el Visor Bayes naive de Microsoft.

Red de dependencias

La ficha Red de dependencias funciona igual que la ficha del mismo nombre del Visor de árboles de Microsoft. Cada nodo del visor representa un atributo y las líneas entre los nodos representan relaciones. En el visor, puede ver todos los atributos que afectan al estado del atributo de predicción, Bike Buyer.

A medida que baje el control deslizante, sólo permanecerán los atributos que afecten en mayor medida a la columna Bike Buyer. Al ajustar el control deslizante, puede ver que el número de coches en propiedad es el factor que más determina si alguien es un comprador de bicicleta.

Perfiles del atributo

La ficha Perfiles del atributo describe la forma en que los diferentes estados de los atributos de entrada afectan al resultado del atributo de predicción.

En el cuadro De predicción, compruebe que se ha seleccionado Bike Buyer. Los atributos que afectan al estado de este atributo de predicción aparecen enumerados junto a los valores de cada estado de los atributos de entrada y sus distribuciones en cada estado del atributo de predicción.

Características del atributo

Mediante la ficha Características del atributo, puede seleccionar un atributo y un valor para ver la frecuencia con la que aparecen los valores de otros atributos en el caso de los valores seleccionados.

En la lista Atributo, compruebe que Bike Buyer se haya seleccionado, y en la lista Valor, seleccione 1. En el visor, podrá ver que las personas que viajan todos los días entre 0 y 1 millas para trabajar y que viven en Norteamérica son los que compran más bicicletas.

Distinción del atributo

La ficha Distinción del atributo le permite examinar las relaciones entre dos valores discretos del atributo de predicción seleccionado y otros valores del atributo. Dado que el modelo TM_NaiveBayes sólo tiene dos estados, 1 y 0, no tiene que hacer ningún cambio en el visor.

En el visor, podrá ver que las personas que no tienen un coche tienden a comprar bicicletas y las personas que tienen dos coches no suelen comprar bicicletas.

Siguiente tarea de la lección

Comprobar la precisión de los modelos de minería de datos (tutorial de minería de datos)

Compartir a través de

Explorar los modelos Targeted Mailing (tutorial de minería de datos)

Modelo Microsoft Decision Tree

Árbol de decisión

Para modificar el árbol

Red de dependencias

Modelo Microsoft Clustering

Diagrama del clúster

Perfiles del clúster

Características del clúster

Distinción del clúster

Modelo Microsoft Naive Bayes

Red de dependencias

Perfiles del atributo

Características del atributo

Distinción del atributo

Siguiente tarea de la lección

Recursos adicionales