Compartir a través de


Explorar los modelos Sequence Clustering (tutorial de minería de datos)

Una vez creado el modelo Sequence Clustering, puede explorarlo con el visor de clústeres de secuencia de Microsoft, que se encuentra en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos. El Visor de clústeres de secuencia de Microsoft contiene cinco fichas: Diagrama del clúster, Perfiles del clúster, Características del clúster, Distinción delclúster y Transiciones de estado. Para obtener más información acerca de cómo utilizar este visor, vea Ver un modelo de minería de datos con el Visor de clústeres de secuencia de Microsoft.

Ficha Diagrama del clúster

La ficha Diagrama del clúster muestra gráficamente los clústeres que el algoritmo detectó en la base de datos. El diseño del diagrama, en donde clústeres similares se agrupan juntos, representa las relaciones entre los clústeres. De forma predeterminada, el sombreado del color del nodo representa la densidad de todos los escenarios del clúster (cuanto más oscuro sea el nodo, más escenarios contiene). Puede cambiar el significado del sombreado de los nodos para que represente un atributo y un estado. Por ejemplo, seleccione Model en la lista Variable de sombreado y Cycling Cap en la lista Estado. El diagrama de clúster muestra que el clúster 9 contiene la mayor densidad de gorras de ciclismo (cycling cap).

Ficha Perfiles del clúster

La ficha Perfiles del clúster muestra las secuencias que existen en cada clúster. Los clústeres se enumeran en columnas individuales ubicadas a la derecha de la columna Estados.

En el visor, la fila Model.samples representa datos de secuencia y la fila Model describe la distribución global de los elementos de un clúster. Las líneas de las secuencias de color de cada celda de la fila Model.samples representan el comportamiento de un usuario seleccionado aleatoriamente en el clúster. Cada color de un histograma de secuencia individual representa un modelo de producto.

Por ejemplo, el color celeste del clúster 3 representa la bicicleta Mountain-200. Su presencia como primer color en la mayoría de las secuencias indica que es muy probable que el cliente incluya la bicicleta Mountain-200 en la cesta de la compra en primer lugar.

Ficha Características del clúster

La ficha Características del clúster resume las transiciones entre los estados de un clúster mediante barras que describen la importancia del valor de atributo para el clúster seleccionado. Por ejemplo, en el clúster 10, uno de los perfiles más importantes es que los clientes tienden a incluir una llanta ML Mountain en la cesta de la compra en primer lugar.

Ficha Distinción del clúster

Mediante la ficha Distinción del clúster, puede comparar dos clústeres para determinar los modelos que favorecen a cada uno de ellos. La ficha contiene cuatro columnas: Variables, Valores, Clúster 1 y Clúster 2. Si el clúster favorece un modelo específico, aparecerá una barra azul en las columnas Clúster 1 o Clúster 2 de la fila del modelo correspondiente en la columna Variables. Cuanto más larga sea la barra azul, más favorecerá el modelo al clúster.

Por ejemplo, utilice la ficha Distinción del clúster, ubicada en el visor, para comparar el clúster 2 y el clúster 5 seleccionando clúster 2 en Clúster 1 y clúster 5 en Clúster 2. Un cliente que compra un soporte para botellas para una bicicleta de montaña, tal y como indica Mountain Bottle Cage en la columna Valores, es más probable que esté incluido en el clúster 5; un cliente que compra una llanta, tal y como indica Touring Tire en la columna Valores, es más probable que esté incluido en el clúster 2.

Ficha Transiciones de estado

En la ficha Transiciones de estado, puede seleccionar un clúster y examinar sus transiciones de estado. Cada nodo representa un estado del modelo como, por ejemplo, Mountain-200. Una línea representa la transición entre estados y cada nodo se basa en la probabilidad de una transición. El color de fondo representa la frecuencia del nodo dentro del clúster.

Por ejemplo, seleccione Clúster 3 en Clúster, seleccione el nodo Touring-3000 y desplace el control deslizante Todos los vínculos hacia abajo varios espacios. Como podrá ver en el visor, si un cliente incluye una llanta (Touring Tire) en la cesta de la compra, hay una probabilidad de 0,63 (indicada por la flecha azul) de que a continuación incluya un tubo para llantas (Touring Tire Tube) en la cesta y una probabilidad de 0,26 de que también incluya una bicicleta Sport 100.