Compartir a través de


Explorar los modelos Market Basket (tutorial de minería de datos)

Actualizado: 15 de septiembre de 2007

Después de crear el modelo Association, puede explorarlo con el visor de asociación de Microsoft, que se encuentra en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos. Al explorar el modelo, podrá ver fácilmente los productos que tienden a aparecer juntos y explorar las relaciones entre los elementos. También puede filtrar las asociaciones más débiles y obtener una idea general de los patrones emergentes.

El visor de asociación de Microsoft contiene tres fichas: Conjuntos de elementos, Reglas y Red de dependencias. Para obtener más información acerca de este visor, vea Ver un modelo de minería de datos con el Visor de reglas de asociación de Microsoft.

Ficha Conjuntos de elementos

La ficha Conjuntos de elementos muestra tres extractos de información importantes que se relacionan con los conjuntos de elementos que el algoritmo de asociación de Microsoft detecta: el soporte, que es el número de transacciones en las que tiene lugar el conjunto de elementos; el tamaño, que es el número de elementos incluidos en el conjunto; y la composición real del conjunto de elementos. Dependiendo de cómo se configuren los parámetros del algoritmo, éste puede generar un número elevado de conjuntos de elementos. Mediante los controles situados en la parte superior de la ficha Conjuntos de elementos, puede filtrar el visor para que muestre sólo los conjuntos de elementos que tengan un tamaño y un soporte mínimo especificos.

También puede utilizar el cuadro Filtrar conjunto de elementos para filtrar conjuntos de elementos mostrados en el visor. Por ejemplo, para ver sólo los conjuntos de elementos que contienen información acerca de la bicicleta Mountain-200, escriba Mountain-200 en Filtrar conjunto de elementos. Como podrá ver en el visor, sólo se muestran los conjuntos de elementos que contienen la palabra "Mountain-200". Todos los conjuntos de elementos que muestra el visor contienen información sobre las transacciones en las que se vendió una bicicleta Mountain-200. Por ejemplo, el conjunto de elementos que contiene el valor 710 en la columna Soporte indica que, de todas las transacciones, 710 personas que compraron la bicicleta Mountain-200 también compraron el modelo Sport-100.

Ficha Reglas

La ficha Reglas muestra la siguiente información relacionada con las reglas que el algoritmo encuentra.

  • Probabilidad
    Posibilidad de que se produzca una regla.
  • Importancia
    Mide la utilidad de una regla; un valor elevado significa que la regla es mejor. Guiarse sólo por la probabilidad puede conducir a error. Por ejemplo, si todas las transacciones contienen un elemento x, la regla y predice que x tiene una probabilidad de 1, lo que quiere decir que x siempre ocurrirá. Aunque la precisión de la regla es muy buena, no transmite mucha información porque cada transacción contiene x con independencia de y.
  • Regla
    Definición de la regla.

Al igual que con la ficha Conjuntos de datos, puede filtrar las reglas para mostrar sólo las más interesantes. Por ejemplo, si desea ver sólo las reglas que incluyen la bicicleta Mountain-200, escriba Mountain-200 en el cuadro Regla del filtro. A continuación, el visor mostrará sólo las reglas que contengan la palabra "Mountain-200". Cada regla puede utilizarse para predecir la presencia de un elemento de una transacción en función de la presencia de otros elementos. Por ejemplo, la primera regla le dice que cuando alguien compra una bicicleta Mountain-200 y una botella de agua, hay una probabilidad de 1 de que esta persona compre también un soporte para botellas Mountain.

Ficha Red de dependencias

Mediante la ficha Red de dependencias, puede examinar la interacción entre los diferentes elementos del modelo. Cada nodo del visor representa un elemento; por ejemplo, el nodo Mountain-200 = Existing indica que Mountain-200 existe en una transacción. Al seleccionar un nodo, puede utilizar la leyenda de color de la parte inferior de la ficha para establecer los elementos que determinan o son determinados por otros elementos del modelo.

El control deslizante está asociado con la probabilidad de una regla. Muévalo arriba o abajo para filtrar las asociaciones débiles. Por ejemplo, en el cuadro Mostrar, seleccione Mostrar sólo el nombre del atributo y, a continuación, haga clic en el nodo Mountain Bottle Cage. El visor muestra que el soporte para botellas Mountain (Mountain Bottle Cage) predice y, a su vez, es predicho por la botella de agua y la bicicleta Mountain-200. Esto significa que estos elementos aparecerán probablemente juntos en una transacción. En otras palabras, si un cliente compra una bicicleta, es probable que también compre una botella de agua y un soporte para botellas de agua.

Lección siguiente

Lección 5: Crear el escenario de clústeres de secuencia