Exploration des modèles d'analyse de panier (Didacticiel intermédiaire sur l'exploration de données)

Maintenant que vous avez créé le modèle Association, vous pouvez le parcourir en utilisant la visionneuse d'associations Microsoft dans l'onglet Visionneuse de modèle d'exploration de données du Concepteur d'exploration de données. Ce didacticiel vous guide dans l'utilisation de la visionneuse pour explorer les relations entre des éléments. La visionneuse vous aide à consulter d'un coup d'œil les produits qui tendent à apparaître ensemble et avoir une idée générale des nouvelles tendances.

La Visionneuse d'associations Microsoft contient trois onglets : Règles, Jeux d'éléments et Réseau de dépendances. Comme chaque onglet révèle une vue légèrement différente des données, lorsque vous explorez un modèle, vous basculez en général entre les différents volets plusieurs fois pour obtenir des éclaircissements.

  • Onglet Réseau de dépendances

  • Onglet Jeux d'éléments

  • Onglet Règles

  • Vue de contenu générique

Pour ce didacticiel, vous allez démarrer sur l'onglet Réseau de dépendances, puis utiliser l'onglet Règles et l'onglet Jeux d'éléments pour approfondir votre compréhension des relations que révèle la visionneuse. Vous utiliserez également la Visionneuse de l'arborescence de contenu générique Microsoft pour extraire des statistiques détaillées pour les règles individuelles ou les jeux d'éléments.

Onglet Réseau de dépendances

Dans l'onglet Réseau de dépendances, vous pouvez étudier l'interaction entre les différents éléments du modèle. Chaque nœud dans la visionneuse représente un élément et les lignes entre les éléments représentent des règles. En sélectionnant un nœud, vous pouvez voir les autres nœuds qui prédisent l'élément sélectionné, ou les éléments prédits par ce dernier. Parfois, il existe une association bidirectionnelle entre des éléments, ce qui signifie qu'ils apparaissent souvent dans la même transaction. Vous pouvez vous reporter à la légende de couleur en bas d'onglet pour déterminer la direction de l'association.

Une ligne qui connecte deux éléments indique qu'il est probable que ces éléments apparaissent ensemble dans une transaction. En d'autres termes, il est probable que les clients achètent ces éléments ensemble. Le curseur est associé à la probabilité de la règle. Déplacez le curseur vers le haut ou le bas pour éliminer les associations faibles, c'est à dire les règles avec une faible probabilité.

Le graphique du réseau de dépendances affiche des règles par couple qui peuvent être représentées logiquement sous la forme A->B, ce qui signifie que si le Produit A est acheté, le Produit B est un achat probable. Le graphique ne peut pas afficher de règles de type AB->C. Si vous déplacez le curseur pour afficher toutes les règles sans toutefois pouvoir afficher une ligne dans le graphique, cela signifie qu'aucune règle par couple ne correspond aux critères des paramètres de l'algorithme.

Vous pouvez rechercher également des nœuds par nom en tapant les premières lettres du nom d'attribut. Pour plus d'informations, consultez Boîte de dialogue Rechercher un nœud (vue Visionneuse de modèle d'exploration de données).

Pour ouvrir le mode Association dans la Visionneuse de l'algorithme MAR (Microsoft Association Rules)

  1. Dans l'Explorateur de solutions, double-cliquez sur la structure Association.

  2. Dans le Concepteur d'exploration de données, cliquez sur l'onglet Visionneuse de modèle d'exploration de données.

  3. Sélectionnez Association dans la liste des modèles d'exploration de données dans la liste déroulante Modèle d'exploration de données.

Pour naviguer dans le graphique des dépendances et localiser des nœuds spécifiques

  1. Dans la Visionneuse de modèle d'exploration de données, cliquez sur l'onglet Réseau de dépendances.

  2. Cliquez sur Zoom avant plusieurs fois jusqu'à ce que vous puissiez consulter facilement les intitulés pour chaque nœud.

    Par défaut, le graphique s'affiche avec tous les nœuds visibles. Dans un modèle complexe, il peut y avoir de nombreux nœuds, ce qui réduit la taille de chaque nœud.

  3. Cliquez sur le signe + dans le coin inférieur droit de la visionneuse et maintenez le bouton de la souris enfoncé pour faire le tour du graphique.

  4. Sur le côté gauche de la visionneuse, faites glisser le curseur vers le bas, en le déplaçant de Tous les liens (valeur par défaut) vers le bas du contrôle Slider.

  5. La visionneuse met à jour le graphique pour n'afficher désormais que l'association la plus forte entre les éléments Touring Tire (Pneu pour vélo de tourisme) et Touring Tire Tube (chambre à air pour vélo de tourisme).

  6. Cliquez sur le nœud intitulé Touring Tire Tube = Existing.

    Le graphique est mis à jour pour mettre en surbrillance uniquement les éléments ayant une forte relation avec cet élément. Notez la direction de la flèche entre les deux éléments.

  7. Sur le côté gauche de la visionneuse, faites glisser encore le curseur vers le haut, en le déplaçant du bas vers le milieu.

    Notez les modifications dans la flèche qui connecte les deux éléments.

  8. Sélectionnez Afficher le nom de l'attribut uniquement dans la liste déroulante en haut du volet Réseau de dépendances.

    Les intitulés de texte dans le graphique sont mis à jour pour afficher uniquement le nom de modèle.

Retour en haut

Onglet Jeux d'éléments

Ensuite, vous approfondirez vos connaissances des règles et des jeux d'éléments générés par le modèle pour les produits Touring Tire et Touring Tire Tube. L'onglet Jeux d'éléments affiche trois informations importantes relatives aux jeux d'éléments que l'algorithme Microsoft Association permet de découvrir :

  • **Prise en charge :    **nombre de transactions dans lesquelles le jeu d'éléments intervient.

  • **Taille :    **nombre d'éléments contenus dans le jeu d'éléments.

  • **Éléments :    **liste des éléments inclus dans chaque jeu d'éléments.

En fonction de la manière dont les paramètres d'algorithme sont définis, l'algorithme peut générer un grand nombre de jeux d'éléments. Chaque jeu d'éléments retourné dans la visionneuse représente des transactions dans lesquelles l'élément a été vendu. En utilisant les contrôles situés en haut de l'onglet Jeux d'éléments, vous pouvez filtrer les informations de la visionneuse pour n'afficher que les jeux d'éléments qui contiennent la prise en charge minimale spécifiée et la taille du jeu d'éléments.

Si vous utilisez un modèle d'exploration de données différent et qu'aucun jeu d'éléments n'est répertorié, cela signifie qu'aucun jeu d'éléments n'a répondu aux critères des paramètres d'algorithme. Dans ce scénario, vous pouvez modifier les paramètres d'algorithme pour autoriser les jeux d'éléments dont la prise en charge est plus faible.

Pour filtrer par nom les jeux d'éléments affichés dans la visionneuse

  1. Cliquez sur l'onglet Jeux d'éléments de la visionneuse.

  2. Dans la zone Filtrer le jeu d'éléments, tapez Touring Tire, puis cliquez à l'extérieur de la zone.

    Le filtre retourne tous les éléments qui contiennent cette chaîne.

  3. Dans la liste Afficher, sélectionnez Afficher le nom de l'attribut uniquement.

  4. Activez la case à cocher Afficher le nom long.

    La liste des jeux d'éléments est mise à jour pour afficher uniquement les jeux d'éléments qui contiennent la chaîne Touring Tire. Le nom long du jeu d'éléments inclut le nom de la table qui contient l'attribut et la valeur pour chaque élément.

  5. Désactivez la case à cocher Afficher le nom long.

    La liste des jeux d'éléments est mise à jour pour afficher uniquement le nom court.

Les valeurs dans la colonne Prise en charge indiquent le nombre de transactions pour chaque jeu d'éléments. Une transaction pour un jeu d'éléments signifie un achat qui comprend tous les éléments dans le jeu d'éléments.

Par défaut, la visionneuse répertorie les jeux d'éléments par ordre décroissant de prise en charge. Vous pouvez cliquer sur les en-têtes de colonne pour trier par une colonne différente, telle que la taille ou le nom du jeu d'éléments. Si vous souhaitez en savoir plus sur les transactions individuelles incluses dans un jeu d'éléments, vous pouvez extraire les cas individuels à partir des jeux d'éléments. Les colonnes de structure dans les résultats d'extraction sont le niveau de revenu du client et l'ID du client qui n'étaient pas été utilisés dans le modèle.

Pour consulter les détails d'un jeu d'éléments

  1. Dans la liste des jeux d'éléments, cliquez sur l'en-tête de colonne Jeu d'éléments pour trier par nom.

  2. Localisez l'élément, Touring Tire (sans deuxième élément).

  3. Cliquez avec le bouton droit sur l'élément Touring Tire, sélectionnez Extraire puis sélectionnez Colonnes de structure et de modèle.

    La boîte de dialogue Extraire affiche les transactions individuelles utilisées pour la prise en charge de ce jeu d'éléments.

  4. Développez la table imbriquée, vAssocSeqLineItems, pour consulter la liste réelle des achats dans la transaction.

Pour filtrer les jeux d'éléments par prise en charge ou taille

  1. Effacez le texte qui peut se trouver dans la zone Filtrer le jeu d'éléments. Vous ne pouvez pas utiliser un filtre de texte avec un filtre numérique.

  2. Dans la zone Prise en charge minimale, tapez 100, puis cliquez sur l'arrière-plan de la visionneuse.

    La liste des jeux d'éléments est mise à jour pour afficher uniquement les jeux d'éléments avec une prise en charge d'au moins 100.

Retour en haut

Onglet Règles

L'onglet Règles affiche les informations associées aux règles découvertes par l'algorithme. Ces informations sont les suivantes :

  • **Probabilité:    **La probabilité d'une règle, définie comme la probabilité de l'élément de la partie droite en fonction de l'élément de la partie gauche.

  • **Importance :    **Degré de l'utilité d'une règle. Une valeur supérieure signifie une meilleure règle.

    L'importance est indiquée pour vous aider à mesurer l'utilité d'une règle, car se baser uniquement sur la probabilité peut porter à confusion. Par exemple, si chaque transaction contient une bouteille d'eau-- la bouteille d'eau est peut-être ajoutée automatiquement au chariot de chaque client dans le cadre d'une promotion--le modèle peut créer une règle qui prédit que la bouteille d'eau a une probabilité de 1. En tenant compte de la probabilité uniquement, cette règle est exacte, mais elle ne fournit pas d'informations utiles.

  • **Règle :    **Définition de la règle. Pour un modèle d'analyse de panier, une règle décrit une combinaison spécifique d'éléments.

Chaque règle peut être utilisée pour prévoir la présence d'un élément dans une transaction en se basant sur la présence d'autres éléments. Tout comme dans l'onglet Jeux d'éléments, vous pouvez filtrer les règles de façon à n'afficher que les plus intéressantes. Si vous utilisez un modèle d'exploration de données qui n'a pas de règles, vous pouvez modifier les paramètres d'algorithme pour abaisser le seuil de probabilité des règles.

Pour n'afficher que les règles qui incluent le vélo Mountain-200

  1. Dans l'onglet Visionneuse de modèle d'exploration de données, cliquez sur l'onglet Règles.

  2. Dans la zone Filtrer la règle, entrez Mountain-200.

    Désactivez la case à cocher Afficher le nom long.

  3. Dans la liste Afficher, sélectionnez Afficher le nom de l'attribut uniquement.

    La visionneuse affiche alors uniquement les règles qui contiennent les mots « Mountain-200 ». La probabilité de la règle vous indique le degré de probabilité de l'achat d'un vélo Mountain-200 par un acheteur, ce dernier achètera également l'autre produit répertorié.

Les règles sont classées par probabilité en ordre décroissant, mais vous pouvez cliquer sur les en-têtes de colonnes pour modifier l'ordre de tri. Pour en savoir plus sur une règle particulière, vous pouvez utiliser l'extraction pour consulter les cas de prise en charge.

Pour consulter des cas qui prennent en charge une règle particulière

  1. Dans l'onglet Règles, cliquez avec le bouton droit sur la règle que vous souhaitez afficher.

  2. Sélectionnez Extraire, puis sélectionnez Colonnes de modèle uniquement ou Colonnes de structure et de modèle.

    La boîte de dialogue Extraire fournit un résumé de la règle en haut du volet, et une liste de tous les cas utilisés comme données associées pour la règle.

Retour en haut

Visionneuse de l'arborescence de contenu générique

Cette visionneuse peut être utilisée pour tous les modèles, quels que soient l'algorithme ou le type de modèle. La Visionneuse de l'arborescence de contenu générique Microsoft est disponible dans la liste déroulante Visionneuse.

Une arborescence de contenu est une représentation d'un modèle d'exploration de données sous forme de série de nœuds, où chaque nœud représente ce qui a été appris sur certains sous-ensembles des données. Le nœud peut contenir un modèle, un ensemble de règles, un cluster ou la définition d'une plage de dates qui partagent certaines caractéristiques. Le contenu exact du nœud diffère selon l'algorithme et le type de l'attribut prévisible, mais la représentation générale du contenu reste la même. Vous pouvez développer chaque nœud pour voir des informations de plus en plus détaillées et copier le contenu de n'importe quel nœud vers le Presse-papiers.

Pour consulter des détails sur la règle en utilisant la visionneuse de contenu

  1. Dans l'onglet Visionneuse de modèle d'exploration de données, sélectionnez Visionneuse de l'arborescence de contenu générique Microsoft dans la liste déroulante Visionneuse.

  2. Dans le volet Légende du nœud, faites défiler vers le bas de la liste et cliquez sur le dernier nœud.

    La visionneuse affiche d'abord les jeux d'éléments et les règles ensuite, mais elle ne les groupe pas. La méthode la plus simple pour rechercher un nœud spécifique est de créer une requête de contenu. Pour plus d'informations, consultez Interrogation d'un modèle d'association (Analysis Services - Exploration de données).

  3. Dans le volet Détails du nœud, examinez la valeur pour NODE_TYPE et NODE_DESCRIPTION.

    Un type de nœud de 8 est une règle, et un type de nœud de 7 est un jeu d'éléments. Pour une règle, la valeur NODE_DESCRIPTION vous indique les conditions qui composent la règle. Pour un jeu d'éléments, la valeur NODE_DESCRIPTION vous indique les éléments inclus dans le jeu d'éléments.

Vous pouvez créer également une requête de contenu pour obtenir des statistiques détaillées sur les règles. Pour plus d'informations sur le contenu d'un modèle d'exploration de données et sur la manière de l'interpréter, consultez Contenu du modèle d'exploration de données pour les modèles d'association (Analysis Services - Exploration de données).

Retour en haut