Exploration des modèles d'analyse de panier (Didacticiel intermédiaire sur l'exploration de données)

 

S’applique à : SQL Server 2016 Preview

Maintenant que vous avez créé le Association modèle, vous pouvez le parcourir en utilisant le Microsoft visionneuse d’associations dans le visionneuse de modèle d’exploration de données onglet du Concepteur d’exploration de données. Ce didacticiel vous guide dans l'utilisation de la visionneuse pour explorer les relations entre des éléments. La visionneuse vous aide à consulter d'un coup d'œil les produits qui tendent à apparaître ensemble et avoir une idée générale des nouvelles tendances.

Le Microsoft visionneuse d’associations contient trois onglets : règles, jeux d’éléments, et réseau de dépendances. Comme chaque onglet révèle une vue légèrement différente des données, lorsque vous explorez un modèle, vous basculez en général entre les différents volets plusieurs fois pour obtenir des éclaircissements.

  • Onglet réseau de dépendances

  • Onglet jeux d’éléments

  • Onglet règles

  • Vue de contenu générique

Pour ce didacticiel, vous allez démarrer sur le réseau de dépendances onglet, puis utilisez la règles onglet et jeux d’éléments onglet pour approfondir votre compréhension des relations révélé la visionneuse. Vous utiliserez également le visionneuse d’arborescences contenu générique Microsoft pour extraire les statistiques détaillées pour les règles individuelles ou des jeux d’éléments.

Onglet Réseau de dépendances

Avec le réseau de dépendances onglet, vous pouvez étudier l’interaction entre les différents éléments dans le modèle. Chaque nœud dans la visionneuse représente un élément et les lignes entre les éléments représentent des règles. En sélectionnant un nœud, vous pouvez voir les autres nœuds qui prédisent l'élément sélectionné, ou les éléments prédits par ce dernier. Parfois, il existe une association bidirectionnelle entre des éléments, ce qui signifie qu'ils apparaissent souvent dans la même transaction. Vous pouvez vous reporter à la légende de couleur en bas d'onglet pour déterminer la direction de l'association.

Une ligne qui connecte deux éléments indique qu'il est probable que ces éléments apparaissent ensemble dans une transaction. En d'autres termes, il est probable que les clients achètent ces éléments ensemble. Le curseur est associé à la probabilité de la règle. Déplacez le curseur vers le haut ou le bas pour éliminer les associations faibles, c'est à dire les règles avec une faible probabilité.

Le graphique du réseau de dépendances affiche des règles par couple qui peuvent être représentées logiquement sous la forme A->B, ce qui signifie que si le Produit A est acheté, le Produit B est un achat probable. Le graphique ne peut pas afficher de règles de type AB->C. Si vous déplacez le curseur pour afficher toutes les règles sans toutefois pouvoir afficher une ligne dans le graphique, cela signifie qu'aucune règle par couple ne correspond aux critères des paramètres de l'algorithme.

Vous pouvez rechercher également des nœuds par nom en tapant les premières lettres du nom d'attribut. Pour plus d’informations, consultez Boîte de dialogue Rechercher un nœud (visionneuse de modèle d’exploration de données).

Pour ouvrir le mode Association dans la Visionneuse de l'algorithme MAR (Microsoft Association Rules)

  1. Dans l’Explorateur de solutions, double-cliquez sur la structure de l’Association.

  2. Dans le Concepteur d'exploration de données, cliquez sur l'onglet Visionneuse de modèle d'exploration de données .

  3. Sélectionnez l’Association de la liste des modèles d’exploration de données dans le du modèle de Mining liste déroulante.

Pour naviguer dans le graphique des dépendances et localiser des nœuds spécifiques

  1. Dans la visionneuse de modèle d’exploration de données cliquez sur le réseau de dépendances onglet.

  2. Cliquez sur Zoom plusieurs fois, jusqu'à ce que vous pouvez facilement afficher les étiquettes pour chaque nœud.

    Par défaut, le graphique s'affiche avec tous les nœuds visibles. Dans un modèle complexe, il peut y avoir de nombreux nœuds, ce qui réduit la taille de chaque nœud.

  3. Cliquez sur le + connecter dans le coin inférieur droit de la visionneuse et maintenez le bouton de la souris pour déplacer le graphique.

  4. Sur le côté gauche de la visionneuse, faites glisser le curseur vers le bas, déplacement de tous les liens (la valeur par défaut) vers le bas du contrôle slider.

  5. La visionneuse met à jour le graphique pour n'afficher désormais que l'association la plus forte entre les éléments Touring Tire (Pneu pour vélo de tourisme) et Touring Tire Tube (chambre à air pour vélo de tourisme).

  6. Cliquez sur le nœud intitulé Touring Tire Tube = Existing.

    Le graphique est mis à jour pour mettre en surbrillance uniquement les éléments ayant une forte relation avec cet élément. Notez la direction de la flèche entre les deux éléments.

  7. Sur le côté gauche de la visionneuse, faites glisser encore le curseur vers le haut, en le déplaçant du bas vers le milieu.

    Notez les modifications dans la flèche qui connecte les deux éléments.

  8. Sélectionnez nom de l’attribut afficher uniquement dans la liste déroulante en haut du volet réseau de dépendances.

    Les intitulés de texte dans le graphique sont mis à jour pour afficher uniquement le nom de modèle.

Retour au début

Onglet Jeux d'éléments

Ensuite, vous approfondirez vos connaissances des règles et des jeux d'éléments générés par le modèle pour les produits Touring Tire et Touring Tire Tube. Le jeux d’éléments onglet affiche trois informations importantes qui se rapportent à des jeux d’éléments qui le Microsoft algorithme Association détecte :

  • **Prise en charge :**le nombre de transactions dans lequel le jeu d’éléments se produit.

  • **Taille :**le nombre d’éléments dans le jeu d’éléments.

  • **Éléments :**une liste des éléments inclus dans chaque jeu d’éléments.

En fonction de la manière dont les paramètres d'algorithme sont définis, l'algorithme peut générer un grand nombre de jeux d'éléments. Chaque jeu d'éléments retourné dans la visionneuse représente des transactions dans lesquelles l'élément a été vendu. En utilisant les contrôles en haut de la jeux d’éléments onglet, vous pouvez filtrer la visionneuse pour afficher uniquement les jeux d’éléments qui contiennent une taille de jeu d’éléments et de prise en charge minimale spécifiée.

Si vous utilisez un modèle d'exploration de données différent et qu'aucun jeu d'éléments n'est répertorié, cela signifie qu'aucun jeu d'éléments n'a répondu aux critères des paramètres d'algorithme. Dans ce scénario, vous pouvez modifier les paramètres d'algorithme pour autoriser les jeux d'éléments dont la prise en charge est plus faible.

Pour filtrer par nom les jeux d'éléments affichés dans la visionneuse

  1. Cliquez sur le jeux d’éléments onglet de la visionneuse.

  2. Dans la jeu d’éléments de filtre tapez Touring Tire, puis cliquez en dehors de la zone.

    Le filtre retourne tous les éléments qui contiennent cette chaîne.

  3. Dans la Afficher liste, sélectionnez Afficher uniquement les nom d’attribut.

  4. Sélectionnez le nom long Show case à cocher.

    La liste des jeux d'éléments est mise à jour pour afficher uniquement les jeux d'éléments qui contiennent la chaîne Touring Tire. Le nom long du jeu d'éléments inclut le nom de la table qui contient l'attribut et la valeur pour chaque élément.

  5. Désactivez le nom long Show case à cocher.

    La liste des jeux d'éléments est mise à jour pour afficher uniquement le nom court.

Les valeurs dans le prise en charge colonne indiquent le nombre de transactions pour chaque jeu d’éléments. Une transaction pour un jeu d'éléments signifie un achat qui comprend tous les éléments dans le jeu d'éléments.

Par défaut, la visionneuse répertorie les jeux d'éléments par ordre décroissant de prise en charge. Vous pouvez cliquer sur les en-têtes de colonne pour trier par une colonne différente, telle que la taille ou le nom du jeu d'éléments. Si vous souhaitez en savoir plus sur les transactions individuelles incluses dans un jeu d'éléments, vous pouvez extraire les cas individuels à partir des jeux d'éléments. Les colonnes de structure dans les résultats d'extraction sont le niveau de revenu du client et l'ID du client qui n'étaient pas été utilisés dans le modèle.

Pour consulter les détails d'un jeu d'éléments

  1. Dans la liste des jeux d’éléments, cliquez sur le jeu d’éléments en-tête de colonne pour trier par nom.

  2. Localisez l’élément, Touring Tire (avec sans deuxième élément).

  3. Cliquez sur l’élément, Touring Tire, sélectionnez extraire, puis sélectionnez modèle et les colonnes de la Structure.

    Le extraire boîte de dialogue affiche les transactions individuelles utilisées en tant que la prise en charge pour ce jeu d’éléments.

  4. Développez la table imbriquée, vAssocSeqLineItems, pour consulter la liste réelle des achats dans la transaction.

Pour filtrer les jeux d'éléments par prise en charge ou taille

  1. Effacez le texte qui peut être dans le jeu d’éléments de filtre boîte. Vous ne pouvez pas utiliser un filtre de texte avec un filtre numérique.

  2. Dans la prise en charge minimale tapez 100 et puis cliquez sur l’arrière-plan de la visionneuse.

    La liste des jeux d'éléments est mise à jour pour afficher uniquement les jeux d'éléments avec une prise en charge d'au moins 100.

Retour au début

Onglet Règles

Le règles onglet affiche les informations suivantes liées aux règles que l’algorithme de recherche.

  • **Probabilité :**le probabilité d’une règle, définie comme la probabilité de l’élément de droite avec l’élément côté gauche.

  • **Importance :**une mesure de l’utilité d’une règle. Une valeur supérieure signifie une meilleure règle.

    L'importance est indiquée pour vous aider à mesurer l'utilité d'une règle, car se baser uniquement sur la probabilité peut porter à confusion. Par exemple, si chaque transaction contient une bouteille d'eau-- la bouteille d'eau est peut-être ajoutée automatiquement au chariot de chaque client dans le cadre d'une promotion--le modèle peut créer une règle qui prédit que la bouteille d'eau a une probabilité de 1. En tenant compte de la probabilité uniquement, cette règle est exacte, mais elle ne fournit pas d'informations utiles.

  • **Règle :**la définition de la règle. Pour un modèle d'analyse de panier, une règle décrit une combinaison spécifique d'éléments.

Chaque règle peut être utilisée pour prévoir la présence d'un élément dans une transaction en se basant sur la présence d'autres éléments. Comme dans le jeux d’éléments onglet, vous pouvez filtrer les règles pour qu’uniquement les règles les plus intéressantes sont affichés. Si vous utilisez un modèle d'exploration de données qui n'a pas de règles, vous pouvez modifier les paramètres d'algorithme pour abaisser le seuil de probabilité des règles.

Pour n'afficher que les règles qui incluent le vélo Mountain-200

  1. Dans la visionneuse de modèle d’exploration de données cliquez sur le règles onglet.

  2. Dans la règle de filtre entrez VTT-200.

    Désactivez le nom long Show case à cocher.

  3. À partir de la Afficher liste, sélectionnez Afficher uniquement les nom d’attribut.

    La visionneuse s’affichera uniquement les règles qui contiennent les mots «VTT-200». La probabilité de la règle vous indique quelle est la probabilité que lorsqu’un utilisateur achète un VTT-200 bicyclettes, cette personne achètera également l’autre produit répertorié.

Les règles sont classées par probabilité en ordre décroissant, mais vous pouvez cliquer sur les en-têtes de colonnes pour modifier l'ordre de tri. Pour en savoir plus sur une règle particulière, vous pouvez utiliser l'extraction pour consulter les cas de prise en charge.

Pour consulter des cas qui prennent en charge une règle particulière

  1. Dans la règles onglet, avec le bouton droit de la règle que vous souhaitez afficher.

  2. Sélectionnez extraire, puis sélectionnez colonnes de modèle uniquement, ou modèle et les colonnes de la Structure.

    Le extraire boîte de dialogue fournit un résumé de la règle en haut du volet et une liste de tous les cas qui ont été utilisés en tant que données de prise en charge pour la règle.

Retour au début

Visionneuse de l'arborescence de contenu générique

Cette visionneuse peut être utilisée pour tous les modèles, quels que soient l'algorithme ou le type de modèle. Le visionneuse d’arborescences contenu générique Microsoft est disponible à partir de la visionneuse liste déroulante.

Une arborescence de contenu est une représentation d'un modèle d'exploration de données sous forme de série de nœuds, où chaque nœud représente ce qui a été appris sur certains sous-ensembles des données. Le nœud peut contenir un modèle, un ensemble de règles, un cluster ou la définition d'une plage de dates qui partagent certaines caractéristiques. Le contenu exact du nœud diffère selon l'algorithme et le type de l'attribut prédictible, mais la représentation générale du contenu reste la même. Vous pouvez développer chaque nœud pour voir des informations de plus en plus détaillées et copier le contenu de n'importe quel nœud vers le Presse-papiers.

Pour consulter des détails sur la règle en utilisant la visionneuse de contenu

  1. Dans la visionneuse de modèle d’exploration de données onglet, sélectionnez visionneuse d’arborescences contenu générique Microsoft à partir de la visionneuse liste.

  2. Dans le volet Légende du nœud, faites défiler vers le bas de la liste et cliquez sur le dernier nœud.

    La visionneuse affiche d'abord les jeux d'éléments et les règles ensuite, mais elle ne les groupe pas. La méthode la plus simple pour rechercher un nœud spécifique est de créer une requête de contenu. Pour plus d’informations, consultez Exemples de requête de modèle d’association.

  3. Dans le volet Détails du nœud, examinez la valeur pour NODE_TYPE et NODE_DESCRIPTION.

    Un type de nœud de 8 est une règle, et un type de nœud de 7 est un jeu d'éléments. Pour une règle, la valeur NODE_DESCRIPTION vous indique les conditions qui composent la règle. Pour un jeu d'éléments, la valeur NODE_DESCRIPTION vous indique les éléments inclus dans le jeu d'éléments.

Vous pouvez créer également une requête de contenu pour obtenir des statistiques détaillées sur les règles. Pour plus d’informations sur le contenu du modèle d’exploration de données et comment interpréter, consultez contenu du modèle d’exploration de données pour les modèles d’Association &#40 ; Analysis Services - Exploration de données &#41 ;.

Retour au début

Tâche suivante de la leçon

Filtrage d’une Table imbriquée dans un modèle d’exploration de données &#40 ; didacticiel d’exploration de données intermédiaires &#41 ;

Voir aussi

Leçon 3 : Génération d’un scénario de panier d’achat (Didacticiel sur l’exploration de données intermédiaire)
Leçon 4 : Création d’un scénario de cluster de séquence &#40 ; didacticiel d’exploration de données intermédiaires &#41 ;
Algorithme Microsoft Association
Références techniques relatives à l'algorithme Microsoft Association