Affichage d'un modèle d'exploration de données à l'aide de la Visionneuse de l'algorithme MSC (Microsoft Sequence Clustering)

La Visionneuse de l'algorithme MSC (Microsoft Sequence Clustering) de Microsoft SQL Server Analysis Services affiche les modèles d'exploration de données qui sont générés avec l'algorithme MSC (Microsoft Sequence Clustering). L'algorithme MSC (Microsoft Sequence Clustering) est un algorithme d'analyse de séquence conçu pour l'exploration des données qui contiennent des événements pouvant être liés par des chemins d'accès consécutifs, ou séquences. Pour plus d'informations sur cet algorithme, consultez Algorithme MSC (Microsoft Sequence Clustering).

Notes

La visionneuse d'arborescences de contenu générique Microsoft permet de consulter des informations détaillées relatives aux équations utilisées dans le modèle et les motifs découverts. Pour plus d'informations, consultez Affichage des détails de modèle avec la Visionneuse de l'arborescence de contenu générique Microsoft ou Visionneuse de l'arborescence de contenu générique Microsoft (Concepteur d'exploration de données).

Notes

La visionneuse de l'algorithme MSC (Microsoft Sequence Clustering) fournit des fonctionnalités et des options similaires à celles de Microsoft Cluster Viewer. Pour plus d'informations, consultez Affichage d'un modèle d'exploration de données à l'aide de Microsoft Cluster Viewer.

Onglets Visionneuse

Lorsque vous parcourez un modèle d'exploration de données dans Analysis Services, le modèle s'affiche sous l'onglet Visionneuse de modèle d'exploration de données du Concepteur d'exploration de données, à l'aide de la visionneuse appropriée pour ce modèle. La Visionneuse de l'algorithme MSC (Microsoft Sequence Clustering) fournit les onglets suivants pour explorer les modèles d'exploration de données MSC :

  • Diagramme de cluster

  • Profils du cluster

  • Caractéristiques du cluster

  • Discrimination de cluster

  • Transitions d'état

Diagramme de cluster

L'onglet Diagramme de cluster de la Visionneuse de l'algorithme MSC (Microsoft Sequence Clustering) affiche tous les clusters se trouvant dans un modèle d'exploration de données. L'ombrage de la ligne reliant un cluster à un autre représente le niveau de similarité des clusters. Si l'ombrage est clair ou inexistant, les clusters ne sont pas très similaires. Plus la ligne est sombre, plus la similarité des liens est grande. Vous pouvez modifier le nombre de lignes affichées par la visionneuse à l'aide du curseur situé à droite des clusters. Si vous déplacez le curseur vers le bas, seuls les liens les plus forts sont affichés.

Par défaut, l'ombre représente le remplissage du cluster. À l'aide des options Variabled'ombrage et État, vous pouvez sélectionner la paire attribut-état que l'ombrage représente. Plus l'ombrage est sombre, plus la distribution d'attribut est grande pour un état spécifique. Inversement, plus l'ombrage est clair, plus la distribution diminue.

Pour renommer un cluster, cliquez avec le bouton droit sur son nœud et sélectionnez Renommer le cluster. Le nouveau nom est enregistré sur le serveur.

Pour copier la partie visible du diagramme dans le Presse-papiers, cliquez sur Copier la vue du graphique. Pour copier l'intégralité du diagramme, cliquez sur Copier le graphique entier. Vous pouvez également faire un zoom avant et arrière à l'aide des boutons Zoom avant et Zoom arrière ou vous pouvez ajuster le diagramme à la taille de l'écran à l'aide de Ajuster le diagramme à la fenêtre.

Retour en haut

Profils du cluster

L'onglet Profils du cluster fournit une vue d'ensemble des clusters créés par l'algorithme de votre modèle. Chacune des colonnes situées après la colonne Remplissage dans la grille représente un cluster qui a été découvert par le modèle. La ligne <attribut>.samples représente les différentes séquences de données existant dans le cluster tandis que la ligne <attribut> décrit tous les éléments contenus dans le cluster et leur distribution globale.

L'option Barres de l'histogramme contrôle le nombre de barres qui sont visibles dans l'histogramme. Si le nombre réel de barres est supérieur au nombre de barres à afficher, les barres les plus importantes sont conservées et le reste des barres est regroupé dans un compartiment gris.

Vous pouvez modifier le nom par défaut des clusters afin de définir des noms plus descriptifs. Pour renommer un cluster, cliquez avec le bouton droit sur son en-tête de colonne et sélectionnez Renommer le cluster. Vous pouvez masquer des clusters en sélectionnant Masquer la colonne et vous pouvez aussi faire glisser des colonnes afin de changer l'ordre dans lequel elles apparaissent dans la visionneuse.

Pour ouvrir une fenêtre fournissant une vue plus détaillée et plus grande des clusters, double-cliquez soit sur une cellule de la colonne États, soit sur un histogramme dans la visionneuse.

Retour en haut

Caractéristiques du cluster

Pour utiliser l'onglet Caractéristiques du cluster, sélectionnez un cluster dans la liste Cluster. Après avoir sélectionné un cluster, vous pouvez examiner les caractéristiques qui composent ce cluster spécifique. Les attributs contenus dans le cluster sont répertoriés dans les colonnes Variables et l'état de l'attribut répertorié est répertorié dans la colonne Valeurs. Les états d'attribut apparaissent par ordre d'importance, en fonction de leur probabilité d'apparition dans le cluster. La probabilité est indiquée dans la colonne Probabilité.

Retour en haut

Discrimination de cluster

Vous pouvez utiliser l'onglet Discrimination de cluster pour comparer les attributs entre deux clusters afin de déterminer la manière dont les éléments d'une séquence privilégient un cluster par rapport à l'autre. Utilisez les listes Cluster 1 et Cluster 2 pour sélectionner les clusters à comparer. La visionneuse détermine les différences les plus importantes entre les clusters et affiche, par ordre d'importance, les états d'attribut associés à ces différences. Une barre à droite de l'attribut indique quel cluster est privilégié par l'état et la taille de la barre indique à quel point l'état privilégie le cluster.

Retour en haut

Transitions d'état

En sélectionnant un cluster sous l'onglet Transitions d'état, vous pouvez parcourir les transitions entre les états de séquence dans le cluster sélectionné. Chaque nœud figurant dans la visionneuse représente un état de la colonne de séquence. Une flèche représente une transition entre deux états et la probabilité associée à la transition. Si une transition revient au nœud d'origine, une flèche peut repointer vers le nœud d'origine.

Une flèche provenant d'un point représente la probabilité que le nœud est le début d'une séquence. Une extrémité de fin menant à une valeur NULL représente la probabilité que le nœud est la fin de la séquence.

Vous pouvez filtrer l'extrémité des nœuds à l'aide du curseur à gauche de l'onglet.

Retour en haut