Exploration du modèle de prévision (Didacticiel sur l'exploration de données intermédiaire)

Article
03/13/2017

S’applique à : SQL Server 2016 Preview

Maintenant que vous avez créé le modèle de prévision d’exploration de données, vous pouvez parcourir les résultats à l’aide de la visionneuse de modèle d’exploration de données onglet du Concepteur d’exploration de données. Le Microsoft temps série visionneuse contient deux onglets : graphiqueset modèle.

En outre, vous pouvez utiliser la visionneuse générique d'arborescences Microsoft avec tous les modèles. Chaque vue présente une image légèrement différente des informations comprises dans le modèle de série chronologique.

Onglet Graphiques
Onglet Modèle
Visionneuse de contenu générique Microsoft

Onglet Graphiques

Le graphiques onglet de la Microsoft temps série visionneuse graphique vous montre chacune des séries, y compris les données d’historique et les prédictions. Chaque ligne dans le graphique de série chronologique représente une combinaison unique de produit, région et attribut prédictible.

La légende à droite de la visionneuse répertorie la série chronologique disponible, en fonction des sélections de la liste déroulante. Vous pouvez cocher et décocher les cases de la légende pour indiquer la série chronologique à afficher dans le graphique.

Vous pouvez également modifier les options d'affichage, telles que les couleurs utilisées pour chaque série chronologique, ou indiquer si les valeurs sont visibles sur les points du graphique.

Pour sélectionner une série chronologique

Cliquez sur le graphiques onglet de la visionneuse de modèle d’exploration de données onglet, s’il n’est pas visible.
Cliquez sur la liste déroulante située à droite du graphique, puis activez toutes les cases à cocher. Cliquez sur OK.

Le graphique doit à présent contenir 24 lignes de série différentes.
Dans les cases à cocher à droite du graphique, désactivez les cases pour masquer temporairement les lignes de toutes les séries sont basées sur la quantité.

Maintenant, désactivez les cases à cocher en rapport avec les vélos R750 et R250.

Le graphique contient à présent uniquement les 6 lignes de série suivantes, afin que vous puissiez plus facilement comparer les tendances des vélos M200 et T1000.
- M200 Europe: Quantity
- M200 North America: Quantity
- M200 Pacific: Quantity
- T1000 Europe: Quantity
- T1000 North America: Quantity
- T1000 Pacific: Quantity

Prédiction de la quantité des séries M200 et T1000

Le graphique affiché dans cette visionneuse comprend à la fois des données historiques et des données prédites. Les données prédites sont ombrées pour les distinguer des données historiques. Pour simplifier la comparaison de séries différentes, vous pouvez également modifier les couleurs associées à chaque ligne dans le graphique. Pour plus d’informations, consultez Modifier les couleurs utilisées dans la visionneuse d’exploration de données.

Les lignes de tendance indiquent que le total des ventes enregistré pour toutes les régions est globalement croissant, avec une pointe tous les 12 mois, en décembre. En examinant le graphique, vous pouvez également remarquer que les données pour les vélos T1000 démarrent beaucoup plus tard que celles des séries des autres produits. Ceci est dû au fait qu'il s'agit d'un produit plus récent, mais puisque cette série est basée sur beaucoup moins de données, les prédictions peuvent ne pas être aussi précises.

Par défaut, cinq étapes de prédiction sont affichées pour chaque série chronologique, affichées sous la forme de lignes en pointillés. Vous pouvez modifier cette valeur pour afficher plus ou moins de prédictions. Vous pouvez également afficher graphiquement l'écart type des prédictions en ajoutant des barres d'erreur au graphique.

Pour modifier les options de prédiction et d'affichage dans la vue Graphique

Essayez de modifier la valeur de étapes de prédiction progressivement à partir de 5 à 10, puis revenez à 6.

Lorsque les données historiques fluctuent beaucoup, ces fluctuations ont tendance à se répéter ou même à s'amplifier lorsque vous augmentez le nombre de prédictions. Vous devrez éventuellement faire des recherches à ce stade, pour comprendre la cause de l'importance de l'augmentation des données historiques, puis choisir d'accepter ces résultats, de rechercher un certain type de correction des données sources, ou d'appliquer un certain type de lissage dans le modèle.
Sélectionnez le Afficher les écarts case à cocher.

Cette option affiche l'estimation de la marge d'erreur pour chaque valeur prédite.
Notez l'échelle de l'axe des X. Les modifications portant sur les données historiques et prédites sont toujours exprimées en pourcentage, mais les valeurs réelles sont ajustées automatiquement pour correspondre à toutes les valeurs présentées sur le graphique. Vous devez donc être vigilant lorsque vous comparez les modèles à ne pas compter uniquement sur les visuels. Pour obtenir la valeur, ou le pourcentage d’augmentation ou de prédictions, placez la souris sur la ligne en pointillés ou les lignes pleines, ou cliquez sur les lignes pour afficher les valeurs dans le légende d’exploration de données.

Conseil: si le légende d’exploration de données n’est pas visible, basculez vers modèle Afficher, cliquez sur n’importe quel nœud, puis sélectionnez Afficher la légende.

Une fois ces tendances consultées, vous vous inquiétez du manque de données pour une partie de la série et vous vous demandez si vous pouvez obtenir des prédictions plus fiables en faisant la moyenne des ventes par modèle ou peut-être en calculant la moyenne des ventes par région. Vous allez explorer cette approche lors d'une leçon ultérieure de ce didacticiel.

Retour au début

Onglet Modèle

Le modèle onglet de la Microsoft temps série visionneuse dans le Concepteur d’exploration de données vous permet d’afficher le modèle de prévision sous la forme d’un graphique d’arbre.

D'abord, notez qu'en raison de la description faite par vos données de deux mesures différentes (Montant et Quantité) pour les ventes de plusieurs lignes de produits (T1000, etc.) dans trois régions différentes (Europe, Amérique du Nord, et Pacifique), le modèle que vous avez généré contient réellement 24 arborescences différentes, chacune représentant un modèle des modèles de ventes pour une autre combinaison de région, produit, et attribut prédictible.

Vous pouvez choisir la combinaison de la gamme de produits, région et mesures de ventes que vous souhaitez afficher en sélectionnant une série de le arborescence liste déroulante de la modèle onglet.

Que pouvez-vous donc apprendre à partir de l'affichage du modèle sous forme d'arborescence ? Par exemple, comparons deux modèles, un qui dispose de plusieurs niveaux dans l'arborescence et un qui dispose d'un nœud unique.

Lorsqu'un graphique d'arborescence contient un nœud unique, cela signifie que la tendance trouvée dans le modèle est principalement homogène avec le temps. Vous pouvez utiliser ce nœud unique, intitulé tous les, pour afficher la formule qui décrit la relation entre les variables d’entrée et le résultat.
Lorsqu'un graphique d'arbre pour une série chronologique a plusieurs branches, cela signifie que la série chronologique qui a été détectée est trop complexe pour être représentée sous la forme d'une équation unique. En revanche, le graphique d’arborescence peut contenir plusieurs branches, chaque branche libellée avec les conditions qui ont provoqué l’arbre Fractionner. Lorsque l'arborescence se fractionne, chaque branche représente un segment de temps différent, à l'intérieur duquel la tendance peut être décrite comme une équation unique.

Par exemple, si vous examinez le graphique et que vous voyez une augmentation soudaine du volume des ventes depuis un jour de septembre et continue jusqu’aux fêtes, vous pouvez basculer vers le modèle pour afficher la date exacte où la tendance a changé. Les branches de l'arborescence qui représentent « avant septembre » et « après septembre » contiendraient des formules différentes : une formule qui décrit mathématiquement les tendances des ventes jusqu'au fractionnement, et une autre formule qui décrit les tendances des ventes pour septembre jusqu'aux fêtes de fin d'année.

Pour explorer l'arbre de décision d'un modèle de série chronologique

Dans la arborescence liste sur la modèle onglet de la visionneuse, sélectionnez le T1000 Europe : quantité série.

Cliquez sur le nœud intitulé tous les.

Pour une tous les nœud, l’info-bulle qui apparaît inclut des informations telles que le nombre de cas dans la série entière et des équations de série chronologique dérivées de l’analyse des données.
Si le légende d’exploration de données n’est pas visible, cliquez sur le nœud et sélectionnez Afficher la légende.

Le légende d’exploration de données fournit les mêmes informations qui se trouve dans l’info-bulle. Si l'une de vos variables indépendantes est discrète, vous verrez également un histogramme indiquant la distribution des variables dans le nœud.
Sélectionnez à présent une série chronologique différente à afficher. À l’aide de la arborescence liste sur la modèle onglet de la visionneuse, sélectionnez le M200 North America : quantité série.

Le graphique d’arbre contient maintenant une tous les nœud et deux nœuds enfants. En examinant les étiquettes situées sur les nœuds enfants, vous pouvez comprendre le degré de modification de la ligne de tendance.

Pour chaque nœud enfant, la description dans la légende d’exploration de données inclut également le nombre de cas dans chaque branche de l’arborescence.

La liste suivante décrit certaines fonctionnalités supplémentaires de la visionneuse d'arborescence :

Vous pouvez modifier la variable qui est représentée dans le graphique à l’aide de la en arrière-plan contrôle. Par défaut, les nœuds plus sombres contiennent plus de cas, étant donné que la valeur de en arrière-plan est définie sur remplissage. Pour voir uniquement le nombre de cas dans un nœud, placez la souris sur un nœud et afficher l’info-bulle qui s’affiche, ou cliquez sur le nœud et afficher les nombres dans les légende du nœud fenêtre.
La formule de régression du nœud peut également être affichée dans l'info-bulle ou en cliquant sur le nœud. Si vous avez créé un modèle mixte, vous pouvez voir deux formules, une pour ARTXP (dans les nœuds terminaux) et une pour ARIMA (dans le nœud racine de l'arborescence).
Les petits losanges sont utilisés dans les nœuds qui représentent des nombres continus. La plage des attributs s'affiche dans la barre sur laquelle le losange est situé. Le losange est centré sur la moyenne du nœud et la largeur du losange représente la variance de l'attribut sur ce nœud.

Retour au début

Visionneuse de l'arborescence de contenu générique (facultative)

Outre la visionneuse personnalisée pour les séries chronologiques, Analysis Services fournit le visionneuse d’arborescence de contenu MicrosoftGeneric pour une utilisation avec tous les modèles d’exploration de données. Cette visionneuse offre quelques avantages :

Visionneuse de série heure: cette vue fusionne les résultats des deux algorithmes. Bien que vous puissiez afficher chaque série séparément, vous ne pouvez pas déterminer comment les résultats de chaque algorithme ont été combinés. De plus, dans cette vue, les info-bulles et la légende d'exploration de données affichent uniquement les statistiques les plus importantes.
Visionneuse d’arborescence de contenu générique: vous permet de parcourir et d’afficher toutes les séries de données qui ont été utilisés dans le modèle à la fois et si vous avez créé une combinaison de modèle, à la fois ARIMA et arbres ARTXP sont affichées dans le même graphique.

Vous pouvez utiliser cette visionneuse pour obtenir toutes les statistiques des deux algorithmes, ainsi que les distributions des valeurs.

Recommandé pour les utilisateurs expérimentés de l'exploration de données qui souhaitent en savoir plus sur les analyses ARIMA et ARTXP.

Pour consulter des détails pour une série de données particulière dans la visionneuse de contenu générique

Dans la visionneuse de modèle d’exploration de données onglet, sélectionnez visionneuse d’arborescences contenu générique Microsoft à partir de la visionneuse liste déroulante.
Dans la légende du nœud volet, cliquez sur le premier nœud (tout).
Dans la Détails du nœud volet, afficher la valeur de ATTRIBUTE_NAME.

Cette valeur vous indique quelle série, ou combinaison de produit et région, est contenue dans ce nœud. Dans l'exemple AdventureWorks, le nœud de premier niveau correspond à la série M200 Europe.
Dans la légende du nœud volet, localisez le premier nœud qui a des nœuds enfants.

Si un nœud de série a des enfants, l’arborescence qui s’affiche sur la modèle onglet de la visionneuse de série heure Microsoft sera ont également une structure de branches.
Développez le nœud et cliquez sur l'un des nœuds enfants.

La colonne NODE_DESCRIPTION du schéma contient la condition qui a provoqué le fractionnement de l'arborescence.
Dans la légende du nœud volet, cliquez sur le nœud ARIMA de premier niveau, puis développez le nœud jusqu'à ce que tous les nœuds enfants sont visibles.
Dans la Détails du nœud volet, afficher la valeur de ATTRIBUTE_NAME.

Cette valeur vous indique quelle série chronologique est contenue dans ce nœud. Le nœud de premier niveau dans la section ARIMA doit correspondre au nœud de premier niveau dans la section (Tout). Dans l'exemple AdventureWorks, ce nœud contient l'analyse ARIMA de la série M200 Europe.