Article
03/31/2012

Fonctionnement des tendances dans le modèle de série chronologique (Didacticiel intermédiaire sur l'exploration de données)

Lorsque vous examinez les divers modèles créés à partir de données agrégées, vous constatez que les lignes de tendance et de prédiction offrent des apparences très différentes selon que vous avez additionné le montant et la quantité dans les différents modèles et régions, ou que vous avez calculé la moyenne.

Avant de décider du modèle à appliquer comme modèle général pour effectuer des projections internationales, vous allez examiner les données sous-jacentes avec le graphique de prédiction pour mieux comprendre les prédictions.

Vous avez remarqué que les lignes de tendance se sont chevauchées jusqu'à juin 2006, lorsque les lignes pour la quantité et le montant divergent. Puis en juillet 2008 les lignes divergent de nouveau.

Dans cette tâche, vous allez créer un calcul nommé à partir de la vue de source de données d'origine pour vous aider à suivre la relation entre la quantité et le prix. Puis, vous allez créer un graphique croisé dynamique qui inclut ce taux pour vous aider à comprendre les séparations dans les lignes de tendance.

Examen des données sous-jacentes

Pour créer un calcul nommé

Dans l'Explorateur de solutions, développez Vues des sources de données, et double-cliquez sur SalesByRegion.dsv.
Cliquez avec le bouton droit sur la table vTimeSeries et sélectionnez Nouveau calcul nommé.
Dans la zone Créer un calcul nommé, pour Nom, tapez UnitAmt.
Dans la zone de texte Expression, tapez Montant/Quantité. Cliquez sur OK.

La table vTimeSeries contient maintenant une colonne calculée supplémentaire, UnitAmt. Cette colonne calculée est stockée uniquement dans la définition de vue de source de données pour le projet d'exploration de données et n'affecte pas la vue de base de données relationnelle sous-jacente.

Pour créer un graphique croisé dynamique à l'aide du calcul nommé

Cliquez avec le bouton droit sur la table vTimeSeries et sélectionnez Explorer les données.
Dans l'onglet Explorer la table vTimeSeries, cliquez sur l'onglet Tableau croisé dynamique.
Faites glisser le champ TimeIndex de la zone Liste de champs de tableau croisé dynamique et déposez-le dans l'aire de conception du tableau croisé dynamique intitulée Déposer ici les champs de colonne.
Faites glisser le champ ModelRegion de la zone Liste de champs de tableau croisé dynamique et déposez-le dans l'aire de conception du tableau croisé dynamique intitulée Placer ici les champs de ligne.
Faites glisser le champ UnitAmt de la zone Liste de champs de tableau croisé dynamique et déposez-le dans l'aire de conception du tableau croisé dynamique intitulée Placer les totaux ou les champs de détails ici.

Examen des modèles agrégés

Dans le tableau croisé dynamique, vous constatez que des modifications substantielles ont affecté à plusieurs instants déterminés le montant des ventes par unité, sans doute en raison de modifications dans les prix des produits. En juillet 2007, une autre modification significative intervient lors de l'ajout d'une nouvelle version, T1000, à toutes les régions. Toutes ces modifications affectent les tendances calculées dans le modèle. Un modèle généralisé est utile parce qu'il réduit l'impact d'une modification. Toutefois, vous pouvez décider de créer des modèles séparés pour les nouveaux magasins dans certains scénarios, afin que les données de ces magasins n'affectent pas les tendances.

Dans ce didacticiel, vous allez choisir un des modèles d'agrégat qui s'appliquent aux projections de ventes. N'oubliez pas que vous avez créé quatre modèles d'exploration de données différents, chacun basé sur une mesure d'agrégat différente. Vous allez utiliser les outils fournis dans la visionneuse de l'algorithme MTS avec le tableau croisé dynamique que vous avez créé précédemment pour orienter cette décision. Le diagramme suivant affiche le graphique de série chronologique créé pour les modèles d'agrégat. Les deux lignes de série en gris représentent des moyennes et les deux lignes de série en vert représentent des sommes.

Quatre modèles pour les mesures d'agrégation

Avant de décider quel modèle d'exploration de données utiliser pour les projections de ventes, vous décidez d'étudier les points suivants :

Les modèles d'exploration de données basés sur Amount ont une tendance ascendante alors que les modèles basés sur Quantity connaissent une baisse cyclique.
Les projections basées sur le montant moyen (AvgAmt) et les projections basées sur la somme (SumQty) sont très éloignées.
Même si les lignes de tendance dans trois des modèles se stabilisent après 5 prédictions, la ligne de tendance du modèle basé sur la somme continue sa forte croissance.

Il y a trois éléments que vous pouvez vérifier pour obtenir plus d'informations. Commencez par activer la case à cocher Afficher les écarts pour afficher les écarts types pour chaque prédiction. Une barre d'erreur plus longue indique une variation plus grande dans la valeur prédite.

Puis remarquez que l'unité de l'axe des ordonnées (Y) est en pourcentages ; notez aussi que l'échelle du graphique varie selon les données dans le graphique. Par défaut, la Visionneuse de l'algorithme MTS (Microsoft Time Series) ajuste automatiquement les unités sur l'axe des pourcentages pour faciliter l'affichage du graphique. Par conséquent, si vous souhaitez utiliser une échelle spécifique ou fixe, vous devez utiliser une requête de prédiction pour créer et exporter les valeurs et créer un graphique dans une autre application, telle que Microsoft Excel.

Enfin, vous pouvez utiliser la vue d'arbre de décision du modèle de série chronologique pour comprendre les séparations dans le modèle. Dans un modèle de série chronologique, une séparation ou une branche dans l'arbre de décision, peut signifier que l'inclinaison de la ligne de tendance a changé considérablement à un moment donné, ou cela peut indiquer que l'arborescence s'est branchée en fonction d'autres conditions. La vue qui affiche ces séparations sous la forme de nœuds dans une arborescence vous permet d'explorer les détails ayant provoqué la séparation.

Pour consulter l'arbre de décision pour chaque série

Dans l'Explorateur de solutions, développez Vues des sources de données, et cliquez avec le bouton droit sur AllRegions.dsv.
Cliquez avec le bouton droit sur la table vTimeSeries et sélectionnez Explorer les données.
Dans l'onglet Explorer la table vTimeSeries, cliquez sur l'onglet Tableau croisé dynamique.
Faites glisser le champ ReportingDate de la zone Liste de champs de tableau croisé dynamique et déposez-le dans l'aire de conception du tableau croisé dynamique intitulée Déposer ici les champs de colonne.
Faites glisser le champ Region de la zone Liste de champs de tableau croisé dynamique et déposez-le dans l'aire de conception du tableau croisé dynamique intitulée Placer ici les champs de ligne.
Faites glisser le champ UnitAmt de la zone Liste de champs de tableau croisé dynamique et déposez-le dans l'aire de conception du tableau croisé dynamique intitulée Placer les totaux ou les champs de détails ici.

Il est important également de comprendre cet aspect, étant donné qu'un modèle de série chronologique est calculé en utilisant des moyennes mobiles, les valeurs de données à la fin de la série de données peuvent avoir une incidence plus forte sur la prédiction que les valeurs de données situées au démarrage de la série de données. De plus, l'indicateur de périodicité que vous avez fourni lors de la génération du modèle a également un effet sur la manière dont les moyennes sont utilisées dans le temps.

Conclusion

Dans cette analyse, vous avez appris plusieurs choses :

La quantité est fondamentalement volatile parce que les valeurs absolues peuvent être très basses pour certains magasins ; de plus, la vue Graphique a tendance à exagérer les différences en présentant les chiffres en pourcentages.
Le montant apparaît encore plus volatile, parce qu'il est dépendant de la quantité mais il est affecté également par les modifications des prix.
La forte tendance haussière dans les prédictions pour la série M200 North America est provoquée par le fait que le volume de ventes était particulièrement élevé pour cette combinaison produit et région sur la fin des données historiques.

Votre analyse approfondie des données et des divers modèles vous a permis d'établir un modèle fiable. Si vos utilisateurs professionnels ont besoin de justification pour l'analyse, vous pouvez obtenir les formules et les données associées en utilisant les statistiques disponibles dans les info-bulles, ou en parcourant ou en interrogeant le contenu de modèle.

Dans la leçon suivante, vous utiliserez le modèle basé sur une quantité moyenne pour élaborer des prédictions pour la quantité dans toutes les régions.