Share via


Spécifications pour un modèle de série chronologique (Didacticiel sur l'exploration de données intermédiaire)

 

S’applique à : SQL Server 2016 Preview

Lorsque vous préparez des données afin de les utiliser dans un modèle de prévision, vous devez veiller à ce qu'elles contiennent une colonne pouvant être utilisée pour identifier les étapes dans la série chronologique. Cette colonne sera désignée comme la Key Time colonne. Puisqu'il s'agit d'une clé, la colonne doit contenir des valeurs numériques uniques.

Choisir la bonne unité pour la Key Time colonne est une partie importante de l’analyse. Par exemple, supposons que vos données de ventes soient actualisées minute par minute. Vous n'êtes pas obligé de prendre les minutes comme unité pour la série chronologique ; il peut être plus explicite de regrouper les chiffres des ventes par jour, semaine ou même par mois. Si vous ne savez pas quelle unité de temps utiliser, vous pouvez créer une vue de source de données pour chaque agrégation et générer les modèles associés, pour savoir si différentes tendances émergent à chaque niveau d'agrégation.

Pour ce didacticiel, les données de ventes sont collectées quotidiennement dans la base de données des ventes transactionnelles, mais pour l'exploration de données, les données ont été préagrégées par mois, à l'aide d'une vue.

De plus, il est souhaitable pour l'analyse que les données aient aussi peu d'écart possible. Si vous envisagez d'analyser plusieurs séries de données, toutes les séries devraient commencer et se terminer de préférence aux mêmes dates. Si les données, mais les espaces ne sont pas au début ou à la fin d’une série, vous pouvez utiliser le paramètre MISSING_VALUE_SUBSTITUTION pour compléter la série. Analysis Services fournit également plusieurs options permettant de remplacer des données manquantes avec des valeurs, telles que l’utilisation de moyennes ou constantes.

Avertissement


Les outils de graphique croisé dynamique et de tableau croisé dynamique qui ont été inclus dans les versions antérieures du concepteur de vue de source de données ne sont plus fournis. Nous vous conseillons d'identifier au préalable les écarts dans les données de série chronologique à l'aide des outils tels que le profileur de données inclus dans Integration Services.

Pour identifier la clé de temps pour le modèle de prévision

  1. Dans le volet, SalesByRegion.dsv [Design], avec le bouton droit de la table vTimeSeries, puis sélectionnez Explorer les données.

    Un nouvel onglet s’ouvre, intitulée Explorer la Table vTimeSeries.

  2. Sur le Table onglet, examinez les données qui sont utilisées dans les colonnes TimeIndex et Reportingdate.

    Ces deux sont des séquences comportant des valeurs uniques et peuvent être toutes deux utilisées comme clé de série chronologique ; toutefois, les types de données des colonnes sont différents. L’algorithme MTS ne nécessite pas une datetime type de données, uniquement que les valeurs soient distinctes et classées. Par conséquent, l'une ou l'autre des colonnes peuvent être utilisées comme clé de temps pour le modèle de prévision.

  3. Dans l’aire de conception vue de source de données, sélectionnez la colonne, la Date de création de rapports et sélectionnez propriétés. Ensuite, cliquez sur la colonne TimeIndex et sélectionnez propriétés.

    Le champ TimeIndex a les type de données System.Int32, tandis que le champ Date de création de rapports comprend les données de type System.DateTime. De nombreux entrepôts de données convertissent les valeurs date/heure en entiers et utilisent la colonne des entiers comme clé pour améliorer les performances d'indexation. Toutefois, si vous utilisez cette colonne, l'algorithme MTS établit des prédictions à l'aide de valeurs futures, telles que 201014, 201014, etc. Étant donné que vous souhaitez représenter vos données de vente à l’aide de dates du calendrier de prévision, vous allez utiliser la colonne de Date de création de rapports en tant qu’identificateur de série unique.

Pour définir la clé dans la vue de source de données

  1. Dans le volet SalesByRegion.dsv, sélectionnez la table vTimeSeries.

  2. Avec le bouton droit de la colonne, la Date de création de rapports, puis sélectionnez définir la clé primaire logique.

Gestion des données manquantes (facultatif)

S'il manque des données dans une série, vous risquez d'obtenir une erreur lorsque vous essayez de traiter le modèle. Il existe plusieurs manières de gérer les données manquantes :

  • Vous pouvez laisser Analysis Services remplir les valeurs manquantes, en calculant une moyenne ou en utilisant une valeur précédente. Pour ce faire, définissez le paramètre MISSING_VALUE_SUBSTITUTION sur le modèle d'exploration de données. Pour plus d’informations sur ce paramètre, consultez la page Microsoft Time Series algorithme Technical Reference. Pour plus d’informations sur la modification des paramètres sur un modèle d’exploration de données existant, consultez Afficher ou modifier les paramètres d’algorithme.

  • Vous pouvez modifier la source de données ou filtrer la vue sous-jacente pour éliminer la série irrégulière ou remplacer des valeurs. Pour ce faire, vous devez utiliser la source de données relationnelle ou modifier la vue de source de données en créant des requêtes ou des calculs nommés personnalisés. Pour plus d’informations, consultez Vues de sources de données dans les modèles multidimensionnels. Une tâche ultérieure au cours de cette leçon fournit un exemple de la manière de générer à la fois une requête nommée et un calcul personnalisé.

Pour ce scénario, certaines données manquent au début d'une série : autrement dit, il n'y a pas de données pour la gamme de produits T1000 jusqu'en juillet 2007. Sinon, toutes les séries se terminent à la même date et aucune valeur ne manque.

La spécification de l’algorithme MTS est que toute série que vous incluez dans un modèle unique doit avoir le même fin point. Étant donné que le modèle de vélo T1000 a été introduit en 2007, les données de cette série démarrent plus tard que pour les autres modèles de vélos, mais la série se termine à la même date ; les données peuvent donc être utilisées.

Pour fermer le concepteur de vues de source de données

  • Cliquez sur l’onglet, Explorer la Table vTimeSeries, puis sélectionnez Fermer.

Tâche suivante de la leçon

Création d’une Structure de prévision et modèle &#40 ; didacticiel d’exploration de données intermédiaires &#41 ;

Voir aussi

Algorithme MTS (Microsoft Time Series)