Prédictions de série chronologique avancées (Didacticiel intermédiaire sur l'exploration de données)

 

S’applique à : SQL Server 2016 Preview

Le modèle de prévision vous a appris que même si les ventes dans la plupart des régions suivent une tendance similaire, certaines régions et certains modèles, tels que le modèle M200 dans la région Pacific, présentent des tendances très différentes. Ceci n'est pas une surprise puisque vous savez que les différences entre les régions sont courantes et sont causées par de nombreux facteurs, notamment les promotions marketing, la création de rapports inexacts ou des événements géopolitiques.

Toutefois, vos utilisateurs demandent un modèle qui peut être appliqué dans le monde entier. C'est pourquoi, dans le but de réduire la portée de facteurs individuels sur les projections, vous décidez de générer un modèle basé sur les mesures cumulées des ventes internationales. Vous pouvez alors utiliser ce modèle pour faire des prédictions pour chacune des régions.

Dans cette tâche, vous allez générer toutes les sources de données dont vous avez besoin pour effectuer les tâches de prédiction avancées. Vous allez créer deux vues de source de données à utiliser comme entrées à la requête de prédiction, et une vue de source de données à utiliser lors de la génération d'un nouveau modèle.

Étapes

  1. Préparez les données de ventes étendues (pour la prédiction)

  2. Préparez les données cumulées (pour générer le modèle)

  3. Préparez les données de la série (pour la prédiction croisée)

  4. Effectuez les prédictions à l'aide d'EXTEND

  5. Créez le modèle de prédiction croisée

  6. Effectuez les prédictions à l'aide de REPLACE

  7. Examinez les nouvelles prédictions

Création des nouvelles données de ventes étendues

Pour mettre à jour vos données de ventes, vous devez obtenir les derniers chiffres de vente. Les données qui viennent d'arriver de la région Pacific sont d'un intérêt particulier car cette région a lancé une promotion commerciale régionale pour attirer l'attention sur les nouveaux magasins et pour attiser la conscience de leurs produits.

Pour ce scénario, nous supposerons que les données ont été importées depuis un classeur Excel qui contient seulement trois mois de nouvelles données pour quelques régions. Vous allez créer une table des données à l'aide d'un script Transact-SQL, puis définir une vue de source de données à utiliser pour la prédiction.

Créez la table avec les nouvelles données de ventes

  1. Dans une fenêtre de requête Transact-SQL, exécutez l'instruction suivante pour ajouter les données de ventes à la base de données AdventureWorksDW (ou une autre base de données).

    USE [database name];  
    GO  
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL   
        DROP TABLE [dbo].[NewSalesData];  
    GO  
    CREATE TABLE [dbo].[NewSalesData](  
    [Series] [nvarchar](255) NULL,  
    [NewDate] [datetime] NULL,  
    [NewQty] [float] NULL,  
    [NewAmount] [money] NULL  
    ) ON [PRIMARY]  
    
    GO  
    
  2. Insérez les nouvelles valeurs à l'aide du script suivant.

    INSERT INTO [NewSalesData]  
    (Series,NewDate,NewQty,NewAmount)  
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),  
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),  
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),  
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),  
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),  
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),  
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),  
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),  
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),  
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),  
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),  
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),  
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),  
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),  
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),  
    ('M200 North America', '7/25/08', 94, '$216,916.00'),  
    ('M200 North America', '8/25/08', 94, '$216,891.00'),  
    ('M200 North America', '9/25/08', 91,'$209,943.00');  
    

    Avertissement


    Les guillemets sont utilisés avec les valeurs monétaires pour empêcher les problèmes liés au séparateur à virgule et au symbole monétaire. Vous pouvez également transmettre les valeurs monétaires dans ce format : 130170.22

    Notez que les dates utilisées dans l'exemple de base de données ont changé pour cette version. Si vous utilisez une version antérieure d'AdventureWorks, vous devrez peut-être ajuster les dates insérées en conséquence.

Créez une vue de source de données à l'aide des nouvelles données de ventes

  1. Dans l’Explorateur de solutions, avec le bouton droit vues de sources de données, puis sélectionnez nouvelle vue de Source de données.

  2. Dans l'Assistant Vue de source de données, faites les sélections suivantes :

    Source de données: Adventure Works DW Multidimensional 2012

    Sélectionner des Tables et vues: sélectionnez la table que vous venez de créer, NewSalesData.

  3. Cliquez sur Terminer.

  4. Dans l’aire de conception de vue de Source de données, cliquez sur NewSalesData, puis sélectionnez Explorer les données pour vérifier les données.

Avertissement


Vous allez utiliser ces données uniquement pour la prédiction, donc il n'est pas important que ces données soient incomplètes.

Création des données pour le modèle de prédiction croisée

Les données qui a été utilisées dans l’original prévision de modèle a été déjà quelque peu regroupées par la vue vTimeSeries réduit plusieurs modèles de vélos de diminuer le nombre de catégories et fusionné les résultats de différents pays en régions. Pour créer un modèle qui peut être utilisé pour les projections internationales, vous allez créer des agrégations simples supplémentaires directement dans le Concepteur de vue de source de données. La nouvelle vue de source de données ne contiendra qu'une somme et une moyenne des ventes de tous les produits pour toutes les régions.

Après avoir créé la source de données utilisée pour le modèle, vous devez créer une nouvelle vue de source de données pour la prédiction. Par exemple, si vous souhaitez prédire des ventes pour l'Europe à l'aide du nouveau modèle international, vous devez charger uniquement les données de la région Europe. Vous allez définir une nouvelle vue de source de données qui filtre les données d'origine et modifier la condition de filtre pour chaque ensemble de requêtes de prédiction.

Pour créer les données de modèle à l'aide d'une vue de source de données personnalisée

  1. Dans l’Explorateur de solutions, avec le bouton droit vues de sources de données, puis sélectionnez nouvelle vue de Source de données.

  2. Dans la page d'accueil de l'Assistant, cliquez sur Suivant.

  3. Dans la page Sélectionner une source de données , sélectionnez Adventure Works DW Multidimensional 2012, puis cliquez sur Suivant.

  4. Dans la page Sélectionner des tables et des vues, n'ajoutez aucune table, cliquez seulement sur Suivant.

  5. Dans la page Fin de l’Assistant, tapez le nom AllRegions, puis cliquez sur Terminer.

  6. Ensuite, cliquez sur l’aire de conception de vue de source données vierge, puis sélectionnez nouvelle requête nommée.

  7. Dans la boîte de dialogue Créer une requête nommée , tapez AllRegionspour Nomet Somme et moyenne des ventes pour tous les modèles et régionspour Description.

  8. Dans le volet Texte SQL, tapez l'instruction suivante et cliquez sur OK :

    SELECT ReportingDate,   
    SUM
    ([Quantity]) as SumQty, AVG
    ([Quantity]) as AvgQty,  
    SUM
    ([Amount]) AS SumAmt, AVG
    ([Amount]) AS AvgAmt,  
    'All Regions' as [Region]  
    FROM dbo.vTimeSeries   
    GROUP BY ReportingDate  
    
  9. Cliquez sur le AllRegions table, puis sélectionnez Explorer les données.

Pour créer les données de série pour la prédiction croisée

  1. Dans l’Explorateur de solutions, avec le bouton droit vues de sources de données, puis sélectionnez nouvelle vue de Source de données.

  2. Dans l'Assistant Vue de source de données, faites les sélections suivantes :

    Source de données: Adventure Works DW Multidimensional 2012

    Sélectionner des tables et des vues: ne sélectionnez pas de tables

    Nom: T1000 Pacific Region

  3. Cliquez sur Terminer.

  4. Cliquez sur l’aire de conception vide pour T1000 Pacific Region.dsv, puis sélectionnez nouvelle requête nommée.

    La boîte de dialogue Créer une requête nommée s'affiche. Retapez le nom, puis ajoutez la description suivante :

    Nom: T1000 Pacific Region

    Description: FiltrervTimeSeriespar région et modèle

  5. Dans le volet Texte, tapez la requête suivante et cliquez sur OK :

    SELECT ReportingDate, ModelRegion, Quantity, Amount  
    FROM dbo.vTimeSeries  
    WHERE (ModelRegion = N'T1000 Pacific')  
    

    Notes


    Puisque vous devez créer des prédictions séparément pour chaque série, vous pouvez copier le texte de la requête et l'enregistrer dans un fichier texte afin de le réutiliser pour les autres séries de données.

  6. Dans l’aire de conception de vue de Source de données, cliquez sur T1000 Pacific, puis sélectionnez Explorer les données pour vérifier que les données sont filtrées correctement.

    Vous utiliserez ces données comme entrée au modèle lors de la création des requêtes de prédiction croisée.

Tâche suivante de la leçon

Prédictions de série chronologique à l’aide de la mise à jour des données &#40 ; Intermediate Data Mining Tutorial &#41 ;

Voir aussi

Algorithme MTS (Microsoft Time Series)
Références techniques relatives à l'algorithme MTS (Microsoft Time Series)
Vues de sources de données dans les modèles multidimensionnels