Erweiterte Zeitreihenvorhersagen (Data Mining-Lernprogramm für Fortgeschrittene)

 

Gilt für: SQL Server 2016 Preview

Bei der Untersuchung des Prognosemodells wurde gezeigt, dass die Verkäufe in den meisten Regionen einem ähnlichen Muster folgen. Einige Regionen und Modelle wie das Modell M200 im Pazifischen Raum weisen jedoch deutlich abweichende Trends auf. Dies ist wenig überraschend, da bekanntermaßen häufig regionale Unterschiede auftreten und durch zahlreiche Faktoren verursacht werden können, einschließlich Marketingaktionen, fehlerhafter Berichterstellung sowie politischer Faktoren.

Ihre Benutzer benötigen jedoch ein Modell, das weltweit angewendet werden kann. Sie können daher die Auswirkungen einzelner Faktoren auf Vorhersagen minimieren, indem Sie ein Modell erstellen, das auf den aggregierten Zahlen aller Verkäufe weltweit basiert. Sie können dann dieses Modell für Vorhersagen für jede einzelne Region nutzen.

In dieser Aufgabe erstellen Sie alle Datenquellen, die für die erweiterten Vorhersagetasks erforderlich sind. Sie erstellen zwei Datenquellensichten zur Verwendung als Eingaben in die Vorhersageabfrage und eine Datenquellensicht, die beim Erstellen eines neuen Modells zum Einsatz kommt.

Schritte

  1. Vorbereiten der erweiterten Umsatzdaten (für die Vorhersage)

  2. Vorbereiten der aggregierten Daten (zum Erstellen des Modells)

  3. Vorbereiten der Reihendaten (für Kreuzvorhersagen)

  4. Vorhersagen mit EXTEND

  5. Erstellen des Modells für Kreuzvorhersagen

  6. Vorhersagen mit REPLACE

  7. Überprüfen der neuen Vorhersagen

Erstellen der neuen erweiterten Umsatzdaten

Um die Umsatzdaten zu aktualisieren, müssen Sie die letzten Umsatzzahlen abrufen. Die Daten aus der Pazifikregion sind von besonderem Interesse, da dort eine regionale Werbeaktion durchgeführt wurde, um neue Niederlassungen einzuführen und ihre Produkte bekannt zu machen.

In diesem Szenario gehen wir davon aus, dass die Daten aus einer Excel-Arbeitsmappe importiert wurden, die neue Daten für einige Regionen über nur drei Monate enthält. Sie erstellen mit einem Transact-SQL-Skript eine Tabelle für die Daten und definieren dann eine Datenquellensicht, die für Vorhersage verwendet werden soll.

Erstellen der Tabelle mit neuen Umsatzdaten

  1. Führen Sie in einem Transact-SQL-Abfragefenster die folgende Anweisung aus, um der Datenbank "AdventureWorksDW" (bzw. einer anderen Datenbank) die Umsatzdaten hinzuzufügen.

    USE [database name];  
    GO  
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL   
        DROP TABLE [dbo].[NewSalesData];  
    GO  
    CREATE TABLE [dbo].[NewSalesData](  
    [Series] [nvarchar](255) NULL,  
    [NewDate] [datetime] NULL,  
    [NewQty] [float] NULL,  
    [NewAmount] [money] NULL  
    ) ON [PRIMARY]  
    
    GO  
    
  2. Fügen Sie die neuen Werte mithilfe des folgenden Skripts ein.

    INSERT INTO [NewSalesData]  
    (Series,NewDate,NewQty,NewAmount)  
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),  
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),  
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),  
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),  
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),  
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),  
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),  
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),  
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),  
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),  
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),  
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),  
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),  
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),  
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),  
    ('M200 North America', '7/25/08', 94, '$216,916.00'),  
    ('M200 North America', '8/25/08', 94, '$216,891.00'),  
    ('M200 North America', '9/25/08', 91,'$209,943.00');  
    

    Warnung


    Die Anführungszeichen werden mit Währungswerten verwendet, um Probleme mit dem Komma als Trennzeichen und dem Währungssymbol zu verhindern. Sie könnten die Währungswerte auch in diesem Format übergeben: 130170.22

    Die in der Beispieldatenbank verwendeten Datumsangaben wurden für diese Version geändert. Wenn Sie eine frühere Edition von AdventureWorks verwenden, müssen Sie die eingefügten Datumsangaben ggf. anpassen.

Erstellen einer Datenquellensicht mit den neuen Umsatzdaten

  1. In Projektmappen-Explorer, mit der rechten Maustaste Datenquellensichten, und wählen Sie dann Neue Datenquellensicht.

  2. Treffen Sie im Datenquellensicht-Assistenten die folgende Auswahl:

    Datenquelle: Adventure Works DW Multidimensional 2012

    Wählen Sie Tabellen und Sichten: Wählen Sie die Tabelle, die Sie gerade erstellt haben, NewSalesData.

  3. Klicken Sie auf Fertig stellen.

  4. Klicken Sie in der Entwurfsoberfläche der Datenquellensicht mit der rechten Maustaste NewSalesData, und wählen Sie Daten durchsuchen die Daten überprüfen.

Warnung


Sie verwenden diese Daten nur für Vorhersagen; daher ist es nicht wichtig, dass sie unvollständig sind.

Erstellen der Daten für das Kreuzvorhersage-Modell

Die Daten in der ursprünglichen zur Prognose Modell wurde bereits teilweise durch die vTimeSeries-Sicht, die mehrere Fahrradmodelle in eine kleinere Anzahl von Kategorien und die Ergebnisse einzelner Länder in Regionen zusammengeführt gruppiert werden. Sie erstellen ein Modell, das für weltweite Prognosen verwendet werden kann, indem Sie direkt im Datenquellensicht-Designer einige zusätzliche einfache Aggregationen erstellen. Die neue Datenquellensicht enthält nur die Summe und den Durchschnitt der Umsätze aller Produkte in allen Regionen.

Nachdem Sie die für das Modell verwendete Datenquelle erstellt haben, müssen Sie eine neue Datenquellensicht erstellen, die für Vorhersage verwendet werden soll. Wenn Sie z. B. die Umsätze in Europa mit dem neuen weltweite Modell vorhersagen möchten, dürfen Sie nur Daten aus der Region Europa eingeben. Daher richten Sie eine neue Datenquellensicht ein, die die ursprünglichen Daten filtert, und ändern die Filterbedingung für jeden Satz von Vorhersageabfragen.

So erstellen Sie die Modelldaten mithilfe einer benutzerdefinierten Datenquellensicht

  1. In Projektmappen-Explorer, mit der rechten Maustaste Datenquellensichten, und wählen Sie dann Neue Datenquellensicht.

  2. Klicken Sie auf der Begrüßungsseite des Assistenten auf Weiter.

  3. Wählen Sie auf der Seite Datenquelle auswählen Adventure Works DW Multidimensional 2012aus und klicken Sie dann auf Weiter.

  4. Fügen Sie auf der Seite Tabellen und Sichten auswählenkeine Tabellen hinzu – klicken Sie nur auf Weiter+.

  5. Geben Sie auf der Seite Assistenten abschließenden Namen AllRegionsein und klicken Sie anschließend auf Fertig stellen.

  6. Rechten Maustaste auf die Entwurfsoberfläche der Datenquellensicht leere Daten, und wählen Sie dann neue benannte Abfrage.

  7. Geben Sie im Dialogfeld Benannte Abfrage erstellen im Feld Nameden Namen AllRegionsein und geben Sie im Feld Beschreibungdie Beschreibung Summen- und Durchschnittswerte der Verkäufe für alle Modelle und Regionenein.

  8. Geben Sie im SQL-Textbereich die folgende Anweisung ein, und klicken Sie dann auf "OK":

    SELECT ReportingDate,   
    SUM
    ([Quantity]) as SumQty, AVG
    ([Quantity]) as AvgQty,  
    SUM
    ([Amount]) AS SumAmt, AVG
    ([Amount]) AS AvgAmt,  
    'All Regions' as [Region]  
    FROM dbo.vTimeSeries   
    GROUP BY ReportingDate  
    
  9. Mit der rechten Maustaste die AllRegions Tabelle, und wählen Sie dann Daten durchsuchen.

So erstellen Sie die Reihendaten für die Kreuzvorhersage

  1. In Projektmappen-Explorer, mit der rechten Maustaste Datenquellensichten, und wählen Sie dann Neue Datenquellensicht.

  2. Treffen Sie im Datenquellensicht-Assistenten die folgende Auswahl:

    Datenquelle: Adventure Works DW Multidimensional 2012

    Tabellen und Sichten auswählen: keine Auswahl

    Namen: T1000 Pacific Region

  3. Klicken Sie auf Fertig stellen.

  4. Mit der rechten Maustaste in der leere Entwurfsoberfläche für T1000 Pacific Region.dsv, und wählen Sie dann neue benannte Abfrage.

    Das Dialogfeld Benannte Abfrage erstellen wird geöffnet. Geben Sie den Namen erneut ein und fügen Sie die folgende Beschreibung hinzu:

    Namen: T1000 Pacific Region

    Beschreibung: vTimeSeriesnach Region und Modellfiltern

  5. Geben Sie im Textbereich die folgende Abfrage ein, und klicken Sie dann auf "OK":

    SELECT ReportingDate, ModelRegion, Quantity, Amount  
    FROM dbo.vTimeSeries  
    WHERE (ModelRegion = N'T1000 Pacific')  
    

    Hinweis


    Da Sie Vorhersagen für jede Reihe getrennt erstellen müssen, könnten Sie den Abfragetext kopieren und als Textdatei speichern, damit Sie ihn für die andere Datenreihe erneut verwenden können.

  6. Klicken Sie in der Entwurfsoberfläche der Datenquellensicht mit der rechten Maustaste T1000 Pacific, und wählen Sie Daten durchsuchen zu überprüfen, ob die Daten ordnungsgemäß gefiltert werden.

    Sie verwenden diese Daten als Eingabe in das Modell, wenn Sie Abfragen für Kreuzvorhersagen erstellen.

Nächste Aufgabe in der Lektion

Zeitreihenvorhersagen mit aktualisierten Daten ( Intermediate Data Mining-Lernprogramm )

Siehe auch

Microsoft Time Series-Algorithmus
Technische Referenz für den Microsoft Time Series-Algorithmus
Datenquellsichten in mehrdimensionalen Modellen