Erweiterte Zeitreihenvorhersagen (Data Mining-Lernprogramm für Fortgeschrittene)

Bei der Untersuchung des Prognosemodells wurde gezeigt, dass die Verkäufe in den meisten Regionen einem ähnlichen Muster folgen. Einige Regionen und Modelle wie das Modell M200 im Pazifischen Raum weisen jedoch deutlich abweichende Trends auf. Dies ist wenig überraschend, da bekanntermaßen häufig regionale Unterschiede auftreten und durch zahlreiche Faktoren verursacht werden können, einschließlich Marketingaktionen, fehlerhafter Berichterstellung sowie politischer Faktoren.

Ihre Benutzer benötigen jedoch ein Modell, das weltweit angewendet werden kann. Sie können daher die Auswirkungen einzelner Faktoren auf Vorhersagen minimieren, indem Sie ein Modell erstellen, das auf den aggregierten Zahlen aller Verkäufe weltweit basiert. Sie können dann dieses Modell für Vorhersagen für jede einzelne Region nutzen.

In dieser Aufgabe erstellen Sie alle Datenquellen, die für die erweiterten Vorhersagetasks erforderlich sind. Sie erstellen zwei Datenquellensichten zur Verwendung als Eingaben in die Vorhersageabfrage und eine Datenquellensicht, die beim Erstellen eines neuen Modells zum Einsatz kommt.

Schritte

  1. Vorbereiten der erweiterten Umsatzdaten (für die Vorhersage)

  2. Vorbereiten der aggregierten Daten (zum Erstellen des Modells)

  3. Vorbereiten der Reihendaten (für Kreuzvorhersagen)

  4. Vorhersagen mit EXTEND

  5. Erstellen des Modells für Kreuzvorhersagen

  6. Vorhersagen mit REPLACE

  7. Überprüfen der neuen Vorhersagen

Erstellen der neuen erweiterten Umsatzdaten

Um die Umsatzdaten zu aktualisieren, müssen Sie die letzten Umsatzzahlen abrufen. Die Daten aus der Pazifikregion sind von besonderem Interesse, da dort eine regionale Werbeaktion durchgeführt wurde, um neue Niederlassungen einzuführen und ihre Produkte bekannt zu machen.

In diesem Szenario gehen wir davon aus, dass die Daten aus einer Excel-Arbeitsmappe importiert wurden, die neue Daten für einige Regionen über nur drei Monate enthält. Sie erstellen mit einem Transact-SQL-Skript eine Tabelle für die Daten und definieren dann eine Datenquellensicht, die für Vorhersage verwendet werden soll.

Erstellen der Tabelle mit neuen Umsatzdaten

  1. Führen Sie in einem Transact-SQL-Abfragefenster die folgende Anweisung aus, um der Datenbank "AdventureWorksDW" (bzw. einer anderen Datenbank) die Umsatzdaten hinzuzufügen.

    USE [database name];
    GO
    IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL 
        DROP TABLE [dbo].[NewSalesData];
    GO
    CREATE TABLE [dbo].[NewSalesData](
    [Series] [nvarchar](255) NULL,
    [NewDate] [datetime] NULL,
    [NewQty] [float] NULL,
    [NewAmount] [money] NULL
    ) ON [PRIMARY]
    
    GO
    
  2. Fügen Sie die neuen Werte mithilfe des folgenden Skripts ein.

    INSERT INTO [NewSalesData]
    (Series,NewDate,NewQty,NewAmount)
    VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'),
    ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '),
    ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '),
    ('T1000 Europe', '7/25/08', 37, '$88,210.00 '),
    ('T1000 Europe', '8/25/08', 41, '$97,746.00 '),
    ('T1000 Europe', '9/25/08', 37, '$88,210.00 '),
    ('T1000 North America', '7/25/08', 69, '$164,500.00 '),
    ('T1000 North America', '8/25/08', 66, '$157,348.00 '),
    ('T1000 North America', '9/25/08', 58, '$138,276.00 '),
    ('M200 Pacific', '7/25/08', 65, '$149,824.35'),
    ('M200 Pacific', '8/25/08', 54,  '$124,619.46'),
    ('M200 Pacific', '9/25/08', 61, '$141,143.39'),
    ('M200 Europe', '7/25/08', 75, '$173,026.00'),
    ('M200 Europe', '8/25/08', 76, '$175,212.00'),
    ('M200 Europe', '9/25/08', 84, '$193,731.00'),
    ('M200 North America', '7/25/08', 94, '$216,916.00'),
    ('M200 North America', '8/25/08', 94, '$216,891.00'),
    ('M200 North America', '9/25/08', 91,'$209,943.00');
    
    VorsichtshinweisVorsicht

    Die Anführungszeichen werden mit Währungswerten verwendet, um Probleme mit dem Komma als Trennzeichen und dem Währungssymbol zu verhindern. Sie könnten die Währungswerte auch in diesem Format übergeben: 130170.22

    Die in der Beispieldatenbank verwendeten Datumsangaben wurden für diese Version geändert. Wenn Sie eine frühere Edition von AdventureWorks verwenden, müssen Sie die eingefügten Datumsangaben ggf. anpassen.

Erstellen einer Datenquellensicht mit den neuen Umsatzdaten

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten, und wählen Sie dann Neue Datenquellensicht aus.

  2. Treffen Sie im Datenquellensicht-Assistenten die folgende Auswahl:

    Datenquelle: Adventure Works DW Multidimensional 2012

    Tabellen und Sichten auswählen: Wählen Sie die Tabelle NewSalesData aus, die Sie soeben erstellt haben.

  3. Klicken Sie auf Fertig stellen.

  4. Klicken Sie auf der Entwurfsoberfläche der Datenquellensicht mit der rechten Maustaste auf NewSalesData, und wählen Sie dann Daten durchsuchen aus, um die Daten zu überprüfen.

VorsichtshinweisVorsicht

Sie verwenden diese Daten nur für Vorhersagen; daher ist es nicht wichtig, dass sie unvollständig sind.

Erstellen der Daten für das Kreuzvorhersage-Modell

Die Daten, die im ursprünglichen Prognosemodell verwendet wurden, wurden in der Sicht vTimeSeries bereits ein wenig gruppiert, da dort mehrere Fahrradmodelle in eine kleinere Anzahl von Kategorien und die Ergebnisse einzelner Länder in Regionen zusammengeführt wurden. Sie erstellen ein Modell, das für weltweite Prognosen verwendet werden kann, indem Sie direkt im Datenquellensicht-Designer einige zusätzliche einfache Aggregationen erstellen. Die neue Datenquellensicht enthält nur die Summe und den Durchschnitt der Umsätze aller Produkte in allen Regionen.

Nachdem Sie die für das Modell verwendete Datenquelle erstellt haben, müssen Sie eine neue Datenquellensicht erstellen, die für Vorhersage verwendet werden soll. Wenn Sie z. B. die Umsätze in Europa mit dem neuen weltweite Modell vorhersagen möchten, dürfen Sie nur Daten aus der Region Europa eingeben. Daher richten Sie eine neue Datenquellensicht ein, die die ursprünglichen Daten filtert, und ändern die Filterbedingung für jeden Satz von Vorhersageabfragen.

So erstellen Sie die Modelldaten mithilfe einer benutzerdefinierten Datenquellensicht

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten und wählen Sie dann Neue Datenquellensicht aus.

  2. Klicken Sie auf der Begrüßungsseite des Assistenten auf Weiter.

  3. Wählen Sie auf der Seite Datenquelle auswählen Adventure Works DW Multidimensional 2012 aus und klicken Sie dann auf Weiter.

  4. Fügen Sie auf der Seite Tabellen und Sichten auswählen keine Tabellen hinzu – klicken Sie nur auf Weiter+.

  5. Geben Sie auf der Seite Assistenten abschließen den Namen AllRegions ein und klicken Sie dann auf Fertig stellen.

  6. Klicken Sie danach mit der rechten Maustaste auf die leere Entwurfsoberfläche der Datenquellensicht und wählen Sie Neue benannte Abfrage aus.

  7. Geben Sie im Dialogfeld Benannte Abfrage erstellen im Feld Name den Namen AllRegions ein und geben Sie im Feld Beschreibung die Beschreibung "Summen- und Durchschnittswerte der Verkäufe für alle Modelle und Regionen" ein.

  8. Geben Sie im SQL-Textbereich die folgende Anweisung ein, und klicken Sie dann auf "OK":

    SELECT ReportingDate, 
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,
    'All Regions' as [Region]
    FROM dbo.vTimeSeries 
    GROUP BY ReportingDate
    
  9. Klicken Sie mit der rechten Maustaste auf die Tabelle AllRegions und wählen Sie dann Daten durchsuchen aus.

So erstellen Sie die Reihendaten für die Kreuzvorhersage

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten und wählen Sie dann Neue Datenquellensicht aus.

  2. Treffen Sie im Datenquellensicht-Assistenten die folgende Auswahl:

    Datenquelle: Adventure Works DW Multidimensional 2012

    Tabellen und Sichten auswählen: keine Auswahl

    Name: T1000 Pacific Region

  3. Klicken Sie auf Fertig stellen.

  4. Klicken Sie mit der rechten Maustaste auf die leere Entwurfsoberfläche für T1000 Pacific Region.dsv und wählen Sie dann Neue benannte Abfrage aus.

    Das Dialogfeld Benannte Abfrage erstellen wird geöffnet. Geben Sie den Namen erneut ein und fügen Sie die folgende Beschreibung hinzu:

    Name: T1000 Pacific Region

    Beschreibung: vTimeSeries nach Region und Modell filtern

  5. Geben Sie im Textbereich die folgende Abfrage ein, und klicken Sie dann auf "OK":

    SELECT ReportingDate, ModelRegion, Quantity, Amount
    FROM dbo.vTimeSeries
    WHERE (ModelRegion = N'T1000 Pacific')
    
    HinweisHinweis

    Da Sie Vorhersagen für jede Reihe getrennt erstellen müssen, könnten Sie den Abfragetext kopieren und als Textdatei speichern, damit Sie ihn für die andere Datenreihe erneut verwenden können.

  6. Klicken Sie auf der Entwurfsoberfläche der Datenquellensicht mit der rechten Maustaste auf T1000 Pacific, und wählen Sie dann Daten durchsuchen aus, um zu überprüfen, ob die Daten ordnungsgemäß gefiltert wurden.

    Sie verwenden diese Daten als Eingabe in das Modell, wenn Sie Abfragen für Kreuzvorhersagen erstellen.

Nächste Aufgabe in dieser Lektion

Erstellen von Zeitreihenvorhersagen mit aktualisierten Daten (Data Mining-Lernprogramm für Fortgeschrittene)

Siehe auch

Verweis

Technische Referenz für den Microsoft Time Series-Algorithmus

Konzepte

Microsoft Time Series-Algorithmus

Datenquellsichten in mehrdimensionalen Modellen