Erweiterte Zeitreihenvorhersagen (Data Mining-Lernprogramm für Fortgeschrittene)
Gilt für: SQL Server 2016 Preview
Bei der Untersuchung des Prognosemodells wurde gezeigt, dass die Verkäufe in den meisten Regionen einem ähnlichen Muster folgen. Einige Regionen und Modelle wie das Modell M200 im Pazifischen Raum weisen jedoch deutlich abweichende Trends auf. Dies ist wenig überraschend, da bekanntermaßen häufig regionale Unterschiede auftreten und durch zahlreiche Faktoren verursacht werden können, einschließlich Marketingaktionen, fehlerhafter Berichterstellung sowie politischer Faktoren.
Ihre Benutzer benötigen jedoch ein Modell, das weltweit angewendet werden kann. Sie können daher die Auswirkungen einzelner Faktoren auf Vorhersagen minimieren, indem Sie ein Modell erstellen, das auf den aggregierten Zahlen aller Verkäufe weltweit basiert. Sie können dann dieses Modell für Vorhersagen für jede einzelne Region nutzen.
In dieser Aufgabe erstellen Sie alle Datenquellen, die für die erweiterten Vorhersagetasks erforderlich sind. Sie erstellen zwei Datenquellensichten zur Verwendung als Eingaben in die Vorhersageabfrage und eine Datenquellensicht, die beim Erstellen eines neuen Modells zum Einsatz kommt.
Schritte
Vorbereiten der erweiterten Umsatzdaten (für die Vorhersage)
Vorbereiten der aggregierten Daten (zum Erstellen des Modells)
Vorbereiten der Reihendaten (für Kreuzvorhersagen)
Erstellen der neuen erweiterten Umsatzdaten
Um die Umsatzdaten zu aktualisieren, müssen Sie die letzten Umsatzzahlen abrufen. Die Daten aus der Pazifikregion sind von besonderem Interesse, da dort eine regionale Werbeaktion durchgeführt wurde, um neue Niederlassungen einzuführen und ihre Produkte bekannt zu machen.
In diesem Szenario gehen wir davon aus, dass die Daten aus einer Excel-Arbeitsmappe importiert wurden, die neue Daten für einige Regionen über nur drei Monate enthält. Sie erstellen mit einem Transact-SQL-Skript eine Tabelle für die Daten und definieren dann eine Datenquellensicht, die für Vorhersage verwendet werden soll.
Erstellen der Tabelle mit neuen Umsatzdaten
Führen Sie in einem Transact-SQL-Abfragefenster die folgende Anweisung aus, um der Datenbank "AdventureWorksDW" (bzw. einer anderen Datenbank) die Umsatzdaten hinzuzufügen.
USE [database name]; GO IF OBJECT_ID ([dbo].[NewSalesData]) IS NOT NULL DROP TABLE [dbo].[NewSalesData]; GO CREATE TABLE [dbo].[NewSalesData]( [Series] [nvarchar](255) NULL, [NewDate] [datetime] NULL, [NewQty] [float] NULL, [NewAmount] [money] NULL ) ON [PRIMARY] GO
Fügen Sie die neuen Werte mithilfe des folgenden Skripts ein.
INSERT INTO [NewSalesData] (Series,NewDate,NewQty,NewAmount) VALUES('T1000 Pacific', '7/25/08', 55, '$130,170.22'), ('T1000 Pacific', '8/25/08', 50, '$114,435.36 '), ('T1000 Pacific', '9/25/08', 50, '$117,296.24 '), ('T1000 Europe', '7/25/08', 37, '$88,210.00 '), ('T1000 Europe', '8/25/08', 41, '$97,746.00 '), ('T1000 Europe', '9/25/08', 37, '$88,210.00 '), ('T1000 North America', '7/25/08', 69, '$164,500.00 '), ('T1000 North America', '8/25/08', 66, '$157,348.00 '), ('T1000 North America', '9/25/08', 58, '$138,276.00 '), ('M200 Pacific', '7/25/08', 65, '$149,824.35'), ('M200 Pacific', '8/25/08', 54, '$124,619.46'), ('M200 Pacific', '9/25/08', 61, '$141,143.39'), ('M200 Europe', '7/25/08', 75, '$173,026.00'), ('M200 Europe', '8/25/08', 76, '$175,212.00'), ('M200 Europe', '9/25/08', 84, '$193,731.00'), ('M200 North America', '7/25/08', 94, '$216,916.00'), ('M200 North America', '8/25/08', 94, '$216,891.00'), ('M200 North America', '9/25/08', 91,'$209,943.00');
Warnung
Die Anführungszeichen werden mit Währungswerten verwendet, um Probleme mit dem Komma als Trennzeichen und dem Währungssymbol zu verhindern. Sie könnten die Währungswerte auch in diesem Format übergeben:130170.22
Die in der Beispieldatenbank verwendeten Datumsangaben wurden für diese Version geändert. Wenn Sie eine frühere Edition von AdventureWorks verwenden, müssen Sie die eingefügten Datumsangaben ggf. anpassen.
Erstellen einer Datenquellensicht mit den neuen Umsatzdaten
In Projektmappen-Explorer, mit der rechten Maustaste Datenquellensichten, und wählen Sie dann Neue Datenquellensicht.
Treffen Sie im Datenquellensicht-Assistenten die folgende Auswahl:
Datenquelle: Adventure Works DW Multidimensional 2012
Wählen Sie Tabellen und Sichten: Wählen Sie die Tabelle, die Sie gerade erstellt haben, NewSalesData.
Klicken Sie auf Fertig stellen.
Klicken Sie in der Entwurfsoberfläche der Datenquellensicht mit der rechten Maustaste NewSalesData, und wählen Sie Daten durchsuchen die Daten überprüfen.
Warnung
Sie verwenden diese Daten nur für Vorhersagen; daher ist es nicht wichtig, dass sie unvollständig sind.
Erstellen der Daten für das Kreuzvorhersage-Modell
Die Daten in der ursprünglichen zur Prognose Modell wurde bereits teilweise durch die vTimeSeries-Sicht, die mehrere Fahrradmodelle in eine kleinere Anzahl von Kategorien und die Ergebnisse einzelner Länder in Regionen zusammengeführt gruppiert werden. Sie erstellen ein Modell, das für weltweite Prognosen verwendet werden kann, indem Sie direkt im Datenquellensicht-Designer einige zusätzliche einfache Aggregationen erstellen. Die neue Datenquellensicht enthält nur die Summe und den Durchschnitt der Umsätze aller Produkte in allen Regionen.
Nachdem Sie die für das Modell verwendete Datenquelle erstellt haben, müssen Sie eine neue Datenquellensicht erstellen, die für Vorhersage verwendet werden soll. Wenn Sie z. B. die Umsätze in Europa mit dem neuen weltweite Modell vorhersagen möchten, dürfen Sie nur Daten aus der Region Europa eingeben. Daher richten Sie eine neue Datenquellensicht ein, die die ursprünglichen Daten filtert, und ändern die Filterbedingung für jeden Satz von Vorhersageabfragen.
So erstellen Sie die Modelldaten mithilfe einer benutzerdefinierten Datenquellensicht
In Projektmappen-Explorer, mit der rechten Maustaste Datenquellensichten, und wählen Sie dann Neue Datenquellensicht.
Klicken Sie auf der Begrüßungsseite des Assistenten auf Weiter.
Wählen Sie auf der Seite Datenquelle auswählen Adventure Works DW Multidimensional 2012aus und klicken Sie dann auf Weiter.
Fügen Sie auf der Seite Tabellen und Sichten auswählenkeine Tabellen hinzu – klicken Sie nur auf Weiter+.
Geben Sie auf der Seite Assistenten abschließenden Namen AllRegionsein und klicken Sie anschließend auf Fertig stellen.
Rechten Maustaste auf die Entwurfsoberfläche der Datenquellensicht leere Daten, und wählen Sie dann neue benannte Abfrage.
Geben Sie im Dialogfeld Benannte Abfrage erstellen im Feld Nameden Namen AllRegionsein und geben Sie im Feld Beschreibungdie Beschreibung Summen- und Durchschnittswerte der Verkäufe für alle Modelle und Regionenein.
Geben Sie im SQL-Textbereich die folgende Anweisung ein, und klicken Sie dann auf "OK":
SELECT ReportingDate, SUM ([Quantity]) as SumQty, AVG ([Quantity]) as AvgQty, SUM ([Amount]) AS SumAmt, AVG ([Amount]) AS AvgAmt, 'All Regions' as [Region] FROM dbo.vTimeSeries GROUP BY ReportingDate
Mit der rechten Maustaste die AllRegions Tabelle, und wählen Sie dann Daten durchsuchen.
So erstellen Sie die Reihendaten für die Kreuzvorhersage
In Projektmappen-Explorer, mit der rechten Maustaste Datenquellensichten, und wählen Sie dann Neue Datenquellensicht.
Treffen Sie im Datenquellensicht-Assistenten die folgende Auswahl:
Datenquelle: Adventure Works DW Multidimensional 2012
Tabellen und Sichten auswählen: keine Auswahl
Namen: T1000 Pacific Region
Klicken Sie auf Fertig stellen.
Mit der rechten Maustaste in der leere Entwurfsoberfläche für T1000 Pacific Region.dsv, und wählen Sie dann neue benannte Abfrage.
Das Dialogfeld Benannte Abfrage erstellen wird geöffnet. Geben Sie den Namen erneut ein und fügen Sie die folgende Beschreibung hinzu:
Namen: T1000 Pacific Region
Beschreibung: vTimeSeriesnach Region und Modellfiltern
Geben Sie im Textbereich die folgende Abfrage ein, und klicken Sie dann auf "OK":
SELECT ReportingDate, ModelRegion, Quantity, Amount FROM dbo.vTimeSeries WHERE (ModelRegion = N'T1000 Pacific')
Hinweis
Da Sie Vorhersagen für jede Reihe getrennt erstellen müssen, könnten Sie den Abfragetext kopieren und als Textdatei speichern, damit Sie ihn für die andere Datenreihe erneut verwenden können.Klicken Sie in der Entwurfsoberfläche der Datenquellensicht mit der rechten Maustaste T1000 Pacific, und wählen Sie Daten durchsuchen zu überprüfen, ob die Daten ordnungsgemäß gefiltert werden.
Sie verwenden diese Daten als Eingabe in das Modell, wenn Sie Abfragen für Kreuzvorhersagen erstellen.
Nächste Aufgabe in der Lektion
Zeitreihenvorhersagen mit aktualisierten Daten ( Intermediate Data Mining-Lernprogramm )
Siehe auch
Microsoft Time Series-Algorithmus
Technische Referenz für den Microsoft Time Series-Algorithmus
Datenquellsichten in mehrdimensionalen Modellen