Erstellen von Zeitreihenvorhersagen mit Ersetzungsdaten (Data Mining-Lernprogramm für Fortgeschrittene)

 

Gilt für: SQL Server 2016 Preview

In dieser Aufgabe erstellen Sie auf Grundlage weltweiter Umsatzdaten ein neues Modell. Sie erstellen dann eine Vorhersageabfrage, mit der Sie das weltweite Umsatzmodell auf eine einzelnen Region anwenden.

Erstellen eines allgemeinen Modells

Denken Sie daran, dass die Analyse der Ergebnisse des ursprünglichen Miningmodells große Unterschiede zwischen Regionen und Produktreihen aufgedeckt hat. Das M200-Modell verzeichnete beispielsweise einen starken Umsatz für Nordamerika, was für die Verkäufe des T1000-Modells nicht der Fall war. Die Analyse wurde dadurch erschwert, dass einige Reihen nicht über aussagekräftige Daten verfügten bzw. der Zeitpunkt für den Beginn der Daten unterschiedlich war. Darüber hinaus fehlten einige Daten.

Reihenvorhersagen für Mengen M200 und T1000

Um einige dieser Data Quality-Probleme zu beheben, entscheiden Sie sich für eine Zusammenführung der weltweiten Umsatzdaten, um aus diesem Satz allgemeiner Verkaufstrends ein allgemeines Modell zu erstellen, mit dem zukünftige Verkäufe in einer beliebigen Region vorhergesagt werden können.

Wenn Sie Vorhersagen erstellen, wenden Sie das an den weltweiten Umsatzdaten trainierte Muster an, ersetzen aber die Vergangenheitsdaten-Punkte durch die Umsatzdaten jeder einzelnen Region. So wird die Form des Trends beibehalten, während die vorhergesagten Werte an den historischen Umsatzzahlen für jede Region und jedes Modell ausgerichtet werden.

Kreuzvorhersagen mit einem Zeitreihenmodell

Das Verfahren, die Daten aus einer Reihe zur Vorhersage von Trends in einer anderen Reihe zu verwenden, wird "Kreuzvorhersage" genannt. Sie können Kreuzvorhersagen in vielen Szenarien verwenden: Sie könnten z. B. entscheiden, dass die Verkäufe von Fernsehern gute Rückschlüsse bei der Vorhersage der wirtschaftlichen Aktivität allgemein sind, und wenden ein an Umsatzdaten von Fernsehern trainiertes Modell auf allgemeine Wirtschaftsdaten an.

In SQL Server Data Mining führen Sie kreuzvorhersagen mit dem Parameter REPLACE_MODEL_CASES innerhalb der Argumente der Funktion PredictTimeSeries ( DMX ).

In der nächsten Aufgabe lernen Sie, wie REPLACE_MODEL_CASES verwendet wird. Sie erstellen aus den zusammengeführten Weltumsatzdaten ein Modell und dann eine Vorhersageabfrage, die das allgemeine Modell den Ersatzdaten zuordnet.

Es wird davon ausgegangen, dass Sie inzwischen mit dem Erstellen von Data Mining-Modelle vertraut sind; daher wurden die Anweisungen zum Erstellen des Modells vereinfacht.

So erstellen Sie eine Miningstruktur und ein Miningmodell mit den aggregierten Daten

  1. In Projektmappen-Explorer, mit der rechten Maustaste Miningstrukturen, und wählen Sie dann Neue Miningstruktur Data Mining-Assistenten zu starten.

  2. Wählen Sie im Data Mining-Assistenten folgende Optionen aus:

    • Algorithmus: Microsoft Time Series

    • Verwenden Sie die Datenquelle, die Sie in dieser fortgeschrittenen Lektion bereits als Quelle für das Modell erstellt haben. Finden Sie unter Erweiterte Zeitreihenvorhersagen ( Datamining-Lernprogramm für fortgeschrittene ).

      Datenquellensicht: AllRegions

    • Wählen Sie die folgenden Spalten für den Reihenschlüssel und den Zeitschlüssel aus:

      Schlüsselzeit: Berichtsdatum

      Schlüssel: Region

    • Wählen Sie die folgenden Spalten für Eingabe und Predict:

      SumQty

      SumAmt

      AvgAmt

      AvgQty

    • Für Miningstrukturname, Typ: alle Regionen

    • Für Miningmodellname, Typ: alle Regionen

  3. Verarbeiten Sie die neue Struktur und das neue Modell.

So erstellen Sie die Vorhersageabfrage und ordnen Ersetzungsdaten zu

  1. Wenn das Modell nicht bereits geöffnet ist, doppelklicken Sie auf die AllRegions-Struktur, und klicken Sie im Data Mining-Designer auf die Miningmodellvorhersage Registerkarte.

  2. In der Miningmodell Bereich, das Modell AllRegions bereits ausgewählt sein sollte. Wenn sie nicht ausgewählt ist, klicken Sie auf Modell auswählen, und wählen Sie dann das AllRegions-Modell.

  3. In der Eingabetabelle(n) Bereich, klicken Sie auf Falltabelle auswählen.

  4. In der Tabelle auswählen (Dialogfeld), Änderung, die Datenquelle zu T1000 Pacific Region, aus, und klicken Sie dann auf OK.

  5. Mit der rechten Maustaste der Joinlinie zwischen dem Miningmodell und die Eingabedaten, und wählen Sie Verbindungen ändern. Ordnen Sie die Daten in der Datenquellensicht wie folgt dem Modell zu:

    1. Stellen Sie sicher, dass die ReportingDate-Spalte im Miningmodell der ReportingDate-Spalte in den Eingabedaten zugeordnet ist.

    2. In der Zuordnung ändern Klicken Sie im Dialogfeld in der Zeile für die Spalte des Modells AvgQty unter Tabellenspalte und wählen Sie T1000 Pacific.Quantity. Klicken Sie auf OK.

      In diesem Schritt ordnen Sie die Spalte zu, die Sie im Modell für die Vorhersage der Durchschnittsmenge aus den tatsächlichen Umsatzdaten der Reihe T1000 erstellt haben.

    3. Die Spalte Region im Modell werden keine Eingabespalte zugeordnet werden.

      Da die Daten aller Reihen im Modell aggregiert sind, findet kein Abgleich der Reihenwerte wie T1000 Pacific statt, und bei der Ausführung der Vorhersageabfrage wird ein Fehler ausgegeben.

  6. Nun erstellen Sie die Vorhersageabfrage.

    Fügen Sie zunächst den Ergebnissen eine Spalte hinzu, die die Bezeichnung "AllRegions" aus dem Modell zusammen mit den Vorhersagen ausgibt. So wissen Sie, dass die Ergebnisse auf dem allgemeinen Modell basieren.

    1. Klicken Sie im Raster auf die erste leere Zeile unter Quelle, und wählen Sie AllRegions-Miningmodell.

    2. Für Feld, wählen Sie Region.

    3. Für Alias, Typ Modell verwendet.

  7. Im nächsten Schritt fügen Sie den Ergebnissen eine weitere Bezeichnung hinzu, der Sie entnehmen können, auf welche Reihe sich die Vorhersage bezieht.

    1. Klicken Sie auf eine leere Zeile, und wählen Sie unter Quelle, Option benutzerdefinierter Ausdruck.

    2. In der Alias Geben Sie die Spalte ModelRegion.

    3. In der Kriterium/Argument Geben Sie die Spalte 'T1000 Pacific'.

  8. Nun richten Sie die Funktion für die Kreuzvorhersage ein.

    1. Klicken Sie auf eine leere Zeile, und wählen Sie unter Quelle, Option Vorhersagefunktion.

    2. In der Feld Spalte PredictTimeSeries.

    3. Für Alias, Typ Predicted Values.

    4. Ziehen Sie das AvgQty-Feld aus der Miningmodell -Bereich in der Kriterium/Argument Spalte mithilfe des Drag & Drop-Vorgangs.

    5. In der Kriterium/Argument Spalte nach dem Namen des Felds geben Sie den folgenden Text: ,5, REPLACE_MODEL_CASES

      Den vollständigen Text der Kriterium/Argument Textfeld sollte wie folgt lauten: [AllRegions].[AvgQty],5,REPLACE_MODEL_CASES

  9. Klicken Sie auf Ergebnisse.

Erstellen der Kreuzvorhersage-Abfrage in DMX

Möglicherweise ist Ihnen ein Problem aufgefallen, das bei Kreuzvorhersagen besteht: Sie müssen nämlich für jede Reihe eine neue Abfrage erstellen, um so das allgemeine Modell auf andere Datenreihen anwenden und jeden Satz von Eingaben dem Modell zuordnen zu können.

Sie haben aber die Möglichkeit, die Abfrage nicht im Designer zu erstellen, sondern zu DMX zu wechseln und die von Ihnen erstellte DMX-Anweisung zu bearbeiten. Die folgende DMX-Anweisung stellt beispielsweise die Abfrage dar, die Sie gerade erstellt haben:

SELECT  
      ([All Regions].[Region]) as [Model Used],  
      ('T-1000 Pacific') as [ModelRegion],  
      (PredictTimeSeries([All Regions].[Avg Qty],5, REPLACE_MODEL_CASES)) as [Predicted Quantity]  
     FROM [All Regions]  
PREDICTION JOIN  
    OPENQUERY([Adventure Works DW2003R2], 'SELECT [ReportingDate] FROM  
      (  
       SELECT  ReportingDate, ModelRegion, Quantity, Amount   
       FROM dbo.vTimeSeries   
       WHERE (ModelRegion = N''T1000 Pacific'')  
       ) as [T1000 Pacific]    ')   
    AS t  
ON   
[All Regions].[Reporting Date] = t.[ReportingDate]   
AND   
[All Regions].[Avg Qty] = t.[Quantity]  

Wenn Sie sie auf ein anderes Modell anwenden möchten, müssen Sie nur die Filterbedingung im Abfrageausdruck ersetzen und die mit den einzelnen Ergebnissen verknüpften Bezeichnungen aktualisieren.

Wenn Sie beispielsweise die Filterbedingungen und die Spaltenbezeichnungen ändern, indem Sie "Pacific" durch "North America" ersetzen, erhalten Sie Vorhersagen für das T1000-Produkt in Nordamerika auf Basis des allgemeinen Modells.

Nächste Aufgabe in der Lektion

Vergleich von Vorhersagen für Forecasting-Modelle ( Datamining-Lernprogramm für fortgeschrittene )

Siehe auch

Abfragebeispiel Zeitreihenmodell
PredictTimeSeries (DMX)