Hinzufügen eines aggregierten Forecasting-Modells (Data Mining-Lernprogramm für Fortgeschrittene)

Aus der Untersuchung des Forecasting-Modells haben Sie erkannt, dass die Verkäufe in den meisten Regionen einem bestimmten Muster folgen. Einige Regionen und Modelle wie das Modell M200 im Pazifischen Raum weisen jedoch deutlich abweichende Trends auf. Unterschiede zwischen einzelnen Regionen treten häufig auf und können durch zahlreiche Faktoren verursacht werden, einschließlich Marketingaktionen, fehlerhafter Berichterstellung sowie politischer Faktoren.

Sie können die Auswirkungen dieser Faktoren auf Projektionen minimieren, indem Sie ein allgemeines Miningmodell erstellen, das auf den aggregierten Zahlen aller Verkäufe weltweit basiert. Anschließend können Sie Vorhersagen mit diesem Modell treffen und auf einzelne Regionen anwenden. Abschließend vergleichen Sie die Vorhersagen für die verschiedenen Produkte.

Erstellen der Daten für das allgemeine Modell

Der erste Schritt zum Erstellen des allgemeinen Modells besteht im Aggregieren der weltweiten Verkaufszahlen. Zu diesem Zweck können Sie eine spezielle Datenquellensicht erstellen, die eine vorhandene Datenquelle verwendet, jedoch Berechnungen wie Summen oder Durchschnittswerte ausführt.

So erstellen Sie eine Datenquellensicht mithilfe einer benutzerdefinierten Abfrage oder Berechnung

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Datenquellensichten und wählen Sie dann Neue Datenquellensicht aus.

  2. Klicken Sie auf der Begrüßungsseite des Assistenten auf Weiter.

  3. Wählen Sie auf der Seite Datenquelle auswählenAdventure Works DW2008R2 aus und klicken Sie dann auf Weiter.

  4. Klicken Sie auf der Seite Tabellen und Sichten auswählen auf Weiter.

  5. Geben Sie auf der Seite Assistenten abschließen den Namen AllRegions ein und klicken Sie dann auf Fertig stellen.

  6. Klicken Sie danach mit der rechten Maustaste auf die leere Entwurfsoberfläche der Datenquellensicht und wählen Sie Neue benannte Abfrage aus.

  7. Geben Sie im Dialogfeld Benannte Abfrage erstellen im Feld Name den Namen AllRegions ein und geben Sie im Feld Beschreibung die Beschreibung Sum and average of sales for all models and regions ein.

  8. Geben Sie die folgende Anweisung im SQL-Textbereich ein:

    SELECT ReportingDate, 
    SUM([Quantity]) as SumQty, AVG([Quantity]) as AvgQty,
    SUM([Amount]) AS SumAmt, AVG([Amount]) AS AvgAmt,
    'All Regions' as [Region]
    FROM dbo.vTimeSeries 
    GROUP BY ReportingDate
    
  9. Klicken Sie auf OK..

  10. Klicken Sie mit der rechten Maustaste auf die Tabelle AllRegions und wählen Sie dann Daten durchsuchen aus.

    Die neue Datenquellensicht enthält einen Summen- und einen Durchschnittswert für alle verkauften Produkte weltweit. Die Verkäufe können auch nach Modell gruppiert und aggregiert werden. In dieser Lektion erstellen Sie jedoch ein einzelnes Zeitreihenmodell für Vorhersagen mit einer beliebigen Kombination aus Region und Produkt.

Nachdem Sie die Datensicht erstellt haben, müssen Sie eine neue Miningstruktur und ein Miningmodell auf Basis dieser Struktur erstellen. Inzwischen sollten Sie mit dem Erstellen einer Miningstruktur vertraut sein. Die nachfolgenden Anweisungen wurden daher vereinfacht.

So erstellen Sie eine Miningstruktur und ein Miningmodell mit den aggregierten Daten

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Miningstrukturen und wählen Sie dann Neue Miningstruktur aus, um den Data Mining-Assistenten zu starten.

  2. Wählen Sie im Data Mining-Assistenten folgende Optionen aus:

    • Algorithmus: Microsoft Time Series

    • Datenquellensicht: AllRegions

    • Schlüssel: ReportingDate (Key Time) und Region (Key)

    • Input und Predict: AvgAmt, AvgQty, SumAmt und SumQty

    • Miningstrukturname: All Regions

    • Miningmodellname: All Regions

  3. Verarbeiten Sie die Struktur und das Modell.

Anzeigen der Ergebnisse

Bevor Sie eine Entscheidung über das allgemeine Modell für weltweite Projektionen treffen, sollten Sie ausreichend mit Projektionen vertraut sein. Eine Betrachtung der Miningmodelle und Vorhersagen für die verschiedenen aggregierten Reihen im Microsoft Time Series-Viewer wirft verschiedene Fragen auf:

  • Bis Juni 2006 folgen alle Trendlinien nahezu dem gleichen Muster. Ab diesem Zeitpunkt weisen die Linien für Menge und Summe unterschiedliche Verläufe auf. Was hat die Änderung verursacht?

  • Im Juli 2008 laufen die Linien erneut auseinander. Worin besteht die Ursache?

  • Bedenken Sie, dass die Vorhersagen für die Reihe M200 North America deutlich höher ausgefallen sind als für die anderen Produkte und Regionen. Sie befürchten, die Projektionen könnten fehlerhaft sein und eine Einbeziehung dieser Reihe könnte das allgemeine Modell verfälschen, das Sie erstellt haben.

In der nächsten Aufgabe vergleichen Sie die Trendlinien und Vorhersagen für die einzelnen Reihenmodelle mit den Modellen auf Basis von aggregierten Daten, um zu sehen, wie sich die zugrunde liegenden Daten auf das Modell auswirken.

Wenn Sie sicher sind, dass das Modell richtig ist und Sie ein ausreichendes Verständnis der Ergebnisse besitzen, können Sie mit der Aufgabe Treffen von Vorhersagen mit dem gemittelten Forecasting-Modell (Data Mining-Lernprogramm für Fortgeschrittene) fortfahren.