Lektion 1: Erstellen eines Miningmodells und einer Miningstruktur für eine Zeitreihe

In dieser Lektion erstellen Sie ein Miningmodell, mit dem Sie auf Basis von Vergangenheitsdaten Werte für einen Zeitraum vorhersagen können. Beim Erstellen des Modells wird die zugrunde liegende Struktur automatisch generiert und kann als Basis für weitere Miningmodelle verwendet werden.

In dieser Lektion wird davon ausgegangen, dass Sie mit Forecasting-Modellen sowie mit den Anforderungen des Microsoft Time Series-Algorithmus vertraut sind. Weitere Informationen finden Sie unter Microsoft Time Series-Algorithmus.

CREATE MINING MODEL-Anweisung

Mit der CREATE MINING MODEL (DMX)-Anweisung können Sie ein Miningmodell direkt erstellen und die zugrunde liegende Miningstruktur automatisch generieren. Der in der Anweisung enthaltene Code umfasst folgende Abschnitte:

  • Benennen des Modells

  • Definieren des Zeitstempels

  • Definieren der optionalen Reihenschlüsselspalte

  • Definieren der vorhersagbaren Attribute

Es folgt ein allgemeines Beispiel für die CREATE MINING MODEL-Anweisung:

CREATE MINING MODEL [<Mining Structure Name>]
(
   <key columns>,
   <predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH

Die erste Codezeile definiert den Namen des Miningmodells:

CREATE MINING MODEL [Mining Model Name]

Der Name für die zugrunde liegende Struktur wird von Analysis Services automatisch generiert, indem "_structure" an den Modellnamen angefügt wird. Dadurch ist sichergestellt, dass sich der Strukturname vom Modellnamen unterscheidet. Weitere Informationen zum Benennen eines Objekts in DMX finden Sie unter Bezeichner (DMX).

Die nächste Codezeile definiert die Schlüsselspalte für das Miningmodell, mit der bei einem Zeitreihenmodell ein Zeitschritt in den Quelldaten eindeutig identifiziert wird. Der Zeitschritt wird mit den KEY TIME-Schlüsselwörtern im Anschluss an den Spaltennamen und die Datentypen identifiziert. Wenn ein Zeitreihenmodell über einen separaten Reihenschlüssel verfügt, wird es anhand des KEY-Schlüsselworts identifiziert.

<key columns>

Die nächste Codezeile definiert die Spalten im Modell, die vorhergesagt werden. Sie können mehrere vorhersagbare Attribute in einem Miningmodell verwenden. Bei mehreren vorhersagbaren Attributen wird vom Microsoft Time Series-Algorithmus eine separate Analyse für jede Reihe generiert:

<predictable attribute columns>

Lektionsaufgaben

Im Rahmen dieser Lektion führen Sie die folgenden Aufgaben aus:

  • Erstellen einer neuen leeren Abfrage

  • Ändern der Abfrage zum Erstellen des Miningmodells

  • Ausführen der Abfrage

Erstellen einer Abfrage

Im ersten Schritt stellen Sie eine Verbindung zu einer Instanz von Analysis Services her und erstellen eine neue DMX-Abfrage in SQL Server Management Studio.

So erstellen Sie eine neue DMX-Abfrage in SQL Server Management Studio

  1. Öffnen Sie SQL Server Management Studio.

  2. Wählen Sie im Dialogfeld Verbindung mit Server herstellen für Servertyp die Option Analysis Services aus. Geben Sie in Servername den Namen LocalHost oder den Namen der Instanz von Analysis Services ein, mit der Sie im Rahmen dieser Lektion eine Verbindung herstellen möchten. Klicken Sie auf Verbinden.

  3. Klicken Sie im Objekt-Explorer mit der rechten Maustaste auf die Instanz von Analysis Services, zeigen Sie auf Neue Abfrage, und klicken Sie dann auf DMX.

    Der Abfrage-Editor wird mit einer neuen leeren Abfrage geöffnet.

Ändern der Abfrage

Im nächsten Schritt ändern Sie die CREATE MINING MODEL-Anweisung und erstellen das Miningmodell für Vorhersagen mit der zugrunde liegenden Struktur.

So passen Sie die CREATE MINING MODEL-Anweisung an

  1. Kopieren Sie im Abfrage-Editor das allgemeine Beispiel der CREATE MINING MODEL-Anweisung in die leere Abfrage.

  2. Ersetzen Sie Folgendes:

    [mining model name] 
    

    durch:

    [Forecasting_MIXED]
    
  3. Ersetzen Sie Folgendes:

    <key columns>
    

    durch:

    [Reporting Date] DATE KEY TIME,
    [Model Region] TEXT KEY
    

    Das TIME KEY-Schlüsselwort gibt an, dass die ReportingDate-Spalte die Zeitschrittwerte enthält, die zur Sortierung der Werte verwendet werden. Zeitschritte können Daten und Uhrzeiten, Ganzzahlen oder jeder beliebige geordnete Datentyp sein; die Werte müssen lediglich eindeutig und sortiert sein.

    Das TEXT-Schlüsselwort und KEY-Schlüsselwort geben an, dass die ModelRegion-Spalte einen weiteren Reihenschlüssel enthält. Sie können nur einen Reihenschlüssel verwenden, und die Werte in der Spalte müssen unterschiedlich sein.

  4. Ersetzen Sie Folgendes:

    < predictable attribute columns> )
    

    durch:

        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    
  5. Ersetzen Sie Folgendes:

    USING <algorithm name>([parameter list])
    WITH DRILLTHROUGH
    

    durch:

    USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    

    Der Algorithmusparameter AUTO_DETECT_PERIODICITY = 0,8 gibt an, dass Zyklen in den Daten vom Algorithmus erkannt werden sollen. Das Festlegen dieses Werts näher bei 1 begünstigt die Erkennung vieler fast Muster, verlangsamt jedoch die Verarbeitung.

    Der Algorithumsparameter FORECAST_METHOD gibt an, dass die Daten mit ARTXP, ARIMA oder einer Kombination aus beiden analysiert werden sollen.

    Das Schlüsselwort WITH DRILLTHROUGH gibt an, dass detaillierte Statistiken in den Quelldaten verfügbar sein sollen, sobald das Modell vollständig ist. Diese Klausel muss hinzugefügt werden, wenn Sie das Modell mit dem Microsoft Time Series-Viewer durchsuchen möchten. Für Vorhersagen ist die Klausel nicht erforderlich.

    Die gesamte Anweisung sollte wie folgt aussehen:

    CREATE MINING MODEL [Forecasting_MIXED]
         (
        [Reporting Date] DATE KEY TIME,
        [Model Region] TEXT KEY,
        [Quantity] LONG CONTINUOUS PREDICT,
        [Amount] DOUBLE CONTINUOUS PREDICT
        )
    USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')
    WITH DRILLTHROUGH
    
  6. Klicken Sie im Menü Datei auf DMXQuery1.dmx speichern unter.

  7. Wechseln Sie im Dialogfeld Speichern unter in den entsprechenden Ordner, und geben Sie der Datei den Namen Forecasting_MIXED.dmx.

Ausführen der Abfrage

Im letzten Schritt führen Sie die Abfrage aus. Nachdem Sie eine Abfrage erstellt und gespeichert haben, muss diese ausgeführt werden, damit das Miningmodell und die Miningstruktur auf dem Server erstellt werden. Weitere Informationen zum Ausführen von Abfragen im Abfrage-Editor finden Sie unter Abfrage-Editor-Fenster des Datenbankmoduls von SQL Server Management Studio.

So führen Sie die Abfrage aus

  • Klicken Sie auf der Symbolleiste im Abfrage-Editor auf Ausführen.

    Der Status der Abfrage wird auf der Registerkarte Meldungen am unteren Rand des Abfrage-Editors angezeigt, nachdem die Ausführung der Anweisung beendet wurde. Die Meldung sollte Folgendes anzeigen:

    Executing the query 
    Execution complete
    

    Auf dem Server ist nun die neue Struktur Forecasting_MIXED_Structure zusammen mit dem verwandten Miningmodell Forecasting_MIXED vorhanden.

In der nächsten Lektion fügen Sie der Forecasting_MIXED-Miningstruktur, die Sie gerade erstellt haben, ein Miningmodell hinzu.