Prüfen des Forecasting-Modells (Data Mining-Lernprogramm für Fortgeschrittene)

Sie haben das Miningmodell Forecasting erstellt und können jetzt die Ergebnisse auf der Registerkarte Miningmodell-Viewer des Data Mining-Designers überprüfen. Der Microsoft Time Series Viewer umfasst zwei Registerkarten: Diagramme und Modell.

Das Miningmodell Forecasting, das Sie erstellt haben, beschreibt den Produktvertrieb in Europa, Nordamerika sowie im pazifischen Raum zwischen 2001 und 2004. Dementsprechend wird vom Microsoft Time Series-Algorithmus ein Zeitreihenmodell mit mehreren Strukturen erstellt, die jeweils eine unterschiedliche Kombination aus Region, Produkt und vorhersagbarem Attribut enthalten.

Jede Registerkarte im Viewer ermöglicht eine spezifische Ansicht der Informationen im vollständigen Zeitreihenmodell.

  • Registerkarte "Diagramme"

  • Registerkarte "Modell"

  • Generic Content Viewer

Registerkarte Diagramme

Auf der Registerkarte Diagramme des Microsoft Time Series Viewers können Sie die Strukturen überprüfen, die vom Algorithmus angelegt werden. Eine Zeitreihenstruktur enthält eine eindeutige Kombination aus Produkt, Region und vorhersagbarem Attribut.

In der Legende rechts im Viewer werden die Zeitreihen aufgelistet, die in der Dropdownliste ausgewählt sind. Für jede Zeitreihe ist ein Kontrollkästchen vorhanden. Indem Sie die Kontrollkästchen in der Legende aktivieren oder deaktivieren, können Sie steuern, welche Zeitreihen im Viewer angezeigt werden.

Sie können auch Anzeigeoptionen wie die Farbe für die einzelnen Zeitreihen ändern oder Werte an beliebigen Punkten im Diagramm anzeigen.

So wählen Sie eine Zeitreihe aus

  1. Klicken Sie ggf. auf der Registerkarte Miningmodell-Viewer auf die Registerkarte Diagramme, um diese anzuzeigen.

  2. Klicken Sie auf die Dropdownliste rechts neben der Diagrammansicht, und aktivieren Sie alle Kontrollkästchen. Das Diagramm sollte 24 verschiedene Reihenlinien enthalten.

  3. Klicken Sie auf OK.

  4. Deaktivieren Sie die entsprechenden Kontrollkästchen rechts neben dem Diagramm, um die Linien für alle Reihen vorübergehend auszublenden, die auf Amount basieren.

  5. Deaktivieren Sie jetzt die Kontrollkästchen, die sich auf die Fahrradmodelle R750 und R250 beziehen.

    Das Diagramm enthält nur noch 6 Reihenlinien, und Sie können die Trends für die Modelle M200 und T1000 nun leichter vergleichen.

    • M200 Europe: Quantity

    • M200 North America: Quantity

    • M200 Pacific: Quantity

    • T1000 Europe: Quantity t

    • T1000 North America: Quantity

    • T1000 Pacific: Quantity

Zeitreihenvorhersagen für Mengen M200 und T1000Zeitreihenvorhersagen für Mengen M200 und T1000

Im Diagramm werden Vergangenheits- und Vorhersagedaten angezeigt. Die Vorhersagedaten sind schattiert dargestellt, um sie von den Vergangenheitsdaten abzugrenzen. Sie können die Farben der Linien im Diagramm auch ändern, um eine Unterscheidung zu erleichtern. Weitere Informationen finden Sie unter Vorgehensweise: Ändern der Farben im Data Mining-Viewer.

Die Trendlinien zeigen, dass die Gesamtumsätze für alle Regionen in der Regel ansteigen, wobei alle 12 Monate im Dezember Spitzenwerte verzeichnet werden. In den Vorhersagen wird dieser Trend im Allgemeinen fortgesetzt. Anhand des Diagramms können Sie ferner erkennen, dass der Startpunkt für die Daten des Modells T1000 gegenüber den Daten für andere Produktreihen deutlich nach hinten verschoben ist.

Standardmäßig werden fünf Vorhersageschritte von Analysis Services für jede Zeitreihe angezeigt. Sie können diesen Wert ändern, um mehr oder weniger Vorhersageschritte anzuzeigen. Eine graphische Ansicht der Standardabweichung für die Vorhersage erhalten Sie durch Hinzufügen von Abweichungsbalken zum Diagramm.

So ändern Sie Vorhersage- und Anzeigeoptionen für die Diagrammsicht

  1. Ändern Sie den Wert für Vorhersageschritte schrittweise von 5 in 10 und anschließend wieder in 6.

    Bei Trendlinien mit starken Schwankungen in den Vergangenheitsdaten verstärken sich die Schwankungen in der Vorhersage.

  2. Aktivieren Sie das Kontrollkästchen Abweichungen anzeigen.

  3. Zeigen Sie mit der Maus auf die Abweichungsbalken für die M200-Reihe.

  4. Zeigen Sie mit der Maus auf die Abweichungsbalken für die T1000-Reihe.

Diese Ergebnisse werden für weitere Untersuchungen verwendet. Später entwickeln Sie ein Modell mit Mittelwerten für alle Regionen, bei dem Abweichungen keine nennenswerte Rolle spielen.

Zurück zum Anfang

Registerkarte 'Modell'

Auf der Registerkarte Modell des Microsoft Time Series-Viewers im Data Mining-Designer können Sie die Zeitreihe als Entscheidungsstrukturdiagramm anzeigen. Für jede Reihe im Modell wird eine separate Struktur berechnet. Bei linearen Zeitreihen kann das Entscheidungsstrukturdiagramm in einem Zeitreihenmodell einen einzelnen Knoten aufweisen, oder das Diagramm kann – analog zu regulären Entscheidungsstrukturen – auch mehrere Knoten und Bedingungen für jede Verzweigung aufweisen.

Die Knoten im Entscheidungsstrukturdiagramm für eine Zeitreihe enthalten verschiedene Arten von Informationen:

  • Die Bündelung der Fälle für den Status des vorhersagbaren Attributs, die im Steuerelement Hintergrund angegeben ist. Sowohl das Fenster Mininglegende für den Knoten als auch die QuickInfo, die angezeigt wird, wenn Sie den Mauszeiger auf ein Objekt in der Struktur setzen, geben die genaue Anzahl von Fällen an.

  • Die Regressionsformel für den Knoten. Die ARTXP-Regressionsformel ist nur in den Blattknoten verfügbar. Die ARIMA-Gleichung ist im Stammknoten der Struktur verfügbar.

  • Ein Rautendiagramm, das den Bereich des Attributs darstellt. Die Raute befindet sich in der Mitte des Knotens. Die Breite der Raute gibt die Varianz des Attributs an diesem Knoten an.

So zeigen Sie die Entscheidungsstruktur für ein Zeitreihenmodell an

  1. Wählen Sie auf der Registerkarte Modell in der Liste Struktur die Reihe M200 North America: Amount aus.

    Ein einzelner Knoten wird im Diagramm angezeigt.

  2. Zeigen Sie mit der Maus auf den Knoten.

    Bei einem Alle-Knoten enthält die angezeigte QuickInfo Informationen wie die Anzahl der Fälle in der vollständigen Reihe sowie aus der Analyse der Daten abgeleitete Zeitreihengleichungen.

  3. Klicken Sie auf den Knoten, und zeigen Sie die Mininglegende an.

    Die Mininglegende enthält neben ähnlichen Informationen wie die QuickInfo noch weitere Informationen wie ein Histogramm der Werte.

  4. Wählen Sie auf der Registerkarte Modell in der Liste Struktur die Reihe M200 Pacific: Amount aus.

    Das Strukturdiagramm enthält jetzt einen Alle-Knoten und zwei untergeordnete Knoten. Der Text in den untergeordneten Knoten beschreibt die Bedingungen für die Unterteilung der Struktur.

  5. Zeigen Sie mit der Maus auf einen untergeordneten Knoten, und überprüfen Sie den Inhalt der QuickInfo. Sie können auch auf Knoten klicken und die Mininglegende anzeigen.

    Bei untergeordneten Knoten enthält die Beschreibung die Anzahl der Fälle in jeder Verzweigung der Struktur sowie zusätzliche Bedingungen für die Unterteilung der Struktur.

Zurück zum Anfang

Generic Content Tree Viewer

Neben dem benutzerdefinierten Viewer für Zeitreihen wird der MicrosoftGeneric Content Tree-Viewer von Analysis Services bereitgestellt. Dieser Viewer kann unabhängig vom Algorithmus oder Modelltyp für alle Data Mining-Modelle verwendet werden. Der Generic Content Tree Viewer ist in der Dropdownliste Viewer verfügbar.

Unabhängig von den Daten oder dem Algorithmus, die für die Analyse verwendet wurden, werden alle Miningmodelle in diesem Viewer als Struktur mit einer Reihe von Knoten dargestellt. Jeder Knoten stellt das erlangte Wissen über eine Teilmenge von Daten dar. Der genaue Inhalt des Knotens ist je nach Algorithmus und Typ des vorhersagbaren Attributs unterschiedlich, das allgemeine Schema des Inhalts ist jedoch gleich.

Das Modell, das Sie erstellt haben, verwendet sowohl den ARTXP- als auch den ARIMA-Algorithmus. Analysis Services verwendet daher den entsprechenden Algorithmus, um ein ARTXP- bzw. ein ARIMA-Modell für die jeweilige Zeitreihe zu erstellen. Wenn Sie den Microsoft Time Series-Viewer zum Durchsuchen des Miningmodells Forecasting verwenden, werden die Ergebnisse der beiden Algorithmen von Analysis Services kombiniert. Das Miningmodell wird als eine Struktur angezeigt, und die einzelnen Knoten der Struktur enthalten Teile des Inhalts aus beiden Algorithmen.

Wenn Sie jedoch den MicrosoftGeneric Content Tree-Viewer verwenden, wird der Inhalt, der vom jeweiligen Algorithmus generiert wurde, durch zwei verschiedene Knotentypen im Miningmodell Forecasting verfügbar gemacht. Sie können einen Drilldown zur ARTXP- oder zur ARIMA-Version des Modells durchführen, um zunehmend mehr Details anzuzeigen.

So zeigen Sie Details für eine besondere Datenreihe im Generic Content Viewer an

  1. Wählen Sie auf der Registerkarte Miningmodell-Viewer den Eintrag Microsoft Generic Content Tree-Viewer aus der Dropdownliste Viewer aus.

  2. Klicken Sie im Bereich Knotenbeschriftung auf den obersten Knoten (Alle).

  3. Schauen Sie im Bereich Knotendetails den Wert für ATTRIBUTE_NAME an.

    Anhand dieses Werts können Sie die Reihe oder die Kombination aus Produkt und Region erkennen, die in diesem Knoten enthalten ist. Im AdventureWorks-Beispiel stellt der oberste Knoten die Reihe für M200 Europe dar.

  4. Suchen Sie im Bereich Knotenbeschriftung den ersten Knoten, der über untergeordnete Knoten verfügt.

    Wenn ein Knoten der Reihe über untergeordnete Knoten verfügt, weist die Strukturansicht auf der Registerkarte Modell des Microsoft Time Series-Viewers ebenfalls eine Verzweigungsstruktur auf.

  5. Erweitern Sie den Knoten, und klicken Sie auf einen der untergeordneten Knoten.

    Die Spalte NODE_DESCRIPTION des Schemas enthält die Bedingung für die Unterteilung der Struktur.

  6. Klicken Sie im Bereich Knotenbeschriftung auf den obersten ARIMA-Knoten, und erweitern Sie den Knoten, bis alle untergeordneten Knoten angezeigt werden.

  7. Schauen Sie im Bereich Knotendetails den Wert für ATTRIBUTE_NAME an.

    Anhand dieses Wertes können Sie erkennen, welche Zeitreihe im Knoten enthalten ist. Der oberste Knoten im ARIMA-Abschnitt sollte mit dem obersten Knoten im Abschnitt (Alle) übereinstimmen. Im AdventureWorks-Beispiel enthält dieser Knoten die ARIMA-Analyse für die Reihe M200 Europe.

Weitere Informationen finden Sie unter Miningmodellinhalt von Zeitreihenmodellen (Analysis Services - Data Mining).

Zurück zum Anfang