Prüfen des Planungserstellungsmodells (Data Mining-Lernprogramm für Fortgeschrittene)

Artikel
05/07/2013

Nachdem Sie das Miningmodell für die Prognose erstellt haben, können Sie die Ergebnisse überprüfen. Verwenden Sie hierzu die Registerkarte Miningmodell-Viewer im Data Mining-Designer. Der Microsoft Time Series-Viewer enthält zwei Registerkarten: Diagramme und Modell.

Zudem können Sie den Microsoft Generic Tree Viewer mit allen Modellen verwenden. Jede Sicht zeigt ein leicht unterschiedliches Bild der Informationen im Zeitreihenmodell.

Registerkarte Diagramme
Registerkarte Modell
Microsoft Generic Content Viewer

Registerkarte Diagramme

Auf der Registerkarte Diagramme des Microsoft Time Series-Viewers werden alle Reihen grafisch dargestellt, einschließlich der Vergangenheitsdaten und Vorhersagen. Jede Zeile im Zeitreihendiagramm stellt eine eindeutige Kombination von Produkt, Bereich und vorhersagbarem Attribut dar.

In der Legende auf der rechten Seite des Viewers sind die verfügbren Zeitreihen auf Grundlage der Auswahl in der Dropdownliste aufgeführt. Aktivieren und deaktivieren Sie die Kontrollkästchen in der Legende, um zu steuern, welche Zeitreihe im Diagramm angezeigt wird.

Sie können hier zudem die Anzeigeoptionen ändern, z. B. die für eine bestimmte Zeitreihe verwendete Farbe oder ob Werte an Punkten im Diagramm angezeigt werden.

So wählen Sie eine Zeitreihe aus

Klicken Sie auf die Registerkarte Diagramme im Miningmodell-Viewer, wenn diese nicht bereits angezeigt wird.
Klicken Sie auf die Dropdownliste rechts neben der Diagrammansicht, und aktivieren Sie alle Kontrollkästchen. Klicken Sie auf OK.

Das Diagramm sollte nun 24 Zeilen für die verschiedenen Reihen enthalten.
Deaktivieren Sie die Kontrollkästchen rechts vom Diagramm, um die Zeilen für alle auf dem Amount basierenden Reihen vorübergehend auszublenden.

Deaktivieren Sie nun die Kontrollkästchen für die Fahrräder R750 und R250.

Das Diagramm enthält anschließend nur die folgenden sechs Reihenzeilen, sodass Sie die Trends für die Fahrräder M200 und T1000 besser vergleichen können.
- M200 Europe: Quantity
- M200 North America: Quantity
- M200 Pacific: Quantity
- T1000 Europe: Quantity
- T1000 North America: Quantity
- T1000 Pacific: Quantity

Reihenvorhersagen für Mengen M200 und T1000

Das Diagramm, das in diesem Viewer angezeigt wird, schließt sowohl Vergangenheitsdaten als auch vorhergesagte Daten ein. Die vorhergesagten Daten sind schattiert dargestellt, um sie von den Vergangenheitsdaten abzugrenzen. Um den Vergleich unterschiedlicher Reihen zu erleichtern, können Sie außerdem die jeder Zeile im Diagramm zugeordneten Farben ändern. Weitere Informationen finden Sie unter Ändern der im Data Mining-Viewer verwendeten Farben.

Den Trendlinien können Sie entnehmen, dass der Gesamtumsatz für alle Regionen zunimmt, wobei alle 12 Monate im Dezember Spitzenwerte verzeichnet werden. Das Diagramm zeigt darüber hinaus, dass die Daten für das Fahrrad T1000 deutlich später beginnen als die Daten für die anderen Produktreihen. Grund hierfür ist die Tatsache, dass es sich um ein neueres Produkt handelt. Da diese Reihe eine deutlich geringere Datengrundlage hat, sind die Vorhersagen möglicherweise nicht so genau.

Standardmäßig werden fünf Vorhersageschritte jede Zeitreihe als gepunktete Linien angezeigt. Sie können diesen Wert jedoch ändern und mehr oder weniger Vorhersagen anzeigen. Sie können die Standardabweichung für die Vorhersagen zudem grafisch darstellen, indem Sie dem Diagramm Fehlerindikatoren hinzufügen.

So ändern Sie die Vorhersage- und Anzeigeoptionen in der Diagrammansicht

Ändern Sie den Wert für Vorhersageschritte nach und nach von 5 auf 10 und zurück auf 6.

Wenn die Vergangenheitsdaten große Schwankungen haben, werden die Schwankungen meist wiederholt oder sogar vergrößert, wenn Sie die Anzahl der Vorhersagen erhöhen. Vermutlich müssen Sie an diesem Punkt ein wenig nachforschen, um die Ursache der großen Erhöhung in den Vergangenheitsdaten zu verstehen. Anschließend entscheiden Sie, ob Sie diese Ergebnisse akzeptieren, sich in den Quelldaten um Korrektur bemühen oder im Modell eiine gewisse Glättung vornehmen möchten.
Aktivieren Sie das Kontrollkästchen Abweichungen anzeigen.

Diese Option zeigt den geschätzten Fehler für jeden vorhergesagten Wert an.
Beachten Sie die Skala der X-Achse. Die Änderungen an Vergangenheits- und vorhergesagten Daten werden immer als Prozentsatz ausgedrückt; die Istwerte werden jedoch automatisch so angepasst, dass alle Werte in das Diagramm passen. Daher dürfen Sie beim Vergleichen von Modellen nicht nur die grafische Darstellung berücksichtigen. Den genauen Wert oder die Zunahme in Prozent und den Wert für Vorhersagen rufen Sie ab, indem Sie mit der Maus auf die gepunktete Linie oder auf durchgezogene Linien deuten. Sie können auch auf die gewünschten Zeilen klicken, um die Werte in der Mininglegende anzuzeigen.

Tipp:, Wenn die Mininglegende nicht angezeigt wird, wechseln Sie zur Sicht Modell, klicken Sie mit der rechten Maustaste auf einen Knoten, und wählen Sie Legende anzeigen aus.

Nach dem Durchsehen dieser Trends bleiben Ihnen Bedenken wegen der geringen Datenbasis für menache Reihen. Sie fragen sich, ob vielleicht verlässlichere Vorhersagen möglich wären, wenn Sie Umsatzdurchschnitte nach Modell oder auch nach Region ermittelten. Diesem Ansatz werden Sie in einer späteren Lektion in diesem Lernprogramm nachgehen.

Zurück zum Anfang

Registerkarte Modell

Auf der Registerkarte Modell im Microsoft Time Series-Viewer des Data Mining-Designers können Sie das Prognosemodell als Strukturdiagramm anzeigen.

Beachten Sie zuerst, dass das von Ihnen erstellte Modell eigentlich 24 verschiedene Strukturen enthält, da Ihre Daten zwei verschiedene Messwerte (Menge und Menge) für die Verkäufe mehrerer Produktlinien (T1000 usw.) in drei verschiedenen Bereichen (Europa, Nordamerika und Pazifik) beschreiben. Dabei stellt jede Struktur ein Modell der Verkaufsmuster für eine andere Kombination von Bereich, Produkt und vorhersagbarem Attribut dar.

Sie können auswählen, welche Kombination von Produktlinie, Bereich und Umsatzmetrik Sie anzeigen möchten, indem Sie eine Reihe aus der Dropdownliste Struktur auf der Registerkarte Modell auswählen.

Welche Einblicke gibt Ihnen also eine Anzeige des Modells als Struktur? Vergleichen wir als Beispiel zwei Modelle: eines hat mehrere Ebenen in der Struktur, und eines verfügt nur über einen einzelnen Knoten.

Wenn ein Strukturdiagramm einen einzelnen Knoten enthält, bedeutet dies, dass der im Modell gefundene Trend im Zeitverlauf überwiegend homogen ist. Sie können diesen einzelnen Knoten mit der Beschriftung Alle dazu verwenden, die Formel anzuzeigen, die die Beziehung zwischen den Eingangsvariablen und dem Ergebnis beschreibt.
Wenn ein Strukturdiagramm für eine Zeitreihe mehrere Verzweigungen hat, bedeutet dies, dass die erkannte Zeitreihe zu komplex für eine Darstellung als einzelne Gleichung ist. Stattdessen könnte das Strukturdiagramm mehrere Verzweigungen enthalten, wobei jede Verzweigung mit den Bedingungen beschriftet ist, die bewirkt haben, dass die Struktur teilt. Wenn sich die Struktur teilt, stellt jede Verzweigung ein Zeitsegment dar, innerhalb dessen der Trend als einzelne Gleichung beschrieben werden kann.

Wenn Sie beispielsweise das Diagramm ansehen und einen abrupten Sprung in Verkaufsvolumen sehen, der irgendwann im September beginnt und über einen Feiertag am Jahresende fortdauert, können Sie zur Sicht Modell wechseln, um das genaue Datum der Trendänderung zu sehen. Die Verzweigungen in der Struktur, die "vor September" und "nach September" darstellen, enthalten unterschiedliche Formeln: eine Formel, die den Verkaufstrend bis zur Teilung mathematisch beschreibt, und eine andere Formel, die den Verkaufstrend von September bis zum Feiertag am Jahresende beschreibt.

So untersuchen Sie die Entscheidungsstruktur für ein Zeitreihenmodell

Wählen Sie auf der Registerkarte Modell in der Liste Struktur die Reihe T1000 Europe: Amount aus.

Klicken Sie auf den Knoten mit der Beschriftung Alle.

Bei einem Knoten Alle enthält der angezeigte QuickInfo-Text Informationen wie die Anzahl der Fälle in der gesamten Reihe und Zeitreihenformeln, die anhand der Datenanalyse abgeleitet wurden.
Wenn die Mininglegende nicht angezeigt wird, klicken Sie mit der rechten Maustaste auf den Knoten und wählen Sie Legende anzeigen aus.

Die Mininglegende enthält im Wesentlichen die gleichen Informationen wie die QuickInfo. Wenn eine Ihrer unabhängigen Variablen diskret ist, sehen Sie auch ein Histogramm, das die Verteilung der Variablen im Knoten anzeigt.
Wählen Sie jetzt eine andere Zeitreihe zur Anzeige aus. Wählen Sie auf der Registerkarte Modell in der Liste Struktur die Reihe M200 North America: Amount aus.

Das Strukturdiagramm enthält jetzt einen Knoten Alle und zwei untergeordnete Knoten. Den Beschriftungen untergeordneten Knoten können Sie entnehmen, an welchem Punkt die Trendlinie sich geändert hat.

Für jeden untergeordneten Knoten enthält die Beschreibung in der Mininglegende auch die Anzahl der Fälle in jeder Verzweigung der Struktur.

Die folgende Liste beschreibt einige zusätzliche Funktionen des Struktur-Viewers:

Sie können die im Diagramm dargestellte Variable mit dem Background-Steuerelement ändern. Standardmäßig enthalten dunklere Knoten mehr Fälle, da der Wert des Hintergrunds durch die Auffüllung bestimmt wird. Wenn Sie die genaue Anzahl der Fälle in einem Knoten anzeigen möchten, können Sie mit dem Mauszeiger auf ihn deuten und so eine QuickInfo anzeigen, oder Sie klicken auf den Knoten und zeigen Sie die Anzahl im Fenster Knotenlegende an.
In der QuickInfo oder durch Klicken auf den Knoten kann zudem die Regressionsformel für den Knoten angezeigt werden. Wenn Sie ein gemischtes Modell erstellt haben, sehen Sie zwei Formeln, eine für ARTXP (in den Blattknoten) und eine für ARIMA (im Stammknoten der Struktur).
Die kleinen Rauten werden in Knoten verwendet, die fortlaufende Nummern darstellen. Der Attributbreich wird in der Leiste angezeigt, auf der sich die Raute befindet. Die Raute befindet sich am Mittelwert des Knotens. Die Breite der Raute gibt die Varianz des Attributs an diesem Knoten an.

Zurück zum Anfang

(Optional) Generic Content Tree Viewer

Zusätzlich zum benutzerdefinierten Viewer für Zeitreihen stellt Analysis Services den Microsoft Generic Content Tree Viewer zur Verwendung auf allen Data Mining-Modellen bereit. Dieser Viewer bietet einige Vorteile:

Microsoft Time Series-Viewer: Diese Sicht führt die Ergebnisse der zwei Algorithmen zusammen. Obwohl Sie jede Reihe getrennt anzeigen können, können Sie nicht bestimmen, wie die Ergebnisse jedes Algorithmus kombiniert wurden. Zudem zeigen die QuickInfos und die Mininglegende in dieser Sicht nur die wichtigsten Statistiken an.
Generic Content Tree Viewer: Hier können Sie alle Datenreihen durchsuchen und anzeigen, die irgendwann im Modell verwendet wurden. Wenn Sie ein gemischtes Modell erstellt haben, werden die ARIMA- und ARTXP-Strukturen im gleichen Diagramm angezeigt.

Sie können mit diesem Viewer alle Statistiken aus beiden Algorithmen sowie die Verteilungen der Werte abrufen.

Empfohlen für sachkundige Benutzer von Data Mining, die mehr über ARIMA- und ARTXP-Analysen erfahren möchten.

So zeigen Sie Details für eine bestimmte Datenreihe im Generic Content Tree Viewer an

Wählen Sie auf der Registerkarte Miningmodell-Viewer aus der Dropdownliste Viewer die Option Microsoft Generic Content Tree Viewer aus.
Klicken Sie im Bereich Knotenbeschriftung auf den obersten Knoten (Alle).
Zeigen Sie im Bereich Knotendetails den Wert für ATTRIBUTE_NAME an.

Dieser Wert zeigt an, welche Reihe oder Kombination von Produkt und Region in diesem Knoten enthalten ist. Im AdventureWorks-Beispiel beinhaltet der oberste Knoten die Reihe M200 Europe.
Suchen Sie im Bereich Knotenbeschriftung den ersten Knoten, der über untergeordnete Knoten verfügt.

Wenn ein Reihenknoten über untergeordnete Knoten verfügt, verfügt die Strukturansicht, die auf der Registerkarte Modell des Microsoft Time Series-Viewers angezeigt wird, ebenfalls über eine Verzweigungsstruktur.
Erweitern Sie den Knoten, und klicken Sie auf einen der untergeordneten Knoten.

Die Spalte NODE_DESCRIPTION des Schemas enthält die Bedingung, die zur Teilung der Struktur führte.
Klicken Sie im Bereich Knotenbeschriftung auf den obersten ARIMA-Knoten, und erweitern Sie den Knoten, bis alle untergeordneten Knoten sichtbar sind.
Zeigen Sie im Bereich Knotendetails den Wert für ATTRIBUTE_NAME an.

Dieser Wert sagt Ihnen, welche Zeitreihe in diesem Knoten enthalten ist. Der oberste Knoten im Abschnitt ARIMA sollte mit dem obersten Knoten im Abschnitt (Alle) übereinstimmen. Im AdventureWorks-Beispiel enthält dieser Knoten die ARIMA-Analyse für die Reihe M200 Europe.

Weitere Informationen finden Sie unter Miningmodellinhalt von Zeitreihenmodellen (Analysis Services – Data Mining).

Zurück zum Anfang

Nächste Aufgabe in der Lektion

Erstellen von Zeitreihenvorhersagen (Data Mining-Lernprogramm für Fortgeschrittene)

Prüfen des Planungserstellungsmodells (Data Mining-Lernprogramm für Fortgeschrittene)

Registerkarte Diagramme

So wählen Sie eine Zeitreihe aus

So ändern Sie die Vorhersage- und Anzeigeoptionen in der Diagrammansicht

Registerkarte Modell

So untersuchen Sie die Entscheidungsstruktur für ein Zeitreihenmodell

(Optional) Generic Content Tree Viewer

So zeigen Sie Details für eine bestimmte Datenreihe im Generic Content Tree Viewer an

Nächste Aufgabe in der Lektion

Siehe auch

Verweis

Konzepte

Zusätzliche Ressourcen