Share via


Untersuchen des Entscheidungsstrukturmodells (Lernprogramm zu Data Mining-Grundlagen)

Durch den Microsoft Decision Trees-Algorithmus wird anhand der übrigen Spalten im Trainingssatz vorhergesagt, welche Spalten die Entscheidung über den Kauf eines Fahrrads beeinflussen.

Der Microsoft Entscheidungsstruktur-Viewer stellt die folgenden Registerkarten zur Untersuchung von Entscheidungsstruktur-Miningmodellen bereit:

Entscheidungsstruktur

Abhängigkeitsnetzwerk

In den folgenden Abschnitten wird beschrieben, wie Sie den entsprechenden Viewer auswählen und die anderen Miningmodelle untersuchen.

Registerkarte "Entscheidungsstruktur"

Auf der Registerkarte Entscheidungsstruktur können Sie alle Strukturmodelle prüfen, die ein Miningmodell bilden.

Da das Targeted Mailing-Modell in diesem Lernprogramm nur das vorhersagbare Attribut Bike Buyer umfasst, wird nur eine Struktur in der Sicht angezeigt. Gibt es mehrere Strukturen, wird das Feld Struktur angezeigt, in dem Sie eine andere Struktur auswählen können.

Durch eine Untersuchung des TM_Decision_Tree-Modells im Entscheidungsstruktur-Viewer erkennen Sie, dass das Alter der entscheidendste Faktor für den voraussichtlichen Kauf eines Fahrrads ist. Interessanterweise unterscheidet sich die nächste Verzweigung der Struktur nach Gruppieren der Kunden anhand des Alters für die einzelnen Altersknoten. Anhand der Registerkarte Entscheidungsstruktur ist zu erkennen, dass bei Kunden im Alter von 34 bis 40 Jahren, die ein oder kein Auto besitzen, die Wahrscheinlichkeit, ein Fahrrad zu kaufen, am höchsten ist; auch junge alleinstehende Kunden im Pazifischen Raum, die ein oder kein Auto besitzen, weisen eine hohe Wahrscheinlichkeit bezüglich des Kaufs eines Fahrrads auf.

So untersuchen Sie das Modell auf der Registerkarte "Entscheidungsstruktur"

  1. Wählen Sie im Data Mining-Designer die Registerkarte Miningmodell-Viewer aus.

    Standardmäßig öffnet der Designer das erste Modell, das der Struktur hinzugefügt wurde, hier: TM_Decision_Tree.

  2. Mithilfe der Lupensymbole können Sie die Größe der Strukturanzeige einstellen.

    Standardmäßig werden im Microsoft Struktur-Viewer nur die ersten drei Strukturebenen angezeigt. Umfasst die Struktur weniger als drei Ebenen, zeigt der Viewer nur die vorhandenen Ebenen an. Wenn Sie weitere Ebenen anzeigen möchten, verwenden Sie den Schieberegler Ebene anzeigen oder die Liste Standarderweiterung.

  3. Schieben Sie den Regler Ebene anzeigen zum vierten Balken.

  4. Ändern Sie den Wert für Hintergrund in 1.

    Wenn Sie die Einstellung für Hintergrund ändern, können Sie schnell die auf den einzelnen Knoten vorhandene Anzahl der Fälle für Fahrradkäufer sehen, die den Zielwert 1 für [Bike Buyer] haben. In diesem besonderen Szenario stellt jeder Fall einen Kunden dar. Der Wert 1 gibt an, dass der Kunde zuvor ein Fahrrad gekauft hat. Der Wert 0 gibt an, dass der Kunde kein Fahrrad gekauft hat. Je dunkler die Schattierung des Knotens ist, desto höher ist der Prozentsatz der Fälle im Knoten mit dem Zielwert.

  5. Positionieren Sie den Cursor auf dem Knoten Alle. Daraufhin wird eine QuickInfo mit folgenden Informationen angezeigt:

    • Gesamtzahl der Fälle

    • Anzahl der Kunden, die keinen Kauf getätigt haben

    • Anzahl der Kunden, die einen Kauf getätigt haben

    • Anzahl der Fälle mit unvollständigen Werten für [Bike Buyer]

    Sie können den Cursor auch auf einem beliebigen Knoten in der Struktur platzieren, um die Bedingung anzuzeigen, die erforderlich ist, um den Knoten vom vorhergehenden Knoten aus zu erreichen. Diese Informationen werden auch in der Mininglegende angezeigt.

  6. Klicken Sie auf den Knoten für Age >= 34 und < 41. Das Histogramm wird als schmaler horizontaler Balken über dem Knoten angezeigt. Es stellt die Verteilung der Kunden in der entsprechenden Altersgruppe dar, die bereits ein Fahrrad gekauft (rosa) bzw. noch kein Fahrrad gekauft haben (blau). Dem Viewer ist zu entnehmen, dass Kunden im Alter von 34 bis 40 Jahren, die ein oder kein Auto besitzen, wahrscheinlich ein Fahrrad kaufen. Bei einer genaueren Betrachtung stellt sich heraus, dass die Wahrscheinlichkeit, ein Fahrrad zu kaufen, im Alter von 38 bis 40 Jahren am größten ist.

Beim Erstellen von Struktur und Modell haben Sie Drillthrough aktiviert. Sie können daher detaillierte Informationen über die Modellfälle und die Miningstruktur einschließlich Spalten abrufen, die nicht Teil des Miningmodells sind (beispielsweise emailAddress, FirstName).

Weitere Informationen finden Sie unter Verwenden von Drillthrough für Miningmodelle und Miningstrukturen (Analysis Services - Data Mining).

So führen Sie einen Drillthrough zu Falldaten aus

  1. Klicken Sie mit der rechten Maustaste auf einen Knoten, und wählen Sie Drillthrough ausführen und dann Nur Modellspalten aus.

    Die Details für die einzelnen Trainingsfälle werden im Arbeitsblattformat angezeigt. Sie wurden der vTargetMail-Sicht entnommen, die beim Erstellen der Miningstruktur als Falltabelle ausgewählt wurde.

  2. Klicken Sie mit der rechten Maustaste auf einen Knoten, und wählen Sie Drillthrough ausführen und dann Modell- und Strukturspalten aus.

    Das gleiche Arbeitsblatt wird angezeigt, und die Strukturspalten wurden an das Ende angefügt.

Zurück zum Anfang

Registerkarte "Abhängigkeitsnetzwerk"

Auf der Registerkarte Abhängigkeitsnetzwerk werden die Beziehungen zwischen Attributen angezeigt, die zur Vorhersagefähigkeit für das Miningmodell beitragen. Der Abhängigkeitsnetzwerk-Viewer bestätigt die Erkenntnisse, dass Alter und Region wichtige Faktoren für den Kauf eines Fahrrads darstellen.

So untersuchen Sie das Modell auf der Registerkarte "Abhängigkeitsnetzwerk"

  1. Klicken Sie auf den Knoten Fahrradkäufer, um die zugehörigen Abhängigkeiten zu identifizieren.

    Der zentrale Knoten des Abhängigkeitsnetzwerks Bike Buyer steht für das vorhersagbare Attribut im Miningmodell. Die rosa Schattierung gibt an, dass alle Attribute Auswirkungen auf den Fahrradkauf haben.

  2. Passen Sie den Schieberegler Alle Verknüpfungen an, um das einflussreichste Attribut zu identifizieren.

    Wenn Sie den Schieberegler nach unten ziehen, werden nur noch diejenigen Attribute angezeigt, welche die stärksten Auswirkungen auf die [Bike Buyer]-Spalte haben. Mithilfe dieses Reglers können Sie feststellen, dass Alter und Region die wichtigste Faktor sind, um festzustellen, ob jemand ein Fahrrad kauft.