Untersuchen des Entscheidungsstrukturmodells (Lernprogramm zu Data Mining-Grundlagen)

 

Gilt für: SQL Server 2016 Preview

Durch den Microsoft Decision Trees-Algorithmus wird anhand der übrigen Spalten im Trainingssatz vorhergesagt, welche Spalten die Entscheidung über den Kauf eines Fahrrads beeinflussen.

Die Microsoft Entscheidungsstruktur-Viewer bietet die folgenden Registerkarten zur Untersuchung von Entscheidungsstruktur-Miningmodellen:

Entscheidungsstruktur

Abhängigkeitsnetzwerk

Registerkarte "Entscheidungsstruktur"

Auf der Entscheidungsstruktur Registerkarte können Sie Entscheidungsstrukturen für jedes vorhersagbare Attribut im Dataset anzeigen.

In diesem Fall wird das Modell nur eine Spalte, Bike Buyer vorhergesagt, ist nur eine Struktur angezeigt. Wenn mehrere Strukturen vorhanden sind, können Sie die Struktur auf eine andere Struktur auswählen.

Wenn Sie zum Anzeigen der TM_Decision_Tree Modell im Entscheidungsstruktur-Viewer können Sie die wichtigsten Attribute auf der linken Seite des Diagramms sehen. Als wichtigste Attribute werden diejenigen beschrieben, die den größten Einfluss auf das Ergebnis haben. Die weiter unten in der Struktur (auf der rechten Diagrammseite) angezeigten Attribute weisen einen geringeren Einfluss auf.

In diesem Beispiel ist das Alter der wichtigste Einzelfaktor für die Vorhersage eines Fahrradkaufs. Im Modell werden Kunden nach dem Alter gruppiert, und anschließend wird das nächstwichtigere Attribut für jede Altersgruppe angezeigt. In der Kundengruppe von 34 bis 40 Jahren ist die Anzahl der Kraftfahrzeuge im Besitz des Kunden nach dem Alter der bedeutendste Vorhersagefaktor.

So untersuchen Sie das Modell auf der Registerkarte "Entscheidungsstruktur"

  1. Wählen Sie die Miningmodell-Viewer Registerkarte Data Mining-Designer.

    In der Standardeinstellung der Designer wird geöffnet, das erste Modell, das der Struktur, in diesem Fall hinzugefügt wurde TM_Decision_Tree.

  2. Mithilfe der Lupensymbole können Sie die Größe der Strukturanzeige einstellen.

    Standardmäßig werden im Microsoft Struktur-Viewer nur die ersten drei Strukturebenen angezeigt. Umfasst die Struktur weniger als drei Ebenen, zeigt der Viewer nur die vorhandenen Ebenen an. Sie können weitere Ebenen anzeigen, indem Sie mit der Ebene anzeigen Schieberegler oder Standarderweiterung Liste.

  3. Schieben Sie Ebene anzeigen zum vierten Balken.

  4. Ändern Sie den Wert für Hintergrund in 1.

    Durch Ändern der Hintergrund festlegen, können Sie schnell sehen die Anzahl von Fällen in jedem Knoten, der den Zielwert 1 für [Bike Buyer]. In diesem besonderen Szenario stellt jeder Fall einen Kunden dar. Der Wert 1 Gibt an, dass der Kunde zuvor ein Fahrrad gekauft den Wert 0 Gibt an, dass der Kunde kein Fahrrad gekauft hat. Je dunkler die Schattierung des Knotens ist, desto höher ist der Prozentsatz der Fälle im Knoten mit dem Zielwert.

  5. Platzieren Sie den Cursor über dem Knoten mit der Bezeichnung alle. Daraufhin wird eine QuickInfo mit folgenden Informationen angezeigt:

    • Gesamtzahl der Fälle

    • Anzahl der Kunden, die keinen Kauf getätigt haben

    • Anzahl der Kunden, die einen Kauf getätigt haben

    • Anzahl der Fälle mit unvollständigen Werten für [Bike Buyer]

    Sie können den Cursor auch auf einem beliebigen Knoten in der Struktur platzieren, um die Bedingung anzuzeigen, die erforderlich ist, um den Knoten vom vorhergehenden Knoten aus zu erreichen. Sie können auch anzeigen, diese Informationen in der Mininglegende.

  6. Klicken Sie auf den Knoten für Age > = 34 und < 41. Das Histogramm wird als schmaler horizontaler Balken über dem Knoten angezeigt. Es stellt die Verteilung der Kunden in der entsprechenden Altersgruppe dar, die bereits ein Fahrrad gekauft (rosa) bzw. noch kein Fahrrad gekauft haben (blau). Dem Viewer ist zu entnehmen, dass Kunden im Alter von 34 bis 40 Jahren, die ein oder kein Auto besitzen, wahrscheinlich ein Fahrrad kaufen. Bei einer genaueren Betrachtung stellt sich heraus, dass die Wahrscheinlichkeit, ein Fahrrad zu kaufen, im Alter von 38 bis 40 Jahren am größten ist.

Beim Erstellen von Struktur und Modell haben Sie Drillthrough aktiviert. Sie können daher detaillierte Informationen über die Modellfälle und die Miningstruktur einschließlich Spalten abrufen, die nicht Teil des Miningmodells sind (beispielsweise emailAddress, FirstName).

Weitere Informationen finden Sie unter Drillthroughabfragen (Data Mining).

So führen Sie einen Drillthrough zu Falldaten aus

  1. Maustaste auf einen Knoten, und wählen Sie Drillthrough dann nur Modellspalten.

    Die Details für die einzelnen Trainingsfälle werden im Arbeitsblattformat angezeigt. Sie wurden der vTargetMail-Sicht entnommen, die beim Erstellen der Miningstruktur als Falltabelle ausgewählt wurde.

  2. Maustaste auf einen Knoten, und wählen Sie Drillthrough dann Modell- und Strukturspalten.

    Das gleiche Arbeitsblatt wird angezeigt, und die Strukturspalten wurden an das Ende angefügt.

Zurück zum Anfang

Registerkarte "Abhängigkeitsnetzwerk"

Die Abhängigkeitsnetzwerk Registerkarte zeigt die Beziehungen zwischen den Attributen, die zur vorhersagefähigkeit für das Miningmodell beitragen. Der Abhängigkeitsnetzwerk-Viewer bestätigt die Erkenntnisse, dass Alter und Region wichtige Faktoren für den Kauf eines Fahrrads darstellen.

So untersuchen Sie das Modell auf der Registerkarte "Abhängigkeitsnetzwerk"
  1. Klicken Sie auf die Bike Buyer Knoten, um die zugehörigen Abhängigkeiten zu identifizieren.

    Der zentrale Knoten des Abhängigkeitsnetzwerks Bike Buyer, stellt das vorhersagbare Attribut im Miningmodell. Im Diagramm werden alle verbundenen Knoten hervorgehoben, die das vorhersagbare Attribut beeinflussen.

  2. Anpassen der Alle Links Schieberegler, um das einflussreichste Attribut zu identifizieren.

    Während Sie den Schieberegler nach unten ziehen, werden die Attribute, die nur eine geringe Auswirkung auf die Spalte [Bike Buyer] haben aus dem Diagramm entfernt. Mithilfe des Reglers können Sie feststellen, dass Alter und Region die wichtigste Faktoren bei der Vorhersage sind, ob ein Kunde ein Fahrrad kauft.

Verwandte Aufgaben

In den folgenden Themen wird erläutert, wie Daten unter Verwendung anderer Modellarten analysiert werden können.

Nächste Aufgabe in der Lektion

Untersuchen des Clustering-Modells ( Grundlegende Datamining-Lernprogramm )

Siehe auch

Tasks und Anweisungen für Miningmodell-Viewer
Registerkarte "Entscheidungsstruktur" (Miningmodell-Viewer)
Registerkarte "Abhängigkeitsnetzwerk" (Miningmodell-Viewer)
Durchsuchen eines Modells mit dem Microsoft Struktur-Viewer