Share via


Prüfen der Targeted Mailing-Modelle (Data Mining-Lernprogramm)

Wenn die Modelle in Ihrem Projekt verarbeitet wurden, können Sie diese anzeigen. Dazu verwenden Sie den Miningmodell-Viewer im Data Mining-Designer. Oben auf der Registerkarte können Sie in der Liste Miningmodell die einzelnen Modelle in der Miningstruktur prüfen.

In den folgenden Abschnitten wird beschrieben, wie die Miningmodelle im jeweiligen Viewer geprüft werden.

  • Microsoft Decision Tree-Modell
  • Microsoft Clustering-Modell
  • Microsoft Naive Bayes-Modell

Microsoft Decision Tree-Modell

Wenn Sie im Data Mining-Designer für das Lernprogrammprojekt Adventure Works DM auf die Registerkarte Miningmodell-Viewer wechseln, wird der Designer mit dem Targeted Mailing-Miningmodell geöffnet, da dieses das erste Modell in der Struktur ist. Jeder Algorithmus, den Sie zum Erstellen eines Modells in Analysis Services verwenden, gibt einen anderen Ergebnistyp zurück. Deshalb wird in Analysis Services für jeden Algorithmus ein separater Viewer bereitgestellt. Wenn Sie ein Miningmodell durchsuchen, wird das Modell im Miningmodell-Viewer mit dem jeweils geeigneten Viewers für das Modell angezeigt. In diesem Fall wird der Microsoft Struktur-Viewer für das Decision Tree-Modell verwendet. Dieser Viewer umfasst die beiden folgenden Registerkarten: Entscheidungsstruktur und Abhängigkeitsnetzwerk.

Entscheidungsstruktur

Auf der Registerkarte Entscheidungsstruktur können Sie alle Strukturmodelle prüfen, die ein Miningmodell bilden. Da das Targeted Mailing-Modell in diesem Lernprogramm nur ein vorhersagbares Attribut umfasst, nämlich Bike Buyer, wird nur eine Struktur angezeigt. Gibt es mehrere Strukturen, wird das Feld Struktur angezeigt, in dem Sie eine andere Struktur auswählen können.

Standardmäßig werden im Microsoft Struktur-Viewer nur die ersten drei Strukturebenen angezeigt. Umfasst die Struktur weniger als drei Ebenen, zeigt der Viewer nur die vorhandenen Ebenen an. Wenn Sie weitere Ebenen anzeigen möchten, verwenden Sie den Schieberegler Ebene anzeigen oder die Liste Standarderweiterung. Weitere Informationen zum Konfigurieren des Viewers finden Sie unter Anzeigen eines Miningmodells mit dem Microsoft Struktur-Viewer.

So ändern Sie die Struktur

  1. Schieben Sie den Regler Ebene anzeigen auf Ebene 5.

  2. Ändern Sie die Liste Hintergrund in 1.

    Wenn Sie die Einstellung für Hintergrund ändern, können Sie schnell die auf den einzelnen Knoten vorhandene Anzahl der Fälle für Bike Buyer sehen, die den Wert 1 haben. Je dunkler die Schattierung eines Knotens ist, desto mehr Fälle sind im Knoten vorhanden.

Jeder Knoten in einer Entscheidungsstruktur zeigt folgende Informationen an:

  • Die Bedingung, die erforderlich ist, um den Knoten vom vorhergehenden Knoten aus zu erreichen. Der vollständige Knotenpfad wird in der Mininglegende angezeigt oder wenn Sie den Mauszeiger auf einen Knoten setzen, um den InfoTipp anzuzeigen.
  • Ein Histogramm, das die Verteilung der Status für die vorhersagbare Spalte in der Reihenfolge ihrer Verwendung beschreibt. Über das Steuerelement Histogramme können Sie steuern, wie viele Status im Histogramm angezeigt werden.
  • Die Bündelung der Fälle, wenn der Status des vorhersagbaren Attributs im Steuerelement Hintergrund angegeben ist.

Wenn Sie mit der rechten Maustaste auf den Knoten klicken und dann Drillthrough ausführen auswählen, werden die Trainingsfälle angezeigt, die der jeweilige Knoten unterstützt.

Abhängigkeitsnetzwerk

Auf der Registerkarte Abhängigkeitsnetzwerk werden die Beziehungen zwischen Attributen angezeigt, die zur Vorhersagefähigkeit für das Miningmodell beitragen.

Der zentrale Knoten des Abhängigkeitsnetzwerks Bike Buyer steht für das vorhersagbare Attribut im Miningmodell. Alle umliegenden Knoten stehen für ein Attribut, welches sich auf das Ergebnis des vorhersagbaren Attributs auswirkt. Mit dem Schieberegler auf der linken Seite der Registerkarte können Sie steuern, welche Verknüpfungen mit welcher Stärke jeweils angezeigt werden sollen. Wenn Sie den Regler nach unten schieben, werden nur die stärksten Verknüpfungen angezeigt.

Wenn Sie auf einen einzelnen Knoten im Netzwerk klicken, können Sie anhand der farbige Legende unten auf der Registerkarte feststellen, welche Knoten der ausgewählte Knoten vorhersagt oder von welchen Knoten er vorhergesagt wird.

Microsoft Clustering-Modell

Verwenden Sie die Liste Miningmodell oben auf der Registerkarte Miningmodell-Viewer, um zum TM_Clustering-Modell zu wechseln. Der Viewer für dieses Modell, Microsoft Cluster-Viewer, enthält vier Registerkarten: Clusterdiagramm, Clusterprofile, Clustermerkmale und Clusterunterscheidung. Standardmäßig zeigt der Viewer beim ersten Öffnen die Registerkarte Clusterdiagramm an.

Weitere Informationen zum Konfigurieren des Microsoft Cluster-Viewers finden Sie unter Anzeigen eines Miningmodells mit dem Microsoft Cluster-Viewer.

Clusterdiagramm

Auf der Registerkarte Clusterdiagramm können Sie die Beziehungen zwischen den Clustern untersuchen, die vom Algorithmus erkannt werden. Die Linien zwischen den Clustern geben die jeweilige "Nähe" an. Ihre Schattierung hängt davon ab, wie groß die Ähnlichkeit zwischen den Clustern ist. Die tatsächliche Farbe der einzelnen Cluster gibt die Häufigkeit der Variablen und den Status im Cluster an. Sie können die Variable und den Status oben auf dem Knoten in den Feldern Schattierungsvariable und Status auswählen. Die Standardvariable lautet Auffüllung. Sie können diese jedoch in jedes beliebige Attribut des Modells ändern, um festzustellen, welche Cluster jeweils Elemente mit den von Ihnen gewünschten Attributen enthalten. Mithilfe des Schiebereglers links neben dem Netzwerk können Sie schwächere Verknüpfungen herausfiltern und die Cluster mit den engsten Beziehungen finden.

Beispiel: Legen Sie für Schattierungsvariable die Einstellung Bike Buyer und für Status den Wert 1 fest. Sie werden feststellen, dass Cluster 5 die höchste Dichte von Bike Buyers enthält und dass die stärkste Beziehung zwischen Cluster 4 und Cluster 7 besteht.

Clusterprofile

Die Registerkarte Clusterprofile bietet eine Übersicht über das TM_Clustering-Modell. Wie Sie im Viewer sehen können, umfasst die Registerkarte Clusterprofile eine Spalte für jeden Cluster im Modell. In der ersten Spalte werden die Attribute aufgelistet, die mit mindestens einem Cluster verknüpft sind. Der Rest des Viewers umfasst die Verteilung der Status eines Attributs für jeden Cluster. Die Verteilung einer diskreten Variablen wird als farbiger Balken angezeigt. Die maximale Anzahl Balken wird in der Liste Histogrammbalken angezeigt. Kontinuierliche Attribute werden in einem Rautendiagramm angezeigt, das die mittlere und die Standardabweichung in jedem Cluster angibt.

Clustermerkmale

Auf der Registerkarte Clustermerkmale können Sie detailliert die Merkmale eines Clusters prüfen. Wenn Sie beispielsweise mithilfe der Liste Cluster den Cluster 5 im Szenario dieses Lernprogramms anzeigen, können Sie feststellen, dass die Personen in diesem Cluster, bei denen es sich um Kunden handelt, die ein Fahrrad gekauft haben, tendenziell folgende Merkmale aufweisen: Ihr Arbeitsweg beträgt 0 bis1 Meilen, sie besitzen kein Auto, und sie sind verheiratet.

Clusterunterscheidung

Auf der Registerkarte Clusterunterscheidung können Sie die Merkmale untersuchen, durch die sich die einzelnen Cluster voneinander unterscheiden. Wenn Sie aus den Feldern Cluster 1 und Cluster 2 zwei Cluster ausgewählt haben, stellt der Viewer die Unterschiede zwischen den Clustern fest und zeigt diese in der Reihenfolge der Attribute an, in denen sich die Cluster am meisten unterscheiden.

Vergleichen Sie beispielsweise Cluster 5 und Cluster 7 des TM_Clustering-Modells. Cluster 5 hat die höchste und Cluster 7 die niedrigste Dichte an Fahrradkäufern. Die Personen in Cluster 7 stammen tendenziell aus Nordamerika und sind zwischen 23 und 31 Jahre alt, währen die Personen in Cluster 5 tendenziell aus Europa stammen und einen kurzen Arbeitsweg haben, der zwischen null und einer Meile lang ist.

Microsoft Naive Bayes-Modell

Verwenden Sie die Liste Miningmodell oben auf der Registerkarte Miningmodell-Viewer, um zum TM_NaiveBayes-Modell zu wechseln. Der Viewer für dieses Modell, Microsoft-Viewer für naives Bayes-Verfahren, enthält vier Registerkarten: Abhängigkeitsnetzwerk, Attributprofile, Attributmerkmale und Attributunterscheidung.

Weitere Informationen zum Verwenden des Microsoft-Viewers für naives Bayes-Verfahren finden Sie unter Anzeigen eines Miningmodells mit dem Microsoft-Viewer für naives Bayes-Verfahren.

Abhängigkeitsnetzwerk

Die Registerkarte Abhängigkeitsnetzwerk entspricht der Registerkarte Abhängigkeitsnetzwerk des Microsoft Struktur-Viewers. Jeder Knoten im Viewer steht für ein Attribut, und die Linien zwischen den Knoten stellen Beziehungen dar. In dem Viewer können Sie alle Attribute sehen, die sich auf den Status des vorhersagbaren Attributs Bike Buyer auswirken.

Wenn Sie den Schieberegler nach unten ziehen, werden nur noch diejenigen Attribute angezeigt, welche die stärksten Auswirkungen auf die Bike Buyer-Spalte haben. Mithilfe dieses Reglers können Sie feststellen, dass die Anzahl der Autos, die eine Person besitzt, der wichtigste Faktor ist, um festzustellen, ob jemand ein Fahrrad kauft.

Attributprofile

Über die Registerkarte Attributprofile wird beschrieben, wie sich verschiedene Status der Eingabeattribute auf das Ergebnis des vorhersagbaren Attributs auswirken.

Stellen Sie sicher, dass im Feld Vorhersagbar die Option Bike Buyer ausgewählt ist. Die Attribute, die sich auf den Status des vorhersagbaren Attributs auswirken, werden zusammen mit den Werten für jeden Status der Eingabeattribute und deren Verteilungen in jedem Status des vorhersagbaren Attributs aufgelistet.

Attributmerkmale

Auf der Registerkarte Attributmerkmale können Sie ein Attribut und einen Wert auswählen, um festzustellen, mit welcher Häufigkeit Werte für andere Attribute in den ausgewählten Fällen auftreten.

Stellen Sie sicher, dass in der Liste Attribut der Eintrag Bike Buyer ausgewählt ist, und wählen Sie in der Liste Wert den Wert 1 aus. Im Viewer können Sie sehen, dass diejenigen Personen, deren Arbeitsweg zwischen null und einer Meile beträgt und die in Nordamerika leben, tendenziell die meisten Fahrräder kaufen.

Attributunterscheidung

Mithilfe der Registerkarte Attributunterscheidung können Sie die Beziehung zwischen zwei diskreten Werten des ausgewählten vorhersagbaren Attributs und anderen Attributwerten prüfen. Da es im TM_NaiveBayes-Modell nur zwei Status gibt, nämlich 1 und 0, brauchen Sie im Viewer keine Änderungen vorzunehmen.

Im Viewer können Sie sehen, dass Personen, die keine Autos besitzen, tendenziell Fahrräder kaufen. Und Personen, die zwei Autos besitzen, kaufen tendenziell keine Fahrräder.

Nächste Aufgabe in dieser Lektion

Testen der Genauigkeit des Miningmodells (Data Mining-Lernprogramm)