Untersuchen des Market Basket-Modells (Data Mining-Lernprogramm für Fortgeschrittene)

Sie haben das Modell Association erstellt und können es jetzt überprüfen. Dazu verwenden Sie den Microsoft Zuordnungs-Viewer auf der Registerkarte Miningmodell-Viewer des Data Mining-Designers. In diesem Lernprogramm werden Sie durch die Verwendung des Viewers zur Untersuchung von Beziehungen zwischen Elementen geführt. Mithilfe des Viewers können Sie auf einen Blick erkennen, welche Produkte tendenziell zusammen angezeigt werden und erhalten eine Vorstellung von den Mustern, die sich ergeben.

Der Microsoft Zuordnung-Viewer enthält drei Registerkarten: Itemsets, Regeln und Abhängigkeitsnetzwerk. Da auf jeder Registerkarte eine geringfügig abweichende Datensicht dargestellt wird, wechseln Sie beim Untersuchen des Modells in aller Regel mehrfach zwischen den einzelnen Bereichen hin- und her.

  • Registerkarte "Abhängigkeitsnetzwerk"

  • Registerkarte "Itemsets"

  • Registerkarte "Regeln"

  • Generic Content Viewer

Sie beginnen dieses Lernprogramm auf der Registerkarte Abhängigkeitsnetzwerk, und vertiefen mithilfe der Registerkarte Regeln sowie der Registerkarte Itemsets Ihre Kenntnisse der Beziehungen, die in diesem Viewer offen gelegt werden. Außerdem rufen Sie mit dem Microsoft Generic Content Tree-Viewer detaillierte Statistiken für einzelne Regeln oder Itemsets ab.

Registerkarte Abhängigkeitsnetzwerk

Mithilfe der Registerkarte Abhängigkeitsnetzwerk können Sie die Interaktionen der verschiedenen Elemente im Modell prüfen. Jeder Knoten im Viewer steht für ein Element, und die Linien zwischen den Knoten stellen Beziehungen dar. Wenn Sie einen Knoten auswählen, können Sie feststellen, welcher andere Knoten das ausgewählte Element vorhersagt oder welche Elemente von dem aktuellen Element vorhergesagt werden. In einigen Fällen besteht eine zweiseitige Beziehung zwischen Elementen, was bedeutet, dass sie häufig in der gleichen Transaktion auftreten. Mithilfe der Farblegende am unteren Rand der Registerkarte können Sie die Richtung der Beziehung feststellen.

Eine Linie, die zwei Elemente verbindet, weist darauf hin, dass diese Elemente in einer Transaktion wahrscheinlich zusammen angezeigt werden. Dies bedeutet, dass Kunden diese Elemente wahrscheinlich zusammen kaufen. Der Schieberegler ist mit der Wahrscheinlichkeit der Regel verknüpft. Verschieben Sie den Schieberegler nach oben oder unten, um schwachen Zuordnungen bzw. Regeln mit niedriger Wahrscheinlichkeit herauszufiltern.

Im Diagramm für das Abhängigkeitsnetzwerk werden paarweise Regeln angezeigt, die logisch als A->B dargestellt werden können: Wenn Produkt A gekauft wird, ist ein Kauf von Produkt B wahrscheinlich. Regeln vom Typ AB->C können im Diagramm nicht dargestellt werden. Wenn Sie den Schieberegler bewegen, um alle Regeln anzuzeigen, ohne dass Linien im Diagramm angezeigt werden, sind keine paarweisen Regeln im Diagramm vorhanden, die den Kriterien der Algorithmusparameter entsprechen.

Sie können Knoten auch anhand des Namens durch Eingeben der ersten Buchstaben des Attributnamens suchen. Weitere Informationen finden Sie unter Knoten suchen-Dialogfeld (Miningmodell-Viewer-Ansicht).

So öffnen Sie den Zuordnungsmodus im Microsoft Zuordnungsregeln-Viewer

  1. Doppelklicken Sie im Projektmappen-Explorer auf die Association-Struktur.

  2. Klicken Sie im Data Mining-Designer auf die Registerkarte Miningmodell-Viewer.

  3. Wählen Sie Association aus der Liste der Miningmodelle in der Dropdownliste Miningmodell aus.

So navigieren Sie im Abhängigkeitsdiagramm und suchen bestimmte Knoten

  1. Klicken Sie auf der Registerkarte Miningmodell-Viewer auf die Registerkarte Abhängigkeitsnetzwerk.

  2. Klicken Sie mehrfach auf Vergrößern, bis Sie die Bezeichnungen für jeden Knoten gut lesen können.

    Das Diagramm wird standardmäßig mit allen Knoten angezeigt. In einem komplexen Modell sind möglicherweise viele Knoten vorhanden, und die einzelnen Knoten werden sehr klein dargestellt.

  3. Klicken Sie auf das +-Zeichen rechts unten im Viewer, und halten Sie die Maustaste gedrückt, um das Diagramm zu drehen.

  4. Ziehen Sie den Schieberegler auf der linken Seite des Viewers nach unten, um diesen von Alle Verknüpfungen (Standardeinstellung) an das Ende des Schieberegler-Steuerelements zu verschieben.

  5. Das Diagramm wird daraufhin vom Viewer aktualisiert, und es werden nur die stärksten Zuordnungen zwischen Touring Tire- und Touring Tire Tube-Elementen angezeigt.

  6. Klicken Sie auf den Knoten mit der Bezeichnung Touring Tire Tube = Existing.

    Das Diagramm wird aktualisiert, und es werden nur die Elemente hervorgehoben, die eine starke Beziehung zu diesem Element aufweisen. Beachten Sie die Richtung des Pfeils zwischen den zwei Elementen.

  7. Ziehen Sie den Schieberegler auf der linken Seite des Viewers wieder nach oben in eine mittlere Position.

    Beachten Sie die Veränderung des Pfeils zwischen den beiden Elementen.

  8. Wählen Sie oben im Bereich Abhängigkeitsnetzwerk die Option Nur Attributnamen anzeigen aus der Dropdownliste aus.

    Die Beschriftungen im Diagramm werden aktualisiert, und es werden nur die Modellnamen angezeigt.

Zurück zum Anfang

Registerkarte Itemsets

Als Nächstes lernen Sie die Regeln und Itemsets kennen, die vom Modell für Touring Tire- und Touring Tire Tube-Produkte generiert werden. Auf der Registerkarte Itemsets werden drei wichtige Arten von Informationen angezeigt, die sich auf Itemsets beziehen und über den Microsoft Association-Algorithmus ermittelt werden:

  • **Unterstützung:    **Die Anzahl von Transaktionen, in denen das Itemset auftritt.

  • Größe: Die Anzahl der Artikel, die im Itemset vorhanden sind.

  • **Elemente:    **Eine Liste der Elemente, die in jedem Itemset enthalten sind.

Abhängig davon, wie die Parameter für den Algorithmus festgelegt werden, kann der Algorithmus zahlreiche Itemsets generieren. Jedes Itemset, das im Viewer zurückgegeben wird, stellt Transaktionen dar, in denen das Element verkauft wurde. Über die Steuerelemente oben auf der Registerkarte Itemsets können Sie einen Filter für den Viewer festlegen, sodass nur Itemsets mit einem festgelegten Mindestwert für den Unterstützungswert und einer bestimmten Mindestgröße angezeigt werden.

Wenn Sie verschiedene Miningmodelle verwenden und keine Itemsets aufgeführt werden, sind keine Itemsets vorhanden, die den Kriterien der Algorithmusparameter entsprechen. In einem solchen Szenario können Sie die Algorithmusparameter ändern, um Itemsets zuzulassen, die über eine geringere Unterstützung verfügen.

So filtern Sie die Itemsets im Viewer nach Namen

  1. Klicken Sie im Viewer auf die Registerkarte Itemsets.

  2. Geben Sie im Feld Filteritemset den Text Touring Tire ein, und klicken Sie dann außerhalb des Felds.

    Der Filter gibt alle Elemente zurück, die diese Zeichenfolge enthalten.

  3. Wählen Sie in der Liste Anzeigen die Option Nur Attributnamen anzeigen aus.

  4. Aktivieren Sie das Kontrollkästchen Langen Namen anzeigen.

    Die Liste der Itemsets wird aktualisiert, und es werden nur die Itemsets angezeigt, die die Zeichenfolge Touring Tire enthalten. Der lange Name des Itemsets enthält den Namen der Tabelle mit dem Attribut und dem Wert der einzelnen Elemente.

  5. Deaktivieren Sie das Kontrollkästchen Langen Namen anzeigen.

    Die Liste der Itemsets wird aktualisiert, und es werden nur die kurzen Namen angezeigt.

Die Werte in der Spalte Unterstützung geben die Anzahl der Transaktionen für jedes Itemset an. Eine Transaktion für ein Itemset stellt einen Kauf dar, der alle Elemente im Itemset enthält.

Standardmäßig werden die Itemsets vom Viewer in absteigender Reihenfolge nach der Unterstützung aufgeführt. Klicken Sie auf die Überschrift einer Spalte, um eine Sortierung anhand dieser Spalte vorzunehmen, beispielsweise anhand der Größe des Itemsets oder des Namens. Wenn Sie mehr über die einzelnen Transaktionen in einem Itemset erfahren möchten, können Sie einen Drillthrough von den Itemsets zu den einzelnen Fällen ausführen. Die Strukturspalten in den Drillthroughergebnissen entsprechen der Höhe des Einkommens und der ID des Kunden; diese wurden nicht im Modell verwendet.

So zeigen Sie Details für ein Itemset an

  1. Klicken Sie in der Liste der Itemsets auf die Spaltenüberschrift für das Itemset, um nach dem Namen zu sortieren.

  2. Suchen Sie das Element Touring Tire (ohne zweites Element).

  3. Klicken Sie mit der rechten Maustaste auf das Element Touring Tire, und wählen Sie Drillthrough ausführen und anschließend Modell- und Strukturspalten aus.

    Im Dialogfeld Drillthrough ausführen werden die einzelnen Transaktionen zur Unterstützung für dieses Itemset angezeigt.

  4. Erweitern Sie die geschachtelte vAssocSeqLineItems-Tabelle, um die tatsächliche Liste der Käufe in der Transaktion anzuzeigen.

So filtern Sie Itemsets nach Unterstützung oder Größe

  1. Löschen Sie Text, der sich ggf. im Feld Filteritemset befindet. Textfilter können nicht zusammen mit numerischen Filtern verwendet werden.

  2. Geben Sie im Feld Minimaler Unterstützungswert 100 ein, und klicken Sie dann auf den Hintergrund des Viewers.

    Die Liste der Itemsets wird aktualisiert, und es werden nur Itemsets angezeigt, die mindestens den Unterstützungswert 100 aufweisen.

Zurück zum Anfang

Registerkarte Regeln

Auf der Registerkarte Regeln werden folgende Informationen angezeigt, die sich auf die Regeln beziehen, die der Algorithmus ermittelt.

  • **Wahrscheinlichkeit:    **Die Wahrscheinlichkeit einer Regel wird als Wahrscheinlichkeit des Elements auf der rechten Seite bei gegebenem Element auf der linken Seite angegeben.

  • **Wichtigkeit:    **Die Wichtigkeit gibt an, wie nützlich eine Regel ist. Ein größerer Wert gibt eine höhere Nützlichkeit an.

    Anhand der Wichtigkeit können Sie die Nützlichkeit einer Regel besser beurteilen, da die Wahrscheinlichkeit alleine zu falschen Schlüssen verleiten kann. Angenommen, jede Transaktion enthält eine Wasserflasche, und es handelt es sich um die Wasserflasche, die jedem Einkaufskorb im Rahmen einer Werbeaktion automatisch hinzugefügt wird. Daraufhin würde im Modell eine Regel erstellt, die besagt, dass die Wasserflasche über eine Wahrscheinlichkeit von 1 verfügt. Betrachtet man nur die Wahrscheinlichkeit alleine, ist diese Regel sehr genau, stellt jedoch keine nützlichen Informationen bereit.

  • **Regel:    **Gibt die Definition der Regel an. Für ein Market Basket-Modell beschreibt eine Regel eine bestimmte Kombination von Elementen.

Jede Regel kann verwendet werden, um das Vorhandensein eines Elements in einer Transaktion abhängig vom Vorhandensein anderer Elemente vorherzusagen. Wie im Falle der Registerkarte Itemsets können Sie die Regeln filtern, sodass nur die interessantesten Regeln angezeigt werden. Wenn Sie ein Miningmodell ohne Regeln verwenden, können Sie die Algorithmusparameter ändern, um die Schwellenwerte für Wahrscheinlichkeiten im Hinblick auf die Regeln zu verringern.

So zeigen Sie nur die Regeln für das Fahrrad Mountain-200 an

  1. Klicken Sie auf der Registerkarte Miningmodell-Viewer auf die Registerkarte Regeln.

  2. Geben Sie im Feld Filterregel die Regel Mountain-200 ein.

    Deaktivieren Sie das Kontrollkästchen Langen Namen anzeigen.

  3. Wählen Sie in der Liste Anzeigen die Option Nur Attributnamen anzeigen aus.

    Der Viewer zeigt dann nur die Regeln an, die den Begriff "Mountain-200" enthalten. An der Wahrscheinlichkeit der Regel können Sie erkennen, mit welcher Wahrscheinlichkeit Käufer eines Mountain-200-Fahrrads das andere aufgeführte Produkt kaufen werden.

Die Regeln werden in absteigender Reihenfolge nach der Wahrscheinlichkeit geordnet. Klicken Sie auf die Spaltenüberschrift, um die Sortierreihenfolge zu ändern. Wenn Sie mehr über eine bestimmte Regel erfahren möchten, können Sie einen Drillthrough zu den unterstützenden Fällen durchführen.

So zeigen Sie Fälle an, die eine bestimmte Regel unterstützen

  1. Klicken Sie auf der Registerkarte Regeln mit der rechten Maustaste auf die Regel, die Sie anzeigen möchten.

  2. Wählen Sie Drillthrough ausführen und dann Nur Modellspalten oder Modell- und Strukturspalten aus.

    Im oberen Bereich des Dialogfelds Drillthrough ausführen finden Sie eine Zusammenfassung der Regel sowie eine Liste aller Fälle, die als unterstützende Daten für die Regel verwendet wurden.

Zurück zum Anfang

Generic Content Tree-Viewer

Dieser Viewer kann für alle Modelle verwendet werden, unabhängig vom Algorithmus oder Modelltyp. Der Microsoft Generic Content Tree-Viewer ist in der Dropdownliste Viewer verfügbar.

Eine Inhaltsstruktur ist die Darstellung eines Mining-Modells als eine Reihe von Knoten, in der jeder Knoten das erlangte Wissen über eine Teilmenge der Daten repräsentiert. Der Knoten kann ein Muster, ein Regelsatz, ein Cluster oder die Definition eines Datenbereichs mit gemeinsamen Merkmalen sein. Der genaue Inhalt des Knotens ist je nach Algorithmus und Typ des vorhersagbaren Attributs unterschiedlich, die allgemeine Darstellung des Inhalts ist jedoch gleich. Sie können jeden Knoten erweitern, um zunehmend mehr Details anzuzeigen, und Sie können den Inhalt eines Knotens in die Zwischenablage kopieren.

So zeigen Sie Details über die Regel mit dem Viewer für Inhalte an

  1. Wählen Sie auf der Registerkarte Miningmodell-Viewer den Eintrag Microsoft Generic Content Tree-Viewer aus der Liste Viewer aus.

  2. Führen Sie einen Bildlauf im Bereich Knotenbeschriftung zum Ende der Liste aus, und klicken Sie auf den letzten Knoten.

    Der Viewer zeigt zuerst Itemsets und dann Regeln an, nimmt aber keine Gruppierung vor. Bestimmte Knoten finden Sie am leichtesten mit einer Inhaltsabfrage. Weitere Informationen hierzu finden Sie unter Abfragen eines Zuordnungsmodells (Analysis Services - Data Mining).

  3. Überprüfen Sie im Bereich Knotendetails den Wert für NODE_TYPE und für NODE_DESCRIPTION.

    Ein Knotentyp von 8 ist eine Regel, und ein Knotentyp von 7 ist ein Itemset. Bei einer Regel können Sie die Bedingungen der Regel anhand des Werts von NODE_DESCRIPTION erkennen. Bei einem Itemset können Sie die Elemente im Itemset anhand des Werts von NODE_DESCRIPTION erkennen.

Sie können auch eine Inhaltsabfrage erstellen, um ausführliche Statistiken über die Regeln abzurufen. Weitere Informationen über den Inhalt des Miningmodells und seine Interpretation finden Sie unter Miningmodellinhalt von Zuordnungsmodellen (Analysis Services - Data Mining).

Zurück zum Anfang