Prüfen des Market Basket-Modells (Data Mining-Lernprogramm)

Aktualisiert: 15. September 2007

Sie haben das Modell Association erstellt und können es jetzt überprüfen. Dazu verwenden Sie den Microsoft Zuordnungs-Viewer auf der Registerkarte Miningmodell-Viewer des Data Mining-Designers. Wenn Sie das Modell genauer betrachten, können Sie sehen, welche Produkte meist zusammen angezeigt werden, und die Beziehungen zwischen den Elementen analysieren. Sie können auch die schwächeren Zuordnungen herausfiltern und eine allgemeine Vorstellung der sich daraus ergebenden Muster bekommen.

Der Microsoft Association Viewer enthält drei Registerkarten: Itemsets, Regeln und Abhängigkeitsnetzwerk. Weitere Informationen zu diesem Viewer finden Sie unter Anzeigen eines Miningmodells mit dem Microsoft Zuordnungsregeln-Viewer.

Registerkarte Itemsets

Auf der Registerkarte Itemsets werden drei wichtige Arten von Informationen angezeigt, die sich auf Itemsets beziehen und über den Microsoft Association-Algorithmus ermittelt werden: der Unterstützungswert, wobei es sich um die Anzahl Transaktionen handelt, in denen das Itemset auftritt; die Größe, wobei es sich um die Anzahl Elemente im Itemset handelt; und die eigentliche Zusammensetzung des Itemsets. Abhängig davon, wie die Parameter für den Algorithmus festgelegt werden, kann der Algorithmus eine große Anzahl von Itemsets generieren. Über die Steuerelemente oben auf der Registerkarte Itemsets können Sie einen Filter für den Viewer festlegen, sodass nur Itemsets mit einem festgelegten Mindestwert für den Unterstützungswert und einer bestimmten Mindestgröße angezeigt werden.

Sie können auch das Feld Filteritemset verwenden, um die im Viewer angezeigten Itemsets zu filtern. Beispiel: Wenn Sie nur die Itemsets anzeigen möchten, die Informationen über das Fahrrad Mountain-200 enthalten, geben Sie Mountain-200 im Feld Filteritemset ein. Im Viewer werden dann nur Itemsets angezeigt, welche den Begriff "Mountain-200" enthalten. Jedes Itemset, das im Viewer ausgegeben wird, enthält Informationen zu Transaktionen, in denen ein Fahrrad vom Typ Mountain-200 verkauft wurde. So gibt beispielsweise das Itemset mit dem Wert 710 in der Spalte Unterstützungswert an, dass unter allen Transaktionen 710 Personen, die ein Fahrrad vom Typ Mountain-200 gekauft haben, auch ein Fahrrad vom Typ Sport-100 gekauft haben.

Registerkarte Regeln

Auf der Registerkarte Regeln werden folgende Informationen angezeigt, die sich auf die Regeln beziehen, die der Algorithmus ermittelt.

  • Wahrscheinlichkeit
    Die Wahrscheinlichkeit, mit der eine Regel auftritt.
  • Wichtigkeit
    Die Wichtigkeit gibt an, wie nützlich eine Regel ist. Ein größerer Wert gibt eine höhere Nützlichkeit an. Es kann irreführend sein, nur den Wahrscheinlichkeitswert zu berücksichtigen. Wenn beispielsweise jede Transaktion das Element x umfasst, dann sagt die Regel y voraus, dass x die Wahrscheinlichkeit 1 hat, was bedeutet, dass x immer auftritt. Auch wenn die Genauigkeit der Regel sehr hoch ist, hat sie dennoch keinen großen Informationsgehalt, da jede Transaktion x enthält, unabhängig von y.
  • Regel
    Gibt die Definition der Regel an.

Wie im Falle der Registerkarte Itemsets können Sie die Regeln filtern, sodass nur die interessantesten Regeln angezeigt werden. Beispiel: Wenn Sie nur die Regeln anzeigen möchten, die das Fahrrad Mountain-200 enthalten, geben Sie Mountain-200 im Feld Filterregel ein. Der Viewer zeigt dann nur die Regeln an, die den Begriff "Mountain-200" enthalten. Jede Regel kann verwendet werden, um das Vorhandensein eines Elements in einer Transaktion abhängig vom Vorhandensein anderer Elemente vorherzusagen. Beispiel: Die erste Regel gibt an, dass eine Person, die ein Fahrrad vom Typ Mountain-200 mit einer Wasserflasche kauft, mit der Wahrscheinlichkeit von 1 auch einen Flaschenhalter kauft.

Registerkarte Abhängigkeitsnetzwerk

Mithilfe der Registerkarte Abhängigkeitsnetzwerk können Sie die Interaktionen der verschiedenen Elemente im Modell prüfen. Jeder Knoten im Viewer steht für ein Element; so gibt beispielsweise der Knoten Mountain-200 = Existing an, dass Mountain-200 in einer Transaktion vorhanden ist. Wenn Sie einen Knoten auswählen, können Sie die Farblegende unten auf der Registerkarte verwenden, um festzustellen, welche anderen Elemente entweder weitere Elemente im Modell festlegen oder von anderen Elementen im Modell festgelegt werden.

Der Schieberegler ist mit der Wahrscheinlichkeit einer Regel verknüpft. Verschieben Sie den Regler nach oben oder unten, um schwache Zuordnungen herauszufiltern. Wählen Sie beispielsweise im Feld Anzeigen die Option Nur Attributnamen anzeigen, und klicken Sie dann auf den Knoten Mountain Bottle Cage. Im Viewer wird angezeigt, dass der Flaschenhalter (Mountain Bottle Cage) sowohl durch die Wasserflasche als auch das Fahrrad vom Typ Mountain-200 vorhergesagt wird. Das bedeutet, dass es wahrscheinlich ist, dass diese Elemente zusammen in einer Transaktion auftreten. Mit anderen Worten heißt das, wenn ein Kunde ein Fahrrad kauft, kauft er wahrscheinlich auch eine Wasserflasche und einen Flaschenhalter.

Nächste Lektion

Lektion 5: Erstellen des Sequenzclusterszenarios