Microsoft Association-Algorithmus

Artikel
12/23/2023

Gilt für: SQL Server 2019 und früher Analysis Services Azure Analysis Services Fabric/Power BI Premium

Wichtig

Data Mining wurde in SQL Server 2017 Analysis Services als veraltet eingestuft und wurde jetzt in SQL Server 2022 Analysis Services eingestellt. Die Dokumentation wird für veraltete und eingestellte Features nicht aktualisiert. Weitere Informationen finden Sie unter Abwärtskompatibilität von Analysis Services.

Der Microsoft Association-Algorithmus ist ein Algorithmus, der häufig für Empfehlungs-Engines verwendet wird. Eine Recommendation Engine empfiehlt Kunden Artikel auf der Basis von Produkten, die diese Kunden bereits gekauft oder an denen sie Interesse gezeigt haben. Der Microsoft Association-Algorithmus ist auch für die Analyse des Warenkorbs nützlich.

Association-Modelle basieren auf Datasets, die Bezeichner enthalten, die sich sowohl auf einzelne Fälle als auch auf die Elemente beziehen, die in dem Fall enthalten sind. Eine Gruppe von Elementen in einem Fall wird als Itemsetbezeichnet. Ein Association-Modell besteht aus einer Reihe von Itemsets und Regeln, die beschreiben, wie diese Elemente in den Fällen gruppiert sind. Mit den Regeln, die der Algorithmus identifiziert, lassen sich wahrscheinliche Kaufentscheidungen von Kunden vorhersagen. Grundlage für diese Prognose sind die Artikel, die sich bereits im Einkaufswagen des Kunden befinden. Die folgende Abbildung zeigt eine Reihe von Regeln in einem Itemset.

Ein Satz von Regeln für ein Zuordnungsmodell

Wie das Diagramm veranschaulicht, kann der Microsoft Association-Algorithmus möglicherweise viele Regeln in einem Dataset finden. Der Algorithmus arbeitet mit zwei Parametern, Unterstützung und Wahrscheinlichkeit, um die Itemsets und Regeln zu beschreiben, die von ihm generiert werden. Beispiel: Wenn X und Y zwei Elemente darstellen, die sich in einem Einkaufswagen befinden, entspricht der Unterstützungsparameter der Anzahl von Fällen im Dataset, die die Elementkombination X und Y enthalten. Mithilfe des Unterstützungsparameters in Kombination mit den benutzerdefinierten Parametern MINIMUM_SUPPORT und MAXIMUM_SUPPORT, steuert der Algorithmus die Anzahl von generierten Itemsets. Der auch Vertrauengenannte Wahrscheinlichkeitsparameter stellt den Anteil der Fälle im Dataset dar, die sowohl X als auch Y enthalten. Mithilfe des Wahrscheinlichkeitsparameters in Kombination mit dem MINIMUM_PROBABILITY -Parameter steuert der Algorithmus, wie viele Regeln generiert werden.

Beispiel

Das Unternehmen Adventure Works Cycle gestaltet die Funktionalität seiner Website neu. Das Ziel dieses Neuentwurfs ist es, den Produkt-Sell-Through zu verbessern. Da das Unternehmen jeden Verkauf in einer Transaktionsdatenbank erfasst, kann es den Microsoft Association-Algorithmus verwenden, um Gruppen von Produkten zu identifizieren, die in der Regel zusammen gekauft werden. Auf der Grundlage der Artikel, die sich bereits im Einkaufswagen eines Kunden befinden, lässt sich dann vorhersagen, für welche weiteren Artikel sich dieser Kunden möglicherweise interessiert.

Funktionsweise des Algorithmus

Der Microsoft Association-Algorithmus durchläuft ein Dataset, um Elemente zu finden, die in einem Fall zusammen angezeigt werden. Der Algorithmus fasst dann alle verknüpften Elemente, die generiert werden, zu Itemsets zusammen, und zwar für die Mindestanzahl von Fällen, die im MINIMUM_SUPPORT -Parameter angegeben wurde. Beispiel: Ein mögliches Itemset lautet "Mountain 200=Existing, Sport 100=Existing", der zugehörige Unterstützungswert ist 710. Der Algorithmus generiert dann Regeln aus den Itemsets. Die Regeln werden verwendet, um die Präsenz eines Elements in der Datenbank, basierend auf der Präsenz anderer konkreter Elemente, die vom Algorithmus als wichtig identifiziert wurden, vorherzusagen. Eine Regel könnte z.B. "if Touring 1000=existing and Road bottle cage=existing, then Water bottle=existing" lauten, und als Wahrscheinlichkeit für diese Regel könnte 0.812 gelten. In diesem Beispiel identifiziert der Algorithmus, dass die Präsenz im Korb Touring 1000 tire und im Korb water bottle vorhersagt, dass davon ausgegangen werden kann, dass sich auch eine Wasserflasche in diesem Korb befinden würde.

Eine ausführlichere Erläuterung des Algorithmus sowie eine Liste der Parameter, mit denen sich das Verhalten des Algorithmus anpassen und die Ergebnisse des Miningmodells steuern lassen, finden Sie unter Technische Referenz für den Microsoft Association-Algorithmus.

Anforderungen für Zuordnungsmodelle

Wenn Sie Daten für das Training von Zuordnungsmodellen aufbereiten, müssen Sie sich mit den Anforderungen des jeweiligen Algorithmus, dessen Anforderungen an die Daten und der Verwendung der Daten vertraut machen.

Für Zuordnungsmodelle gelten folgende Anforderungen:

Nur eine Schlüsselspalte: Jedes Modell muss eine numerische Spalte oder Textspalte enthalten, die jeden Datensatz eindeutig identifiziert. Verbundschlüssel sind nicht zulässig.
Eine einzelne vorhersagbare Spalte Zuordnungsmodelle können jeweils nur eine vorhersagbare Spalte enthalten. In der Regel handelt es sich hierbei um die Schlüsselspalte der geschachtelten Tabelle, beispielsweise das Feld, in dem die gekauften Produkte verzeichnet werden. Die Werte müssen diskret sein oder diskretisiert werden.
Eingabespalten Die Eingabespalten müssen diskret sein. Die Eingabedaten für ein Association-Modell sind häufig auf zwei Tabellen verteilt. Eine Tabelle kann beispielsweise Kundendaten enthalten, während in einer anderen Tabelle die Einkäufe der Kunden verzeichnet werden. Diese Daten können mithilfe einer geschachtelten Tabelle in das Modell eingegeben werden. Weitere Informationen zu geschachtelten Tabellen finden Sie unter Geschachtelte Tabellen (Analysis Services – Data Mining).

Ausführliche Informationen zu den in Assoziationsmodellen unterstützten Inhaltstypen und Datentypen finden Sie im Abschnitt „Anforderungen“ unter Technische Referenz für den Microsoft Association-Algorithmus.

Anzeigen eines Zuordnungsmodells

Zum Durchsuchen des Modells können Sie den Microsoft Zuordnungsregeln-Viewerverwenden. Wenn Sie ein Zuordnungsmodell anzeigen, stellt SQL Server Analysis Services die Korrelationen aus verschiedenen Blickwinkeln dar, sodass Sie die Beziehungen und Regeln, die in den Daten gefunden wurden, besser verstehen können. Der Bereich Itemset des Viewers enthält eine detaillierte Analyse der am häufigsten vorkommenden Kombinationen oder Itemsets. Im Bereich Regeln wird eine Liste der aus den Daten abgeleiteten allgemeinen Regeln zusammen mit Berechnungen von deren Wahrscheinlichkeit dargestellt und die Rangfolge der Regeln nach ihrer relativen Wichtigkeit bestimmt. Im Abhängigkeitsnetzwerk-Viewer können Sie die Verbindungen zwischen den einzelnen Elementen untersuchen. Weitere Informationen finden Sie unter Durchsuchen eines Modells mit dem Microsoft Cluster-Viewer.

Wenn Sie Näheres über die Itemsets und Regeln in Erfahrung bringen möchten, können Sie das Modell im Microsoft Generic Content Tree Viewerdurchsuchen. Der für das Modell gespeicherte Inhalt umfasst Unterstützungswerte für jedes Itemset, ein Ergebnis für jede Regel und andere statistischen Daten. Weitere Informationen finden Sie unter Miningmodellinhalt für Zuordnungsmodelle (Analysis Services – Data Mining).

Erstellen von Vorhersagen

Nachdem das Modell verarbeitet wurde, können Sie die Regeln und die Itemsets zum Erstellen von Vorlagen verwenden. In einem Zuordnungsmodell geht aus einer Vorhersage hervor, welches Element wahrscheinlich auftritt, wenn das angegebene Element vorhanden ist, und die Vorhersage kann Angaben wie Wahrscheinlichkeit, Unterstützung oder Wichtigkeit enthalten. Beispiele dazu, wie Abfragen für ein Zuordnungsmodell erstellt werden, finden Sie unter Beispiele für Zuordnungsmodellabfragen.

Allgemeine Informationen zur Erstellung von Abfragen für ein Data Mining-Modell finden Sie unter Data Mining-Abfragen.

Leistung

Der Prozess, Itemsets zu erstellen und Korrelationen zu zählen, kann zeitaufwendig sein. Obwohl der Microsoft Association Rules-Algorithmus Optimierungstechniken verwendet, um Speicherplatz zu sparen und die Verarbeitung zu beschleunigen, sollten Sie wissen, dass Leistungsprobleme unter Bedingungen wie den folgenden auftreten können:

Das Dataset ist groß und umfasst viele einzelne Elemente.
Die minimale Itemsetgröße ist zu niedrig festgelegt.

Um die Verarbeitungszeit zu minimieren und die Komplexität der Itemsets zu reduzieren, können Sie verwandte Elemente nach Kategorien gruppieren, bevor Sie die Daten analysieren.

Hinweise

Unterstützt nicht die Verwendung von PMML (Predictive Model Markup Language) zum Erstellen von Miningmodellen.
Unterstützt Drillthrough.
Unterstützt die Verwendung von OLAP-Miningmodellen.
Unterstützt die Erstellung von Data Mining-Dimensionen.

Weitere Informationen

Data Mining-Algorithmen (Analysis Services - Data Mining)
Modell mit dem Microsoft-Viewer für Zuordnungsregeln durchsuchen
Miningmodellinhalt von Zuordnungsmodellen (Analysis Services – Data Mining)
Technische Referenz für den Microsoft Association-Algorithmus
Beispiele für Zuordnungsmodellabfragen