Data Mining-Algorithmen (Analysis Services - Data Mining)

Der Data Mining-Algorithmus ist ein Mechanismus zur Erstellung eines Data Mining-Modells. Der Algorithmus analysiert zunächst Daten auf der Suche nach bestimmten Mustern und Trends, um ein Modell zu erstellen. Mithilfe der Ergebnisse dieser Analyse definiert der Algorithmus die Parameter für das Miningmodell. Diese Parameter werden dann für das gesamte Dataset übernommen, um aussagefähige Muster und ausführliche Statistiken zu extrahieren.

Das von einem Algorithmus erstellte Miningmodell kann verschiedene Formen annehmen, einschließlich der folgenden:

  • Eine Gruppe von Regeln, die beschreiben, wie Produkte bei einer Transaktion gruppiert werden.

  • Ein Entscheidungsbaum, der vorhersagt, ob ein bestimmter Kunde ein Produkt kaufen wird.

  • Ein mathematisches Modell zum Vorhersagen von Umsätzen.

  • Eine Reihe von Clustern, die die Beziehungen der Fälle in einem Dataset beschreiben.

Microsoft SQL Server Analysis Services stellt verschiedene Algorithmen bereit, die in den Data Mining-Projektmappen verwendet werden können. Diese Algorithmen sind eine Teilmenge aller Algorithmen, die für Data Mining verwendet werden können. Sie können darüber hinaus Algorithmen von Drittanbietern verwenden, die der Spezifikation OLE DB für Data Mining entsprechen. Weitere Informationen zu Algorithmen von Drittanbietern finden Sie unter Plug-In-Algorithmen.

Typen von Data Mining-Algorithmen

Analysis Services enthält die folgenden Algorithmentypen:

  • Klassifikationsalgorithmen sagen basierend auf den anderen Attribute im Dataset mindestens eine diskrete Variable voraus. Ein Beispiel für einen Klassifikationsalgorithmus ist der Microsoft Decision Trees-Algorithmus.

  • Regressionsalgorithmen sagen basierend auf anderen Attribute im Dataset mindestens eine kontinuierliche Variable voraus. Ein Beispiel für einen Regressionsalgorithmus ist der Microsoft Time Series-Algorithmus.

  • Segmentierungsalgorithmen teilen Daten in Gruppen oder Cluster aus Elementen auf, die ähnliche Eigenschaften haben. Ein Beispiel für einen Segmentierungsalgorithmus ist der Microsoft Clustering-Algorithmus.

  • Zuordnungsalgorithmen suchen nach Korrelationen zwischen verschiedenen Attributen in einem Dataset. Die häufigste Anwendung dieser Algorithmusart besteht im Erstellen von Zuordnungsregeln, die für eine Warenkorbanalyse verwendet werden können. Ein Beispiel für einen Zuordnungsalgorithmus ist der Microsoft Association-Algorithmus.

  • Sequenzanalysealgorithmen fassen häufige Datensequenzen oder -periodizitäten, z. B. einen Webpfadfluss zusammen. Ein Beispiel für einen Sequenzanalysealgorithmus ist der Microsoft Sequence Clustering-Algorithmus.

Anwenden der Algorithmen

Es kann schwierig sein, den besten Algorithmus für eine bestimmte Geschäftsaufgabe auszuwählen. Während verschiedene Algorithmen zum Ausführen derselben Geschäftsaufgabe verwendet werden können, liefert jeder Algorithmus ein anderes Ergebnis und einige Algorithmen können mehr als eine Ergebnisart ergeben. Sie können z. B. den Microsoft Decision Trees-Algorithmus nicht nur für Vorhersagen verwenden, sondern auch als Möglichkeit, die Anzahl der Spalten in einem Dataset zu reduzieren, weil der Entscheidungsbaum Spalten identifizieren kann, die sich nicht auf das endgültige Miningmodell auswirken.

Sie müssen die Algorithmen außerdem nicht unabhängig voneinander verwenden. In einer einzelnen Data Mining-Projektmappe können einige Algorithmen zum Durchsuchen von Daten und andere Algorithmen zum Vorhersagen bestimmter Ausgaben auf Grundlage dieser Daten verwendet werden. Sie können z. B. einen Clusteringalgorithmus zum Erkennen von Mustern verwenden, um Daten in mehr oder weniger homogene Gruppen aufzuteilen, und im Anschluss daran mit den Ergebnissen ein besseres Entscheidungsbaummodell erstellen. Sie können mehrere Algorithmen innerhalb einer Projektmappe zum Ausführen separater Aufgaben verwenden, z. B. können Sie mit einem Regressionsstrukturalgorithmus Finanzprognosen erstellen und eine Warenkorbanalyse mit einem regelbasierten Algorithmus ausführen.

Mithilfe von Miningmodellen können Werte vorhergesagt, Datenzusammenfassungen erstellt und verborgene Korrelationen gesucht werden. In der folgenden Tabelle finden Sie Empfehlungen zum Verwenden von Algorithmen für bestimmte Aufgaben, die Ihnen beim Auswählen der Algorithmen für eine Data Mining-Projektmappe helfen sollen.

Aufgabe

Microsoft-Algorithmen

Vorhersagen eines diskreten Attributs

Sie möchten z. B. vorhersagen, ob der Empfänger einer Targeted Mailing-Kampagne ein Produkt kaufen wird.

Microsoft Decision Trees-Algorithmus

Microsoft Naive Bayes-Algorithmus

Microsoft Clustering-Algorithmus

Microsoft Neural Network-Algorithmus (Analysis Services - Data Mining)

Vorhersagen eines kontinuierlichen Attributs.

Sie möchten z. B. den Verkaufstrend für das nächste Jahr vorhersagen.

Microsoft Decision Trees-Algorithmus

Microsoft Time Series-Algorithmus

Vorhersagen einer Sequenz.

Sie möchten z. B. bei einer Unternehmenswebsite eine Clickstreamanalyse ausführen.

Microsoft Sequence Clustering-Algorithmus

Suchen von Gruppen aus allgemeinen Elementen in Transaktionen.

Sie möchten z. B. die Warenkorbanalyse verwenden, um einem Kunden weitere Produkte vorzuschlagen.

Microsoft Association-Algorithmus

Microsoft Decision Trees-Algorithmus

Suchen von Gruppen mit ähnlichen Elementen.

Sie möchten z. B. demografische Daten in Gruppen unterteilen, um die Beziehungen zwischen den Attributen besser zu verstehen.

Microsoft Clustering-Algorithmus

Microsoft Sequence Clustering-Algorithmus

Weil jedes Modell einen unterschiedlichen Ergebnistyp zurückgibt, stellt Analysis Services einen separaten Viewer für jeden Algorithmus bereit. Wenn Sie ein Miningmodell in Analysis Services durchsuchen, wird das Modell im Data Mining-Designer auf der Registerkarte Miningmodell-Viewer mit dem jeweils geeigneten Viewer für das Modell angezeigt. Weitere Informationen finden Sie unter Anzeigen eines Data Mining-Modells.

Algorithmusdetails

In der folgenden Tabelle finden Sie Links zu den Informationstypen, die für jeden Algorithmus zur Verfügung stehen:

  • Grundlegende Algorithmusbeschreibung   Bietet eine grundlegende Erklärung darüber, was der Algorithmus leistet und wie dies vorgenommen wird. Des Weiteren wird ein Geschäftsszenario angegeben, in dem der Algorithmus hilfreich sein könnte.

  • Technische Referenz   Listet die Parameter auf, die Sie festlegen können, um das Verhalten des Algorithmus zu steuern und die Ergebnisse im Modell anzupassen. Bietet zusätzliche technische Details über die Bereitstellung des Algorithmus, Leistungstipps und Informationen zu Datenanforderungen.

  • Abfragen eines Modells   Enthält Beispiele für Abfragen, die Sie mit jedem Modelltyp verwenden können.Sie können ein Modell abfragen, um mehr über die im Modell enthaltenen Muster zu erfahren oder auf der Grundlage dieser Muster Vorhersagen zu erstellen.

  • Miningmodellinhalt    Beschreibt, wie Informationen in einer für alle Modelltypen gemeinsamen Struktur gespeichert werden, und erklärt, wie diese Informationen zu interpretieren sind. Nachdem Sie ein Modell erstellt haben, können Sie es mithilfe der in BI Development Studio bereitgestellten Viewer durchsuchen. Des Weiteren können Sie in DMX Abfragen schreiben, um Daten direkt aus dem Modellinhalt zurückzugeben.

Grundlegende Algorithmusbeschreibung

Technische Referenz

Abfragen

Miningmodellinhalt

Microsoft Association-Algorithmus

Technische Referenz für den Microsoft Association-Algorithmus-

Abfragen eines Zuordnungsmodells (Analysis Services – Data Mining)

Miningmodellinhalt von Zuordnungsmodellen (Analysis Services – Data Mining)

Microsoft Clustering-Algorithmus

Technische Referenz für den Microsoft Clustering-Algorithmus

Abfragen eines Clustermodells (Analysis Services – Data Mining)

Mingingmodellinhalt von Clusteringmodellen (Analysis Services – Data Mining)

Microsoft Decision Trees-Algorithmus

Technische Referenz für den Microsoft Decision Trees-Algorithmus

Abfragen eines Entscheidungsstrukturmodells (Analysis Services – Data Mining)

Miningmodellinhalt von Entscheidungsstrukturmodellen (Analysis Services – Data Mining)

Microsoft Linear Regression-Algorithmus

Technische Referenz für den Microsoft Linear Regression-Algorithmus

Abfragen eines linearen Regressionsmodells (Analysis Services – Data Mining)

Miningmodellinhalt von linearen Regressionsmodellen (Analysis Services – Data Mining)

Microsoft Logistic Regression-Algorithmus

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Abfragen eines logistischen Regressionsmodells (Analysis Services – Data Mining)

Miningmodellinhalt von logistischen Regressionsmodellen (Analysis Services – Data Mining)

Microsoft Naive Bayes-Algorithmus

Technische Referenz für den Microsoft Naive Bayes-Algorithmus

Abfragen eines Naive Bayes-Modells (Analysis Services – Data Mining)

Miningmodellinhalt von Naive Bayes-Modellen (Analysis Services – Data Mining)

Microsoft Neural Network-Algorithmus (Analysis Services - Data Mining)

Technische Referenz für den Microsoft Neural Network-Algorithmus

Abfragen eines neuronalen Netzwerkmodells (Analysis Services - Data Mining)

Miningmodellinhalt von neuronalen Netzwerkmodellen (Analysis Services – Data Mining)

Microsoft Sequence Clustering-Algorithmus

Technische Referenz für den Microsoft Sequence Clustering-Algorithmus (Analysis Services - Data Mining)

Abfragen eines Sequenzclustermodells (Analysis Services – Data Mining)

Mingingmodellinhalt von Sequence Clustering-Modellen (Analysis Services – Data Mining)

Microsoft Time Series-Algorithmus

Technische Referenz für den Microsoft Time Series-Algorithmus

Abfragen eines Zeitreihenmodells (Analysis Services – Data Mining)

Miningmodellinhalt von Zeitreihenmodellen (Analysis Services – Data Mining)