TechNet
Exportieren (0) Drucken
Alle erweitern

Data Mining-Algorithmen (Analysis Services - Data Mining)

 

Betrifft: SQL Server 2016

Ein Algorithmus in Data Mining (oder maschinellen) ist eine Reihe von Heuristiken und Berechnungen, die ein Modell aus Daten erstellt. Um ein Modell zu erstellen, werden vom Algorithmus zuerst die von Ihnen bereitgestellten Daten analysiert und bestimmte Muster oder Trends gesucht. Der Algorithmus verwendet die Ergebnisse dieser Analyse über viele Iterationen der optimalen Parameter zum Erstellen des Miningmodells gefunden. Diese Parameter werden dann für das gesamte Dataset übernommen, um aussagefähige Muster und ausführliche Statistiken zu extrahieren.

Das von einem Algorithmus aus Ihren Daten erstellte Miningmodell kann verschiedene Formen annehmen, einschließlich der folgenden:

  • Eine Reihe von Clustern, die die Beziehungen der Fälle in einem Dataset beschreiben.

  • Eine Entscheidungsstruktur, durch die ein Ergebnis vorhergesagt und beschrieben wird, wie sich unterschiedliche Kriterien auf dieses Ergebnis auswirken.

  • Ein mathematisches Modell zum Vorhersagen von Umsätzen.

  • Eine Gruppe von Regeln, die beschreiben, wie Produkte in einer Transaktion gruppiert werden, und die Wahrscheinlichkeiten, dass Produkte zusammen gekauft werden.

Die in bereitgestellten Algorithmen SQL Server Data Mining werden die meisten gängigen, durchdachter Methoden von Mustern aus Daten ableiten. Ein Beispiel: K-Means-clustering ist eine von der ältesten Clusteringalgorithmen und häufig in viele verschiedene Tools und mit vielen verschiedenen Implementierungen und Optionen zur Verfügung. Jedoch in die jeweiligen Implementierung des K-Means-clustering verwendet SQL Server Data Mining von Microsoft Research entwickelte und wurde dann für die Leistung optimiert Analysis Services. Alle Microsoft Datamining-Algorithmen kann umfassend angepasst und sind vollständig programmierbar, mithilfe der bereitgestellten APIs. Sie können die Erstellung auch automatisieren, Schulung und Modelle mithilfe von Datamining-Komponenten in Umschulung Integration Services.

Sie können auch Drittanbieter-Algorithmen verwenden, die mit OLE DB-Spezifikation für Data Mining oder benutzerdefinierte Algorithmen entwickeln, die als Dienste registriert und dann innerhalb von verwendet werden können die SQL Server Data Mining-Frameworks.

Es kann schwierig sein, den besten Algorithmus für einen bestimmten analytischen Task auszuwählen. Während verschiedene Algorithmen zum Ausführen derselben Geschäftsaufgabe verwendet werden können, liefert jeder Algorithmus ein anderes Ergebnis, und einige Algorithmen können mehr als eine Ergebnisart ergeben. Sie können z. B. den Microsoft Decision Trees-Algorithmus nicht nur für Vorhersagen verwenden, sondern auch als Möglichkeit, die Anzahl der Spalten in einem Dataset zu reduzieren, weil die Entscheidungsstruktur Spalten identifizieren kann, die sich nicht auf das endgültige Miningmodell auswirken.

Auswählen eines Algorithmus nach Typ

SQL Server Datamining umfasst die folgenden algorithmentypen:

  • Klassifikationsalgorithmen sagen basierend auf den anderen Attributen im Dataset mindestens eine diskrete Variable voraus.

  • Regressionsalgorithmen Vorhersagen mindestens eine kontinuierliche numerische Variablen, z. B. Gewinn oder Verlust, basierend auf anderen Attributen im Dataset.

  • Segmentierungsalgorithmen teilen Daten in Gruppen oder Cluster aus Elementen auf, die ähnliche Eigenschaften haben.

  • Zuordnungsalgorithmen suchen nach Korrelationen zwischen verschiedenen Attributen in einem Dataset. Die häufigste Anwendung dieser Algorithmusart besteht im Erstellen von Zuordnungsregeln, die für eine Warenkorbanalyse verwendet werden können.

  • Sequenzanalysealgorithmen fassen häufige oder Episoden in den Daten, wie z. B. eine Reihe von Mausklicks auf einer Website oder eine Reihe von Protokollereignissen Computerwartung vor.

Es gibt jedoch keinen Grund, sich in Projektmappen auf einen Algorithmus zu beschränken. Erfahrene Analytiker verwenden manchmal einen Algorithmus, um die effizientesten Eingaben (d. h. Variablen) zu bestimmen, und wenden dann einen anderen Algorithmus an, um ein bestimmtes Ergebnis auf Grundlage dieser Daten vorherzusagen. SQL Server Datamining können Sie mehrere Modelle für eine einzelne Miningstruktur erstellen, damit innerhalb einer einzelnen Datamining-Lösung Sie clustering-Algorithmus, ein entscheidungsstrukturmodell und ein Naïve Bayes-Modell verschiedene Sichten auf Ihre Daten abgerufen können. Sie können mehrere Algorithmen innerhalb einer einzelnen Projektmappe auch verwenden, um separate Aufgaben: Angenommen, Sie verwenden Regression finanzielle Vorhersage generieren und verwenden einen neural Network-Algorithmus zum Durchführen einer Analyse der Faktoren, die Prognosen zu beeinflussen konnte.

Auswählen eines Algorithmus nach Task

Um Ihnen die Auswahl eines Algorithmus für einen bestimmten Task zu erleichtern, ist in der folgende Tabelle angegeben, für welche Tasktypen die einzelnen Algorithmen üblicherweise verwendet werden.

Beispiele für TasksMicrosoft-Algorithmen
Vorhersagen eines diskreten Attributs:

Kennzeichnen von Kunden in einer Liste potenzieller Käufer als Kunden mit wahrscheinlicher oder unwahrscheinlicher Kaufabsicht.

Berechnen der Wahrscheinlichkeit, dass ein Server innerhalb der nächsten sechs Monate ausfällt.

Kategorisieren von Therapieergebnissen und Untersuchen verwandter Faktoren.
Microsoft Decision Trees-Algorithmus

 Microsoft Naive Bayes-Algorithmus

 Microsoft Clustering-Algorithmus

 Microsoft Neural Network-Algorithmus
Vorhersagen eines kontinuierlichen Attributs:

Vorhersagen des Verkaufstrends für das nächste Jahr.

Vorhersagen von Websitebesuchern anhand historischer und saisonaler Trends.

Generieren einer Risikobewertung anhand demografischer Daten.
Microsoft Decision Trees-Algorithmus

 Microsoft Time Series-Algorithmus

 Microsoft Linear Regression-Algorithmus
Vorhersagen einer Sequenz an:

Ausführen einer Clickstreamanalyse für eine Unternehmenswebsite.

Analysieren der Faktoren, die zu einem Serverausfall führen.

Aufzeichnen und Analysieren von Arbeitsabläufen während ambulanter Arztbesuche, um Best Practices für allgemeine Abläufe aufzustellen.
Microsoft Sequence Clustering-Algorithmus
Suchen von Gruppen aus allgemeinen Elementen in Transaktionen:

Bestimmen der Produktplatzierung mithilfe der Warenkorbanalyse.

Vorschlagen zusätzlicher Produktkäufe für einen Kunden.

Analysieren einer Besucherumfrage zu einer Veranstaltung, um festzustellen, welche Aktivitäten oder Stände eine Korrelation aufweisen, und zukünftige Aktivitäten zu planen.
Microsoft Association-Algorithmus

 Microsoft Decision Trees-Algorithmus
Suchen von Gruppen ähnlicher Elemente:

Gruppieren von Patientenrisikoprofilen auf der Grundlage von Attributen wie demografischen oder Verhaltensdaten.

Analysieren von Benutzern anhand von Browsing- und Kaufmustern.

Identifizieren von Servern mit ähnlichen Verwendungsmerkmalen.
Microsoft Clustering-Algorithmus

 Microsoft Sequence Clustering-Algorithmus

Die folgende Tabelle enthält Links zu Lernressourcen für jeden Datamining-Algorithmen, die in bereitgestellt werden SQL Server Data Mining:

Grundlegende AlgorithmusbeschreibungErläutert die Bedeutung und Funktionsweise des Algorithmus und zeigt mögliche Geschäftsszenarien auf, in denen der Algorithmus hilfreich sein könnte.
Microsoft Association-Algorithmus

 Microsoft Clustering-Algorithmus

 Microsoft Decision Trees-Algorithmus

 Microsoft Linear Regression-Algorithmus

 Microsoft Logistic Regression-Algorithmus

 Microsoft Naive Bayes-Algorithmus

 Microsoft Neural Network-Algorithmus

 Microsoft Sequence Clustering-Algorithmus

 Microsoft Time Series-Algorithmus
Technische ReferenzStellt technische Details zur Implementierung des Algorithmus ggf. mit Verweisen auf wissenschaftliche Artikel bereit. Listet die Parameter auf, die Sie festlegen können, um das Verhalten des Algorithmus zu steuern und die Ergebnisse im Modell anzupassen. Beschreibt Datenanforderungen sowie Leistungstipps, falls möglich.
Technische Referenz für den Microsoft Association-Algorithmus

 Technische Referenz für den Microsoft Clustering-Algorithmus

 Technische Referenz für den Microsoft Decision Trees-Algorithmus

 Technische Referenz für den Microsoft Linear Regression-Algorithmus

 Technische Referenz für den Microsoft Logistic Regression-Algorithmus

 Technische Referenz für den Microsoft Naive Bayes-Algorithmus

 Technische Referenz für den Microsoft Neural Network-Algorithmus

 Technische Referenz für den Microsoft Sequence Clustering-Algorithmus

 Technische Referenz für den Microsoft Time Series-Algorithmus
ModellinhaltBeschreibt die Strukturierung der Informationen innerhalb der einzelnen Data Mining-Modelltypen und erläutert, wie die in den einzelnen Knoten gespeicherten Informationen interpretiert werden.
Miningmodellinhalt von Zuordnungsmodellen & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von Clustering-Modelle & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von Entscheidungsstrukturmodellen & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von linearen Regressionsmodellen & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von logistischen Regressionsmodellen & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von Naive Bayes-Modelle & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von Modellen neuronaler Netzwerke & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von Sequence Clustering-Modelle & #40; Analysis Services – Datamining & #41;

 Miningmodellinhalt von Zeitreihenmodellen & #40; Analysis Services – Datamining & #41;
Data Mining-AbfragenStellt mehrere Abfragen bereit, die mit jedem Modelltyp verwendet werden können. Zu den Beispielen gehören Inhaltsabfragen, die Aufschluss über die im Modell enthaltenen Muster geben, und Vorhersageabfragen, die Sie beim Generieren von Vorhersagen auf Grundlage dieser Muster unterstützen.
Beispiele für Zuordnungsmodellabfragen

 Beispiele für Clusteringmodellabfragen

 Beispiele für Entscheidungsstruktur-Modellabfragen

 Beispiele für lineare Regressionsmodellabfrage

 Logistische Regressionsmodell-Abfragebeispiele

 Beispiele für Naive Bayes-Modellabfrage

 Neuronale Beispiele für Netzwerkmodellabfragen

 Sequenzclusteringmodellabfragebeispiele

 Abfragebeispiel Zeitreihenmodell
ThemaBeschreibung
Bestimmen des von einem Data Mining-Modell verwendeten AlgorithmusAbfragen der Parameter, mit denen ein Miningmodell erstellt wird
Erstellen eines benutzerdefinierten Plug-In-AlgorithmusPlug-In-Algorithmen
Durchsuchen eines Modells mit einem algorithmusspezifischen ViewerData Mining-Modell-Viewer
Anzeigen des Inhalts eines Modells unter Verwendung eines generischen TabellenformatsDurchsuchen eines Modells mit dem Microsoft Generic Content Tree Viewer
Hier erfahren Sie, wie die Daten eingerichtet und Algorithmen zum Erstellen von Modellen verwendet werdenMiningstrukturen & #40; Analysis Services – Datamining & #41;

 Miningmodelle & #40; Analysis Services – Datamining & #41;

Data Mining-Tools

Community-Beiträge

Anzeigen:
© 2016 Microsoft