Microsoft Neural Network-Algorithmus (Analysis Services - Data Mining)

In SQL Server Analysis Services kombiniert der Microsoft Neural Network-Algorithmus jeden möglichen Status des Eingabeattributs mit jedem möglichen Status des vorhersagbaren Attributs und nutzt die Trainingsdaten für die Berechnung der Wahrscheinlichkeiten. Sie können diese Wahrscheinlichkeiten später für die Klassifizierung oder Regression und für die Vorhersage eines Ergebnisses des vorhergesagten Attributs auf Basis der Eingabeattribute verwenden.

Ein Miningmodell, das mit dem Microsoft Neural Network-Algorithmus erstellt wurde, kann mehrere Netzwerke enthalten, abhängig von der Anzahl an Spalten, die für die Eingabe und Vorhersage verwendet wird, und von der Spaltenanzahl, die nur für die Vorhersage verwendet wird. Die Anzahl von Netzwerken in einem einzelnen Miningmodell hängt von der Anzahl der in den Eingabe- und vorhersagbaren Spalten enthaltenen Status, die das Miningmodell verwendet, ab.

Beispiel

Der Microsoft Neural Network-Algorithmus ist hilfreich zum Analysieren komplexer Eingabedaten, z. B. die eines Produktions- oder Handelsprozesses oder von Geschäftsproblemen. Für diese Daten sind zwar bedeutende Trainingsdatenmengen verfügbar, jedoch können für diese Daten Regeln mithilfe anderer Algorithmen nicht einfach abgeleitet werden.

Das Verwenden des Microsoft Neural Network-Algorithmus wird in folgenden Szenarien empfohlen:

  • Marketing- und Werbeanalysen, z. B. zur Erfolgsermittlung einer Werbung per E-Mail oder einer Radiowerbekampagne.

  • Vorhersagen von Lagerbewegungen, Kursschwankungen oder von anderen hoch liquiden Finanzinformationen aus Vergangenheitsdaten.

  • Analysieren von Produktions- und Gewerbeprozessen.

  • Text Mining.

  • Ein beliebiges Vorhersagemodell, das komplexe Beziehungen zwischen vielen Eingaben und relativ wenigen Ausgaben analysiert.

Funktionsweise des Algorithmus

Der Microsoft Neural Network-Algorithmus erstellt ein Netzwerk, das aus bis zu drei Neuronenebenen besteht. Zu diesen Ebenen gehört eine Eingabeebene, eine optionale verborgene Ebene und eine Ausgabeebene.

Eingabeebene: Eingabeneuronen definieren alle Eingabeattributwerte für das Data Mining-Modell und deren Wahrscheinlichkeiten.

Verborgene Ebene: Verborgene Neuronen empfangen die von Eingabeneuronen bereitgestellten Eingaben und stellen Ausgabeneuronen die empfangenen Ausgaben zur Verfügung. In der verborgenen Ebene werden den verschiedenen Wahrscheinlichkeiten der Eingaben Gewichtungen zugewiesen. Eine Gewichtung beschreibt die Relevanz oder Wichtigkeit einer bestimmten Eingabe zum verborgenen Neuron. Je größer die Gewichtung ist, die einer Eingabe zugewiesen wird, desto wichtiger ist der Wert dieser Eingabe. Gewichtungen können negativ sein, was bedeutet, dass ein bestimmtes Ergebnis durch die Eingabe eher unterdrückt als begünstigt werden kann.

Ausgabeebene: Ausgabeneuronen stellen vorhersagbare Attributwerte des Data Mining-Modells dar.

Eine ausführliche Erklärung dazu, wie die Eingabeebene, die verborgene Ebene und die Ausgabeebene erstellt und eingestuft werden, finden Sie unter Technische Referenz für den Microsoft Neural Network-Algorithmus.

Erforderliche Daten für neuronale Netzwerkmodelle

Ein neuronales Netzwerkmodell muss eine Schlüsselspalte, mindestens eine Eingabespalte und mindestens eine vorhersagbare Spalte enthalten.

Data Mining-Modelle, die den Microsoft Neural Network-Algorithmus verwenden, hängen stark von den Werten ab, die Sie für die im Algorithmus verfügbaren Parameter festlegen. Die Parameter legen fest, wie Daten als Stichprobe genommen werden, wie die Daten in jeder Spalte verteilt werden oder werden sollen und wann die Featureauswahl aufgerufen wird, um die im endgültigen Modell zu verwendenden Werte einzugrenzen.

Weitere Informationen über die Parametereinstellung zur Anpassung von Modellverhalten finden Sie unter Technische Referenz für den Microsoft Neural Network-Algorithmus.

Anzeigen eines neuronalen Netzwerkmodells

Um mit den Daten zu arbeiten und zu sehen, wie das Modell Eingaben mit Ausgaben korreliert, können Sie den Microsoft-Viewer für neuronale Netzwerke verwenden. Über diesen benutzerdefinierten Viewer können Sie Eingabeattribute und deren Werte filtern und Diagramme einsehen, die darstellen, welche Auswirkungen diese auf die Ausgaben haben. Die QuickInfos im Viewer zeigen Ihnen die Wahrscheinlichkeit und Prognose für jedes Paar an Eingabe- und Ausgabewerten an. Weitere Informationen finden Sie unter Anzeigen eines Miningmodells mit dem Microsoft Viewer für neuronale Netzwerke.

Die einfachste Art und Weise, die Struktur des Modells zu durchsuchen, erfolgt über den Microsoft Generic Content Tree-Viewer. Hier können Sie die Eingaben, Ausgaben und Netzwerke einsehen, die vom Modell erstellt wurden, und auf jeden beliebigen Knoten klicken, um diesen zu erweitern und Statistiken in Bezug auf die Knoten der Eingabe-, Ausgabeebene und der verborgenen Ebene einzusehen. Weitere Informationen finden Sie unter Anzeigen von Modelldetails mit dem Microsoft Generic Content Tree Viewer.

Erstellen von Vorhersagen

Nachdem das Modell verarbeitet wurde, können Sie das Netzwerk und die innerhalb eines jeden Knotens gespeicherten Gewichtungen verwenden, um Vorhersagen zu erstellen. Ein neuronales Netzwerkmodell unterstützt Regression, Zuordnung und Klassifikationsanalyse. Daher können die Bedeutungen der einzelnen Vorhersagen unterschiedlich sein. Darüber hinaus können Sie das Modell selbst abfragen, um die gefundenen Korrelationen zu prüfen und die entsprechenden Statistiken abzurufen. Beispiele dazu, wie Abfragen für ein neuronales Netzwerkmodell erstellt werden, finden Sie unter Abfragen eines neuronalen Netzwerkmodells (Analysis Services - Data Mining).

Allgemeine Informationen über die Erstellung von Abfragen für ein Data Mining-Modell finden Sie unter Abfragen von Data Mining-Modellen (Analysis Services - Data Mining).

Hinweise

  • Unterstützt nicht Drillthrough oder Data Mining-Dimensionen. Grund hierfür ist, dass die Struktur der Knoten im Miningmodell nicht zwangsläufig den zugrunde liegenden Daten direkt entspricht.

  • Unterstützt nicht die Erstellung von Modellen im PMML-Format (Predictive Model Markup Language).

  • Unterstützt die Verwendung von OLAP-Miningmodellen.

  • Unterstützt nicht die Erstellung von Data Mining-Dimensionen.