Miningmodellinhalt von logistischen Regressionsmodellen (Analysis Services – Data Mining)

Artikel
07/30/2013

In diesem Thema wird der Miningmodellinhalt beschrieben, der Modellen eigen ist, die den Microsoft Logistic Regression-Algorithmus verwenden. Eine Erklärung dazu, wie Statistiken und Strukturen, die allen Modelltypen eigen sind, interpretiert werden, und die allgemeinen Definitionen von Begriffen in Bezug auf den Miningmodellinhalt finden Sie unter Miningmodellinhalt (Analysis Services – Data Mining).

Grundlegendes zur Struktur von logistischen Regressionsmodellen

Ein logistisches Regressionsmodell wird mithilfe des Microsoft Neural Network-Algorithmus mit Parametern erstellt, die das Modell darauf beschränken, den verborgenen Knoten zu entfernen. Daher ist die Gesamtstruktur eines logistischen Regressionsmodells fast identisch mit dem eines neuronalen Netzwerks: Jedes Modell verfügt sowohl über einen einzelnen übergeordneten Knoten, der das Modell und dessen Metadaten darstellt, als auch über einen besonderen Knoten für Randstatistik (NODE_TYPE = 24), der beschreibende Statistiken über die im Modell verwendeten Eingaben liefert.

Zusätzlich enthält das Modell ein Subnetzwerk (NODE_TYPE = 17) für jedes vorhersagbare Attribut. Wie auch bei einem neuronalen Netzwerkmodell enthält jedes Subnetzwerk zwei Zweige: einen für die Eingabeebene und einen weiteren Zweig, der die verborgene Ebene (NODE_TYPE = 19) und die Ausgabeebene (NODE_TYPE = 20) für das Netzwerk enthält. Das gleiche Subnetzwerk kann für mehrere Attribute verwendet werden, wenn sie nur auf die Vorhersage festgelegt sind. Vorhersagbare Attribute, die auch Eingaben sind, erscheinen möglicherweise nicht im gleichen Subnetzwerk.

Allerdings ist bei einem logistischen Regressionsmodell der Knoten, der die verborgene Ebene darstellt, leer und verfügt über keine untergeordneten Elemente. Daher enthält das Modell Knoten, die einzelne Ausgaben (NODE_TYPE = 23) und einzelne Eingaben (NODE_TYPE = 21), aber keine einzelnen, verborgenen Knoten darstellen.

Inhaltsstruktur für logistisches Regressionsmodell

Standardmäßig wird ein logistisches Regressionsmodell im Microsoft-Viewer für neuronale Netzwerke angezeigt. Über diesen benutzerdefinierten Viewer können Sie Eingabeattribute und deren Werte filtern und Diagramme einsehen, die darstellen, welche Auswirkungen diese auf die Ausgaben haben. Die QuickInfos im Viewer zeigen Ihnen die Wahrscheinlichkeit und Prognose für jedes Paar an Eingaben und Ausgabewerten an. Weitere Informationen finden Sie unter Modell mit dem Microsoft-Viewer für neuronale Netzwerke durchsuchen.

Um die Struktur der Eingaben und Subnetzwerke zu durchsuchen und detaillierte Statistiken einzusehen, können Sie den Microsoft Generic Content Tree-Viewer verwenden. Sie können auf jeden Knoten klicken, um diesen zu erweitern und die untergeordneten Knoten einzusehen. Des Weiteren können Sie die Gewichtungen und andere Statistiken einsehen, die im Knoten enthalten sind.

Modellinhalt eines logistischen Regressionsmodells

In diesem Abschnitt werden nur diejenigen Spalten des Miningmodellinhalts detaillierter und anhand von Beispielen erläutert, die für die logistische Regression relevant sind. Der Modellinhalt ist fast identisch mit dem eines neuronalen Netzwerkmodells. Allerdings können Beschreibungen, die für neuronale Netzwerkmodelle gelten, in dieser Tabelle wiederholt werden.

Informationen zu den allgemeinen Spalten im Schemarowset, z. B. MODEL_CATALOG und MODEL_NAME, die hier nicht beschrieben werden, sowie weitere Erläuterungen zur Miningmodell-Terminologie finden Sie unter Miningmodellinhalt (Analysis Services – Data Mining).

MODEL_CATALOG
Name der Datenbank, in der das Modell gespeichert wird.
MODEL_NAME
Name des Modells.

ATTRIBUTE_NAME
Die Namen des Attributs, das diesem Knoten entspricht.

Node	Inhalt
Modellstamm	Leer
Randstatistik	Leer
Eingabeebene	Leer
Eingabeknoten	Name des Eingabeattributs
Verborgene Ebene	Leer
Ausgabeebene	Leer
Ausgabeknoten	Name des Ausgabeattributs

NODE_NAME
Der Name des Knotens. Derzeit enthält diese Spalte den gleichen Wert wie NODE_UNIQUE_NAME. Dies ändert sich möglicherweise in zukünftigen Versionen.
NODE_UNIQUE_NAME
Der eindeutige Name des Knotens.

Weitere Informationen darüber, wie die Namen und IDs Strukturinformationen über Modelle bieten, finden Sie unter Verwenden von Knotennamen und IDs.

NODE_TYPE
Ein logistisches Regressionsmodell gibt die folgenden Knotentypen aus:

Knotentyp-ID	Beschreibung
1	Modell.
17	Planerknoten für das Subnetzwerk.
18	Planerknoten für die Eingabeebene.
19	Planerknoten für die verborgene Ebene. Die verborgene Ebene ist leer.
20	Planerknoten für die Ausgabeebene.
21	Eingabeattributknoten.
23	Ausgabeattributknoten.
24	Knoten für Randstatistik.

NODE_CAPTION
Eine Bezeichnung oder Beschriftung, die dem Knoten zugeordnet ist. In logistischen Regressionsmodellen immer Leerzeichen.

CHILDREN_CARDINALITY
Eine Schätzung der Anzahl untergeordneter Elemente des Knotens.

Node	Inhalt
Modellstamm	Gibt die Anzahl der untergeordneten Knoten an; enthält mindestens 1 Netzwerk, 1 erforderlichen Knoten für Randstatistik und 1 erforderliche Eingabeebene. Beispiel: Bei einem Wert von 5 sind 3 Subnetzwerke vorhanden.
Randstatistik	Immer 0.
Eingabeebene	Gibt die Anzahl der Eingabeattribut-Wert-Paare an, die vom Modell verwendet wurden.
Eingabeknoten	Immer 0.
Verborgene Ebene	In einem logistischen Regressionsmodell immer 0.
Ausgabeebene	Gibt die Anzahl der Ausgabewerte an.
Ausgabeknoten	Immer 0.

PARENT_UNIQUE_NAME
Der eindeutige Name des dem Knoten übergeordneten Elements. Für Knoten auf der Stammebene wird NULL zurückgegeben.

Weitere Informationen darüber, wie die Namen und IDs Strukturinformationen über Modelle bieten, finden Sie unter Verwenden von Knotennamen und IDs.

NODE_DESCRIPTION
Eine benutzerfreundliche Beschreibung des Knotens.

Node	Inhalt
Modellstamm	Leer
Randstatistik	Leer
Eingabeebene	Leer
Eingabeknoten	Name des Eingabeattributs
Verborgene Ebene	Leer
Ausgabeebene	Leer
Ausgabeknoten	Enthält den Namen des Ausgabeattributs, wenn das Ausgabeattribut kontinuierlich ist. Enthält den Namen des Attributs und den Wert, wenn das Ausgabeattribut diskret oder diskretisiert ist.

NODE_RULE
Eine XML-Beschreibung der Regel, die in den Knoten eingebettet ist.

Node	Inhalt
Modellstamm	Leer
Randstatistik	Leer
Eingabeebene	Leer
Eingabeknoten	Ein XML-Fragment, das die gleichen Informationen wie die Spalte NODE_DESCRIPTION enthält.
Verborgene Ebene	Leer
Ausgabeebene	Leer
Ausgabeknoten	Ein XML-Fragment, das die gleichen Informationen wie die Spalte NODE_DESCRIPTION enthält.

MARGINAL_RULE
Für logistische Regressionsmodelle immer Leerzeichen.
NODE_PROBABILITY
Die diesem Knoten zugeordnete Wahrscheinlichkeit. Für logistische Regressionsmodelle immer 0.
MARGINAL_PROBABILITY
Die Wahrscheinlichkeit, mit der dieser Knoten vom übergeordneten Knoten erreicht wird. Für logistische Regressionsmodelle immer 0.
NODE_DISTRIBUTION
Eine geschachtelte Tabelle, die statistische Informationen für den Knoten enthält. Detaillierte Informationen über die Inhalte dieser Tabelle für jeden Knotentyp finden Sie im Abschnitt "Grundlegendes zur NODE_DISTRIBUTION-Tabelle" unter Miningmodellinhalt von neuronalen Netzwerkmodellen (Analysis Services - Data Mining).

NODE_SUPPORT
Für logistische Regressionsmodelle immer 0.

Hinweis
Unterstützungswahrscheinlichkeiten sind immer 0, da die Ausgabe dieses Modellstyps nicht probabilistisch ist. Nur die Gewichtungen sind für den Algorithmus von Bedeutung. Daher erfolgt keine Verarbeitung von Wahrscheinlichkeit, Unterstützung oder Varianz durch den Algorithmus.

Informationen über die Unterstützung in Trainingsfällen für spezifische Werte finden Sie über den Knoten für Randstatistik.

MSOLAP_MODEL_COLUMN

Node	Inhalt
Modellstamm	Leer
Randstatistik	Leer
Eingabeebene	Leer
Eingabeknoten	Name des Eingabeattributs.
Verborgene Ebene	Leer
Ausgabeebene	Leer
Ausgabeknoten	Name des Eingabeattributs.

MSOLAP_NODE_SCORE
In logistischen Regressionsmodellen immer 0.
MSOLAP_NODE_SHORT_CAPTION
In logistischen Regressionsmodellen immer Leerzeichen.

Verwenden von Knotennamen und IDs

Die Benennung der Knoten in einem logistischen Regressionsmodell bietet zusätzliche Informationen über die Beziehungen zwischen den Knoten im Modell. In der folgenden Tabelle werden die Konventionen für die IDs dargestellt, die den Knoten in jeder Ebene zugewiesen werden.

Knotentyp	Konvention für Knoten-ID
Modellstamm (1)	00000000000000000.
Knoten für Randstatistik (24)	10000000000000000
Eingabeebene (18)	30000000000000000
Eingabeknoten (21)	Beginnt bei 60000000000000000
Subnetzwerk (17)	20000000000000000
Verborgene Ebene (19)	40000000000000000
Ausgabeebene (20)	50000000000000000
Ausgabeknoten (23)	Beginnt bei 80000000000000000

Sie können diese IDs verwenden, um zu bestimmen, in welcher Beziehung Ausgabeattribute zu spezifischen Attributen der Eingabeebene stehen, indem Sie die Tabelle NODE_DISTRIBUTION des Ausgabeknotens einsehen. Jede Zeile in dieser Tabelle enthält eine ID, die auf einen bestimmten Eingabeattributknoten zurückzeigt. Die NODE_DISTRIBUTION-Tabelle enthält auch den Koeffizienten für dieses Eingabe-Ausgabe-Paar.

Siehe auch

Verweis

Miningmodellinhalt von neuronalen Netzwerkmodellen (Analysis Services - Data Mining)

Technische Referenz für den Microsoft Logistic Regression-Algorithmus

Konzepte

Microsoft Logistic Regression-Algorithmus

Logistische Regressionsmodell-Abfragebeispiele