Verarbeiten von Data Mining-Objekten

Ein Data Mining-Objekt ist vor seiner Verarbeitung nur ein leerer Container. Die Verarbeitung eines Data Mining-Modells wird auch als Training bezeichnet.

Verarbeiten von Miningstrukturen:   Eine Miningstruktur ruft Daten von einer externen Datenquelle ab, die über die Spaltenbindungen und Verwendungsmetadaten definiert ist, und liest die Daten. Diese Daten werden vollständig gelesen und anschließend analysiert, um verschiedene statistische Informationen zu extrahieren. Analysis Services speichert eine kurze Darstellung der Daten, die für die Analyse durch Data Mining-Algorithmen geeignet ist, in einem lokalen Cache. Sie können diesen Cache entweder beibehalten oder löschen, nachdem die Modelle verarbeitet wurden. Standardmäßig wird der Cache gespeichert. Weitere Informationen finden Sie unter Verarbeiten einer Miningstruktur.

Verarbeiten von Miningmodellen:    Bis zu seiner Verarbeitung ist ein Miningmodell leer und enthält nur Definitionen. Um ein Miningmodell verarbeiten zu können, muss zuerst die zugrunde liegende Miningstruktur verarbeitet werden. Das Miningmodell erhält die Daten aus dem Cache der Miningstruktur, wendet die Filter an, die ggf. für das Modell erstellt wurden, und übergibt dann das Dataset über den Algorithmus, um Muster zu ermitteln. Nachdem das Modell verarbeitet wurde, speichert das Modell nur die Ergebnisse der Verarbeitung, nicht die Daten selbst. Weitere Informationen finden Sie unter Verarbeiten eines Miningmodells.

In der folgenden Abbildung ist jeweils der Datenfluss für die Verarbeitung einer Miningstruktur und für die Verarbeitung eines Miningmodells dargestellt.

Datenverarbeitung: Quelle-zu-Struktur-zu-Modell

Anzeigen der Ergebnisse der Verarbeitung

Nachdem eine Miningstruktur verarbeitet wurde, enthält sie eine kurze Darstellung der Daten zur Verwendung in statistischen Analysen. Wenn der Cache nicht gelöscht wurde, können Sie wie folgt auf die Daten im Cache zugreifen:

Nachdem ein Miningmodell verarbeitet wurde, enthält es nur die Muster, die bei der Analyse ermittelt wurden, sowie die Zuordnungen von den Modellergebnissen zu den im Cache zwischengespeicherten Trainingsdaten. Sie können die Modellergebnisse, die auch als Modellinhalt bezeichnet werden, durchsuchen oder abfragen, oder Sie können die Modell- und Strukturfälle abfragen, wenn diese zwischengespeichert wurden.

Der Modellinhalt eines Miningmodells hängt von dem Algorithmus ab, der für die Erstellung verwendet wurde. Wenn ein Modell beispielsweise ein Clusteringmodell ist und ein anderes Modell ein Entscheidungsstrukturmodell, unterscheidet sich der Modellinhalt stark, obwohl die beiden Modelle dieselben Daten verwenden. Weitere Informationen finden Sie unter Miningmodellinhalt (Analysis Services – Data Mining).

Anforderungen für die Verarbeitung

Die Anforderungen für die Verarbeitung hängen davon ab, ob die Miningmodelle ausschließlich auf relationalen Daten oder auf einer mehrdimensionaler Datenquelle basieren.

Bei einer relationalen Datenquelle müssen Sie für die Verarbeitung nur Trainingsdaten erstellen und Miningalgorithmen für diese Daten ausführen. Miningmodelle, die auf OLAP-Objekten, z. B. Dimensionen und Measures, basieren, erfordern jedoch, dass die zugrunde liegenden Daten in einem verarbeiteten Status vorliegen. Hierfür kann es notwendig sein, dass die mehrdimensionalen Objekte verarbeitet werden, um das Miningmodell zu füllen.

Weitere Informationen finden Sie unter Anforderungen und Überlegungen zur Verarbeitung (Data Mining).

Siehe auch

Konzepte

Drillthroughabfragen (Data Mining)

Miningstrukturen (Analysis Services - Data Mining)

Miningmodelle (Analysis Services – Data Mining)

Logische Architektur (Analysis Services - Data Mining)