Anforderungen und Überlegungen zur Verarbeitung (Data Mining)

Artikel
07/30/2013

In diesem Thema werden in einige technische Überlegungen behandelt, die beim Verarbeiten von Data Mining-Objekten berücksichtigt werden sollten. Eine allgemeine Erklärung der Verarbeitung und deren Anwendung auf Data Mining finden Sie unter Verarbeiten von Data Mining-Objekten.

Abfragen an relationalen Speicher

Verarbeiten von Miningstrukturen

Verarbeiten von Miningmodellen

Abfragen an den relationalen Speicher während der Verarbeitung

Für Data Mining besteht der Verarbeitungsprozess aus drei Phasen: Abfragen der Quelldaten, Bestimmen der statistischen Rohdaten und Trainieren des Miningmodells mit der Modelldefinition und dem Modellalgorithmus.

Der Analysis Services-Server gibt Abfragen an die Datenbank aus, die die Rohdaten bereitstellt. Bei dieser Datenbank kann es sich um eine Instanz von SQL Server 2012 oder einer früheren Version des SQL Server-Datenbankmoduls handeln. Beim Verarbeiten einer Data Mining-Struktur werden die Daten der Quelle an die Miningstruktur übertragen und in einem neuen komprimierten Format auf dem Datenträger gespeichert. Es werden nicht alle Spalten der Datenquelle verarbeitet: Es werden nur die Spalten verarbeitet, die gemäß der Definition durch die Bindungen in der Miningstruktur enthalten sind.

Mit den Rohdaten baut Analysis Services einen Index aller Daten und diskretisierten Spalten auf und erstellt einen separaten Index für fortlaufende Spalten. Für jede geschachtelte Tabelle wird zum Erstellen des Index eine Abfrage ausgegeben. Eine weitere Abfrage wird für jede geschachtelte Tabelle generiert, um die Beziehungen zwischen den einzelnen Paaren einer geschachtelten Tabelle und Falltabelle zu verarbeiten. Es werden mehrere Abfragen erstellt, um einen besonderen internen mehrdimensionalen Datenspeicher zu verarbeiten. Sie können die Anzahl der Abfragen, die von Analysis Services an den relationalen Speicher gesendet werden, beschränken, indem Sie die Servereigenschaft DatabaseConnectionPoolMax festlegen. Weitere Informationen finden Sie unter OLAP-Eigenschaften.

Beim Verarbeiten des Modells liest das Modell die Daten nicht erneut von der Datenquelle, sondern ruft stattdessen die Zusammenfassung der Daten aus der Miningstruktur ab. Mit dem erstellten Cube und den zwischengespeicherten Index- und Falldaten erstellt der Server unabhängige Threads zum Trainieren der Modelle.

Weitere Informationen zu den Editionen von SQL Server, die die parallele Modellverarbeitung unterstützen, finden Sie unter Von den SQL Server 2012-Editionen unterstützte Funktionen (https://go.microsoft.com/fwlink/?linkid=232473).

Verarbeiten von Miningstrukturen

Eine Miningstruktur kann zusammen mit allen abhängigen Modellen oder getrennt verarbeitet werden. Die Verarbeitung einer Miningstruktur getrennt von Modellen kann nützlich sein, wenn manche Modelle voraussichtlich eine lange Verarbeitungszeit benötigen und Sie diesen Vorgang aufschieben möchten.

Weitere Informationen finden Sie unter Verarbeiten einer Miningstruktur.

Wenn es für Sie wichtig ist, Festplattenspeicherplatz zu sparen, beachten Sie, dass die von Analysis Services beibehaltene Miningstruktur lokal zwischengespeichert wird. Das bedeutet, dass alle Trainingsdaten auf die lokale Festplatte geschrieben werden. Wenn keine Daten zwischengespeichert werden sollen, können Sie die Standardeinstellung ändern, indem Sie für die MiningStructureCacheMode-Eigenschaft der Miningstruktur ClearAfterProcessing festlegen. Auf diese Weise wird der Zwischenspeicher nach der Verarbeitung der Modelle gelöscht, und außerdem wird Drillthrough für die Miningstruktur deaktiviert. Weitere Informationen finden Sie unter Drillthroughabfragen (Data Mining).

Wenn Sie den Cache löschen, können Sie außerdem nicht den Zurückhaltungstestsatz verwenden, wenn Sie einen solchen definiert haben, und die Definition der Testsatzpartition geht verloren. Weitere Informationen zu Zurückhaltungstestsätzen finden Sie unter Trainings- und Testdatasets.

Verarbeiten von Miningmodellen

Sie können ein Miningmodell getrennt von seiner zugeordnete Miningstruktur verarbeiten, oder Sie können alle Modelle, die auf der Struktur basieren, zusammen mit der Struktur verarbeiten.

Weitere Informationen finden Sie unter Verarbeiten eines Miningmodells.

In SQL Server-Datentools (SSDT) und SQL Server Management Studio können Sie jedoch nicht mehrere Miningmodelle für die Verarbeitung mit der Struktur auswählen. Wenn Sie steuern müssen, welche Modelle verarbeitet werden, müssen Sie sie einzeln auswählen oder XMLA bzw. DMX verwenden, um die Modelle seriell zu verarbeiten.

Wenn Neuverarbeitung erforderlich ist

Sie müssen die von Ihnen definierten Analysis Services-Modelle verarbeiten, bevor Sie damit arbeiten können. Darüber hinaus müssen Sie die Miningmodelle immer dann neu verarbeiten, wenn Sie Änderungen an der Struktur des Miningmodells vornehmen, die Trainingsdaten aktualisieren, ein vorhandenes Miningmodell ändern oder der Struktur ein neues Miningmodell hinzufügen.

Miningmodelle werden auch in folgenden Szenarien verarbeitet:

Bereitstellung eines Projekts: Abhängig von den Projekteinstellungen und dem aktuellen Projektstatus werden die Miningmodelle im Projekt in der Regel zum Zeitpunkt der Bereitstellung des Projekts vollständig verarbeitet.

Beim Initiieren der Bereitstellung beginnt die Verarbeitung automatisch, es sei denn, auf dem Analysis Services-Server befindet sich eine zu einem früheren Zeitpunkt verarbeitete Version und es gibt keine strukturellen Änderungen. Wählen Sie aus der Dropdownliste Projektmappe bereitstellen aus, oder drücken Sie F5, um ein Projekt bereitzustellen. Folgende Aktionen sind möglich:

Weitere Informationen zum Festlegen von Analysis Services-Bereitstellungseigenschaften, die steuern, wie Miningmodelle bereitgestellt werden, finden Sie unter Bereitstellen von Data Mining-Lösungen.

Verschieben eines Miningmodells: Wenn Sie mit dem EXPORT-Befehl ein Miningmodell verschieben, wird nur die Definition des Modells exportiert. Dazu gehört der Name der Miningstruktur, die Daten an das Modell bereitstellen soll.

Neuverarbeitungsanforderungen für die folgenden Szenarien, die die Befehle EXPORT und IMPORT verwenden:

Die Miningstruktur ist auf der Zielinstanz vorhanden, und die Miningstruktur befindet sich in einem nicht verarbeiteten Status.

Sowohl die Struktur als auch das Modell müssen erneut verarbeitet werden.
Die Miningstruktur ist auf der Zielinstanz vorhanden, und die Miningstruktur wurde verarbeitet. Nur das Miningmodell wurde exportiert.

Das Modell kann ohne Verarbeitung verwendet werden.
Die Miningstrukturdefinition wurde ebenfalls mit dem WITH DEPENDENCIES-Schlüsselwort exportiert.

Sowohl die Struktur als auch das Modell müssen erneut verarbeitet werden.

Weitere Informationen finden Sie unter Exportieren und Importieren von Data Mining-Objekten.

Siehe auch

Konzepte

Miningstrukturen (Analysis Services - Data Mining)

Verarbeitung von mehrdimensionalen Modellobjekten

Anforderungen und Überlegungen zur Verarbeitung (Data Mining)

Abfragen an den relationalen Speicher während der Verarbeitung

Verarbeiten von Miningstrukturen

Verarbeiten von Miningmodellen

Wenn Neuverarbeitung erforderlich ist

Siehe auch

Konzepte

Zusätzliche Ressourcen