Anforderungen und Überlegungen zur Verarbeitung (Data Mining)

Artikel
10/31/2023

Gilt für: SQL Server 2019 und früheren Analysis Services Azure Analysis Services Fabric/Power BI Premium

Wichtig

Data Mining wurde in SQL Server 2017 Analysis Services als veraltet eingestuft und wurde jetzt in SQL Server 2022 Analysis Services eingestellt. Die Dokumentation wird für veraltete und eingestellte Features nicht aktualisiert. Weitere Informationen finden Sie unter Abwärtskompatibilität von Analysis Services.

In diesem Thema werden in einige technische Überlegungen behandelt, die beim Verarbeiten von Data Mining-Objekten berücksichtigt werden sollten. Eine allgemeine Erklärung der Verarbeitung und deren Anwendung auf Data Mining finden Sie unter Verarbeiten von Data Mining-Objekten.

Abfragen an relationalen Speicher

Verarbeiten von Miningstrukturen

Verarbeiten von Miningmodellen

Abfragen an den relationalen Speicher während der Verarbeitung

Für Data Mining besteht der Verarbeitungsprozess aus drei Phasen: Abfragen der Quelldaten, Bestimmen der statistischen Rohdaten und Trainieren des Miningmodells mit der Modelldefinition und dem Modellalgorithmus.

Der SQL Server Analysis Services Server stellt Abfragen an die Datenbank aus, die die Rohdaten bereitstellt. Diese Datenbank kann eine instance von SQL Server 2017 oder einer früheren Version der SQL Server-Datenbank-Engine sein. Beim Verarbeiten einer Data Mining-Struktur werden die Daten der Quelle an die Miningstruktur übertragen und in einem neuen komprimierten Format auf dem Datenträger gespeichert. Es werden nicht alle Spalten der Datenquelle verarbeitet: Es werden nur die Spalten verarbeitet, die gemäß der Definition durch die Bindungen in der Miningstruktur enthalten sind.

Mithilfe dieser Daten erstellt SQL Server Analysis Services einen Index aller Daten und diskretisierten Spalten und erstellt einen separaten Index für fortlaufende Spalten. Für jede geschachtelte Tabelle wird zum Erstellen des Index eine Abfrage ausgegeben. Eine weitere Abfrage wird für jede geschachtelte Tabelle generiert, um die Beziehungen zwischen den einzelnen Paaren einer geschachtelten Tabelle und Falltabelle zu verarbeiten. Es werden mehrere Abfragen erstellt, um einen besonderen internen mehrdimensionalen Datenspeicher zu verarbeiten. Sie können die Anzahl der Abfragen begrenzen, die SQL Server Analysis Services an den relationalen Speicher sendet, indem Sie die Servereigenschaft DatabaseConnectionPoolMax festlegen. Weitere Informationen finden Sie unter OLAP Properties.

Beim Verarbeiten des Modells liest das Modell die Daten nicht erneut von der Datenquelle, sondern ruft stattdessen die Zusammenfassung der Daten aus der Miningstruktur ab. Mit dem erstellten Cube und den zwischengespeicherten Index- und Falldaten erstellt der Server unabhängige Threads zum Trainieren der Modelle.

Weitere Informationen zu den Editionen von SQL Server, die die parallele Modellverarbeitung unterstützen, finden Sie unter Features, die von den Editionen von SQL Server 2012 (https://go.microsoft.com/fwlink/?linkid=232473) unterstützt werden.

Verarbeiten von Miningstrukturen

Eine Miningstruktur kann zusammen mit allen abhängigen Modellen oder getrennt verarbeitet werden. Die Verarbeitung einer Miningstruktur getrennt von Modellen kann nützlich sein, wenn manche Modelle voraussichtlich eine lange Verarbeitungszeit benötigen und Sie diesen Vorgang aufschieben möchten.

Weitere Informationen finden Sie unter Process a Mining Structure.

Wenn Sie Bedenken haben, Festplattenspeicher zu sparen, beachten Sie, dass SQL Server Analysis Services Miningstrukturcaches lokal beibehält. Das bedeutet, dass alle Trainingsdaten auf die lokale Festplatte geschrieben werden. Wenn keine Daten zwischengespeichert werden sollen, können Sie die Standardeinstellung ändern, indem Sie für die MiningStructureCacheMode -Eigenschaft der Miningstruktur auf ClearAfterProcessing. Auf diese Weise wird der Zwischenspeicher nach der Verarbeitung der Modelle gelöscht, und außerdem wird Drillthrough für die Miningstruktur deaktiviert. Weitere Informationen finden Sie unter Drillthroughabfragen (Data Mining).

Wenn Sie den Cache löschen, können Sie außerdem nicht den Zurückhaltungstestsatz verwenden, wenn Sie einen solchen definiert haben, und die Definition der Testsatzpartition geht verloren. Weitere Informationen zu zurückgehaltenen Testsätzen finden Sie unter Trainings- und Testdatensätze.

Verarbeiten von Miningmodellen

Sie können ein Miningmodell getrennt von seiner zugeordnete Miningstruktur verarbeiten, oder Sie können alle Modelle, die auf der Struktur basieren, zusammen mit der Struktur verarbeiten.

Weitere Informationen finden Sie unter Verarbeiten eines Miningmodells.

In SQL Server Data Tools und SQL Server Management Studio können Sie jedoch keine Miningmodelle mehrfach auswählen, die mit der -Struktur verarbeitet werden sollen. Wenn Sie steuern müssen, welche Modelle verarbeitet werden, müssen Sie sie einzeln auswählen oder XMLA bzw. DMX verwenden, um die Modelle seriell zu verarbeiten.

Wenn Neuverarbeitung erforderlich ist

Sie müssen die SQL Server Analysis Services-Modelle verarbeiten, die Sie definieren, bevor Sie mit der Arbeit mit ihnen beginnen können. Darüber hinaus müssen Sie die Miningmodelle immer dann neu verarbeiten, wenn Sie Änderungen an der Struktur des Miningmodells vornehmen, die Trainingsdaten aktualisieren, ein vorhandenes Miningmodell ändern oder der Struktur ein neues Miningmodell hinzufügen.

Miningmodelle werden auch in folgenden Szenarien verarbeitet:

Bereitstellung eines Projekts: Abhängig von den Projekteinstellungen und dem aktuellen Projektstatus werden die Miningmodelle im Projekt in der Regel zum Zeitpunkt der Bereitstellung des Projekts vollständig verarbeitet.

Wenn Sie die Bereitstellung initiieren, wird die Verarbeitung automatisch gestartet, es sei denn, es gibt eine zuvor verarbeitete Version auf dem SQL Server Analysis Services Server und es wurden keine strukturellen Änderungen vorgenommen. Wählen Sie in der Dropdownliste Projektmappe bereitstellen aus, oder drücken Sie F5, um ein Projekt bereitzustellen. Sie haben folgende Möglichkeiten:

Weitere Informationen zum Festlegen SQL Server Analysis Services Bereitstellungseigenschaften, die steuern, wie Miningmodelle bereitgestellt werden, finden Sie unter Bereitstellung von Data Mining-Lösungen.

Verschieben eines Miningmodells: Wenn Sie mit dem EXPORT-Befehl ein Miningmodell verschieben, wird nur die Definition des Modells exportiert. Dazu gehört der Name der Miningstruktur, die Daten an das Modell bereitstellen soll.

Neuverarbeitungsanforderungen für die folgenden Szenarien, die die Befehle EXPORT und IMPORT verwenden:

Die Miningstruktur ist auf der Zielinstanz vorhanden, und die Miningstruktur befindet sich in einem nicht verarbeiteten Status.

Sowohl die Struktur als auch das Modell müssen erneut verarbeitet werden.
Die Miningstruktur ist auf der Zielinstanz vorhanden, und die Miningstruktur wurde verarbeitet. Nur das Miningmodell wurde exportiert.

Das Modell kann ohne Verarbeitung verwendet werden.
Die Miningstrukturdefinition wurde ebenfalls mit dem WITH DEPENDENCIES-Schlüsselwort exportiert.

Sowohl die Struktur als auch das Modell müssen erneut verarbeitet werden.

Weitere Informationen finden Sie unter Exportieren und Importieren von Data Mining-Objekten.

Weitere Informationen

Miningstrukturen (Analysis Services - Data Mining)
Miningstrukturen (Analysis Services - Data Mining)
Verarbeiten eines mehrdimensionalen Modells (Analysis Services)

Anforderungen und Überlegungen zur Verarbeitung (Data Mining)

Abfragen an den relationalen Speicher während der Verarbeitung

Verarbeiten von Miningstrukturen

Verarbeiten von Miningmodellen

Wenn Neuverarbeitung erforderlich ist

Weitere Informationen

Feedback

Feedback

Zusätzliche Ressourcen