Miningmodelle (Analysis Services – Data Mining)

In diesem Abschnitt wird die grundlegende Architektur eines Data Mining-Modells erklärt, eine Übersicht über die Eigenschaften eines Data Mining-Modells gegeben und beschrieben, wie man ein Miningmodell erstellt und damit arbeitet.

Architektur des Miningmodells

Definieren von Miningmodellen

Miningmodelleigenschaften

Miningmodellspalten

Verarbeiten von Miningmodellen

Anzeigen und Abfragen von Miningmodellen

Architektur des Miningmodells

Ein Data Mining-Modell erhält Daten aus einer Miningstruktur und analysiert diese Daten durch die Verwendung eines Data Mining-Algorithmus. Die Miningstruktur und das Miningmodell sind separate Objekte. Die Miningstruktur speichert Informationen, die die Datenquelle definieren. Ein Miningmodell speichert Informationen, die aus der statistischen Verarbeitung der Daten herrühren, beispielsweise die als Ergebnis der Analyse gefundenen Muster.

Ein Miningmodell ist leer, bis die Daten, die von der Miningstruktur bereitgestellt werden, verarbeitet und analysiert wurden. Nachdem ein Miningmodell verarbeitet wurde, enthält es Metadaten, Ergebnisse und Bindungen zur Miningstruktur.

Modell enthält Metadaten, Muster und Bindungen

Die Metadaten legen den Namen des Modells und des Servers, auf dem es gespeichert ist, und eine Definition des Modells fest, einschließlich einer Liste der Spalten aus der Miningstruktur, die bei der Erstellung des Modells herangezogen wurden, der Definitionen der optionalen Filter, die bei der Verarbeitung des Modells angewandt wurden, und eines Algorithmus, der für die Analyse der Daten verwendet wurde. Die Auswahl von Spalten, Filtern und Algorithmus hat beträchtliche Auswirkungen auf die Ergebnisse der Analyse. Wenn Sie beispielsweise ein Clusteringmodell und ein Entscheidungsstrukturmodell bei Verwendung der gleichen Daten erstellen, kann der Modellinhalt sehr unterschiedlich ausfallen, da diese Modelle unterschiedliche Algorithmen und Filter verwenden. Weitere Informationen finden Sie unter Miningmodellinhalt (Analysis Services - Data Mining).

Die im Modell gespeicherten Ergebnisse unterscheiden sich in Abhängigkeit vom Algorithmus, aber können Muster, Itemsets, Regeln und Formeln enthalten. Diese Ergebnisse können zum Treffen von Vorhersagen verwendet werden.

Die im Modell gespeicherten Bindungen verweisen auf die in der Miningstruktur zwischengespeicherten Daten zurück. Wenn die Daten in der Struktur zwischengespeichert und nach der Verarbeitung nicht bereinigt wurden, können Sie über diese Bindungen einen Drillthrough von den Ergebnissen zu den Fällen durchführen, die die Ergebnisse unterstützen. Aber die tatsächlichen Daten werden im Strukturcache, nicht im Modell, gespeichert.

[Nach oben]

Definition von Data Mining-Modellen

Ein Data Mining-Modell kann über die folgenden Schritte erstellt werden:

  • Erstellen sie die zugrunde liegende Miningstruktur.

  • Wählen Sie einen Algorithmus aus.

  • Legen Sie die Modellspalten und die Verwendung der Spalten fest.

  • Legen Sie optional Parameter fest, die die Verarbeitung durch den Algorithmus optimieren.

  • Verarbeiten Sie das Modell.

Analysis Services stellt die folgenden Tools bereit, um die Verwaltung Ihrer Miningmodelle zu unterstützen:

  • Der Data Mining-Assistent unterstützt Sie bei der Erstellung einer Struktur und des zugehörigen Miningmodells. Dies ist die leichteste Vorgehensweise. Der Assistent erstellt automatisch die erforderliche Miningstruktur und unterstützt Sie bei der Konfiguration der wichtigen Einstellungen.

  • Eine DMX CREATE MODEL-Anweisung kann verwendet werden, um ein Modell zu definieren. Die erforderliche Struktur wird automatisch als Teil des Prozesses erstellt. Daher können Sie eine bestehende Struktur mit dieser Methode nicht erneut verwenden. Verwenden Sie diese Methode, wenn Sie bereits wissen, welches Modell Sie erstellen möchten.

  • Eine DMX ALTER STRUCTURE ADD MODEL-Anweisung kann verwendet werden, um ein neues Miningmodell zu einer bestehenden Struktur hinzuzufügen. Verwenden Sie diese Methode, wenn Sie mit unterschiedlichen Modellen experimentieren möchten, die auf dem gleichen Dataset basieren.

Darüber hinaus können Sie Miningmodelle programmgesteuert über AMO oder XML/A oder über den Einsatz anderer Clients, wie den Data Mining-Client für Excel, erstellen. Weitere Informationen finden Sie unter den folgenden Themen:

Analysis Management Objects (AMO)

Einführung in Analysis Services Scripting Language

Data Mining-Erweiterungen (DMX) - Referenz

[Nach oben]

Miningmodelleigenschaften

Jedes Miningmodell verfügt über Eigenschaften, die das Modell und seine Metadaten definieren. Hierzu gehören zum Beispiel Name, Beschreibung, Datum der letzten Verarbeitung des Modells, Berechtigungen für das Modell und jegliche Filter auf den Daten, die für das Training verwendet werden.

Jedes Miningmodell verfügt darüber hinaus über Eigenschaften, die sich aus der Miningstruktur ableiten und die vom Modell verwendeten Datenspalten beschreiben. Wenn es sich bei der Spalte um eine geschachtelte Tabelle handelt, kann auf die Spalte auch ein separater Filter angewandt sein.

Zusätzlich enthält jedes Miningmodell zwei besondere Eigenschaften: Algorithm und Usage.

  • **Algorithmus-Eigenschaft   **Legt den Algorithmus fest, der zur Erstellung des Modells verwendet wird. Die verfügbaren Algorithmen hängen von Ihrem Anbieter ab. Eine Liste der in SQL Server Analysis Services enthaltenen Algorithmen finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining). Die Algorithm-Eigenschaft gilt für das Miningmodell und kann für jedes Modell nur einmal festgelegt werden. Sie können den Algorithmus zu einem späteren Zeitpunkt ändern, aber einige Spalten im Miningmodell werden möglicherweise ungültig, wenn sie vom ausgewählten Algorithmus nicht unterstützt werden. Darüber hinaus müssen Sie im Anschluss an die Änderungen das Modell immer erneut verarbeiten.

  • **Usage-Eigenschaft   **Definiert die Verwendung der einzelnen Spalten durch das Modell. Sie können die Spaltenverwendung als Input, Predict, Predict Only oder Key. Die Usage-Eigenschaft gilt für einzelne Spalten des Miningmodells und muss für jede in einem Modell enthaltene Spalte separat festgelegt werden. Wenn die Struktur eine Spalte enthält, die Sie im Modell nicht verwenden möchten, wird die Verwendung auf Ignore festgelegt.

Sie können die Werte der Eigenschaften des Miningmodells nach der Erstellung eines Miningmodells ändern. Allerdings erfordert jede Änderung, auch die des Namens des Miningmodells, eine erneute Verarbeitung des Modells. Nachdem Sie das Modell erneut verarbeitet haben, könnten Sie andere Ergebnisse sehen.

[Nach oben]

Miningmodellspalten

Wie die Miningstruktur enthält das Miningmodell Spalten. Sie können auswählen, welche Spalten aus der Miningstruktur im Modell verwendet werden sollen. Zusätzlich zur Verwendung der Spalten in der zugrunde liegenden Miningstruktur können Sie Kopien der Miningstrukturspalten erstellen und diese dann umbenennen oder ihre Nutzung ändern.

Abhängig von dem von Ihnen ausgewählten Algorithmus können einige Spalten in der Miningstruktur inkompatibel mit dem Modell sein oder zu schlechten Ergebnissen führen. Sie sollten die Daten in der Struktur sorgfältig prüfen und nur die Spalten in das Modell einbeziehen, die für die Analyse hilfreich sind. Wenn Sie der Meinung sind, dass eine Spalte nicht verwendet werden sollte, müssen Sie diese nicht aus der Miningstruktur oder dem Miningmodell löschen, sondern können stattdessen die Spalte mit einem Flag versehen, das festlegt, dass diese Spalte bei der Erstellung des Modells ignoriert werden soll. Dies bedeutet, dass die Spalte in der Miningstruktur erhalten bleibt, aber nicht im Miningmodell verwendet wird. Allerdings können Sie die Informationen aus der Spalte zu einem späteren Zeitpunkt abfragen, wenn Drillthrough vom Modell zur Miningstruktur aktiviert ist.

Nach der Erstellung des Modells können Sie Änderungen vornehmen. Hierzu gehören zum Beispiel das Hinzufügen oder Löschen von Spalten oder das Ändern des Modellnamens. Allerdings erfordern alle Änderungen, auch solche, die ausschließlich an den Modellmetadaten vorgenommen werden, eine erneute Verarbeitung des Modells.

Weitere Informationen finden Sie unter Miningstrukturspalten und Miningmodellspalten.

[Nach oben]

Verarbeiten von Miningmodellen

Beim Data Mining-Modell handelt es sich bis zu seiner Verarbeitung um ein leeres Objekt. Bei der Verarbeitung eines Modells werden die Daten, die von der Struktur zwischengespeichert werden, durch einen Filter geschickt, falls einer im Modell definiert wurde, und durch den Algorithmus analysiert. Der Algorithmus identifiziert die Regeln und Muster innerhalb der Daten und verwendet diese dann zum Auffüllen des Modells. Weitere Informationen dazu, wie Miningmodelle mithilfe von Algorithmen erstellt werden, finden Sie unter Data Mining-Algorithmen (Analysis Services - Data Mining).

Nach seiner Verarbeitung speichert das Miningmodell auch Informationen über die Ergebnisse der Analyse. Weitere Informationen über die Art der Daten, die im Miningmodell gespeichert werden, finden Sie unter Miningmodellinhalt (Analysis Services - Data Mining).

[Nach oben]

Anzeigen und Abfragen von Miningmodellen

Nachdem Sie ein Data Mining-Modell verarbeitet haben, können Sie dies anhand der in Business Intelligence Development Studio oder SQL Server Management Studio verfügbaren benutzerdefinierten Viewer durchsuchen. Weitere Informationen zu benutzerdefinierten Viewern in Analysis Services finden Sie unter Anzeigen eines Data Mining-Modells.

Darüber hinaus können Sie Abfragen des Miningmodells erstellen, um entweder Vorhersagen zu treffen oder Modellmetadaten oder vom Modell erstellte Muster abzufragen. Abfragen werden über Data Mining-Erweiterungen (DMX; Data Mining Extensions) erstellt. Informationen über die unterschiedlichen Typen von Abfragen für ein Data Mining-Modell finden Sie unter Abfragen von Data Mining-Modellen (Analysis Services - Data Mining).