Data Mining-Abfrage

Data Mining-Abfragen eignen sich für viele Zwecke. Folgende Aktionen sind möglich:

  • Anwenden des Modells auf neue Daten, um einzelne oder mehrere Vorhersagen zu treffen. Sie können Eingabewerte als Parameter oder in einem Batch bereitstellen.

  • Abrufen einer statistischen Zusammenfassung der für das Training verwendeten Daten.

  • Extrahieren von Mustern und Regeln oder Generieren eines Profils des typischen Falls, der ein Muster im Modell darstellt.

  • Extrahieren von Regressionsformeln und anderen Berechnungen zur Erklärung von Mustern.

  • Abrufen der Fälle, die einem bestimmten Muster entsprechen.

  • Abrufen von Details zu einzelnen im Modell verwendeten Fällen, einschließlich in der Analyse nicht verwendeter Daten.

  • Erneutes Trainieren eines Modells durch Hinzufügen neuer Daten oder Ausführen einer Kreuzvorhersage.

Dieser Abschnitt bietet eine Übersicht über die Informationen, die Sie für die ersten Schritte mit Data Mining-Abfragen benötigen. Er beschreibt die Typen von Abfragen, die Sie für Data Mining-Objekte erstellen können, bietet eine Einführung in die Abfragetools und Abfragesprachen und stellt Links zu Beispielen für Abfragen bereit, die Sie für Modelle erstellen können, die mit den in SQL Server Data Mining verfügbaren Algorithmen erstellt wurden.

Grundlegendes zu Data Mining-Abfragen

Abfragetools und -schnittstellen

Abfragen für unterschiedliche Modelltypen

Anforderungen

Grundlegendes zu Data Mining-Abfragen

Analysis Services Data Mining unterstützt die folgenden Typen von Abfragen:

  • Vorhersageabfragen (Data Mining)

    Abfragen, mit denen Rückschlüsse anhand von Mustern im Modell und aus Eingabedaten gezogen werden können.

  • Inhaltsabfragen (Data Mining)

    Abfragen, die Metadaten, Statistiken und andere Informationen zum Modell selbst zurückgeben.

  • Drillthroughabfragen (Data Mining)

    Abfragen, die die zugrunde liegenden Falldaten für das Modell und sogar Daten, die nicht im Modell verwendet wurden, aus der Struktur abrufen können.

  • Datendefinitionsabfragen (Data Mining)

    Abfragen, die keine Informationen aus dem Modell zurückgeben, sondern zum Erstellen von Modellen und Strukturen oder zum Aktualisieren der Daten in einem Modell oder einer Struktur verwendet werden.

Bevor Sie Abfragen erstellen, sollten Sie sich mit den Unterschieden zwischen den Modellen vertraut machen, die mit den verschiedenen von SQL Server bereitgestellten Data Mining-Algorithmen erstellt werden können.

Abfragetools und -schnittstellen

Sie können Data Mining-Abfragen interaktiv mit einem der von SQL Server bereitgestellten Abfragetools erstellen. Der grafische Generator für Vorhersageabfragen ist sowohl in SQL Server-Datentools (SSDT) als auch in SQL Server Management Studio verfügbar. Wenn Sie den Generator für Vorhersageabfragen bisher noch nicht verwendet haben, empfehlen wir, die Schritte im Lernprogramm zu Data Mining-Grundlagen durchzuarbeiten, um sich mit der Oberfläche vertraut zu machen. Eine kurze Übersicht der Schritte finden Sie im Abschnitt zum Erstellen einer Abfrage mit dem Erstellen von Vorhersageabfragen mithilfe des Generators für Vorhersageabfragen.

Der Generator für Vorhersageabfragen ist nützlich zum Erstellen grundlegender Abfragen, die Sie später weiter anpassen können. Sie können Datenquellen leicht hinzufügen und Spalten zuordnen und dann zu DMX wechseln und die Abfrage anpassen, indem Sie eine WHERE-Klausel oder andere Funktionen hinzufügen.

Sobald Sie mit den Data Mining-Modellen und dem Erstellen von Abfragen vertraut sind, können Sie die Abfragen auch direkt mithilfe der Data Mining-Erweiterungen (Data Mining Extensions, DMX) schreiben. DMX ist eine Abfragesprache, die Transact-SQL ähnelt und in vielen verschiedenen Clients verwendet werden kann. DMX ist das bevorzugte Tool zum Erstellen von benutzerdefinierten Vorhersagen und komplexen Abfragen. Eine Einführung zu DMX finden Sie unter Erstellen und Abfragen von Data Mining-Modellen mit DMX: Lernprogramme (Analysis Services – Data Mining).

DMX-Editoren werden sowohl in SQL Server-Datentools (SSDT) als auch in SQL Server Management Studio bereitgestellt. Sie können Abfragen auch zunächst mit dem Generator für Vorhersageabfragen erstellen und dann zur Text-Editor-Ansicht wechseln und die DMX-Anweisung in einen anderen Client kopieren. Weitere Informationen finden Sie unter Schnittstellen für Data Mining-Abfragen.

Sie können DMX-Anweisungen programmgesteuert erstellen und sie mit AMO oder XMLA vom Client an den Analysis Services-Server senden. Zum Erstellen von Abfragen für ein Miningmodell müssen Sie jedoch immer DMX verwenden.

Sie können die Metadaten, Statistiken und bestimmte Inhalte des Modells auch mit dynamischen Verwaltungssichten (Dynamic Management Views, DMVs) abfragen, die auf den Data Mining-Schemarowsets basieren. DMVs erleichtern das Abrufen von Modellinformationen durch die Eingabe von SELECT-Anweisungen, unterstützten jedoch nicht das Erstellen von Vorhersagen. Weitere Informationen zu DMVs, die von Analysis Services unterstützt werden, finden Sie unter Verwenden von dynamischen Verwaltungssichten (DMVs) zum Überwachen von Analysis Services.

Schließlich können Sie mithilfe von Data Mining-Abfragetask oder Transformation für Data Mining-Abfragen Data Mining-Abfragen zur Verwendung in Integration Services-Paketen erstellen. Der Ablaufsteuerungstask unterstützt mehrere Typen von DMX-Abfragen, während die Datenflusstransformation nur Abfragen unterstützt, die Daten im Datenfluss verarbeiten, d. h. Abfragen, die die PREDICTION JOIN-Syntax verwenden.

Abfragen für unterschiedliche Modelltypen

Der Algorithmus, der beim Erstellen des Modells verwendet wurde, hat großen Einfluss auf die Art von Informationen, die Sie mit einer Data Mining-Abfrage abrufen können. Der Grund für die Unterschiede ist, dass jeder Algorithmus die Daten auf eine andere Weise verarbeitet und andere Arten von Mustern speichert. Einige Algorithmen erstellen z. B. Cluster, andere erstellen Strukturen. Daher müssen Sie ggf. spezialisierte Vorhersage- und Abfragefunktionen verwenden, abhängig vom Modelltyp, mit dem Sie arbeiten.

Die folgende Liste bietet eine Zusammenfassung der Funktionen, die Sie in Abfragen verwenden können:

  • Allgemeine Vorhersagefunktionen: Die Predict-Funktion ist polymorph, d. h., sie kann mit allen Modelltypen verwendet werden. Diese Funktion erkennt automatisch den Modelltyp, mit dem Sie arbeiten, und fordert Sie zur Eingabe zusätzlicher Parameter auf. Weitere Informationen finden Sie unter Predict (DMX).

    VorsichtshinweisVorsicht

    Nicht alle Modelle werden verwendet, um Vorhersagen zu treffen. Beispielsweise können Sie ein Clusteringmodell erstellen, das über kein vorhersagbares Attribut verfügt. Aber selbst wenn ein Modell nicht über ein vorhersagbares Attribut verfügt, können Sie Vorhersageabfragen erstellen, die andere Typen nützlicher Informationen aus dem Modell zurückgeben.

  • Benutzerdefinierte Vorhersagefunktionen: Jeder Modelltyp stellt einen Satz von Vorhersagefunktionen bereit, die zum Arbeiten mit den von diesem Algorithmus erstellten Mustern entworfen wurden.

    Für Zeitreihenmodelle wird z. B. die Lag-Funktion bereitgestellt, mit der Sie die Vergangenheitsdaten anzeigen können, die für das Modell verwendet wurden. Bei Clusteringmodellen liefern z. B. Funktionen wie ClusterDistance sinnvollere Informationen.

    Weitere Informationen zu den Funktionen, die für jeden Modelltyp unterstützt werden, finden Sie unter den folgenden Links:

    Beispiele für Zuordnungsmodellabfragen

    Microsoft Naive Bayes-Algorithmus

    Beispiele für Clusteringmodellabfragen

    Neuronale Beispiele für Netzwerkmodellabfragen

    Beispiele für Entscheidungsstruktur-Modellabfragen

    Sequenzclusteringmodellabfragebeispiele

    Beispiele für lineare Regressionsmodellabfrage

    Abfragebeispiel Zeitreihenmodell

    Logistische Regressionsmodell-Abfragebeispiele

    Sie können auch VBA-Funktionen aufrufen oder eigene Funktionen erstellen. Weitere Informationen finden Sie unter Funktionen (DMX).

  • Allgemeine Statistiken: Es gibt eine Reihe von Funktionen, die mit nahezu jedem Modelltyp verwendet werden können, der einen Standardsatz von beschreibenden Statistiken zurückgibt (z. B. die Standardabweichung).

    Die PredictHistogram-Funktion gibt z. B. eine Tabelle zurück, in der alle Status der angegebenen Spalte aufgeführt sind.

    Weitere Informationen finden Sie unter Allgemeine Vorhersagefunktionen (DMX).

  • Benutzerdefinierte Statistiken: Für jeden Modelltyp werden zusätzliche unterstützende Funktionen bereitgestellt, um Statistiken zu generieren, die für die spezifische analytische Aufgabe relevant sind.

    Wenn Sie z. B. mit einem Clusteringmodell arbeiten, können Sie die PredictCaseLikelihood-Funktion verwenden, um das einem bestimmten Fall und Cluster zugeordnete Wahrscheinlichkeitsergebnis zurückzugeben. Wenn Sie hingegen ein lineares Regressionsmodell erstellen, ist das Abrufen und Abfangen des Koeffizienten von größerer Bedeutung. In diesem Fall können Sie eine Inhaltsabfrage verwenden.

  • Funktionen für den Modellinhalt: Der Inhalt aller Modelle wird in einem standardisierten Format dargestellt, aus dem Sie mit einer einfachen Abfrage Informationen abrufen können. Zum Erstellen von Abfragen für den Modellinhalt verwenden Sie DMX. Einige Modellinhaltstypen können Sie auch mithilfe der Data Mining-Schemarowsets abfragen.

    Im Modellinhalt ist die Bedeutung jeder Zeile bzw. jedes Knoten der Tabelle, die zurückgegeben wird, abhängig vom Typ des Algorithmus, der zum Erstellen des Modells verwendet wurde. Dies gilt ebenso für den Datentyp der Spalte. Weitere Informationen finden Sie unter Inhaltsabfragen (Data Mining).

Anforderungen

Bevor Sie eine Abfrage für ein Modell erstellen können, muss das Data Mining-Modell bereits verarbeitet sein. Für die Verarbeitung von Analysis Services-Objekten sind spezielle Berechtigungen erforderlich. Weitere Informationen zur Verarbeitung von Miningmodellen finden Sie unter Anforderungen und Überlegungen zur Verarbeitung (Data Mining).

Um Abfragen für ein Data Mining-Modell auszuführen, sind je nach Typ der auszuführenden Abfrage unterschiedliche Berechtigungsstufen erforderlich. Zum Beispiel erfordert ein Drillthrough der Fall- oder Strukturdaten in der Regel zusätzliche Berechtigungen, die für das Miningstrukturobjekt oder das Miningmodellobjekt festgelegt werden können.

Wenn die Abfrage jedoch externe Daten verwendet und Anweisungen wie OPENROWSET oder OPENQUERY beinhaltet, müssen diese Anweisungen in der Datenbank, die Sie abfragen, aktiviert werden, und Sie müssen über Berechtigungen für die zugrunde liegenden Datenbankobjekte verfügen.

Weitere Informationen zu den Sicherheitskontexten, die zum Ausführen von Data Mining-Abfragen erforderlich sind, finden Sie unter Sicherheitsübersicht (Data Mining).

In diesem Abschnitt

Die Themen in diesem Abschnitt stellen jeden Data Mining-Abfragetyp im Detail vor und enthalten Links zu ausführlichen Beispielen für das Erstellen von Abfragen für Data Mining-Modelle.

Vorhersageabfragen (Data Mining)

Inhaltsabfragen (Data Mining)

Drillthroughabfragen (Data Mining)

Datendefinitionsabfragen (Data Mining)

Schnittstellen für Data Mining-Abfragen

Verwandte Aufgaben

Über diese Links erhalten Sie Informationen zum Erstellen und Verwenden von Data Mining-Abfragen.

Aufgaben

Links

Lernprogramme und exemplarische Vorgehensweisen zu Data Mining-Abfragen

Lektion 6: Erstellen und Verwenden von Vorhersagen (Lernprogramm zu Data Mining-Grundlagen)

DMX-Lernprogramm für Zeitreihenvorhersagen

Verwenden von Data Mining-Abfragetools in SQL Server Management Studio und SQL Server-Datentools (SSDT)

Erstellen einer DMX-Abfrage in SQL Server Management Studio

Erstellen von Vorhersageabfragen mithilfe des Generators für Vorhersageabfragen

Anwenden von Vorhersagefunktionen auf ein Modell

Manuelles Bearbeiten eine Vorhersageabfrage

Arbeiten mit externen, in Vorhersageabfragen verwendeten Daten

Auswählen und Zuordnen von Eingabedaten für eine Vorhersageabfrage

Auswählen und Zuordnen von Eingabedaten für eine Vorhersageabfrage

Arbeiten mit Abfrageergebnissen

Anzeigen und Speichern der Ergebnisse einer Vorhersageabfrage

Verwenden der in Management Studio verfügbaren DMX- und XMLA-Abfragevorlagen

Erstellen einer SINGLETON-Vorhersageabfrage aus einer Vorlage

Erstellen einer Data Mining-Abfrage mit XML/A

Verwenden von Analysis Services-Vorlagen in SQL Server Management Studio

Weitere Informationen zu Inhaltsabfragen und Beispiele

Erstellen einer Miningmodell-Inhaltsabfrage

Abfragen der Parameter, mit denen ein Miningmodell erstellt wird

Inhaltsabfragen (Data Mining)

Festlegen von Abfrageoptionen und Problembehandlung bei Abfrageberechtigungen und Abfragen

Ändern des Timeoutwerts für Data Mining-Abfragen

Verwenden der Data Mining-Komponenten in Integration Services

Data Mining-Abfragetask

Transformation für Data Mining-Abfragen

Siehe auch

Konzepte

Data Mining-Algorithmen (Analysis Services - Data Mining)

Miningmodellinhalt (Analysis Services – Data Mining)