Data Mining-Abfrage

 

Data Mining-Abfragen eignen sich für viele Zwecke. Folgende Aktionen sind möglich:

  • Anwenden des Modells auf neue Daten, um einzelne oder mehrere Vorhersagen zu treffen. Sie können Eingabewerte als Parameter oder in einem Batch bereitstellen.

  • Abrufen einer statistischen Zusammenfassung der für das Training verwendeten Daten.

  • Extrahieren von Mustern und Regeln oder Generieren eines Profils des typischen Falls, der ein Muster im Modell darstellt.

  • Extrahieren von Regressionsformeln und anderen Berechnungen zur Erklärung von Mustern.

  • Abrufen der Fälle, die einem bestimmten Muster entsprechen.

  • Abrufen von Details zu einzelnen im Modell verwendeten Fällen, einschließlich in der Analyse nicht verwendeter Daten.

  • Erneutes Trainieren eines Modells durch Hinzufügen neuer Daten oder Ausführen einer Kreuzvorhersage

Dieser Abschnitt bietet eine Übersicht über die Informationen, die Sie für die ersten Schritte mit Data Mining-Abfragen benötigen. Er beschreibt die Typen von Abfragen, die Sie für Data Mining-Objekte erstellen können, bietet eine Einführung in die Abfragetools und Abfragesprachen und stellt Links zu Beispielen für Abfragen bereit, die Sie für Modelle erstellen können, die mit den in SQL Server Data Mining verfügbaren Algorithmen erstellt wurden.

Grundlegendes zu Data Mining-Abfragen

Abfragetools und -schnittstellen

Abfragen für unterschiedliche Modelltypen

Anforderungen

Analysis Services Data Mining unterstützt die folgenden Typen von Abfragen:

  • Vorhersageabfragen (Data Mining)

    Abfragen, mit denen Rückschlüsse anhand von Mustern im Modell und aus Eingabedaten gezogen werden können.

  • Inhaltsabfragen (Data Mining)

    Abfragen, die Metadaten, Statistiken und andere Informationen zum Modell selbst zurückgeben.

  • Drillthroughabfragen (Data Mining)

    Abfragen, die die zugrunde liegenden Falldaten für das Modell und sogar Daten, die nicht im Modell verwendet wurden, aus der Struktur abrufen können.

  • Datendefinitionsabfragen (Data Mining)

    Abfragen, die keine Informationen aus dem Modell zurückgeben, sondern zum Erstellen von Modellen und Strukturen oder zum Aktualisieren der Daten in einem Modell oder einer Struktur verwendet werden.

Bevor Sie Abfragen erstellen, sollten Sie sich mit den Unterschieden zwischen den Modellen vertraut machen, die mit den verschiedenen von SQL Server bereitgestellten Data Mining-Algorithmen erstellt werden können.

Sie können Data Mining-Abfragen interaktiv mit einem der von SQL Server bereitgestellten Abfragetools erstellen. Der grafische Generator für Vorhersageabfragen ist sowohl in SQL Server Data Tools (SSDT) als auch in SQL Server Management Studioverfügbar. Wenn Sie den Generator für Vorhersageabfragen bisher noch nicht verwendet haben, empfehlen wir, die Schritte im Basic Data Mining Tutorial durchzuarbeiten, um sich mit der Oberfläche vertraut zu machen. Kurze Übersicht der Schritte, finden Sie unter Erstellen einer Abfrage mit der erstellt eine Vorhersage mithilfe des Generators für Vorhersageabfragen.

Der Generator für Vorhersageabfragen ist nützlich zum Erstellen grundlegender Abfragen, die Sie später weiter anpassen können. Sie können Datenquellen leicht hinzufügen und Spalten zuordnen und dann zu DMX wechseln und die Abfrage anpassen, indem Sie eine WHERE-Klausel oder andere Funktionen hinzufügen.

Sobald Sie mit den Data Mining-Modellen und dem Erstellen von Abfragen vertraut sind, können Sie die Abfragen auch direkt mithilfe der Data Mining-Erweiterungen (Data Mining Extensions, DMX) schreiben. DMX ist eine Abfragesprache, die Transact-SQL ähnelt und in vielen verschiedenen Clients verwendet werden kann. DMX ist das bevorzugte Tool zum Erstellen von benutzerdefinierten Vorhersagen und komplexen Abfragen. Eine Einführung in DMX finden Sie unter Erstellen und Abfragen von Data Mining-Modellen mit DMX: Tutorials (Analysis Services – Data Mining).

DMX-Editoren werden sowohl in SQL Server Data Tools (SSDT) als auch in SQL Server Management Studiobereitgestellt. Sie können Abfragen auch zunächst mit dem Generator für Vorhersageabfragen erstellen und dann zur Text-Editor-Ansicht wechseln und die DMX-Anweisung in einen anderen Client kopieren. Weitere Informationen finden Sie unter Data Mining-Abfragetools.

Sie können DMX-Anweisungen programmgesteuert erstellen und sie mit AMO oder XMLA vom Client an den Analysis Services -Server senden. Zum Erstellen von Abfragen für ein Miningmodell müssen Sie jedoch immer DMX verwenden.

Sie können die Metadaten, Statistiken und bestimmte Inhalte des Modells auch mit dynamischen Verwaltungssichten (Dynamic Management Views, DMVs) abfragen, die auf den Data Mining-Schemarowsets basieren. DMVs erleichtern das Abrufen von Modellinformationen durch die Eingabe von SELECT-Anweisungen, unterstützten jedoch nicht das Erstellen von Vorhersagen. Weitere Informationen zu den von Analysis Services unterstützten DMVs finden Sie unter Verwenden von dynamischen Verwaltungssichten (DMVs) zum Überwachen von Analysis Services.

Schließlich können Sie mithilfe von Data Mining Query Taskoder Data Mining Query TransformationData Mining-Abfragen zur Verwendung in Integration Services-Paketen erstellen. Der Ablaufsteuerungstask unterstützt mehrere Typen von DMX-Abfragen, während die Datenflusstransformation nur Abfragen unterstützt, die Daten im Datenfluss verarbeiten, d. h. Abfragen, die die PREDICTION JOIN-Syntax verwenden.

Der Algorithmus, der beim Erstellen des Modells verwendet wurde, hat großen Einfluss auf die Art von Informationen, die Sie mit einer Data Mining-Abfrage abrufen können. Der Grund für die Unterschiede ist, dass jeder Algorithmus die Daten auf eine andere Weise verarbeitet und andere Arten von Mustern speichert. Einige Algorithmen erstellen z. B. Cluster, andere erstellen Strukturen. Daher müssen Sie ggf. spezialisierte Vorhersage- und Abfragefunktionen verwenden, abhängig vom Modelltyp, mit dem Sie arbeiten.

Die folgende Liste bietet eine Zusammenfassung der Funktionen, die Sie in Abfragen verwenden können:

  • Allgemeine Vorhersagefunktionen: Die Predict -Funktion ist polymorph, d. h., sie kann mit allen Modelltypen verwendet werden. Diese Funktion erkennt automatisch den Modelltyp, mit dem Sie arbeiten, und fordert Sie zur Eingabe zusätzlicher Parameter auf. Weitere Informationen finden Sie unter Predict (DMX).

    System_CAPS_ICON_warning.jpg Warnung


    Nicht alle Modelle werden verwendet, um Vorhersagen zu treffen. Beispielsweise können Sie ein Clusteringmodell erstellen, das über kein vorhersagbares Attribut verfügt. Aber selbst wenn ein Modell nicht über ein vorhersagbares Attribut verfügt, können Sie Vorhersageabfragen erstellen, die andere Typen nützlicher Informationen aus dem Modell zurückgeben.

  • Benutzerdefinierte Vorhersagefunktionen: Jeder Modelltyp stellt einen Satz von Vorhersagefunktionen bereit, die zum Arbeiten mit den von diesem Algorithmus erstellten Mustern entworfen wurden.

    Für Zeitreihenmodelle wird z. B. die Lag -Funktion bereitgestellt, mit der Sie die Vergangenheitsdaten anzeigen können, die für das Modell verwendet wurden. Bei Clusteringmodellen liefern z. B. Funktionen wie ClusterDistance sinnvollere Informationen.

    Weitere Informationen zu den Funktionen, die für jeden Modelltyp unterstützt werden, finden Sie unter den folgenden Links:

    Beispiele für ZuordnungsmodellabfragenMicrosoft Naive Bayes-Algorithmus
    Beispiele für ClusteringmodellabfragenNeuronale Beispiele für Netzwerkmodellabfragen
    Beispiele für Entscheidungsstruktur-ModellabfragenSequenzclusteringmodellabfragebeispiele
    Beispiele für lineare RegressionsmodellabfrageAbfragebeispiel Zeitreihenmodell
    Logistische Regressionsmodell-Abfragebeispiele

    Sie können auch VBA-Funktionen aufrufen oder eigene Funktionen erstellen. Weitere Informationen finden Sie unter Funktionen (DMX).

  • Allgemeine Statistiken: Es gibt eine Reihe von Funktionen, die mit nahezu jedem Modelltyp verwendet werden können, der einen Standardsatz von beschreibenden Statistiken zurückgibt (z. B. die Standardabweichung).

    Die PredictHistogram -Funktion gibt z. B. eine Tabelle zurück, in der alle Status der angegebenen Spalte aufgeführt sind.

    Weitere Informationen finden Sie unter Allgemeine Vorhersagefunktionen (DMX).

  • Benutzerdefinierte Statistiken: Für jeden Modelltyp werden zusätzliche unterstützende Funktionen bereitgestellt, um Statistiken zu generieren, die für die spezifische analytische Aufgabe relevant sind.

    Wenn Sie z. B. mit einem Clusteringmodell arbeiten, können Sie die PredictCaseLikelihood-Funktion verwenden, um das einem bestimmten Fall und Cluster zugeordnete Wahrscheinlichkeitsergebnis zurückzugeben. Wenn Sie hingegen ein lineares Regressionsmodell erstellen, ist das Abrufen und Abfangen des Koeffizienten von größerer Bedeutung. In diesem Fall können Sie eine Inhaltsabfrage verwenden.

  • Funktionen für den Modellinhalt: Der Inhalt aller Modelle wird in einem standardisierten Format dargestellt, aus dem Sie mit einer einfachen Abfrage Informationen abrufen können. Zum Erstellen von Abfragen für den Modellinhalt verwenden Sie DMX. Einige Modellinhaltstypen können Sie auch mithilfe der Data Mining-Schemarowsets abfragen.

    Im Modellinhalt ist die Bedeutung jeder Zeile bzw. jedes Knoten der Tabelle, die zurückgegeben wird, abhängig vom Typ des Algorithmus, der zum Erstellen des Modells verwendet wurde. Dies gilt ebenso für den Datentyp der Spalte. Weitere Informationen finden Sie unter Inhaltsabfragen (Data Mining).

Bevor Sie eine Abfrage für ein Modell erstellen können, muss das Data Mining-Modell bereits verarbeitet sein. Für die Verarbeitung von Analysis Services -Objekten sind spezielle Berechtigungen erforderlich. Weitere Informationen zum Verarbeiten von Miningmodellen finden Sie unter Anforderungen und Überlegungen zur Verarbeitung (Data Mining).

Um Abfragen für ein Data Mining-Modell auszuführen, sind je nach Typ der auszuführenden Abfrage unterschiedliche Berechtigungsstufen erforderlich. Zum Beispiel erfordert ein Drillthrough der Fall- oder Strukturdaten in der Regel zusätzliche Berechtigungen, die für das Miningstrukturobjekt oder das Miningmodellobjekt festgelegt werden können.

Wenn die Abfrage jedoch externe Daten verwendet und Anweisungen wie OPENROWSET oder OPENQUERY beinhaltet, müssen diese Anweisungen in der Datenbank, die Sie abfragen, aktiviert werden, und Sie müssen über Berechtigungen für die zugrunde liegenden Datenbankobjekte verfügen.

Weitere Informationen zu den Sicherheitskontexten, die zum Ausführen von Data Mining-Abfragen erforderlich sind, finden Sie unter Sicherheitsübersicht (Data Mining).

Die Themen in diesem Abschnitt stellen jeden Data Mining-Abfragetyp im Detail vor und enthalten Links zu ausführlichen Beispielen für das Erstellen von Abfragen für Data Mining-Modelle.

Vorhersageabfragen (Data Mining)

Inhaltsabfragen (Data Mining)

Drillthroughabfragen (Data Mining)

Datendefinitionsabfragen (Data Mining)

Data Mining-Abfragetools

Über diese Links erhalten Sie Informationen zum Erstellen und Verwenden von Data Mining-Abfragen.

AufgabenLinks
Lernprogramme und exemplarische Vorgehensweisen zu Data Mining-AbfragenLektion 6: Erstellen und Verwenden von Vorhersagen (Tutorial zu Data Mining-Grundlagen)

 DMX-Lernprogramm für Zeitreihenvorhersagen
Verwenden von Data Mining-Abfragetools in SQL Server Management Studio und SQL Server Data Tools (SSDT)Erstellen einer DMX-Abfrage in SQL Server Management Studio

 Erstellen von Vorhersageabfragen mithilfe des Generators für Vorhersageabfragen

 Anwenden von Vorhersagefunktionen auf ein Modell

 Manuelles Bearbeiten eine Vorhersageabfrage
Arbeiten mit externen, in Vorhersageabfragen verwendeten DatenAuswählen und Zuordnen von Eingabedaten für eine Vorhersageabfrage

 Auswählen und Zuordnen von Eingabedaten für eine Vorhersageabfrage
Arbeiten mit AbfrageergebnissenAnzeigen und Speichern der Ergebnisse einer Vorhersageabfrage
Verwenden der in Management Studio verfügbaren DMX- und XMLA-AbfragevorlagenErstellen einer SINGLETON-Vorhersageabfrage aus einer Vorlage

 Create a Data Mining Query by Using XMLA

 Verwenden von Analysis Services-Vorlagen in SQL Server Management Studio
Weitere Informationen zu Inhaltsabfragen und BeispieleErstellen einer Miningmodell-Inhaltsabfrage

 Abfragen der Parameter, mit denen ein Miningmodell erstellt wird

 Inhaltsabfragen (Data Mining)
Festlegen von Abfrageoptionen und Problembehandlung bei Abfrageberechtigungen und AbfragenÄndern des Timeoutwerts für Data Mining-Abfragen
Verwenden der Data Mining-Komponenten in Integration ServicesData Mining-Abfragetask

 Transformation für Data Mining-Abfragen

Data Mining-Algorithmen (Analysis Services – Data Mining)
Miningmodellinhalt (Analysis Services – Data Mining)

Community-Beiträge

HINZUFÜGEN
Anzeigen: