CREATE MINING MODEL (DMX)

Gilt für: SQL Server Analysis Services

Erstellt sowohl ein neues Miningmodell als auch eine Miningstruktur in der Datenbank. Sie können ein Modell erstellen, indem Sie entweder das neue Modell in der Anweisung definieren oder PMML (Predictive Model Markup Language) verwenden. Diese zweite Möglichkeit empfiehlt sich nur für fortgeschrittene Benutzer.

Der Name der Miningstruktur ergibt sich, indem "_structure" an den Modellnamen angefügt wird. Dadurch ist sichergestellt, dass sich der Strukturname vom Modellnamen unterscheidet.

Um ein Miningmodell für eine vorhandene Miningstruktur zu erstellen, verwenden Sie die ALTER MINING STRUCTURE (DMX)- Anweisung.

Syntax

  
CREATE [SESSION] MINING MODEL <model>  
(  
    [(<column definition list>)]  
)  
USING <algorithm> [(<parameter list>)] [WITH DRILLTHROUGH]  
CREATE MINING MODEL <model> FROM PMML <xml string>  

Argumente

model
Ein eindeutiger Name für das Modell.

Spaltendefinitionsliste
Eine durch Trennzeichen getrennte Liste mit Spaltendefinitionen.

Algorithmus
Der Name eines Data Mining-Algorithmus, der vom aktuellen Anbieter definiert wurde.

Hinweis

Eine Liste der vom aktuellen Anbieter unterstützten Algorithmen kann mithilfe von DMSCHEMA_MINING_SERVICES Rowset abgerufen werden. Informationen zum Anzeigen der in der aktuellen instance von Analysis Services unterstützten Algorithmen finden Sie unter Data Mining-Eigenschaften.

Parameterliste
Optional. Eine durch Trennzeichen getrennte Liste mit anbieterdefinierten Parametern für den Algorithmus.

XML-Zeichenfolge
(Nur zur erweiterten Verwendung.) Ein XML-codiertes Modell (PMML). Die Zeichenfolge muss in einfache Anführungszeichen (') eingeschlossen werden.

Mit der SESSION-Klausel können Sie ein Miningmodell erstellen, das automatisch vom Server entfernt wird, wenn die Verbindung geschlossen wird oder das Sitzungstimeout ausfällt. SESSION-Miningmodelle sind nützlich, da sie nicht erfordern, dass der Benutzer datenbankadministrator ist, und sie verwenden nur Speicherplatz, solange die Verbindung geöffnet ist.

Die WITH DRILLTHROUGH-Klausel ermöglicht drillthrough für das neue Miningmodell. Drillthrough kann nur aktiviert werden, wenn das Modell erstellt wird. Bei einigen Modelltypen ist ein Drillthrough erforderlich, um das Modell im benutzerdefinierten Viewer zu durchsuchen. Ein Drillthrough ist nicht erforderlich für Vorhersagen oder das Durchsuchen des Modells mit dem Microsoft Generic Content Tree Viewer.

Die CREATE MINING MODEL-Anweisung erstellt ein neues Miningmodell, das auf der Spaltendefinitionsliste, dem Algorithmus und der Algorithmusparameterliste basiert.

Spaltendefinitionsliste (Column Definition List)

Sie definieren die Struktur eines Modells, für das die Spaltendefinitionsliste verwendet wird, indem Sie für jede Spalte die folgenden Informationen einschließen:

  • Name (obligatorisch)

  • Datentyp (obligatorisch)

  • Distribution

  • Liste der Modellierungsflags

  • Inhaltstyp (obligatorisch)

  • Vorhersageanforderung, die an den Algorithmus zur Vorhersage dieser Spalte angibt, angegeben durch die PREDICT- oder PREDICT_ONLY-Klausel

  • Beziehung zu einer Attributspalte (nur obligatorisch, wenn sie gilt), angegeben durch die RELATED TO-Klausel

Verwenden Sie die folgende Syntax für die Spaltendefinitionsliste, um eine einzelne Spalte zu definieren:

<column name>    <data type>    [<Distribution>]    [<Modeling Flags>]    <Content Type>    [<prediction>]    [<column relationship>]   

Verwenden Sie die folgende Syntax für die Spaltendefinitionsliste, um eine geschachtelte Tabellenspalte zu definieren:

<column name>    TABLE    [<prediction>] ( <non-table column definition list> )  

Zum Definieren einer Spalte können Sie jeweils nur eine Klausel aus einer bestimmten Gruppe verwenden. Die einzige Ausnahme bilden Modellierungsflags. Sie können mehrere Modellierungsflags für eine Spalte definieren.

Eine Liste der Datentypen, Inhaltstypen, Spaltendistributionen und Modellierungsflags, mit denen Sie eine Spalte definieren können, finden Sie in den folgenden Themen:

Sie können der Anweisung eine Klausel hinzufügen, um die Beziehung zwischen zwei Spalten zu beschreiben. Analysis Services unterstützt die Verwendung der folgenden <Column-Beziehungsklausel> .

IM ZUSAMMENHANG MIT
Diese Form kennzeichnet eine Wertehierarchie. Das Ziel einer RELATED TO-Spalte kann eine Schlüsselspalte einer geschachtelten Tabelle, eine Spalte mit diskreten Werten in der Fallzeile oder eine andere Spalte mit einer RELATED TO-Klausel sein, wodurch eine tiefere Hierarchie gekennzeichnet ist.

Mit einer Vorhersageklausel können Sie beschreiben, wie die Vorhersagespalte verwendet wird. In der folgenden Tabelle sind die beiden möglichen Klauseln beschrieben.

<Prediction-Klausel> BESCHREIBUNG
PREDICT Diese Spalte kann vom Modell vorhergesagt werden, und sie kann in Eingabefällen bereitgestellt werden, um den Wert anderer vorhersagbarer Spalten vorherzusagen.
PREDICT_ONLY Diese Spalte kann vom Modell vorhergesagt werden, aber ihre Werte können in Eingabefällen nicht dazu verwendet werden, den Wert anderer vorhersagbarer Spalten vorherzusagen.

Parameterdefinitionsliste (Parameter Definition List)

Mit der Parameterliste können Sie die Leistung und die Funktionsweise eines Miningmodells anpassen. Die Syntax der Parameterliste sieht wie folgt aus:

[<parameter> = <value>, <parameter> = <value>,...]  

Eine Liste der Parameter, die jedem Algorithmus zugeordnet sind, finden Sie unter Data Mining-Algorithmen (Analysis Services – Data Mining).

Bemerkungen

Wenn Sie ein Modell mit einem integrierten Testdataset erstellen möchten, sollten Sie die Anweisung CREATE MINING STRUCTURE gefolgt von ALTER MINING STRUCTURE verwenden. Jedoch unterstützen nicht alle Modelltypen ein zurückgehaltenes Dataset. Weitere Informationen finden Sie unter CREATE MINING STRUCTURE (DMX).

Eine exemplarische Vorgehensweise zum Erstellen eines Miningmodells mithilfe der CREATEMODEL-Anweisung finden Sie im DMX-Tutorial zur Zeitreihenvorhersage.

Beispiel für Naive Bayes-Algorithmus

Im folgenden Beispiel wird der Microsoft Naive Bayes-Algorithmus verwendet, um ein neues Miningmodell zu erstellen. Die Bike Buyer-Spalte ist als das vorhersagbare Attribut definiert.

CREATE MINING MODEL [NBSample]  
(  
    CustomerKey LONG KEY,   
    Gender TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Bike Buyer] LONG DISCRETE PREDICT  
)  
USING Microsoft_Naive_Bayes  

Beispiel für Association-Algorithmus

Im folgenden Beispiel wird der Microsoft Association-Algorithmus verwendet, um ein neues Miningmodell zu erstellen. Für die Anweisung wird die Möglichkeit genutzt, eine Tabelle in einer Modelldefinition zu schachteln, indem eine Tabellenspalte verwendet wird. Das Modell wird mithilfe der Parameter MINIMUM_PROBABILITY und MINIMUM_SUPPORT geändert.

CREATE MINING MODEL MyAssociationModel (  
    OrderNumber TEXT KEY,  
    [Products] TABLE PREDICT (  
        [Model] TEXT KEY  
    )  
)  
USING Microsoft_Association_Rules (Minimum_Probability = 0.1, MINIMUM_SUPPORT = 0.01)  

Beispiel für den Sequence Clustering-Algorithmus

Im folgenden Beispiel wird der Microsoft Sequence Clustering-Algorithmus verwendet, um ein neues Miningmodell zu erstellen. Das Modell wird mit zwei Schlüsseln definiert. Die Spalte OrderNumber wird als Groß-/Kleinschreibungsschlüssel verwendet und gibt einzelne Bestellungen an. Die Spalte LineNumber wird als geschachtelter Tabellenschlüssel verwendet und gibt die Reihenfolge an, in der Elemente einer Bestellung hinzugefügt wurden.

CREATE MINING MODEL BuyingSequence (  
    [Order Number] TEXT KEY,  
    [Products] TABLE   
     (  
        [Line Number] LONG KEY SEQUENCE,  
        [Model] TEXT DISCRETE PREDICT  
    )  
)  
USING Microsoft_Sequence_Clustering  

Beispiel für den Time Series-Algorithmus

Im folgenden Beispiel wird der Microsoft Times Series-Algorithmus verwendet, um mithilfe des ARTxp-Algorithmus ein neues Miningmodell zu erstellen. ReportingDate ist die Schlüsselspalte für die Zeitreihe, und ModelRegion ist die Schlüsselspalte für die Datenreihe. In diesem Beispiel wird davon ausgegangen, dass die Periodizität der Daten alle 12 Monate ist. Daher ist der parameter PERIODICITY_HINT auf 12 festgelegt.

Hinweis

Sie müssen den parameter PERIODICITY_HINT mithilfe von geschweiften Zeichen angeben. Da der Wert eine Zeichenfolge ist, muss er außerdem in einfache Anführungszeichen eingeschlossen werden: "{<numeric value>}".

CREATE MINING MODEL SalesForecast (  
        ReportingDate DATE KEY TIME,  
        ModelRegion TEXT KEY,  
        Amount LONG CONTINUOUS PREDICT,  
        Quantity LONG CONTINUOUS PREDICT  
)  
USING Microsoft_Time_Series (PERIODICITY_HINT = '{12}', FORECAST_METHOD = 'ARTXP')  

Weitere Informationen

Data Mining-Erweiterungen (DMX) - Datendefinitionsanweisungen
Data Mining-Erweiterungen (DMX) - Datenbearbeitungsanweisungen
Data Mining-Erweiterungen (DMX) - Anweisungsreferenz