Lektion 1: Erstellen der Bike Buyer-Miningstruktur

 

Gilt für: SQL Server 2016 Preview

In dieser Lektion erstellen Sie eine Miningstruktur, mit der sich vorhersagen lässt, ob ein potenzieller Kunde von Adventure Works Cycles ein Fahrrad kaufen wird. Wenn Sie nicht mit Miningstrukturen und ihre Rolle beim Datamining vertraut sind, finden Sie unter Miningstrukturen ( Analysis Services – Datamining ).

Die Bike Buyer-Struktur, die Sie in dieser Lektion erstellen unterstützt das Hinzufügen von Miningmodellen basierend auf den Microsoft Clustering-AlgorithmusMicrosoft Decision Trees-Algorithmus. In späteren Lektionen untersuchen Sie mithilfe der Clustering-Miningmodelle verschiedene Möglichkeiten zum Gruppieren von Kunden und verwenden Entscheidungsstruktur-Miningmodelle, um vorherzusagen, ob ein potenzieller Kunde ein Fahrrad kaufen wird oder nicht.

CREATE MINING STRUCTURE-Anweisung

Um eine Miningstruktur zu erstellen, verwenden Sie die CREATE MINING STRUCTURE ( DMX ) Anweisung. Der in der Anweisung enthaltene Code umfasst folgende Abschnitte:

  • Benennen der Struktur.

  • Definieren der Schlüsselspalte.

  • Definieren der Miningspalten

  • Definieren eines optionalen Test-Datasets

Es folgt ein allgemeines Beispiel für die CREATE MINING STRUCTURE-Anweisung:

CREATE MINING STRUCTURE [<mining structure name>]  
(  
    <key column>,  
    <mining structure columns>  
)   
WITH HOLDOUT (<holdout specifier>)  

Die erste Codezeile definiert den Namen der Struktur:

CREATE MINING STRUCTURE [<mining structure name>]  

Informationen zum Benennen eines Objekts in Data Mining Extensions (DMX) finden Sie unter Bezeichner ( DMX ).

Die nächste Codezeile definiert die Schlüsselspalte für die Miningstruktur, die eine Entität in den Quelldaten eindeutig identifiziert:

<key column>,  

In der Miningstruktur erstellen, die Kunden-ID, CustomerKey, definiert Sie eine Entität in den Quelldaten.

Mit der nächsten Codezeile werden die Miningspalten definiert, die von den Miningmodellen verwendet werden, die der Miningstruktur zugeordnet sind:

<mining structure columns>  

Sie können die DISCRETIZE-Funktion in kontinuierliche Spalten Diskretisieren mithilfe der folgenden Syntax:

DISCRETIZE(<method>,<number of buckets>)

Weitere Informationen zur Diskretisierung von Spalten finden Sie unter Diskretisierungsmethoden ( Data Mining ). Weitere Informationen zu den Arten von Miningstrukturspalten, die Sie definieren können, finden Sie unter Miningstrukturspalten.

In der letzten Codezeile wird eine optionale Partition in der Miningstruktur definiert:

WITH HOLDOUT (<holdout specifier>)  

Sie geben einen Teil der Daten an, die zum Testen von Miningmodellen verwendet werden sollen, die mit der Struktur verknüpft sind. Die übrigen Daten werden zum Trainieren der Modelle verwendet. Standardmäßig erstellt Analysis Services ein Test-Dataset, das 30 % aller Falldaten enthält. Sie fügen die Spezifikation hinzu, dass das Test-Dataset 30 % der Fälle bis zu einem Maximum von 1000 Fällen enthalten soll. Wenn 30 % der Fälle weniger sind als 1000, enthält das Test-Dataset den kleineren Wert.

Lektionsaufgaben

Im Rahmen dieser Lektion führen Sie die folgenden Aufgaben aus:

  • Erstellen Sie eine neue, leere Abfrage.

  • Ändern Sie die Abfrage aus, um die Miningstruktur zu erstellen.

  • Führen Sie die Abfrage.

Erstellen einer Abfrage

Im ersten Schritt stellen Sie eine Verbindung zu einer Instanz von Analysis Services her und erstellen eine neue DMX-Abfrage in SQL Server Management Studio.

So erstellen Sie eine neue DMX-Abfrage in SQL Server Management Studio

  1. Öffnen Sie SQL Server Management Studio.

  2. In der Verbindung mit Server herstellen im Dialogfeld für Servertyp, Option Analysis Services. In Servername, Typ LocalHost, oder geben Sie den Namen der Instanz von Analysis Services die Sie in dieser Lektion eine Verbindung herstellen möchten. Klicken Sie auf Verbinden.

  3. In Objekt-Explorer, mit der rechten Maustaste in der Instanzstatus von Analysis Services, zeigen Sie auf neue Abfrage, und klicken Sie dann auf DMX zum Öffnen der -Abfrage-Editor und eine neue, leere Abfrage.

Ändern der Abfrage

Im nächsten Schritt ändern Sie die oben beschriebene CREATE MINING STRUCTURE-Anweisung und erstellen die Bike Buyer-Miningstruktur.

So passen Sie die CREATE MINING STRUCTURE-Anweisung an

  1. Kopieren Sie im Abfrage-Editor das allgemeine Beispiel der CREATE MINING STRUCTURE-Anweisung in die leere Abfrage.

  2. Ersetzen Sie Folgendes:

    [<mining structure>]   
    

    durch:

    [Bike Buyer]  
    
  3. Ersetzen Sie Folgendes:

    <key column>   
    

    durch:

    CustomerKey LONG KEY  
    
  4. Ersetzen Sie Folgendes:

    <mining structure columns>   
    

    durch:

    [Age] LONG DISCRETIZED(Automatic,10),  
    [Bike Buyer] LONG DISCRETE,  
    [Commute Distance] TEXT DISCRETE,  
    [Education] TEXT DISCRETE,  
    [Gender] TEXT DISCRETE,  
    [House Owner Flag] TEXT DISCRETE,  
    [Marital Status] TEXT DISCRETE,  
    [Number Cars Owned] LONG DISCRETE,  
    [Number Children At Home] LONG DISCRETE,  
    [Occupation] TEXT DISCRETE,  
    [Region] TEXT DISCRETE,  
    [Total Children]LONG DISCRETE,  
    [Yearly Income] DOUBLE CONTINUOUS  
    
  5. Ersetzen Sie Folgendes:

    WITH HOLDOUT (holdout specifier>)  
    

    durch:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    

    Die gesamte Miningstrukturanweisung sollte jetzt wie folgt aussehen:

    CREATE MINING STRUCTURE [Bike Buyer]  
    (  
       [Customer Key] LONG KEY,  
       [Age]LONG DISCRETIZED(Automatic,10),  
       [Bike Buyer] LONG DISCRETE,  
       [Commute Distance] TEXT DISCRETE,  
       [Education] TEXT DISCRETE,  
       [Gender] TEXT DISCRETE,  
       [House Owner Flag] TEXT DISCRETE,  
       [Marital Status] TEXT DISCRETE,  
       [Number Cars Owned]LONG DISCRETE,  
       [Number Children At Home]LONG DISCRETE,  
       [Occupation] TEXT DISCRETE,  
       [Region] TEXT DISCRETE,  
       [Total Children]LONG DISCRETE,  
       [Yearly Income] DOUBLE CONTINUOUS  
    )  
    WITH HOLDOUT (30 PERCENT or 1000 CASES)  
    
  6. Auf der Datei Menü klicken Sie auf Dmxquery1.DMX speichern.

  7. In der Speichern Dialogfeld wechseln Sie zum entsprechenden Ordner, und nennen Sie die Datei Bike Buyer Structure.dmx.

Ausführen der Abfrage

Im letzten Schritt führen Sie die Abfrage aus. Nachdem eine Abfrage erstellt und gespeichert wurde, muss sie ausgeführt werden. Das bedeutet, die Anweisung muss ausgeführt werden, um auf dem Server eine Miningstruktur zu erstellen. Weitere Informationen zum Ausführen von Abfragen im Abfrage-Editor finden Sie unter Datenbankmodul-Abfrage-Editor ( SQL Server Management Studio ).

So führen Sie die Abfrage aus

  1. Klicken Sie im Abfrage-Editor auf der Symbolleiste auf Execute.

    Der Status der Abfrage wird angezeigt, der Nachrichten Registerkarte am unteren Rand des Abfrage-Editor nach der Ausführung der Anweisung beendet wurde. Die Meldung sollte Folgendes anzeigen:

    Executing the query   
    Execution complete  
    

    Eine neue Struktur mit dem Namen Bike Buyer nun auf dem Server vorhanden ist.

In der nächsten Lektion fügen Sie der soeben erstellten Struktur Miningmodelle hinzu.

Nächste Lektion

Lektion 2: Hinzufügen von Miningmodellen zur Bike Buyer-Miningstruktur