Lektion 1: Erstellen der Bike Buyer-Miningstruktur

In dieser Lektion erstellen Sie eine Miningstruktur, mit der sich vorhersagen lässt, ob ein potenzieller Kunde von Adventure Works Cycles ein Fahrrad kaufen wird. Falls Sie nicht mit Mininigstrukturen vertraut sind, finden Sie weitere Informationen unter Miningstrukturen (Analysis Services - Data Mining).

Die Bike Buyer-Miningstruktur, die Sie in dieser Lektion erstellen, unterstützt das Hinzufügen von Miningmodellen, die auf dem Microsoft Clustering-AlgorithmusMicrosoft Decision Trees-Algorithmus basieren. In späteren Lektionen untersuchen Sie mithilfe der Clustering-Miningmodelle verschiedene Möglichkeiten zum Gruppieren von Kunden und verwenden Entscheidungsstruktur-Miningmodelle, um vorherzusagen, ob ein potenzieller Kunde ein Fahrrad kaufen wird oder nicht.

CREATE MINING STRUCTURE-Anweisung

Zum Erstellen einer Miningstruktur verwenden Sie die CREATE MINING STRUCTURE (DMX)-Anweisung. Der in der Anweisung enthaltene Code umfasst folgende Abschnitte:

  • Benennen der Struktur

  • Definieren der Schlüsselspalte

  • Definieren der Miningspalten

  • Definieren eines optionalen Test-Datasets

Es folgt ein allgemeines Beispiel für die CREATE MINING STRUCTURE-Anweisung:

CREATE MINING STRUCTURE [<mining structure name>]
(
    <key column>,
    <mining structure columns>
) 
WITH HOLDOUT (<holdout specifier>)

Die erste Codezeile definiert den Namen der Struktur:

CREATE MINING STRUCTURE [<mining structure name>]

Weitere Informationen zum Benennen eines Objekts in Data Mining Extensions (DMX) finden Sie unter Bezeichner (DMX).

Die nächste Codezeile definiert die Schlüsselspalte für die Miningstruktur, die eine Entität in den Quelldaten eindeutig identifiziert:

<key column>,

In der Miningstruktur, die Sie erstellen, definiert der Kundenbezeichner CustomerKey eine Entität in den Quelldaten.

Mit der nächsten Codezeile werden die Miningspalten definiert, die von den Miningmodellen verwendet werden, die der Miningstruktur zugeordnet sind:

<mining structure columns>

Sie können die DISCRETIZE-Funktion in <Miningstrukturspalten> verwenden, um kontinuierliche Spalten mithilfe der folgenden Syntax zu diskretisieren:

DISCRETIZE(<method>,<number of buckets>)

Weitere Informationen zur Diskretisierung von Spalten finden Sie unter Diskretisierungsmethoden (Data Mining). Weitere Informationen zu den unterschiedlichen Miningstrukturspalten, die von Ihnen definiert werden können, finden Sie unter Miningstrukturspalten.

In der letzten Codezeile wird eine optionale Partition in der Miningstruktur definiert:

WITH HOLDOUT (<holdout specifier>)

Sie geben einen Teil der Daten an, die zum Testen von Miningmodellen verwendet werden sollen, die mit der Struktur verknüpft sind. Die übrigen Daten werden zum Trainieren der Modelle verwendet. Standardmäßig erstellt Analysis Services ein Test-Dataset, das 30 % aller Falldaten enthält. Sie fügen die Spezifikation hinzu, dass das Test-Dataset 30 % der Fälle bis zu einem Maximum von 1000 Fällen enthalten soll. Wenn 30 % der Fälle weniger sind als 1000, enthält das Test-Dataset den kleineren Wert.

Lektionsaufgaben

Im Rahmen dieser Lektion führen Sie die folgenden Aufgaben aus:

  • Erstellen einer neuen leeren Abfrage

  • Ändern der Abfrage, um die Miningstruktur zu erstellen

  • Ausführen der Abfrage

Erstellen einer Abfrage

Im ersten Schritt stellen Sie eine Verbindung zu einer Instanz von Analysis Services her und erstellen eine neue DMX-Abfrage in SQL Server Management Studio.

So erstellen Sie eine neue DMX-Abfrage in SQL Server Management Studio

  1. Öffnen Sie SQL Server Management Studio.

  2. Wählen Sie im Dialogfeld Verbindung mit Server herstellen für Servertyp die Option Analysis Services aus. Geben Sie unter Servername den Namen LocalHost ein, oder geben Sie den Namen der Instanz von Analysis Services ein, mit der Sie im Rahmen dieser Lektion eine Verbindung herstellen möchten. Klicken Sie auf Verbinden.

  3. Klicken Sie im Objekt-Explorer mit der rechten Maustaste auf die Instanz von Analysis Services, zeigen Sie auf Neue Abfrage, und klicken Sie dann auf DMX, um den Abfrage-Editor und eine neue, leere Abfrage zu öffnen.

Ändern der Abfrage

Im nächsten Schritt ändern Sie die oben beschriebene CREATE MINING STRUCTURE-Anweisung und erstellen die Bike Buyer-Miningstruktur.

So passen Sie die CREATE MINING STRUCTURE-Anweisung an

  1. Kopieren Sie im Abfrage-Editor das allgemeine Beispiel der CREATE MINING STRUCTURE-Anweisung in die leere Abfrage.

  2. Ersetzen Sie Folgendes:

    [<mining structure>] 
    

    durch:

    [Bike Buyer]
    
  3. Ersetzen Sie Folgendes:

    <key column> 
    

    durch:

    CustomerKey LONG KEY
    
  4. Ersetzen Sie Folgendes:

    <mining structure columns> 
    

    durch:

       [Age] LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned] LONG DISCRETE,
       [Number Children At Home] LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    
  5. Ersetzen Sie Folgendes:

    WITH HOLDOUT (holdout specifier>)
    

    durch:

    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    

    Die gesamte Miningstrukturanweisung sollte jetzt wie folgt aussehen:

    CREATE MINING STRUCTURE [Bike Buyer]
    (
       [Customer Key] LONG KEY,
       [Age]LONG DISCRETIZED(Automatic,10),
       [Bike Buyer] LONG DISCRETE,
       [Commute Distance] TEXT DISCRETE,
       [Education] TEXT DISCRETE,
       [Gender] TEXT DISCRETE,
       [House Owner Flag] TEXT DISCRETE,
       [Marital Status] TEXT DISCRETE,
       [Number Cars Owned]LONG DISCRETE,
       [Number Children At Home]LONG DISCRETE,
       [Occupation] TEXT DISCRETE,
       [Region] TEXT DISCRETE,
       [Total Children]LONG DISCRETE,
       [Yearly Income] DOUBLE CONTINUOUS
    )
    WITH HOLDOUT (30 PERCENT or 1000 CASES)
    
  6. Klicken Sie im Menü Datei auf DMXQuery1.dmx speichern unter.

  7. Wechseln Sie im Dialogfeld Speichern unter in den entsprechenden Ordner, und geben Sie der Datei den Namen Bike Buyer Structure.dmx.

Ausführen der Abfrage

Im letzten Schritt führen Sie die Abfrage aus. Nachdem eine Abfrage erstellt und gespeichert wurde, muss sie ausgeführt werden. Dies bedeutet, dass die Anweisung ausgeführt werden muss, um die Miningstruktur auf dem Server zu erstellen. Weitere Informationen zum Ausführen von Abfragen im Abfrage-Editor finden Sie unter Abfrage-Editor-Fenster des Datenbankmoduls von SQL Server Management Studio.

So führen Sie die Abfrage aus

  • Klicken Sie auf der Symbolleiste im Abfrage-Editor auf Ausführen.

    Der Status der Abfrage wird auf der Registerkarte Meldungen am unteren Rand des Abfrage-Editors angezeigt, nachdem die Ausführung der Anweisung beendet wurde. Die Meldung sollte Folgendes anzeigen:

    Executing the query 
    Execution complete
    

    Eine neue Struktur mit dem Namen Bike Buyer ist jetzt auf dem Server vorhanden.

In der nächsten Lektion fügen Sie der soeben erstellten Struktur Miningmodelle hinzu.