Market Basket DMX-Lernprogramm

In diesem Lernprogramm erfahren Sie, wie Miningmodelle mithilfe der Abfragesprache Data Mining-Erweiterungen (Data Mining Extensions, DMX) erstellt, trainiert und analysiert werden. Anschließend verwenden Sie diese Miningmodelle zum Erstellen von Vorhersagen, die beschreiben, welche Produkte tendenziell als Kombinationskäufe erworben werden.

Die Miningmodelle werden aus den Daten in der AdventureWorksDW2008R2-Beispieldatenbank erstellt. In dieser Datenbank sind Daten für das fiktive Unternehmen Adventure Works Cycles gespeichert. Adventure Works Cycles ist ein großes, multinationales Fertigungsunternehmen. Das Unternehmen fertigt und verkauft Fahrräder aus Metall und Verbundwerkstoffen auf dem nordamerikanischen, europäischen und asiatischen Markt. Der Hauptsitz befindet sich mit 290 Mitarbeitern in Bothell, Washington. Darüber hinaus sind mehrere regionale Vertriebsteams über die internationalen Zielmärkte des Unternehmens verteilt.

Lernprogrammszenario

Das Unternehmen Adventure Works Cycles hat entschieden, eine benutzerdefinierte Anwendung zu erstellen, die mithilfe von Data Mining-Funktionen vorhersagt, welche Produkte die Kunden tendenziell als Kombinationskauf erwerben. Die Verwendung dieser benutzerdefinierten Anwendung verfolgt das Ziel, eine Produktgruppe zu identifizieren und vorherzusagen, welche zusätzlichen Produkte zusammen mit den angegebenen Produkten erworben werden. Diese Informationen werden von Adventure Works Cycles dann dazu genutzt, der Firmenwebsite eine "Vorschlags-Funktion" hinzuzufügen und die Informationspräsentation für die Kunden übersichtlicher zu gestalten.

Microsoft SQL Server Analysis Services stellt mehrere Tools bereit, mit denen folgende Aufgabe ausgeführt werden kann:

Data Mining-Erweiterungen (DMX) ist eine von Analysis Services bereitgestellte Abfragesprache, mit der Sie Miningmodelle erstellen und die Sie zum Arbeiten mit Mining-Modellen verwenden können. Der Microsoft Association-Algorithmus erstellt die Modelle, mit denen die Produkte vorhergesagt werden können, die tendenziell als Kombinationskauf erworben werden.

Ziel dieses Lernprogramms ist es, die DMX-Abfragen bereitzustellen, die in der angepassten Anwendung verwendet werden.

Weitere Informationen:Data Mining-Projekte (Analysis Services – Data Mining)

Miningstruktur und Miningmodelle

Bevor Sie mit dem Erstellen von DMX-Anweisungen beginnen, sollten Sie sich mit dem wichtigsten Objekten vertraut machen, die von Analysis Services zum Erstellen von Miningmodellen verwendet werden. Die Miningstruktur ist eine Datenstruktur, die die Datendomäne, aus der die Miningmodelle erstellt werden, definiert. Eine einzelne Miningstruktur kann mehrere Miningmodelle enthalten, die dieselbe Domäne verwenden. Ein Miningmodell wendet einen Miningmodellalgorithmus für die Daten an, welcher durch eine Miningstruktur dargestellt wird.

Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten.

Miningmodelle müssen die in der Miningstruktur beschriebene Schlüsselspalte sowie eine Teilmenge der übrigen Spalten enthalten. Das Miningmodell definiert die Verwendung jeder einzelnen Spalte und den zum Erstellen des Miningmodells verwendeten Algorithmus. Beispiel: Sie können in DMX angeben, dass eine Spalte eine Schlüsselspalte oder ein PREDICT-Spalte ist. Eine Spalte, für die kein Typ angegeben ist, wird als Eingabespalte behandelt.

Es gibt in DMX zwei Möglichkeiten, Miningmodelle zu erstellen. Sie können die Miningstruktur und das zugehörige Miningmodell entweder zusammen mithilfe der CREATE MINING MODEL-Anweisung erstellen, oder Sie können zuerst mithilfe der CREATE MINING STRUCTURE-Anweisung eine Miningstruktur erstellen und dann der Miningstruktur mithilfe der ALTER STRUCTURE-Anweisung ein Miningmodell hinzufügen. Diese Methoden werden weiter unten beschrieben.

  • CREATE MINING MODEL
    Verwenden Sie diese Anweisung, um eine Miningstruktur und ihr zugehöriges Miningmodell (unter Verwendung desselben Namens) zusammen zu erstellen. An den Namen des Miningmodells wird "Structure" angefügt, um es von der Miningstruktur zu unterscheiden.

    Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen, die ein einzelnes Miningmodell enthält.

    Weitere Informationen finden Sie unter CREATE MINING MODEL (DMX).

  • CREATE MINING STRUCTURE
    Verwenden Sie diese Anweisung, um eine neue Miningstruktur ohne Modelle zu erstellen.

    Wenn Sie CREATE MINING STRUCTURE verwenden, können Sie zudem ein zurückgehaltenes Dataset erstellen. Dieses kann zum Testen aller Modelle verwendet werden, die auf der gleichen Miningstruktur basieren.

    Weitere Informationen finden Sie unter CREATE MINING STRUCTURE (DMX).

  • ALTER MINING STRUCTURE
    Verwenden Sie diese Anweisung, um einer Miningstruktur ein Miningmodell hinzuzufügen, das bereits auf dem Server vorhanden ist.

    Es kann mehrere Gründe geben, warum Sie einer einzelnen Miningstruktur mehr als nur ein Miningmodell hinzufügen sollten. Ein Grund könnte beispielsweise sein, dass Sie mehrere Miningmodelle mit unterschiedlichen Algorithmen erstellen möchten, um herauszufinden, mit welchem Modell die besten Ergebnisse erzielt werden. Alternativ können Sie mehrere Miningmodelle mit demselben Algorithmus, jedoch mit einer anderen Einstellung für einen Parameter in jedem Miningmodell erstellen, um die beste Einstellung für diesen Parameter zu ermitteln.

    Weitere Informationen finden Sie unter ALTER MINING STRUCTURE (DMX).

Da Sie eine Miningstruktur erstellen, die mehrere Miningmodelle beinhaltet, verwenden Sie in diesem Lernprogramm die zweite Methode.

Weitere Informationen

Data Mining-Erweiterungen (DMX) - Referenz, Grundlegendes zur SELECT-Anweisung (DMX), Vorhersageabfragen (DMX)

Lernziele

Dieses Lernprogramm ist in die vier folgenden Lektionen aufgeteilt:

Anforderungen

Stellen Sie vor dem Durchführen des Lernprogramms sicher, dass Folgendes installiert ist:

  • Microsoft SQL Server 

  • Microsoft SQL Server Analysis Services 

  • Die AdventureWorksDW2008R2-Datenbank.

Aus Sicherheitsgründen werden die Beispieldatenbanken standardmäßig nicht installiert. Rufen Sie zur Installation der offiziellen Beispieldatenbanken für Microsoft SQL Server die Seite https://www.CodePlex.com/MSFTDBProdSamples auf oder den Abschnitt Microsoft SQL Server Product Samples auf der Microsoft SQL Server Samples and Community Projects-Startseite. Klicken Sie auf Datenbanken und anschließend auf die Registerkarte Releases, und wählen Sie die gewünschten Datenbanken aus.

HinweisHinweis

Zur besseren Anzeige der Lernprogramme empfehlen wir Ihnen, dass Sie der Symbolleiste in der Dokumentanzeige die Schaltflächen Nächstes Thema und Vorheriges Thema hinzufügen. Weitere Informationen finden Sie unter Erweitern der Hilfe um die Schaltflächen Weiter und Zurück.