Market Basket DMX-Lernprogramm

Neu: 05. Dezember 2005

In diesem Lernprogramm erfahren Sie, wie Miningmodelle mithilfe der Abfragesprache Data Mining-Erweiterungen (Data Mining Extensions, DMX) erstellt, trainiert und analysiert werden. Anschließend verwenden Sie diese Miningmodelle zum Erstellen von Vorhersagen, die beschreiben, welche Produkte tendenziell als Kombinationskäufe erworben werden.

Die Miningmodelle werden aus Daten erstellt, die in der AdventureWorksDW-Beispieldatenbank enthalten sind. In dieser Datenbank werden Daten für das fiktive Unternehmen Adventure Works Cycles gespeichert. Adventure Works Cycles ist ein großes, multinationales Herstellungsunternehmen. Das Unternehmen fertigt und verkauft Fahrräder aus Metall und Verbundwerkstoffen auf dem nordamerikanischen, europäischen und asiatischen Markt. Der Hauptsitz befindet sich mit 290 Mitarbeitern in Bothell, Washington. Darüber hinaus sind mehrere regionale Vertriebsteams über die internationalen Zielmärkte des Unternehmens hinweg verteilt. Weitere Informationen zur AdventureWorksDW-Beispieldatenbank finden Sie unter Data Warehouse-Beispiel für AdventureWorks.

Lernprogrammszenario

Die Firma Adventure Works Cycles hat entschieden, eine benutzerdefinierte Anwendung zu erstellen, die sich dazu verwenden lässt, mithilfe von Data Mining-Funktionen vorherzusagen, welche Produkte ihre Kunden tendenziell als Kombinationskauf erwerben. Die Verwendung dieser benutzerdefinierten Anwendung verfolgt das Ziel, eine Produktgruppe zu identifizieren und vorherzusagen, welche zusätzlichen Produkte zusammen mit den angegebenen Produkten erworben werden. Diese Informationen werden von Adventure Works Cycles dann dazu genutzt, der Firmenwebsite ein vorgeschlagenes Feature hinzuzufügen und die Informationspräsentation für die Kunden übersichtlicher zu gestalten.

Microsoft SQL Server 2005 Analysis Services (SSAS) stellt mehrere Tools bereit, mit denen folgende Aufgabe ausgeführt werden kann:

Data Mining-Erweiterungen (DMX) ist eine von Analysis Services bereitgestellte Abfragesprache, mit der Sie Miningmodelle erstellen und die Sie zum Arbeiten mit Mining-Modellen verwenden können. Der Microsoft Association-Algorithmus erstellt die Modelle, mit denen die Produkte vorhergesagt werden können, die tendenziell als Kombinationskauf erworben werden.

Ziel dieses Lernprogramms ist es, die DMX-Abfragen bereitzustellen, die in der angepassten Anwendung verwendet werden.

Weitere Informationen:Verwenden von Data Mining

Miningstruktur und Miningmodelle

Bevor Sie mit dem Erstellen von DMX-Anweisungen beginnen, sollten Sie sich mit dem wichtigsten Objekten vertraut machen, die von Analysis Services zum Erstellen von Miningmodellen verwendet werden. Die Miningstruktur ist eine Datenstruktur, die die Datendomäne, aus der die Miningmodelle erstellt werden, definiert. Eine einzelne Miningstruktur kann mehrere Miningmodelle enthalten, die dieselbe Domäne verwenden. Ein Miningmodell wendet einen Miningmodellalgorithmus für die Daten an, welcher durch eine Miningstruktur dargestellt wird.

Die Grundbausteine der Miningstruktur sind die Miningstrukturspalten, die die in der Datenquelle enthaltenen Daten beschreiben. Diese Spalten enthalten Informationen, z. B. über den Datentyp, den Inhaltstyp und die Verteilung der Daten.

Miningmodelle müssen die in der Miningstruktur beschriebene Schlüsselspalte sowie eine Teilmenge der übrigen Spalten enthalten. Das Miningmodell definiert die Verwendung jeder einzelnen Spalte und den zum Erstellen des Miningmodells verwendeten Algorithmus. Beispiel: Sie können in DMX angeben, dass eine Spalte eine Schlüsselspalte oder ein PREDICT-Spalte ist. Eine Spalte, für die kein Typ angegeben ist, wird als Eingabespalte behandelt.

Es gibt in DMX zwei Möglichkeiten, Miningmodelle zu erstellen. Sie können die Miningstruktur und das zugehörige Miningmodell entweder zusammen mithilfe der CREATE MINING MODEL-Anweisung erstellen, oder Sie können zuerst mithilfe der CREATE MINING STRUCTURE-Anweisung eine Miningstruktur erstellen und dann der Miningstruktur mithilfe der ALTER STRUCTURE-Anweisung ein Miningmodell hinzufügen. Diese Methoden werden weiter unten beschrieben.

  • CREATE MINING MODEL
    Verwenden Sie diese Anweisung, um eine Miningstruktur und ihr zugehöriges Miningmodell (unter Verwendung desselben Namens) zusammen zu erstellen. An den Namen des Miningmodells wird "Structure" angefügt, um es von der Miningstruktur zu unterscheiden. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen, die ein einzelnes Miningmodell enthalten wird.

    Weitere Informationen finden Sie unter CREATE MINING MODEL (DMX).

  • ALTER MINING STRUCTURE
    Verwenden Sie diese Anweisung, um einer Miningstruktur ein Miningmodell hinzuzufügen, das bereits auf dem Server vorhanden ist. Diese Anweisung ist hilfreich, wenn Sie eine Miningstruktur erstellen möchten, die mehrere unterschiedliche Miningmodelle enthält. Es kann mehrere Gründe geben, warum Sie einer einzelnen Miningstruktur mehr als nur ein Miningmodell hinzufügen sollten. Ein Grund könnte beispielsweise sein, dass Sie mehrere Miningmodelle mithilfe unterschiedlicher Algorithmen erstellen möchten, um herauszufinden, mit welchem Modell die besten Ergebnisse erzielt werden. Oder Sie möchten beispielsweise mehrere Miningmodelle mithilfe desselben Algorithmus erstellen, jedoch einen Parameter für jedes Miningmodell anders festlegen, um die beste Einstellung für den Parameter zu ermitteln.

    Weitere Informationen finden Sie unter ALTER MINING STRUCTURE (DMX).

Da Sie eine Miningstruktur erstellen werden, die mehrere Miningmodelle beinhaltet, verwenden Sie in diesem Lernprogramm die zweite Methode.

Weitere Informationen

Data Mining-Erweiterungen (DMX) – Referenz, Grundlegendes zur SELECT-Anweisung (DMX), Vorhersageabfragen (DMX)

Lernziele

Dieses Lernprogramm ist in die vier folgenden Lektionen aufgeteilt:

Anforderungen

Stellen Sie vor dem Durchführen des Lernprogramms sicher, dass Folgendes installiert ist:

ms345326.note(de-de,SQL.90).gifHinweis:
Zur besseren Anzeige der Lernprogramme empfehlen wir Ihnen, dass Sie der Symbolleiste in der Dokumentanzeige die Schaltflächen Nächstes Thema und Vorheriges Thema hinzufügen. Weitere Informationen finden Sie unter Erweitern der Hilfe um die Schaltflächen Weiter und Zurück.

Siehe auch

Konzepte

Bike Buyer-Lernprogramm zur DMX-Abfragesprache
Data Mining-Lernprogramm

Andere Ressourcen

Data Mining-Konzepte

Hilfe und Informationen

Informationsquellen für SQL Server 2005