Erstellen der Miningmodellstruktur Targeted Mailing (Data Mining-Lernprogramm)

Artikel
12/15/2008

Als ersten Schritt für das Erstellen eines Targeted Mailing-Szenarios legen Sie mit dem Data Mining-Assistenten in Business Intelligence Development Studio eine neue Miningstruktur und das Decision Tree-Miningmodell an.

Weitere Informationen

Data Mining-Assistent, Data Mining-Designer, Microsoft Decision Trees-Algorithmus

So erstellen Sie eine Miningstruktur für ein Targeted Mailing-Szenario

Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Miningstrukturen, und wählen Sie Neue Miningstruktur aus.

Der Data Mining-Assistent wird geöffnet.
Klicken Sie auf der Seite Willkommen auf Weiter.
Überprüfen Sie auf der Seite Definitionsmethode auswählen, ob die Option Aus vorhandener relationaler Datenbank oder vorhandenem Data Warehouse ausgewählt ist, und klicken Sie dann auf Weiter.
Wählen Sie auf der Seite Data Mining-Technik auswählen unter Welche Data Mining-Technik möchten Sie verwenden? die Option Microsoft Decision Trees.

In diesem Lernprogramm werden Sie mehrere Modelle erstellen, die auf dieser ursprünglichen Miningstruktur basieren. Das erste Modell wird zusammen mit der Struktur erstellt, wenn Sie den Assistenten vollständig ausführen. Es basiert auf dem Microsoft Decision Trees-Algorithmus.
Klicken Sie auf Weiter.
Beachten Sie auf der Seite Datenquellensicht auswählen, dass Adventure Works DW standardmäßig ausgewählt ist. Klicken Sie auf Durchsuchen, um die Tabellen in der Datenquellensicht anzuzeigen, und klicken Sie dann auf Schließen, um zum Assistenten zurückzukehren.
Klicken Sie auf Weiter.
Aktivieren Sie auf der Seite Tabellentypen angeben neben der Tabelle vTargetMail das Kontrollkästchen in der Spalte Fall, und klicken Sie dann auf Weiter.
Überprüfen Sie auf der Seite Trainingsdaten angeben, ob das Kontrollkästchen Schlüssel neben der Spalte CustomerKey aktiviert ist.

Wenn in der Quelltabelle der Datenquellensicht ein Schlüssel angegeben ist, wählt der Data Mining-Assistent automatisch diese Spalte als Schlüssel für das Modell aus.
Aktivieren Sie neben der Spalte BikeBuyer die Kontrollkästchen Eingabe und Vorhersagbar.

Wenn Sie angeben, dass eine Spalte vorhersagbar ist, wird die Schaltfläche Vorschlagen aktiviert. Wenn Sie auf Vorschlagen klicken, wird das Dialogfeld Verbundene Spalten vorschlagen geöffnet, in dem diejenigen Spalten aufgelistet werden, die den engsten Bezug zur vorhersagbaren Spalte haben.

Im Dialogfeld Verbundene Spalten vorschlagen werden die Attribute nach ihrer Abhängigkeit vom vorhersagbaren Attribut angeordnet. Spalten mit einem Wert größer als 0,05 werden automatisch für die Aufnahme ins Modell ausgewählt. Wenn Sie den Vorschlägen zustimmen, klicken Sie auf OK, womit die ausgewählten Spalten im Assistenten als Eingabespalten gekennzeichnet werden. Im Rahmen dieses Lernprogramms ignorieren Sie die Vorschläge und klicken auf Abbrechen.
Aktivieren Sie das Kontrollkästchen Eingabe neben folgenden Spalten:
- Age
- CommuteDistance
- EnglishEducation
- EnglishOccupation
- FirstName
- Gender
- GeographyKey
- HouseOwnerFlag
- LastName
- MaritalStatus
- NumberCarsOwned
- NumberChildrenAtHome
- Region
- TotalChildren
- YearlyIncome
Mithilfe der UMSCHALTTASTE können Sie mehrere Spalten markieren.
Klicken Sie auf Weiter.
Klicken Sie auf der Seite Inhalt und Datentyp der Spalten angeben auf Erkennen.

Ein Algorithmus wird ausgeführt, der numerische Daten prüft und feststellt, ob die numerischen Spalten kontinuierliche oder diskrete Werte enthalten. So kann beispielsweise eine Spalte die Gehaltsdaten in Form tatsächlicher Werte enthalten, welche kontinuierlich sind, oder sie kann ganze Zahlen enthalten, die für codierte Gehaltsbereiche stehen, wie z. B. 1 = < 25.000 Dollar; 2 = von 25.000 bis 50.000 Dollar, welche diskret sind.

Stellen Sie nach dem Klicken auf Erkennen sicher, dass die Einträge in den Spalten Inhaltstyp und Datentyp die in der folgenden Tabelle aufgelisteten Einstellungen aufweisen.

Spalte	Inhaltstyp	Datentyp
Age	Continuous	Long
BikeBuyer	Discrete	Long
CommuteDistance	Discrete	Text
CustomerKey	Key	Long
EnglishEducation	Discrete	Text
EnglishOccupation	Discrete	Text
FirstName	Discrete	Text
Gender	Discrete	Text
GeographyKey	Discrete	Text
HouseOwnerFlag	Discrete	Text
LastName	Discrete	Text
MaritalStatus	Discrete	Text
NumberCarsOwned	Discrete	Long
NumberChildrenAtHome	Discrete	Long
Region	Discrete	Text
TotalChildren	Discrete	Long
YearlyIncome	Continuous	Double

Hinweis:
Der ausschließlich auf den numerischen Werten basierende Data Mining-Algorithmus legt nahe, dass die Spalte GeographyKey kontinuierliche Zahlen enthält. Zahlen wie zum Beispiel Postleitzahlen sollten jedoch in der Regel als diskrete und nicht als kontinuierliche numerische Werte behandelt werden, weil mathematische Operationen mit diesen Zahlen keinen Sinn ergeben.

Klicken Sie auf Weiter.
Geben Sie auf der Seite Assistenten abschließen bei Miningstrukturname den Namen Targeted Mailing ein.
Geben Sie im Feld Miningmodellname die Eingabe TM_Decision_Tree ein.
Aktivieren Sie das Kontrollkästchen Drillthrough zulassen.
Klicken Sie auf Fertig stellen.

Nächste Aufgabe in dieser Lektion

Ändern des Targeted Mailing-Modells (Data Mining-Lernprogramm)

Share via

Erstellen der Miningmodellstruktur Targeted Mailing (Data Mining-Lernprogramm)

So erstellen Sie eine Miningstruktur für ein Targeted Mailing-Szenario

Nächste Aufgabe in dieser Lektion

Zusätzliche Ressourcen