Share via


Erstellen der Miningmodellstruktur Targeted Mailing (Data Mining-Lernprogramm)

Als ersten Schritt für das Erstellen eines Targeted Mailing-Szenarios legen Sie mit dem Data Mining-Assistenten in Business Intelligence Development Studio eine neue Miningstruktur und das Decision Tree-Miningmodell an.

Weitere Informationen

Data Mining-Assistent, Data Mining-Designer, Microsoft Decision Trees-Algorithmus

So erstellen Sie eine Miningstruktur für ein Targeted Mailing-Szenario

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Miningstrukturen, und wählen Sie Neue Miningstruktur aus.

    Der Data Mining-Assistent wird geöffnet.

  2. Klicken Sie auf der Seite Willkommen auf Weiter.

  3. Überprüfen Sie auf der Seite Definitionsmethode auswählen, ob die Option Aus vorhandener relationaler Datenbank oder vorhandenem Data Warehouse ausgewählt ist, und klicken Sie dann auf Weiter.

  4. Wählen Sie auf der Seite Data Mining-Technik auswählen unter Welche Data Mining-Technik möchten Sie verwenden? die Option Microsoft Decision Trees.

    In diesem Lernprogramm werden Sie mehrere Modelle erstellen, die auf dieser ursprünglichen Miningstruktur basieren. Das erste Modell wird zusammen mit der Struktur erstellt, wenn Sie den Assistenten vollständig ausführen. Es basiert auf dem Microsoft Decision Trees-Algorithmus.

  5. Klicken Sie auf Weiter.

  6. Beachten Sie auf der Seite Datenquellensicht auswählen, dass Adventure Works DW standardmäßig ausgewählt ist. Klicken Sie auf Durchsuchen, um die Tabellen in der Datenquellensicht anzuzeigen, und klicken Sie dann auf Schließen, um zum Assistenten zurückzukehren.

  7. Klicken Sie auf Weiter.

  8. Aktivieren Sie auf der Seite Tabellentypen angeben neben der Tabelle vTargetMail das Kontrollkästchen in der Spalte Fall, und klicken Sie dann auf Weiter.

  9. Überprüfen Sie auf der Seite Trainingsdaten angeben, ob das Kontrollkästchen Schlüssel neben der Spalte CustomerKey aktiviert ist.

    Wenn in der Quelltabelle der Datenquellensicht ein Schlüssel angegeben ist, wählt der Data Mining-Assistent automatisch diese Spalte als Schlüssel für das Modell aus.

  10. Aktivieren Sie neben der Spalte BikeBuyer die Kontrollkästchen Eingabe und Vorhersagbar.

    Wenn Sie angeben, dass eine Spalte vorhersagbar ist, wird die Schaltfläche Vorschlagen aktiviert. Wenn Sie auf Vorschlagen klicken, wird das Dialogfeld Verbundene Spalten vorschlagen geöffnet, in dem diejenigen Spalten aufgelistet werden, die den engsten Bezug zur vorhersagbaren Spalte haben.

    Im Dialogfeld Verbundene Spalten vorschlagen werden die Attribute nach ihrer Abhängigkeit vom vorhersagbaren Attribut angeordnet. Spalten mit einem Wert größer als 0,05 werden automatisch für die Aufnahme ins Modell ausgewählt. Wenn Sie den Vorschlägen zustimmen, klicken Sie auf OK, womit die ausgewählten Spalten im Assistenten als Eingabespalten gekennzeichnet werden. Im Rahmen dieses Lernprogramms ignorieren Sie die Vorschläge und klicken auf Abbrechen.

  11. Aktivieren Sie das Kontrollkästchen Eingabe neben folgenden Spalten:

    • Age
    • CommuteDistance
    • EnglishEducation
    • EnglishOccupation
    • FirstName
    • Gender
    • GeographyKey
    • HouseOwnerFlag
    • LastName
    • MaritalStatus
    • NumberCarsOwned
    • NumberChildrenAtHome
    • Region
    • TotalChildren
    • YearlyIncome

    Mithilfe der UMSCHALTTASTE können Sie mehrere Spalten markieren.

  12. Klicken Sie auf Weiter.

  13. Klicken Sie auf der Seite Inhalt und Datentyp der Spalten angeben auf Erkennen.

    Ein Algorithmus wird ausgeführt, der numerische Daten prüft und feststellt, ob die numerischen Spalten kontinuierliche oder diskrete Werte enthalten. So kann beispielsweise eine Spalte die Gehaltsdaten in Form tatsächlicher Werte enthalten, welche kontinuierlich sind, oder sie kann ganze Zahlen enthalten, die für codierte Gehaltsbereiche stehen, wie z. B. 1 = < 25.000 Dollar; 2 = von 25.000 bis 50.000 Dollar, welche diskret sind.

  14. Stellen Sie nach dem Klicken auf Erkennen sicher, dass die Einträge in den Spalten Inhaltstyp und Datentyp die in der folgenden Tabelle aufgelisteten Einstellungen aufweisen.

    Spalte Inhaltstyp Datentyp

    Age

    Continuous

    Long

    BikeBuyer

    Discrete

    Long

    CommuteDistance

    Discrete

    Text

    CustomerKey

    Key

    Long

    EnglishEducation

    Discrete

    Text

    EnglishOccupation

    Discrete

    Text

    FirstName

    Discrete

    Text

    Gender

    Discrete

    Text

    GeographyKey

    Discrete

    Text

    HouseOwnerFlag

    Discrete

    Text

    LastName

    Discrete

    Text

    MaritalStatus

    Discrete

    Text

    NumberCarsOwned

    Discrete

    Long

    NumberChildrenAtHome

    Discrete

    Long

    Region

    Discrete

    Text

    TotalChildren

    Discrete

    Long

    YearlyIncome

    Continuous

    Double

ms170347.note(de-de,SQL.90).gifHinweis:
Der ausschließlich auf den numerischen Werten basierende Data Mining-Algorithmus legt nahe, dass die Spalte GeographyKey kontinuierliche Zahlen enthält. Zahlen wie zum Beispiel Postleitzahlen sollten jedoch in der Regel als diskrete und nicht als kontinuierliche numerische Werte behandelt werden, weil mathematische Operationen mit diesen Zahlen keinen Sinn ergeben.
  1. Klicken Sie auf Weiter.
  2. Geben Sie auf der Seite Assistenten abschließen bei Miningstrukturname den Namen Targeted Mailing ein.
  3. Geben Sie im Feld Miningmodellname die Eingabe TM_Decision_Tree ein.
  4. Aktivieren Sie das Kontrollkästchen Drillthrough zulassen.
  5. Klicken Sie auf Fertig stellen.

Nächste Aufgabe in dieser Lektion

Ändern des Targeted Mailing-Modells (Data Mining-Lernprogramm)