Share via


Erstellen der Miningmodellstruktur "Targeted Mailing" (Lernprogramm zu Data Mining-Grundlagen)

Als ersten Schritt für das Erstellen eines Targeted Mailing-Szenarios legen Sie mit dem Data Mining-Assistenten in Business Intelligence Development Studio eine neue Miningstruktur und das Decision Tree-Miningmodell an.

In dieser Aufgabe erstellen Sie die grundlegende Miningstruktur auf Basis des Microsoft Decision Trees-Algorithmus. Wählen Sie zunächst Tabellen und Sichten aus, und geben Sie dann die Spalten für das Training und für das Testen an, um die Struktur zu erstellen.

So erstellen Sie eine Miningstruktur für das Targeted Mailing-Szenario

  1. Klicken Sie im Projektmappen-Explorer mit der rechten Maustaste auf Miningstrukturen, und wählen Sie Neue Miningstruktur, um den Data Mining-Assistenten zu starten.

  2. Klicken Sie auf der Seite Willkommen auf Weiter.

  3. Überprüfen Sie auf der Seite Definitionsmethode auswählen, ob die Option Aus vorhandener relationaler Datenbank oder vorhandenem Data Warehouse ausgewählt ist, und klicken Sie dann auf Weiter.

  4. Wählen Sie auf der Seite Data Mining-Struktur erstellen unter Welche Data Mining-Technik möchten Sie verwenden? die Option Microsoft Decision Trees.

    HinweisHinweis

    Wenn Sie eine Warnung erhalten, dass keine Data Mining-Algorithmen gefunden werden können, werden die Projekteigenschaften möglicherweise nicht korrekt konfiguriert. Diese Warnung tritt auf, wenn das Projekt versucht, eine Liste mit Data Mining-Algorithmen vom Analysis Services-Server abzurufen, und der Server nicht gefunden werden kann. BI Development Studio verwendet standardmäßig localhost als Server. Wenn Sie eine andere Instanz oder eine benannte Instanz verwenden, müssen die Projekteigenschaften geändert werden. Weitere Informationen finden Sie unter Erstellen eines Analysis Services-Projekts (Lernprogramm zu Data Mining-Grundlagen).

  5. Klicken Sie auf Weiter.

  6. Wählen Sie auf der Seite Datenquellensicht auswählen im Bereich Verfügbare Datenquellensichten die Datenquellensicht Targeted Mailing aus. Sie können auf Durchsuchen klicken, um die Tabellen in der Datenquellensicht anzuzeigen, und dann auf Schließen klicken, um zum Assistenten zurückzukehren.

  7. Klicken Sie auf Weiter.

  8. Aktivieren Sie auf der Seite Tabellentypen angeben das Kontrollkästchen in der Spalte Fall für vTargetMail zur Verwendung als Falltabelle, und klicken Sie auf Weiter. Die Tabelle ProspectiveBuyer wird später zum Testen verwenden; im Moment spielt sie keine Rolle.

  9. Geben Sie auf der Seite Trainingsdaten angeben mindestens eine vorhersagbare Spalte, eine Schlüsselspalte sowie eine Eingabespalte für das Modell an. Aktivieren Sie das Kontrollkästchen in der Spalte Vorhersagbar in der Zeile BikeBuyer.

    HinweisHinweis

    Beachten Sie die Warnung am unteren Fensterrand. Sie müssen mindestens eine Spalte für Eingabe und eine Spalte für Vorhersagbar auswählen, um zur nächsten Seite navigieren zu können.

  10. Klicken Sie auf Vorschlagen, um das Dialogfeld Verbundene Spalten vorschlagen zu öffnen.

    Die Schaltfläche Vorschlagen wird immer dann aktiviert, wenn mindestens ein vorhersagbares Attribut ausgewählt wurde. Das Dialogfeld Verbundene Spalten vorschlagen listet die Spalten auf, die am engsten mit vorhersagbaren Spalten verbunden sind, und sortiert die Attribute nach ihrer Korrelation mit dem vorhersagbaren Attribut. Spalten mit einer signifikanten Korrelation (Vertrauen größer als 95 %) werden automatisch für die Aufnahme ins Modell ausgewählt.

    Überprüfen Sie die Vorschläge, und klicken Sie auf Abbrechen, um die Vorschläge zu ignorieren.

    HinweisHinweis

    Wenn Sie auf OK klicken, werden alle aufgelisteten Vorschläge im Assistenten als Eingabespalten gekennzeichnet. Wenn Sie nur einige der Vorschläge übernehmen möchten, müssen Sie die Werte manuell ändern.

  11. Vergewissern Sie sich, dass das Kontrollkästchen in der Spalte Key in der Zeile CustomerKey aktiviert ist.

    HinweisHinweis

    Wenn in der Quelltabelle der Datenquellensicht ein Schlüssel angegeben ist, wählt der Data Mining-Assistent automatisch diese Spalte als Schlüssel für das Modell aus.

  12. Aktivieren Sie in den folgenden Zeilen die Kontrollkästchen in der Spalte Eingabe. Sie können mehrere Spalten aktivieren, indem Sie einen Zellenbereich markieren und STRG drücken, während Sie ein Kontrollkästchen aktivieren.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Region

    • TotalChildren

    • YearlyIncome

  13. Aktivieren Sie in der Spalte ganz links auf der Seite die Kontrollkästchen in den nachfolgend angegebenen Zeilen.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName

    Vergewissern Sie sich, dass die Zeilen nur für die linke Spalte aktiviert sind. Diese Spalten werden der Struktur hinzugefügt, ohne jedoch im Modell Berücksichtigung zu finden. Nach Erstellen des Modells sind die Spalten jedoch für Drillthrough und Tests verfügbar. Weitere Informationen über Drillthrough finden Sie unter Verwenden von Drillthrough für Miningmodelle und Miningstrukturen (Analysis Services - Data Mining).

  14. Klicken Sie auf Weiter.