Partager via


Création d'une structure de modèle d'exploration de données pour le publipostage ciblé (Didacticiel sur l'exploration de données)

La première étape dans la création d'un scénario de publipostage ciblé consiste à utiliser l'Assistant Exploration de données dans Business Intelligence Development Studio pour créer une nouvelle structure d'exploration de données et un modèle d'exploration de données du type Arbres de décision.

Pour plus d'informations

Assistant Exploration de données, Concepteur d'exploration de données, Algorithme MDT (Microsoft Decision Trees)

Pour créer une structure d'exploration de données pour un scénario de publipostage ciblé

  1. Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Structures d'exploration de données et choisissez Nouvelle structure d'exploration de données.

    L'Assistant Exploration de données s'ouvre.

  2. Dans la page Assistant Exploration de données, cliquez sur Suivant.

  3. Dans la page Sélectionner la méthode de définition, vérifiez si l'option À partir d'une base de données relationnelles ou d'un entrepôt de données qui existent déjà est sélectionnée, puis cliquez sur Suivant.

  4. Dans la page Sélectionner la technique d'exploration de données, sous Quelle technique d'exploration de données souhaitez-vous utiliser ?, sélectionnez Algorithme MDT (Microsoft Decision Trees).

    Au cours de ce didacticiel, vous allez créer plusieurs modèles basés sur cette structure d'exploration de données initiale. Le premier modèle sera créé en même temps que la structure à la fin de l'Assistant, et sera basé sur l'algorithme MDT (Microsoft Decision Trees).

  5. Cliquez sur Suivant.

  6. Dans la page Sélectionner une vue de source de données, notez que l'entrepôt de données Adventure Works est sélectionné par défaut. Cliquez sur Parcourir pour afficher les tables de la vue de source de données, puis cliquez sur Fermer pour réafficher l'Assistant.

  7. Cliquez sur Suivant.

  8. Dans la page Spécifier les types des tables, activez la case à cocher dans la colonne Cas en regard de la table vTargetMail, puis cliquez sur Suivant.

  9. Dans la page Spécifier les données d'apprentissage, vérifiez si la case à cocher dans la colonne Clé est activée en regard de la colonne CustomerKey.

    Si la table source de la vue de source de données indique une clé, l'Assistant Exploration de données choisit automatiquement cette colonne comme clé du modèle.

  10. Sélectionnez Entrée et Prévisible en regard de la colonne BikeBuyer.

    Lorsque vous indiquez qu'une colonne est prévisible, le bouton Suggérer est activé. Le bouton Suggérer permet d'ouvrir la boîte de dialogue Suggérer des colonnes associées. Cette boîte de dialogue présente la liste des colonnes qui ont un lien étroit avec la colonne prévisible.

    Elle présente les attributs classés par ordre de corrélation avec l'attribut prévisible. Les colonnes qui contiennent une valeur supérieure à 0,05 sont automatiquement sélectionnées pour être incluses dans le modèle. Si vous acceptez les suggestions, cliquez sur OK. Les colonnes sélectionnées sont alors marquées comme colonnes d'entrée dans l'Assistant. Dans le cadre de ce didacticiel, il vous est demandé d'ignorer les suggestions et de cliquer sur Annuler.

  11. Activez les cases à cocher Entrée en regard des colonnes suivantes :

    • Age
    • CommuteDistance
    • EnglishEducation
    • EnglishOccupation
    • FirstName
    • Gender
    • GeographyKey
    • HouseOwnerFlag
    • LastName
    • MaritalStatus
    • NumberCarsOwned
    • NumberChildrenAtHome
    • Region
    • TotalChildren
    • YearlyIncome

    Maintenez la touche MAJ enfoncée pour effectuer plusieurs sélections consécutives.

  12. Cliquez sur Suivant.

  13. Dans la page Spécifier le contenu et le type de données des colonnes, cliquez sur Détecter.

    Un algorithme exécute ces données numériques exemple et détermine si les colonnes numériques contiennent des valeurs continues ou discrètes. Par exemple, une colonne peut contenir des informations relatives aux salaires, c'est-à-dire les valeurs actuelles des salaires qui sont continues ou contenir des entiers qui représentent des plages de salaires codés telles que 1 = < 25 000; 2 = de 25 000 à 50 000 et qui sont des entiers discrets.

  14. Après avoir cliqué sur Détecter, vérifiez que les entrées des colonnes Type de contenu et Type de données sont bien paramétrées comme indiqué dans le tableau suivant.

    Colonne Type de contenu Type de données

    Age

    Continu

    Long

    BikeBuyer

    Discret

    Long

    CommuteDistance

    Discret

    Text

    CustomerKey

    Clé

    Long

    EnglishEducation

    Discret

    Text

    EnglishOccupation

    Discret

    Text

    FirstName

    Discret

    Text

    Gender

    Discret

    Text

    GeographyKey

    Discret

    Text

    HouseOwnerFlag

    Discret

    Text

    LastName

    Discret

    Text

    MaritalStatus

    Discret

    Text

    NumberCarsOwned

    Discret

    Long

    NumberChildrenAtHome

    Discret

    Long

    Region

    Discret

    Text

    TotalChildren

    Discret

    Long

    YearlyIncome

    Continu

    Double

ms170347.note(fr-fr,SQL.90).gifRemarque :
Basé uniquement sur les valeurs numériques, l'algorithme d'exploration de données suggère que la colonne GeographyKey contient des nombres continus. Toutefois, les nombres tels que les codes postaux doivent typiquement être traités comme des valeurs discrètes, plutôt que comme des valeurs numériques continues, car des opérations mathématiques utilisant ces nombres n'ont pas de sens.
  1. Cliquez sur Suivant.
  2. Dans la page Fin de l'Assistant, dans Nom de la structure d'exploration de données, tapez Publipostage ciblé.
  3. Dans Nom du modèle d'exploration de données, tapez TM_Decision_Tree.
  4. Activez la case à cocher Accepter l'extraction.
  5. Cliquez sur Terminer.

Tâche suivante de la leçon

Modification des modèles de publipostage ciblé (Didacticiel sur l'exploration de données)