Création d'une structure de modèle d'exploration de données pour le publipostage ciblé (Didacticiel sur l'exploration de données)
La première étape dans la création d'un scénario de publipostage ciblé consiste à utiliser l'Assistant Exploration de données dans Business Intelligence Development Studio pour créer une nouvelle structure d'exploration de données et un modèle d'exploration de données du type Arbres de décision.
Pour plus d'informations
Assistant Exploration de données, Concepteur d'exploration de données, Algorithme MDT (Microsoft Decision Trees)
Pour créer une structure d'exploration de données pour un scénario de publipostage ciblé
Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Structures d'exploration de données et choisissez Nouvelle structure d'exploration de données.
L'Assistant Exploration de données s'ouvre.
Dans la page Assistant Exploration de données, cliquez sur Suivant.
Dans la page Sélectionner la méthode de définition, vérifiez si l'option À partir d'une base de données relationnelles ou d'un entrepôt de données qui existent déjà est sélectionnée, puis cliquez sur Suivant.
Dans la page Sélectionner la technique d'exploration de données, sous Quelle technique d'exploration de données souhaitez-vous utiliser ?, sélectionnez Algorithme MDT (Microsoft Decision Trees).
Au cours de ce didacticiel, vous allez créer plusieurs modèles basés sur cette structure d'exploration de données initiale. Le premier modèle sera créé en même temps que la structure à la fin de l'Assistant, et sera basé sur l'algorithme MDT (Microsoft Decision Trees).
Cliquez sur Suivant.
Dans la page Sélectionner une vue de source de données, notez que l'entrepôt de données Adventure Works est sélectionné par défaut. Cliquez sur Parcourir pour afficher les tables de la vue de source de données, puis cliquez sur Fermer pour réafficher l'Assistant.
Cliquez sur Suivant.
Dans la page Spécifier les types des tables, activez la case à cocher dans la colonne Cas en regard de la table vTargetMail, puis cliquez sur Suivant.
Dans la page Spécifier les données d'apprentissage, vérifiez si la case à cocher dans la colonne Clé est activée en regard de la colonne CustomerKey.
Si la table source de la vue de source de données indique une clé, l'Assistant Exploration de données choisit automatiquement cette colonne comme clé du modèle.
Sélectionnez Entrée et Prévisible en regard de la colonne BikeBuyer.
Lorsque vous indiquez qu'une colonne est prévisible, le bouton Suggérer est activé. Le bouton Suggérer permet d'ouvrir la boîte de dialogue Suggérer des colonnes associées. Cette boîte de dialogue présente la liste des colonnes qui ont un lien étroit avec la colonne prévisible.
Elle présente les attributs classés par ordre de corrélation avec l'attribut prévisible. Les colonnes qui contiennent une valeur supérieure à 0,05 sont automatiquement sélectionnées pour être incluses dans le modèle. Si vous acceptez les suggestions, cliquez sur OK. Les colonnes sélectionnées sont alors marquées comme colonnes d'entrée dans l'Assistant. Dans le cadre de ce didacticiel, il vous est demandé d'ignorer les suggestions et de cliquer sur Annuler.
Activez les cases à cocher Entrée en regard des colonnes suivantes :
- Age
- CommuteDistance
- EnglishEducation
- EnglishOccupation
- FirstName
- Gender
- GeographyKey
- HouseOwnerFlag
- LastName
- MaritalStatus
- NumberCarsOwned
- NumberChildrenAtHome
- Region
- TotalChildren
- YearlyIncome
Maintenez la touche MAJ enfoncée pour effectuer plusieurs sélections consécutives.
Cliquez sur Suivant.
Dans la page Spécifier le contenu et le type de données des colonnes, cliquez sur Détecter.
Un algorithme exécute ces données numériques exemple et détermine si les colonnes numériques contiennent des valeurs continues ou discrètes. Par exemple, une colonne peut contenir des informations relatives aux salaires, c'est-à-dire les valeurs actuelles des salaires qui sont continues ou contenir des entiers qui représentent des plages de salaires codés telles que 1 = < 25 000; 2 = de 25 000 à 50 000 et qui sont des entiers discrets.
Après avoir cliqué sur Détecter, vérifiez que les entrées des colonnes Type de contenu et Type de données sont bien paramétrées comme indiqué dans le tableau suivant.
Colonne Type de contenu Type de données Age
Continu
Long
BikeBuyer
Discret
Long
CommuteDistance
Discret
Text
CustomerKey
Clé
Long
EnglishEducation
Discret
Text
EnglishOccupation
Discret
Text
FirstName
Discret
Text
Gender
Discret
Text
GeographyKey
Discret
Text
HouseOwnerFlag
Discret
Text
LastName
Discret
Text
MaritalStatus
Discret
Text
NumberCarsOwned
Discret
Long
NumberChildrenAtHome
Discret
Long
Region
Discret
Text
TotalChildren
Discret
Long
YearlyIncome
Continu
Double
Remarque : |
---|
Basé uniquement sur les valeurs numériques, l'algorithme d'exploration de données suggère que la colonne GeographyKey contient des nombres continus. Toutefois, les nombres tels que les codes postaux doivent typiquement être traités comme des valeurs discrètes, plutôt que comme des valeurs numériques continues, car des opérations mathématiques utilisant ces nombres n'ont pas de sens. |
- Cliquez sur Suivant.
- Dans la page Fin de l'Assistant, dans Nom de la structure d'exploration de données, tapez Publipostage ciblé.
- Dans Nom du modèle d'exploration de données, tapez TM_Decision_Tree.
- Activez la case à cocher Accepter l'extraction.
- Cliquez sur Terminer.
Tâche suivante de la leçon
Modification des modèles de publipostage ciblé (Didacticiel sur l'exploration de données)