Share via


Création d'une structure de modèle d'exploration de données pour le publipostage ciblé (Didacticiel sur l'exploration de données de base)

La première étape dans la création d'un scénario de publipostage ciblé consiste à utiliser l'Assistant Exploration de données dans Business Intelligence Development Studio pour créer une nouvelle structure d'exploration de données et un modèle d'exploration de données du type Arbres de décision.

Dans cette tâche vous allez créer la structure d'exploration de données initiale basée sur l'algorithme MDT (MicrosoftDecision Trees). Pour créer la structure, vous allez sélectionner en premier des tables et des vues, puis vous identifierez quelles colonnes seront utilisées pour l'apprentissage et pour le test.

Pour créer une structure d'exploration de données pour le scénario de publipostage ciblé

  1. Dans l'Explorateur de solutions, cliquez avec le bouton droit sur Structures d'exploration de données et sélectionnez Nouvelle structure d'exploration de données pour démarrer l'Assistant Exploration de données.

  2. Dans la page Assistant Exploration de données, cliquez sur Suivant.

  3. Dans la page Sélectionner la méthode de définition, vérifiez si l'option À partir d'une base de données relationnelles ou d'un entrepôt de données qui existent déjà est sélectionnée, puis cliquez sur Suivant.

  4. Dans la page Créer la structure d'exploration de données, sous Quelle technique d'exploration de données souhaitez-vous utiliser ?, sélectionnez Algorithme MDT (Microsoft Decision Trees).

    [!REMARQUE]

    Si vous obtenez un avertissement indiquant qu'aucun algorithme d'exploration de données n'a été trouvé, les propriétés du projet ne sont peut-être pas configurées correctement. Cet avertissement se produit lorsque le projet tente d'extraire une liste d'algorithmes d'exploration de données du serveur Analysis Services et ne trouve pas le serveur. Par défaut, BI Development Studio utilisera localhost comme serveur. Si vous utilisez une instance différente ou une instance nommée, vous devez modifier les propriétés du projet. Pour plus d'informations, consultez Création d'un projet Analysis Services (Didacticiel sur l'exploration de données de base).

  5. Cliquez sur Suivant.

  6. Dans la page Sélectionner une vue de source de données, dans le volet Vues de sources de données disponibles, sélectionnez Publipostage ciblé. Vous pouvez cliquer sur Parcourir pour afficher les tables de la vue de source de données, puis cliquer sur Fermer pour revenir dans l'Assistant.

  7. Cliquez sur Suivant.

  8. Dans la page Spécifier les types des tables, activez la case à cocher dans la colonne Cas pour que vTargetMail l'utilise comme la table de case, puis cliquez sur Suivant. Vous utiliserez ultérieurement la table ProspectiveBuyer à des fins de test ; ignorez-la pour le moment.

  9. Dans la page Spécifier les données d'apprentissage, vous identifierez au moins une colonne prévisible, une colonne de clé et une colonne d'entrée pour votre modèle. Activez la case à cocher dans la colonne Prévisible dans la ligne BikeBuyer.

    [!REMARQUE]

    Remarquez l'avertissement en bas de la fenêtre. Vous ne pourrez pas naviguer jusqu'à la page suivante avant d'avoir sélectionné au moins une colonne Entrée et une colonne Prévisible.

  10. Cliquez sur Suggérer pour ouvrir la boîte de dialogue Suggérer des colonnes associées.

    Le bouton Suggérer est activé lorsqu'au moins un attribut prévisible a été sélectionné. La boîte de dialogue Suggérer des colonnes associées répertorie les colonnes qui ont un lien étroit avec la colonne prévisible et classe les attributs en fonction de leur corrélation avec l'attribut prévisible. Les colonnes qui contiennent une corrélation significative (confiance supérieure à 95%) sont automatiquement sélectionnées pour être incluses dans le modèle.

    Examinez les suggestions, puis cliquez sur Annuler pour ignorer les suggestions.

    [!REMARQUE]

    Si vous cliquez sur OK, toutes les suggestions répertoriées seront marquées comme colonnes d'entrée dans l'Assistant. Si vous acceptez uniquement certaines des suggestions, vous devez modifier les valeurs manuellement.

  11. Vérifiez que la case à cocher dans la colonne Clé est activée dans la ligne CustomerKey.

    [!REMARQUE]

    Si la table source de la vue de source de données indique une clé, l'Assistant Exploration de données choisit automatiquement cette colonne comme clé du modèle.

  12. Activez les cases à cocher dans la colonne Entrée dans les lignes suivantes. Vous pouvez activer plusieurs colonnes en mettant en surbrillance une plage de cellules et en appuyant sur CTRL tout en activant une case à cocher.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Region

    • TotalChildren

    • YearlyIncome

  13. Sur la colonne d'extrême gauche de la page, activez les cases à cocher dans les lignes suivantes.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName.

    Vérifiez que ces lignes n'ont des coches que dans la colonne gauche. Ces colonnes seront ajoutées à votre structure mais ne seront pas incluses dans le modèle. Toutefois, une fois le modèle construit, elles seront disponibles pour l'extraction et le test. Pour plus d'informations sur l'extraction, consultez Utilisation de l'extraction sur les modèles et les structures d'exploration de données (Analysis Services - Exploration de données).

  14. Cliquez sur Suivant.