Création d'une structure de modèle d'exploration de données pour le publipostage ciblé (Didacticiel sur l'exploration de données de base)

 

S’applique à : SQL Server 2016 Preview

La première étape dans la création d'un scénario de publipostage ciblé consiste à utiliser l'Assistant Exploration de données dans Outils de données SQL Server (SSDT) pour créer une structure d'exploration de données et un modèle d'exploration de données du type Arbres de décision.

Dans cette tâche vous allez configurer une nouvelle structure d’exploration de données et ajouter un modèle d’exploration de données initial basé sur le Microsoft algorithme des arbres de décision. Pour créer la structure, vous allez sélectionner en premier des tables et des vues, puis vous identifierez quelles colonnes seront utilisées pour l'apprentissage et pour le test.

Pour créer une structure d'exploration de données pour le scénario de publipostage ciblé

  1. Dans l’Explorateur de solutions, cliquez sur des Structures d’exploration de données et sélectionnez nouvelle Structure d’exploration de données pour démarrer l’Assistant exploration de données.

  2. Dans la page Assistant Exploration de données, cliquez surSuivant.

  3. Sur le Sélectionner la méthode de définition page, vérifiez que à partir de la base de données ou de données relationnelle existante est sélectionnée, puis cliquez sur Suivant.

  4. Sur le créer la Structure d’exploration de données sous quelle technique d’exploration de données voulez-vous utiliser ?, sélectionnez Microsoft Decision Trees.

    Notes


    Si vous obtenez un avertissement indiquant qu'aucun algorithme d'exploration de données n'a été trouvé, les propriétés du projet ne sont peut-être pas configurées correctement. Cet avertissement se produit lorsque le projet tente d'extraire une liste d'algorithmes d'exploration de données du serveur Analysis Services et ne trouve pas le serveur. Par défaut, Outils de données SQL Server utilisera localhost que le serveur. Si vous utilisez une instance différente ou une instance nommée, vous devez modifier les propriétés du projet. Pour plus d’informations, consultez Création d’un projet Analysis Services &#40 ; Didacticiel d’exploration de données de base de données &#41 ;.

  5. Cliquez sur Suivant.

  6. Sur le Sélectionner une vue de Source de données page, dans le des vues de source de données volet, sélectionnez publipostage. Vous pouvez cliquer sur Naviguer pour afficher les tables de la vue de source de données, puis cliquez sur Fermer pour revenir à l’Assistant.

  7. Cliquez sur Suivant.

  8. Sur le spécifier les Types de Table sélectionnez la case à cocher dans la cas colonne vTargetMail à utiliser comme table de cas, puis cliquez sur Suivant. Vous utiliserez ultérieurement la table ProspectiveBuyer à des fins de test ; ignorez-la pour le moment.

  9. Sur le spécifier les données d’apprentissage page, vous allez identifier au moins une colonne prévisible, une colonne clé et une colonne d’entrée pour votre modèle. Activez la case à cocher dans la prédictible colonne dans la BikeBuyer ligne.

    Notes


    Remarquez l'avertissement en bas de la fenêtre. Vous ne pourrez pas accéder à la page suivante, jusqu'à ce que vous sélectionnez au moins un entrée et un prédictible colonne.

  10. Cliquez sur Suggérer pour ouvrir le Suggérer des colonnes associées boîte de dialogue.

    Le Suggérer bouton est activé lorsqu’au moins un attribut prévisible a été sélectionné. Le Suggérer des colonnes associées boîte de dialogue répertorie les colonnes qui sont plus étroitement liées à la colonne prédictible et classe les attributs en correspondance avec l’attribut prédictible. Les colonnes qui contiennent une corrélation significative (confiance supérieure à 95%) sont automatiquement sélectionnées pour être incluses dans le modèle.

    Passez en revue les suggestions, puis cliquez sur Annuler toignore les suggestions.

    Notes


    Si vous cliquez sur OK, mentionné toutes les suggestions sont marquées comme colonnes d’entrée dans l’Assistant. Si vous acceptez uniquement certaines des suggestions, vous devez modifier les valeurs manuellement.

  11. Vérifiez que la case à cocher dans la Key colonne est sélectionnée dans le CustomerKey ligne.

    Notes


    Si la table source de la vue de source de données indique une clé, l'Assistant Exploration de données choisit automatiquement cette colonne comme clé du modèle.

  12. Activez les cases à cocher dans la entrée colonne dans les lignes suivantes. Vous pouvez activer plusieurs colonnes en mettant en surbrillance une plage de cellules et en appuyant sur CTRL tout en activant une case à cocher.

    • Age

    • CommuteDistance

    • EnglishEducation

    • EnglishOccupation

    • Gender

    • GeographyKey

    • HouseOwnerFlag

    • MaritalStatus

    • NumberCarsOwned

    • NumberChildrenAtHome

    • Région

    • TotalChildren

    • YearlyIncome

  13. Sur la colonne d'extrême gauche de la page, activez les cases à cocher dans les lignes suivantes.

    • AddressLine1

    • AddressLine2

    • DateFirstPurchase

    • EmailAddress

    • FirstName

    • LastName

    Vérifiez que ces lignes n'ont des coches que dans la colonne gauche. Ces colonnes seront ajoutées à votre structure mais ne seront pas incluses dans le modèle. Toutefois, une fois le modèle construit, elles seront disponibles pour l'extraction et le test. Pour plus d’informations sur l’extraction, consultez requêtes d’extraction &#40 ; d’exploration de données &#41 ;

  14. Cliquez sur Suivant.

Tâche suivante de la leçon

En spécifiant le Type de données et Type de contenu &#40 ; Didacticiel d’exploration de données de base de données &#41 ;

Voir aussi

Spécifier les types des tables (Assistant Exploration de données)
Concepteur d'exploration de données
Algorithme MDT (Microsoft Decision Trees)