Création de prédictions (Didacticiel sur l'exploration de données de base)

 

S’applique à : SQL Server 2016 Preview

Après avoir testé la précision de vos modèles d’exploration de données et que vous êtes satisfait des résultats, vous pouvez ensuite générer des prédictions à l’aide du Générateur de requête de prédiction de le prévision de modèle d’exploration de données onglet dans le Concepteur d’exploration de données.

Le Générateur de requêtes de prédiction a trois vues. Avec le Design et requête vues, vous pouvez générer et examiner votre requête. Vous pouvez ensuite exécuter la requête et afficher les résultats dans le résultat vue.

Toutes les requêtes de prédictions utilisent DMX, qui est l'abréviation du langage Data Mining Extensions (DMX). DMX a une syntaxe similaire à celle de T-SQL mais est utilisée pour des requêtes sur des objets d'exploration de données. Bien que la syntaxe DMX n’est pas compliqué, à l’aide d’un générateur de requêtes comme celle-ci, ou celui de le SQL Server Data Mining-compléments pour Office, facilite la sélection des entrées et créer des expressions, nous recommandons fortement que vous découvrez les principes de base.

Création de la requête

La première étape dans la création d'une requête de prédiction consiste à sélectionner un modèle d'exploration de données et une table d'entrée.

Pour sélectionner un modèle et une table d'entrée

  1. Sur le prévision de modèle d’exploration de données onglet du Concepteur d’exploration de données, dans le le modèle de Mining cliquez sur Sélectionner un modèle.

  2. Dans la Sélectionner un modèle d’exploration de données boîte de dialogue zone, parcourez l’arborescence pour le publipostage ciblé structure, développez la structure, sélectionnez TM_Decision_Tree, puis cliquez sur OK.

  3. Dans la Sélectionner une ou plusieurs tables d’entrée cliquez sur Sélectionner la Table de cas.

  4. Dans la Sélectionner une Table boîte de dialogue, dans le Source de données sélectionnez la vue de source de données Adventure Works DW Multidimensional 2012.

  5. Dans nom de la Table/vue, sélectionnez le ProspectiveBuyer (dbo) de table, puis cliquez sur OK.

    Le ProspectiveBuyer table est très similaire à la vTargetMail table de cas.

Mappage des colonnes

Une fois la table d'entrée sélectionnée, le Générateur de requêtes de prédiction crée un mappage par défaut entre le modèle d'exploration de données et la table d'entrée en fonction des noms des colonnes. Au moins une colonne de la structure doit correspondre à une colonne dans les données externes.

Important


Les données que vous utilisez pour déterminer la précision des modèles doivent contenir une colonne qui peut être mappée à la colonne prédictible. Si une telle colonne n'existe pas, vous pouvez en créer une avec des valeurs vides, mais elle doit avoir le même type de données que la colonne prédictible.

Pour mapper les entrées au modèle

  1. Droit des lignes qui connectent les modèle d’exploration de données fenêtre pour la Sélectionner une Table d’entrée puis sélectionnez Modifier les connexions.

    Vous remarquez que toutes les colonnes ne sont pas mappées. Nous allons ajouter des mappages pour plusieurs colonnes de la Table. Nous allons également générer une nouvelle colonne de date de naissance sur la colonne de date actuelle, afin que les colonnes correspondent mieux.

  2. Sous colonne de Table, cliquez sur le vélo cellule et sélectionnez ProspectiveBuyer.Unknown dans la liste déroulante.

    Cette action mappe la colonne prédictible, [Bike Buyer], à une colonne de la table d'entrée.

  3. Cliquez sur OK.

  4. Dans l’Explorateur de solutions, avec le bouton droit le publipostage ciblé vue de source de données et sélectionnez Concepteur de vues.

  5. Avec le bouton droit de la table ProspectiveBuyer, puis sélectionnez Nouveau calcul nommé.

  6. Dans le créer un calcul nommé boîte de dialogue pour nom de la colonne, type calcAge.

  7. Pour Description, type calcule l’âge en fonction de la date de naissance.

  8. Dans la Expression tapez DATEDIFF(YYYY,[BirthDate],getdate()) puis OK.

    Étant donné que la table d’entrée n’a pas Age colonne correspondant à celle du modèle, vous pouvez utiliser cette expression pour calculer l’âge du client à partir de la colonne date de naissance dans la table d’entrée. Étant donné que Age a été identifiée comme les plus influents colonne pour prédire l’achat de vélo, elle doit exister dans les deux le modèle et dans la table d’entrée.

  9. Dans le Concepteur d’exploration de données, sélectionnez le prévision de modèle d’exploration de données onglet et ouvrez à nouveau la Modifier les connexions fenêtre.

  10. Sous colonne de Table, cliquez sur le Age cellule et sélectionnez ProspectiveBuyer.calcAge à partir de la liste déroulante.

    Avertissement


    Si vous ne voyez pas la colonne dans la liste, vous devrez peut-être actualiser la définition de la vue de source de données chargée dans le concepteur. Pour ce faire, à partir de le fichier menu, sélectionnez Enregistrer tous les, puis fermez et rouvrez le projet dans le concepteur.

  11. Cliquez sur OK.

Conception de la requête de prédiction

  1. Le premier bouton de la barre d’outils de la prévision de modèle d’exploration de données onglet est le passez design afficher / basculer vers l’affichage du résultat / basculer vers l’affichage de la requête bouton. Cliquez sur la flèche bas sur ce bouton, puis sélectionnez conception.

  2. Dans la grille sur la prévision de modèle d’exploration de données cliquez sur la cellule dans la première ligne vide dans le Source colonne, puis sélectionnez fonction de prédiction.

  3. Dans la fonction de prédiction ligne le champ colonne, sélectionnez PredictProbability.

    Dans la Alias colonne de la même ligne, type probabilité des résultats.

  4. À partir de la le modèle de Mining fenêtre ci-dessus, sélectionnez et faites glisser [Bike Buyer] dans le critères/Argument cellule.

    Lorsque vous relâchez, [TM_Decision_Tree]. [Bike Buyer] s’affiche dans le critères/Argument cellule.

    Spécifie la colonne cible pour le PredictProbability (fonction). Pour plus d’informations sur les fonctions, consultez Data Mining Extensions &#40 ; DMX &#41 ; Référence de fonction.

  5. Cliquez sur la ligne vide suivante dans la Source colonne, puis sélectionnez un modèle d’exploration de données TM_Decision_Tree**.**

  6. Dans le TM_Decision_Tree de ligne, dans le champ colonne, sélectionnez vélo.

  7. Dans le TM_Decision_Tree de ligne, dans le critères/Argument entrez = 1.

  8. Cliquez sur la ligne vide suivante dans la Source colonne, puis sélectionnez table ProspectiveBuyer.

  9. Dans le ProspectiveBuyer de ligne, dans le champ colonne, sélectionnez ProspectiveBuyerKey.

    Un identificateur unique est ainsi ajouté à la requête de prédiction, lequel vous permet d'identifier les personnes susceptibles ou non d'acheter un vélo.

  10. Ajoutez cinq lignes en plus à la grille. Pour chaque ligne, sélectionnez table ProspectiveBuyer comme le Source puis ajoutez les colonnes suivantes dans le champ cellules :

    • calcAge

    • LastName

    • FirstName

    • AddressLine1

    • AddressLine2

Enfin, exécutez la requête et consultez les résultats.

Le Générateur de requête de prédiction inclut également ces commandes :

  • Afficher case à cocher

    Vous permet de supprimer des clauses de la requête sans devoir les supprimer du concepteur. Ceci s'avère utile lorsque vous travaillez avec des requêtes complexes et souhaitez conserver la syntaxe sans devoir copier et coller le DMX dans la fenêtre.

  • Grouper

    Insère une parenthèse ouvrante (gauche) au début de la ligne sélectionnée, ou insère une parenthèse fermante (droite) à la fin de la ligne active.

  • AND/OR

    Insère le AND opérateur ou la OR opérateur immédiatement après la fonction actuelle ou de la colonne.

Pour exécuter la requête et afficher les résultats

  1. Dans la prévision de modèle d’exploration de données onglet, sélectionnez le résultat bouton.

  2. Après l'exécution de la requête et l'affichage des résultats, vous pouvez examiner les résultats.

    Le prévision de modèle d’exploration de données onglet affiche des informations de contact pour les clients potentiels sont susceptibles d’acheter des vélos. Le probabilité des résultats colonne indique la probabilité de la prédiction. Ces résultats peuvent vous aider à déterminer les clients potentiels à cibler pour le publipostage.

  3. À ce stade, vous pouvez enregistrer les résultats. Vous avez le choix entre trois options.

    • Une ligne de données dans les résultats et sélectionnez copie Enregistrer uniquement cette valeur (et l’en-tête de colonne) dans le Presse-papiers.

    • Avec le bouton droit n’importe quelle ligne dans les résultats, puis sélectionnez Copier tout pour copier le jeu de résultats entier, y compris les en-têtes de colonnes, dans le Presse-papiers.

    • Cliquez sur Enregistrer le résultat de la requête pour enregistrer les résultats directement à une base de données comme suit :

      1. Dans la résultat de requête d’exploration de données Enregistrer boîte de dialogue, sélectionnez une source de données, ou définir une nouvelle source de données.

      2. Tapez le nom de la table dans laquelle seront enregistrés les résultats de la requête.

      3. Utilisez l’option, Ajouter à la vue de gestion dynamique, pour créer la table et l’ajouter à une vue de source de données existante. Cela est utile si vous voulez conserver toutes les tables associées pour un modèle, telles que les données de formation, les données source de prédiction et les résultats de la requête, dans la même vue de source de données.

      4. Utiliser l’option Remplacer existe, mettre à jour une table existante avec les derniers résultats.

        Vous devez utiliser l'option permettant de remplacer la table si vous avez ajouté des colonnes à la requête de prédiction, modifié les noms des types de données des colonnes dans la requête de prédiction ou si vous avez exécuté des instructions ALTER sur la table de destination.

        En outre, si plusieurs colonnes portent le même nom (par exemple, le nom de colonne par défaut Expression) vous devez créer un alias pour les colonnes avec des noms dupliqués, ou une erreur est générée lorsque le concepteur tente d’enregistrer les résultats dans SQL Server. En effet, SQL Server n'autorise pas plusieurs colonnes à porter le même nom.

        Pour plus d’informations, consultez Data Mining requête résultat de boîte de dialogue Enregistrer &#40 ; Vue prévision de modèle &#41 ; d’exploration de données.

Tâche suivante de la leçon

Utilisation de l’extraction sur la Structure de données &#40 ; Didacticiel d’exploration de données de base de données &#41 ;

Voir aussi

Créer une requête de prédiction à l'aide du Générateur de requêtes de prédiction