Appliquer des fonctions de prédiction à un modèle

Pour créer une requête de prédiction, vous devez d'abord sélectionner le modèle d'exploration de données sur lequel la requête sera basée. Vous pouvez sélectionner n'importe quel modèle d'exploration de données existant du projet actuel.

Après avoir sélectionné un modèle, ajoutez une fonction de prédiction à la requête. Il est important de comprendre que les fonctions de prédiction sont utilisées à de nombreuses fins : non seulement vous pouvez prédire des valeurs, mais vous pouvez également obtenir des statistiques s'y rapportant, ainsi que les informations qui ont été utilisées pour générer la prédiction. Les fonctions de prédiction peuvent retourner les types de valeurs suivants :

  • le nom de l'attribut prédictible et la valeur prédite ;

  • des statistiques sur la distribution et la variance des valeurs prédites ;

  • la probabilité du résultat spécifié ou de tous les résultats possibles ;

  • les scores ou valeurs les plus élevés ou les plus faibles ;

  • les valeurs associées à un nœud, un objet ou un attribut spécifié.

Il existe une grande variété de fonctions de prédiction que vous pouvez utiliser, mais vous devez choisir la fonction adaptée au type de modèle que vous avez créé. Ce choix dépend généralement de l'algorithme utilisé pour créer le modèle.

  • Pour obtenir la liste des fonctions de prédiction prises en charge pour presque tous les types de modèles, consultez Fonctions de prédiction générales (DMX).

  • De plus, des algorithmes individuels prennent en charge différentes fonctions spécialisées. Par exemple, si vous créez un modèle d'exploration de données basé sur l'algorithme de gestion de clusters Microsoft, vous pouvez utiliser des fonctions de prédiction spécialisées pour rechercher des informations sur les clusters, telles que la distance d'une valeur de données au centroïde du cluster.

    Pour obtenir des exemples sur l'interrogation d'un type spécifique de modèle d'exploration de données, consultez la rubrique de référence relative à l'algorithme, dans Algorithmes d'exploration de données (Analysis Services - Exploration de données).

Choisir un modèle d'exploration de données à utiliser pour la prédiction

  1. Dans SQL Server Management Studio, cliquez avec le bouton droit sur le modèle, puis sélectionnez Générer une requête de prédiction.

    -- OU --

    Dans Outils de données SQL Server (SSDT), cliquez sur l'onglet Prédiction de modèle d'exploration de données, puis cliquez sur Sélectionner un modèle dans la table Modèle d'exploration de données.

  2. Dans la boîte de dialogue Sélectionner un modèle d'exploration de données, sélectionnez un modèle d'exploration de données, puis cliquez sur OK.

    Vous pouvez choisir n'importe quel modèle dans la base de données Analysis Services actuelle. Pour créer une requête à l'aide d'un modèle se trouvant dans une autre base de données, vous devez soit ouvrir une nouvelle fenêtre de requête dans le contexte de cette base de données, soit ouvrir le fichier solution contenant ce modèle.

Ajouter des fonctions de prédiction à une requête

  1. Dans le Générateur de requêtes de prédiction, configurez les données d'entrée utilisées pour la prédiction, soit en fournissant des valeurs dans la boîte de dialogue Entrée de requête singleton, soit en mappant le modèle à une source de données externe.

    Pour plus d'informations, consultez Choisir et mapper les données d'entrée pour une requête de prédiction.

    AttentionAttention

    Il n'est pas nécessaire de fournir des entrées pour générer des prédictions. Lorsqu'il n'y a aucune entrée, l'algorithme retourne généralement la valeur prédite la plus probable entre toutes les entrées possibles.

  2. Cliquez sur la colonne Source, puis choisissez une valeur dans la liste :

    <nom du modèle>

    Sélectionnez cette option pour inclure des valeurs du modèle d'exploration de données dans la sortie. Vous pouvez uniquement ajouter des colonnes prédictibles.

    Lorsque vous ajoutez une colonne du modèle, le résultat retourné est la liste non distinctive des valeurs se trouvant dans cette colonne.

    Les colonnes que vous ajoutez à cette option sont incluses dans la partie SELECT de l'instruction DMX obtenue.

    Fonction de prédiction

    Sélectionnez cette option pour parcourir une liste de fonctions de prédiction.

    Les valeurs ou fonctions que vous sélectionnez sont ajoutées à la partie SELECT de l'instruction DMX obtenue.

    La liste des fonctions de prédiction n'est pas filtrée ou limitée par le type de modèle sélectionné. Par conséquent, si vous avez un doute sur la prise en charge, ou non, de la fonction pour le type de modèle actuel, vous pouvez simplement ajouter la fonction à la liste et voir s'il y a une erreur.

    Les éléments de la liste qui sont précédés d'un symbole $ (tel que $AdjustedProbability) représentent les colonnes de la table imbriquée qui est produite en sortie lorsque vous utilisez la fonction PredictHistogram. Vous trouverez ci-après les raccourcis que vous pouvez utiliser pour retourner une seule colonne, et non une table imbriquée.

    Expression personnalisée

    Sélectionnez cette option pour taper une expression personnalisée puis affecter un alias à la sortie.

    L'expression personnalisée est ajoutée à la partie SELECT de la requête de prédiction DMX obtenue.

    Cette option est utile si vous voulez ajouter du texte pour une sortie avec chaque ligne, pour appeler des fonctions VB ou pour appeler des procédures stockées personnalisées.

    Pour plus d'informations sur l'utilisation de fonctions VBA et Excel à partir de DMX, consultez Fonctions VBA dans MDX et DAX.

  3. Après avoir ajouté une fonction ou expression, basculez vers la vue DMX pour voir comment la fonction est ajoutée dans l'instruction DMX.

    AttentionAttention

    Le Générateur de requêtes de prédiction ne valide l'instruction DMX tant lorsque vous cliquez sur Résultats. Vous constaterez souvent que l'expression qui est produite par le générateur de requêtes n'est pas une instruction DMX valide. Les causes les plus courantes sont la référence à une colonne qui n'est pas liée à la colonne prédictible ou la tentative de prédire une colonne d'une table imbriquée, ce qui requiert une instruction sub-SELECT. À ce stade, vous pouvez basculer vers la vue DMX et continuer à modifier l'instruction.

Exemple : créer une requête sur un modèle de clustering

  1. Si aucun modèle de clustering n'est disponible pour générer cet exemple de requête, créez le modèle, [TM_Clustering], à l'aide du Didacticiel sur l'exploration de données de base.

  2. Dans SQL Server Management Studio, cliquez avec le bouton droit sur le modèle, cliquez sur [TM_Clustering], puis sélectionnez Générer une requête de prédiction.

  3. Dans le menu Modèle d'exploration de données, sélectionnez Requête singleton.

  4. Dans la boîte de dialogue Entrée de requête singleton, définissez les valeurs suivantes comme entrées :

    • Sexe = M

    • Distance domicile-travail = 5 à 10 miles

  5. Dans la grille de requête, pour Source, sélectionnez le modèle d'exploration de données TM_Clustering, puis ajoutez la colonne [Bike Buyer].

  6. Pour Source, sélectionnez Fonction de prédiction, puis ajoutez la fonction Cluster.

  7. Pour Source, sélectionnez Fonction de prédiction, ajoutez la fonction PredictSupport, puis faites glisser la colonne de modèle [Bike Buyer] dans la zone Critères/Argument. Tapez Support dans la colonne Alias.

    Copiez l'expression représentant la fonction de prédiction et la référence de colonne de la zone Critères/Argument.

  8. Pour Source, sélectionnez Expression personnalisée, tapez un alias, puis référencez la fonction CEILING Excel à l'aide de la syntaxe suivante :

    Excel![CEILING](<arguments) as <return type>
    

    Collez la référence de colonne comme argument de la fonction.

    Par exemple, l'expression suivante retourne le plafond (CEILING) de la valeur de support :

    EXCEL!CEILING(PredictSupport([TM_Clustering].[Bike Buyer]),2)
    

    Tapez CEILING dans la colonne Alias.

  9. Cliquez sur Basculer vers l'affichage du texte de la requête pour vérifier l'instruction DMX qui a été générée, puis cliquez sur Basculer vers l'affichage du résultat de la requête pour afficher la sortie des colonnes par la requête de prédiction.

    Le tableau suivant indique les résultats attendus :

    Bike Buyer

    $Cluster

    SUPPORT

    CEILING

    0

    Cluster 8

    954

    953.948638926372

Si vous voulez ajouter d'autres clauses ailleurs dans l'instruction (par exemple, si vous voulez ajouter une clause WHERE), vous ne pouvez pas l'ajouter à l'aide de la grille ; vous devez d'abord basculer vers la vue DMX.

Voir aussi

Concepts

Requêtes d'exploration de données