Spécifier une colonne à utiliser comme régresseur dans un modèle

S’applique à : SQL Server 2019 et versions antérieures d’Analysis Services Azure Analysis Services Fabric/Power BI Premium

Important

L’exploration de données a été déconseillée dans SQL Server 2017 Analysis Services et est à présent abandonnée dans SQL Server 2022 Analysis Services. La documentation n’est pas mise à jour pour les fonctionnalités déconseillées et abandonnées. Pour en savoir plus, consultez Compatibilité descendante d’Analysis Services.

Un modèle de régression linéaire représente la valeur de l'attribut prévisible résultant d'une formule qui combine les entrées de telle façon que les données sont ajustées le mieux possible à une ligne de régression estimée. L'algorithme accepte uniquement les valeurs numériques comme entrées, et détecte automatiquement les entrées qui sont le mieux adaptées.

Vous pouvez toutefois spécifier qu'une colonne soit incluse en tant que régresseur en ajoutant le paramètre FORCE_REGRESSOR au modèle et en spécifiant les régresseurs à utiliser. Ce peut être le cas lorsque l'attribut a une signification même si l'effet est trop limité pour être détecté par le modèle, ou lorsque vous voulez vous assurer que l'attribut est inclus dans la formule.

La procédure suivante explique comment créer un modèle de régression linéaire simple, en utilisant le même exemple de données que celui utilisé pour le didacticiel sur les réseaux neuronaux. Le modèle n'est pas nécessairement fiable, mais il montre comment utiliser le Concepteur d'exploration de données pour personnaliser un modèle de régression linéaire.

Procédure de création d'un modèle de régression linéaire simple

  1. Dans SQL Server Data Tools, dans Explorateur de solutions, développez Structures d’exploration de données.

  2. Double-cliquez sur Call Center.dmm pour l'ouvrir dans le concepteur.

  3. Dans le menu Modèle d’exploration de données , sélectionnez Nouveau modèle d’exploration de données.

  4. Pour l’algorithme, sélectionnez MLR (Microsoft Linear Regression). Pour le nom, tapez Call Center Regression.

  5. Sous l’onglet Modèles d’exploration de données , modifiez l’utilisation des colonnes de la façon suivante. La valeur Ignorerdoit être affectée à toutes les colonnes ne figurant pas dans la liste suivante, si ce n’est pas déjà fait.

    FactCallCenterIDKey

    ServiceGradePredictOnly

    Total OperatorsInput

    AverageTimePerIssueInput

  6. Dans le menu Modèle d’exploration de données , sélectionnez Définir les paramètres du modèle.

  7. Pour le paramètre FORCE_REGRESSOR, dans la colonne Valeur , tapez les noms de colonnes entre crochets et séparés par une virgule, comme suit :

    [Average Time Per Issue],[Total Operators]  
    

    Notes

    L'algorithme détectera automatiquement les colonnes qui constituent les meilleurs régresseurs. Vous devez uniquement forcer l'utilisation des régresseurs lorsque vous voulez vous assurer qu'une colonne est incluse dans la formule finale.

  8. Dans le menu Modèle d’exploration de données , sélectionnez Traiter le modèle.

    Dans la visionneuse, le modèle est représenté sous la forme d'un nœud unique contenant la formule de régression. Vous pouvez afficher la formule dans la Légende d’exploration de données, ou extraire les coefficients de la formule à l’aide de requêtes.

Voir aussi

Algorithme MLR (Microsoft Linear Regression)
Requêtes d’exploration de données
Références techniques relatives à l'algorithme MLR (Microsoft Linear Regression)
Contenu du modèle d'exploration de données pour les modèles de régression linéaire (Analysis Services - Exploration de données)