Colonnes d'un modèle d'exploration de données

Un modèle d'exploration de données applique un algorithme de modèle d'exploration de données aux données qui sont représentées par une structure d'exploration de données. Comme la structure d'exploration de données, le modèle d'exploration de données contient des colonnes. Un modèle d'exploration de données est inclus dans la structure d'exploration de données et hérite de toutes les valeurs des propriétés définies par la structure d'exploration de données. Le modèle peut utiliser toutes les colonnes que contient la structure d'exploration de données ou un sous-ensemble de ces colonnes.

Vous pouvez définir deux éléments d'informations supplémentaires sur une colonne de modèle d'exploration de données : l'utilisation et les indicateurs de modélisation.

  • L'utilisation est une propriété qui définit la façon dont le modèle utilise la colonne. Les colonnes peuvent être utilisées en tant que colonnes d'entrée, que colonnes de clés ou que colonnes prédictibles.

  • Les indicateurs de modélisation fournissent à l'algorithme des informations supplémentaires sur les données définies dans la table de cas, de sorte que l'algorithme puisse générer un modèle plus précis. Vous pouvez définir les indicateurs de modélisation par programmation en utilisant le langage DMX (Data Mining Extensions) ou le Concepteur d'exploration de données dans Business Intelligence Development Studio.

La liste ci-dessous décrit les indicateurs de modélisation que vous pouvez définir sur une colonne de modèle d'exploration de données.

  • MODEL_EXISTENCE_ONLY
    Indique que la présence de l'attribut est plus importante que les valeurs incluses dans la colonne de l'attribut. Par exemple, considérez une table de cas qui contient une liste d'articles associés à un client particulier. Les données de la table incluent le type de produit, l'ID et le coût de chaque élément. Pour la modélisation, le fait que le client ait acheté un article particulier peut être plus important que le coût de l'article. Dans ce cas, la colonne de coût doit recevoir l'indicateur MODEL_EXISTENCE_ONLY.

  • REGRESSOR
    Indique que l'algorithme peut utiliser la colonne spécifiée dans la formule de régression des algorithmes de régression. Cet indicateur est pris en charge par les algorithmes MDT (Microsoft Decision Trees) et MTS (Microsoft Time Series).

Pour plus d'informations sur la spécification de la propriété d'utilisation et la définition des indicateurs de modélisation par programmation à l'aide du langage DMX, consultez CREATE MINING MODEL (DMX). Pour plus d'informations sur la spécification de la propriété d'utilisation et la définition des indicateurs de modélisation dans Business Intelligence Development Studio, consultez Gestion des modèles d'exploration de données dans le Concepteur d'exploration de données.