Partager via


Distributions de colonnes (exploration de données)

Dans Microsoft SQL Server Analysis Services, vous pouvez définir des distributions de colonnes dans une structure d'exploration de données pour affecter la manière dont les algorithmes traitent les données dans ces colonnes lorsque vous créez des modèles d'exploration de données. Pour certains algorithmes, il est judicieux de définir la distribution des colonnes continues avant de traiter le modèle, s'il est établi que les colonnes contiennent des distributions de valeurs communes. Si vous ne définissez pas les distributions, les modèles d'exploration de données résultants peuvent produire des prédictions moins précises que si les distributions sont définies, car les algorithmes disposent de moins d'informations à partir desquelles interpréter les données.

Les algorithmes disponibles dans Analysis Services prennent en charge les types de distribution suivants :

  • Normal
    Les valeurs pour la colonne continue forment un histogramme à distribution normale.

    Histogramme avec distribution normale

  • Log Normal
    Les valeurs pour la colonne continue forment un histogramme, dans lequel la courbe est allongée à son extrémité supérieure et est rétrécie vers son extrémité inférieure.

    Histogramme avec distribution normale logarithmique

  • Uniform
    Les valeurs pour la colonne continue forment une courbe plate, dont toutes les valeurs sont sensiblement les mêmes.

    Histogramme avec distribution uniforme

Pour plus d'informations sur les algorithmes fournis par Analysis Services, consultez Algorithmes d'exploration de données (Analysis Services - Exploration de données).

Voir aussi

Référence

Distributions (DMX)

Concepts

Types de contenu (Exploration de données)

Structures d'exploration de données (Analysis Services – exploration de données)

Méthodes de discrétisation (exploration de données)

Colonnes de structure d'exploration de données