Distributions (DMX)

Dans Microsoft SQL Server Analysis Services, il est possible de définir le contenu des colonnes d'une structure d'exploration de données, pour influencer la manière dont les algorithmes traitent les données de ces colonnes lors de la création des modèles d'exploration de données. Pour certains algorithmes, il est judicieux de définir la distribution des colonnes continues avant de traiter le modèle, s'il est établi que les colonnes contiennent des distributions de valeurs communes. Si vous ne définissez pas de distributions, les modèles d'exploration de données obtenus risquent de générer des prévisions moins précises, car les algorithmes disposent dans ce cas d'une moins grande quantité d'informations pour interpréter les données.

Les algorithmes d'exploration de données Microsoft prennent en charge les types de distribution suivants :

  • NORMAL
    Les valeurs de la colonne continue forment un histogramme à distribution gaussienne normale.

  • Log Normal
    Les valeurs de la colonne continue forment un histogramme dans lequel le logarithme des valeurs est normalement distribué.

  • UNIFORM
    Les valeurs de la colonne continue forment une courbe plate, dont toutes les valeurs sont sensiblement les mêmes.

Pour plus d'informations sur les algorithmes d'exploration de données Microsoft, consultez Algorithmes d'exploration de données (Analysis Services – exploration de données). Des algorithmes tiers peuvent prendre en charge des types de distribution supplémentaires. Pour déterminer les types de distribution pris en charge par un algorithme, utilisez l'ensemble de lignes du schéma SUPPORTED_DISTRIBUTION_FLAGS.

Pour plus d'informations sur les types de distribution, consultez Distributions de colonnes (exploration de données).