PredictCaseLikelihood (DMX)

Cette fonction retourne la probabilité qu'un cas d'entrée corresponde au modèle existant. Uniquement utilisée avec les modèles de clustering.

Syntaxe

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

Arguments

  • NORMALIZED
    La valeur de retour contient la probabilité du cas au sein du modèle divisée par la probabilité du cas sans le modèle.

  • NONNORMALIZED
    La valeur de retour contient la probabilité brute du cas, qui est le produit des probabilités des attributs de cas.

Application

Les modèles générés par les algorithmes Microsoft Clustering et Microsoft Sequence Clustering.

Type de valeur renvoyé

Nombre à virgule flottante double précision compris entre 0 et 1. Un nombre plus proche de 1 indique que le cas a une probabilité plus élevée de se produire dans ce modèle. Un nombre plus proche de 0 indique qu'il est moins probable que le cas se produise dans ce modèle.

Notes

Le résultat de la fonction PredictCaseLikelihood est normalisé par défaut. Les valeurs normalisées sont généralement plus utiles lorsque le nombre d'attributs d'un cas augmente et que les différences entre les probabilités brutes de deux cas deviennent beaucoup moins importantes.

L'équation suivante est utilisée pour calculer les valeurs normalisées pour des valeurs x et y données :

  • x = probabilité du cas en fonction du modèle de clustering

  • y = probabilité de cas marginale, calculée comme le logarithme du rapport de vraisemblance du cas en fonction des cas d'apprentissage

  • Z = Exp( log(x) – Log(Y))

Valeur normalisée = (z/ (1+z))

Exemples

L'exemple suivant retourne la probabilité que le cas spécifié se produira dans le modèle de clustering, qui est basé sur la base de données Adventure Works DW.

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

Résultats attendus :

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

La différence entre ces résultats montre l'effet de la normalisation. La valeur brute de CaseLikelihood suggère que la probabilité du cas est approximativement de 20 pour cent. Toutefois, lorsque vous normalisez les résultats, il apparaît que la probabilité du cas est très faible.