PredictCaseLikelihood(DMX)

이 함수는 입력 사례가 기존 모델에 적합할 가능성을 반환합니다. 클러스터링 모델에서만 사용합니다.

구문

PredictCaseLikelihood([NORMALIZED|NONNORMALIZED])

인수

  • NORMALIZED
    모델에 있는 사례의 확률을 모델이 없는 사례의 확률로 나눈 값이 반환됩니다.

  • NONNORMALIZED
    사례 특성의 확률을 곱한 값인 사례의 원시 확률이 반환됩니다.

적용 대상

Microsoft 클러스터링 및 Microsoft 시퀀스 클러스터링 알고리즘을 사용하여 만든 모델

반환 형식

0에서 1 사이의 배정밀도 부동 소수점 숫자입니다. 1에 가까울수록 이 모델에 사례가 나타날 확률이 높음을 나타내고 0에 가까울수록 이 모델에 사례가 나타날 가능성이 낮음을 나타냅니다.

주의

기본적으로 PredictCaseLikelihood 함수의 결과는 정규화됩니다. 일반적으로 정규화된 값은 사례 증가에 있는 특성 수와 두 사례의 원시 확률 간 차이가 작을수록 더 유용합니다.

다음 수식은 x와 y가 제공될 경우 정규화된 값을 계산하는 데 사용됩니다.

  • x = 클러스터링 모델을 기반으로 하는 사례가 나타날 가능성

  • y = 학습 사례 수를 기반으로 하는 사례의 로그 유사도로 계산되는 한계 사례가 나타날 가능성

  • Z = Exp( log(x) – Log(Y))

정규화된 값 = (z/ (1+z))

다음 예에서는 Adventure Works DW 데이터베이스를 기반으로 하는 클러스터링 모델에 지정한 사례가 나타날 가능성을 반환합니다.

SELECT
  PredictCaseLikelihood() AS Default_Likelihood,
  PredictCaseLikelihood(NORMALIZED) AS Normalized_Likelihood,
  PredictCaseLikelihood(NONNORMALIZED) AS Raw_Likelihood,
FROM
  [TM Clustering]
NATURAL PREDICTION JOIN
(SELECT 28 AS [Age],
  '2-5 Miles' AS [Commute Distance],
  'Graduate Degree' AS [Education],
  0 AS [Number Cars Owned],
  0 AS [Number Children At Home]) AS t

예상 결과:

Default_Likelihood

Normalized_Likelihood

Raw_Likelihood

6.30672792729321E-08

6.30672792729321E-08

9.5824454056846E-48

이러한 결과 간의 차이는 정규화의 효과를 보여 줍니다. CaseLikelihood의 원시 값은 사례의 확률이 20%임을 나타내지만 결과를 정규화하면 사례의 확률이 이보다 낮음을 알 수 있습니다.

참고 항목

참조

DMX(Data Mining Extensions) 함수 참조

함수(DMX)

일반 예측 함수(DMX)

개념

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)