배포(DMX)

Microsoft SQL Server Analysis Services에서는 마이닝 구조의 열 내용을 정의한 다음 마이닝 모델을 만들 때 알고리즘의 열 데이터 처리 방법에 정의 내용을 적용할 수 있습니다. 이렇게 하면 공통적인 값 배포가 열에 포함되어 있을 경우 모델을 처리하기 전에 몇몇 알고리즘에서 연속 열 배포를 정의하는 데 도움이 됩니다. 배포를 정의하지 않으면 알고리즘이 데이터를 해석하는 데 사용할 정보가 더 줄어듭니다. 따라서 마이닝 모델에서 얻는 예측의 정확도가 배포를 정의했을 경우보다 낮아질 수 있습니다.

Microsoft 데이터 마이닝 알고리즘에서는 다음 배포 유형을 지원합니다.

  • NORMAL
    연속 열에 대한 값은 정규 가우스 분포로 된 히스토그램을 형성합니다.

  • Log Normal
    연속 열에 대한 값은 값 로그가 정상적으로 분포된 히스토그램을 형성합니다.

  • UNIFORM
    연속 열에 대한 값은 모든 값이 균일한 평탄 곡선을 형성합니다.

Microsoft 데이터 마이닝 알고리즘에 대한 자세한 내용은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하십시오. 타사 알고리즘 공급자가 추가 배포 유형을 지원할 수 있습니다. 알고리즘에서 지원하는 배포 유형을 확인하려면 SUPPORTED_DISTRIBUTION_FLAGS 스키마 행 집합을 사용합니다.

배포 유형에 대한 자세한 내용은 열 배포(데이터 마이닝)를 참조하십시오.