열 배포(데이터 마이닝)

Microsoft SQL Server Analysis Services에서는 마이닝 구조의 열 배포를 정의한 다음 마이닝 모델을 만들 때 알고리즘의 열 데이터 처리 방법에 정의 내용을 적용할 수 있습니다. 이렇게 하면 공통적인 값 배포가 열에 포함되어 있을 경우 모델을 처리하기 전에 몇몇 알고리즘에서 연속 열 배포를 정의하는 데 도움이 됩니다. 배포를 정의하지 않으면 알고리즘이 데이터를 해석하는 데 사용할 정보가 더 줄어듭니다. 따라서 마이닝 모델에서 얻는 예측의 정확도가 배포를 정의했을 경우보다 낮아질 수 있습니다.

Analysis Services에서 사용 가능한 알고리즘은 다음 배포 유형을 지원합니다.

  • Normal
    연속 열 값이 정규 분포로 된 히스토그램을 형성합니다.

    정규 분포를 보여 주는 히스토그램

  • Log Normal
    연속 열 값이 위쪽 끝 곡선은 늘어나고 아래쪽 끝 곡선은 기울어진 히스토그램을 형성합니다.

    로그 정규 분포를 보여 주는 히스토그램

  • Uniform
    연속 열 값이 모든 값이 균일한 평탄 곡선을 형성합니다.

    균일한 분포를 보여 주는 히스토그램

Analysis Services에서 제공하는 알고리즘에 대한 자세한 내용은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하십시오.

참고 항목

참조

배포(DMX)

개념

내용 유형(데이터 마이닝)

마이닝 구조(Analysis Services - 데이터 마이닝)

분할 방법(데이터 마이닝)

마이닝 구조 열