|
이 문서는 수동으로 번역한 것입니다. 원본 텍스트를 보려면 포인터를 문서의 문장 위로 올리십시오.
|
번역
원본
|
Microsoft 의사 결정 트리 알고리즘 기술 참조
트리 작성
불연속 및 연속 입력
점수 매기기 방법 및 기능 선택
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
확장성 및 성능
-
기능 선택을 사용하여 특성 선택을 최적화합니다. -
Bayesian 점수 매기기를 사용하여 트리 증가를 제어합니다. -
연속 특성에 대한 Bin 생성을 최적화합니다. -
입력 값을 동적으로 그룹화하여 가장 중요한 값을 확인합니다.
-
COMPLEXITY_PENALTY 매개 변수의 값을 늘려 트리 증가를 제한합니다. -
연결 모델의 항목 수를 제한하여 작성되는 트리 수를 제한합니다. -
MINIMUM_SUPPORT 매개 변수의 값을 늘려 과잉 맞춤을 방지합니다. -
모든 특성의 불연속 값 수를 10개 이하로 제한합니다. 다른 모델에서 다른 방법으로 값을 그룹화해 볼 수도 있습니다.
참고
데이터 마이닝을 시작하기 전에 SQL Server 2012 Integration Services(SSIS)에서 제공되는 데이터 탐색 도구를 사용하여 데이터의 값 분포를 시각화하고 적절하게 값을 그룹화할 수 있습니다. 자세한 내용은 데이터 프로파일링 태스크 및 뷰어을 참조하십시오. Excel 2007용 데이터 마이닝 추가 기능을 사용하여 Microsoft Excel에서 데이터를 탐색하고 그룹화하고 레이블을 재지정할 수도 있습니다.
참고
|
|---|
|
|
알고리즘 매개 변수 설정
모델링 플래그
|
|
|
|---|---|
|
|
|
|
|
|
의사 결정 트리 모델의 회귀 변수
입력 열과 예측 가능한 열
|
|
|
|---|---|
|
|
|
|
|
|
참고
|
|---|
|
|
