SELECT DISTINCT FROM <model >(DMX)

 

이 항목은 다음에 적용됩니다.예SQL Server(2008부터 시작)아니요Azure SQL 데이터베이스아니요Azure SQL 데이터 웨어하우스아니요병렬 데이터 웨어하우스

모델에서 선택한 열에 대해 가능한 모든 상태를 반환합니다. 반환되는 값은 지정된 열에 불연속 값, 불연속화된 숫자 값 또는 연속 숫자 값이 들어 있는지 여부에 따라 다릅니다.

  
SELECT [FLATTENED] DISTINCT [TOP <n>] <expression list> FROM <model>   
[WHERE <condition list>][ORDER BY <expression>]  

n
(선택 사항) 반환할 행 수를 지정하는 정수입니다.

식 목록
관련 열 식별자(모델에서 파생됨) 또는 식의 쉼표로 구분된 목록입니다.

모델
모델 식별자입니다.

조건 목록
열 목록에서 반환되는 값을 제한하는 조건입니다.


(선택 사항) 스칼라 값을 반환하는 식입니다.

SELECT DISTINCT FROM 문에 단일 열 또는 관련된 열 집합에만 작동 합니다. 이 절은 관련 없는 열 집합에는 적용되지 않습니다.

SELECT DISTINCT FROM 문을 사용 하면 중첩된 테이블 안의 열을 직접 참조할 수 있습니다. 예를 들어

<model>.<table column reference>.<column reference>  

결과 **SELECT DISTINCT FROM <> > ** 문 열 유형에 따라 달라 집니다. 다음 표에서는 지원되는 열 유형 및 문의 출력 결과에 대해 설명합니다.

열 유형출력
불연속열의 고유 값
불연속화됨열에서 불연속화된 각 버킷의 중간점
연속열에서 값의 중간점

다음 코드 예제는 기반는 [TM Decision Tree] 에서 만드는 모델은 기본 데이터 마이닝 자습서합니다. 이 쿼리는 불연속 열 Gender에 있는 고유 값을 반환합니다.

SELECT DISTINCT [Gender]  
FROM [TM Decision Tree]  

예제 결과:

Gender
F
M

열에 불연속 값이 들어 있으면 결과에 null 값으로 표시되는 누락된 상태가 항상 포함됩니다.

다음 코드 샘플은 열에 있는 모든 값의 중간점, 최소 기간 및 최대 기간을 반환합니다.

SELECT DISTINCT [Age] AS [Midpoint Age],   
    RangeMin([Age]) AS [Minimum Age],   
    RangeMax([Age]) AS [Maximum Age]  
FROM [TM Decision Tree]  

예제 결과:

Midpoint AgeMinimum AgeMaximum Age
622697

또한 이 쿼리는 누락된 값을 나타내는 null 값의 행 하나를 반환합니다.

다음 코드 예제는 [Yearly Income] 열의 알고리즘으로 작성된 각 버킷의 중간점, 최대값 및 최소값을 반환합니다. 이 예의 결과를 재현하려면 [Targeted Mailing]과 동일한 새 마이닝 구조를 만들어야 합니다. 마법사에서의 콘텐츠 형식을 변경 하는 Yearly Income 열에서 연속불연속화합니다.

System_CAPS_ICON_note.jpg 참고


기본 마이닝 자습서에서 만든 마이닝 모델을 변경하여 마이닝 구조 열인 [Yearly Income]을 불연속화할 수도 있습니다. 이 작업을 수행 하는 방법에 대 한 정보를 참조 하십시오. 마이닝 모델에 있는 열의 분할 변경합니다. 그러나 열의 분할을 변경하면 마이닝 구조가 다시 처리되어 해당 구조를 사용하여 작성한 다른 모델의 결과가 변경됩니다.

SELECT DISTINCT [Yearly Income] AS [Bucket Average],   
    RangeMin([Yearly Income]) AS [Bucket Minimum],   
    RangeMax([Yearly Income]) AS [Bucket Maximum]  
FROM [TM Decision Tree]  

예제 결과:

Bucket AverageBucket MinimumBucket Maximum
24610.71000039221.41
55115.7339221.4171010.05
84821.5471010.0598633.04
111633.998633.04124634.7
147317.4124634.7170000

[Yearly Income] 열의 값이 다섯 개의 버킷으로 불연속화되었고, 누락된 값을 나타내는 null 값의 열이 하나 추가되었습니다.

결과의 소수 자릿수는 쿼리에 사용하는 클라이언트에 따라 다릅니다. 여기에서는 SQL Server Data Tools(SSDT)에서 표시되는 값을 반영하기 위해 편의상 소수점 이하 두 자리로 반올림되었습니다.

예를 들어 의사 결정 트리 뷰어를 사용하여 모델을 탐색하면서 수입별로 그룹화된 고객이 들어 있는 노드를 클릭하면 도구 설명에 다음과 같은 노드 속성이 표시됩니다.

Age >=69 AND Yearly Income < 39221.41

System_CAPS_ICON_note.jpg 참고


최소 버킷의 최소값과 최대 버킷의 최대값은 단순히 관측 값 중 가장 높은 값과 가장 낮은 값입니다. 이러한 관측 범위에서 벗어나는 값은 최소 버킷과 최대 버킷에 속하는 것으로 간주됩니다.

SELECT (DMX)
Data Mining Extensions (DMX) 데이터 조작 문
Data Mining Extensions (DMX) 문 참조

커뮤니티 추가 항목

추가
표시: