예측 만들기(기본 데이터 마이닝 자습서)

아티클
10/11/2016

적용 대상: SQL Server 2016 Preview

예측 쿼리 작성기를 사용 하 여 예측을 생성 한 다음 수 마이닝 모델의 정확도 테스트 하 고 결과 만족 했으면 후는 마이닝 모델 예측 데이터 마이닝 디자이너의 탭 합니다.

예측 쿼리 작성기에는 세 가지 뷰가 있습니다. 와 디자인 및 쿼리 뷰를 작성 하 고 쿼리를 검사할 수 있습니다. 다음 쿼리를 실행 하 고 결과를 볼 수는 결과 보기.

모든 예측 쿼리는 DMX(Data Mining Extensions) 언어를 사용합니다. DMX의 구문은 T-SQL의 구문과 비슷하지만 데이터 마이닝 개체에 대한 쿼리에 실행됩니다. DMX 구문이 복잡 하지는 않지만이 또는 한 개 이상에서 같은 쿼리 작성기를 사용 하는 SQL Server 데이터 마이닝 추가 기능에 대 한 Office, 를 훨씬 쉽게 입력을 선택 하 여 식을 작성할 수 있으므로 기초 정보를 설명 하는 것이 좋습니다.

쿼리 만들기

예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델과 입력 테이블을 선택하는 것입니다.

모델과 입력 테이블을 선택하려면

에 마이닝 모델 예측 데이터 마이닝 디자이너의 탭에는 마이닝 모델 상자를 클릭 모델 선택합니다.
에 마이닝 모델 선택 대화 상자에서 트리를 이동는 대상 메일 구조, 구조를 확장 하 고, 선택 TM_Decision_Tree, 를 클릭 하 고 확인합니다.
에 입력 테이블 선택 상자 사례 테이블 선택합니다.
에 테이블 선택 대화 상자는 데이터 원본 목록에서 데이터 원본 뷰 선택 Adventure Works DW Multidimensional 2012합니다.
테이블/뷰 이름, 선택는 ProspectiveBuyer (dbo) 테이블을 마우스 클릭 한 다음 확인합니다.

ProspectiveBuyer 테이블에 가장 비슷한는 vTargetMail 사례 테이블입니다.

열 매핑

입력 테이블을 선택하면 열 이름을 기반으로 마이닝 모델과 입력 테이블 간에 기본 매핑이 만들어집니다. 구조의 열 중 적어도 하나 이상의 열이 외부 데이터의 열과 일치해야 합니다.

중요

모델의 정확도를 결정하는 데 사용하는 데이터에는 예측 가능한 열에 매핑될 수 있는 열이 포함되어 있어야 합니다. 이러한 열이 존재하지 않는 경우 빈 값으로 열을 만들 수 있지만 이 열은 예측 가능한 열과 동일한 데이터 형식을 사용해야 합니다.

입력을 모델에 매핑하려면

연결 하는 선을 마우스 오른쪽 단추로 클릭는 마이닝 모델 창에는 입력 테이블 선택 창과 선택 연결 수정합니다.

모든 열이 매핑되지는 않았습니다. 몇 가지에 대 한 매핑을 추가 합니다 테이블 열합니다. 또한 열이 더 잘 일치하도록 현재 날짜 열을 기반으로 새 생년월일 열을 생성합니다.
테이블 열, 를 클릭 하는 Bike Buyer 셀 하 고 드롭다운에서 ProspectiveBuyer.Unknown을 선택 합니다.

이는 예측 가능한 열인 [Bike Buyer]를 입력 테이블 열에 매핑합니다.

확인을 클릭합니다.
솔루션 탐색기, 를 마우스 오른쪽 단추로 클릭는 Targeted Mailing 데이터 원본 뷰 및 선택 뷰 디자이너합니다.
ProspectiveBuyer, 테이블을 마우스 오른쪽 단추로 클릭 하 고 선택 새 명명 된 계산합니다.
에 명명 된 계산 만들기 대화 상자에 대 한 열 이름, 형식 calcAge합니다.
에 대 한 설명, 형식 나 생년월일에 따라이 계산할합니다.
에 식 상자에 입력 합니다 DATEDIFF(YYYY,[BirthDate],getdate()) 클릭 하 고 확인합니다.

입력된 테이블에 있으므로 시대 모델의 해당 열이이 식을 사용 하 여 입력된 테이블 BirthDate 열에서 고객 나이 계산 합니다. 이후 시대 가장 큰 영향으로 확인 됨 자전거 구매 예측에 대 한 열을 모두 모델에서 및 입력된 테이블에 존재 해야 것입니다.
데이터 마이닝 디자이너에서 선택 된 마이닝 모델 예측 탭을 다시 엽니다는 연결 수정 창입니다.
아래에서 테이블 열, 클릭는 시대 드롭다운에서 ProspectiveBuyer.calcAge를 선택 하 고 셀입니다.

경고

목록에 열이 표시되지 않는 경우 디자이너에 로드되는 데이터 원본 뷰의 정의를 새로 고쳐야 할 수 있습니다. 이 수행 하는 파일 메뉴 모두 저장, 을 디자이너에서 프로젝트를 다시 엽니다.
확인을 클릭합니다.

예측 쿼리 디자인

도구 모음에서 첫 번째 단추는 마이닝 모델 예측 탭은는 디자인 전환 보려면 결과 뷰로 전환 / 쿼리 뷰로 전환 / 단추입니다. 이 단추에서 아래쪽 화살표를 클릭 하 고 선택 디자인합니다.
모눈에 마이닝 모델 예측 탭에서 첫 번째 빈 행에서 셀을 클릭 하는 소스 열을 선택한 다음 예측 함수합니다.
에 예측 함수 행은 필드 열에서 선택 PredictProbability합니다.

에 별칭 동일한 행 형식 열의 결과의 확률합니다.
마이닝 모델 창 위의 작업을 선택 하 고 [Bike Buyer] 끌어는 조건/인수 셀입니다.

경우 이렇게 하면 [TM_Decision_Tree]. [Bike Buyer]에 표시 된 **조건/인수** 셀입니다.  

대상 열이 지정 된 **PredictProbability** 함수입니다. 함수에 대 한 자세한 내용은 참조 [데이터 마이닝 확장 기능 &#40; DMX &#41; 함수 참조](../Topic/Data%20Mining%20Extensions%20(DMX)%20Function%20Reference.md)합니다.

다음 빈 행을 클릭 합니다.는 소스 열 및 TM_Decision_Tree 마이닝 모델을 선택한 다음합니다.
에 TM_Decision_Tree 행은 필드 열에서 선택 Bike Buyer합니다.
에 TM_Decision_Tree 행은 조건/인수 열, 형식 = 1합니다.
다음 빈 행을 클릭 합니다.는 소스 열을 선택한 다음 ProspectiveBuyer 테이블합니다.
에 ProspectiveBuyer 행은 필드 열에서 선택 ProspectiveBuyerKey합니다.

이렇게 하면 자전거 구매 가능성이 있는 고객과 구매 가능성이 없는 고객을 식별할 수 있도록 예측 쿼리에 고유 식별자가 추가됩니다.
표에 5개의 행을 더 추가합니다. 각 행에 대해 선택 ProspectiveBuyer 테이블 으로 소스 다음에 다음 열을 추가 하 고는 필드 셀:
- calcAge
- LastName
- FirstName
- AddressLine1
- AddressLine2

마지막으로 쿼리를 실행하고 결과를 찾아봅니다.

예측 쿼리 작성기 도 이러한 컨트롤을 포함 합니다.

표시 확인란

디자이너에서 삭제할 필요 없이 쿼리에서 절을 제거할 수 있습니다. 이 확인란은 복잡한 쿼리로 작업할 때 DMX를 복사하여 창에 붙여 넣을 필요 없이 구문을 보존하려는 경우에 유용할 수 있습니다.
그룹

선택한 줄의 시작 부분에 여는(왼쪽) 괄호를 삽입하거나 현재 줄의 끝에 닫는(오른쪽) 괄호를 삽입합니다.
AND/OR

삽입 된 AND 연산자 또는 OR 연산자 바로 다음에 현재 함수 또는 열입니다.

쿼리를 실행하고 결과를 확인하려면

에 마이닝 모델 예측 탭을 선택 된 결과 단추입니다.
쿼리가 실행되고 결과가 표시되면 해당 결과를 검토할 수 있습니다.

마이닝 모델 예측 탭 자전거 구매자 될 가능성이 있는 잠재 고객에 대 한 연락처 정보를 표시 합니다. 결과의 확률 열은 예측의 확률을 나타냅니다. 이러한 결과를 사용하여 메일 대상으로 삼을 잠재 고객을 결정할 수 있습니다.
이때 결과를 저장할 수 있습니다. 세 가지 옵션이 있습니다.
- 결과에 데이터의 행을 마우스 오른쪽 단추로 클릭 하 고 선택 복사 를 해당 값만 (및 열 머리글)를 클립보드에 저장 합니다.
- 결과에서 행을 마우스 오른쪽 단추로 클릭 하 고 선택 모두 복사 클립보드에 열 머리글을 포함 하는 전체 결과 집합을 복사 합니다.
- 클릭 쿼리 결과 저장 다음과 같이 데이터베이스에 직접 결과 저장할 수 있습니다.
  1. 에 데이터 마이닝 쿼리 결과 저장 대화 상자 데이터 원본을 선택 하거나 새 데이터 원본을 정의 합니다.
  2. 쿼리 결과를 포함할 테이블의 이름을 입력합니다.
  3. 옵션을 사용 하 여 DSV에 추가, 테이블을 만들고는 기존 데이터 원본 뷰를 추가 합니다. 이는 학습 데이터, 예측 원본 데이터, 쿼리 결과와 같은 모델에 대한 모든 관련 테이블을 동일한 데이터 원본 뷰에 유지하려는 경우에 유용합니다.
  4. 옵션을 사용 하 여 경우 덮어쓰기 존재, 최신 결과 함께 기존 테이블을 업데이트 합니다.
    
    예측 쿼리에 열을 추가한 경우, 예측 쿼리에서 열의 이름 또는 데이터 형식을 변경한 경우, 대상 테이블에서 ALTER 문을 실행한 경우 테이블을 덮어 쓰려면 이 옵션을 사용해야 합니다.
    
    또한 여러 열의 이름이 동일한 경우 (예를 들어, 기본 열 이름을 식) 중복 된 이름의 열에 대 한 별칭을 만들어야 합니다 또는 디자이너에서 SQL Server에 결과 저장 하려고 할 때 오류가 발생 합니다. 그 이유는 SQL Server가 여러 열에서 동일한 이름을 갖도록 허용하지 않기 때문입니다.
    
    자세한 내용은 참조 저장 데이터 마이닝 쿼리 결과 대화 상자 및 #40; 마이닝 모델 예측 뷰 )합니다.

단원의 다음 태스크

구조 데이터 (에 드릴스루 사용 기본 데이터 마이닝 자습서 및 #41;