시계열 예측 만들기(중급 데이터 마이닝 자습서)

아티클
11/01/2016

적용 대상: SQL Server 2016 Preview

이 단원의 이전 태스크에서는 시계열 모델을 만들고 결과를 살펴보았습니다. 기본적으로 Analysis Services에서는 항상 시계열 모델에 대한 5개의 예측으로 구성된 집합을 만들고 예측 값을 예측 차트의 일부분으로 표시합니다. 그러나 DMX(Data Mining Extensions) 예측 쿼리를 작성하여 예측을 만들 수도 있습니다.

이 태스크에서는 뷰어에서 본 것과 같은 예측을 생성하는 예측 쿼리를 만듭니다. 이 태스크에서는 사용자가 이미 기본 데이터 마이닝 자습서의 단원을 마쳤으며 예측 쿼리 작성기를 사용하는 방법에 익숙하다고 가정합니다. 이제 시계열 모델과 관련된 쿼리를 만드는 방법을 배웁니다.

시계열 예측 만들기

일반적으로 예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델과 입력 테이블을 선택하는 것입니다. 그러나 시계열 모델에는 일반 예측을 위해 추가 입력이 필요하지 않습니다. 따라서 모델에 데이터를 추가하거나 데이터를 바꾸지 않는 한 예측을 만들 때 새로운 데이터 원본을 지정할 필요가 없습니다.

이 단원에서는 예측 단계 수를 지정해야 합니다. 특정 제품 및 지역 조합에 대한 예측을 얻기 위해 계열 이름을 지정할 수 있습니다.

모델과 입력 테이블을 선택하려면

에 마이닝 모델 예측 데이터 마이닝 디자이너의 탭에는 마이닝 모델 상자를 클릭 모델 선택합니다.
에 마이닝 모델 선택 대화 상자에서 Forecasting 구조를 선택 된 Forecasting 목록에서 모델을 클릭 한 다음 확인합니다.
무시 된 입력 테이블 선택 상자입니다.

참고

시계열 모델의 경우 교차 예측을 수행하지 않는 한 별도의 입력을 지정할 필요가 없습니다.
에 소스 열에 있는 표에서 마이닝 모델 예측 탭, 첫 번째 빈 행의 셀을 클릭 한 다음 선택 Forecasting 마이닝 모델.
에 필드 열에서 선택 Model Region합니다.

이렇게 하면 예측이 적용되는 모델 및 지역 조합을 나타내기 위해 예측 쿼리에 계열 식별자가 추가됩니다.
다음 빈 행을 클릭 합니다.는 소스 열을 선택한 다음 예측 함수합니다.
에 필드 열에서 선택 PredictTimeSeries합니다.

참고

사용할 수도 있습니다는 Predict 시계열 모델과 함께 함수입니다. 그러나 기본적으로 Predict 함수는 각 계열에 대해 하나의 예측만 만듭니다. 따라서 여러 예측 단계를 지정 하려면 사용 해야는 PredictTimeSeries 함수입니다.
에 마이닝 모델 창에서 마이닝 모델 열 선택 양입니다. 금액을 끌어는 조건/인수 상자에 PredictTimeSeries 위에서 추가한 함수입니다.
클릭 된 조건/인수 쉼표와 입력 5, 필드 이름 뒤 합니다.

텍스트는 조건/인수 상자에서 다음으로 표시 되어야 합니다.

[Forecasting].[Amount],5
에 별칭 열, 형식 PredictAmount합니다.
다음 빈 행을 클릭 합니다.는 소스 열을 선택한 다음 예측 함수 다시 합니다.
에 필드 열에서 선택 PredictTimeSeries합니다.
에 마이닝 모델 창에서 Quantity 열을 선택한 다음 끕니다는 조건/인수 두 번째 상자 PredictTimeSeries 함수입니다.
클릭 된 조건/인수 쉼표와 입력 5, 필드 이름 뒤 합니다.

텍스트는 조건/인수 상자에서 다음으로 표시 되어야 합니다.

[Forecasting].[ Quantity],5
에 별칭 열, 형식 PredictQuantity합니다.
클릭 쿼리 결과 뷰로 전환합니다.

쿼리 결과가 테이블 형식으로 표시됩니다.

열 값을 사용하는 결과 하나와 예측 함수에서 예측 값을 가져오는 결과 두 개를 합쳐 세 가지 유형의 결과를 쿼리 작성기에서 만들었습니다. 따라서 쿼리 결과에 세 개의 다른 열이 포함됩니다. 첫 번째 열에는 제품 및 지역 조합 목록이 포함됩니다. 두 번째 및 세 번째 열에는 각각 예측 결과의 중첩 테이블이 포함됩니다. 각 중첩 테이블에는 다음 표와 같은 시간 단계 및 예측 값이 포함됩니다.

ModelRegion M200 Europe

결과 예(금액은 소수점 두 자리로 잘림):

PredictAmount

$TIME Amount

7/25/2008 99978.00

8/25/2008 145575.07

9/25/2008 116835.19

10/25/2008 116537.38

11/25/2008 107760.55
PredictQuantity

$TIME 수량

7/25/2008 52

8/25/2008 67

9/25/2008 58

10/25/2008 57

11/25/2008 54

$TIME	Amount
7/25/2008	99978.00
8/25/2008	145575.07
9/25/2008	116835.19
10/25/2008	116537.38
11/25/2008	107760.55

$TIME	수량
7/25/2008	52
8/25/2008	67
9/25/2008	58
10/25/2008	57
11/25/2008	54

ModelRegion M200 North America

PredictAmount

$TIME Amount

7/25/2008 348533.93

8/25/2008 340097.98

9/25/2008 257986.19

10/25/2008 374658.24

11/25/2008 379241.44
PredictQuantity

$TIME 수량

7/25/2008 272

8/25/2008 152

9/25/2008 250

10/25/2008 181

11/25/2008 290

$TIME	Amount
7/25/2008	348533.93
8/25/2008	340097.98
9/25/2008	257986.19
10/25/2008	374658.24
11/25/2008	379241.44

$TIME	수량
7/25/2008	272
8/25/2008	152
9/25/2008	250
10/25/2008	181
11/25/2008	290

경고

예제 데이터베이스에 사용된 날짜가 이 릴리스에 맞게 변경되었습니다. 이전 버전의 예제 데이터를 사용하는 경우에는 결과가 다르게 나타날 수 있습니다.

예측 결과 저장

예측 결과를 사용하기 위한 여러 다른 옵션이 있습니다. 결과를 일반화하고 결과 뷰에서 데이터를 복사하여 Excel 워크시트 또는 다른 파일에 붙여 넣을 수 있습니다.

결과 저장 프로세스를 간소화하기 위해 데이터 마이닝 디자이너에서도 데이터를 데이터 원본 뷰에 저장할 수 있는 기능이 제공됩니다. 데이터 원본 뷰에 결과를 저장하는 기능은 SQL Server Data Tools(SSDT)에서만 사용할 수 있습니다. 결과는 일반 형식으로만 저장할 수 있습니다.

결과 창에서 결과를 평면화하려면

예측 쿼리 작성기에서 클릭 쿼리 디자인 뷰로 전환합니다.

DMX 쿼리 텍스트를 수동으로 편집할 수 있도록 뷰가 변경됩니다.

형식에서 FLATTENED 키워드 다음의 선택 키워드입니다. 전체 쿼리 텍스트가 다음과 같이 됩니다.

SELECT FLATTENED  
  [Forecasting].[Model Region],  
  (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount],  
  (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity]  
FROM  
  [Forecasting]

필요에 따라 다음 예와 같이 결과를 제한하는 절을 입력할 수도 있습니다.

SELECT FLATTENED  
  [Forecasting].[Model Region],  
  (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount],  
  (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity]  
FROM  
  [Forecasting]  
WHERE [Forecasting].[Model Region] = 'M200 North America'   
OR [Forecasting].[Model Region] = 'M200 Europe'

클릭 쿼리 결과 뷰로 전환합니다.

예측 쿼리 결과를 내보내려면

클릭 쿼리 결과 저장합니다.
에 데이터 마이닝 쿼리 결과 저장 대화 상자에 대 한 데이터 소스, 선택, AdventureWorksDW2012합니다. 데이터를 다른 관계형 데이터베이스에 저장하려는 경우 데이터 원본을 만들 수도 있습니다.
에 테이블 이름 와 같은 새 임시 테이블 이름, 유형, 열 Test Predictions합니다.
저장을 클릭합니다.

참고

만든 테이블을 보려면 데이터를 저장한 인스턴스의 데이터베이스 엔진에 대한 연결을 만들고 쿼리를 만드십시오.

결론

기본 시계열 모델을 작성하고 예측을 해석 및 생성하는 방법을 배웠습니다.

이 자습서의 나머지 태스크는 선택 사항이며 고급 시계열 예측에 대해 설명합니다. 계속하기로 결정한 경우 새 데이터를 모델에 추가하고 확장된 계열에 대해 예측을 생성하는 방법을 배우게 됩니다. 또한 모델의 추세를 사용하되 데이터는 새 데이터 계열로 교체하여 교차 예측을 수행하는 방법도 배웁니다.

다음 단원

고급 시계열 예측 ( 중급 데이터 마이닝 자습서 )