시계열 예측 만들기(중급 데이터 마이닝 자습서)

이 단원의 이전 태스크에서는 시계열 모델을 만들고 결과를 살펴보았습니다. 기본적으로 Analysis Services에서는 항상 시계열 모델에 대한 예측을 만들고 이러한 예측을 예측 차트의 일부분으로 표시합니다. 그러나 DMX(Data Mining Extensions) 예측 쿼리를 작성하여 사용자 지정 예측을 만들 수도 있습니다.

이 태스크에서는 뷰어에서 본 것과 같은 예측을 생성하는 예측 쿼리를 만듭니다. 이 태스크에서는 사용자가 이미 기본 데이터 마이닝 자습서의 단원을 마쳤으며 예측 쿼리 작성기를 사용하는 방법에 익숙하다고 가정합니다. 이제 시계열 모델과 관련된 쿼리를 만드는 방법을 배웁니다.

시계열 예측 만들기

일반적으로 예측 쿼리를 만드는 첫 번째 단계는 마이닝 모델과 입력 테이블을 선택하는 것입니다. 그러나 시계열 모델에는 일반 예측을 위해 추가 입력이 필요하지 않습니다. 따라서 모델에 데이터를 추가하거나 데이터를 바꾸지 않는 한 예측을 만들 때 새로운 데이터 원본을 지정할 필요가 없습니다. 이 단원에서는 예측 단계 수를 지정해야 합니다. 특정 제품 및 지역 조합에 대한 예측을 얻기 위해 키 값을 지정할 수도 있습니다.

[!참고]

이 자습서의 이후 태스크에서는 모델의 데이터를 새 데이터로 바꿔 교차 예측을 수행하는 시나리오를 소개합니다. 자세한 내용은 평균 예측 모델을 사용하여 예측(중급 데이터 마이닝 자습서)을 참조하십시오.

모델과 입력 테이블을 선택하려면

  1. 데이터 마이닝 디자이너의 마이닝 모델 예측 탭에 있는 마이닝 모델 상자에서 모델 선택을 클릭합니다.

  2. 마이닝 모델 선택 대화 상자에서 Forecasting 구조를 확장하고 목록에서 Forecasting 모델을 선택한 다음 확인을 클릭합니다.

  3. 입력 테이블 선택 상자는 무시합니다.

    [!참고]

    시계열 모델의 경우 교차 예측을 수행하지 않는 한 별도의 입력을 지정할 필요가 없습니다.

  4. 마이닝 모델 예측 탭의 표에 있는 원본 열에서 첫 번째 빈 행의 셀을 클릭한 다음 Forecasting 마이닝 모델을 선택합니다.

  5. 필드 열에서 Model Region을 선택합니다.

    이렇게 하면 예측이 적용되는 모델 및 지역 조합을 나타내기 위해 예측 쿼리에 계열 식별자가 추가됩니다.

  6. 원본 열에서 다음 빈 행을 클릭한 다음 예측 함수를 선택합니다.

  7. 필드 열에서 PredictTimeSeries를 선택합니다.

    [!참고]

    Predict 함수도 시계열 모델에 사용할 수 있습니다. 그러나 기본적으로 Predict 함수는 각 계열에 대해 하나의 예측만 만듭니다. 따라서 여러 예측 단계를 지정하려면 PredictTimeSeries 함수를 사용해야 합니다.

  8. 마이닝 모델 창에서 마이닝 모델 열 Amount를 선택합니다. Amount를 이전에 추가한 PredictTimeSeries 함수에 대한 조건/인수 상자로 끕니다.

  9. 조건/인수 상자를 클릭하고 필드 이름 다음에 쉼표와 5를 입력합니다.

    조건/인수 상자의 텍스트가 다음과 같이 표시되어야 합니다.

    [Forecasting].[Amount],5

  10. 별칭 열에 PredictAmount를 입력합니다.

  11. 원본 열에서 다음 빈 행을 클릭한 다음 예측 함수를 다시 선택합니다.

  12. 필드 열에서 PredictTimeSeries를 선택합니다.

  13. 마이닝 모델 창에서 Quantity 열을 선택한 다음 이를 두 번째 PredictTimeSeries 함수에 대한 조건/인수 상자로 끕니다.

  14. 조건/인수 상자를 클릭하고 필드 이름 다음에 쉼표와 5를 입력합니다.

    조건/인수 상자의 텍스트가 다음과 같이 표시되어야 합니다.

    [Forecasting].[ Quantity],5

  15. 별칭 열에 PredictQuantity를 입력합니다.

  16. 쿼리 결과 뷰로 전환을 클릭합니다.

    쿼리 결과가 테이블 형식으로 표시됩니다.

열 값을 사용하는 결과 하나와 예측 함수에서 예측 값을 가져오는 결과 두 개를 합쳐 세 가지 유형의 결과를 쿼리 작성기에서 만들었습니다. 따라서 쿼리 결과에 세 개의 다른 열이 포함됩니다. 첫 번째 열에는 제품 및 지역 조합 목록이 포함됩니다. 두 번째 및 세 번째 열에는 각각 예측 결과의 중첩 테이블이 포함됩니다. 각 중첩 테이블에는 다음 표와 같은 시간 단계 및 예측 값이 포함됩니다.

예 결과:

ModelRegion

PredictAmount

PredictQuantity

M200 Europe

$TIMEAmount
7/25/2008264039.4
8/25/2008323995.1
9/25/2008346405.6
10/25/2008337472.8
11/25/2008342890.8
$TIMEQuantity
7/25/2008121
8/25/2008142
9/25/2008152
10/25/2008149
11/25/2008154

M200 North America

$TIMEAmount
7/25/2008372986.4
8/25/2008411315.3
9/25/2008356186.6
10/25/2008412292.1
11/25/2008473739.2
$TIMEQuantity
7/25/2008163
8/25/2008178
9/25/2008156
10/25/2008173
11/25/2008203

예측 결과 저장

예측 결과를 사용하기 위한 여러 다른 옵션이 있습니다. 결과를 평면화하고 결과 뷰에서 데이터를 복사하여 Excel 워크시트 또는 다른 파일에 붙여 넣을 수 있습니다. 또한 데이터를 데이터 원본 뷰에 저장할 수 있습니다. 결과를 데이터 원본 뷰에 저장하는 기능은 Business Intelligence Development Studio에서만 사용할 수 있으며 결과는 내보낸 보고서에 평면화된 형식으로 저장됩니다.

결과 창에서 결과를 평면화하려면

  1. 예측 쿼리 작성기에서 쿼리 디자인 뷰로 전환을 클릭합니다.

    DMX 쿼리 텍스트를 수동으로 편집할 수 있도록 뷰가 변경됩니다.

  2. SELECT 키워드 다음에 FLATTENED 키워드를 입력합니다. 전체 쿼리 텍스트가 다음과 같이 됩니다.

    SELECT FLATTENED
      [Forecasting].[Model Region],
      (PredictTimeSeries([Forecasting].[Amount],5)) as [PredictAmount],
      (PredictTimeSeries([Forecasting].[Quantity],5)) as [PredictQuantity]
    FROM
      [Forecasting]
    
  3. 쿼리 결과 뷰로 전환을 클릭합니다.

예측 쿼리 결과를 내보내려면

  1. 쿼리 결과 저장을 클릭합니다.

  2. 데이터 마이닝 쿼리 결과 저장 대화 상자에서 데이터 원본에 대해 AdventureWorksDW2008R2를 선택합니다. 데이터를 다른 관계형 데이터베이스에 저장하려는 경우 데이터 원본을 만들 수도 있습니다.

  3. 테이블 이름 열에 Test Predictions와 같은 새 임시 테이블 이름을 입력합니다.

  4. 저장을 클릭합니다.

    [!참고]

    만든 테이블을 보려면 데이터를 저장한 인스턴스의 데이터베이스 엔진에 대한 연결을 만들고 쿼리를 만드십시오.