예측 모델 탐색(데이터 마이닝 자습서)

이제 예측 모델을 작성했으므로 데이터 마이닝 디자이너의 마이닝 모델 뷰어 탭에 있는 Microsoft 시계열 뷰어를 사용하여 결과를 탐색할 수 있습니다. Microsoft 시계열 뷰어에는 의사결정 트리차트의 두 탭이 있습니다. 이 뷰어에 대한 자세한 내용은 Microsoft 시계열 뷰어를 사용하여 마이닝 모델 보기를 참조하십시오.

Microsoft 시계열 알고리즘에서는 데이터 집합에 있는 별개의 각 계열에 대해 모델을 작성합니다. 예를 들어 데이터 집합의 각 지역에는 특정 기간 동안의 판매 데이터가 포함되어 있으므로 지역마다 별개의 시계열이 만들어집니다. 각 시계열에는 판매 수량과 판매 금액 모두에 대한 정보가 있습니다.

이 작업에서는 유럽, 북미 및 태평양 지역의 판매에 대해 설명하는 시계열을 탐색합니다.

의사결정 트리 탭

데이터 마이닝 디자이너에 있는 Microsoft 시계열 뷰어의 의사결정 트리 탭에서는 모델을 처리할 때 생성된 의사결정 트리를 볼 수 있습니다.

의사결정 트리를 보려면

  1. 뷰어의 의사결정 트리 탭에 있는 트리 목록에서 M200 Pacific: Amount 모델을 선택합니다.

의사결정 트리의 각 노드에는 다음 세 가지 정보가 표시됩니다.

  • 배경 컨트롤에서 지정한 예측 가능한 특성의 상태에 대한 사례의 집중. 노드 범례 창과 포인터를 트리의 개체 위로 가져갈 때 나타나는 정보 팁 모두에서 정확한 사례 개수를 알 수 있습니다.
  • 노드의 회귀 수식
  • 특성 범위를 나타내는 다이아몬드 차트. 다이아몬드는 노드의 평균에 있고 다이아몬드 너비는 해당 노드에서 특성의 분산을 나타냅니다. 다이아몬드 너비가 좁을수록 노드에서 만들 수 있는 예측의 품질이 높아집니다.

차트 탭

Microsoft 시계열 뷰어의 차트 탭을 사용하여 알고리즘에서 만드는 시계열을 조사할 수 있습니다.

시계열을 선택하려면

  1. 마이닝 모델 뷰어 탭의 차트 탭으로 전환합니다.

  2. 차트 뷰 오른쪽의 드롭다운 목록 상자에서 다음 시계열에 대한 확인란을 선택합니다.

    • R750 Europe:Amount
    • R750 North America:Amount
    • R750 Pacific:Amount
  3. 확인을 클릭합니다.

뷰어 오른쪽의 범례에는 드롭다운 목록 상자에서 선택한 계열이 나열되고 각 시계열에 대한 확인란이 포함됩니다. 범례에서 확인란을 선택하거나 확인란의 선택을 취소하여 뷰어에 표시되는 시계열을 제어할 수 있습니다.

차트에는 기록 데이터와 예측 데이터가 모두 표시됩니다. 예측 데이터는 기록 데이터와 구분하기 위해 음영 처리됩니다. 예측 단계 목록을 사용하여 표시되는 데이터의 예측 단계 개수를 제어할 수 있습니다. 편차 표시 확인란을 사용하여 예측에 오류 막대를 추가할 수 있습니다.

뷰어에서 알 수 있듯이 모든 지역의 총 판매액은 대개 12개월 간격으로 증가하여 12월에 최고를 기록합니다. 예측에서도 이 추세가 계속됩니다.

다음 단원

4단원: 장바구니 시나리오 구축