예측 비디오 자습서(데이터 마이닝 테이블 분석 도구)

적용 대상: Microsoft SQL Server Analysis Services

작성자: 미셸 하트, Microsoft Corporation

내레이터: 메리 브레넌, Microsoft Corporation

시간: 00:4:46

크기: 9,165KB

형식: WMV 파일

이 비디오 보기

관련 도움말 항목:

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

추가 비디오:

테이블 분석 도구 시작(SQL Server 비디오)

주요 영향 요인 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

범주 검색 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예제로 채우기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예외 강조 표시 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예측 계산기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

시나리오 분석 – 목표 검색 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시나리오 분석 – 가상(What-If) 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시장 바구니 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

비디오 요약

이 자습서에서는 Excel 2007용 예측 테이블 분석 도구를 사용하는 방법에 대해 설명합니다.

비디오 대본

소개

안녕하세요, 메리 브레넌입니다. 저는 Microsoft SQL Server의 테크니컬 라이터입니다.

예측 도구는 Microsoft 시계열 알고리즘을 사용하여 기존 시계열 데이터의 추세를 기반으로 미래가치를 예측합니다. 예를 들어 현재 상태와 데이터의 기타 요인을 기반으로 지금으로부터 2년 후의 연간 매출을 예측할 수 있습니다. 이 도구는 예측 값을 예측을 위해 선택한 테이블에 새 행으로 추가하며 계열의 이전 상태와 예측 상태를 표시하는 새로운 워크시트도 만듭니다.

이 자습서에서는 현재 자전거 구매자의 특징을 토대로 새로운 고객 데이터 집합의 자전거 구매 가능성을 예측해 보겠습니다.

Excel용 테이블 분석 도구에 포함된 예측 도구와 Excel용 데이터 마이닝 클라이언트에 포함된 예측 마법사 모두 Microsoft 시계열 알고리즘을 사용합니다. 그러나 예측 도구는 사용자 데이터에 가장 적합한 설정을 사용하도록 알고리즘을 자동으로 구성하므로 사용이 더 용이합니다.

마법사 작업

먼저

  1. 예측(Forecasting) 탭을 선택하고 테이블 안을 아무 곳이나 클릭하여 테이블 분석 도구를 활성화합니다.
  2. 표 도구(Table Tools) 메뉴에서 분석(Analyze) 탭을 선택하여 테이블 분석 도구(Table Analysis Tools) 리본을 엽니다.
  3. **예측(Forecast)**을 클릭하여 마법사를 시작합니다.

유럽과 북미 지역의 매출을 예측해 보겠습니다. 이 도구는 통화나 기타 숫자와 같은 연속 숫자 데이터에 대해서만 작동합니다.

가능하면 데이터에 시간 또는 날짜 계열이 들어 있는 열도 포함해야 합니다. 이 예에는 Year/Month가 나옵니다. 데이터에 날짜 또는 시간 데이터가 없으면 대신 숫자 계열(1, 2, 3…)을 사용할 수 있습니다. 그러나 계열 열의 값은 고유해야 합니다. 예측 도구가 계열 열에서 중복 값을 찾으면 오류가 발생합니다.

날짜를 예측하는 데에는 예측 도구를 사용할 수 없다는 사실도 유의해야 합니다. 오류는 발생하지 않을지 몰라도 이 알고리즘은 날짜를 예측 가능한 값으로 사용하도록 설계되지 않았습니다.

  1. 데이터를 살펴보면 이 시계열이 연도와 월을 기반으로 함을 알 수 있습니다. 날짜 계열을 연말로 확장해 보겠습니다.
  2. Year/Month 레이블이 업데이트되도록 하려면 **타임스탬프(Time stamp)**를 지정해야 합니다.
  3. **데이터 주기성(Periodicity of data)**은 **<자동으로 검색(detect automatically)>**으로 두겠습니다.
  4. **실행(Run)**을 클릭합니다. 마법사가 원본 테이블에 예측 값을 추가하고 새 워크시트에 예측 보고서를 만듭니다.

보고서 작업

예측 보고서가 자동으로 표시됩니다. 이와 동시에 새로운 예측 값이 원본 데이터 테이블 끝에 새 열로 추가됩니다.

새 워크시트에는 이전 추세를 보여 주고 예측 값을 점으로 표시하는 꺾은선형 그래프가 포함되어 있습니다. 기록 데이터는 실선으로 표시되고 예측 데이터는 점선으로 표시됩니다. 선 위의 점을 클릭하면 예측 값을 볼 수 있습니다.

예측에 요청된 만큼의 시간 조각이 없는 경우도 있습니다. 이는 일반적으로 알고리즘이 해당 미래 시점까지 예측을 수행하는 데 필요한 데이터가 모자라다는 것을 의미합니다. 예측 도구는 최소 확률 임계값을 만족하는 예측만 수행합니다.

예측 값에 레이블이 없는 것을 볼 수 있습니다. 레이블은 예측 워크시트에서 추가할 수 있습니다.

  1. 예측(Forecasting) 워크시트를 엽니다.
  2. 아래로 스크롤하여 강조 표시된 새 예측 값을 봅니다.
  3. B40부터 예측 값 끝까지의 값을 선택합니다.
  4. 채우기의 계열 기능을 사용하여 타임스탬프 열을 확장합니다.
  5. **열(Columns)**과 **추세(Trend)**를 선택하고 **확인(OK)**을 클릭합니다.
  6. 예측 워크시트로 돌아가면 새 타임스탬프 축 레이블을 볼 수 있습니다.

결론

이것으로 예측 비디오 자습서를 마칩니다. 테이블 분석 도구에 대한 추가 도움말은 다른 테이블 분석 도구 비디오 자습서를 보거나 데이터 마이닝 추가 기능에 포함된 도움말 문서를 참조하는 것이 좋습니다. 이 자습서를 시청해 주셔서 감사합니다.