예제로 채우기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

적용 대상: Microsoft SQL Server Analysis Services

작성자: 미셸 하트, Microsoft Corporation

내레이터: 메리 브레넌, Microsoft Corporation

시간: 00:4:13

크기: 10,187KB

형식: WMV 파일

이 비디오 보기

관련 도움말 항목:

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

추가 비디오:

테이블 분석 도구 시작(SQL Server 비디오)

주요 영향 요인 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

범주 검색 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예측 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예외 강조 표시 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예측 계산기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

시나리오 분석 – 목표 검색 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시나리오 분석 – 가상(What-If) 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시장 바구니 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

비디오 요약

이 자습서에서는 Excel용 예제로 채우기 테이블 분석 도구를 사용하는 방법에 대해 설명합니다.

비디오 대본

소개

안녕하세요, 메리 브레넌입니다. 저는 Microsoft SQL Server의 테크니컬 라이터입니다.

이 비디오에서는 예제로 채우기 도구를 처음 사용하는 데 도움이 되는 방법에 대해 살펴보겠습니다. 예제로 채우기 도구를 사용하면 Excel 테이블에서 찾은 패턴과 새 값을 얻기 위해 사용자가 제공하는 예제를 기반으로 새로운 데이터 열을 빠르게 만들 수 있습니다.

이 자습서에서 AdventureWorks는 고가치 고객을 식별하고자 합니다. 데이터베이스에 있는 모든 고객에 대해 이러한 값을 직접 입력할 수는 없으므로 예제로 채우기를 통해 모델을 학습하여 데이터에 존재하는 패턴을 이해한 다음 패턴 보고서를 검토하고 워크시트에 추가된 새로운 데이터 열을 평가하도록 하겠습니다.

시작하기 전에 몇 가지 유의해야 할 사항이 있습니다.

  • 먼저, 열에 있는 데이터만 사용할 수 있습니다. 채우려는 계열이 행에 저장되어 있는 경우에는 Excel의 붙여넣기, 행/열 바꿈(Paste, Transpose) 기능을 사용하여 데이터를 열 형식으로 변경할 수 있습니다.
  • 또한 예측하려는 모든 값에 대해 하나 이상의 예제가 있어야 합니다.

마법사 작업

  1. 먼저 예제로 채우기(Fill From Example) 워크시트를 엽니다.
  2. High Value Customer 열로 스크롤합니다. AdventureWorks에서는 보유하고 있는 고객에 대한 정보를 활용하여 10명의 고객을 HighValue 또는 Not High Value로 분류했습니다. 예제로 채우기 도구는 데이터의 기존 패턴을 사용자가 입력한 예제와 함께 분석하고 나머지 열에 값을 채워 넣습니다.
    결과가 만족스럽지 않을 경우 더 많은 예제를 제공하여 결과를 다듬을 수 있습니다.
  3. 예제로 채우기(Fill From Example) 탭을 선택하고 테이블 안의 아무 곳이나 클릭하여 테이블 분석 도구를 활성화합니다.
  4. 표 도구(Table Tools) 메뉴에서 분석(Analyze) 탭을 선택하여 테이블 분석 도구(Table Analysis Tools) 리본을 엽니다.
  5. **예제로 채우기(Fill From Example)**를 클릭하여 마법사를 시작합니다.
  6. 예제로 채우기(Fill From Example) 대화 상자에서 이 도구는 Null 값이나 누락된 값이 가장 많은 열을 자동으로 선택합니다. 여기서는 High Value Customer가 선택됩니다. 다른 열을 사용하려면 목록에서 다른 열을 선택하면 됩니다.
  7. **분석에 사용할 열 선택(Choose columns to be used for analysis)**을 클릭합니다. 이 도구는 분석에 사용할 열을 권장해 주지만 이러한 권장 사항을 무시하고 다른 열을 선택할 수 있습니다. 예를 들어 IncomeAge와 누락된 값이 있는 열 간에 인과관계가 있다는 사실을 경험을 통해 아는 경우 목록에서 다른 열을 선택 취소하여 더 나은 결과를 얻을 수 있습니다.
    입력으로 어떤 열을 추가해야 할지 잘 모르는 경우에는 모든 열을 추가할 수 있습니다. 여기서는 ID를 제외하고 모든 열을 추가하겠습니다.
  8. **확인(OK)**을 클릭합니다.
  9. **실행(Run)**을 클릭합니다. 새 워크시트에 보고서가 표시됩니다.
    패턴이 검색된 경우 누락된 값이 예제로 채우기(Fill From Example) 워크시트에서 자동으로 채워집니다.

보고서 작업

패턴 보고서는 누락된 값을 채우는 데 사용된 규칙을 설명합니다. 각 영향 요인 또는 규칙이 열, 해당 열의 값, 예측에 대한 규칙의 상대적 영향 조합으로 설명되어 있습니다.

**상대적 영향(Relative Impact)**은 음영 처리된 막대로 표시됩니다. 막대가 길수록 이 규칙이 채워지는 값을 예측할 확률이 높아집니다.

즉, High Value Customer의 경우 Pacific 지역은 No로 강력히 예측되고 2-5 mile 통근 거리는 Yes로 강력히 예측됩니다.

이 도구는 원래 데이터 테이블에 High Value Customer_Extended라는 새 열도 추가합니다.

  1. 예제로 채우기(Fill From Example) 워크시트로 돌아갑니다.
  2. 새로운 High Value Customer_Extended 열로 스크롤합니다.
    워크시트의 모든 행에 대해 예측 값이 채워진 것을 확인할 수 있습니다. 이러한 값은 데이터에서 검색된 패턴을 기반으로 합니다. 학습에 사용된 원래 열도 계속 남아 있습니다.
  3. 고객 값을 기준으로 행을 정렬하겠습니다.

결론

이것으로 예제로 채우기 비디오 자습서를 마칩니다. 테이블 분석 도구에 대한 추가 도움말은 다른 테이블 분석 도구 비디오 자습서를 보거나 데이터 마이닝 추가 기능에 포함된 도움말 문서를 참조하는 것이 좋습니다. 이 자습서를 시청해 주셔서 감사합니다.