주요 영향 요인 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

적용 대상: Microsoft SQL Server Analysis Services

작성자: 미셸 하트, Microsoft Corporation

내레이터: 메리 브레넌, Microsoft Corporation

시간: 4분 48초

크기: 6,892KB

형식: WMV 파일

이 비디오 보기

관련 도움말 항목:

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

추가 비디오:

테이블 분석 도구 시작(SQL Server 비디오)

범주 검색 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예제로 채우기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예측 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예외 강조 표시 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예측 계산기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

시나리오 분석 – 목표 검색 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시나리오 분석 – 가상(What-If) 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시장 바구니 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

비디오 요약

이 자습서에서는 Excel 2007용 주요 영향 요인 분석 테이블 분석 도구를 사용하는 방법에 대해 설명합니다.

비디오 대본

소개

안녕하세요, 메리 브레넌입니다. 저는 Microsoft SQL Server의 테크니컬 라이터입니다.

주요 영향 요인 분석 도구는 Microsoft 클러스터링 알고리즘을 사용하여 사용자가 원하는 결과 또는 대상 값이 포함된 열을 선택한 다음 데이터의 패턴을 분석하여 해당 결과에 가장 큰 영향을 미친 요인을 확인할 수 있도록 합니다. 예를 들어 각 고객의 전년도 총 구매량을 보여 주는 열이 포함된 고객 목록이 있는 경우 테이블을 분석하여 최상위 구매자들이 공통적으로 가지는 특징을 확인할 수 있습니다.

이 도구를 사용하면 가능한 결과 쌍을 선택하여 비교할 수도 있습니다. 예를 들어 예측하는 열에 Purchase = 예(Yes), Purchase = 아니요(No) 또는 Purchase = Yes but not now와 같은 불연속 값이 포함된 경우에는 즉시 구매하는 고객과 나중에 구매하는 고객을 비교하고 나중에 구매하는 고객과 구매하지 않는 고객을 비교할 수 있습니다. 이렇게 하면 구매에 영향을 미치는 중요한 요인을 확인하는 데 도움이 됩니다.

이 자습서에서는 자전거 구매를 결정하는 데 영향을 미치는 요인을 찾아보겠습니다. 요인을 찾은 다음에는 해당 정보를 사용하여 제품을 구매할 가능성이 가장 높은 고객을 식별할 수 있습니다.

마법사 작업

  1. 먼저 테이블 분석 도구 샘플(Table Analysis Tools Sample) 탭을 선택하고 테이블 안을 아무 곳이나 클릭하여 테이블 분석 도구를 활성화합니다.
  2. 테이블 도구(Table Tools) 메뉴에서 분석(Analyze) 탭을 선택하여 테이블 분석 도구(Table Analysis Tools) 리본을 엽니다.
  3. **주요 영향 요인 분석(Analyze Key Influencers)**을 두 번 클릭하여 마법사를 시작합니다.
  4. 마법사 대화 상자에서 분석할 열을 선택합니다. 마법사에서는 기본적으로 워크시트의 첫 번째 열이 자동으로 선택되지만 여기서는 자전거 구매에 대해 살펴보려고 합니다. 지금 **실행(Run)**을 클릭하면 모든 열에 대해 분석이 수행되므로 대신
  5. **분석에 사용할 열 선택(Choose columns to be used for analysis)**을 클릭합니다. 고급 열 선택(Advanced Columns Selection) 대화 상자에서 자전거 매출에 가장 큰 영향을 미칠 것으로 판단되는 열을 선택합니다. 여기서는 결혼 여부(Marital Status), 소유 자동차 수(Number of Cars Owned), 지역(Region) 및 **성별(Gender)**이 자전거 매출에 미치는 영향을 알아보겠습니다. 분석을 간소화하면 성능과 정확도를 높일 수 있습니다.
  6. 실행을 클릭합니다. 패턴이 검색되면 마법사는 새 워크시트에 이러한 패턴을 보여 주는 보고서를 만듭니다. 보고서의 이름은 **<Purchased Bike>에 대한 주요 영향 요인(Key Influencers for <Purchased Bike> )**입니다. 패턴이 검색되지 않은 경우 마법사는 문제에 대한 설명이 포함된 새 워크시트를 만듭니다.

보고서 작업

Purchased Bike에 대한 주요 영향 요인(Key Influencers for Purchased Bike) 보고서를 엽니다. 테이블에 각 결과와 관련된 요인이 보고되며 관련성에 대한 확률이 그래픽으로 표시됩니다.

  1. 결과에서 첫 번째로 주목할 점은 자전거 구매에 큰 영향을 주지 않는 **성별(Gender)**이 나열되지 않았다는 점입니다.
  2. 결과는 각각의 가능한 Purchased Bike 값에 대해 가장 영향이 큰 요인에서 가장 영향이 작은 요인 순으로 나열됩니다. 자전거를 구매하지 않도록 하는 가장 큰 요인은 두 대의 차를 보유한 경우이고 자전거를 구매하도록 하는 가장 큰 요인은 차를 보유하지 않은 경우입니다.
  3. 이제 이 보고서를 더욱 세부적으로 조정하여 결과를 심도 있게 살펴보겠습니다. 주요 영향 요인을 기반으로 한 판별(Discrimination based on key influencers) 대화 상자에서 가능한 각 결과를 비교하는 새 보고서를 만들 수 있습니다. 새 보고서를 만들기 위해 결과를 필터링하고 모델로 드릴다운하여 고유한 특성을 찾아내고 두 주요 영향 요인 간의 차이점을 강조하는 작업을 수행하도록 하겠습니다. 이 경우에는 YesNo의 두 가지만 있습니다.
  4. **보고서 추가(Add Report)**를 클릭합니다.
    마법사가 요인 비교 쌍 각각에 대해 새 테이블을 만듭니다. 이 경우 2개의 값밖에 없으므로 이 테이블은 같은 데이터를 다른 시각으로 본 것입니다.
  5. 비교를 마치면 **닫기(Close)**를 클릭합니다.

이 자습서에서는 Yes와 No라는 2개의 값만 있는 열을 살펴보았습니다. 보다 복잡한 예에서는 많은 값이 있는 결과에 대한 영향 요인을 분석할 수 있습니다. 예를 들어 Number of Bikes Purchased0, 1, 2, 3, 4 등의 값이 있을 수 있습니다. 또는 동일한 데이터베이스를 사용하여 **지역(Region)**에 대한 주요 영향 요인을 살펴보고 태평양(Pacific) 및 **북아메리카(North America)**를 드릴다운하여 비교할 수 있습니다.

결론

이것으로 주요 영향 요인 분석 비디오 자습서를 마칩니다. 테이블 분석 도구에 대한 추가 도움말은 다른 테이블 분석 도구 비디오 자습서를 보거나 Excel용 데이터 마이닝 추가 기능에 포함된 도움말 문서를 참조하는 것이 좋습니다. 이 자습서를 시청해 주셔서 감사합니다.