다음을 통해 공유


예외 강조 표시 비디오 자습서(데이터 마이닝 테이블 분석 도구)

적용 대상: Microsoft SQL Server Analysis Services

작성자: Michele Hart, Microsoft Corporation

내레이터: Mary Brennan, Microsoft Corporation

시간: 00:4:28

크기: 19,479KB

형식: WMV 파일

이 비디오 보기

관련 도움말 항목:

데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

추가 비디오:

테이블 분석 도구 시작(SQL Server 비디오)

주요 영향 요인 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

범주 검색 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예제로 채우기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예측 비디오 자습서(데이터 마이닝 테이블 분석 도구)

예측 계산기 비디오 자습서(데이터 마이닝 테이블 분석 도구)

시나리오 분석 – 목표 검색 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시나리오 분석 – 가상(What-If) 비디오 자습서(Excel용 데이터 마이닝 추가 기능)

시장 바구니 분석 비디오 자습서(데이터 마이닝 테이블 분석 도구)

비디오 요약

이 자습서에서는 Excel 2007용 예외 강조 표시 테이블 분석 도구를 사용하는 방법에 대해 설명합니다.

비디오 대본

소개

안녕하세요, 메리 브레넌입니다. 저는 Microsoft SQL Server의 테크니컬 라이터입니다. 이 비디오에서는 예외 강조 표시 도구를 처음 사용하는 데 도움이 되는 방법에 대해 살펴보겠습니다. 예외 강조 표시 도구는 Microsoft 클러스터링 알고리즘과 패턴 분석 기능을 사용하여 데이터 집합에서 불규칙한 값을 찾습니다. 이러한 값은 대부분의 다른 값이 포함된 범위를 벗어난 값이거나, 누락된 값이거나, 심지어는 잘못된 값일 수 있으며 분석 작업의 질에 영향을 줄 수 있습니다. 예외 강조 표시 도구를 사용하면 이러한 값을 찾아 후속 작업이 필요한지 검토할 수 있습니다.

Excel 데이터 테이블에 있는 전체 데이터 범위에 대해 예외 강조 표시 도구를 사용하거나 몇 가지 열만 선택할 수 있습니다. 데이터의 가변성을 제어하는 임계값을 조정하여 더 많은 예외를 찾거나 더 적은 예외를 찾을 수도 있습니다.

이 자습서에서는 예외 강조 표시 도구를 사용하여 비정상적인 데이터를 식별하겠습니다. 이러한 비정상적인 값을 "이상값"이라고 합니다. 이러한 값은 데이터 입력 오류로 인해 발생하는 값이거나 추가적인 분석을 요하는 진짜 비정상 값일 수 있습니다. 식별 작업 후에는 이상값을 검토하고 수정하며, 마지막 단계에서는 예외 임계값을 조정하여 이상값을 가장 중요한 값으로 제한하겠습니다.

마법사 작업

  1. 먼저 테이블 분석 도구 샘플(Table Analysis Tools Sample) 탭을 선택하고 테이블 안을 아무 곳이나 클릭하여 테이블 분석 도구를 활성화합니다.
  2. 테이블 도구(Table Tools) 메뉴에서 분석(Analyze) 탭을 선택하여 테이블 분석 도구(Table Analysis Tools) 리본을 엽니다.
  3. **예외 강조 표시(Highlight Exceptions)**를 두 번 클릭하여 마법사를 시작합니다.
  4. 열 선택(Column Selection) 창에서 예외가 있는지 확인하기 위해 분석하려는 열을 선택합니다. 정보가 빈약하거나 패턴을 만드는 데 유용할 것으로 판단되지 않는 입력 열은 선택 취소합니다. 예를 들어 값 중 상당수가 누락되었거나 0인 열을 선택 취소하거나 이름 또는 ID 번호와 같은 고유한 값이 포함된 열을 선택 취소할 수 있습니다.
  5. **실행(Run)**을 클릭합니다. 새 워크시트에 보고서가 표시됩니다.

보고서 작업

이상값 워크시트에는 분석 작업을 수행한 각 열에서 찾은 이상값 수를 요약하는 보고서가 표시됩니다. 이 도구는 원래 데이터 테이블에 있는 예외도 강조 표시합니다.

이 예에서는 예외 임계값을 초과하는 34개의 이상값이 검색되었으며 이러한 값 중 대부분이 Children 열과 Cars 열에 있습니다. 예제 데이터를 다시 살펴보면 이러한 이상값을 쉽게 검색할 수 있습니다. 어두운 강조 표시는 주의가 필요한 행을 나타내고 밝은 강조 표시는 해당 셀의 값이 주의 대상으로 식별되었음을 나타냅니다.

  1. 테이블 분석 도구 샘플(Table Analysis Tools Sample) 워크시트에서 Age 열을 내림차순으로 정렬합니다.
    세 번째 행과 여섯 번째 행 모두에 나이를 기반으로 하는 이상값이 있습니다. 78세에 $100,000를 벌고 자전거를 구매한 것이 조금 이상해 보입니다.
  2. 이상값 17657로 스크롤합니다. 여기에 실수가 있으며 이 30세 고객에게 자녀가 두 명만 있다는 사실을 발견합니다.
  3. 값을 4에서 2로 변경합니다. 새 값이 즉시 분석되고 이제 해당 값이 예상 범위 안에 포함되므로 강조 표시가 제거됩니다.
  4. 강조 표시된 셀을 검토한 후 요약 보고서로 돌아가 **예외 임계값(Exception threshold value)**을 변경하여 이상값 수를 줄입니다. 초기 예외 임계값은 항상 75입니다. 이는 강조 표시된 데이터가 잘못될 확률이 알고리즘을 통해 75%로 계산되었음을 의미합니다. 그러나 여기서 보고 싶은 것은 가장 중요한 이상값뿐입니다.
    따라서 **예외 임계값(Exception threshold)**을 90으로 늘립니다. 그러면 예외 수가 7개로 줄어듭니다. 원본 워크시트로 돌아가면 이제 7개의 행만 강조 표시되어 있는 것을 확인할 수 있습니다.

결론

이것으로 예외 강조 표시 비디오 자습서를 마칩니다. 테이블 분석 도구에 대한 추가 도움말은 다른 테이블 분석 도구 비디오 자습서를 보거나 데이터 마이닝 추가 기능에 포함된 도움말 문서를 참조하는 것이 좋습니다. 이 자습서를 시청해 주셔서 감사합니다.