새로운 기능(Analysis Services - 데이터 마이닝)

[!참고]

SQL Server 2008 R2의 경우 이 항목에 나열된 내용에 대해 변경 사항이 없습니다.

Microsoft SQL Server Analysis Services의 최신 버전에서는 새로운 기능과 향상된 기능을 제공합니다. 새로운 in-memory 분석 기능과 Analysis Services용 SharePoint 통합 모드에 대한 자세한 내용은 PowerPivot for SharePoint를 참조하십시오.

Office 2007용 데이터 마이닝 추가 기능과의 호환성

SQL Server 2008 R2에서는 Office 2007용 SQL Server 2008 데이터 마이닝 추가 기능을 통해 Microsoft Excel에서 데이터 마이닝 모델을 만들고 관리하고 사용할 수 있습니다. 널리 사용되는 이 무료 추가 기능 버전을 사용하여 SQL Server 2008 R2 또는 SQL Server 2008이 실행되고 있는 Analysis Services 인스턴스에 연결할 수 있습니다. PowerPivot for Excel에서 만들어진 메모리 내 다차원 데이터 집합을 직접 사용할 수는 없습니다.

PowerPivot for Excel 2010과의 호환성

데이터 마이닝 추가 기능을 PowerPivot for Excel 추가 기능과 같은 컴퓨터에 설치하고 같은 Excel 2010 통합 문서 내에서 사용할 수 있습니다. 그러나 데이터 마이닝 추가 기능을 사용하려면 32비트 버전의 Excel 2010이 설치되어 있어야 합니다. PowerPivot 클라이언트는 32비트 또는 64비트 버전의 Excel 2010에서 실행될 수 있습니다.

추가 기능에 대한 자세한 내용은 Office 2007용 데이터 마이닝 추가 기능(Data Mining Add-ins for Office 2007)을 참조하십시오.

새 예제 및 리소스

온라인 설명서에는 더 이상 SQL Server 예제 데이터베이스와 예제 응용 프로그램이 포함되어 있지 않습니다. 이 예제 데이터베이스와 예제 응용 프로그램은 이제 SQL Server 예제 웹 사이트에서 구할 수 있습니다. 이 웹 사이트에서는 예제를 보다 쉽게 찾을 수 있고 Microsoft SQL Server 및 Business Intelligence와 관련된 새로운 예제를 제공합니다. SQL Server 예제 웹 사이트에서 다음을 수행할 수 있습니다.

  • Microsoft MVP(최고 전문가) 커뮤니티, 사용자 및 개발자가 제공하는 예제 찾아보기

  • 예제 데이터베이스 및 코드 프로젝트 다운로드

  • 문제를 보고하고 각 기술 영역 예제에 대해 질문할 수 있는 토론 영역 확인 또는 참여

  • Analysis Services의 새 SharePoint 통합 인스턴스 및 PowerPivot 클라이언트를 사용하는 추가 예제는 PowerPivot.com 사이트에서 찾을 수 있습니다.

SQL Server 2008의 데이터 마이닝 기능

SQL Server 2008의 R2 릴리스에서는 SQL Server 2008에 새로 추가된 다음 기능을 지원합니다.

홀드아웃 테스트 집합 만들기

마이닝 구조를 만들 때 이제 마이닝 구조의 데이터를 학습 집합과 테스트 집합으로 나눌 수 있습니다. 파티션 정의는 구조와 함께 저장되므로 해당 구조를 기반으로 하는 모든 마이닝 모델에서 학습 집합과 테스트 집합을 다시 사용할 수 있습니다.

학습 및 테스트 데이터 집합을 사용하는 방법은 학습 및 테스트 집합으로 데이터 분할(Analysis Services - 데이터 마이닝)을 참조하십시오.

SQL Server 2008의 모델 유효성 검사 기능에 대한 자세한 내용은 데이터 마이닝 모델 유효성 검사(Analysis Services - 데이터 마이닝)를 참조하십시오.

모델 사례 필터링

마이닝 모델에 필터를 연결하고 학습 및 테스트 도중 이 필터를 적용할 수 있습니다. 모델에 필터를 적용하면 모델 학습에 사용되는 데이터를 제어할 수 있고 데이터의 하위 집합에 대한 모델의 성능을 보다 쉽게 평가할 수 있습니다.

마이닝 모델 필터를 만드는 방법은 마이닝 모델에 대한 필터 만들기(Analysis Services - 데이터 마이닝)를 참조하십시오.

마이닝 모델 테스트를 위한 데이터 필터링에 대한 자세한 내용은 모델 정확도 차트용 도구(Analysis Services - 데이터 마이닝)를 참조하십시오.

여러 마이닝 모델의 교차 유효성 검사

교차 유효성 검사는 데이터 마이닝 모델의 정확도 평가에 널리 사용되는 방법입니다. 교차 유효성 검사에서는 마이닝 구조 데이터를 하위 집합으로 반복적으로 분할하고, 이러한 하위 집합을 기반으로 모델을 작성한 다음 각 파티션에 대한 모델의 정확도를 측정합니다. 반환되는 통계를 검토함으로써 마이닝 모델의 신뢰성을 판단하고 동일한 구조를 기반으로 하는 모델을 보다 쉽게 비교할 수 있습니다.

자세한 내용은 교차 유효성 검사(Analysis Services - 데이터 마이닝)를 참조하십시오.

Microsoft 시계열 알고리즘 향상

시계열 모델에서 일부 예측의 정확도와 안정성을 개선하기 위해 새로운 알고리즘이 Microsoft 시계열 알고리즘에 추가되었습니다. 익히 알려진 ARIMA 알고리즘을 기반으로 하는 이 새로운 알고리즘은 Analysis Services에 사용되는 ARTxp 알고리즘에 비해 더 우수한 장기 예측을 제공합니다. ARTxp는 하나의 시간 조각 또는 단기 예측에 최적화된 자동 회귀 트리 알고리즘입니다.

시계열 마이닝 모델에 대한 자세한 내용은 Microsoft 시계열 알고리즘PredictTimeSeries(DMX)를 참조하십시오.

구조 사례 및 구조 열로 드릴스루

SQL Server 2008에서 마이닝 구조에 드릴스루를 설정한 경우 마이닝 구조를 쿼리하여 학습과 테스트에 사용된 사례에 대한 세부 정보를 반환할 수 있습니다. DMX(Data Mining Extensions)를 사용하여 구조에 대한 드릴스루 쿼리를 만들 수 있습니다.

자세한 내용은 마이닝 모델 및 마이닝 구조에 드릴스루 사용(Analysis Services - 데이터 마이닝)을 참조하십시오.

마이닝 구조에 대한 DMX 쿼리의 예는 SELECT FROM <structure>.CASES를 참조하십시오.

모델에서 구조 데이터로의 드릴스루에 대한 예는 SELECT FROM <model>.CASES(DMX)를 참조하십시오.

마이닝 모델 열 별칭 지정

이제 마이닝 모델의 열에 별칭을 추가하여 보다 쉽게 열 내용을 이해하고 DMX 문의 열을 참조할 수 있습니다.

별칭을 관리하고 보는 방법은 마이닝 모델에서 속성 설정 또는 방법: 모델 열의 별칭 만들기를 참조하십시오.

DMX 문을 사용하여 열 별칭을 만드는 방법은 ALTER MINING STRUCTURE(DMX)를 참조하십시오.

데이터 마이닝 스키마 행 집합 쿼리

SQL Server 2008에는 기존 OLE DB 데이터 마이닝 스키마 행 집합 대부분이 DMX 문을 사용하여 쉽게 쿼리할 수 있는 시스템 테이블 집합으로 노출됩니다. 이 경우 모델 및 구조와 관련된 메타데이터를 검색하는 작업이나 마이닝 모델 콘텐츠에서 정보를 추출하는 작업, Analysis Services 인스턴스 또는 서비스를 모니터링하는 작업을 쉽게 수행할 수 있습니다.

자세한 내용은 데이터 마이닝 스키마 행 집합 쿼리(Analysis Services - 데이터 마이닝)를 참조하십시오.

클러스터링 모델의 변경 내용

SQL Server 2008에서 Microsoft 클러스터링 알고리즘의 기본 구성은 기본적으로 z 점수 정규화를 사용하도록 변경되었습니다. 이 변경의 목적은 크기가 크고 이상값이 많을 수 있는 특성이 가져오는 영향을 최소화하는 것입니다. 일반적으로 z 점수 정규화는 클러스터링 결과를 개선하지만 비정규 분포에 대한 클러스터링 결과를 변경시킬 수 있습니다. 또한 이전 버전의 Analysis Services에서 SQL Server 2008 Analysis Services로 솔루션을 마이그레이션하는 고객은 클러스터링 모델이 이제 다른 결과를 생성하는 것을 확인할 수 있습니다. 자세한 내용은 Microsoft 클러스터링 알고리즘 기술 참조를 참조하십시오.

Analysis Services의 향상된 기능

Analysis Services를 사용하여 데이터 마이닝에도 사용할 OLAP 큐브를 만드는 경우 차원 및 관련 계층과 특성을 훨씬 더 쉽게 디자인할 수 있게 되었습니다. 차원 디자이너에 포함된 새로운 특성 관계 디자이너를 사용하면 특성 관계를 보다 쉽게 디자인하고 특성 관계가 최상의 방법에 부합하도록 할 수 있습니다.

자세한 내용은 새로운 기능(Analysis Services - 다차원 데이터베이스)을 참조하십시오.