아티클
09/27/2010

새로운 기능(Analysis Services - 데이터 마이닝)

MicrosoftSQL ServerAnalysis Services의 최신 릴리스에서는 새 기능과 향상된 기능을 제공합니다.

홀드아웃 테스트 집합 만들기

마이닝 구조를 만들 때 이제 마이닝 구조의 데이터를 학습 집합과 테스트 집합으로 나눌 수 있습니다. 파티션 정의는 구조와 함께 저장되므로 해당 구조를 기반으로 하는 다른 모든 마이닝 모델에서 학습 및 테스트 집합을 다시 재사용할 수 있습니다.

데이터는 학습 파티션과 테스트 파티션으로 무작위 분할되지만 파티션을 다시 만들어야 하는 경우 파티션을 만들 때 사용할 초기값을 지정할 수 있습니다.

테스트 집합의 크기는 총 행 수에 대한 백분율, 최대 행 수 또는 이러한 두 요구 사항을 결합하여 지정할 수 있습니다. 학습 및 테스트 데이터 집합을 사용하는 방법은 학습 및 테스트 집합으로 데이터 분할(Analysis Services - 데이터 마이닝)을 참조하십시오.

SQL Server 2008의 모델 유효성 검사 기능에 대한 자세한 내용은 데이터 마이닝 모델 유효성 검사(Analysis Services - 데이터 마이닝)를 참조하십시오.

모델 사례 필터링

마이닝 모델에 필터를 연결하고 학습 및 테스트 도중 이 필터를 적용할 수 있습니다. 모델에 필터를 적용하면 모델 학습에 사용되는 데이터를 제어할 수 있고 데이터의 하위 집합에 대한 모델의 성능을 보다 쉽게 평가할 수 있습니다.

예를 들어 수입이 특정 수준 이상인 고객에 대해서만 대상 메일 모델의 정확도를 파악하려는 경우 리프트 차트를 만들 때 마이닝 모델의 Income 열에 필터를 적용하여 해당되는 고객에 대한 결과만 볼 수 있습니다.

또한 Business Intelligence Development Studio는 사례 테이블과 중첩 테이블에 모두 적용할 수 있는 복잡한 조건을 작성하는 데 도움이 되는 새로운 필터 편집기를 제공합니다.

마이닝 모델 필터를 만드는 방법은 마이닝 모델에 대한 필터 만들기(Analysis Services - 데이터 마이닝)를 참조하십시오.

마이닝 모델 테스트를 위한 데이터 필터링에 대한 자세한 내용은 모델 정확도 차트용 도구(Analysis Services - 데이터 마이닝)를 참조하십시오.

여러 마이닝 모델의 교차 유효성 검사

교차 유효성 검사는 데이터 마이닝 모델의 정확도 평가에 널리 사용되는 방법입니다. 교차 유효성 검사에서는 마이닝 구조 데이터를 하위 집합으로 반복적으로 분할하고, 이러한 하위 집합을 기반으로 모델을 작성한 다음 각 파티션에 대한 모델의 정확도를 측정합니다. 반환되는 통계를 검토하면 마이닝 모델의 신뢰성을 판단하고 동일한 구조를 기반으로 하는 모델을 보다 쉽게 비교할 수 있습니다.

교차 유효성 검사는 데이터 마이닝 디자이너의 마이닝 정확도 차트 뷰에서 사용할 수 있습니다. 또한 Analysis Services 저장 프로시저를 사용하여 마이닝 구조를 분할하고 여러 마이닝 모델을 테스트하고 분석을 생성할 수 있습니다.

SQL Server 2008에서 교차 유효성 검사 보고서를 생성하려면 마이닝 구조와 예측 가능한 특성을 지정하고, 사례 데이터를 나눌 접기 수를 지정합니다.

Analysis Services는 개별 파티션에 대한 가능성 또는 제곱 평균 오차, 집계 모델에 대한 모든 측정값의 평균 및 표준 편차와 같은 통계를 보고하는 테이블을 반환합니다. 자세한 내용은 교차 유효성 검사(Analysis Services - 데이터 마이닝)를 참조하십시오.

Office 2007용 데이터 마이닝 추가 기능에 대한 지원

SQL Server 2008에서는 Office 2007용 SQL Server 2008 데이터 마이닝 추가 기능을 통해 Microsoft Excel에서 데이터 마이닝 모델을 만들고 관리하고 사용할 수 있습니다. 널리 사용되는 이 무료 추가 기능의 최신 버전은 장바구니 분석과 인쇄 가능한 예측 계산기 등의 몇 가지 새로운 분석 도구, 교차 유효성 검사 및 서버측 학습 및 테스트 파티션에 대한 지원 기능 추가를 통해 기능이 향상되었습니다.

모델 문서화 마법사를 사용하여 SQL Server 2008의 인스턴스에 저장된 구조와 모델에 대한 문서를 쉽게 만들 수도 있습니다. 추가 기능에 대한 자세한 내용은 Office 2007용 데이터 마이닝 추가 기능(Data Mining Add-ins for Office 2007)을 참조하십시오.

향상된 Microsoft 시계열 알고리즘

시계열 모델에서 일부 예측의 정확도와 안정성을 개선하기 위해 새로운 알고리즘이 Microsoft 시계열 알고리즘에 추가되었습니다. 익히 알려진 ARIMA 알고리즘을 기반으로 하는 이 새로운 알고리즘은 Analysis Services에 사용되는 ARTxp 알고리즘에 비해 더 우수한 장기 예측을 제공합니다. (ARTxp는 하나의 시간 조각 또는 단기 예측에 최적화된 자동 회귀 트리 알고리즘입니다.)

기본적으로 Microsoft 시계열 알고리즘의 새 구현에서는 모델의 한 버전은 ARTxp 알고리즘으로, 다른 버전은 ARIMA 알고리즘으로 학습시킵니다. 그런 다음 사용자가 선호하는 예측 특징을 제공하기 위해 이러한 두 모델의 결과에 가중치를 부여합니다. 이러한 기본 구현을 사용하지 않으려면 Microsoft 시계열 알고리즘에서 ARTxp 또는 ARIMA 알고리즘만 사용하도록 지정하면 됩니다. SQL Server 2008 Enterprise에서는 알고리즘의 사용자 지정 가중치를 지정하여 변화하는 시간 범위에서 최적의 예측을 제공할 수 있습니다.

Microsoft 시계열 알고리즘은 예측 중에도 데이터를 받으므로 새로운 비즈니스 시나리오의 구현이 가능합니다. 예를 들어 제품, 지역 집계 또는 기타 폭넓은 데이터 집합에 걸친 평균을 기반으로 수익 예측 모델을 만들 수 있습니다. 그런 다음 개별 제품의 판매량을 표시하는 시계열에 이 모델을 적용할 수 있습니다. 이러한 일반 모델을 적용함으로써 집계 데이터의 안정성과 가용성을 활용하고 개별 제품에 따라 예측을 사용자 지정할 수 있습니다.

또한 여러 계열을 사용하여 모델을 학습시킨 다음 이 모델을 새 데이터에 적용하여 “가정(what-if)” 시나리오를 예측할 수 있습니다.

시계열 마이닝 모델에 대한 자세한 내용은 Microsoft 시계열 알고리즘 및 PredictTimeSeries(DMX)를 참조하십시오.

구조 사례 및 구조 열로 드릴스루

SQL Server 2008에서 마이닝 구조에 드릴스루를 설정한 경우 마이닝 구조를 쿼리하여 학습과 테스트에 사용된 사례에 대한 세부 정보를 반환할 수 있습니다. 구조에 대한 드릴스루 쿼리는 DMX(Data Minding Extensions)를 사용하여 작성할 수 있습니다.

또한 마이닝 모델 및 관련된 마이닝 구조에 드릴스루가 설정된 경우에는 기본 마이닝 구조에서 데이터 열을 검색하는 쿼리를 작성할 수 있습니다. 이 기능은 특정 노드의 사례에 대한 자세한 정보를 검색하려는 경우 유용합니다. 예를 들어 특정 클러스터의 고객에 대한 계약 정보를 검색할 수 있습니다.

자세한 내용은 마이닝 모델 및 마이닝 구조에 드릴스루 사용(Analysis Services - 데이터 마이닝)을 참조하십시오.

마이닝 구조에 대한 DMX 쿼리의 예는 SELECT FROM <structure>.CASES를 참조하십시오.

모델에서 구조 데이터로의 드릴스루에 대한 예는 SELECT FROM <model>.CASES(DMX)를 참조하십시오.

마이닝 모델 열 별칭 지정

이제 마이닝 모델의 열에 별칭을 추가하여 보다 쉽게 열 내용을 이해하고 DMX 문에서 열을 참조할 수 있습니다.

예를 들어 동일한 데이터의 연속 버전과 불연속 버전을 포함하는 마이닝 구조를 만드는 경우 두 열에 같은 이름을 지정하면 손쉽게 비교할 수 있습니다.

별칭을 관리하고 보는 방법은 마이닝 모델에서 속성 설정 또는 방법: 모델 열의 별칭 만들기를 참조하십시오.

DMX 문을 사용하여 열 별칭을 만드는 방법은 ALTER MINING STRUCTURE(DMX)를 참조하십시오.

데이터 마이닝 스키마 행 집합 쿼리

SQL Server 2008에는 기존 OLE DB 데이터 마이닝 스키마 행 집합 대부분이 DMX 문을 사용하여 쉽게 쿼리할 수 있는 시스템 테이블 집합으로 노출됩니다. 이 경우 모델 및 구조와 관련된 메타데이터 검색, 마이닝 모델 콘텐츠에서 정보 추출 또는 Analysis Services 인스턴스 또는 서비스 모니터링 작업을 쉽게 수행할 수 있습니다.

자세한 내용은 데이터 마이닝 스키마 행 집합 쿼리(Analysis Services - 데이터 마이닝)를 참조하십시오.

새 예제 위치

온라인 설명서에는 더 이상 SQL Server 예제 데이터베이스와 예제 응용 프로그램이 포함되어 있지 않습니다. 이 예제 데이터베이스와 예제 응용 프로그램은 이제 SQL Server 예제 웹 사이트에서 구할 수 있습니다. 이 웹 사이트에서는 예제를 보다 쉽게 찾을 수 있고 MicrosoftSQL Server 및 Business Intelligence와 관련된 새로운 예제를 제공합니다. SQL Server 예제 웹 사이트에서 다음을 수행할 수 있습니다.

Microsoft MVP(최고 전문가) 커뮤니티, 사용자 및 개발자가 제공하는 예제 찾아보기
예제 데이터베이스 및 코드 프로젝트 다운로드
문제를 보고하고 각 기술 영역 예제에 대해 질문할 수 있는 토론 영역 확인 또는 참여

SQL Server 2005 Analysis Services와 함께 설치

SQL Server 2008 이제 SQL Server 2008Analysis Services를 SQL Server 2005 Analysis Services(SSAS)와 함께 설치할 수 있습니다. 자세한 내용은 여러 버전 및 인스턴스의 SQL Server 작업을 참조하십시오.

두 버전을 함께 설치할 경우 Analysis Services에 미치게 되는 주요 영향에 대해서는 이 릴리스와 함께 제공되는 추가 정보 파일을 참조하십시오.

Analysis Services 데이터베이스 백업 및 복원

Analysis Services 데이터베이스의 백업 및 복원 기능이 향상되었습니다. 데이터베이스의 크기에 대한 제한이 완화되었으며 작업을 백업하고 복원하는 데 필요한 시간이 크게 줄었습니다.

자세한 내용은 새로운 기능(Analysis Services - 다차원 데이터베이스)을 참조하십시오.

Analysis Services의 다른 향상된 기능

Analysis Services를 사용하여 데이터 마이닝에도 사용할 OLAP 큐브를 만드는 경우 차원 및 관련 계층과 특성을 훨씬 더 쉽게 디자인할 수 있게 되었습니다. 차원 디자이너에 포함된 새로운 특성 관계 디자이너를 사용하면 특성 관계를 보다 쉽게 디자인하고 특성 관계가 최상의 방법에 부합하도록 할 수 있습니다.