데이터 마이닝 작업

데이터 마이닝을 통해 어려운 비즈니스 문제에 대해 논리적 결정을 내리는 데 필요한 정보에 액세스할 수 있습니다. Microsoft SQL Server 2005 Analysis Services(SSAS)에서는 데이터 마이닝에 필요한 도구를 제공하며 이러한 도구로 데이터의 규칙 및 패턴을 식별하여 인과 관계를 밝히고 추후 발생할 일을 예측할 수 있습니다. Analysis Services에서 데이터 마이닝 솔루션을 만들려면 먼저 비즈니스 문제를 설명하는 모델을 만든 다음 데이터의 수학적 모델을 생성하는 알고리즘을 통해 데이터를 실행합니다. 이를 모델 성향 습득 프로세스라고 합니다. 그런 다음 마이닝 모델을 시각적으로 탐색하거나 이에 대한 예측 쿼리를 만들 수 있습니다. Analysis Services는 관계형 데이터베이스의 데이터 집합과 OLAP 데이터베이스의 데이터 집합을 모두 사용할 수 있으며 해당 데이터를 조사하는 데 사용할 수 있는 다양한 알고리즘을 포함합니다. 데이터 마이닝 프로세스에 대한 보다 자세한 개요는 데이터 마이닝 개념을 참조하십시오.

SQL Server 2005에서는 데이터 마이닝에 사용할 수 있는 다양한 환경 및 도구를 제공합니다. 다음 섹션에서는 데이터 마이닝 솔루션을 만드는 일반적인 프로세스를 개괄적으로 설명하고 각 단계에 사용할 리소스를 식별합니다.

Analysis Services 프로젝트 만들기

데이터 마이닝 솔루션을 만들려면 먼저 새 Analysis Services 프로젝트를 만든 다음 프로젝트에 대한 데이터 원본 및 데이터 원본 뷰를 추가 및 구성해야 합니다. 데이터 원본은 마이닝 모델의 기반으로 할 데이터 원본에 연결할 때 사용하는 연결 문자열 및 인증 정보를 정의합니다. 데이터 원본 뷰는 데이터 원본을 추상적으로 보여 주며 이를 통해 데이터의 구조를 수정하여 프로젝트에 보다 적절한 구조를 만들 수 있습니다.

참조 항목:Analysis Services 프로젝트 정의, 데이터 원본 마법사를 사용하여 데이터 원본 정의, 데이터 원본 뷰 마법사를 사용하여 데이터 원본 뷰 정의

Analysis Services 프로젝트에 마이닝 구조 추가

Analysis Services 프로젝트를 만든 다음에는 마이닝 구조 및 각 구조를 기반으로 하는 하나 이상의 마이닝 모델을 추가할 수 있습니다. 테이블 및 열을 포함하는 마이닝 구조는 프로젝트의 기존 데이터 원본 뷰 또는 OLAP 큐브에서 파생됩니다. 새 마이닝 구조를 추가하면 데이터 마이닝 마법사가 시작되며 이를 통해 구조를 정의하고 해당 구조를 기반으로 하는 초기 모델을 만드는 데 사용할 알고리즘 및 성향 습득 데이터를 지정할 수 있습니다.

참조 항목:새 마이닝 구조 만들기, 데이터 마이닝 알고리즘, 데이터 마이닝 마법사

데이터 마이닝 디자이너의 마이닝 구조 탭을 사용하여 열 및 중첩 테이블을 추가하는 등 기존 마이닝 구조를 수정할 수 있습니다.

참조 항목:데이터 마이닝 디자이너

데이터 마이닝 모델 작업

정의한 마이닝 모델을 사용하려면 Analysis Services에서 알고리즘을 통해 성향 습득 데이터를 전달하여 모델을 채울 수 있도록 먼저 해당 마이닝 모델을 처리해야 합니다. Analysis Services에서는 처리할 개체 및 처리 방법을 제어하는 기능을 포함하여 마이닝 모델 개체 처리에 대한 여러 옵션을 제공합니다.

참조 항목:Analysis Services에서의 처리, 데이터 마이닝 개체 처리

모델을 처리한 다음에는 결과를 조사하여 가장 적합한 모델을 결정할 수 있습니다. Analysis Services에서는 데이터 마이닝 디자이너의 마이닝 모델 뷰어 탭에 각 마이닝 모델 유형에 대한 뷰어를 제공하며 이를 사용하여 마이닝 모델을 탐색할 수 있습니다. 또한 Analysis Services에서는 디자이너의 마이닝 정확도 차트 탭에 마이닝 모델을 직접 비교하여 가장 적합한 마이닝 모델을 선택하는 데 사용할 수 있는 도구를 제공합니다. 이러한 도구에는 리프트 차트, 수익 차트 및 분류 행렬이 포함됩니다.

참조 항목:데이터 마이닝 모델 보기, 데이터 마이닝 모델 유효성 검사

예측 만들기

대부분의 데이터 마이닝 프로젝트의 주 목적은 마이닝 모델을 사용하여 예측을 만드는 것입니다. 마이닝 모델을 탐색 및 비교한 다음에는 여러 도구 중 하나를 사용하여 예측을 만들 수 있습니다. Analysis Services에서는 예측 만들기의 기본이 되는 DMX(Data Mining Extensions)라는 쿼리 언어를 제공합니다. DMX 예측 쿼리 생성을 돕기 위해 SQL Server에서는 SQL Server Management Studio 및 Business Intelligence Development Studio에서 사용할 수 있는 쿼리 작성기를 제공하고 Management Studio의 쿼리 편집기에서 사용할 수 있는 DMX 템플릿을 제공합니다. BI Development Studio의 데이터 마이닝 디자이너에 있는 마이닝 모델 예측 탭에서 쿼리 작성기에 액세스합니다.

참조 항목:DMX 예측 쿼리 만들기, DMX(데이터 마이닝 확장) 문 참조

SQL Server Management Studio

BI Development Studio를 사용하여 데이터 마이닝 프로젝트에 대한 마이닝 모델을 작성한 다음에는 Management Studio에서 모델 관리 및 관련 작업을 수행하고 예측을 만들 수 있습니다.

참조 항목:SQL Server Management Studio에서 데이터 마이닝

SQL Server Reporting Services

마이닝 모델을 만든 다음 그 결과를 보다 많은 관계자에게 배포하려는 경우 Microsoft SQL Server 2005 Reporting Services(SSRS)의 보고서 디자이너를 사용하여 보고서를 만든 다음 이를 사용하여 마이닝 모델에 포함된 정보를 제공할 수 있습니다. DMX 쿼리의 결과를 기반으로 보고서를 만들고 Reporting Services에서 사용할 수 있는 매개 변수화 및 서식 지정 기능을 사용할 수 있습니다.

참조 항목:보고서 디자이너 작업, Analysis Services DMX 쿼리 디자이너 사용

프로그래밍 방식으로 데이터 마이닝 작업

Analysis Services에서는 프로그래밍 방식으로 데이터 마이닝 작업을 할 때 사용할 수 있는 여러 도구를 제공합니다. DMX(Data Mining Extensions) 언어는 데이터 마이닝 모델 생성, 성향 습득 및 사용에 활용할 수 있는 문을 제공합니다. XMLA(XML for Analysis)와 ASSL(Analysis Services Scripting Language)을 조합하여 사용하거나 AMO(Analysis Management Objects)를 사용하여 이러한 작업을 수행할 수도 있습니다.

데이터 마이닝 스키마 행 집합을 사용하여 데이터 마이닝에 연결된 모든 메타데이터에 액세스할 수 있습니다. 예를 들어 스키마 행 집합을 사용하여 알고리즘이 지원하는 데이터 형식 또는 데이터베이스에 있는 모델 이름을 확인할 수 있습니다.

참조 항목:DMX(데이터 마이닝 확장) 참조, Data Mining Schema Rowsets, Analysis Services Administration Programming (SSAS), Using XML for Analysis in Analysis Services (XMLA)

참고 항목

개념

Analysis Services 솔루션 및 프로젝트 개발
데이터 마이닝 개념
마이닝 구조(Analysis Services)
SQL Server Analysis Services

관련 자료

DMX(데이터 마이닝 확장) 참조
Business Intelligence Development Studio 소개
SQL Server Management Studio 및 Business Intelligence Development Studio

도움말 및 정보

SQL Server 2005 지원 받기