솔루션 및 데이터 원본 만들기(중급 데이터 마이닝 자습서)

각 MicrosoftSQL ServerAnalysis Services 프로젝트에서는 단일 Analysis Services 데이터베이스에 있는 개체의 스키마를 정의합니다. Analysis Services 데이터베이스에는 마이닝 구조와 마이닝 모델, OLAP(온라인 분석 처리) 큐브 및 보조 개체(예: 데이터 원본 및 데이터 원본 뷰)가 포함됩니다.

Business Intelligence Development Studio를 사용하여 Analysis Services 프로젝트를 만들면 솔루션이 배포될 때까지 로컬 파일로 저장됩니다. 솔루션을 배포하면 Analysis Services에서 자동으로 프로젝트와 이름이 같은 새 데이터베이스를 만듭니다. 기본적으로 Analysis Services에서는 새 프로젝트에 대해 localhost 인스턴스를 사용합니다. 명명된 인스턴스를 사용하거나 기본 인스턴스에 대해 다른 이름을 지정한 경우에는 프로젝트의 배포 데이터베이스 속성을 데이터 마이닝 개체를 만들려는 위치로 변경해야 합니다.

데이터베이스를 만든 후에는 해당 데이터베이스를 검색하거나, 모델을 보거나, SQL Server Management Studio 또는 Business Intelligence Development Studio를 사용하여 예측을 만들 수 있습니다. AMO(Analysis Management Objects)를 사용하거나 Business Intelligence Development Studio에서 프로젝트 파일을 다시 열어 이 데이터베이스에 새로운 개체를 계속해서 추가할 수 있습니다. 또는 새 프로젝트를 만들고 해당 데이터베이스의 이름을 변경할 수 있습니다. 이렇게 하면 새 Analysis Services 데이터베이스를 만드는 대신 기존 데이터베이스를 다시 사용하고 이 데이터베이스에 새 데이터 마이닝 개체를 추가할 수 있습니다. 그러나 이 경우 프로젝트 속성에서 기존 데이터베이스를 업데이트할지, 아니면 덮어쓸지를 결정해야 합니다.

Analysis Services 프로젝트에 대한 자세한 내용은 Analysis Services 프로젝트 정의를 참조하십시오.

이 자습서에 사용할 새 Analysis Services 프로젝트를 만들려면

  1. Business Intelligence Development Studio를 엽니다.

  2. 파일 메뉴에서 새로 만들기를 가리킨 다음 프로젝트를 클릭합니다.

  3. 템플릿 창에서 Analysis Services 프로젝트가 선택되어 있는지 확인합니다.

  4. 이름 상자에서 새 프로젝트의 이름을 DM_Intermediate으로 지정합니다.

  5. 확인을 클릭합니다.

데이터 마이닝 개체가 저장되는 인스턴스를 변경하려면(옵션)

  1. Business Intelligence Development Studio의 프로젝트 메뉴에서 속성을 클릭합니다.

  2. 속성 페이지 창의 왼쪽에서 배포를 클릭합니다.

  3. 서버 이름이 localhost인지 확인합니다. 다른 인스턴스를 사용할 경우에는 해당 인스턴스의 이름을 입력합니다. 확인을 클릭합니다.

프로젝트의 배포 속성을 변경하려면(옵션)

  1. 솔루션 탐색기에서 프로젝트를 마우스 오른쪽 단추로 클릭하고 속성을 선택합니다.

    - 또는 -

    Business Intelligence Development Studio의 프로젝트 메뉴에서 속성을 선택합니다.

  2. 속성 페이지 창의 왼쪽에서 배포를 클릭합니다.

    옵션 창에서 배포 모드를 선택하고 옵션을 모두 배포로 설정하여 덮어쓰거나 변경 내용만 배포로 설정하여 개체를 업데이트하거나 새 개체를 추가합니다.

데이터 원본 만들기

기본 데이터 마이닝 자습서에서는 AdventureWorksDW2008 데이터베이스에 대한 연결 정보를 저장하는 데이터 원본을 만들었습니다. 동일한 단계를 수행하여 이 솔루션에 AdventureWorksDW2008 데이터 원본을 만듭니다.

데이터 원본을 만들려면

단일 데이터 원본으로 여러 데이터 원본 뷰를 지원할 수 있으며 각 데이터 원본 뷰에 여러 테이블을 포함할 수 있습니다. 그러나 데이터 원본 및 데이터 원본 뷰가 사용자가 만드는 데이터 마이닝 모델과 함께 MicrosoftSQL ServerAnalysis Services 데이터베이스에 배포되기 때문에 데이터 원본 뷰에 각 데이터 마이닝 모델 또는 모델 그룹에 필요한 테이블만 포함하는 것이 가장 좋습니다.

다음 단원에서는 각 단원에서 디자인하는 새 마이닝 구조 및 모델을 지원하기 위해 새 데이터 원본 뷰를 추가합니다. 시장 바구니 및 시퀀스 클러스터링 단원에서는 같은 데이터 원본을 사용하지만 다른 모든 측면에서 두 단원은 서로 독립적이며 별도로 완료할 수 있습니다.

단원

데이터 원본 뷰

2단원: 예측 시나리오 구축(중급 데이터 마이닝 자습서)

여러 지역에서의 자전거 버전에 대한 월별 판매 보고서

3단원: 시장 바구니 시나리오 구축(중급 데이터 마이닝 자습서)

고객 구매에 대한 분석 데이터. 이 데이터 원본 뷰에는 중첩 테이블이 포함됩니다.

4단원: 시퀀스 클러스터링 시나리오 구축(중급 데이터 마이닝 자습서)

시퀀스 식별자를 추가하여 향상된 고객 구매에 대한 분석 데이터

5단원: 신경망 및 로지스틱 회귀 모델 작성(중급 데이터 마이닝 자습서)

콜 센터에서 받은 예비 성과 추적 데이터