데이터 마이닝 도구

Microsoft SQL Server Analysis Services에는 데이터 마이닝 솔루션을 만드는 데 사용할 수 있는 다음 도구가 있습니다.

  • SQL Server Data Tools(SSDT)의 데이터 마이닝 마법사는 관계형 데이터 원본이나 큐브의 다차원 데이터를 사용하여 마이닝 구조와 마이닝 모델을 쉽게 만들 수 있도록 합니다.

    이 마법사에서 사용할 데이터를 선택한 다음 클러스터링, 신경망 또는 시계열 모델링과 같은 특정 데이터 마이닝 기술을 적용할 수 있습니다.

  • 모델 뷰어는 마이닝 모델이 만들어진 후 마이닝 모델을 탐색하기 위해 SQL Server Management Studio 및 SQL Server Data Tools(SSDT)에서 제공됩니다. 각 알고리즘에 맞게 조정된 뷰어를 사용하여 모델을 찾아보거나 모델 콘텐츠 뷰어를 사용하여 세부적으로 분석할 수 있습니다.

  • 예측 쿼리 작성기는 예측 쿼리를 쉽게 만들 수 있도록 SQL Server Management Studio 및 SQL Server Data Tools(SSDT)에서 제공됩니다. 홀드아웃 데이터 집합 또는 외부 데이터에 대해 모델의 정확도를 테스트하거나 교차 유효성 검사를 사용하여 데이터 집합의 품질을 평가할 수도 있습니다.

  • SQL Server Management Studio는 Analysis Services 인스턴스에 배포된 기존 데이터 마이닝 솔루션을 관리하는 인터페이스입니다. 구조와 모델을 다시 처리하여 구조와 모델의 데이터를 업데이트할 수 있습니다.

  • SQL Server Integration Services에는 데이터를 정리하고, 예측 생성, 모델 업데이트 등의 태스크를 자동화하고, 텍스트 마이닝 솔루션을 만드는 데 사용할 수 있는 도구가 있습니다.

다음 섹션에서는 SQL Server의 데이터 마이닝 도구에 대한 추가 정보를 제공합니다.

데이터 마이닝 마법사

데이터 마이닝 마법사를 사용하여 데이터 마이닝 솔루션 생성을 시작할 수 있습니다. 이 마법사는 빠르고 쉬우며 데이터 마이닝 구조 및 초기 관련 마이닝 모델을 만드는 과정을 안내하고 알고리즘 유형 및 데이터 원본 선택 태스크와 분석에 사용되는 사례 데이터 정의 태스크를 포함합니다.

참조 항목: 데이터 마이닝 마법사(Analysis Services - 데이터 마이닝)

데이터 마이닝 디자이너

데이터 마이닝 마법사를 사용하여 마이닝 구조와 마이닝 모델을 만든 후 SQL Server Data Tools(SSDT) 또는 SQL Server Management Studio에서 데이터 마이닝 디자이너를 사용하여 기존 모델과 구조로 작업할 수 있습니다.

디자이너에는 다음 태스크를 위한 도구가 포함되어 있습니다.

  • 마이닝 구조의 속성을 수정하고, 열을 추가하고 열 별칭을 만들고, 범주화 방법이나 값의 예상 분포를 변경합니다.

  • 기존 구조에 새 모델을 추가하고, 모델을 복사하고, 모델 속성이나 메타데이터를 변경하고, 마이닝 모델에 대한 필터를 정의합니다.

  • 모델 내의 패턴과 규칙을 찾아보고, 연결 또는 의사 결정 트리를 탐색하고, 자세한 통계를 얻습니다.

    데이터를 분석하고 데이터 마이닝으로 드러난 패턴을 탐색하는 데 도움을 주기 위해 사용자 지정 뷰어가 모델의 각기 다른 각 시간에 대해 제공됩니다.

  • 리프트 차트를 만들거나 모델의 수익 곡선을 분석하여 모델의 유효성을 검사합니다. 분류 행렬을 사용하여 모델을 비교하거나 교차 유효성 검사를 사용하여 데이터 집합과 해당 모델의 유효성을 검사합니다.

  • 기존 마이닝 모델에 대해 예측 및 내용 쿼리를 만듭니다. 외부 데이터의 전체 테이블에 대한 예측을 생성하기 위해 쿼리를 설정하거나 일회용 쿼리를 작성합니다.

참조 항목: 데이터 마이닝 디자이너

SQL Server Management Studio

마이닝 모델을 만들어 서버에 배포한 후 SQL Server Management Studio를 사용하여 데이터 마이닝 개체를 호스팅하는 Analysis Services 데이터베이스를 관리할 수 있습니다. 또한 모델 탐색, 새 데이터 처리, 예측 생성 등의 모델을 사용하는 태스크를 계속 수행할 수도 있습니다.

Management Studio에는 DMX(Data Mining Extensions) 쿼리를 디자인하고 실행하거나 XMLA를 사용하여 데이터 마이닝 개체로 작업하는 데 사용할 수 있는 쿼리 편집기도 포함되어 있습니다.

참조 항목: SQL Server Management Studio에서 데이터 마이닝

Integration Services 데이터 마이닝 태스크 및 변환

SQL Server Integration Services에는 데이터 마이닝을 지원하는 많은 구성 요소가 있습니다.

Integration Services의 일부 도구는 예측, 모델 작성, 처리 등의 일반적인 데이터 마이닝 태스크를 쉽게 자동화할 수 있도록 설계되었습니다. 예를 들면 다음과 같습니다.

  • 데이터 집합이 새 고객으로 업데이트될 때마다 모델을 자동으로 업데이트하는 Integration Services 패키지를 만듭니다.

  • 사례 레코드의 사용자 지정 구분 또는 사용자 지정 샘플링을 수행합니다.

  • 매개 변수에서 전달된 모델을 자동으로 생성합니다.

그러나 다른 프로세스에 대한 입력으로 패키지 워크플로에서 데이터 마이닝을 사용할 수도 있습니다. 예를 들면 다음과 같습니다.

  • 모델에서 생성된 확률 값을 사용하여 텍스트 마이닝 또는 다른 분류 태스크에 대한 점수에 가중치를 부여합니다.

  • 이전 데이터를 기반으로 자동으로 예측을 생성하고 해당 값을 사용하여 새 데이터의 유효성을 평가합니다.

  • 로지스틱 회귀를 사용하여 위험을 기준으로 들어오는 고객을 구분합니다.

참조 항목: 데이터 마이닝 솔루션 관련 프로젝트

참고 항목

참조

DMX(Data Mining Extensions) 참조

개념

데이터 마이닝 솔루션

관련 자료

마이닝 모델 태스크 및 방법

마이닝 모델 뷰어 태스크 및 방법