아티클
09/27/2010

구조에 마이닝 모델 추가(Analysis Services - 데이터 마이닝)

마이닝 구조는 데이터 도메인을 정의하지만 마이닝 모델은 해당 도메인의 데이터를 특정 문제에 적용하는 방법을 정의합니다. 마이닝 구조를 만든 후에는 구조에 마이닝 모델을 여러 개 추가할 수 있습니다. 모델을 만들 때마다 각기 다른 비즈니스 문제를 목표로 할 수 있습니다. 예를 들어 매개 변수를 변경하여 약간 다른 방법을 사용하거나, 데이터의 다른 하위 집합을 사용하여 다른 결과를 얻거나, 목표 모집단에만 해당하는 패턴을 추출할 수도 있습니다.

참조 항목:새 마이닝 구조 만들기, 데이터 마이닝 마법사(Analysis Services – 데이터 마이닝), 데이터 마이닝 디자이너의 마이닝 구조 관리

새 마이닝 모델 만들기

마이닝 모델은 두 가지 방법으로 만들 수 있습니다. 마이닝 구조를 정의한 다음 이 구조를 사용하는 다른 모델을 시험해 보거나, 원하는 모델을 만든 다음 생성된 구조를 사용하여 추가 모델을 만들 수 있습니다.

데이터 마이닝 마법사를 사용하여 새 마이닝 모델을 만드는 경우 먼저 마이닝 구조를 만듭니다. 그런 다음 마법사에서 제공하는 옵션을 통해 초기 마이닝 모델을 구조에 추가하고 해당 구조 내에서 학습 및 테스트 데이터 집합을 구성할 수 있습니다. 하지만 모델은 바로 만들 필요가 없습니다. 구조만 만들 경우 예측 가능한 특성으로 사용할 열이나 특정 모델에서 데이터를 사용하는 방법을 결정할 필요가 없습니다. 대신 나중에 사용할 일반 데이터 구조만 설정하고 나중에 데이터 마이닝 디자이너에서 해당 구조를 기반으로 하는 새 마이닝 모델을 추가할 수 있습니다.

만들려는 마이닝 모델의 유형을 이미 알고 있는 경우 구조를 만든 다음 데이터 마이닝 마법사를 사용하여 첫 번째 모델을 마이닝 구조에 추가할 수 있습니다. 마법사를 완료한 후에도 구조에 모델을 더 추가할 수 있습니다.

[!참고]

DMX에서 CREATE MINING MODEL 문은 마이닝 모델에서 시작됩니다. 즉, 사용자가 선택한 마이닝 모델을 정의하면 Analysis Services에서 자동으로 기본 구조를 생성합니다. ALTER STRUCTURE… ADD MODEL 문을 사용하여 나중에 해당 구조에 새 마이닝 모델을 계속 추가할 수 있습니다.

참조 항목:데이터 마이닝 디자이너의 마이닝 모델 관리

마이닝 모델 정의

데이터 도메인을 정의한 후에는 열 내용과 열 사용법을 지정하여 각 데이터 열의 사용법을 Analysis Services에 알립니다. 데이터 마이닝 구조에 포함된 각 열을 새 마이닝 모델에 사용할 필요는 없습니다. 두 모델이 동일한 구조를 기반으로 하는 경우라도 한 모델의 특정 열을 무시하도록 Analysis Services에 지시할 수 있습니다. 자세한 내용은 논리적 아키텍처(Analysis Services - 데이터 마이닝)를 참조하십시오.

알고리즘 선택

구조에 모델을 추가할 때 해당 모델에 사용할 데이터 마이닝 알고리즘을 선택해야 합니다. 각 알고리즘은 서로 다른 유형의 분석을 수행하며 일부 알고리즘의 경우 입력 또는 예측에 사용되는 데이터 열의 멤버 및 형식에 대한 요구 사항도 다릅니다.

따라서 선택한 알고리즘에 따라 마이닝 구조에 포함된 일부 데이터 열을 무시할 수도 있고 다른 데이터 형식으로 변환해야 할 수도 있으며 값을 제거해야 할 수도 있습니다. 데이터 마이닝 마법사는 일부 값을 자동으로 변경하여 모델이 작동하도록 합니다. 그러나 다른 경우에는 데이터를 먼저 수정하거나 사례 키와 같은 필요한 열을 추가하는 것이 좋습니다.

경우에 따라 모델에 사용된 알고리즘을 변경할 수도 있지만 대부분의 경우 모델 정의를 변경하면 모델과 데이터를 다시 처리해야 합니다. 일반적으로 모델에 사용된 알고리즘을 변경할 때마다 해당 알고리즘은 다시 처리해야 하는 완전히 새로운 모델로 간주해야 합니다.

참조 항목:데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)

열 사용법 지정

알고리즘을 선택한 후에는 알고리즘이 구조에 포함된 데이터를 처리하는 방법을 지정해야 하는데, 여기에는 예측 가능한 열(모델에 필요한 경우) 선택, 입력으로 사용할 열 선택, 사례 또는 중첩 테이블 키 지정 등이 포함됩니다. 모델에서 동일한 데이터를 사용하더라도 각 알고리즘의 요구 사항이 서로 다르기 때문에 모델마다 이러한 열 정의가 다를 수 있습니다. 불필요한 데이터가 포함될 경우 처리 시간이 늘어 결과 품질에 영향을 미칠 수 있으므로 분석에 가장 유용한 열만 선택하는 것이 좋습니다. 데이터 마이닝 마법사에는 구조에 포함된 열을 분석한 다음 Entropy 기반 점수를 사용하여 가장 많은 정보를 제공하는 열을 권장하는 선택적 제안 기능이 있습니다.

참조 항목:마이닝 모델 열, 마이닝 모델에서 속성 설정

열 내용 지정

열 내용을 지정해야 하는 열도 있습니다. SQL Server 데이터 마이닝에서는 각 데이터 열의 내용 유형 속성을 통해 알고리즘이 해당 열의 데이터를 처리하는 방식을 알 수 있습니다. 예를 들어 데이터에 가변 값을 갖는 Income 열이 있을 경우 내용 유형을 Continuous로 설정하여 열이 연속 숫자를 포함하도록 지정해야 합니다. 그러나 내용 유형을 Discretized로 설정하고 선택적으로 정확한 버킷 수를 지정하여 Income 열의 숫자를 버킷으로 그룹화하도록 지정할 수도 있습니다. 고객을 세 개의 연령 그룹으로 버킷팅하는 모델과 고객을 10개의 연령 그룹으로 버킷팅하는 또 다른 모델을 만들려는 경우와 같이 열을 다르게 처리하는 다른 모델을 만들 수 있습니다.

참조 항목:데이터 형식(데이터 마이닝), 내용 유형(데이터 마이닝)

참고 항목

개념

마이닝 구조(Analysis Services - 데이터 마이닝)

데이터 마이닝 디자이너

데이터 마이닝 마법사(Analysis Services – 데이터 마이닝)