신경망 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)

아티클
10/31/2023

적용 대상: SQL Server 2019 및 이전 Analysis Services Azure Analysis Services Fabric/Power BI Premium

중요

데이터 마이닝은 SQL Server 2017 Analysis Services에서 더 이상 사용되지 않으며 이제 SQL Server 2022 Analysis Services에서 중단되었습니다. 더 이상 사용되지 않는 기능 및 중단된 기능에 대해서는 설명서가 업데이트되지 않습니다. 자세한 내용은 Analysis Services 이전 버전과의 호환성을 참조하세요.

이 항목에서는 Microsoft 신경망 알고리즘을 사용하는 모델만의 마이닝 모델 콘텐츠에 대해 설명합니다. 모든 모델 형식에서 공유하는 통계 및 구조와 마이닝 모델 콘텐츠와 관련된 용어의 일반적인 정의를 해석하는 방법에 대한 설명은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.

신경망 모델의 구조 이해

각 신경망 모델에는 모델 및 해당 메타데이터를 나타내는 단일 부모 노드와 입력 특성에 대한 기술 통계를 제공하는 특수한 한계 통계 노드(NODE_TYPE = 24)가 있습니다. 한계 통계 노드는 입력에 대한 정보를 요약하기 때문에 개별 노드에서 데이터를 쿼리하지 않아도 되므로 유용합니다.

이 두 노드 아래에는 두 개 이상의 노드가 있으며, 이러한 노드는 모델에 포함된 예측 가능한 특성의 수에 따라 매우 많이 있을 수도 있습니다.

첫 번째 노드(NODE_TYPE = 18)는 항상 입력 계층의 최상위 노드를 나타냅니다. 이 최상위 노드 아래에는 실제 입력 특성과 해당 값이 들어 있는 입력 노드(NODE_TYPE = 21)가 있습니다.
연속된 각 노드에는 각기 다른 서브네트워크 (NODE_TYPE = 17)가 있습니다. 각 하위 네트워크에는 해당 하위 네트워크에 대한 숨겨진 계층(NODE_TYPE = 19)과 출력 계층(NODE_TYPE = 20)이 항상 포함되어 있습니다.

신경망용 모델 콘텐츠의 신경망

입력 계층의 정보는 간단합니다. 각 입력 계층의 최상위 노드(NODE_TYPE = 18)는 입력 노드(NODE_TYPE = 21) 컬렉션의 구성 도우미 역할을 합니다. 입력 노드의 내용은 다음 표에서 설명합니다.

각 하위 네트워크(NODE_TYPE = 17)는 입력 계층이 예측 가능한 특정 특성에 주는 영향에 대한 분석을 나타냅니다. 예측 가능한 출력이 여러 개 있으면 하위 네트워크도 여러 개 있습니다. 각 하위 네트워크의 숨겨진 계층에는 여러 개의 숨겨진 노드(NODE_TYPE = 22)가 포함되고 이 숨겨진 노드에는 해당 노드로 끝나는 각 전환의 가중치에 대한 정보가 포함됩니다.

출력 계층(NODE_TYPE = 20)에는 각각 예측 가능한 특성의 고유 값이 포함된 출력 노드(NODE_TYPE = 23)가 포함됩니다. 예측 가능한 특성이 연속 숫자 데이터 형식일 경우에는 해당 특성에 대한 출력 노드가 하나만 있습니다.

참고

로지스틱 회귀 알고리즘에서는 예측 가능한 결과가 하나만 있고 입력은 여러 개일 수 있는 특수한 신경망을 사용합니다. 로지스틱 회귀에서는 숨겨진 계층을 사용하지 않습니다.

입력 및 하위 네트워크의 구조를 탐색하는 가장 쉬운 방법은 Microsoft 일반 콘텐츠 트리 뷰어를 사용하는 것입니다. 임의의 노드를 클릭하여 확장한 후 자식 노드를 보거나 노드에 포함된 가중치 및 기타 통계를 볼 수 있습니다.

데이터를 사용하고 모델이 입력과 출력 간의 상관 관계를 찾아내는 방식을 보려면 Microsoft 신경망 뷰어를 사용합니다. 이 사용자 지정 뷰어를 사용하면 입력 특성과 해당 값을 필터링하고 이러한 항목이 출력에 주는 영향을 그래픽으로 볼 수 있습니다. 뷰어의 도구 설명에는 각 입력 및 출력 값 쌍과 연결된 확률 및 리프트가 표시됩니다. 자세한 내용은 Microsoft 신경망 뷰어를 사용하여 모델 찾아보기를 참조하세요.

신경망 모델에 대한 모델 콘텐츠

이 섹션에서는 신경망 모델과 특별히 관련된 마이닝 모델 콘텐츠 열에 대한 세부 정보 및 예만 제공합니다. 여기에 설명되지 않은 MODEL_CATALOG 및 MODEL_NAME 같은 스키마 행 집합의 범용 열에 대한 자세한 내용은 마이닝 모델 용어에 대한 설명은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.

MODEL_CATALOG
모델이 저장되는 데이터베이스의 이름입니다.

MODEL_NAME
모델의 이름입니다.

ATTRIBUTE_NAME
이 노드에 해당하는 특성의 이름입니다.

노드	콘텐츠
모델 루트	비어 있음
한계 통계	비어 있음
입력 계층	비어 있음
입력 노드	입력 특성 이름
숨겨진 계층	비어 있음
숨겨진 노드	비어 있음
출력 계층	비어 있음
출력 노드	출력 특성 이름

NODE_NAME
노드의 이름입니다. 이 열에는 NODE_UNIQUE_NAME과 동일한 값이 포함됩니다.

NODE_UNIQUE_NAME
노드의 고유한 이름입니다.

이름과 ID가 모델에 대한 구조 정보를 반영하는 방식에 대한 자세한 내용은 노드 이름 및 ID 사용섹션을 참조하세요.

NODE_TYPE
신경망 모델이 출력하는 노드 유형은 다음과 같습니다.

노드 유형 ID	설명
1	모델
17	하위 네트워크의 구성 도우미 노드
18	입력 계층의 구성 도우미 노드
19	숨겨진 계층의 구성 도우미 노드.
20	출력 계층의 구성 도우미 노드
21	입력 특성 노드
22	숨겨진 계층 노드
23	출력 특성 노드
24	한계 통계 노드

NODE_CAPTION
노드와 연결된 레이블 또는 캡션입니다. 신경망 모델에서는 항상 비어 있습니다.

CHILDREN_CARDINALITY
노드에 있는 예상 자식 수입니다.

노드	콘텐츠
모델 루트	한 개 이상의 네트워크, 한 개의 필수 한계 노드 및 한 개의 필수 입력 계층을 포함하는 자식 노드의 수를 나타냅니다. 예를 들어 값이 5인 경우 3개의 하위 네트워크가 있습니다.
한계 통계	항상 0입니다.
입력 계층	모델에 사용된 입력 특성-값 쌍의 수를 나타냅니다.
입력 노드	항상 0입니다.
숨겨진 계층	모델에서 만든 숨겨진 노드의 수를 나타냅니다.
숨겨진 노드	항상 0입니다.
출력 계층	출력 값의 수를 나타냅니다.
출력 노드	항상 0입니다.

PARENT_UNIQUE_NAME
노드 부모의 고유한 이름입니다. 루트 수준의 모든 노드에 대해서 NULL이 반환됩니다.

이름과 ID가 모델에 대한 구조 정보를 반영하는 방식에 대한 자세한 내용은 노드 이름 및 ID 사용섹션을 참조하세요.

NODE_DESCRIPTION
노드에 대한 알기 쉬운 설명입니다.

노드	콘텐츠
모델 루트	비어 있음
한계 통계	비어 있음
입력 계층	비어 있음
입력 노드	입력 특성 이름
숨겨진 계층	비어 있음
숨겨진 노드	숨겨진 노드 목록에 있는 숨겨진 노드의 시퀀스를 나타내는 정수
출력 계층	비어 있음
출력 노드	출력 특성이 연속 특성인 경우 출력 특성의 이름을 포함합니다. 출력 특성이 불연속 또는 불연속화된 특성인 경우 특성 이름 및 값을 포함합니다.

NODE_RULE
노드에 포함된 규칙에 대한 XML 설명입니다.

노드	콘텐츠
모델 루트	비어 있음
한계 통계	비어 있음
입력 계층	비어 있음
입력 노드	NODE_DESCRIPTION 열과 같은 정보가 들어 있는 XML 조각
숨겨진 계층	비어 있음
숨겨진 노드	숨겨진 노드 목록에 있는 숨겨진 노드의 시퀀스를 나타내는 정수
출력 계층	비어 있음
출력 노드	NODE_DESCRIPTION 열과 같은 정보가 들어 있는 XML 조각

MARGINAL_RULE
신경망 모델의 경우 항상 비어 있습니다.

NODE_PROBABILITY
이 노드와 관련된 확률입니다. 신경망 모델의 경우 항상 0입니다.

MARGINAL_PROBABILITY
부모 노드에서 해당 노드에 도달할 확률입니다. 신경망 모델의 경우 항상 0입니다.

NODE_DISTRIBUTION
노드에 대한 통계 정보가 들어 있는 중첩 테이블입니다. 각 노드 유형에 대해 이 테이블에 포함되는 내용에 대한 자세한 내용은 NODE_DISTRIBUTION 테이블 이해섹션을 참조하세요.

NODE_SUPPORT
신경망 모델의 경우 항상 0입니다.

참고

이 모델 유형의 출력은 확률적이 아니므로 지지도 확률은 항상 0입니다. 이 알고리즘에는 가중치만 의미가 있으므로 이 알고리즘은 확률, 지지도 또는 분산을 컴퓨팅하지 않습니다.

특정 값에 대한 학습 사례의 지지도에 관한 정보를 보려면 한계 통계 노드를 참조하세요.

MSOLAP_MODEL_COLUMN

노드	콘텐츠
모델 루트	비어 있음
한계 통계	비어 있음
입력 계층	비어 있음
입력 노드	입력 특성 이름
숨겨진 계층	비어 있음
숨겨진 노드	비어 있음
출력 계층	비어 있음
출력 노드	입력 특성 이름

MSOLAP_NODE_SCORE
신경망 모델의 경우 항상 0입니다.

MSOLAP_NODE_SHORT_CAPTION
신경망 모델의 경우 항상 비어 있습니다.

설명

신경망 모델의 학습 목적은 입력에서 중간점 및 중간점에서 엔드포인트로의 각 전환과 연결된 가중치를 확인하는 것입니다. 따라서 모델의 입력 계층은 주로 모델을 작성하는 데 사용된 실제 값을 저장하기 위해 존재합니다. 숨겨진 계층은 계산된 가중치를 저장하며 입력 특성에 대한 포인터를 제공합니다. 출력 계층은 예측 가능한 값을 저장하며 숨겨진 계층의 중간점에 대한 포인터를 제공합니다.

노드 이름 및 ID 사용

신경망 모델의 노드 이름은 노드 유형에 대한 추가 정보를 제공하므로 이를 통해 숨겨진 계층과 입력 계층의 관계 및 출력 계층과 숨겨진 계층의 관계를 쉽게 이해할 수 있습니다. 다음 표에서는 각 계층의 노드에 할당되는 ID의 규칙을 보여 줍니다.

노드 유형	노드 ID의 규칙
모델 루트(1)	00000000000000000.
한계 통계 노드(24)	10000000000000000
입력 계층(18)	30000000000000000
입력 노드(21)	60000000000000000에서 시작
하위 네트워크(17)	20000000000000000
숨겨진 계층(19)	40000000000000000
숨겨진 노드(22)	70000000000000000에서 시작
출력 계층(20)	50000000000000000
출력 노드(23)	80000000000000000에서 시작

숨겨진 노드(NODE_TYPE = 22)의 NODE_DISTRIBUTION 테이블을 보면 숨겨진 특정 계층과 관련된 입력 특성을 확인할 수 있습니다. NODE_DISTRIBUTION 테이블의 각 행에는 입력 특성 노드의 ID가 들어 있습니다.

마찬가지로, 출력 노드(NODE_TYPE = 23)의 NODE_DISTRIBUTION 테이블을 보면 출력 특성과 관련된 숨겨진 계층을 확인할 수 있습니다. NODE_DISTRIBUTION 테이블의 각 행에는 숨겨진 계층 노드의 ID와 관련 계수가 들어 있습니다.

NODE_DISTRIBUTION 테이블의 정보 해석

일부 노드에서는 NODE_DISTRIBUTION 테이블이 비어 있을 수 있습니다. 그러나 입력 노드, 숨겨진 계층 노드 및 출력 노드의 경우 NODE_DISTRIBUTION 테이블에는 모델에 대한 중요하고 주목할 만한 정보가 저장됩니다. 이 정보를 쉽게 해석할 수 있도록 NODE_DISTRIBUTION 테이블에는 각 행에 대해 VALUETYPE 열이 들어 있으므로 이 열을 통해 ATTRIBUTE_VALUE 열의 값이 불연속적(4)인지, 불연속화(5)되었는지, 연속적(3)인지를 알 수 있습니다.

입력 노드

입력 계층에는 모델에 사용된 각 특성 값에 대한 노드가 포함됩니다.

불연속 특성: 입력 노드에는 ATTRIBUTE_NAME 및 ATTRIBUTE_VALUE 열의 특성 이름 및 해당 값만 저장됩니다. 예를 들어 [Work Shift]가 열인 경우 이 열의 값 중 모델에 사용된 각 값(예: AM 및 PM)에 대해 별도의 노드가 만들어집니다. 각 노드의 NODE_DISTRIBUTION 테이블에는 특성의 현재 값만 나열됩니다.

불연속화된 숫자 특성: 입력 노드에는 특성 이름 및 해당 값이 저장됩니다. 이때 값은 범위이거나 특정 값일 수 있습니다. 모든 값은 [문제당 시간]의 값에 대해 '77.4 - 87.4' 또는 ' < 64.0'과 같은 식으로 표시됩니다. 각 노드의 NODE_DISTRIBUTION 테이블에는 특성의 현재 값만 나열됩니다.

연속 특성: 입력 노드에는 노드의 평균값이 저장됩니다. 각 노드의 NODE_DISTRIBUTION 테이블에는 특성의 현재 값만 나열됩니다.

숨겨진 계층 노드

숨겨진 계층에는 여러 개의 노드가 포함됩니다. 각 노드의 NODE_DISTRIBUTION 테이블에는 숨겨진 계층에서 입력 계층 노드로의 매핑이 들어 있습니다. ATTRIBUTE_NAME 열에는 입력 계층의 노드에 해당하는 노드 ID가 들어 있습니다. ATTRIBUTE_VALUE 열에는 입력 노드 및 숨겨진 계층 노드의 조합과 연결된 가중치가 들어 있습니다. 테이블의 마지막 행에는 숨겨진 계층에 있는 숨겨진 해당 노드의 가중치를 나타내는 계수가 들어 있습니다.

출력 노드

출력 계층에는 모델에 사용된 각 출력 값에 대한 출력 노드가 하나씩 포함됩니다. 각 노드의 NODE_DISTRIBUTION 테이블에는 출력 계층에서 숨겨진 계층 노드로의 매핑이 들어 있습니다. ATTRIBUTE_NAME 열에는 숨겨진 계층의 노드에 해당하는 노드 ID가 들어 있습니다. ATTRIBUTE_VALUE 열에는 출력 노드 및 숨겨진 계층 노드의 조합과 연결된 가중치가 들어 있습니다.

NODE_DISTRIBUTION 테이블에는 특성 유형에 따라 다음과 같은 추가 정보가 포함됩니다.

불연속 특성: NODE_DISTRIBUTION 테이블의 마지막 두 행에 해당 노드 전체에 대한 계수와 특성의 현재 값이 들어 있습니다.

불연속화된 숫자 특성: 특성 값이 값 범위라는 점만 제외하고 불연속 특성과 동일합니다.

연속 특성: NODE_DISTRIBUTION 테이블의 마지막 두 행에 특성의 평균, 해당 노드 전체에 대한 계수 및 계수의 분산이 들어 있습니다.

참고 항목

Microsoft Neural Network Algorithm
Microsoft 신경망 알고리즘 기술 참조
신경망 모델 쿼리 예제