의미 체계 검색(SQL Server)

적용 대상:SQL Server

통계 의미 체계 검색은 통계적으로 관련된 핵심 구를 추출하고 인덱싱하여 SQL Server 데이터베이스에 저장된 구조화되지 않은 문서에 대한 심층적인 인사이트를 제공합니다. 그런 다음 이러한 핵심 구를 사용하여 유사하거나 관련된 문서를 식별하고 인덱싱합니다.

의미 체계 검색으로 무엇을 할 수 있나요?

의미 체계 검색은 SQL Server의 기존 전체 텍스트 검색 기능을 기반으로 하지만 키워드 검색 이상으로 확장되는 새로운 시나리오를 사용하도록 설정합니다. 전체 텍스트 검색을 사용하면 문서의 단어를 쿼리할 수 있지만 의미 체계 검색을 통해 문서의 의미를 쿼리할 수 있습니다. 이제 가능한 솔루션에는 자동 태그 추출, 관련 콘텐츠 검색 및 유사한 콘텐츠의 계층적 탐색이 포함됩니다. 예를 들어 핵심 구의 인덱스를 쿼리하여 조직 또는 문서 모음에 대한 분류를 작성할 수 있습니다. 또는 문서 유사성 인덱스를 쿼리하여 작업 설명과 일치하는 이력서를 식별할 수 있습니다.

다음 예제에서는 의미 체계 검색의 기능을 보여 줍니다. 동시에 이러한 예제는 의미론적 인덱스를 쿼리하고 결과를 구조화된 데이터로 검색하는 데 사용하는 세 가지 Transact-SQL 행 집합 함수를 보여 줍니다.

문서에서 핵심 구 찾기

다음 쿼리는 샘플 문서에서 식별된 핵심 구를 가져옵니다. 각 핵심 구의 통계적 유의 순위를 매기는 점수를 기준으로 결과를 내림차순으로 표시합니다.

이 쿼리는 semantickeyphrasetable 함수를 호출합니다.

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC  
  

유사하거나 관련된 문서 찾기

다음 쿼리에서는 예제 문서와 유사하거나 관련된 것으로 확인된 문서를 가져옵니다. 두 문서의 유사성 순위를 매기는 점수별로 결과를 내림차순으로 표시합니다.

이 쿼리는 의미 체계시밀리티트 가능 함수를 호출합니다.

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC  
  

문서를 유사하게 만들거나 관련된 핵심 구 찾기

다음 쿼리는 두 샘플 문서를 유사하거나 서로 관련시키는 핵심 구를 가져옵니다. 각 핵심 구의 가중치를 매기는 점수를 기준으로 결과를 내림차순으로 표시합니다.

이 쿼리는 semanticsimilaritydetailstable 함수를 호출합니다.

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC  
  

SQL Server에 문서 저장

의미 체계 검색을 사용하여 문서를 인덱싱하려면 SQL Server 데이터베이스에 문서를 저장해야 합니다.

SQL Server의 FileTable 기능은 관계형 데이터베이스의 구조화되지 않은 파일 및 문서 일류 시민을 만듭니다. 따라서 데이터베이스 개발자는 Transact-SQL 집합 기반 작업에서 구조화된 데이터와 함께 문서를 조작할 수 있습니다.

FileTable 기능에 대한 자세한 내용은 FileTables(SQL Server)를 참조하세요. 데이터베이스에 문서를 저장하는 또 다른 옵션인 FILESTREAM 기능에 대한 자세한 내용은 FILESTREAM(SQL Server)을 참조하세요.

관련 작업

의미 체계 검색 설치 및 구성
통계 의미 체계 검색의 필수 구성 요소 및 설치 또는 확인 방법에 대해 설명합니다.

테이블 및 열에 대한 의미 체계 검색 사용
문서 또는 텍스트가 포함된 선택한 열에서 통계 의미 체계 인덱싱을 사용하거나 사용하지 않도록 설정하는 방법을 설명합니다.

의미 체계 검색을 사용하여 문서에서 핵심 구 찾기
통계 의미 체계 인덱싱을 위해 구성된 문서 또는 텍스트 열에서 핵심 구를 찾는 방법을 설명합니다.

의미 체계 검색을 사용하여 유사 문서 및 관련 문서 찾기
통계적 의미 체계 인덱싱을 위해 구성된 열에서 유사하거나 관련된 문서 또는 텍스트 값을 찾고 유사하거나 연관된 정도에 관한 정보를 찾는 방법에 대해 설명합니다.

의미 체계 검색 관리 및 모니터링
의미 체계 인덱싱 프로세스 및 인덱스 모니터링 및 관리와 관련된 작업에 대해 설명합니다.

관련 콘텐츠

의미 체계 검색 DDL, 함수, 저장 프로시저 및 뷰
통계 의미 체계 검색을 지원하기 위해 추가되거나 변경된 Transact-SQL 문 및 SQL Server 데이터베이스 개체를 나열합니다.