SharePoint Server의 검색 스키마 개요

적용 대상:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

검색 인덱스는 검색에서 핵심적인 요소입니다. 검색 인덱스에 포함된 내용에 따라 사용자가 검색 쿼리를 입력하거나 인터넷 또는 인트라넷 페이지와 상호 작용하여 정보를 찾을 때 표시되는 결과가 결정됩니다.

이 문서에서는 검색 스키마를 사용하여 콘텐츠를 수집하고 검색 인덱스에서 검색하는 방법을 설명합니다. 검색 스키마는 크롤링 속성에서 관리 속성으로의 매핑과 관리 속성 설정이 포함되어 있습니다. 관리 속성 설정은 검색 가능한 항목과 검색 방법, 구체화에 사용할 수 있는 기준 및 검색 결과 표시 방법과 순서 등을 정의합니다.

크롤링 및 크롤링 속성

검색 인덱스를 작성하려면 먼저 콘텐츠를 크롤링해야 합니다. SharePoint Servercontent, 파일 공유 또는 사용자 프로필과 같은 다양한 콘텐츠 원본을 크롤링할 수 있습니다. 크롤링하는 항목의 메타데이터와 콘텐츠는 크롤링 속성으로 표시됩니다.

크롤링되어 콘텐츠 처리 구성 요소로 전달되는 각 항목에는 크롤링 속성이 연결되어 있습니다. 속성의 예로는 만든 이, 제목, 만든 날짜 등이 있습니다. 새 크롤링 속성은 자동으로 검색됩니다.

크롤링 속성은 항목의 프로토콜 처리기 또는 IFilter를 기준으로 하는 범주로 그룹화됩니다. 예제 범주는 Office (Word 문서, Excel 워크시트 등에서 크롤링된 속성), 비즈니스 데이터 (예: 데이터베이스에서 크롤링된 속성) 및 (웹 사이트의 크롤링 속성)입니다.

크롤링에 대한 자세한 내용은 SharePoint Server의 크롤링 및 페더레이션 계획을 참조하세요.

관리 속성 및 속성 매핑

크롤링 속성의 메타데이터와 콘텐츠를 검색 인덱스에 포함하려면 크롤링 속성을 관리 속성에 매핑해야 합니다. 관리 속성만 검색 인덱스에 기록됩니다.

관리 속성은 여러 설정을 포함할 수 있습니다. 관리 속성의 설정에 따라 검색 결과에서 콘텐츠를 표시할 수 있는 방법 및 사용자가 콘텐츠를 검색할 수 있는 방법이 결정됩니다.

여러 크롤링 속성을 관리 속성 하나에 매핑할 수 있습니다. 예를 들어 "작성자"와 "만든 이" 크롤링 속성을 모두 "만든 이" 관리 속성에 매핑할 수 있습니다. 크롤링 속성 하나를 여러 관리 속성에 매핑할 수도 있습니다.

또한 크롤링 속성이 관리 속성에 매핑되는 순서에 따라 관리 속성 콘텐츠가 결정됩니다. 예를 들어 관리 속성 하나에 여러 개의 크롤링 속성이 매핑될 수 있고 매핑된 모든 크롤링 속성의 모든 값을 포함하도록 관리 속성을 설정할 수 잇습니다. 그러나 SharePoint 제목이 포함된 크롤링 속성에 대해 매핑의 다른 제목보다 높은 우선 순위를 지정한 경우 검색 결과에 SharePoint 제목이 표시됩니다.

크롤링 속성과 관리 속성 간의 기본 매핑 집합이 정의되어 있습니다. 자세한 내용은 SharePoint Server의 크롤링 및 관리 속성 개요를 참조하세요.

일부 크롤링 속성 유형은 새 관리 속성 및 크롤링 속성과 관리 속성 간의 매핑을 자동으로 생성합니다. 예를 들어 SharePoint 라이브러리의 모든 사이트 열에는 이와 같은 자동 생성 및 매핑이 적용됩니다. 목록에서 사이트 열을 만들고 해당 목록을 크롤링하면 크롤링 속성, 관리 속성 및 크롤링 속성과 관리 속성 간의 매핑이 사이트 열에 대해 자동으로 만들어집니다.

기본 매핑 또는 다른 매핑을 크롤링에서 관리 속성으로 변경하거나, 새 매핑을 만들거나, 새 관리 속성을 만들 수 있습니다. 새 관리 속성을 만들거나 기존 관리 속성에 대한 특정 설정을 변경하는 경우 관리 속성 및 해당 값이 검색 인덱스에 포함되기 전에 전체 크롤링이 완료되어야 합니다. 새 속성 또는 변경된 속성이 SharePoint 라이브러리 또는 목록에 있는 경우 전체 SharePoint 콘텐츠 원본의 전체 크롤링을 시작하지 않고 해당 개별 라이브러리 또는 목록을 다시 인덱싱할 수 있습니다. 전체 크롤링과 동일한 효과가 있습니다.

자세한 내용은 이 문서의 뒷부분에 나오는 관리 속성 설정 개요 표를 참조하세요.

검색 스키마

검색 스키마는 검색 관리 데이터베이스에 저장됩니다. 검색 스키마에는 다음이 포함됩니다.

  • 크롤링 속성과 관리 속성 간의 매핑. 이는 크롤링 속성 하나와 관리 속성 하나의 매핑이거나 일대다, 다대일 또는 다대다 매핑일 수 있습니다.

  • 관리 속성을 검색 인덱스에 쓸 방법. 예를 들어 관리 속성의 값을 쓸 전체 텍스트 인덱스 및 가중치 그룹(컨텍스트) 등이 포함될 수 있습니다.

  • 각 관리 속성의 설정. 예를 들어 특정 관리 속성을 검색/쿼리하거나 검색 결과 세분화 기준으로 사용할 수 있는지 여부가 포함될 수 있습니다.

  • IFilter 또는 프로토콜 처리기에 따라 속성을 그룹화하는 크롤링 속성 범주. 크롤링 속성 범주를 편집하면 변경 내용이 해당 범주 내의 모든 크롤링 속성에 적용됩니다. 이는 성능 및 검색 인덱스에 저장되는 항목 수에 영향을 줄 수 있습니다.

검색 스키마 업데이트는 1분마다 검색 시스템을 통해 전파됩니다.

여러 검색 스키마

검색 스키마를 여러 개 만들 수 있습니다. 기본 검색 스키마는 Search Service 애플리케이션에서 정의되며 중앙 관리에서 편집할 수 있습니다. 사이트 모음 관리자와 테넌트 관리자는 특정 사이트 모음 또는 테넌트의 검색 스키마를 변경할 수 있습니다. 예를 들어 사이트 모음 관리자는 해당 사이트 모음의 검색 스키마를 변경하여 검색 인덱스에 포함되는 내용을 사용자 지정할 수 있으며, 결과적으로 해당 사이트 모음의 검색 환경을 사용자 지정할 수 있습니다. 사이트 소유자는 검색 스키마를 볼 수 있지만 변경할 수는 없습니다.

참고

중앙 관리에서는 사이트 모음 검색 스키마를 보거나 변경할 수 없습니다. 사이트 모음에 대한 검색 스키마를 보거나 변경하려면 사이트 모음 관리를 사용해야 합니다.

검색 인덱스

검색 인덱스는 서버의 폴더에 있는 파일 집합으로 구성됩니다. 콘텐츠 처리 구성 요소는 크롤링된 항목을 처리하고, 검색 스키마를 사용하여 크롤링된 속성을 관리 속성에 매핑하고, 관리 속성을 검색 인덱스에 기록되는 형식으로 변환합니다. 다양한 전체 텍스트 인덱스 외에도 검색 가능한 것으로 표시된 관리 속성과 쿼리 가능한 것으로 표시된 관리 속성의 별도의 인덱스가 있습니다. 특성 벡터에 대한 별도의 인덱스도 있으며 숫자 인덱스가 있습니다.

인덱스 업데이트 그룹

항목은 변경될 때마다 다시 크롤링한 후 다시 인덱싱해야 합니다. 다시 인덱싱 부하를 줄이기 위해 SharePoint Server에는 몇 가지 별도의 인덱스 업데이트 그룹이 도입되었습니다.

  • 기본 그는 관리 속성의 대부분을 포함합니다. 이 인덱스 업데이트 그룹에는 보안, 링크, 사용량 또는 사람 인덱스 업데이트 그룹에 속하지 않는 모든 관리 속성이 포함됩니다.

  • 보안 문서 ACL(액세스 제어 목록) 관리 속성을 포함합니다.

  • 링크 링크 구조와 관련된 관리 속성을 포함합니다.

  • 사용 현황 사용 현황 데이터와 관련된 관리 속성을 포함합니다.

  • 사용자 사용자 검색과 관련된 관리 속성을 포함합니다.

각 업데이트 그룹은 검색 인덱스에서 서로 다른 폴더에 저장됩니다.

전체 텍스트 인덱스

전체 텍스트 인덱스에는 전체 텍스트 인덱스에 저장된 검색 가능한 관리 속성의 모든 텍스트가 포함됩니다. 각 전체 텍스트 인덱스는 컨텍스트라고도 하는 가중치 그룹으로 나뉩니다. 다양한 컨텍스트는 검색 결과의 총 관련성 순위를 계산하는 데 사용되는 순위 기능 중 하나인 관리 속성의 상대적 중요도와 관련이 있습니다. 컨텍스트의 숫자 또는 ID는 중요하지 않습니다. 순위 모델은 특정 컨텍스트에 기여 가중치를 할당하여 상대적 중요도를 결정합니다. 기여 가중치가 높을수록 순위 점수가 높아질 수 있습니다. 자세한 내용은 SharePoint Server 의 검색 결과 순위 개요 문서에서 검색 스키마를 사용하여검색 결과의 순위에 영향을 미치는 섹션을 참조하세요.

기본 전체 텍스트 인덱스 외에 두 개의 미리 정의된 전체 텍스트 인덱스가 있습니다. 그 중 하나는 SharePoint 용어 전체 텍스트 인덱스(SpTermsIdx)이고 다른 하나는 사용자 인덱스(PeopleIdx)입니다.

대부분의 관리 속성은 기본적으로 적합한 컨텍스트와 전체 텍스트 인덱스에 이미 매핑되어 있습니다. 검색 가능한 기존 관리 속성의 컨텍스트를 변경하지 않는 것이 좋습니다.

관리 속성 설정 개요

관리 속성의 설정에 따라 검색 인덱스에 콘텐츠가 저장되는 방법 및 사용자가 콘텐츠를 검색할 수 있는 경우와 방법이 결정됩니다.

검색 스키마는 중앙 관리, 사이트 모음 관리 및 테넌트 관리에서 편집할 수 있습니다. 사이트 관리자는 검색 스키마를 볼 수는 있지만 편집할 수는 없습니다. 다음 표에서는 각 설정 및 서로 다른 관리자 수준에서 해당 설정을 편집할 수 있는지 여부에 대한 설명이 나와 있습니다.

관리 속성 설정 속성 기능 예시 사용 가능한 위치 설정 변경 후 전체 크롤링 또는 필요한 SharePoint 목록/라이브러리 다시 인덱싱
검색 가능 관리 속성의 콘텐츠를 쿼리할 수 있습니다. 이 관리 속성의 콘텐츠는 전체 텍스트 인덱스에 포함됩니다. 속성이 "만든 이"인 경우 "Smith"만 쿼리하면 "Smith"라는 단어가 포함된 항목 및 해당 만든 이 속성에 "Smith"가 포함된 항목이 반환됩니다. 중앙 관리/사이트 모음 관리/테넌트 관리
고급 검색 가능 설정 관리 속성이 기록된 전체 텍스트 인덱스를 보고 변경할 수 있습니다. 또한 관련성 순위 계산을 위한 관리 속성 컨텍스트를 변경할 수 있습니다. 기존 관리 속성의 컨텍스트를 변경하지 않는 것이 좋습니다. 자세한 내용은 SharePoint Server 의 검색 결과 순위 개요 문서에서 검색 스키마를 사용하여검색 결과의 순위에 영향을 미치는 섹션을 참조하세요. 중앙 관리/사이트 모음 관리/테넌트 관리
쿼리 가능 특정 관리 속성을 쿼리할 수 있습니다. 관리 속성 이름이 쿼리에 포함되어 있어야 합니다(쿼리 자체에서 지정하거나 프로그래밍 방식으로 쿼리에 포함). 관리 속성이 "만든 이"이면 쿼리에는 "만든 이:Smith"를 포함해야 합니다. 중앙 관리/사이트 모음 관리/테넌트 관리 사용 안 함에서 사용으로
조회 가능 이 관리 속성의 콘텐츠를 검색 결과에서 반환할 수 있습니다. 검색 결과에 있는 항목과 관련된 관리 속성에 대해 이 설정을 사용하도록 설정합니다. 중앙 관리/사이트 모음 관리/테넌트 관리 사용 안 함에서 사용으로
여러 값 허용 이 관리 속성에 유형이 동일한 여러 값을 포함할 수 있습니다. 관리 속성이 "만든 이"인데 문서에 만든 이가 여러 명 있으면 각 만든 이의 이름이 관리 속성에 개별 값으로 저장됩니다. 중앙 관리
구체 검색 가능 예 - 활성(Yes - active): 프런트 엔드에서 검색 결과의 구체화로 속성을 사용할 수 있습니다. 웹 파트에서 구체화를 수동으로 구성해야 합니다.

예 - 잠재(Yes - latent): 나중에 구체 검색 가능으로 전환할 수 있으며 전환 시에는 전체 다시 크롤링을 수행하지 않아도 됩니다.

두 옵션 모드 전체 크롤링을 수행해야 적용됩니다.

중요: 예 - 활성 또는 예 - 숨어 있음을 선택하는 경우 관리 속성을 쿼리 가능으로 설정해야 합니다.

최신 검색 환경에서 지원되지 않습니다.
"만든 이" 관리 속성이 구체 검색 가능으로 설정되어 있으면 나중에 만든 이를 검색 프런트 엔드에서 구체화로 설정할 수 있습니다. 중앙 관리 사용 안 함에서 사용으로(이미 정렬 가능으로 설정되지 않은 경우)
정렬 가능 예 - 활성(Yes - active): 결과 집합이 반환되기 전에 속성을 기준으로 결과 집합을 정렬할 수 있습니다.

예 - 잠재(Yes - latent): 나중에 정렬 가능으로 전환할 수 있으며 전환 시에는 전체 다시 크롤링을 수행하지 않아도 됩니다.

두 옵션 모드 전체 크롤링을 수행해야 적용됩니다.

최신 검색 환경에서 지원되지 않습니다.
동시에 정렬 및 검색할 수 없는 큰 결과 집합에 사용합니다. 중앙 관리 사용 안 함에서 사용으로(이미 구체 검색 가능으로 설정되지 않은 경우)
별칭 쿼리와 검색 결과에서 관리 속성 이름 대신 별칭을 사용하려는 경우 관리 속성의 별칭을 정의합니다. 크롤링 속성을 매핑하려면 별칭이 아닌 원래 관리 속성을 사용합니다. 새 관리 속성을 만들지 않으려는 경우 또는 만들 권한이 없는 경우 별칭을 사용합니다. 중앙 관리/사이트 모음 관리/테넌트 관리 아니요
토큰 정규화(Token normalization) 쿼리에 사용되는 대/소문자 및 분음 부호에 관계없이 결과를 반환할 수 있습니다. "curacao"를 쿼리하면 "Curacao", "curacao", "Curacao"도 일치 항목으로 반환됩니다. 중앙 관리/사이트 모음 관리/테넌트 관리
전체 일치(Complete matching) 기본적으로 검색은 관리 속성에 대한 쿼리와 관리 속성의 콘텐츠 간에 부분 일치 항목을 반환합니다.

검색을 위해 일치 완료를 선택하여 정확한 일치 항목을 반환합니다.
관리 속성 "Title"에 "Contoso 사이트"가 포함된 경우 제목: "Contoso 사이트"라는 쿼리만 결과를 제공합니다. 중앙 관리/사이트 모음 관리/테넌트 관리
언어 중립적 토큰화(SharePoint Server 2019만 해당) 다국어 콘텐츠가 있고 관리 속성에 메타데이터 용어 집합 또는 기타 식별자를 기반으로 하는 태그가 포함된 경우 언어 중립적 토큰화를 선택합니다.

기본적으로 검색은 쿼리와 콘텐츠를 파트(토큰화)로 분할할 때 언어에 따라 달라집니다. 예를 들어 제품 식별자에 "11.132-84-115#4"와 같은 영숫자가 아닌 문자가 있는 영어 및 중국어 제품 데이터시트를 모두 포함하는 문서 라이브러리가 있습니다. 검색에서 데이터시트를 처리할 때 해당 언어를 검색하고 해당 언어에 따라 모든 항목을 토큰화합니다. 사용자가 제품 식별자를 검색할 때 검색은 사용 중인 SharePoint 사이트의 언어 설정에 따라 쿼리를 토큰화합니다. 사이트가 영어로 설정되어 있고 사용자가 중국어 텍스트로 토큰화된 제품 식별자를 검색하는 경우 토큰이 일치하지 않을 수 있으며 사용자는 결과를 얻지 못할 수 있습니다 .

사용자에게 더 나은 결과를 만들려면 언어 중립 토큰화를 사용하도록 설정된 새 관리 속성 "ProductID"에 제품 식별자의 크롤링 속성을 매핑합니다. 사용자에게 ProductID:"11.132-8"와 같은 새 관리 속성에 대해 제품 식별자를 검색하도록 지시합니다.
제품 식별자에 대한 크롤링 속성이 관리 속성 "ProductID"에 매핑된 경우 검색은 "ProductID"에 대한 쿼리에 언어 중립적 토큰화를 사용합니다. 중앙 관리/사이트 모음 관리/테넌트 관리
더 미세한 쿼리 토큰화(SharePoint Server 2019만 해당) 이 설정을 사용하면 사용자가 영숫자가 아닌 문자가 있는 메타데이터를 포함하는 관리 속성에서 검색할 때 더 나은 검색 결과를 얻을 수 있습니다. 이 설정을 사용하면 관리 속성에 대한 쿼리가 느려집니다.

쿼리를 빠르게 입력한 다음 결과를 찾아 찾고 있는 데이터시트를 찾으려는 사용자는 일반적으로 ProductID:"132-884"와 같은 쿼리를 입력합니다. 검색은 기본적으로 검색 인덱스의 콘텐츠를 쿼리보다 작은 부분으로 나누기 때문에 검색에서 이러한 쿼리에 대한 일치 항목을 찾지 못할 수 있습니다. 쿼리가 더 세밀하게 토큰화되면 검색 인덱스와 쿼리의 토큰 간에 일치하는 항목이 있을 가능성이 높습니다. 사용자는 제품 식별자의 중간 또는 마지막 부분을 쿼리할 수도 있습니다.

데이터시트를 검색하고 전체 제품 식별자와 일치하는 결과만 가져올 것으로 예상되는 사용자는 일반적으로 ProductID:"11.132-884-115#4"와 같은 쿼리를 작성합니다. 더 미세한 쿼리 토큰화는 이러한 쿼리에 차이를 만들지 않습니다.
"11.132-884-115#4"를 포함하는 관리 속성 "제품 식별자"가 있는 경우 ProductID:"132-884"와 같은 검색이 결과를 얻을 수 있습니다. 중앙 관리/사이트 모음 관리/테넌트 관리 아니오
크롤링 속성에 매핑 목록에는 이 관리 속성에 매핑된 모든 크롤링 속성이 표시됩니다. 관리 속성은 하나 이상의 크롤링 속성에서 해당 콘텐츠를 가져올 수 있습니다.

모든 크롤링 속성의 콘텐츠를 포함할 수도 있고, 지정된 순서에 따라 비어 있지 않은 첫 번째 크롤링 속성의 콘텐츠를 포함할 수도 있습니다.
중앙 관리/사이트 모음 관리/테넌트 관리
회사 이름 추출(Company name extraction) 시스템에서 새 항목이나 업데이트된 항목을 크롤링할 때 관리 속성의 회사 이름 엔터티를 추출할 수 있습니다. 추출된 엔터티는 나중에 구체화를 설정하는 데 사용할 수 있습니다.

회사 이름 추출용으로 미리 채워진 사전 하나가 제공됩니다. 시스템에서는 인덱스에서 변경되지 않은 원래 관리 속성 콘텐츠와 추출된 엔터티의 복사본을 "회사" 관리 속성에 저장합니다. "회사" 관리 속성은 검색 가능, 쿼리 가능, 조회 가능, 정렬 가능, 구체 검색 가능으로 구성됩니다.

용어 저장소에서 회사 이름 사전을 편집할 수 있습니다.

자세한 내용은 SharePoint Server에서 회사 이름 추출 관리를 참조하세요.

최신 검색 환경에서 지원되지 않습니다.
중앙 관리/사이트 모음 관리/테넌트 관리
사용자 지정 엔터티 추출(Custom entity extraction) 하나 이상의 사용자 지정 엔터티 추출기를 이 관리 속성에 연결할 수 있습니다. 그러면 시스템에서 새 항목이나 업데이트된 항목을 크롤링할 때 관리 속성의 엔터티를 추출할 수 있습니다. 추출된 엔터티는 나중에 구체화를 설정하는 데 사용할 수 있습니다.

자세한 내용은 SharePoint Server에서 사용자 지정 엔터티 추출기 만들기 및 배포를 참조하세요.

최신 검색 환경에서 지원되지 않습니다.
중앙 관리/사이트 모음 관리

참고 항목

SharePoint Server에서 검색 스키마 관리

크롤링 속성 및 관리 SharePoint 서버에서 속성의 개요

SharePoint Server의 크롤링 및 페더레이션 계획