SharePoint Server의 분석 처리 개요

적용 대상:yes-img-132013 yes-img-162016 yes-img-192019 yes-img-seSubscription Edition no-img-sopSharePoint in Microsoft 365

사용자가 가장 유용하고 관련성이 있다고 생각하는 콘텐츠를 식별하고 노출할 수 있도록 SharePoint Server의 분석 처리 구성 요소는 콘텐츠 자체와 사용자가 상호 작용하는 방식을 모두 분석합니다. 이러한 분석 결과는 검색 인덱스의 항목에 추가되므로 시간이 경과하면서 관련 검색 기능이 자동으로 향상됩니다. 그뿐만 아니라 분석 결과는 검색 관리자가 검색 시스템을 개선하기 위해 직접 수행할 수 있는 작업을 파악하는 데 도움을 주는 보고서에도 사용됩니다.

분석 아키텍처

분석 아키텍처는 다음과 같은 주요 부분으로 구성됩니다.

  • 분석 작업을 실행하는 분석 처리 구성 요소. 자세한 내용은 다양한 분석 유형을 참조하십시오.

  • 사용 이벤트 수와 같은 여러 분석의 통계 정보를 저장하는 분석 보고 데이터베이스. SharePoint Server는 이 데이터베이스의 정보를 사용하여 검색 관리자를 위한 Excel 보고서를 만듭니다. 자세한 내용은 사용 현황 분석분석 처리 기반 보고서를 참조하십시오.

  • 검색 및 크롤링된 문서에 대한 정보를 저장하는 링크 데이터베이스. 이 데이터베이스의 데이터는 여러 하위 분석에서 처리됩니다. 자세한 내용은 검색 분석을 참조하십시오.

다양한 분석 유형

분석 처리 구성 요소가 실행하는 두 가지 주요 분석 유형은 검색 분석사용 현황 분석입니다. 검색 분석에서는 검색 인덱스의 콘텐츠를 분석하고 사용 현황 분석에서는 사용자 작업을 분석합니다.

  • 검색 분석에서는 크롤링되어 검색 인덱스에 추가되는 콘텐츠를 분석합니다.

  • 사용 현황 분석에서는 SharePoint Server 사이트의 사용자 작업, 즉 사용 이벤트(예: 클릭, 항목 보기 등)를 분석합니다.

검색 분석

검색 분석은 크롤링 및 처리되어 검색 인덱스에 저장되는 콘텐츠에서 링크 및 고정 텍스트와 같은 정보를 추출하는 분석 집합입니다. 추출된 정보는 검색 결과 클릭 관련 정보와 함께 링크 데이터베이스에 저장됩니다. 링크 데이터베이스의 정보는 여러 하위 분석에서 추가로 처리됩니다.

검색 분석에서 제공되는 정보는 관련성 및 회수를 개선하는 정보로 검색 인덱스의 항목을 보완하는 데 사용되며, 보고 데이터베이스에 저장되고 보고서에 포함됩니다.

검색 분석에서 수행되는 분석

분석 설명
고정 텍스트 처리 고정 텍스트 처리에서는 콘텐츠 모음의 항목이 상호 링크되는 방식을 분석합니다. 또한 링크와 연결된 고정 텍스트도 분석에 포함됩니다. 분석 처리 구성 요소는 이 분석의 결과를 사용하여 검색 인덱스의 항목에 순위 포인트를 추가합니다.
클릭 횟수 클릭 횟수 분석에서는 신뢰할 수 있는 페이지에서 검색 인덱스의 항목까지 이동하기 위한 클릭 수를 계산합니다. 신뢰할 수 있는 페이지는 최상위 사이트(예 https://www.contoso.com: ) 또는 중요한 것으로 표시되는 다른 페이지일 수 있습니다. 중앙 관리에서 신뢰할 수 있는 페이지를 정의할 수 있습니다.

분석 처리 구성 요소는 이 분석의 결과를 사용하여 검색 인덱스의 항목에 순위 포인트를 추가합니다.
검색 클릭 검색 클릭 분석에서는 사용자가 검색 인덱스의 항목 수준을 올리거나 내리기 위해 검색 결과에서 클릭하는 항목에 대한 정보를 사용합니다. 이 분석은 기준 관련성과 비교한 새 항목 순위를 계산합니다.

클릭 데이터는 링크 데이터베이스에 저장됩니다.
공유 태그 공유 태그 분석에서는 사용자가 자신에게 의미 있는 방식으로 정보를 분류하기 위해 콘텐츠에 적용할 수 있는 단어나 구인 공유 태그를 분석합니다.

SharePoint Server에서 소셜 태그는 기본적으로 구체화, 순위 지정 또는 회수에 사용되지 않습니다. 그러나 공유 태그 및 이 분석의 정보를 사용하는 사용자 지정 검색 환경을 만들 수 있습니다.
사회적 거리 소셜 거리 분석은 팔로우 사람 기능을 사용하는 사용자 간의 관계를 계산합니다. 분석은 첫 번째 및 두 번째 수준 Followings: 첫 번째 수준 다음을 계산한 다음, 다음을 계산합니다.

이 분석의 정보는 사회적 거리를 기준으로 사용자 검색 결과를 정렬하는 데 사용됩니다.
검색 보고서 검색 보고서 분석에서는 데이터를 집계하여 분석 보고 데이터베이스에 저장합니다. 이 데이터는 다음과 같은 검색 보고서를 생성하는 데 사용됩니다.

쿼리 수

가장 많이 사용하는 쿼리

중단된 쿼리

결과 없는 쿼리

쿼리 규칙 사용 현황

보고서 정보는 검색 인덱스의 항목과 함께 저장되는 것이 아니라 Search Service 응용 프로그램에 저장됩니다. Search Service 응용 프로그램을 삭제하면 보고서 정보도 삭제됩니다.
딥 링크 딥 링크 분석에서는 사용자가 검색 결과에서 실제로 클릭하는 항목에 대한 정보를 사용하여 사이트에서 가장 중요한 하위 페이지를 계산합니다. 이러한 페이지는 검색 결과에서 사이트에 대한 중요 바로 가기로 표시되며 사용자는 검색 결과에서 관련 하위 페이지에 바로 액세스할 수 있습니다.

사용 현황 분석

사용 현황 분석은 SharePoint Server 사이트에서 사용자 작업 또는 클릭 또는 보기 항목과 같은 사용 이벤트에 대한 정보를 수신하는 분석 집합입니다. 사용 현황 분석에서는 이 정보를 검색 분석에서 크롤링된 콘텐츠에 대한 정보와 결합하고 정보를 처리합니다. 추천 및 사용 이벤트에 대한 정보는 검색 인덱스에 추가됩니다. 다양한 사용 이벤트에 대한 통계가 검색 인덱스에 추가되고 Analytics 보고 데이터베이스로 전송됩니다.

기본 사용 이벤트 집합은 기본적으로 정의됩니다. 기본 이벤트는 항상 SharePoint Server에 의해 등록 및 분석됩니다. 사용자 지정 이벤트 유형을 구성할 수도 있습니다. 기본 사용 이벤트에 대한 자세한 내용은 사용 현황 분석에서 사용되는 사용 이벤트를 참조하세요.

사용 현황 분석에서 수행되는 분석

분석 설명
사용 횟수 사용량 계산 분석은 보기 또는 클릭 항목과 같은 이벤트를 분석합니다. 이 분석은 검색 결과 페이지뿐만 아니라 Word 문서를 열거나 SharePoint Server 라이브러리에서 클릭한 경우와 같이 항목이 전체적으로 열리는 횟수를 계산합니다.

이 분석에서는 정의된 모든 이벤트 유형에 대해 최근 이벤트와 전체 이벤트를 둘 다 계산합니다. 기본적으로 최근 이벤트는 지난 14일로 설정되지만 1~14일(온-프레미스) 사이에 설정할 수 있습니다. 통계 데이터는 사이트 수준, 사이트 모음 수준 및 organization 수준(Microsoft 365의 SharePoint)에서 집계됩니다.

사용 이벤트는 웹 프런트 엔드에 일시적으로 저장된 다음 15분마다 Search Service 응용 프로그램으로 푸시됩니다. 사용 이벤트는 삭제될 때까지 최대 14일 동안 디스크에 보관됩니다. 전날의 종일 사용 횟수 데이터가 매일 분석됩니다.

사용 횟수는 검색 관련성을 개선하기 위해 검색 인덱스의 항목에 추가됩니다. 또한 이 정보는 분석 보고 데이터베이스에도 저장되며 사이트에서 자주 사용하는 항목을 표시하는 데 사용할 수 있습니다.
추천 추천 분석에서는 사용자가 사이트의 항목과 상호 작용한 방식에 따라 항목 간의 추천을 작성합니다. 이 분석은 사용 횟수와 동일한 이벤트 파일을 사용하지만 사용 현황의 패턴을 확인합니다. 항목 간 관계 그래프가 계산되며 해당 정보가 검색 인덱스의 항목에 추가됩니다.

이 분석의 정보를 사용하여 사이트에서 "이 항목을 본 사용자가 함께 본 항목"과 같은 추천을 표시할 수 있습니다.

데이터는 복구용으로 분석 보고 데이터베이스에 저장됩니다. 추천과 관련된 보고서는 사용 횟수 분석을 기반으로 합니다.
작업 순위 작업 순위 분석에서는 사용 이벤트의 작업 추적(이벤트 비율)을 사용하여 검색 관련성을 조정합니다. 일반적으로 사용 작업(클릭 또는 보기) 횟수가 많은 항목의 작업 순위 점수가 작업 횟수가 적은 항목보다 높습니다.

분석은 항목 작업의 추세를 찾습니다. 이벤트 수만 계산하는 경우 이전 문서에서 활동을 수집하는 데 더 많은 시간이 있었기 때문에 일반적으로 이전 항목이 관련성에서 "승리"됩니다. 활동 추적은 사용량이 많은 최신 문서가 더 높은 순위를 얻는 데 도움이 됩니다.

사용 현황 분석에서 사용되는 사용 이벤트

SharePoint Server에는 다음과 같은 기본 사용 이벤트가 포함됩니다.

  • 보기

  • 표시된 추천

  • 클릭한 추천

기본 이벤트 외에 사용자 지정 이벤트를 12개까지 추가할 수 있습니다. 예를 들어 모바일 플랫폼에서 항목에 액세스하는 빈도를 추적하는 사용자 지정 이벤트를 추가할 수 있습니다.

모든 사용 이벤트는 항목, 사이트 모음 및 테넌트당 계산됩니다(Microsoft 365의 SharePoint).

분석 처리 기반 보고서

분석 처리 구성 요소는 다음과 같은 사용 현황 보고서를 만드는 데 사용되는 데이터를 생성합니다.

  • 인기 추세 SharePoint 라이브러리 또는 목록의 사이트 모음, 사이트 또는 특정 항목에 대한 사용 이벤트당 일별/월별 횟수를 표시하는 Excel 보고서입니다.

    참고

    고유 사용자는 일별 고유 사용자 수를 표시하고 월별 고유 사용자는해당 월 의 SUM(UU/Day)을 표시합니다.

  • 가장 인기 있는 항목 라이브러리 또는 목록의 모든 항목 (예: 라이브러리 또는 목록에서 가장 많이 본 항목)에 대한 사용량 이벤트당 순위를 표시합니다. 순위는 최근 또는 별로 정렬할 수 있습니다.

분석 처리 구성 요소가 수집한 데이터의 개인 정보 보호

분석 처리 구성 요소는 개인 식별 정보와 관련된 데이터의 해당 부분을 수집합니다. SharePoint Server에는 이 정보의 개인 정보를 보호하는 다양한 기능이 있습니다.

분석 처리 구성 요소는 각 사용 이벤트에 대한 다음과 같은 정보를 기록합니다.

  • 사용 이벤트가 발생한 항목의 URL

  • 사용 이벤트가 발생한 사이트 ID, 웹 ID 및 테넌트 ID

  • 사용 이벤트가 발생한 날짜와 시간

  • 사용 이벤트를 발생시킨 사용자의 애매한 사용자 ID

이 데이터는 Search Service 응용 프로그램에 저장되었다가 분석 처리 구성 요소에서 처리됩니다. 데이터는 30일 후에 자동으로 제거됩니다. 다음 목록에는 데이터 처리 결과가 나와 있습니다.

  • 사용 이벤트의 총수

  • 고유한 사용 이벤트의 총수

  • 항목 간 권장 사항

  • 관련성 기능

이러한 결과는 분석 보고 데이터베이스와 검색 인덱스에 저장됩니다. 사용자 정보는 데이터 처리의 결과로 저장되지 않습니다. 애매한 사용자 ID는 고유한 사용 이벤트 수를 계산할 때와 항목 간 권장 사항을 계산할 때에만 사용됩니다.

두 사용 현황 보고서에서 결과를 확인할 수 있습니다. 자세한 내용은 SharePoint Server에서 사용 현황 보고서 보기를 참조하세요.

익명 사용자가 있는 사이트의 사용 현황 쿠키

기본적으로 사용 쿠키는 SharePoint Server 웹 애플리케이션에 대해 사용하도록 설정되지 않습니다. 익명 사용자가 있는 사이트에 대한 고유한 사용자 수 및 항목 대 항목 권장 사항을 생성하기 위해 SharePoint Server를 사용하면 SharePoint 웹 애플리케이션에 사용 쿠키를 사용할 수 있습니다. 사용 현황 쿠키를 사용하도록 설정하면 데이터가 처리되는 동안 사용자 ID로 사용되는 고유한 GUID가 생성됩니다. 이 GUID는 쿠키의 수명 동안 사용할 수 있으며, 데이터가 처리되는 동안 사용자 ID로 사용됩니다. 쿠키의 수명은 14일입니다.

중요

익명 사용자가 포함된 사이트에서 쿠키를 사용하도록 설정할 경우 현지의 법적 제한 사항이 적용될 수 있습니다.

SharePoint 웹 애플리케이션에 사용 쿠키를 사용하도록 설정하려면 SharePoint Server에서 웹 애플리케이션의 일반 설정 편집을 참조하세요. 이 문서는 SharePoint Server 2016에도 적용됩니다.