Обзор обработки аналитических данных в SharePoint Server

 

**Применимо к:**SharePoint Server 2013, SharePoint Server 2016

**Последнее изменение раздела:**2017-07-24

Сводка. Узнайте, как компонент обработки аналитических сведений анализирует контент и пользовательские действия по улучшению релевантности поиска.

Чтобы найти и отобразить нужный и релевантный контент, компонент обработки аналитических сведений в SharePoint Server анализирует как сам контент, так и работу с ним пользователей. Результаты анализа добавляются к элементам в индексе поиска, что со временем автоматически улучшает релевантность поиска. Кроме того, результаты используются в отчетах, чтобы помочь администраторам поиска в определении ручных действий по улучшению поисковой системы.

В этой статье

  • Архитектура аналитики

  • Различные типы анализов

  • События использования по умолчанию, которые применяются в аналитике использования

  • Отчетность на основе обработки аналитических сведений

Архитектура аналитики

Архитектура аналитики состоит из трех основных частей.

  • Компонент обработки аналитических сведений выполняет задания аналитической обработки. Дополнительные сведения см. в разделе Различные типы анализов.

  • База данных аналитической отчетности хранит статистические сведения, такие как счетчики событий использования, взятые из различных анализов. SharePoint Server использует сведения из этой базы данных для создания отчетов Excel для администраторов поиска. Дополнительные сведения см. в разделах Аналитика использования и Отчеты, основанные на обработке аналитических сведений.

  • База данных ссылок хранит сведения о поисках и документах, обработанных во время обхода контента. Данные в этой базе обрабатываются различными подкомпонентами анализа. Дополнительные сведения см. в разделе Аналитика поиска.

Различные типы анализов

Компонент обработки аналитических сведений выполняет два основных типа анализа: аналитика поиска и аналитика использования. Аналитика поиска служит для анализа контента в поисковом индексе, а аналитика использования — для анализа пользовательских действий.

  • Аналитика поиска служит для анализа контента, который был добавлен в индекс поиска после обхода.

  • Аналитика использования служит для анализа действий пользователей или событий использования, таких как переходы или просмотр элементов, на сайте SharePoint Server.

Аналитика поиска

Аналитика поиска — это набор отдельных анализов, которые получают из контента такие сведения, как ссылки и текст привязки, по мере обхода и обработки контента и сохраняют полученные данные в индекс поиска. Извлеченные сведения сохраняются в базе данных ссылок вместе со сведениями о количестве щелчков результатов поиска. Сведения в базе данных ссылок далее обрабатываются в различных подкомпонентах анализа.

Сведения, полученные в результате аналитики поиска, используются для улучшения индекса поиска благодаря данным, которые могут повысить релевантность и быстроту вывода результатов, и сохраняются в базе данных отчетности для последующего включения в отчеты.

Анализы в аналитике поиска

Анализ Описание

Обработка текста привязки

Обработка текстов привязок служит для анализа взаимосвязи элементов контента. Кроме того, сюда включаются тексты привязок, связанные со ссылками в анализе. Компонент обработки аналитических сведений использует результаты этого анализа для добавления баллов рейтинга к элементам в индексе поиска.

Количество переходов

Анализ количества переходов вычисляет количество щелчков между достоверной страницей и элементами в индексе поиска. Достоверная страница может быть сайтом верхнего уровня, например https://www.contoso.com, или другими страницами, которые считаются важными. Достоверные страницы определяются в Центр администрирования.

Компонент обработки аналитических сведений использует результаты этого анализа для ранжирования элементов в индексе поиска.

Переходы в поиске

Анализ переходов в результатах поиска задействует сведения о том, какие элементы щелкали пользователи в результатах поиска, чтобы просмотреть элементы в индексе поиска. Этот анализ вычисляет новое ранжирование элементов относительно базовой релевантности.

Данные о переходах сохраняются в базе данных ссылок.

Социальные теги

Анализ социальных тегов работает со словами или фразами, которые пользователи могут применять к контенту для распределения контента по понятным категориям.

В SharePoint Server социальные теги не используются по умолчанию для уточнения, ранжирования или отзыва. Однако можно создать пользовательские условия поиска, в которых используются социальные теги и сведения из этого анализа.

Социальная дистанция

При анализе социальной дистанции вычисляются отношения между пользователями, использующими функцию подписки. Анализ вычисляет первый и второй уровни подписок: сначала первый уровень подписки, затем подписку на первого подписчика.

Эти сведения используются для упорядочивания результатов поиска людей по социальной дистанции.

Отчеты о поиске

Анализ отчетов о поиске сводит воедино данные и сохраняет эти данные в базе данных аналитической отчетности, где они используются для создания следующих отчетов поиска:

  • Количество запросов

  • Самые популярные запросы

  • Прерванные запросы

  • Безрезультатные запросы

  • Использование правил запросов

Данные отчетов сохраняются в приложении-службе поиска, а не в элементах индекса поиска. Если удалить приложение-службу поиска, данные отчетов также будут удалены.

Прямые ссылки

В анализе прямых ссылок используются сведения о том, что пользователи фактически выбирали в результатах поиска для определения самых важных вложенных страниц на сайте. Эти страницы отображаются в результатах поиска как важные ссылки на сайте, а пользователи могут получать доступ к релевантным вложенным страницам напрямую в результатах поиска.

Аналитика использования

Аналитика использования — это ряд анализов, которые используют сведения о действиях пользователей или событиях использования, таких как переходы или просмотр элементов, на сайте SharePoint Server. Аналитика использования объединяет эти сведения с данными из анализов поиска по обойденному контенту, а затем обрабатывает эти данные. Сведения о рекомендациях и событиях использования добавляются в индекс поиска. Статистика по различным событиям использования добавляется в индекс поиска и отправляется в базу данных отчетов аналитики.

Набор событий использования по умолчанию уже определен. События по умолчанию всегда регистрируются и анализируются в SharePoint Server. Вы также можете настроить пользовательские типы событий. Дополнительные сведения о событиях использования по умолчанию см. в статье События использования, обрабатываемые аналитикой использования.

Анализы в аналитике использования

Анализ Описание

Счетчики использования

Анализ счетчиков использования служит для анализа таких событий, как просмотр и переход по элементам. Анализ вычисляет, сколько раз открывается элемент в целом, не только со страницы результатов поиска, но и, например, при открытии документа в Word или выборе его в библиотеке SharePoint Server.

Анализ вычисляет как недавние события, так и все связанные события для всех определенных типов событий. По умолчанию недавними событиями считаются события за последние 14 дней, однако можно задать значение от 1 до 14 дней (на локальных ресурсах). Статистические данные агрегируются на уровне сайта, на уровне семейства сайтов и на уровне клиента (SPO).

События использования сохраняются временно на интерфейсном веб-сервере и передаются в приложение-службу поиска каждые 15 минут. События использования хранятся на диске 14 дней до удаления. Ежедневно анализируются данные по счетчикам использования за весь прошедший день.

Счетчики использования добавляются к элементам в индексе поиска для повышения релевантности поиска. Сведения также сохраняются в базе данных аналитической отчетности и могут использоваться для отображения популярных элементов на сайте.

Рекомендации

Анализ рекомендаций создает рекомендации между элементами на основе взаимодействия пользователей с элементами на сайте. В анализе используются те же события, что и при анализе счетчиков использования, однако оцениваются другие схемы использования. Анализ вычисляет отношения между элементами и добавляет эти сведения к элементам в индексе поиска.

Эти данные могут использоваться для отображения рекомендаций на сайте, например «Вместе с этим также смотрят».

Данные сохраняются в базе данных аналитической отчетности в целях восстановления. Отчеты, связанные с рекомендациями, основаны на анализе счетчиков использования.

Ранжирование активности

Анализ ранжирования активности задействует отслеживание активности по событиям использования (частота событий), что влияет на релевантность поиска. Элементы с высокой степенью активности использования (переходы и просмотры), как правило, получают более высокий ранг активности по сравнению с менее популярными элементами.

Анализ определяет тенденции в активности элементов. Если подсчитывается только количество событий, более старые элементы, как правило «побеждают» в плане релевантности, так как старые документы дольше учитывались при сборе данных по активности. Отслеживание активности позволяет присваивать высокий ранг более новым документам с высокой степенью активности.

События использования, которые применяются в аналитике использования

SharePoint Server включает следующие события использования по умолчанию:

  • Просмотры

  • Отображение рекомендаций

  • Переходы по рекомендациям

Кроме событий по умолчанию можно добавить до двенадцати настраиваемых событий. Например, можно добавить настраиваемое событие, которое отслеживает частоту открытия элемента с мобильной платформы.

Все события использования подсчитываются для каждого элемента, семейства сайтов и клиента (SPO).

Отчеты на основе обработки аналитических сведений

Компонент обработки аналитических данных создает данные, используемые для создания следующих отчетов по использованию:

  • Тренды популярности. Отчет Excel, в котором отображается ежедневное и ежемесячное количество событий использования для семейства веб-сайтов, сайта или определенного элемента в библиотеке или списке SharePoint.

    Примечание

    Счетчик Уникальные пользователи показывает число уникальных пользователей в день, а счетчик Уникальные пользователиза месяц показывает результат суммы СУММ(UU/Day) за месяц.

  • Самые популярные элементы. Отображает события использования по рангу для всех элементов библиотеке или списка, например самых просматриваемых элементов в библиотеке или списке. Ранги можно сортировать по недавним событиям или событиям за все время.

Защита конфиденциальности данных, собранных компонентом обработки аналитических сведений

Компонент обработки аналитики собирает, в том числе, и персональные данные. SharePoint Server предоставляет различные функции для защиты конфиденциальности этих данных.

Для каждого события использования компонент обработки аналитических сведений заносит в журнал следующие сведения:

  • URL-адрес элемента, для которого произошло событие использования;

  • свойства SiteID, WebID и TenantID расположения, в котором произошло событие использования;

  • время и дата события использования;

  • замаскированный идентификатор пользователя, вызвавшего событие использования.

Эти данные хранятся в приложении-службе поиска, пока не будут обработаны компонентом обработки аналитических сведений. Данные автоматически удаляются через 30 дней. Результаты обработки данных представлены в приведенном ниже списке.

  • Общее количество событий использования.

  • Общее количество уникальных событий использования.

  • Рекомендации для каждого элемента.

  • Возможности, связанные с релевантностью.

Эти результаты хранятся в базе данных аналитических отчетов и в индексе поиска. В результате обработки данных не сохраняется никаких сведений о пользователях. Замаскированный идентификатор пользователя применяется только при подсчете количества уникальных событий использования и рекомендаций для каждого элемента.

Результаты можно просмотреть в двух отчетах об использовании. Дополнительные сведения см. в статье Просмотр отчетов об использовании в SharePoint Server.

Файлы cookie использования не включены для веб-приложения SharePoint Server по умолчанию. В SharePoint Server вы можете применять такой тип файлов cookie для веб-приложения SharePoint, чтобы создавать счетчики уникальных пользователей и рекомендации относительно каждого элемента для сайтов, которые посещают анонимные пользователи. Когда вы включите такие файлы cookie, будет создан уникальный GUID, используемый при обработке данных как идентификатор пользователя. Этот GUID доступный в течение всего времени существования файла cookie (14 дней).

Важно!

Локальные юридические ограничения могут применяться, если вы включили файлы cookie на сайтах с анонимными пользователями.

Чтобы разрешить использование файлов cookie для веб-приложения SharePoint, просмотрите статью Изменение общих параметров веб-приложения в SharePoint 2013. Эта статья также относится к SharePoint Server 2016.