Обзор архитектуры поиска в SharePoint Server

 

**Применимо к:**SharePoint Server 2013, SharePoint Server 2016

**Последнее изменение раздела:**2017-07-24

Сводка. Узнайте об архитектуре, компонентах, базах данных и топологии поиска SharePoint Server.

Архитектура поиска содержит компоненты и базы данных поиска. Структура архитектуры поиска зависит от планируемой области поиска: корпоративная среда или интернет-сайты. При построении архитектуры поиска необходимо учитывать такие факторы, как высокая доступность и отказоустойчивость, объем контента, а также расчетное количество просмотров страниц и запросов в секунду.

Сведения о топологиях поиска для различных сценариев использования см. в статьях Архитектуры поиска в корпоративной среде для SharePoint Server 2016 и Архитектуры поиска на веб-сайтах для SharePoint Server 2016.

В этой статье

  • Обзор компонентов и баз данных поиска

  • О компоненте обхода

  • О компоненте обработки контента

  • О компоненте обработки аналитических данных

  • О компоненте индексирования

  • О компоненте обработки запросов

  • О компоненте администрирования поиска

  • О базе данных обхода

  • О базе данных ссылок

  • О базе данных аналитических отчетов

  • О базе данных администрирования поиска

Обзор компонентов и баз данных поиска

В приведенных ниже таблицах представлены общие сведения о доступных компонентах поиска и базах данных поиска. Дополнительные сведения о взаимодействии этих компонентов и баз данных показаны в схеме статьи Архитектуры поиска для SharePoint Server 2016.

Компоненты поиска

Имя компонента поиска Описание

Компонент обхода

Выполняет обход контента, собирает свойства для обхода и метаданные из обойденных элементов и отправляет их в компонент обработки контента.

Компонент обработки контента

Преобразует обойденные элементы и отправляет их в компонент индексирования. Этот компонент также сопоставляет свойства для обхода с управляемыми свойствами.

Компонент обработки аналитических данных

Выполняет анализ поиска и использования.

Компонент индексирования

Получает обработанные элементы из компонента обработки контента и записывает их в индекс поиска. Этот компонент также обрабатывает входящие запросы, получает данные из индекса поиска и отправляет набор результатов в компонент обработки запросов.

Компонент обработки запросов

Анализирует входящие запросы. Это помогает оптимизировать точность, список возврата и релевантность. Запросы отправляются в компонент индексирования, который возвращает соответствующие наборы результатов поиска.

Компонент администрирования поиска

Запускает системные процессы поиска, а также добавляет и инициализирует новые экземпляры компонентов поиска.

Базы данных поиска

Имя базы данных поиска Описание

База данных обхода

Хранит данные отслеживания и накопленные сведения об обойденных элементах, таких как документы и URL-адреса. Также хранит такие сведения, как время последнего обхода, идентификатор последнего обхода и тип обновления (добавление, обновление, удаление) при последнем обходе.

База данных ссылок

Хранит необработанные данные, извлеченные компонентом обработки контента, а также сведения об использовании результатов поиска. Компонент обработки аналитических данных анализирует эти данные.

База данных аналитических отчетов

Сохраняет результаты анализа использования.

База данных администрирования поиска

Сохраняет данные конфигурации поиска.

О компоненте обхода

Компонент обхода выполняет обход источников контента. Он может обходить различные источники, такие как общие файловые ресурсы, контент SharePoint Server, бизнес-приложения и т. д. Для получения данных компонент обхода подключается к источникам контента, вызывая соответствующий соединитель индексирования или обработчик протокола. После получения контента компонент обхода передает обойденные элементы в компонент обработки контента.

Дополнительные сведения об источниках контента для обхода см. в статье Планирование обхода контента и федерации в SharePoint Server.

О компоненте обработки контента

Компонент обработки контента обрабатывает обойденные элементы и отправляет их в компонент индексирования. Компонент обработки выполняет такие операции, как разбор документов и сопоставление свойств. Он также выполняет лингвистическую обработку, например определение языка и извлечение объектов. Компонент преобразует обойденные элементы в артефакты, включаемые в индекс поиска. Он также записывает сведения о ссылках и URL-адресах в базу данных ссылок.

Дополнительные сведения об обработке контента см. в статье Планирование обхода контента и федерации в SharePoint Server.

О компоненте обработки аналитических данных

Компонент обработки аналитики выполняет два вида анализа: анализ поиска и анализ использования. Этот компонент использует полученную информацию для повышения релевантности поиска, создания отчетов по поиску, а также формирования рекомендаций и прямых ссылок.

  • Анализ поиска позволяет извлечь такую информацию, как ссылки, число щелчков элемента, текст привязки, данные, связанные с пользователями, и метаданные, из базы данных ссылок. Эта информация важна для релевантности.

  • Анализ использования позволяет проанализировать сведения из журнала использования, полученные с интерфейсного веб-сервера через хранилище событий. Анализ использования создает отчеты об использовании и статистические отчеты.

Результаты анализа будут добавлены в элементы индекса поиска. Кроме того, результаты анализа использования хранятся базе данных отчетов анализа.

Дополнительные сведения см. в статье Обзор обработки аналитических данных в SharePoint Server.

О компоненте индексирования

Индекс поиска можно разделить на отдельные части, называемые "разделами индекса". Индекс поиска — это объединение всех разделов индекса. Каждый раздел содержит одну или несколько реплик индекса с одинаковой информацией. Для обеспечения отказоустойчивости и избыточности создайте дополнительные реплики индекса для каждого раздела и скопируйте реплики на несколько серверов.

Компонент индексирования — это логическое представление реплики индекса. В топологии поиска необходимо подготовить по одному компоненту индексирования для каждой реплики индекса.

Компонент индексирования:

  • Получает обработанные элементы из компонента обработки контента и записывает их в файл индекса. Файлы индекса хранятся на диске сервера, на котором размещен компонент индексирования.

  • Получает запросы из компонента обработки запросов и возвращает наборы результатов.

Дополнительные сведения о схеме и индексе поиска см. в статье Обзор схемы поиска в SharePoint Server.

О компоненте обработки запросов

Компонент обработки запросов анализирует и обрабатывает запросы и результаты. Он выполняет такие операции лингвистической обработки, как разбиение на слова и выделение корней. Получая запрос от интерфейсного веб-сервера поиска, компонент анализирует и обрабатывает его для оптимизации точности, списка возврата и релевантности. Обработанный запрос отправляется в компонент индексирования. Компонент индексирования возвращает набор результатов в компонент обработки запросов, который обрабатывает его перед отправкой на интерфейсный сервер поиска.

Дополнительные сведения см. в статье Планирование преобразования запросов и упорядочивания результатов в SharePoint Server.

О компоненте администрирования поиска

Компонент администрирования поиска запускает системные процессы для поиска. Этот компонент выполняет подготовку, то есть добавляет и инициализирует экземпляры других компонентов поиска.

О базе данных обхода

База данных обхода хранит данные отслеживания и накопленные сведения об обойденных элементах. Например, в ней хранятся сведения о времени последнего обхода, идентификаторе последнего обхода и типе обновления при последнем обходе.

О базе данных ссылок

База данных ссылок хранит сведения, извлеченные компонентом обработки контента. В ней также хранятся сведения о количестве переходов пользователей по результатам поиска. Эти данные хранятся в необработанном виде и анализируются компонентом обработки аналитических данных.

О базе данных аналитических отчетов

База данных отчетов анализа хранит результаты анализа использования. Кроме того, в ней хранятся статистические данные анализа. SharePoint Server использует эту информацию для создания отчетов Excel, показывающих различные статистические данные.

О базе данных администрирования поиска

База данных администрирования поиска хранит данные конфигурации поиска, такие как топология, правила обхода, правила запросов и сопоставления между свойствами, для которых был выполнен обход, и управляемыми свойствами. В ней также хранится список управления доступом (ACL) для компонента обхода. Для каждого приложения-службы поиска может существовать только одна база данных администрирования поиска.

See also

Управление топологией поиска в SharePoint Server