Рекомендации по упорядочению контента для поиска в SharePoint Server

 

**Применимо к:**SharePoint Server 2013, SharePoint Server 2016

**Последнее изменение раздела:**2017-09-04

Сводка. Сведения об упорядочивании контента и метаданных SharePoint Server 2016 и SharePoint Server 2013 для облегчения поиска контента.

Эти рекомендации по упорядочиванию контента SharePoint Server и применению полезных метаданных помогут обеспечить включение в индекс поиска нужного контента и его наличие в результатах поиска.

В этой статье

  • Хранение самого важного контента в SharePoint

  • Упорядочивание контента в иерархиях и использование естественного языка

  • Рекомендация для пользователей вводить более полные и согласованные метаданные для сайтов и контента

  • Управление многоязычным контентом

  • Указание достоверных страниц

Хранение самого важного контента в SharePoint

Если это возможно, храните самый важный контент в SharePoint и выполняйте обход и индексирование как можно большего объема важного контента. Если вы не можете выполнять обход и индексирование контента, рассмотрите возможность федерации результатов из других источников с результатами локального поиска.

Попробуйте организовать контент с похожим значением и важностью в расположенные рядом структуры сайта. Поисковая система автоматически выведет относительную важность, но вы можете напрямую повлиять на важность сайтов, определив достоверный страницы. Дополнительные сведения см. в разделе Указание достоверных страниц.

Важно знать, обход какого контента нужно выполнять и какой контент включать в индекс поиска, но также важно знать, обход какого контента не следует выполнять. Например, вы можете не осуществлять обход и индексацию общих файловых ресурсов резервного копирования. Вы также должны установить процедуры архивации старого контента, удаления низкокачественного контента и поощрять пользователей добавлять даты истечения срока действия в объявления.

Упорядочивание контента в иерархиях и использование естественного языка

Когда вы организуете контент SharePoint в естественные иерархии, пользователям будет проще понять, где они могут находить и хранить контент, а поисковой системе — ранжировать контент и возвращать релевантные результаты поиска.

Плоская структура Структура с иерархией

http://Europe

http://Asia

http://sales

http://sales/Europe

http://sales/Asia

URL-адреса и другие метаданные файлов, такие как имена файлов, анализируются лингвистически поисковой системы. Если вы используете естественный язык для URL-адресов и метаданных, поисковой системе будет легче понять, какая информация находится на сайте или в файле, и она сможет указать соответствующую оценку в результатах. Поисковой системе (и пользователям) намного легче понять такой URL-адрес и такое имя файла, как http://sales/Europe/presentations/phones.ppt, чем http://slseur/p_phones.ppt.

Рекомендация для пользователей вводить более полные и согласованные метаданные для сайтов и контента

Метаданные — это данные, которые предоставляют дополнительную информацию об одном или нескольких аспектах сайтов и контента, например создатель сайта, дата создания сайта и цель контента или сайта. Согласованные и полные метаданные улучшают качество самого контента и также упрощают для поисковой системы обнаружение связей между контентом и позволяют ей предоставлять более точные и релевантные результаты поиска.

Вот некоторые из примеров важных метаданных, которые пользователи должны вводить:

  • заголовок документа;

  • описание сайта;

  • авторы документа;

  • дата создания контента.

Для некоторых типов документов, таких как документы PowerPoint и Word, поисковая система извлекает дополнительные метаданные, такие как заголовки и подзаголовки, из контента и использует эту информацию для возврата нужных результатов поиска и предоставления полноценных сводок о документах.

Для получения нужных результатов поиска также важно, чтобы были введены данные на личных сайтахЛичные сайты и в профилях пользователей, чтобы поисковая система могла использовать эту информацию как метаданные.

Управление многоязычным контентом

Поисковая система обнаруживает язык большинства контента автоматически. Следующие рекомендации позволяют поисковой системе не ошибиться при определении языка.

  • Если возможно, храните контент на разном языке на разных сайтах. Если поисковая система не может определить язык отдельного элемента контента, она предполагает, что используется язык сайта, на котором хранится контент.

  • Избегайте смешивания языков в контенте и метаданных контента. Используйте в метаданных тот же язык, что и в самом контенте.

  • Избегайте смешивания языков в одном элементе метаданных. В основном, это применимо к URL-адресам.

Указание достоверных страниц

Вы можете использовать функцию достоверных страниц в приложении службы поиска для указания сайтов SharePoint с самой релевантной информацией. Результаты поиска с достоверных страниц приоритетнее других результатов поиска.

Вы можете указать три степени достоверности и также указать недостоверные сайты. При определении сайта как достоверного сайты, подключаемые к достоверной странице через гиперссылке также поднимаются в результатах на основе их близости к достоверной странице. Самая достоверная страница содержит ссылки на наиболее релевантную информацию. URL-адреса, обозначенные как недостоверные, получают меньшую оценку, чем другие сайты.

Рекомендуется указывать небольшое число (4-5) достоверных страниц, в противном случае будет сложно предсказать их влияние на результаты поиска.

Дополнительные сведения см. в статье Настройка достоверных страниц в SharePoint Server.