Планирование глобального корпоративного поиска

Содержание

  • Рекомендуемые архитектуры поиска

  • Централизованный поиск

  • Региональные поставщики общих служб с синхронизированным контентом

  • Централизованный поиск в сочетании с распределенным поиском

  • Распределенный поиск

  • Федеративный поиск

Рекомендуемые архитектуры поиска

Если планируется развернуть несколько ферм серверов на основе Microsoft Office SharePoint Server 2007 в разных географических расположениях, можно применять несколько архитектур поиска, эффективных в средах глобальной сети. Эти архитектуры обсуждаются в данной статье. Указанная далее модель, выполненная в размере плаката, предоставляет обзор поддерживаемых глобальных решений и рекомендуемых архитектур поиска: Развертывание сервера Microsoft Office SharePoint Server для в разных географических расположениях (на английском языке) (https://go.microsoft.com/fwlink/?linkid=110982&clcid=0x419) (на английском языке). Эта модель создана в программе Microsoft Office Visio. Если программа Visio не установлена можно бесплатно загрузить средство просмотра (на английском языке) (https://go.microsoft.com/fwlink/?linkid=73526&clcid=0x419) (на английском языке). Для печати этого файла более всего подходит плоттер.

Примечание

Этот автор публикации еще не обносил данные об архитектуре федеративного поиска.

Планирование архитектуры поиска обеспечивает оптимальное сочетание указанных далее типов требований на основе приоритетов организации.

  • Взаимодействие с пользователем при поиске контента с помощью поисковых запросов. Взаимодействие с пользователем включает:

    • решение проблем производительности, связанных с выполнением поискового запроса и получением результатов поиска;

    • релевантность и полнота получаемых результатов;

  • решение проблем производительности, связанных с обходом контента по глобальной сети;

  • затраты на администрирование глобальной среды поиска.

В некоторых случаях понимание возможностей архитектуры поиска в среде глобальной сети помогает определить, какие поддерживаемые глобальные решения оптимально подходят для организации. Дополнительные сведения об этих решениях см. в статье Поддерживаемые глобальные решения для Office SharePoint Server.

В этой статье не обсуждаются показатели производительности при выполнении поисковых запросов по глобальной сети и при обходе контента через глобальную сеть. Однако понимание того факта, насколько среда глобальной сети поддерживает эти типы операций, критически важно для планирования глобальной среды. Дополнительные сведения о методах работы сервера Office SharePoint Server 2007 по глобальной сети см. в статье Планирование требований к пропускной способности.

Централизованный поиск

В архитектуре централизованного поиска служба поиска на центральной ферме обходит контент на всех региональных фермах. Поисковые запросы региональных пользователей отправляются на центральную ферму.

На следующем рисунке показана архитектура централизованного поиска.

Централизованная архитектура — развертывание с поддержкой глобального поиска

Если каналы связи глобальной сети поддерживают обход контента на региональных сайтах, то рекомендуется использовать именно эту архитектуру, поскольку она обеспечивает стандартизированное взаимодействие с пользователями, включая перечисленные ниже аспекты.

  • Пользователи всегда получают доступ к центральной ферме для поиска.

  • В результатах поиска обеспечивается точное соответствие запросу.

  • Пользователи могут выполнять поиск по всему контенту в рамках организации на основе имеющихся разрешений на просмотр.

Однако у этой архитектуры есть один недостаток. Не существует способа установить приоритеты и выделить локальный контент в результатах поиска, если только диапазон поиска не создается на основе расположения контента на ферме. Т. е. если пользователь регионального сайта ищет документ, хранящийся на региональном сайте, то не существует простого способа определить, где находятся документы, указанные в результатах поиска.

Если пропускная способность каналов связи глобальной сети низкая, то эта архитектура может добавить некоторые риски. Обход контента может перегрузить канал связи глобальной сети, что снижает производительность обслуживания запросов пользователей. Если существует большой объем часто изменяющихся данных, то операции индексирования могут не справиться с изменениями. Однако существуют способы оптимизации приложения Office SharePoint Server 2007 для повышения эффективности обхода контента через глобальную сеть. Эти способы позволяют уменьшить время индексирования и сетевой трафик, используемый в его процессе. Дополнительные сведения см. в разделе "Оптимизация обхода контента" статьи Оптимизация Office SharePoint Server для сред глобальной сети.

И наконец, несмотря на то что каналы связи глобальной сети всегда оказывают влияние при удаленном обходе контента — и, соответственно, определяют целесообразность использования архитектуры централизованного поиска, — медленные каналы связи глобальной сети также имеют важное значение для эффективности поиска, выполняемого региональными пользователями. Медленные каналы связи глобальной сети могут заставить пользователей отказаться от выполнения запросов. Можно оптимизировать производительность глобальной сети в рабочие часы, планируя обход контента и другие операции, снижающие производительность, на часы наименьшей нагрузки. Однако даже с учетом оптимизации следует определить, насколько эффективно архитектура централизованного поиска обслуживает потребности региональных пользователей по существующим каналам связи глобальной сети.

Во многих случаях использование архитектуры централизованного поиска помогает масштабировать сервер Office SharePoint Server 2007 для предоставления служб региональным пользователям.

В следующей таблице приведено обобщение компромиссных решений в архитектуре централизованного поиска.

Преимущества Недостатки

Сохраняется соответствие результатов поиска отправленным запросам.

Управление поставщиками общих служб осуществляется централизованно.

Обход контента через глобальную сеть снижает пропускную способность глобальной сети.

Поддержание актуальности индексации может представлять собой проблему в средах с большими объемами часто изменяющихся данных.

Производительность запросов зависит от производительности ссылок глобальной сети.

Региональные поставщики общих служб с синхронизированным контентом

Если каналы связи глобальной сети не поддерживают архитектуру централизованного поиска и требуется предоставить поиск в качестве службы для региональных сайтов, то можно разместить поставщики общих служб на каждом региональном сайте.

Существует несколько различных архитектур поиска, позволяющих разместить поставщики общих служб на региональных сайтах. Первая из этих архитектур использует синхронизацию контента в рамках организации, чтобы на каждом региональном сайте присутствовала копия всего контента, необходимого сотрудникам регионального сайта. Такой подход к управлению контентом в рамках всей организации описан в статье Разработка глобальной информационной архитектуры и системы управления. Поскольку контент синхронизируется, то нет необходимости обходить контент удаленно через глобальную сеть.

Эта архитектура показана на следующем рисунке.

Синхронизированная архитектура поиска

Пояснение к рисунку

  • Проекты, готовые к распространению в рамках организации, публикуются на центральном сайте, независимо от места создания контента.

  • После публикации контента на центральном сайте выполняется синхронизация версий проектов, доступных только для чтения, на всех сайтах.

  • На каждой ферме служба поиска обходит только контент в рамках фермы.

Аналогичным образом, сведения о компании так же синхронизируются в рамках организации, что отображено на следующем рисунке.

Сценарий глобального поиска с помощью поставщика общих услуг

Хотя эта архитектура снимает потребность в обходе контента через глобальную сеть, требуется использовать каналы связи глобальной сети для синхронизации контента в рамках среды. Чтобы минимизировать влияние на производительность глобальной сети, можно запланировать эти операции на часы наименьшей нагрузки. Основным преимуществом является то, что региональные пользователи получают локальный доступ к контенту с помощью локальной службы поиска. В этой архитектуре использование каналов связи глобальной сети осуществляется по плану и под контролем, и пользователи не испытывают затруднений с производительностью каналов связи глобальной сети при выполнении своих рабочих обязанностей.

В следующей таблице приведено обобщение компромиссных решений в данной архитектуре поиска.

Преимущества Недостатки

Обход контента выполняется локально.

Производительность поисковых запросов не зависит от производительности каналов связи глобальной сети.

В результатах поиска обеспечивается точное соответствие запросу для каждой фермы.

Использование нескольких поставщиков общих служб приводит к повышению административных затрат.

Синхронизация контента в рамках организации повышает сложность решения.

Централизованный поиск в сочетании с распределенным поиском

Можно разработать архитектуру поиска, сочетающую централизованный и распределенный поиск. В этой архитектуре служба поиска каждого региона выполняет обход всего контента этого региона, а центральная ферма выполняет обход контента в рамках всех ферм организации.

В этой архитектуре региональные пользователи могут искать локальный контент без использования каналов связи глобальной сети. Региональные пользователи могут также осуществлять поиск в рамках всей организации, отправляя запросы на центральную ферму.

На следующем рисунке показана архитектура, сочетающая централизованный поиск и распределенный поиск.

Настройка фермы для распределенного и централизованного поиска

Пояснение к схеме

  • На каждой ферме размещен поставщик общих служб. Служба поиска, предоставляемая локальным поставщиком общих служб, выполняет обход локального контента на каждой региональной ферме.

  • Служба поиска, предоставляемая поставщиком общих служб на центральной ферме, также выполняет обход контента на региональных фермах.

Основным преимуществом данной архитектуры является оптимизация производительности запросов к локальному контенту с одновременным предоставлением возможности глобального поиска. Эта архитектура обеспечивает эффективность в следующих условиях.

  • Региональные сотрудники используют поиск в основном для доступа к локальному контенту.

  • Каналы связи глобальной сети поддерживают обход контента на региональных сайтах.

Однако аналогично архитектуре централизованного поиска, эта архитектура основана на активном использовании каналов связи глобальной сети для обхода контента. Тем не менее, поскольку предоставляется возможность локального поиска, глобальный поиск не оказывает столь критического влияния на совокупную архитектуру поиска, и это можно учесть при планировании обхода и в соглашениях об уровне обслуживания.

В следующей таблице приведено обобщение компромиссных решений в данной архитектуре поиска.

Преимущества Недостатки

Оптимизирована производительность запросов к локальному контенту.

Этот вариант значительно уменьшает число запросов по глобальной сети в сравнении с моделью централизованного поиска.

Соответствие результатов поиска отправленным запросам оптимизировано на основе области поиска (локальной или глобальной).

Использование нескольких поставщиков общих служб приводит к повышению административных затрат.

Обход контента через глобальную сеть снижает пропускную способность сети.

Для региональных пользователей, выполняющих глобальные запросы, производительность поиска зависит от производительности каналов связи глобальной сети.

Распределенный поиск

Если каналы связи глобальной сети не могут обеспечить возможность синхронизации контента в рамках глобальной среды или обхода удаленного контента на региональных фермах, то можно предоставить поиск только на уровне региональных ферм. В архитектуре распределенного поиска на каждой региональной ферме размещается собственный поставщик общих служб, а служба поиска, предоставляемая каждый региональным поставщиком общих служб, выполняет обход только локального контента.

На следующем рисунке показана архитектура распределенного поиска.

Глобальный поиск с помощью поставщика общих услуг в распределенной архитектуре

Реализация архитектуры распределенного поиска целесообразна в следующих условиях.

  • Региональные сайты слабо связаны по каналам связи глобальной сети.

  • Региональные сайты автономны от других региональных сайтов.

  • Региональные сайты неактивно используют соединение с центральным сайтом — например в организации, где филиалы работают автономно.

  • Существует большое число региональных сайтов и бизнес-модель, а каналы связи глобальной сети не поддерживают централизованную модель — например в организации с большим количеством филиалов, слабо связанных по каналам связи глобальной сети.

В следующей таблице приведено обобщение компромиссных решений в архитектуре распределенного поиска.

Преимущества Недостатки

Сохраняется соответствие результатов поиска отправленным запросам.

Не выполняется обход контента по каналам связи глобальной сети.

Поиск осуществляется не по всему предприятию.

Пользователям региональных ферм требуется подключаться к центральной ферме, чтобы выполнять поиск контента на этой ферме.

Федеративный поиск

Федеративный поиск — это функция, которая добавляется в Обновление инфраструктуры для серверов Microsoft Office Servers. Эта функция также включена в Microsoft Search Server 2008. Федеративный поиск позволяет конечным пользователям выдавать запрос, который выполняет поиск по нескольким источникам и отображает результаты в отдельной веб-части на одной странице результатов поиска. Этими источниками могут быть корпоративные хранилища контента, другие поисковые системы или части индекса сервера поиска. Использование федерации позволяет предоставить более обширные результаты запросов для пользователей, не тратя ресурсы сервера на обход и индексирование контента.

В распределенной среде с фермами серверов, находящимися в разных регионах, федеративный поиск можно настроить в каждом из регионов, представляющих другое федеративное местоположение. Пользователь увидит результаты поиска из каждого региона в отдельной веб-части результатов федеративного поиска. Результаты можно отображать сразу по мере их получения. Например, результаты поиска из локальной фермы серверов вероятно будут возвращаться перед результатами поиска, полученными по соединениям территориально-распределенной сети.

На следующей диаграмме показано использование федеративного поиска в территориально рассредоточенной среде, в которой Microsoft Office SharePoint Server развернуть в каждом регионе.

Подключение к удаленной ферме для федеративного поиска

На этой диаграмме:

  • Пользователь в региональной ферме 2 выдает запрос.

  • Трафик запроса передается на веб-сервер на локальной ферме. Веб-сервер перенаправляет запрос в местоположения федеративного поиска.

  • Запросы A и B являются федеративными местоположениями и передаются в территориально рассредоточенные фермы.

  • Запрос C является локальным поиском, который обслуживается локальной фермой.

  • Результаты поиска отображаются на одной веб-странице в отдельных веб-частях.

Настройка федеративного поиска в распределенных средах

С помощью федеративного поиска каждая ферма серверов выполняет обход своего контента. Для ферм серверов, на которых запущен Office SharePoint Server, это требует поставщика общих служб в каждой региональной ферме. При этом создается федеративное соединение с удаленной фермой серверов, на которой запущен Office SharePoint Server путем создания (на локальной ферме серверов ) федеративного местоположения OpenSearch. Федеративное местоположение OpenSearch должно указывать на канал RSS страницы результатов поиска внутри центра поиска на удаленной ферме. Чтобы включить локальную ферму в федеративный поиск. создается тип федеративного местоположения "индекс локального поиска". Чтобы внедрить федеративный поиск в распределенной среде, настройте каждую ферму с федеративными местоположениями в других фермах.

На следующей диаграмме подробно показано подключение федеративного поиска к удаленной ферме.

Федеративный поиск, географически распределенный, у каждого региона собственное развертывание

На этой диаграмме:

  • На центральной ферме центр поиска добавляется в семейство информационных сайтов компании. Этот центр поиска настраивается с областью, которая позволяет пользователям выполнять поиск по ферме. Данный центр поиска включает страницу результатов поиска. Для этой страницы включен канал RSS.

  • В региональной ферме настраивается соединение федеративного поиска (позиция A) для подключения к странице результатов поиска центральной фермы. Это позволяет локальным пользователям в региональной ферме выполнять поиск по контенту на центральной ферме.

Во многих средах с несколькими фермами серверов не весь контент на ферме серверов относится к пользователям, находящимся рядом с другими фермами. Например, политики компании определенного региона могут применяться только для данного региона. Если известно, что имеется поднабор контента, который относится к поиску пользователей в других регионах, создайте область на ферме, которая охватывает поиск с соответствующим поднабором контента. При создании федеративного подключения к удаленной ферме подключитесь к тому же каналу RSS страницы результатов поиска, однако добавьте область в качестве параметра URL-адреса. Например: https://server/searchcenter/_layouts/srchrss.aspx?k={searchTerms}&s=<yourcustomscope>

Дополнительные сведения о внедрении центра поиска см. в следующих статьях:

После завершения создания и настройки федеративных местоположений поиска необходимо подключать каждое из них к веб-части результатов федеративного поиска, чтобы пользователи могли увидеть результаты из местоположения, отображаемого в центре поиска. Настройте различные веб-части результатов федеративного поиска для каждой фермы. При настройке свойств веб-части результатов федеративного поиска обязательно выберите параметр асинхронной визуализации результатов (это параметр по умолчанию). При использовании этого параметра результаты будут отображаться по мере их получения, и пользователям не придется ждать более медленных соединений до начала просмотра результатов. По умолчанию если асинхронный режим не выбран, результаты не будут отображаться до тех пор, пока не будет возвращен результат из каждого местоположения федеративного поиска или истечет время ожидания. Период времени ожидания — 90 секунд, изменять его нельзя.

Важным фактором для учета при использовании функции федеративного поиска является обрезка результатов поиска системой безопасности. По умолчанию системой безопасности усекаются результаты поиска из следующих мест:

  • локальных местоположений индекса поиска (местной фермы);

  • местоположений OpenSearch, которые используют общие учетные данные (один набор учетных данных для всех пользователей);

  • местоположений OpenSearch, в которых используется проверка подлинности каждого пользователя Kerberos.

Однако учетные данные пользователей автоматически не передаются ни на какие протоколы, кроме Kerberos. Чтобы результаты усекались по соображениям безопасности, расширьте веб-часть результатов федеративного поиска для сбора учетных данных пользователей. Для получения дополнительных сведений см. раздел Создание настраиваемой веб-части федеративного поиска с интерфейсом для ввода учетных данных (на английском языке) (https://go.microsoft.com/fwlink/?linkid=121779&clcid=0x419) (на английском языке).

Кроме того, можно использовать веб-часть первых результатов федеративного поиска, среди которых отображаются лучшие результаты из нескольких федеративных местоположений. Однако данная веб-часть настроена на синхронное отображение результатов, и эту настройку нельзя изменять. Поэтому время загрузки страницы будет определяться самым медленным местоположением, настроенным в веб-части лучших результатов федеративного поиска. Если используется проверка подлинности Kerberos, вам также потребуется расширить эту веб-часть для сбора учетных данных пользователей, если необходимо обеспечить обрезку результатов поиска по соображениям безопасности для местоположений OpenSearch (все местоположения, отличные от локальной фермы) для каждого пользователя.

Наконец, несмотря на то, что федеративный поиск предоставляет пользователям возможность просмотра нескольких источников поиска, пользователи ограничены стандартными параметрами поиска. Расширенные параметры поиска нельзя использовать при федеративном поиске.

Использование федеративного поиска с фермами, на которых запущены службы Windows SharePoint

Чтобы использовать федеративный поиск с фермой, на которой запущен Службы Windows SharePoint Services, обновите ферму с Службы Windows SharePoint Services до Search Server 2008 Express или Search Server 2008. Обновление предоставляет возможность предложения поиска фермы, на которой запущен Службы Windows SharePoint Services, вместо поиска с областью, ограниченной каждой базой данных контента. Кроме того, Поисковый сервер требуется для предоставления каналов RSS по результатам. RSS требуется для создания федеративного местоположения OpenSearch для результатов удаленной фермы, чтобы результаты можно было отобразить на обобщенной странице.

На следующей диаграмме показана территориально разрозненная среда с фермами, на которых запущен Службы Windows SharePoint Services, обновленный до Search Server 2008 в региональных местоположениях.

Среда с географическим распределением; фермы обновляются по региональному расположению.

Резюме по федеративному поиску

Существует множество преимуществ использования федеративного поиска в географическом развертывании. Федеративный поиск исключает необходимость обхода контента с использованием соединений территориально-распределенной сети или синхронизации контента по соединениям территориально-распределенной сети. Отображение результатов в отдельных веб-частях помогает пользователям различать, где находится контент, упрощая идентификацию локального контента. Понимание того, где находится контент, также помогает пользователю определить, какие результаты вероятнее всего являются наиболее релевантными.

Подобная архитектура имеет несколько недостатков. Первый: не удается достичь релевантности результатов поиска на уровне предприятия. Область релевантности ограничено каждым федеративным местоположением. Далее, производительность запроса для удаленных местоположений зависит от каналов территориально-распределенной сети. Однако пользователи обычно получают результаты поиска для локальной фермы достаточно быстро.

В следующей таблице приведена краткая сводка недостатков архитектуры федеративного поиска.

Преимущества Недостатки

Поиск в рамках предприятия.

Отсутствие ограничения по количеству документов или элементов, которые можно искать.

Не выполняется обход или синхронизация контента по каналам территориально-распределенной сети.

Производительность запросов оптимизируется для локального контента, хотя в то же время результаты предоставляются для удаленного контента.

Пользователи могут выполнять поиск в других местоположениях, не выполняя отдельное подключение к каждому местоположению.

Каждым хранилищем контента можно управлять отдельно.

Службы Windows SharePoint Services с Search Server 2008 можно использовать в региональных фермах вместо Office SharePoint Server.

Обрезка по соображениям безопасности сохраняется для локальной фермы и для удаленных ферм, если используется проверка подлинности Kerberos.

Релевантность поиска не распространяется по всем предприятиям. Ее область ограничена источником контента.

Управление несколькими поставщиками общих служб или развертываниями Search Server 2008 приводит к увеличению административных расходов.

Производительность запросов для удаленных местоположений зависит от каналов территориально-распределенной сети.

Поскольку контент не синхронизируется в среде, пользователи будут загружать содержимое по каналам территориально-распределенной сети в пиковые часы для использования полосы пропускания.

Пользователи не могут использовать расширенные параметры поиска.

Если проверка подлинности Kerberos не используется, сохранение обрезки результатов поиска по соображениям безопасности требует расширения веб-частей федеративного поиска.

Загрузить эту книгу

Для упрощения чтения и печати эта тема включена в следующую загружаемую книгу:

См. полный список доступных книг на веб-сайте Загружаемые материалы для Office SharePoint Server 2007.

См. также

Понятия

Поддерживаемые глобальные решения для Office SharePoint Server
Разработка глобальной информационной архитектуры и системы управления
Планирование требований к пропускной способности