Расчет требований к производительности и ресурсам для сред поиска

Содержание:

  • Основные характеристики

  • Тестовая среда

  • Рекомендации

Данный сценарий планирования производительности и ресурсов включает в себя одну ферму серверов Microsoft Office SharePoint Server 2007, используемую для поиска и индексирования контента Office SharePoint Server в среде предприятия.

Важно!

Некоторые рекомендации из этой статьи обновлены для Office SharePoint Server 2007 с пакетом обновления 1 (SP1). Полный список обновлений для Office SharePoint Server 2007 с пакетом обновления 1 (SP1) см. в разделе Загружаемая книга: "Планирование и развертывание пакета обновления 1 (SP1) для Office SharePoint Server 2007 в среде из нескольких серверов".

Основные характеристики

Основные характеристики описывают факторы окружающей среды, характер использования и затрагивают другие вопросы, которые вероятно могут возникнуть при развертывании на основе этого сценария.

К числу основных характеристик этого сценария относятся следующие.

  • **Время отклика пользователей   **Целевые значения времени отклика пользователей при выполнении стандартных, нестандартных, продолжительных и редких операций перечислены в таблице "Время отклика пользователей" в разделе Планирование границ программного обеспечения (Office SharePoint Server). Некоторые организации могут допускать большее время отклика пользователей, в то время как другие могут требовать более быстрого отклика. Ожидаемое время отклика пользователей является ключевым фактором, определяющим общие целевые значения пропускной способности. Пропускная способность определяется как количество запросов, которое сервер способен обработать в секунду. Большему числу пользователей требуются более высокие целевые значения пропускной способности для достижения того же времени отклика пользователей.

  • **Параллелизм пользователей   **Принимается уровень параллелизма равный 10% с одновременным обращением 1% параллельно работающих пользователей. Например из 10000 пользователей 1000 пользователей активно использует решение одновременно и 100 пользователей активно направляют запросы.

  • **Длительные асинхронные задачи   **Такие задачи, как обход контента и резервное копирование баз данных создают дополнительную нагрузку производительности в ферме серверов. С учетом общих характеристик производительности образцов топологий предполагается, что такие задачи должны выполняться в периоды снижения активности, например в ночные часы. Это позволяет поддерживать требуемые значения времени отклика пользователей во время рабочего дня.

Тестовая среда

Тестирование этого сценария должно помочь в оценке того, как различные конфигурации ферм реагируют на изменения разнообразных факторов, таких как:

  • Количество пользователей, одновременно работающих с системой.

  • Типы выполняемых пользователями операций.

  • Количество опрашиваемых документов в индексе.

Необходимо отметить, что выводы, полученные на основании результатов тестирования, включая конкретные значения мощности и производительности, представленные в данном разделе, могут отличаться от результатов при работе в реальных средах. Результаты, изложенные в этой статье, могут использоваться в качестве отправной точки при проектировании правильно масштабируемой среды. После завершения первоначального этапа разработки системы протестируйте созданную конфигурацию, чтобы убедиться, что система поддерживает факторы, характерные для данной среды.

Примечание

Тестирование проводилось с целью моделирования среды предприятия с несколькими миллионами документов и большой базой пользователей. Аппаратное обеспечение для тестовой среды было настроено для работы с мощными процессорами и большим объемом оперативной памяти и дискового пространства. Начальные рекомендации по выбору оборудования см. в разделе Рекомендации в этой статье.

Дополнительные сведения о тестировании развертывания см. в разделе Средства планирования производительности и мощности (Office SharePoint Server).

Исходные условия

  • **64-разрядная архитектура   **В тестовой среде использовались только 64-разрядные серверы. Несмотря на возможность развертывания Office SharePoint Server 2007 на 32-разрядных серверах, рекомендуется осуществлять развертывание на 64-разрядных серверах в среде фермы Office SharePoint Server 2007. Дополнительные сведения см. в разделе "Сравнение 64-разрядных и 32-разрядных серверов" в статье О планировании производительности и загрузки (Office SharePoint Server).

  • Включение кэширования на диске   Кэширование на диске позволяет исключить необходимость многократного доступа к базе данных для чтения фрагментов кода или больших двоичных файлов, например файлов изображений, звука и видео. Включение кэширования на диске позволит повысить производительность всей среды. Следует обратить внимание, что кэширование на диске по умолчанию отключено. Дополнительные сведения о включении кэширования на диске см. в разделе Кэширование на диске для BLOB (на английском языке) (https://go.microsoft.com/fwlink/?linkid=82617&clcid=0x419) (на английском языке).

Топология лаборатории

Для тестирования использовалось несколько конфигураций ферм, в составе которых было от одного до восьми серверов запросов, один сервер индексирования, один SSP и один сервер баз данных с программным обеспечением баз данных Microsoft SQL Server 2005. На всех серверах работала конфигурация по умолчанию для Office SharePoint Server 2007 Enterprise Edition с операционной системой Microsoft Windows Server 2003 с пакетом обновления 1 (SP1), Enterprise x64 Edition.

В следующей таблице перечислено специальное оборудование, использованное для тестирования.

Роль компьютера Аппаратное обеспечение Емкость жесткого диска

Серверы запросов

4 двухъядерных процессора Intel Xeon, 2,66 ГГц

ОЗУ 32 ГБ

40 ГБ для операционной системы (дисковый массив (RAID) уровня 5)

956 ГБ для индекса контента и файла подкачки операционной системы (RAID 10)

Сервер индекса

4 двухъядерных процессора Intel Xeon, 2,66 ГГц

ОЗУ 32 ГБ

40 ГБ для операционной системы (RAID 5)

956 ГБ для индекса контента и файла подкачки операционной системы (RAID 10)

Сервер баз данных

4 двухъядерных процессора Intel Xeon, 2,66 ГГц

ОЗУ 32 ГБ

40 ГБ для операционной системы (RAID 5)

956 ГБ для базы данных SharedServices_Search_DB с выделенным контроллером (RAID 10) с интерфейсом SCSI

Следующие диски используют контроллер SCSI совместно:

273 ГБ для базы данных SharedServices_DB (RAID 10)

273 ГБ для базы данных TempDb (RAID 10)

273 ГБ для файлов журналов (RAID 10)

136 ГБ для базы данных SharePoint_Config (RAID 10)

В среде тестирования использовалась гигабитная сеть (один миллиард бит/с). Рекомендуется организация гигабитной сети между серверами в ферме Office SharePoint Server для обеспечения достаточной пропускной способности сети.

Профиль использования

В таблице далее представлен профиль использования для среды тестирования поиска Office SharePoint Server 2007.

Примечание

При тестировании этого сценария для определения производительности системы использовались только операции пользовательских запросов.

Для тестирования был произведен обход около 50 миллионов элементов. В следующей таблице представлены типы и количество элементов, обход которых был осуществлен. Размер элементов составлять от 10 килобайт (КБ) до 100 КБ и в их число входили элементы списка, веб-страницы и различные типы документов.

Тип элемента Число элементов

Содержимое на сайтах SharePoint

10 миллионов элементов включая:

  • 420 семейств сайтов

  • 4000 сайтов

  • 24200 списка

  • 47780 библиотек документов

Содержимое в общих папках

15 миллионов элементов

HTTP-содержимое

15 миллионов элементов

Профили пользователей

2,5 миллиона

Stitch (внутреннее средство тестирования, создающее документы в памяти)

7,5 миллионов

Свойства (метаданные)

1 миллион

В следующей таблице показано использование дискового пространства.

Тип использования Объем

Размер индекса на сервере запросов

100 ГБ*

Размер индекса на сервере индексирования

100 ГБ*

Размер база данных поиска

600 ГБ

Примечание

Протестированные размеры индекса меньше размеров, которые могут наблюдаться в производственной среде. В полученных в результате тестирования объемах, количество уникальных слов ограничено и они часто повторяются.

Во время испытания для полного обхода потребовалось 35 дней (приблизительно 15 документов в секунду). Следует упомянуть, что подобные результаты тестирования наблюдались в производственной среде, где задержка сети и реакция хранилищ, обход которых осуществлялся, влияли на скорость обхода. Скорость обхода, измеряемая количеством документов в секунду, могла быть значительно выше в исключительно тестовой среде или в средах с более высокой пропускной способностью и лучшей реакцией хранилищ, обход которых осуществлялся.

При изменении объема на два процента от размера, используемого в тестовой среде, потребуется от 8 до 12 часов для охвата изменений при добавочном обходе. Время зависит от задержки и реакции обходимых сайтов. Следует отметить, что изменения метаданных и внешних ссылок потребуют больше времени на обработку содержимого документов.

Рекомендации

В данном разделе представлены общие рекомендации по производительности и мощности среды. С помощью этих рекомендаций можно определить характеристики мощности и производительности начальной топологии, созданной в статье Планирование избыточности (Office SharePoint Server), а также принять решение о необходимости увеличения или уменьшения размера этой топологии.

Примечание

*Горизонтальное масштабирование* означает добавление серверов в определенной роли, а *вертикальное масштабирование* означает увеличение производительности или ресурсов путем добавления памяти, дисков и более мощных процессоров.

Рекомендации по аппаратному обеспечению

В таблице далее перечислено рекомендованное оборудование для веб-серверов, серверов индексирования и серверов баз данных.

Примечание

Требования к памяти веб-серверов, серверов индексирования и серверов баз данных зависят от размера фермы серверов, количества параллельных пользователей и сложности функций и страниц фермы. Рекомендации к объему памяти, представленные в следующей таблице, подходят для ферм серверов с низким или небольшим уровнем использования; при этом необходимо тщательно отслеживать процессы использования памяти, чтобы вовремя выявить необходимость в дополнительном объеме.

Роль сервера Рекомендуемое аппаратное обеспечение

Веб-сервер (сервер запроса)

Двухпроцессорная система, 2,5 ГГц или выше (рекомендуется использовать процессоры с тактовой частотой 3 ГГц или выше)

ОЗУ не менее 2 ГБ

3 ГБ доступного места на диске

DVD-дисковод на локальном компьютере или доступный через сеть

Сервер индекса

Двухпроцессорная система, 2,5 ГГц или выше (рекомендуется использовать процессоры с тактовой частотой 3 ГГц или выше)

ОЗУ не менее 4 ГБ

3 ГБ доступного места на диске

DVD-дисковод на локальном компьютере или доступный через сеть

Сервер баз данных

Двухпроцессорная система, 2,5 ГГц или выше (рекомендуется использовать процессоры с тактовой частотой 3 ГГц или выше)

ОЗУ не менее 4 ГБ

Объем жесткого диска для базы данных контента должен обеспечиваться на основании соотношения размера содержимого к емкости базы данных 1:1,2. Например, если планируется использовать 100 ГБ содержимого, необходимо не менее 120 ГБ доступного места на диске для базы данных контента, а также дополнительное место для журналов транзакций.

Объем жесткого диска для базы данных поиска должен обеспечиваться на основании соотношения размера индекса к емкости базы данных 1:4. Например, если размер индекса составит 100 ГБ, необходимо не менее 400 ГБ доступного места на диске для базы данных поиска, а также дополнительное место для журналов транзакций.

DVD-дисковод на локальном компьютере или доступный через сеть

Примечание

Размер дискового пространства, необходимого на сервере баз данных для журналов транзакций зависит от параметров журнала. Дополнительные сведения см. в разделе Ознакомление с журналами транзакций и управление ими (https://go.microsoft.com/fwlink/?linkid=82925&clcid=0x419).

Дополнительные сведения о минимальных и рекомендуемых системных требованиях см. в разделе Determine hardware and software requirements (Search Server 2008).

Начальные топологии

Чтобы оценить производительность начальной топологии, сравните созданную топологию с начальными топологиями, представленными в разделе Планирование избыточности (Office SharePoint Server). Это позволит быстро определить необходимость увеличения или уменьшения начальной топологии для достижения целевых значений производительности и мощности.

Мощность и производительность увеличенных и уменьшенных топологий

Чтобы увеличить мощность и производительность одной из начальных топологий, можно либо увеличить топологию, внедрив серверные компьютеры с большей мощностью, либо уменьшить ее, добавив серверы. В данном разделе описаны общие характеристики производительности нескольких увеличенных и уменьшенных топологий. В образцах топологий предлагаются следующие стандартные способы увеличения или уменьшения топологии для среды поиска:

  • Для поддержки большей пользовательской нагрузки добавьте компьютеры сервера запросов. Кроме того, можно добавить серверы индексирования и выделенные серверы запросов, чтобы освободить веб-серверы от нагрузки обработки.

  • Чтобы поддержать больший объем данных, необходимо увеличить мощность сервера базы данных, повысив мощность одного сервера (кластерного или зеркального), обновив его до 64-разрядного сервера, или добавив кластерные или зеркальные серверы.

  • Поддерживайте соотношение не более восьми компьютеров сервера запросов к одному компьютеру сервера базы данных (кластерному или зеркальному). В лабораторных испытаниях было получено оптимальное соотношение 7x1x1 (семь серверов запросов к одному серверу индексирования и одному серверу баз данных)

Расчет целевых показателей пропускной способности

В этом разделе приводятся данные тестов, показывающие пропускную способность при увеличении числа серверов запросов и подключений пользователей.

Поскольку Office SharePoint Server 2007 можно развернуть и настроить различными способами, простого способа оценки количества пользователей, которые будут поддерживаться заданным числом серверов, нет. Следовательно, важно перед развертыванием Office SharePoint Server 2007 в производственной среде провести тестирование.

Существует несколько факторов, влияющих на пропускную способность, в числе которых количество пользователей, сложность и периодичность операций пользователей, кэширование и настройка страниц и веб-частей. Каждый из этих факторов может существенно влиять на пропускную способность фермы. При планировании развертывания следует обязательно учитывать каждый из этих факторов.

Дополнительные сведения о кэшировании в Office SharePoint Server 2007, см. в следующих материалах:

Если в организации используется существующее решение поиска, журналы IIS помогут определиться с режимами использования и изменениями в текущей среде. Дополнительные сведения о разборе журналов IIS см. в разделе Анализ файлов журналов (IIS 6.0) (на английском языке) (https://go.microsoft.com/fwlink/?linkid=78825&clcid=0x419) (на английском языке).

Если в организации планируется развернуть новое решение поиска, информация в следующих разделах поможет оценить режимы использования.

Результаты тестирования: пропускная способность в зависимости от конфигурации фермы серверов

В таблице в этом разделе представлены результаты тестирования для различных профилей операций пользователей на основе оборудования и профиля использования, указанных в разделе Среда тестирования ранее в этой статье. Обратите внимание, что для каждой конфигурации фермы было протестировано от одного до восьми серверов с одним сервером индексирования и одним сервером баз данных. Таким образом, конфигурация фермы 3x1x1 означает три сервера запросов к одному серверу индексирования и одному серверу баз данных. Фермы с несколькими серверами индексирования и серверами баз данных протестированы не были.

В следующей таблице представлены результаты тестирования для пользовательских операций, связанных с поиском.

Размер фермы Запросов в секунду Процент использования ресурсов центрального процессора сервера запросов Процент использования ресурсов центрального процессора сервера индексирования Процент использования ресурсов центрального процессора сервера баз данных Средняя скорость записи в секунду на диск сервера баз данных

1x1x1

24,01

99,49

1,98

7,23

6,11

2x1x1

48,04

96,98

3,95

13,02

2,66

3x1x1

71,07

94,73

5,61

20,56

2,29

4x1x1

93,11

91,77

8,81

29,21

2,41

5x1x1

114,95

90,50

10,27

39,38

2,45

6x1x1

133,34

87,29

11,91

52,94

2,83

7x1x1

148,52

80,20

15,24

63,72

3,14

8x1x1

146,94

65,65

15,15

69,15

2,87

На следующей диаграмме представлены изменения пропускной способности для операций поиска при изменении числа серверов запросов.

Серверы запросов и количество запросов в секунду

Окно оценки обхода

В среде поиска Office SharePoint Server 2007 обход контента обычно является наиболее длительной операцией, инициируемой не пользователями. Следует выполнить тестирование в собственной среде, чтобы определить время, затрачиваемое на обход контента на основе определенного источника и выяснить, оказывает ли влияние пропускная способность, используемая при обходе этого содержимого, на целевые значения времени отклика пользователей.

Оценка размера необходимого дискового пространства

Следующие сведения помогут в планировании необходимого дискового пространства для серверов индексирования, серверов запросов и серверов баз данных в среде.

Необходимое дисковое пространство для серверов индексирования и запросов

Следующие сведения используются при планировании требований к дисковому пространству фермы серверов, предназначенному для серверов индексирования и запросов.

Примечание

Обычно индекс контента по размеру меньше собрания, поскольку перед индексированием контента все ненужные слова удаляются.

Примечание

Если роль сервера запросов включена не на сервере индексирования, индекс автоматически распространяется на эти серверы запросов. Для сохранения копии индекса контента в файловой системе сервера запросов каждому серверу нужен то же объем дискового пространства, который сервер индексирования использует для хранения индекса. Дополнительные сведения см. в разделе Планирование избыточности (Office SharePoint Server).

Следующие указания позволят оценить необходимое дисковое для жесткого диска, содержащего индекс контента.

  1. Приблизительно оцените количество содержимого, которое планируется обходить, и средний размер каждого файла. Если примерный размер файлов в собрании неизвестен, используйте как исходную точку 10 КБ на каждый документ.

    Вычислите объем дискового пространства для хранения индекса контента по следующей формуле:

    Необходимое количество ГБ дискового пространства = общий_размер_собрания (в ГБ) x модификатор_размера_файла x 2,85

    где модификатор_размера_файла — число в следующем диапазоне, выбранном на основе среднего размера файлов в собрании:

    • 1,0 если в собрании находятся очень маленькие файлы (средний размер = 1 КБ).

    • 0,12 если в собрании находятся средние файлы (средний размер = 10 КБ).

    • 0,05 если в собрании находятся большие файлы (средний размер = 100 КБ и более).

Примечание

Следует уточнить, что это уравнение подойдет для оценки на начальном этапе. Реальные результаты могут варьироваться в зависимости от размера и типа индексируемых документов и объема метаданных, индексируемых во время операции обхода.

В этом уравнении общий_размер_собрания (в ГБ) x на модификатор_размера_файла для получения примерного размера файла индекса. Затем нужно умножить результат на 2,85, чтобы компенсировать дополнительные расходы при слиянии обойденных данных с индексом. В итоге получится приблизительно необходимый объем дискового пространства.

Например, для вычисления примерного размера файла индекса собрания в 1 ГБ, которое в основном состоит из файлов примерного размера 10 КБ, используются следующие значения:

1 ГБ x 0,12 = 0,12 ГБ

По этой формуле получается примерный размер файла индекса 120 МБ.

Далее примерный размер файла индекса нужно умножить на 2,85:

120 МБ x 2,85 = 342 МБ

Соответственно, объем дискового пространства, необходимый для файла индекса с учетом операций индексирования, составляет 342 МБ или 0,342 ГБ.

Примечание

Размер данных после обхода может быть различным в зависимости от содержимого. Источник контента представляет собой набор параметров, которые можно использовать для указания типа контента для обхода, обходимых URL-адресов и также глубины и времени обхода.

  1. Если этот приблизительный размер индекса контента не превышает объема свободного места на жестком диске серверов индексирования и запросов, переходите к шагу 3. В противном случае расширьте дисковое пространство или повторите шаг 1 прежде, чем перейти к шагу 3.

  2. Обойдите часть содержимого.

  3. Приблизительно оцените размер индекса контента и количество обойденных файлов. Увеличьте с помощью этих данных точность результатов, полученных в шаге 1.

  4. Если оставшегося дискового пространства достаточно, обойдите еще часть содержимого. В противном случае расширьте дисковое пространство или измените свои планы относительно содержимого для обхода.

  5. Повторяйте шаги 3-5, пока не обойдете все содержимое.

    После обхода всего содержимого рекомендуется сохранить данные о размере индекса контента и базы данных поиска по каждому обходу, чтобы определить средний коэффициент роста. По мере добавления содержимого в ферму собрание обычно растет, поэтому чтобы сохранить достаточно места для операций индексирования, необходимо отслеживать объем доступного дискового пространства.

Необходимое дисковое пространство для базы данных поиска

Для базы данных поиска, где хранятся метаданные и информация журнала обходчика для системы поиска, обычно требуется больше дискового пространства, чем для индекса. Это особенно справедливо, когда обходится много сайтов SharePoint с большими объемами метаданных.

Примечание

В базе данных поиска сохраняются метаданные всего индексированного содержимого и журнал обходчика.

Вычислите объем дискового пространства для хранения базы данных поиска по следующей формуле:

Необходимое количество ГБ дискового пространства = общий_размер_собрания (в ГБ) x модификатор_размера_файла x 4

где модификатор_размера_файла — число в следующем диапазоне, выбранном на основе среднего размера файлов в собрании:

  • 1,0 если в собрании находятся очень маленькие файлы (средний размер = 1 КБ).

  • 0,12 если в собрании находятся средние файлы (средний размер = 10 КБ).

  • 0,05 если в собрании находятся большие файлы (средний размер = 100 КБ и более).

Например, для вычисления примерного размера файла индекса собрания в 1 ГБ, которое в основном состоит из файлов примерного размера 10 КБ, подставьте в выражение следующие значения:

1 ГБ x 0,12 = 0,12 ГБ, или 120 МБ

Далее примерный размер файла индекса нужно умножить на 4:

120 МБ x 4 = 480 МБ

Соответственно, для базы данных поиска потребуется 480 МБ, или 0,48 ГБ дискового пространства.

Определение характеристик серверов индексирования, запросов и баз данных

В Office SharePoint Server 2007 поиск является общей службой, доступной на уровне SSP. Система поиска Office SharePoint Server 2007 включает две основные роли серверов: сервер индексирования и сервер запросов.

Обход и индексирование являются ресурсоемкими операциями. Процесс обхода контента заключается в обращении к содержимому и его разборе системой для построения индекса контента, который сможет обслуживать запросы поиска. Обход поглощает ресурсы процессора и памяти на сервере индексирования, сервере запросов или серверах, на которых выполняются операции обхода, сервере или серверах с хранилищем содержимого, обход которого осуществляется, и сервере баз данных, обслуживающем ферму Office SharePoint Server 2007.

Обход влияет на общую производительность системы и непосредственно на время отклика пользователей и производительность других общих служб в ферме, а также на веб-службу на сервере запросов, обслуживающую операции обхода. Для операций обхода можно выделить сервер запросов, что позволит сократить нагрузку на другие серверы фермы.

Индексирование контента после обхода может также влиять на общую производительность системы, если операции обхода не назначены выделенному серверу запросов. Если основная часть операций в ферме связана с поиском, следует подумать о развертывании выделенного сервера запросов. Дополнительные сведения см. в описании выделенного сервера запросов для обхода далее в этой статье.

Определение характеристик серверов индексирования

Сведения в этом разделе помогут установить требования в серверам индексирования в ферме Office SharePoint Server 2007.

Центральный процессор сервера индексирования

Быстродействие процессора сервера индексирования влияет на скорость обхода и число потоков обхода, которые удастся запустить. Хотя определенные рекомендации по количеству или типу процессоров отсутствуют, при определении требований к серверу индексирования следует исходить из объема содержимого. В среде предприятия сервер индексирования должен иметь несколько процессоров для обработки большой нагрузки индексирования.

В следующей таблице показано, как скорость обхода повышается с увеличением числа процессоров сервера индексирования

Число процессоров Процент повышения скорости обхода

1

0,00

2

10,89

4

19,77

8

30,77

Память сервера индексирования

На сервере индексирования документы загружаются в буферы для обработки средством обходчика. В ферме с фондом из 1 миллиона документов для сервера индексирования требуется приблизительно 1,5 ГБ памяти. После обработки документа он записывается на диск. Чем больше объем памяти, тем больше документов сможет обрабатывать средство обходчика параллельно и тем меньше времени потребуется на обход.

Рекомендуется минимум 4 ГБ ОЗУ на сервере индексирования для обхода фонда документов объемом более 1 миллиона.

Скорость работы дисков сервера индексирования

Рекомендуется использовать массив RAID 10 со временем доступа 2 мс и скоростью записи более 150 МБ/сек для обеспечения быстрой записи на диск.

Отдельный индекс и взаимосвязь

В SharePoint Portal Server 2003 индекс контента можно разделить между несколькими серверами, создав подмножества индексированного содержимого, что позволит лучше реагировать на расширение содержимого. Хотя Office SharePoint Server 2007 поддерживает использование нескольких серверов индексирования для масштабирования, каждому серверу индексирования требуется отдельный SSP и отдельные индексы объединить невозможно.

Количество серверов индексирования

Несколько серверов индексирования можно развернуть в ферме в тех случаях, когда необходимо добиться полной изоляции между SSP или масштабировать систему. Несмотря на то, что жестких ограничений на количество серверов индексирования в ферме не установлено, максимальное число серверов индексирования в одной ферме при тестировании составляло четыре.

Количество используемых в ферме серверов индексирования зависит от того, каким образом планируется организовать осуществление поиска. Если при поиске требуется, чтобы содержимое для обхода располагалось в отдельном наборе результатов, следует развернуть один SSP с отдельным сервером индексирования. Большинство организацией желает, чтобы все обходимое содержимое было доступно пользователям для поиска и, следовательно, нескольких областей поиска не требуется.

Если поиск можно разделить на несколько областей так, чтобы получать отдельный, соответствующий набор результатов по различным хранилищам содержимого, можно использовать несколько SSP и серверов индексирования. В качестве примера сценария, в котором могут потребоваться различные области поиска можно привести предприятие с одним отделом, где ведутся конфиденциальные документов, поиск по которым должен быть доступен только определенной группе пользователей.

В зависимости от требований к масштабированию и безопасности все SSP можно связать с одним сервером индексирования, или каждый SSP связать с отдельным сервером индексирования.

Примечание

Отправка запросов нескольким SSP для получения единого целевого набора результатов не поддерживается в Office SharePoint Server 2007.

Отдельный сервер индексирования с мощным оборудованием может поддерживать до 50 миллионов документов. При построении одного индекса такого размера рекомендуется использовать не более одного сервера индексирования в ферме, поскольку индекс распространяется на все серверы запросов в ферме. При добавлении второго сервера индексирования индексы с него так же распространяются на все серверы индексирования в ферме, что создает дополнительную нагрузку на серверы запросов.

Чтобы повысить производительность поиска путем добавления SSP, потребуется горизонтальное масштабирование. Как минимум, необходимо добавить еще один сервер индексирования, сервер баз данных и выделенный веб-сервер. Если существующее оборудование поддерживает индексирование 10 миллионов документов в одном SSP, можно осуществить вертикальное масштабирование, используя то же оборудование для размещения 20 SSP.

Примечание

В Microsoft Office SharePoint Server 2007 для поиска можно использовать только одного SSP.

Это позволит осуществлять индексирование приблизительно 2 миллионов документов на каждого SSP с общим количеством документов, равным 40 миллионам.

Примечание

SSP всегда связан только с одним сервером индексирования. При этом на сервере индексирования может размещаться несколько SSP.

Выделенный сервер запросов для обхода

Для операций обхода рекомендуется использовать выделенный сервер запросов.

В ферме с возможностями поиска все серверы запросов по умолчанию обслуживают операции обхода. После запуска операции обхода сервер индексирования отправляет запрос на серверы запросов, которые, в свою очередь, выбирают содержимое для обхода и передают его на сервер индексирования. При высокой пользовательской нагрузке операция обхода может ухудшать реакцию системы на запросы пользователя.

Чтобы сократить влияние операций обхода на производительность фермы, для обхода можно настроить выделенный сервер запросов. Выделение сервера запросов для обхода позволит выполнять все операции обхода через выделенный сервер, в то время как другие серверы запросов продолжат обслуживать запросы пользователей. Такая конфигурация в особенности подходит для сред, в которых выполнение операций обхода невозможно ограничить только ночным временем, или для территориально распределенных сред, в которых пользовательские запросы не прекращаются.

Дополнительные сведения о выделении сервера запросов для обхода см. в разделе Настройка выделенного интерфейсного веб-сервера для обхода содержимого (Office SharePoint Server 2007)..

Примечание

Выделение сервера запросов для обхода может отразиться на других службах, работающих на сервере. Используемый таким образом сервер запросов не предусматривает балансирование нагрузки и не будет обслуживать запросы конечных пользователей.

Оптимизация производительности сервера индексирования

Операции индексирования повышают нагрузку на сервер баз данных и могут ухудшить реакцию фермы. Кроме того, операции индексирования могут влиять на другие общие службы на сервере приложений со службой индексирования поиска. Уровень производительности индексирования можно оптимизировать для каждого сервера индексирования и добиться одного из трех значений:

  • Пониженная

  • Частично пониженная

  • Максимальная

Значением по умолчанию является "Пониженная". Этот параметр можно настроить только для определенного сервера индексирования, а не для SSP.

Операции обхода влияют на производительность сервера баз данных, поскольку служба поиска Office SharePoint Server записывает все метаданные, собранные из документов во время обхода в таблицы баз данных. Существует вероятность, что сервер индексирования или несколько серверов будут создавать данные с такой скоростью, что сервер баз данных будет перегружен.

Следует провести самостоятельное тестирование для балансировки скорость обхода, задержки сети, нагрузки на базы данных и нагрузки на хранилища содержимого для обхода.

В следующей таблице представлены отношения между настройкой уровня производительности и использованием центрального процессора на сервере индексирования и сервере баз данных, которые было получены в результате тестирования.

Настройка уровня производительности Процент использования ресурсов центрального процессора сервера индексирования Процент использования ресурсов центрального процессора сервера баз данных

Пониженная

20

20

Частично пониженная

24

24

Максимальная

25

26

Следует учесть сценарии и рекомендации по настройке уровня производительности, перечисленные ниже.

  • Если сервер индексирования и серверы баз данных используются только для службы поиска Office SharePoint Server, можно выбрать уровень "Максимальная". При этом рекомендуется, чтобы максимальное увеличение процента использования ресурсов центрального процессора сервера баз данных по отношению к активности сервера индексирования не превышало 30 процентов. Если увеличение использования ресурсов центрального процессора сервера баз данных превышает 30 процентов при уровне "Максимальная", рекомендуется понизить уровень производительности на один.

  • Если сервер приложений и сервер баз данных используются для нескольких общих служб, таких как служба поиска Office SharePoint Server и службы вычислений Excel, рекомендуется выбрать более низкий уровень производительности. При этом сокращение максимальной допустимой активности индексирования приведет к снижению скорости индексирования элементов и неактуальности результатов поиска, как результат. Чтобы определить соответствующий уровень производительности сервера индексирования, необходимо следить за производительностью локального сервера.

Для установки уровня производительности на сервере индексирования выполните описанные далее действия.

Настройка производительности сервера индексирования

  1. Нажмите кнопку Пуск , а затем последовательно выберите пункты Все программы , Microsoft Office Server и Центр администрирования SharePoint 3.0.

  2. На домашней странице центра администрирования щелкните пункт Операции.

  3. На странице "Операции" в разделе Топология и службы щелкните Службы на сервере.

  4. На странице служб в меню Сервер выберите сервер индексирования для управления.

  5. В разделе Запустите службы, указанные в следующей таблице щелкните Служба поиска Office SharePoint Server.

  6. На странице "Настройка параметров службы поиска Office SharePoint Server" в разделе Производительность компонента индексирования выберите желаемый уровень производительности.

  7. Для сохранения изменений нажмите кнопку ОК.

Правила воздействия обходчика

Правила воздействия обходчика представляют собой параметры конфигурации поиска на уровне фермы, определяющие количество одновременных запросов, создаваемых службой поиска Office SharePoint Server во время обхода на основе указанного источника контента. Чем больше число одновременных запросов, тем выше скорость работы обходчика. Следует отметить, что от частоты запросов, указанной в правиле воздействия обходчика, непосредственно зависит нагрузка на сервер баз данных, а так же на сервер с содержимым для обхода. Если для заданного сайта увеличить частоту запросов, нужно будет внимательно следить за серверами, обход которых осуществляется, для оценки допустимости дополнительной нагрузки.

В качестве значения по умолчанию используется число процессов на сервере индексирования. Таким образом, для компьютера с четырехъядерным процессором значением по умолчанию будет восемь. Рекомендуется скорректировать значение и измерить нагрузку на целевой сервер, чтобы определить оптимальное число одновременных запросов. Количество одновременных запросов можно выбрать из следующих возможных значений: 1, 2, 4, 8, 16, 32, 64.

Кроме того, можно создать правило, согласно которому будет запрашиваться один документ одновременно и которое будет устанавливать заданное число секунд между запросами. Это правило может пригодиться для обхода сайта с постоянной нагрузкой со стороны пользователей.

В следующей таблице представлены отношения между числом одновременных запросов и использованием ресурсов центрального процессора на серверах индексирования и серверах баз данных.

Число потоков обхода Процент использования ресурсов центрального процессора сервера индексирования Процент использования ресурсов центрального процессора сервера баз данных

4

35

12

8

40

15

12

45

15

16

60

20

Для создания правила обходчика необходимо выполнить описанные далее действия.

Создание правила воздействия программы-обходчика

  1. Нажмите кнопку Пуск , а затем последовательно выберите пункты Все программы , Microsoft Office Server и Центр администрирования SharePoint 3.0.

  2. На странице центра администрирования нажмите Управление приложениями.

  3. На странице "Управление службой поиска" в разделе Поиск щелкните ссылку Управление службой поиска.

  4. На странице "Управление службой поиска" в разделе Управление параметрами поиска на уровне фермы щелкните ссылку Правила воздействия обходчика.

  5. На странице "Правила воздействия обходчика" щелкните ссылку Добавить правило.

  6. На странице "Добавление правила воздействия обходчика" в разделе Узел введите имя сайта, для которого необходимо создать правило. Протокол следует опустить (например, не включайте http://)

  7. В разделе Частота запросов определите режим запроса документов с этого сайта.

    1. Для одновременного запроса нескольких документов установите флажок Запрашивать одновременно не более указанного числа документов без ожидания между запросами и выберите необходимое значение из списка Одновременные запросы.

    2. Чтобы одновременно запрашивался один документ, установите флажок Запрашивать по одному документу и ожидать заданное время между запросами и введите время ожидания в секундах между запросами в поле Время ожидания (с).

  8. Чтобы создать правило, нажмите кнопку ОК.

Определение характеристик серверов запросов

Сведения в этом разделе помогут установить требования в серверам запросов в ферме Office SharePoint Server 2007.

Память сервера запросов

Больший объем доступной памяти позволит сократить время, затрачиваемое службой поиска Office SharePoint Server на обращение к жесткому диску для выполнения данного запроса. Наличие достаточного объема памяти также обеспечит более эффективное кэширование. В идеале, памяти на серверах запросов должно быть достаточно для обработки целого индекса.

На следующем рисунке показано отношение между размером индекса на серверах запросов к времени реакции пользователя на каждый запрос.

Анализ производительности при поиске

Скорость работы дисков сервера запросов

Рекомендуется использовать массив RAID 10 для быстрой записи на диск.

Количество серверов запросов

Можно развернуть несколько серверов запросов в ферме для достижения избыточности и балансировки нагрузки. Используемое число серверов запросов зависит от количества пользователей в ферме и ожидаемой пиковой нагрузки. Было протестировано до восьми серверов запросов в ферме.

На следующем рисунке показана пропускная способность запросов, процент использования ресурсов центрального процессора сервера баз данных для базы данных поиска и процент использования ресурсов центрального процессора сервера запросов по мере добавления последних в ферму. При тестировании, в результате которого были получены эти данные, сервер баз данных использовался совместно базами данных контента и базами данных служб.

График производительности сервера поиска

Задержка удаленного сервера

Задержка памяти является основным фактором, влияющим на производительность обхода. Производительность между серверами должна быть сбалансирована для достижения потенциала общей производительности обхода. Например, мощный сервер индексирования может работать при 25% нагрузке, если сервер баз данных не может отвечать достаточно быстро во время обхода. В этом случае можно выполнить вертикальное масштабирование сервера баз данных, что, в свою очередь, повысить скорость обхода в масштабе всей фермы.

Следует провести собственное тестирование для оценки реакции серверов в среде. Сервер баз данных, работающий в целевой ферме, часто оказывается узким местом в случае низкой производительности обхода. Для повышения производительности обхода доступны следующие решения:

  • Масштабирование оборудования сервера баз данных путем добавления или модернизации процессоров, добавления памяти и модернизации жестких дисков с более коротким временем поиска и временем записи.

  • Расширение памяти серверов запросов в ферме

  • Выполнение обхода в часы наименьшей нагрузки, так чтобы сервер баз данных во время обхода мог обслуживать пользовательский трафик в течение дня и реагировать на обход в часы наименьшей нагрузки.

Определение характеристик серверов баз данных

Система поиска Office SharePoint Server 2007 обходит текстовые данные и метаданные, связанные с содержимым. В Office SharePoint Portal Server 2003 все содержимое, собираемое системой индексирования, размещалось в хранилище свойств базы данных JET. В Office SharePoint Server 2007 обращенный полнотекстовый индекс хранится на сервере индексирования, а метаданные хранятся в базе данных поиска. Сервер индексирования записывает метаданные в базу данных, а серверы запросов считывают эти данные для обработки запросов на основе свойств, создаваемых пользователями.

Сведения в этом разделе помогут установить требования в серверам баз данных в ферме Office SharePoint Server 2007.

Пропускная способность базы данных

Хранилище метаданных баз данных используется совместно сервером индексирования и всеми серверами запросов в ферме. Сервер индексирования записывает все метаданные, а серверы запросов считывают эти данные для обработки запросов поиска. Пропускная способность запросов в большей мере зависит от быстроты реакции хранилища метаданных.

С увеличением числа серверов запросов в ферме, нагрузка сервер баз данных также повышается и влияет на общую пропускную способность запросов. При добавлении серверов индексирования или серверов запросов в ферму следует внимательно следить за сервером баз данных, чтобы поддерживать производительность баз данных на должном уровне.

Распределение дисков сервера баз данных

Поскольку служба поиска Office SharePoint Server записывает большие объемы данных в базы данных поиска во время обхода, для баз данных SharedServices_Search_Db, SharedServices_Db и TempDb рекомендуется использовать отдельные диски с целью повышения производительности в тех случаях, когда индекс содержит более 5 миллионов элементов.

Скорость работы дисков сервера баз данных

Рекомендуется использовать массив RAID 10 для быстрой записи на диск.

Загрузите эту книгу

Этот раздел включен в следующую загружаемую книгу для удобства чтения и печати:

Полный список доступных книг приведен в разделе Загружаемые материалы для Office SharePoint Server 2007.

См. также

Понятия

Настройка выделенного интерфейсного веб-сервера для обхода содержимого (Office SharePoint Server 2007).