Мониторинг и обслуживание SharePoint Server 2013

 

**Применимо к:**SharePoint Server 2013 Enterprise, SharePoint Server 2013 Standard

**Последнее изменение раздела:**2017-08-25

**Сводка.**Сведения о мониторинге и обслуживании среды SharePoint Server 2013.

В этой статье обсуждаются мониторинга и счетчики производительности для SharePoint Server 2013 ферм. Для поддержки SharePoint Server 2013 производительность системы, необходимо контролировать сервере, чтобы определить потенциальные узкие места. Перед может отслеживать эффективно, необходимо понять ключевых индикаторов, сообщит вам при определенных часть фермы требуют внимания и знать, как интерпретировать эти индикаторы. Если найти, что фермы работают за пределами целевые значения, заданных фермы можно настроить путем добавления или удаления ресурсов оборудования, изменение топологии или изменения способа хранения данных.

Информация в этом разделе предназначена, чтобы помочь администраторам вручную настраивать счетчики производительности и другие параметры. Сведения о мониторинге работоспособности и устранении неполадок с помощью средств мониторинга работоспособности, встроенных в интерфейс Веб-сайт центра администрирования SharePoint, см. в следующих статьях:

Перед прочтением этой статьи следует ознакомиться с Обзор управления емкостью и изменения размера в SharePoint Server 2013.

В этой статье

  • Настройка мониторинга

  • Удаление узких мест

Настройка мониторинга

Ниже представлен список параметров, которые можно изменить для отслеживания среды на ранних этапах. Это поможет вам определить, нужные ли какие-либо изменения. Более интенсивное применение возможностей мониторинга повлияет на объем дискового пространства, необходимого базе данных использования. Когда среда станет работать стабильно и такой подробный мониторинг больше не потребуется, вы сможете восстановить настройки по умолчанию.

Параметр Значение Примечания

Защита от переполнения журнала событий

Отключено

Значение по умолчанию — Включено. Этот параметр можно отключить, чтобы собирать как можно больше данных мониторинга. Для нормального режима работы этот параметр нужно включить.

Расписание задания таймера

   

Импорт данных об использовании Microsoft SharePoint Foundation

5 минут

Значение по умолчанию — 30 минут. Если уменьшить это значение, данные будут чаще импортироваться в базу данных использования. Это особенно полезно при устранении неполадок. В нормальном режиме работы значение параметра должно быть равно 30 минутам.

Поставщики диагностики

   

Включение всех поставщиков диагностики

Включено

Значение по умолчанию — Отключено, кроме поставщика "Мониторинг работоспособности поиска — трассировка событий". Эти поставщики собирают данные о работоспособности различных функций и компонентов. Для нормального режима работы может потребоваться восстановить значение по умолчанию.

Установка интервалов расписания "job-diagnostics-performance-counter-wfe-provider" и "job-diagnostics-performance-counter-sql-provider"

1 мин

Значение по умолчанию — 5 минут. Если уменьшить это значение, данные будут запрашиваться чаще. Это особенно полезно при устранении неполадок. В нормальном режиме работы значение параметра должно быть равно 5 минутам.

Прочее

   

Включение трассировки стека для запросов контента

Включено

Значение по умолчанию — Отключено. Если включить этот параметр, вы сможете диагностировать сбои запросов контента с помощью трассировки стека процессов. Для нормального режима работы этот параметр следует включить.

Включение панели разработчика

Включено

Значение по умолчанию — Отключено. Если включить этот параметр, вы сможете диагностировать медленные страницы и другие проблемы с помощью панели разработчика. Для нормального режима работы этот параметр следует отключить сразу после завершения устранения неполадок.

Сбор данных об использовании

   

Использование импорта контента

Использование экспорта контента

Запросы страниц

Использование компонентов

Использование запросов поиска

Использование каталога сайтов

Задания таймера

Использование оценок

Включено

Включение ведения журнала для этого набора счетчиков позволит вам собирать больше данных об использовании во всей среде и лучше понимать, какие схемы трафика присутствуют в среде.

Счетчики производительности

Если вы применяете базу данных использования, вы можете добавить счетчики производительности, помогающие отслеживать и оценивать производительность фермы по отношению к базе данных использования, которые будут автоматически записываться в журнал с определенным интервалом (по умолчанию — 30 минут). С учетом этого вы можете запрашивать базу данных использования, чтобы получать эти счетчики и анализировать результаты с течением времени. Далее показано, как использовать командлет Add-SPDiagnosticsPerformanceCounter консоли PowerShell, чтобы добавить счетчик "% загруженности процессора" в базу данных использования. Этот командлет выполняется только на одном из веб-серверов:

Add-SPDiagnosticsPerformanceCounter -Category "Processor" -Counter "% Processor Time" -Instance "_Total" -WebFrontEnd

Существует несколько универсальных счетчиков производительности, которые следует отслеживать для любой серверной системы. Они описываются в следующей таблице.

Счетчик производительности Описание

Процессор

Необходимо отслеживать производительность и поддерживать загруженность всех процессоров на уровне не выше 80 %. При более высоких уровнях загруженности система не сможет справиться с внезапными всплесками активности. Это также позволит избежать эффекта "домино", когда сбой одного компонента вызовет неисправность других компонентов. Например, если у вас три веб-сервера, необходимо убедиться, что средняя загрузка ЦП на всех серверах меньше 60 %, чтобы в случае сбоя одного из них два других процессора смогли обработать дополнительную нагрузку.

Сетевой интерфейс

Отслеживайте скорость передачи и получения данных через сетевой адаптер. Это значение всегда должно быть меньше 50 % пропускной способности сети.

Диски и кэш

Существует несколько параметров логических дисков, которые необходимо регулярно отслеживать. Доступное дисковое пространство важно при любом анализе емкости, но также следует анализировать время простоя диска. В зависимости от типов приложений или служб, работающих на серверах, можно просматривать время чтения с диска и записи на диск. Расширенные очереди на запись или чтение повлияют на производительность. Кэш также оказывает сильное влияние на операции чтения и записи, поэтому необходимо отслеживать возможное увеличение ошибок кэша.

Память и файл подкачки

Отслеживайте объем физической памяти, доступный для выделения. Если памяти недостаточно, файл подкачки будет использоваться более интенсивно, а число ошибок страниц в секунду увеличится.

Системные счетчики

В следующей таблице описываются системные объекты и счетчики, которые можно добавить в число отслеживаемых в базе данных использования с помощью SPDiagnosticPerformanceCounter на веб-сервере.

Объекты и счетчики Описание

Процессор

 

% загруженности процессора

Отображает загрузку процессора с течением времени. Если это значение слишком велико на протяжении длительного времени, производительность может быть значительно снижена. В многопроцессорных системах не забудьте учитывать общее значение. Вы также можете измерять использование каждого процессора, чтобы балансировать нагрузку между ядрами.

Диск

 

— Средняя длина очереди диска

Этот счетчик показывает среднее количество запросов на чтение и запись, помещенных в очередь для выбранного диска в течение интервала выборки. Большая очередь допустима, если не влияет на операции чтения и записи, а система работает стабильно без расширения очереди.

— Средняя длина очереди чтения диска

Среднее число запросов на чтение в очереди.

Средняя длина очереди записи на диск

Среднее число запросов на запись в очереди.

Количество операций чтения с диска/с

Число операций чтения диска в секунду.

Количество операций записи на диск/с

Число операций записи на диск в секунду.

Память

 

— Доступно МБ

Этот счетчик показывает объем физической памяти, доступный для выделения. Если памяти недостаточно, файл подкачки будет использоваться более интенсивно, а число ошибок страниц в секунду увеличится.

— Ошибок кэш-памяти/с

Этот счетчик показывает частоту возникновения ошибок при поиске страницы в кэше файловой системы. Это может быть программная ошибка, если страница обнаружена в памяти, или аппаратная ошибка, если страница находится на диске.

Эффективное использование кэша для операций чтения и записи может сильно повлиять на производительность сервера. Необходимо отслеживать увеличение числа ошибок кэша, что обозначается снижением значения Асинхронных быстрых чтений/с или Упреждающих чтений/с.

— Обмен страниц/с

Этот счетчик показывает скорость чтения или записи страниц на диск для устранения ошибок страниц физической памяти. Если его значение увеличивается, существуют проблемы с производительностью всей системы.

Файл подкачки

 

— % использования и % использования (пик)

Страничный файл сервера, также известный как файл подкачки, содержит "виртуальные" адреса на диске. Ошибки страницы возникают, когда процесс нужно остановить и дождаться, пока необходимые "виртуальные" ресурсы будут скопированы с диска в память. Их будет больше, если объема физической памяти недостаточно.

Сетевой адаптер

 

— Всего байт/с

Это скорость передачи и получения данных через сетевой адаптер. Если это значение превышает 40–50 % емкости сети, может потребоваться дальнейший анализ. Для более точного исследования отслеживайте значения Получено байт/с и Отправлено байт/с.

Процесс

 

— Рабочий набор

Этот счетчик указывает текущий размер рабочего набора для заданного процесса в байтах. Этот объем памяти резервируется для процесса, даже если он не используется.

— % загруженности процессора

Этот счетчик показывает процент времени процессора, используемого указанным процессом.

Число потоков (_Total)

Текущее количество потоков.

ASP.NET

 

Общее число запросов

Общее число запросов с момента запуска службы.

Запросов в очереди

SharePoint Server 2013 предоставляет стандартные блоки для HTML-страниц, которые отображаются в браузере пользователя по протоколу HTTP. Этот счетчик показывает число запросов, ожидающих обработки.

Время ожидания запроса

Время ожидания последнего запроса в очереди на обработку в миллисекундах. С увеличением числа событий ожидания пользователи будут замечать снижение производительности при отрисовке страниц.

Отклонено запросов

Общее число запросов, не выполненных из-за недостатка ресурсов сервера для их обработки. Этот счетчик представляет число запросов, возвращающих код состояния HTTP 503, указывающий на то, что сервер занят.

Выполняется запросов (_Total)

Число текущих выполняемых запросов.

Запросов/с (_Total)

Число выполняемых запросов в секунду. Это значение представляет текущую пропускную способность приложения. При постоянной нагрузке это число должно оставаться в определенном диапазоне, препятствуя выполнению других операций (например, сбору мусора, потоку очистки кэша, внешним серверным средствам и т. д.).

Память CLR .NET

 

Сборов мусора для поколения 0

Отображает число извлечений объектов поколения 0 (т. е. объектов, добавленных последними) сборщиком мусора с момента запуска приложения. Это значение удобно использовать в отношении "сборов мусора для поколения 0: сборов мусора для поколения 1: сборов мусора для поколения 2". Это позволяет следить за тем, чтобы число сборов мусора для поколения 2 не сильно превышало число сборов для поколения 0. Оптимальный коэффициент — 2.

Сборов мусора для поколения 1

Отображает число извлечений объектов поколения 1 сборщиком мусора с момента запуска приложения.

Сборов мусора для поколения 2

Отображает число извлечений объектов поколения 2 сборщиком мусора с момента запуска приложения. Этот счетчик увеличивается на 1 после завершения сбора мусора для поколения 2 (что также называют полным сбором мусора).

% времени в GC

Отображает процентное отношение времени, потраченного на сбор мусора после последнего цикла сбора мусора. Этот счетчик обычно обозначает работу, проделанную сборщиком мусора для извлечения и сжатия памяти от имени приложения. Этот счетчик обновляется только в конце каждой сборки мусора. Данный счетчик показывает не среднее, а последнее наблюдаемое значение. В нормальном режиме значение счетчика не должно превышать 5 %.

Счетчики SQL Server

В следующей таблице приведены сведения об объектах и счетчиках SQL Server.

Объекты и счетчики Описание

Общая статистика

Этот объект содержит счетчики для мониторинга общей работы сервера, такие как счетчик количества текущих подключений и количества пользователей, подключающихся к экземпляру SQL Server и отключающихся от него, в секунду.

Соединений пользователей

Этот счетчик показывает количество пользовательских подключений к вашему экземпляру SQL Server. Повышение этого значения на 500 % относительно исходного уровня может привести к снижению производительности.

Базы данных

Этот объект содержит счетчики для мониторинга массовых операций копирования, пропускной способности резервного копирования и восстановления, а также операций с журналом транзакций. Мониторинг транзакций и журнала транзакций позволяет определить степень активности пользователей в базе данных и степень заполнения журнала транзакций. Степень активности пользователей может оказывать влияние на производительность базы данных, размер журнала, блокировку и репликацию. Мониторинг низкоуровневых операций с журналом для оценки активности пользователей и использования ресурсов помогает определить факторы, ограничивающие производительность.

Транзакций/с

Этот счетчик отображает число транзакций в заданной базе данных или всем экземпляре SQL Server в секунду. Это значение помогает создать базовый план и упрощает устранение неполадок.

Блокировок

Этот объект содержит сведения о блокировках SQL Server для отдельных типов ресурсов.

Число взаимоблокировок/с

Этот счетчик показывает число взаимоблокировок в SQL Server в секунду. Как правило, это значение должно быть равно 0.

Среднее время ожидания блокировки (мс)

Этот счетчик показывает среднее время ожидания для каждого запроса блокировки, который вызвал задержку.

Время ожидания блокировки (мс)

Этот счетчик показывает общее время ожидания блокировок за последнюю секунду.

Ожиданий блокировок/с

Этот счетчик показывает количество блокировок в секунду, которые не были выполнены немедленно и были вынуждены ждать освобождения ресурсов.

Кратковременные блокировки

Этот объект содержит счетчики для мониторинга внутренних блокировок ресурсов SQL Server, которые называются кратковременными блокировками. Мониторинг кратковременных блокировок для определения активности пользователей и использования ресурсов помогает определить факторы, ограничивающие производительность.

Среднее время ожидания кратковременной блокировки (мс)

Этот счетчик показывает среднее время ожидания для запросов кратковременной блокировки.

Ожиданий кратковременных блокировок/с

Этот счетчик показывает число запросов кратковременных блокировок в секунду, которые не удалось выполнить незамедлительно.

Статистика SQL

Этот объект содержит счетчики для мониторинга компиляции и типа запросов, направленных к экземпляру SQL Server. Мониторинг количества компиляций и повторных компиляций, а также количества пакетов, полученных экземпляром SQL Server, позволяет определить скорость обработки запросов пользователей в SQL Server и эффективность обработки запросов оптимизатором запросов.

Компиляций SQL/с

Этот счетчик показывает количество введений пути к компилируемому коду в секунду.

Повторных компиляций SQL/с

Этот счетчик показывает число перекомпиляций инструкций в секунду.

Кэш планов

Этот объект предоставляет счетчики для отслеживания того, как SQL Server использует память для хранения таких объектов, как хранимые процедуры, случайные и подготовленные инструкции Transact-SQL, а также триггеры.

Коэффициент попадания в кэш

Этот счетчик показывает отношение количества попаданий в кэш к количеству поисков для планов.

Буферный кэш

Этот объект содержит счетчики для мониторинга того, как SQL Server использует память для хранения страниц данных, внутренних структур данных и кэша процедур, а также для мониторинга работы физической подсистемы ввода-вывода при чтении и записи страниц базы данных в SQL Server.

Коэффициент попадания в буферный кэш

Этот счетчик показывает процент страниц, которые были найдены в буферном кэше и не требовали считывания с диска. Коэффициент равен отношению общего количества попаданий в кэш к общему количеству поисков в кэше с момента запуска экземпляра SQL Server.

Удаление узких мест

Узких мест системы представляют точку конкуренции которых недостаточно ресурсов для обслуживания запросов транзакций пользователя. Это может быть физического оборудования, операционной среды или на основе приложения. Часто причиной узким местом будет Неэффективная пользовательский код или с помощью решений сторонних производителей, и приводится обзор может вызвать улучшить результаты, чем добавить необходимое оборудование. Другой распространенной причиной возникновения узких мест является неправильной настройке фермы или реализация Неэффективная решения, структуры данных, чтобы требует больше ресурсов, чем необходимо. Для системный администратор должен управлять узкие места, постоянно мониторинг производительности. Если определить проблемы с производительностью, необходимо оценить наиболее решение для удаления узким местом. Счетчики производительности и другие приложения, такие как SCOM, наблюдения за производительностью — основные средства в отслеживание и анализ проблем, таким образом, вы можете разрабатывать решения.

Устранение физического узкого места

Физические узкие места связаны с недостатком ресурсов процессора, диска, памяти и сети: слишком много запросов для слишком малого числа ресурсов. Объекты и счетчики, описанные в разделе "Мониторинг производительности" позволяют определить, где возникла проблема, например в процессоре или ASP.NET. Для устранения узкого места необходимо выявить проблему и внести соответствующие изменения.

Проблемы редко возникают неожиданно. Обычно наблюдается постепенное ухудшение производительности, которое можно выявить при регулярном отслеживании системы с помощью монитора производительности или более сложной системы, такой как SCOM. При использовании любого из этих средств (в различной степени) способы устранения проблемы можно внедрять в оповещение в форме текстовой рекомендации или команд в скрипте.

Может потребоваться разрешение вопросов узкое место при внесении изменений конфигурации оборудования или системы, убедившись, что они не является причиной неправильной настройкой, неэффективны настраиваемых решений кода или сторонних производителей или реализации Неэффективная решения. Следующей таблицы определите варианты устранения проблемы порогового значения и, возможно. Некоторые параметры предложить обновление оборудования или изменения.

Объекты и счетчики Проблема Варианты устранения

Процессор

Процессор — % загруженности процессора

Более 75–85 %

Обновить процессор.

Увеличить число процессоров.

Добавить дополнительные серверы.

Диск

   

Средняя длина очереди диска

Постепенное увеличение, система не находится в стабильном состоянии и выполняется резервное копирование очереди.

Увеличить число или скорость дисков.

Перейти к чередующейся конфигурации массива.

Переместить данные на альтернативный сервер.

% времени простоя

Менее 90 %

Увеличить число дисков.

Переместить данные на другой диск или сервер.

% свободного места

Менее 30 %

Увеличить число дисков.

Переместить данные на другой диск или сервер.

Память

   

Доступно МБ

Менее 2 ГБ на веб-сервере

Добавить память.

Примечание

Объем доступной памяти SQL Server будет небольшим, это предусмотрено при проектировании и не всегда указывает на наличие проблемы.

Ошибок кэш-памяти/с

Больше 1

Добавить память.

По возможности увеличить размер и скорость кэша.

Переместить данные на другой диск или сервер.

Обмен страниц/с

Больше 10

Добавить память.

Файл подкачки

   

% использования и % использования (пик)

Страничный файл сервера, также известный как файл подкачки, содержит "виртуальные" адреса на диске. Ошибки страницы возникают, когда процесс нужно остановить и дождаться, пока необходимые "виртуальные" ресурсы будут скопированы с диска в память. Их будет больше, если объема физической памяти недостаточно.

Добавить память.

Сетевой адаптер

   

Всего байт/с

Более 40–50 % пропускной способности сети. Это скорость передачи и получения данных через сетевой адаптер.

Дальнейший анализ путем наблюдения за счетчиками "Получено байт/с" и "Отправлено байт/с".

Пересмотреть скорость сетевого адаптера.

Проверить число, размер и загрузку буферов памяти.

Процесс

   

Рабочий набор

Более 80 % от общего объема памяти

Добавить память.

% загруженности процессора

Более 75–85 %

Увеличить число процессоров.

Перераспределить нагрузку на дополнительные серверы.

ASP.NET

   

Перезапусков пула приложений

Несколько в день, что вызывает временные задержки

Убедиться, что перезапуск пула приложения в течение дня не вызван используемым настройками.

Запросов в очереди

Сотни или тысячи запросов в очереди

Реализовать дополнительные веб-серверы.

Максимальное значение по умолчанию для этого счетчика — 5 000, вы можете изменить его в файле Machine.config.

Время ожидания запроса

С увеличением числа событий ожидания пользователи будут замечать снижение производительности при отрисовке страниц

Реализовать дополнительные веб-серверы.

Отклонено запросов

Больше 0

Реализовать дополнительные веб-серверы.

See also

Тестирование производительности для SharePoint Server 2013
Планирование мощности для SharePoint Server 2013
Мониторинг и создание отчетов в SharePoint Server 2016

Обзор управления емкостью и изменения размера в SharePoint Server 2013