Мониторинг и устранение неполадок, связанных с быстродействием хранилища

В этой статье приведены счетчики производительности, рекомендуемые для слежения за производительностью баз данных SQL Server, работающих в среде Microsoft Office SharePoint Server 2007. Кроме того, приведены приблизительные работоспособные значения для каждого счетчика.

Сведения о мониторинге производительности и использовании счетчиков производительности см. в статье Мониторинг производительности (https://go.microsoft.com/fwlink/?linkid=105584&clcid=0x419).

Отслеживаемые счетчики физических серверов

Чтобы гарантировать работоспособность своих серверов, следите за следующими счетчиками:

  • Процессор: % загруженности процессора: _Всего.   Этот счетчик показывает процент времени, в течение которого процессор выполняет процессы приложений и операционной системы, не находясь в состоянии бездействия. На компьютере с работающим приложением SQL Server значение этого счетчика должно находиться между 50 и 75 процентами. В случае постоянной перегрузки, исследуйте, является ли причиной отклонения аномальная работа процессов или в сервер нужно установить дополнительные процессоры.

  • Система: Длина очереди процессора.   Этот счетчик показывает число потоков в очереди процессора. Следите за этим счетчиком, чтобы гарантировать, что он не более, чем в два раза превышает число ядер процессоров.

  • Память: Доступно МБ.   Этот счетчик показывает количество физической памяти (в мегабайтах), доступное процессам, работающим на компьютере. Следите за этим счетчиком, чтобы гарантировать уровень, не менее 20 процентов суммарного доступного физического ОЗУ.

  • Память: Обмен страниц/сек.   Этот счетчик показывает частоту считывания страниц с диска или записи на диск, чтобы разрешать ошибки страниц физической памяти. Следите за этим счетчиком, чтобы гарантировать, что его значение не превысит 100.

Дополнительные сведения и методы устранения неполадок памяти см. в статье Использование мониторинга памяти для SQL Server 2005 (https://go.microsoft.com/fwlink/?linkid=105585&clcid=0x419).

Отслеживаемые счетчики дисков

Чтобы гарантировать работоспособность дисков, следите за следующими счетчиками. Обратите внимание, что следующие значения представляют значения, измеренные за интервал времени, а не значения во время неожиданного пика и не значения, основанные на одном измерении.

  • Физический диск: % активности диска: Диск_Данных.   Этот счетчик показывает процент прошедшего времени, в течение которого выбранный диск был занят, обслуживая запросы чтения или записи. Следите за этим счетчиком, чтобы гарантировать, что он превышает число дисков не более, чем в два раза.

  • Логический диск: Обращений к диску/сек.   Этот счетчик показывает частоту выполнения операций чтения и записи для диска. Этот счетчик используется для контроля тенденций увеличения и соответствующих прогнозов.

  • Логический диск: Скорость чтения с диска (байт/сек) и Логический диск: Скорость записи на диск (байт/сек).   Эти счетчики показывают частоту, с которой байты передаются с диска или на диск во время операций чтения или записи, соответственно.

  • Логический диск: Средний размер одного чтения с диска (байт).   Этот счетчик показывает среднее число байтов, переданных с диска во время операций чтения. Это значение может отражать задержку диска — большее число операций чтения может привести к небольшому увеличению задержки.

  • Логический диск: Средний размер одной записи на диск (байт).   Этот счетчик показывает среднее число байтов, переданных с диска во время операций чтения. Это значение может отражать задержку диска — большее число операций записи может привести к небольшому увеличению задержки.

  • Логический диск: Текущая длина очереди диска.   Этот счетчик показывает число невыполненных запросов к диску время сбора данных о производительности. Чем ниже значения этого счетчика, тем лучше. Значения, превышающие 2 на диск, могут показывать узкие места и требуют исследования. Это означает, что для LUN, состоящего из 4 дисков, допустимо значение до 8. Узкие места могут вызывать появление невыполненных заданий, которые могут распространяться за пределы текущего сервера, обращающегося к диску, и приводить к длительным временам ожидания пользователей. Возможными решениями для устранения узкого места являются добавление дисков в RAID-массив, замена существующих дисков на более быстрые или перемещение определенных данных на другие диски.

  • Логический диск: Средняя длина очереди диска.   Этот счетчик показывает среднее число запросов как чтения, так и записи, которые были поставлены в очередь за интервал выборки. Правило состоит в том, что число невыполненных запросов ввода и вывода на диск не должно превышать двух запросов, но это значение может быть трудно измерить из-за виртуализации хранилища и различий уровней RAID между конфигурациями. Ищите сочетание превышения средних длин очереди диска вместе с превышением средних задержек диска. Эта комбинация может сообщать о перегрузке кэша массива хранилища или о том, что совместное использование диска с другими приложениями влияет на производительность.

  • Логический диск: Среднее время чтения с диска (сек) и Логический диск: Среднее время записи на диск (сек).   Эти счетчики показывают среднее время, в секундах, операции чтения или записи на диск. Следите за этими счетчиками, чтобы гарантировать, что они останутся ниже 85 процентов производительности диска. Время доступа к диску вырастает экспоненциально, если операции чтения или записи занимают более 85 процентов производительности диска. Чтобы определить конкретную производительность своего оборудования, обратитесь к документации производителя или используйте для ее расчета средство тестирования производительности дисковой подсистемы SQLIO. Дополнительные сведения см. в статье Средство тестирования производительности дисковой подсистемы SQLIO(на английском языке) (https://go.microsoft.com/fwlink/?linkid=105586&clcid=0x419).

    • Логический диск: Среднее время чтения с диска (сек).   Этот счетчик показывает среднее время, в секундах, операции чтении с диска. На хорошо настроенной системе идеальные значения находятся в диапазоне 1–5 мс для журналов (в идеале 1 мс для кэшируемого массива) и 4–20 мс для данных (в идеале меньше 10 мс). Большие задержки могут возникать в пиковые моменты, но если высокие значения возникают регулярно, следует изучить возможную причину.

    • Логический диск: Среднее время записи на диск (сек).   Этот счетчик показывает среднее время, в секундах, операции чтении с диска. На хорошо настроенной системе идеальные значения находятся в диапазоне 1–5 мс для журналов (в идеале 1 мс для кэшируемого массива) и 4–20 мс для данных (в идеале меньше 10 мс). Большие задержки могут возникать в пиковые моменты, но если высокие значения возникают регулярно, следует изучить возможную причину.

    При использовании RAID-конфигураций с Среднее время чтения с диска (сек) или Среднее время записи на диск (сек), применяйте формулы, приведенные в следующей таблице, чтобы определить скорость ввода с диска и вывода на диск.

    Уровень RAID Формула

    RAID 0

    Операции ввода-вывода на диск= (чтения + записи) / число дисков

    RAID 1

    Операции ввода-вывода на диск= [чтения + (2 * записи))] / 2

    RAID 5

    Операции ввода-вывода на диск= [чтения + (4 * записи)] / число дисков

    RAID 10

    Операции ввода-вывода на диск= [чтения + (2 * записи)] / число дисков

    Например, если при использовании системы RAID 1 с двумя физическими дисками значения счетчиков равны показанным в следующей таблице:

    Счетчик Значение

    Среднее время чтения с диска (сек)

    80

    Среднее время записи на диск (сек)

    70

    Средняя длина очереди диска

    5

    Значение операций ввода-вывода на диск можно вычислить следующим образом: (80 + (2 * 70))/2 = 110

    Длина очереди диска может быть вычислена как: 5/2 = 2,5

    В этой ситуации диагностируется пограничное состояние узкого места ввода-вывода.

Другие средства наблюдения

Можно также отслеживать задержки диска и анализировать тенденции, используя динамическое административное представление sys.dm_io_virtual_file_stats в SQL Server 2008. Дополнительные сведения см. в описании sys.dm_io_virtual_file_stats (Transact-SQL) (https://go.microsoft.com/fwlink/?linkid=105587&clcid=0x419).

Устранение неполадок

При недостаточной производительности диска или RAID-массива можно выполнить следующие действия:

  1. Переместите некоторые файлы на отдельный диск или RAID-массив.

  2. Добавить диски в массив.

  3. Если невозможно отделить содержимое (например, если есть только один файл базы данных контента), замените диски на более быстрые.

  4. По возможности разделите соответствующую базу данных контента на несколько баз данных, то есть переместите или разбейте и переместите семейства сайтов, используя такие средства, как программа командной строки Stsadm.exe или Microsoft Office SharePoint Designer. Если проблема сохраняется, повторите действия по устранению неполадок, начиная с шага 1.