Руководство по мониторингу и устранению неполадок в группах доступности AlwaysOn

 

THIS TOPIC APPLIES TO: yesSQL Server (starting with 2008) noAzure SQL Database noAzure SQL Data Warehouse noParallel Data Warehouse

Это руководство поможет вам приступить к работе над устранение некоторых распространенных проблем в группах доступности AlwaysOn и мониторинг групп доступности AlwaysOn. Он предназначен для предоставления исходного содержимого, а также целевая страница полезной информации, уже опубликована в других местах.

Хотя в этом руководстве не может полностью рассматриваются все проблемы, которые могут возникнуть на большую площадь, охваченных группами доступности AlwaysOn, он указывает вы в правильном направлении в вашей анализ основной причины и способы устранения проблемы. Как группы доступности AlwaysOn — это встроенная технология, множество проблем, возникающих только признаками этой проблемы являются другие проблемы в базе данных. Некоторые проблемы, вызванные параметры в группе доступности, такие как приостановки базы данных доступности. Другие проблемы могут включать проблемы, которые можно изолировать к другим аспектам SQL Server, такие как параметры SQL Server, развертывание файла базы данных и проблем с производительностью систематический несвязанных группы доступности, реплик или базы данных. По-прежнему других проблем и находятся за пределами SQL Server, например сетевых операций ввода-вывода, TCP/IP, Active Directory и сервера отказоустойчивой кластеризации Windows (WSFC). Часто вызывают проблемы, что поверхности в группе доступности, реплик или базы данных требуется для устранения различных технологий, прежде чем можно определить корневой.

Устранение неполадок в сценариях

В следующей таблице содержатся ссылки на общие сценарии устранения неполадок для групп доступности AlwaysOn. Они разбиты на категории по их типы сценарии, например конфигурации, возможность подключения клиентов, переход на другой ресурс и производительности.

Сценарий Тип сценария Description
Диагностика конфигурации групп доступности AlwaysOn ( SQL Server ) Конфигурация Сведения об устранении типичных проблем, возникающих при настройке экземпляров сервера для групп доступности AlwaysOn. Включает примеры типичных проблем настройки группы доступности AlwaysOn отключена, учетные записи настроены неправильно, конечная точка зеркального отображения базы данных не существует, конечная точка является недоступным (ошибка SQL Server 1418), отсутствует доступ к сети и команда присоединения базы данных завершается ошибкой (ошибка SQL Server 35250).
Устранение неполадок «WSFC Проверка конфигурации кворума голосования «предупреждение Конфигурация При создании группы доступности AlwaysOn с помощью мастера создания группы доступности в Microsoft SQL Server 2012, появится предупреждающее сообщение, которое имеет следующий вид: «текущей конфигурации голосования кворума кластера WSFC не рекомендуется для этой группы доступности.»
Устранение неполадок при создании прослушивателей группы доступности Конфигурация Возникают ошибки при попытке создания прослушивателя группы доступности.
Устранение неполадок операцию не удалось добавить файл ( Группы доступности AlwaysOn ) Конфигурация В результате операции добавления файла база данных-получатель приостановлена, а также находиться в состоянии NOT SYNCHRONIZING.
Исправление: Ошибка 41009 при попытке создать несколько групп доступности Конфигурация Возникли ошибки 41009 при попытке создать несколько групп доступности.
Не удается подключиться к прослушивателю группы доступности в среде с несколькими подсетями Подключение клиента После настройки прослушивателя группы доступности, не удается проверить связь с прослушиватель или подключаться к ней из приложения.
Устранение неполадок сбоя автоматический переход на другой ресурс Отработка отказа Не удалось выполнить автоматический переход на другой.
Устранение неполадок: Группы доступности превышен RTO Производительность После автоматической отработки отказа или плановую отработку отказа вручную без потери данных время отработки отказа превышает вашего RTO. Или, при оценке времени отработки отказа вторичной реплики с синхронной фиксацией (например, партнера автоматического перехода на другой ресурс), найти превышает вашей RTO.
Устранение неполадок: Группы доступности превышен RPO Производительность После выполнения принудительной отработки отказа вручную, то потеря данных больше, чем RPO. Или, при расчете возможна потеря данных вторичная реплика асинхронной фиксации, найти превышает RPO.
Устранение неполадок: Изменения в первичной реплике, не отражаются на вторичной реплике Производительность Клиентское приложение успешного завершения обновления первичной реплике, но запрос вторичной реплики показано, что изменения не отражаются.

Полезные средства для устранения неполадок

При настройке или при запуске группы доступности AlwaysOn, различные средства помогают определить причины различные типы проблем. В таблице ниже ссылки на полезные сведения об этих средствах.

Инструмент Description
Использование панели мониторинга AlwaysOn (среда SQL Server Management Studio) Отчеты в быстро представление работоспособности группы доступности в удобным интерфейсом.
Политики AlwaysOn Использовать панели мониторинга AlwaysOn.
Журнал ошибок SQL Server ( Группы доступности AlwaysOn ) Журналы состояния события переходов для группы доступности, реплик и баз данных, состояния других компонентов AlwaysOn и ошибки AlwaysOn.
КЛАСТЕР. ЖУРНАЛ ( Группы доступности AlwaysOn ) Журналы событий, включая переходы состояния группы доступности, а также события и ошибки из DLL ресурсов SQL Server с кластером.
Журнал диагностики работоспособности AlwaysOn Журналы диагностики работоспособности SQL Server, предоставленное с кластером WSFC (SQL Server Библиотека ресурсов) sp_server_diagnostics ( Transact-SQL ).
Динамические административные представления и представления системного каталога ( Группы доступности AlwaysOn ) Сообщает сведения о группах доступности, такие как конфигурации, состояние работоспособности и метрики производительности.
AlwaysOn расширенных событий Предоставляет подробные diagnotics групп доступности и полезные для анализа основных причин.
Типы ожиданий AlwaysOn Предоставляет статистику ожидания специально для группы доступности и полезные для настройки производительности.
Счетчики производительности AlwaysOn Наблюдение за активностью группы доступности AlwaysOn являются отражаются в системном мониторе и используется для настройки производительности. Дополнительные сведения см. в разделе SQL Server, реплика доступности и SQL Server, реплика базы данных.
AlwaysOn кольцевых буферов Запись предупреждения в системе SQL Server для внутренней диагностики, а также можно использовать для отладки проблемы, связанные с группами доступности.

Мониторинг групп доступности AlwaysOn

Проблема требуются отработки отказа ли автоматический или ручной предшествует идеальный времени для устранения неполадок группы доступности. Это можно сделать путем отслеживания показателей производительности группы доступности и отправки предупреждений, выполняя реплик доступности вне пределов соглашения об уровне обслуживания (SLA). Например если синхронная вторичная реплика имеет проблем с производительностью, вызывающие приблизительное время отработки отказа для увеличения, подождите, пока выполняется автоматическая отработка отказа и можно определить, что время отработки отказа превышает время цели восстановления не требуется.

Как группы доступности AlwaysOn это высокого уровня доступности и аварийного восстановления, наиболее важные метрики производительности для наблюдения, приблизительное время отработки отказа, который влияет на время восстановления (RTO) и потери данных после аварии, который влияет на вашей точки восстановления (RPO). Эти показатели можно собирать данные, которые SQL Server предоставляет в любой момент времени, поэтому можно получать оповещения о проблемах в HADR-возможностей системы до возникновения события причину ошибки. Таким образом важно ознакомиться с процессом синхронизации данных групп доступности AlwaysOn и соответствующим образом сбора метрик.

Следующей таблице описываются разделы, в которых можно отслеживать работоспособность группы доступности AlwaysOn решения.

Раздел Description
Монитор производительности для группы доступности AlwaysOn Описывает процесс синхронизации данных для группы доступности AlwaysOn, шлюзы потока управления и полезных метрик, при мониторинге группы доступности; а также показано, как собирать метрики RTO и RPO.
Мониторинг групп доступности ( SQL Server ) Сведения о средствах наблюдения за группой доступности.
AlwaysOn работоспособности модель, часть 1 архитектура модели исправности Общие сведения о модели исправности AlwaysOn.
Модель исправности AlwaysOn часть 2 — расширение модели исправности Показано, как настроить модель исправности AlwaysOn и настраивать панели мониторинга AlwaysOn для отображения дополнительных сведений.
Мониторинг работоспособности AlwaysOn с PowerShell, часть 1: общий обзор командлетов Предоставляет общий обзор командлетов AlwaysOn PowerShell, которые можно использовать для наблюдения за работоспособностью группы доступности.
Мониторинг работоспособности AlwaysOn с PowerShell, часть 2: расширенное использование командлетов Содержит сведения о расширенное использование командлетов AlwaysOn PowerShell для наблюдения за работоспособностью группы доступности.
Мониторинг работоспособности AlwaysOn с PowerShell, часть 3: простое приложение для мониторинга Показано, как автоматически мониторинг группы доступности с помощью приложения.
Мониторинг работоспособности AlwaysOn с PowerShell, часть 4: интеграция с агентом SQL Server Сведения о том, как интегрировать отслеживания группы доступности с помощью агента SQL Server и настроить уведомление соответствующим получателям при возникновении проблем.

См. также:

Блог SQL Server AlwaysOn
Блоги инженеров CSS SQL Server