Устранение неполадок набора данных о работоспособности DataProtection
Область применения: Exchange Server 2013 г.
Набор для контроля работоспособности DataProtection служит для мониторинга избыточности баз данных в группе обеспечения доступности баз данных (DAG).
Если вы получаете оповещение о том, что DataProtection неработоспособна, это указывает на проблему, которая может повлиять на компоненты репликации или кластера и может препятствовать доступу к базам данных Exchange.
Объяснение
Служба работоспособности DataProtection отслеживается с помощью следующих зондов и мониторов.
Зонд | Настройки работоспособности | Зависимости | Связанные мониторы |
---|---|---|---|
ClusterEndpointProbe | DataProtection | Active Directory | ClusterEndpointMonitor |
ClusterGroupProbe | DataProtection | Active Directory | ClusterGroupMonitor |
ClusterNetworkProbe | DataProtection | Active Directory | ClusterNetworkMonitor |
ClusterServiceCrashProbe | DataProtection | Active Directory | ClusterServiceCrashMonitor |
ServerOneCopyProbe | DataProtection | Active Director | ServerOneCopyMonitor |
ServerOneCopyInternalMonitorProbe | DataProtection | Active Directory | ServerOneCopyInternalMonitorMonitor |
ServiceHealthMSExchangeReplEndpointProbe | DataProtection | Active Directory | ServiceHealthMSExchangeReplEndpointMonitor |
ServiceHealthMSExchangeReplCrashProbe | DataProtection | Active Directory | ServiceHealthMSExchangeReplCrashMonitor |
ServerSiteFailureProbe | DataProtection | Active Directory | ServerSiteFailureMonitor |
StorageApparentControllerIssuesProbe | DataProtection | Active Directory | StorageApparentControllerIssuesMonitor |
DatabaseHealthTooManyMountedDatabaseProbe | DataProtection | Active Directory | DatabaseHealthTooManyMountedDatabaseMonitor |
Дополнительные сведения о пробах и мониторах см. в разделе Работоспособность и производительность сервера.
Действия пользователя
Служба может восстановить работу после отображения оповещения. Поэтому если вы получите оповещение о неработоспособном состоянии настроек работоспособности, сначала убедитесь в наличии данной проблемы. Если проблема не устранена, выполните соответствующие действия по восстановлению, указанные в приведенных ниже разделах.
Проверка наличия проблемы
Определите имена настроек работоспособности и сервера, указанные в оповещении.
В сообщении приводятся подробные сведения о точной причине возникновения оповещения. В большинстве случаев в сообщении приводится достаточно сведений по устранению неполадок для определения основной причины проблемы. Если в сообщении приводятся непонятные сведения:
Откройте командную консоль Exchange и выполните следующую команду, чтобы получить сведения о наборе работоспособности, выпустившей оповещение:
Get-ServerHealth <server name> | ?{$_.HealthSetName -eq "<health set name>"}
Например, чтобы извлечь подробные сведения о настройках работоспособности Autodiscover.Protocol относительно сервера server1.contoso.com, выполните следующую команду.
Get-ServerHealth server1.contoso.com | ?{$_.HealthSetName -eq "Autodiscover.Protocol"}
Просмотрите выходные данные команды, чтобы определить монитор, сообщивший об ошибке. Значение AlertValue для монитора, выдавшего оповещение, будет иметь значение
Unhealthy
.Определите зонд, на котором основан монитор. Обратите внимание, что у большинства зондов один и тот же префикс. В предыдущем примере выполните поиск по запросу ClusterNetwork*:
Get-MonitoringItemIdentity -Identity DataProtection -Server server1.contoso.com | ?{$_.Name -like "ClusterNet ItemType work*"}
Возвращенные результаты должны иметь примерно следующий вид.
ItemType HealthSetName Имя TargetResource Probe
DataProtection
ClusterNetworkProbe
MSExchangeRepl
Повторно запустите связанную пробу для монитора, который находится в неработоспособном состоянии. Обратитесь к таблице в разделе Explanation, чтобы найти связанный зонд. Для этого выполните следующую команду.
Invoke-MonitoringProbe <health set name>\<probe name> -Server <server name> | Format-List
Например, предположим, что не работает монитор AutodiscoverSelfTestMonitor. С этим монитором связан зонд AutodiscoverSelfTestProbe. Чтобы запустить этот зонд на сервере server1.contoso.com, выполните следующую команду.
Invoke-MonitoringProbe Autodiscover.Protocol\AutodiscoverSelfTestProbe -Server server1.contoso.com | Format-List
В выходных данных команды просмотрите значение параметра Результат зонда. Если этот параметр имеет значение Succeeded, ошибка была временной и в настоящее время устранена. В противном случае обратитесь к действиям по восстановлению, приведенным в следующих разделах.
Действия по устранению неполадок
Если вы получите оповещение, связанное с настройками работоспособности, сообщение электронной почты содержит приведенные ниже сведения.
Имя сервера, отправившего оповещение.
Время и дата возникновения оповещения.
Используемый механизм проверки подлинности и сведения об учетных данных.
Полная трассировка исключения, связанного с последней ошибкой, включая диагностические данные и конкретные сведения о заголовке HTTP.
Сведения в полной трассировке исключения можно использовать для устранения проблемы. Исключение, созданное зондом, содержит причину сбоя зонда.
Для большинства проблем, возникающих в средах высокой доступности, можно запустить командлет Test-ReplicationHealth, чтобы устранить неполадки в кластерах, сети, ActiveManager и службах. Для других наборов для контроля работоспособности и компонентов существуют другие командлеты с префиксом "Test-*".
Например:
Test-ReplicationHealth <ServerName>
Возвращаемые результаты будут выглядеть следующим образом:
Сервер | Проверка | Result |
---|---|---|
<Имя _сервера> | ClusterService |
Passed |
<Имя _сервера> | ReplayService |
Passed |
<Имя _сервера> | ActiveManager |
Passed |
<Имя _сервера> | TasksRpcListener |
Passed |
<Имя _сервера> | TcpListener |
Passed |
<Имя _сервера> | ServerLocatorService |
Passed |
<Имя _сервера> | DagMembersUp |
Passed |
<Имя _сервера> | ClusterNetwork |
Passed |
<Имя _сервера> | QuorumGroup |
Passed |
<Имя _сервера> | FileShareQuorum |
Passed |
<Имя _сервера> | DatabaseRedundancyCheck |
Passed |
<Имя _сервера> | DatabaseAvailabilityCheck |
Passed |
<Имя _сервера> | DBCopySuspended |
Passed |
<Имя _сервера> | DBCopyFailed |
Прошло |
<Имя _сервера> | DBInitializing |
Passed |
<Имя _сервера> | DBDisconnected |
Passed |
<Имя _сервера> | DBLogCopyKeepingUp |
Passed |
<Имя _сервера> | DBLogReplayKeepingUp |
Passed |
Если для всех компонентов отображается значение Тест пройден в столбце Результат, попробуйте перезапустить связанный зонд, как это показано в шаге 2c в разделе Verifying the issue still exists.
Если проблема не устранена, перезапустите сервер. После перезапуска сервера повторно запустите связанный зонд, как показано в шаге 2c раздела Verifying the issue still exists.
Если зонд все еще не работает, вам понадобится помощь для устранения данной проблемы. Для решения этой проблемы обратитесь к специалисту службы технической поддержки Майкрософт. Чтобы обратиться к специалисту по служба поддержки Майкрософт, перейдите в службу поддержки для бизнеса, а затем выберите Серверы>Exchange Server. Так как обращение непосредственно в службу технической поддержки Майкрософт в вашей организации может регламентироваться, сначала ознакомьтесь с инструкциями организации.