Устранение неполадок набора данных о работоспособности DataProtection

Область применения: Exchange Server 2013 г.

Набор для контроля работоспособности DataProtection служит для мониторинга избыточности баз данных в группе обеспечения доступности баз данных (DAG).

Если вы получаете оповещение о том, что DataProtection неработоспособна, это указывает на проблему, которая может повлиять на компоненты репликации или кластера и может препятствовать доступу к базам данных Exchange.

Объяснение

Служба работоспособности DataProtection отслеживается с помощью следующих зондов и мониторов.

Зонд Настройки работоспособности Зависимости Связанные мониторы
ClusterEndpointProbe DataProtection Active Directory ClusterEndpointMonitor
ClusterGroupProbe DataProtection Active Directory ClusterGroupMonitor
ClusterNetworkProbe DataProtection Active Directory ClusterNetworkMonitor
ClusterServiceCrashProbe DataProtection Active Directory ClusterServiceCrashMonitor
ServerOneCopyProbe DataProtection Active Director ServerOneCopyMonitor
ServerOneCopyInternalMonitorProbe DataProtection Active Directory ServerOneCopyInternalMonitorMonitor
ServiceHealthMSExchangeReplEndpointProbe DataProtection Active Directory ServiceHealthMSExchangeReplEndpointMonitor
ServiceHealthMSExchangeReplCrashProbe DataProtection Active Directory ServiceHealthMSExchangeReplCrashMonitor
ServerSiteFailureProbe DataProtection Active Directory ServerSiteFailureMonitor
StorageApparentControllerIssuesProbe DataProtection Active Directory StorageApparentControllerIssuesMonitor
DatabaseHealthTooManyMountedDatabaseProbe DataProtection Active Directory DatabaseHealthTooManyMountedDatabaseMonitor

Дополнительные сведения о пробах и мониторах см. в разделе Работоспособность и производительность сервера.

Действия пользователя

Служба может восстановить работу после отображения оповещения. Поэтому если вы получите оповещение о неработоспособном состоянии настроек работоспособности, сначала убедитесь в наличии данной проблемы. Если проблема не устранена, выполните соответствующие действия по восстановлению, указанные в приведенных ниже разделах.

Проверка наличия проблемы

  1. Определите имена настроек работоспособности и сервера, указанные в оповещении.

  2. В сообщении приводятся подробные сведения о точной причине возникновения оповещения. В большинстве случаев в сообщении приводится достаточно сведений по устранению неполадок для определения основной причины проблемы. Если в сообщении приводятся непонятные сведения:

    1. Откройте командную консоль Exchange и выполните следующую команду, чтобы получить сведения о наборе работоспособности, выпустившей оповещение:

      Get-ServerHealth <server name> | ?{$_.HealthSetName -eq "<health set name>"}
      

      Например, чтобы извлечь подробные сведения о настройках работоспособности Autodiscover.Protocol относительно сервера server1.contoso.com, выполните следующую команду.

      Get-ServerHealth server1.contoso.com | ?{$_.HealthSetName -eq "Autodiscover.Protocol"}
      

      Просмотрите выходные данные команды, чтобы определить монитор, сообщивший об ошибке. Значение AlertValue для монитора, выдавшего оповещение, будет иметь значение Unhealthy.

    2. Определите зонд, на котором основан монитор. Обратите внимание, что у большинства зондов один и тот же префикс. В предыдущем примере выполните поиск по запросу ClusterNetwork*:

      Get-MonitoringItemIdentity -Identity DataProtection -Server server1.contoso.com | ?{$_.Name -like "ClusterNet ItemType work*"}
      

      Возвращенные результаты должны иметь примерно следующий вид.

      ItemType HealthSetName Имя TargetResource
      Probe DataProtection ClusterNetworkProbe MSExchangeRepl
    3. Повторно запустите связанную пробу для монитора, который находится в неработоспособном состоянии. Обратитесь к таблице в разделе Explanation, чтобы найти связанный зонд. Для этого выполните следующую команду.

      Invoke-MonitoringProbe <health set name>\<probe name> -Server <server name> | Format-List
      

      Например, предположим, что не работает монитор AutodiscoverSelfTestMonitor. С этим монитором связан зонд AutodiscoverSelfTestProbe. Чтобы запустить этот зонд на сервере server1.contoso.com, выполните следующую команду.

      Invoke-MonitoringProbe Autodiscover.Protocol\AutodiscoverSelfTestProbe -Server server1.contoso.com | Format-List
      
    4. В выходных данных команды просмотрите значение параметра Результат зонда. Если этот параметр имеет значение Succeeded, ошибка была временной и в настоящее время устранена. В противном случае обратитесь к действиям по восстановлению, приведенным в следующих разделах.

Действия по устранению неполадок

Если вы получите оповещение, связанное с настройками работоспособности, сообщение электронной почты содержит приведенные ниже сведения.

  • Имя сервера, отправившего оповещение.

  • Время и дата возникновения оповещения.

  • Используемый механизм проверки подлинности и сведения об учетных данных.

  • Полная трассировка исключения, связанного с последней ошибкой, включая диагностические данные и конкретные сведения о заголовке HTTP.

    Сведения в полной трассировке исключения можно использовать для устранения проблемы. Исключение, созданное зондом, содержит причину сбоя зонда.

Для большинства проблем, возникающих в средах высокой доступности, можно запустить командлет Test-ReplicationHealth, чтобы устранить неполадки в кластерах, сети, ActiveManager и службах. Для других наборов для контроля работоспособности и компонентов существуют другие командлеты с префиксом "Test-*".

Например:

Test-ReplicationHealth <ServerName>

Возвращаемые результаты будут выглядеть следующим образом:

Сервер Проверка Result
<Имя _сервера> ClusterService Passed
<Имя _сервера> ReplayService Passed
<Имя _сервера> ActiveManager Passed
<Имя _сервера> TasksRpcListener Passed
<Имя _сервера> TcpListener Passed
<Имя _сервера> ServerLocatorService Passed
<Имя _сервера> DagMembersUp Passed
<Имя _сервера> ClusterNetwork Passed
<Имя _сервера> QuorumGroup Passed
<Имя _сервера> FileShareQuorum Passed
<Имя _сервера> DatabaseRedundancyCheck Passed
<Имя _сервера> DatabaseAvailabilityCheck Passed
<Имя _сервера> DBCopySuspended Passed
<Имя _сервера> DBCopyFailed Прошло
<Имя _сервера> DBInitializing Passed
<Имя _сервера> DBDisconnected Passed
<Имя _сервера> DBLogCopyKeepingUp Passed
<Имя _сервера> DBLogReplayKeepingUp Passed

Если для всех компонентов отображается значение Тест пройден в столбце Результат, попробуйте перезапустить связанный зонд, как это показано в шаге 2c в разделе Verifying the issue still exists.

Если проблема не устранена, перезапустите сервер. После перезапуска сервера повторно запустите связанный зонд, как показано в шаге 2c раздела Verifying the issue still exists.

Если зонд все еще не работает, вам понадобится помощь для устранения данной проблемы. Для решения этой проблемы обратитесь к специалисту службы технической поддержки Майкрософт. Чтобы обратиться к специалисту по служба поддержки Майкрософт, перейдите в службу поддержки для бизнеса, а затем выберите Серверы>Exchange Server. Так как обращение непосредственно в службу технической поддержки Майкрософт в вашей организации может регламентироваться, сначала ознакомьтесь с инструкциями организации.

Дополнительные сведения

Что нового в Exchange 2013

Exchange PowerShell