Устранение неполадок в наборе для контроля работоспособности DataProtection

 

Применимо к:Exchange Server 2013, Project Server 2013

Последнее изменение раздела:2015-03-09

Набор для контроля работоспособности DataProtection служит для мониторинга избыточности баз данных в группе обеспечения доступности баз данных (DAG).

Если появляется предупреждение о нарушении работоспособности DataProtection, это говорит о наличии проблемы, которая может повлиять на компоненты репликации или кластерные компоненты, что может заблокировать доступ к базам данных Exchange.

Служба работоспособности DataProtection отслеживается с помощью следующих зондов и мониторов.

 

Зонд Настройки работоспособности Зависимости Связанные мониторы

ClusterEndpointProbe

DataProtection

Active Directory

ClusterEndpointMonitor

ClusterGroupProbe

DataProtection

Active Directory

ClusterGroupMonitor

ClusterNetworkProbe

DataProtection

Active Directory

ClusterNetworkMonitor

ClusterServiceCrashProbe

DataProtection

Active Directory

ClusterServiceCrashMonitor

ServerOneCopyProbe

DataProtection

Active Director

ServerOneCopyMonitor

ServerOneCopyInternalMonitorProbe

DataProtection

Active Directory

ServerOneCopyInternalMonitorMonitor

ServiceHealthMSExchangeReplEndpointProbe

DataProtection

Active Directory

ServiceHealthMSExchangeReplEndpointMonitor

ServiceHealthMSExchangeReplCrashProbe

DataProtection

Active Directory

ServiceHealthMSExchangeReplCrashMonitor

ServerSiteFailureProbe

DataProtection

Active Directory

ServerSiteFailureMonitor

StorageApparentControllerIssuesProbe

DataProtection

Active Directory

StorageApparentControllerIssuesMonitor

DatabaseHealthTooManyMountedDatabaseProbe

DataProtection

Active Directory

DatabaseHealthTooManyMountedDatabaseMonitor

Дополнительные сведения о зондах и мониторах см. в разделе Работоспособность и производительность сервера.

Служба может восстановить работу после отображения оповещения. Поэтому если вы получите оповещение о неработоспособном состоянии настроек работоспособности, сначала убедитесь в наличии данной проблемы. Если проблема не устранена, выполните соответствующие действия по восстановлению, указанные в приведенных ниже разделах.

  1. Определите имена настроек работоспособности и сервера, указанные в оповещении.

  2. В сообщении приводятся подробные сведения о точной причине возникновения оповещения. В большинстве случаев в сообщении приводится достаточно сведений по устранению неполадок для определения основной причины проблемы. Если в сообщении приводятся непонятные сведения:

    1. Откройте Командная консоль Exchange, а затем выполните следующую команду, чтобы извлечь подробные сведения о настройках работоспособности, с которыми связано оповещение.

      Get-ServerHealth <server name> | ?{$_.HealthSetName -eq "<health set name>"}
      

      Например, чтобы извлечь подробные сведения о настройках работоспособности Autodiscover.Protocol относительно сервера server1.contoso.com, выполните следующую команду.

      Get-ServerHealth server1.contoso.com | ?{$_.HealthSetName -eq "Autodiscover.Protocol"}
      

      Просмотрите выходные данные команды, чтобы определить монитор, сообщивший об ошибке. Параметр AlertValue монитора, вызвавшего оповещение, будет иметь значение Unhealthy.

    2. Определите зонд, на котором основан монитор. Обратите внимание, что у большинства зондов один и тот же префикс. Используя предыдущий пример, выполните поиск "ClusterNetwork*".

      Get-MonitoringItemIdentity -Identity DataProtection -Server server1.contoso.com | ?{$_.Name -like "ClusterNet ItemType  
      work*"}
      

      Возвращенные результаты должны иметь примерно следующий вид.

       

      ItemType

      HealthSetName

      Name

      TargetResource

      Probe

      DataProtection

      ClusterNetworkProbe

      MSExchangeRepl

    3. Еще раз запустите зонд для средства мониторинга, которое находится в неисправном состоянии. Обратитесь к таблице в разделе Пояснение, чтобы найти связанный зонд. Для этого выполните следующую команду.

      Invoke-MonitoringProbe <health set name>\<probe name> -Server <server name> | Format-List
      

      Например, предположим, что не работает монитор AutodiscoverSelfTestMonitor. С этим монитором связан зонд AutodiscoverSelfTestProbe. Чтобы запустить этот зонд на сервере server1.contoso.com, выполните следующую команду.

      Invoke-MonitoringProbe Autodiscover.Protocol\AutodiscoverSelfTestProbe -Server server1.contoso.com | Format-List
      
    4. В выходных данных команды просмотрите значение параметра Результат зонда. Если этот параметр имеет значение Succeeded, ошибка была временной и в настоящее время устранена. В противном случае обратитесь к действиям по восстановлению, приведенным в следующих разделах.

Если вы получите оповещение, связанное с настройками работоспособности, сообщение электронной почты содержит приведенные ниже сведения.

  • Имя сервера, отправившего оповещение.

  • Время и дата возникновения оповещения.

  • Используемый механизм проверки подлинности и сведения об учетных данных.

  • Полная трассировка исключения, связанного с последней ошибкой, включая диагностические данные и конкретные сведения о заголовке HTTP.

    Сведения в полной трассировке исключения можно использовать для устранения проблемы. Исключение, созданное зондом, содержит причину сбоя зонда.

Для большинства проблем, возникающих в средах высокой доступности, можно запустить командлет Test-ReplicationHealth, чтобы устранить неполадки в кластерах, сети, ActiveManager и службах. Для других наборов для контроля работоспособности и компонентов существуют другие командлеты с префиксом "Test-*".

Например:

Test-ReplicationHealth <ServerName>

Возвращенные результаты должны иметь примерно следующий вид.

 

Server

Check

Result

<ServerName>

ClusterService

Passed

<ServerName>

ReplayService

Passed

<ServerName>

ActiveManager

Passed

<ServerName>

TasksRpcListener

Passed

<ServerName>

TcpListener

Passed

<ServerName>

ServerLocatorService

Passed

<ServerName>

DagMembersUp

Passed

<ServerName>

ClusterNetwork

Passed

<ServerName>

QuorumGroup

Passed

<ServerName>

FileShareQuorum

Passed

<ServerName>

DatabaseRedundancyCheck

Passed

<ServerName>

DatabaseAvailabilityCheck

Passed

<ServerName>

DBCopySuspended

Passed

<ServerName>

DBCopyFailed

Тест пройден

<ServerName>

DBInitializing

Passed

<ServerName>

DBDisconnected

Passed

<ServerName>

DBLogCopyKeepingUp

Passed

<ServerName>

DBLogReplayKeepingUp

Passed

Если для всех компонентов отображается значение Тест пройден в столбце Результат, попробуйте перезапустить связанный зонд, как это показано в шаге 2c в разделе Проверка наличия проблемы.

Если проблема не устранена, перезапустите сервер. После перезапуска сервера повторно запустите связанный зонд, как показано в шаге 2c раздела Проверка наличия проблемы.

Если зонд все еще не работает, вам понадобится помощь для устранения данной проблемы. Для решения этой проблемы обратитесь к специалисту службы технической поддержки Майкрософт. Сделать это можно в Центре решений Exchange Server. В области навигации выберите элемент Варианты поддержки и ресурсы и выберите один из вариантов в разделе Получите техническую поддержку, чтобы обратиться к соответствующему специалисту. Так прямое обращение в службу технической поддержки Майкрософт в вашей организации может регламентироваться, сначала ознакомьтесь с инструкциями организации.

 
Показ: