Monitorando a replicação contínua

 

Aplica-se a: Exchange Server 2007 SP3, Exchange Server 2007 SP2, Exchange Server 2007 SP1

Tópico modificado em: 2007-08-22

O Microsoft Exchange Server 2007 Service Pack 1 (SP1) apresenta novos e aprimorados recursos para monitoramento de ambientes de replicação contínua. Essas alterações aprimoram os recursos de relatório de cluster na versão RTM (Versão de Produção) do Microsoft Exchange Server 2007 e incluem funcionalidade adicional projetada para monitoramento proativo de ambientes de replicação contínua. Especificamente, o Exchange 2007 SP1 apresenta aprimoramentos para o cmdlet Get-StorageGroupCopyStatus, adiciona um novo cmdlet chamado Test-ReplicationHealth e fornece maior visibilidade na janela de perdas coberta pelo dumpster de transporte. Além de utilizar esses cmdlets para monitorar o funcionamento da replicação contínua, você pode usar também vários contadores de desempenho que são publicados pelo serviço de Replicação do Microsoft Exchange.

Aprimoramentos para o cmdlet Get-StorageGroupCopyStatus no SP1

Na RTM do Exchange 2007, há várias condições em que o status relatado por Get-StorageGroupCopyStatus e os contadores de desempenho de replicação contínua são imprecisos ou confusos:

  • Um grupo de armazenamento inativo (por exemplo, sem alteração) pode informar seu status como adequado quando, na verdade, pode não ser adequado. Esse cenário ocorre porque a condição inadequada não é detectada até que um log seja repetido.

  • Durante a inicialização da replicação, o status da replicação está sendo avaliado e pode não ser preciso. Quando a inicialização for concluída, o status será atualizado.

  • O valor do campo LastLogGenerated pode estar errado quando o banco de dados do grupo de armazenamento for desmontado.

  • Quando houver um ou mais arquivos de log ausentes no meio de um fluxo de logs, a cópia passiva continuará a tentar se recuperar, fazendo com que o status da replicação alterne entre os estados com falha e adequado. Quando isso acontece, as filas de repetição e de cópia continuam a crescer.

  • Em raras condições, um log pode ser verificado com êxito, mas a repetição falhará mesmo assim. Nessa situação, o sistema alternará entre os estados com falha e adequado, durante sua tentativa de recuperação. Quando isso acontece, as filas de repetição e de cópia continuam a crescer.

A RTM do Exchange 2007 usa o banco de dados de cluster e o Registro para comunicação entre o serviço de Replicação do Microsoft Exchange e as tarefas de gerenciamento do Exchange, que é um processo assíncrono. Como o processo é assíncrono, ele pode resultar no status não confiável descrito anteriormente.

No Exchange 2007 SP1, os problemas anteriores foram resolvidos reprojetando o mecanismo subjacente usado para comunicação entre o serviço de Replicação do Microsoft Exchange e as tarefas de gerenciamento do Exchange. Em vez de usar o serviço do Cluster ou o Registro, as tarefas de gerenciamento agora se comunicam diretamente com o serviço de Replicação do Microsoft Exchange usando RPCs (chamadas de procedimento remoto).

Além disso, o cmdlet Get-StorageGroupCopyStatus foi aprimorado com a adição de novas informações de status:

  • O cmdlet Get-StorageGroupCopyStatus relata um SummaryCopyStatus de ServiceDown quando o serviço de Replicação do Microsoft Exchange no computador de destino não está acessível por rede.

  • O cmdlet Get-StorageGroupCopyStatus relata um SummaryCopyStatus de Inicializando quando o serviço de Replicação do Microsoft Exchange no computador de destino não concluiu suas verificações iniciais de inicialização. Um novo contador de desempenho também foi criado para representar esse status como Booleano.

  • O cmdlet Get-StorageGroupCopyStatus relatará um SummaryCopyStatus de Sincronizando quando não tiver concluído uma nova propagação incremental.

Os novos estados do valor SummaryCopyStatus serão visíveis apenas ao utilizar a versão SP1 do Exchange 2007 das ferramentas de gerenciamento do Exchange. Quando você utilizar a versão RTM do Exchange 2007 das ferramentas de gerenciamento do Exchange, o status de qualquer um dos estados anteriores será relatado como Com Falha.

Cmdlet Test-ReplicationHealth

O Exchange 2007 SP1 apresenta um novo cmdlet chamado Test-ReplicationHealth. Esse cmdlet é projetado para monitoramento proativo de replicação contínua e da pipeline de replicação contínua. O cmdlet Test-ReplicationHealth é projetado para ser executado localmente em um servidor de Caixa de Correio para verificar o status de replicação em um ambiente LCR (replicação contínua local), CCR (replicação contínua em cluster) e SCR (replicação contínua em espera). O cmdlet Test-ReplicationHealth é projetado também para ser intimamente integrado ao Pacote de Gerenciamento MOM (Microsoft Operations Manager), a fim de fornecer informações simples e precisas, detalhando o funcionamento da replicação contínua para o servidor de Caixa de Correio. As verificações são feitas por ordem de gravidade; testes mais críticos são verificados primeiro. Se uma dessas verificações falhar, suporemos que os testes menos críticos falhariam ou que não fossem relevantes.

O cmdlet Test-ReplicationHealth verifica todos os aspectos da replicação, os serviços de Cluster e a replicação do grupo de armazenamento e fornece uma visão geral completa do sistema de replicação. Especificamente, ao executar em um nó do cluster, o cmdlet Test-ReplicationHealth executa os testes descritos na tabela a seguir.

Testes executados pelo cmdlet Test-ReplicationHealth

Test Descrição

Status do nó passivo (PassiveNodeUp)

Verifica se o nó passivo tem um status de Ativo quando usado em um ambiente de CCR.

Status da rede de cluster (ClusterNetwork)

Verifica se as redes gerenciadas por cluster encontradas no nó local estão em execução.

Estado do grupo de quorum (QuorumGroup)

Verifica se o grupo de clusters que contém o recurso de quorum é adequado.

Estado do quorum de compartilhamento de arquivos (FileShareQuorum)

Verifica se o valor do FileSharePath usado pelo quorum de Conjunto de Nós Principais com testemunha de compartilhamento de arquivo está acessível.

Estado do grupo de servidores de caixa de correio em cluster (CmsGroup)

Verifica se o servidor de caixa de correio em cluster é adequado, confirmando se todos os recursos do grupo estão online.

Estado do nó (NodePaused)

Verifica se algum dos nós do cluster está em um estado pausado.

Status de registro de DNS (DnsRegistrationStatus)

Verifica se as interfaces de rede gerenciadas por cluster que tenham Exigir registro de DNS para obter êxito definido transmitiram o registro de DNS (Sistema de Nome de Domínio).

Status de serviço de replicação (ReplayService)

Verifique se o serviço de Replicação do Microsoft Exchange do nó local é adequado.

Bancos de dados montados após o failover (DBMountedFailover)

Verifica se algum banco de dados está desmontado ou com falha após um failover. Esse teste verifica somente os bancos de dados cujo resultado de um failover seja com falha.

Cópia do grupo de armazenamento suspensa (SGCopySuspended)

Verifica se a replicação contínua foi suspensa em algum grupo de armazenamento no servidor de caixa de correio em cluster.

Falha na cópia do grupo de armazenamento (SGCopyFailed)

Verifica se existe alguma cópia do grupo de armazenamento que esteja em um estado Com Falha.

Inicializando grupo de armazenamento (SGInitializing)

Verifica se algum grupo de armazenamento está no estado Inicializando.

Comprimento da fila de cópias do grupo de armazenamento (SGCopyQueueLength)

Verifica se algum grupo de armazenamento tem um comprimento da fila de cópias de replicação maior que os limites da prática recomendada. Atualmente, esses limites são:

  • Aviso   O comprimento da fila é de 3 a 5 arquivos de log.

  • Falha   O comprimento da fila é de 6 ou mais arquivos de log.

Comprimento da fila de repetição do grupo de armazenamento (SGReplayQueueLength)

Verifica se algum grupo de armazenamento tem um comprimento da fila de repetição de replicação maior que os limites da prática recomendada. Atualmente, esses limites são:

  • Aviso   O comprimento da fila é de 30 a 59 arquivos de log.

  • Falha   O comprimento da fila é de 60 ou mais arquivos de log.

Monitoramento de contexto para Test-ReplicationHealth

O cmdlet Test-ReplicationHealth inclui um parâmetro chamado MonitoringContext, que você pode usar para incluir eventos de monitoramento e contadores de desempenho nos resultados da tarefa. Esse parâmetro é usado pelo Pacote de Gerenciamento para MOM. Os dois valores possíveis para esse parâmetro sao $true ou $false. Se você especificar $true, os resultados incluirão eventos de monitoramento e contadores de desempenho, além de informações sobre serviços.

Se o contexto de monitoramento for especificado, somente as seguintes verificações serão verificadas em um nó ativo:

  • PassiveNodeUp

  • ClusterNetwork

  • QuorumGroup

  • FileShareQuorum

  • CmsGroup

  • NodePaused

  • DnsRegistrationStatus

  • ReplayService

  • DBMountedFailover

Se o contexto de monitoramento for especificado, somente as seguintes verificações serão verificadas em um nó passivo:

  • ClusterNetwork

  • DnsRegistrationStatus

  • ReplayService

  • SGCopySuspended

  • SGCopyFailed

  • SGInitializing

  • SGCopyQueueLength

  • SGReplayQueueLength

Contadores de desempenho publicados pelo Serviço de Replicação do Microsoft Exchange

O serviço de Replicação do Microsoft Exchange fornece contadores de desempenho que podem ser usados para monitorar o funcionamento da replicação em LCR e CCR. É recomendável coletar e avaliar os contadores discutidos posteriormente neste tópico para monitorar e solucionar problemas relacionados ao desempenho.

Contadores de desempenho do serviço de Replicação do Microsoft Exchange recomendado

O serviço de Replicação do Microsoft Exchange cria uma instância dos contadores na tabela a seguir para cada cópia do grupo de armazenamento. Isso permite que você monitore, de forma independente, o funcionamento e o desempenho de cada grupo de armazenamento. Você pode monitorar o funcionamento e o status de cada grupo de armazenamento, monitorando os contadores ReplayQueueLength e CopyQueueLength sob o objeto de desempenho MSExchange Replication.

Dica

Conforme mencionado anteriormente, o cmdlet Get-StorageGroupCopyStatus exibe também os valores desses contadores.

Nome do contador Descrição do contador

Fila de cópia excede limite de montagem (apenas CCR)

Indica se o comprimento da fila de cópias é maior que o limite especificado pela discagem automática de montagem do banco de dados. Em um ambiente de CCR, o valor para esse contador será 1 se o limite de discagem automática de montagem do banco de dados for excedido. O valor será sempre 0 em um ambiente de LCR.

CopyGenerationNumber

Indica o número de seqüência de geração do último arquivo de log copiado.

CopyNotificationGenerationNumber

Indica o número de seqüência de geração do último arquivo de log conhecido para o serviço de Replicação do Microsoft Exchange.

CopyQueueLength

Indica o número de arquivos de log aguardando para serem copiados e inspecionados.

Failed

Com um valor de 1, indica que a replicação contínua está em um estado Com Falha para a instância selecionada (grupo de armazenamento). Um valor de 0 indica que a replicação contínua não está em um estado Com Falha.

Inicializando

Com um valor de 1, indica que a replicação contínua está em um estado Inicializando para a instância selecionada (grupo de armazenamento). Esse estado indica que a cópia do grupo de armazenamento está executando verificações de inicialização iniciais ou que o serviço de Replicação do Microsoft Exchange está executando uma nova propagação incremental. Um valor de 0 indica que a replicação contínua não está em um estado Inicializando.

InspectorGenerationNumber

Indica o número de seqüência de geração do último arquivo de log inspecionado.

ReplayBatchSize

Indica o número de arquivos de log que foram repetidos juntos.

ReplayGenerationNumber

Indica o número de seqüência de geração do último arquivo de log repetido com êxito.

ReplayGenerationsComplete

Indica o número de arquivos de log repetidos no lote atual.

ReplayGenerationsPerMinute

Indica a velocidade de repetição (nas gerações de log por minuto) no lote atual.

ReplayGenerationsRemaining

Indica o número de gerações de log restantes a serem repetidas no lote atual.

ReplayNotificationGenerationNumber

Indica o número de seqüência de geração do último arquivo de log conhecido para o serviço de Replicação do Microsoft Exchange.

ReplayQueueLength

Indica o número de arquivos de log aguardando para serem repetidos.

Suspenso

Com um valor de 1, indica que a atividade de replicação contínua está suspensa. Suspenso significa que os arquivos de log não estão sendo copiados ou repetidos na cópia passiva.

TruncatedGenerationNumber

Indica o número de seqüência de geração do último arquivo de log truncado pelo serviço de Replicação do Microsoft Exchange.

Além dos contadores listados na tabela anterior, um contador adicional chamado Seeding Finished % é publicado no objeto de desempenho MSExchange Replica Seeder. Esse contador indica a porcentagem de propagação concluída. Seu valor varia de 0 a 100 por cento e é publicado somente para grupos de armazenamento que estão no processo de serem propagados.