Share via


Windows Server 2008 R2: Solução de problemas de Clusters de Failover

Quando falha não é uma opção, configuração de clusters de failover no Windows Server pode ajudar a garantir disponibilidade perto consistente.

John Marlin

Windows Server tem mudado ao longo dos anos, com diferentes versões, diferentes níveis de suporte e táticas diferentes para solução de problemas. A política de suporte atual é que, para uma solução Windows Server 2008 ou cluster de Failover do Windows Server 2008 R2 para ser considerado soluções suportadas oficialmente pela Microsoft ao cliente suporte serviços (CSS), eles devem atender a seguintes critérios:

  • Todos os componentes de hardware e software devem satisfazer as qualificações para receber um logotipo "Certified for Windows Server 2008 r2".
  • A solução totalmente configurada deve passar no teste de validação no gerenciamento de Cluster de Failover.

Garantindo a que você tem uma versão com apoio oficial, você tem a melhor chance de tudo funcionando. Sempre pode haver problemas com fornecedores de hardware, ou Microsoft pode precisar envolver-se ajudar com algumas configurações, mas as chances são que você deve pelo menos ser bom para começar. Aqui está uma olhada em alguns dos problemas mais comuns com o cluster de Failover do Windows Server 2008 R2 e como com precisão solucionar esses problemas.

O Cluster de mudança

A forma como Clusters são qualificados mudou significativamente no Windows Server 2008 R2 com a introdução da Validação de Cluster assistente, que está integrado no cluster de Failover. O Assistente de validação de Cluster permite que você execute um conjunto de testes focadas em um conjunto de servidores que você pretende usar como nós em um Cluster.

Esse processo de validação testa o hardware e o software subjacente directa e individualmente. Isso fornecerá uma avaliação precisa de quão bem uma determinada configuração oferecerá suporte a cluster de Failover. Se você usá-lo em um Cluster em execução, ele pode também informá-lo se você está cumprindo as práticas recomendadas. Você deve executá-lo quando você adiciona novo hardware ou drivers para o Cluster.

Para aqueles que gostam de scripts, Failover Clustering agora tem Windows PowerShell suporta. Isso é algo com que você deve começar a se tornar mais familiar, como CLUSTER.EXE não está mais sendo atualizado. Se você não sabe o que são os cmdlets e o que eles significam, você pode executar o comando Get-Help * Cluster *. Isto lhe dará uma lista que descreve os comandos, como este:

Synopsis nome
----                             --------
Novo Cluster criar um novo cluster de failover. Antes de criar um
cluster, você deve...

Se você não sabe como usar o comando, você pode usar Get-Help New-Cluster –Examples para ver amostras, como este:

NOME

Novo Cluster

SINOPSE

Crie um novo cluster de failover. Antes de criar um cluster, você
deve conectar o hardware (servidores, redes e armazenamento) e executar
os testes de validação.

-------------------------- EXAMPLE 1 --------------------------

C:\PS > Nova-Cluster - nome cluster1-nó Nó1, Nó2, Nó3, Nó4

Name
----
cluster1

Description
-----------
Este comando cria um cluster de quatro nós chamada cluster1, usando o padrão
configurações de endereçamento IP.

Aquando da recepção de eventos no Windows, é sempre uma boa idéia para realmente entender o que elas significam. Alguns não são tão descritivos como você gostaria. Uma lista de todos os eventos que você pode ver, incluindo a descrição do evento, está disponível on-line.

Líder em Logs de eventos

Se você encontrar um problema, eventos de Cluster é um dos primeiros lugares que você deve começar a procurar. Qualquer crítica, erro ou avisos emitidos será no Log de eventos do sistema. Mensagens informativas (como um grupo entrar no modo offline, movendo um grupo para outro nó e assim por diante) será no canal Cluster operacional. Você pode ver esses eventos no Visualizador de eventos / Logs de aplicativo e serviços / Microsoft / Windows / FailoverClustering.

Se você não tiver certeza de que o problema era com um grupo específico de serviço/aplicativo ou recurso, você pode vê-lo no gerenciamento de Cluster de Failover. Se você estiver realçado em um determinado grupo, selecionar "Visualizar eventos críticos para este aplicativo". Se você estiver realçado em um recurso específico, selecione "Mostrar os eventos críticos para este recurso".

Isso abrirá o Log de eventos do sistema e o filtro para o grupo específico ou recurso. Ele lhe dará todas as instâncias encontradas no Log de eventos do sistema para todos os nós do cluster. Isso poderia ser benéfico, como ele irá mostrar-lhe tudo isso em um único local.

Depois de identificar o recurso, você pode ir para os Logs de eventos do sistema para ver se há outros fatores contribuintes. Não se distrair com o sintoma — concentrar-se em uma causa raiz. Por exemplo, se um endereço IP ou nome de rede falhar, há outros eventos de rede-tipo que poderiam contribuir para esta (TCPIP pilha falha, mau funcionamento de placa de rede e assim por diante)?

Log de depuração de cluster mudou-se para sessões de rastreamento de eventos. Há não mais de CLUSTER.LOG. O sistema agora escreve extrair, transformar e carregar (ETL) arquivos localizados na pasta %WinDir%\System32\winevt\logs. Com esses arquivos ETL, você pode gerar um único CLUSTER.LOG para ser visto de todos os três. Este é um "snapshot" no tempo, no entanto. Em outras palavras, quando você gera um cluster, já não é escrito para o próprio arquivo de cluster. Cada vez que você gerar um em um nó, ele substituirá o atual e substituí-lo por um novo.

Você pode gerar logs com o Windows Powershell comando Get-ClusterLog. Isso vai sair para todos os nós do Cluster e criar o arquivo para cada nó na pasta %WinDir%\Cluster\Reports. Dependendo do número de nós e o tamanho dos arquivos, você pode querer considerar algumas opções adicionais.

Digamos que você tem um Cluster de nó de nove e deseja obter todos os logs. Você pode usar a opção –Destination para tê-los todos gerados e copiá-los para um local específico. Isto lhe dará um lugar único para obtê-los. Ele também irá marcar o nome do nó como parte do nome de arquivo (por exemplo, Get-ClusterLog –Destination c:\logs criará Node1_Cluster.log, Node2_cluster.log e assim por diante na pasta C:\LOGS).

Outra consideração se trata de um problema facilmente reproduzível: use a opção de –Timespan (em minutos). Simplesmente reproduzir o problema em um nó e executar Get-ClusterLog –Timespan 5 –Node Node1. Isso irá gerar um cluster para apenas Node1 e capturar apenas os últimos cinco minutos.

Aqui estão algumas dicas para este nível de resolução de problemas:

  • O log é extenso e complexo. Ele não deve ser o primeiro lugar para começar a procurar.
  • Certifique-se de captura no valor de dados, pelo menos, três dias. Dessa forma, se você tiver uma falha na noite de sexta-feira, os dados ainda estará lá quando você chega na segunda-feira. Cada registro é 100 MB de tamanho. Se você precisa aumentar o tamanho, use o Windows Powershell comando Set-Clusterlog –Size 200 (ou qualquer tamanho em megabytes que você especifica).
  • Algumas aplicações são "ruidosas" ou "falante" nos logs. Talvez você precise aumentar o tamanho do log, em caso afirmativo.
  • O Log de depuração de Cluster é gerado como GMT, então você precisa converter os tempos para corresponder quando ocorreu o evento real Hora local.
  • Dependendo do que você deseja ver, use –Destination ou –Timespan.

No mês que vem, vamos dar você através de alguns cenários de solução de problemas comuns.

John Marlin

**John Marlin**é um engenheiro de escalonamento de suporte sênior no grupo de suporte técnico comercial. Ele está na Microsoft há mais de 19 anos, com os últimos 14 anos com foco em servidores de cluster.

Conteúdo relacionado