Exportar (0) Imprimir
Expandir Tudo
Expandir Minimizar

Sistema de Arquivos Distribuído da Microsoft

Cartão de Valor de TI

Publicado em: 17 de dezembro de 2005

Logotipo do Showcase de TI


Este cartão descreve como o grupo de Tecnologia de Informação da Microsoft Corporation (TI da Microsoft) utiliza o DFS (Sistema de Arquivos Distribuído) do Microsoft® Windows Server™ 2003 R2, que contém as novas tecnologias modernas de replicação, gerenciamento e compactação que asseguram o uso eficiente da largura de banda. O DFS inclui um conjunto avançado de tecnologias, incluindo Espaços para Nomes do DFS (DFS-R) e Compactação Diferencial Remota (RDC).

Nesta página

Sinopse
Situação
Solução
Observações de implantação
Vantagens
Lições aprendidas
Ambiente Global da TI da Microsoft

 

Vantagem

Origem ou Derivação

Replicação mais rápida

Replicação 300 % mais rápida de arquivos grandes por meio de DFS-R (Replicação DFS)

Métricas informadas pelo Relatório de Condições DFS-R, com vantagens maiores para arquivos de 290 megabytes (MB) e maiores.

Compressão mais rápida

Compactação Diferenciada Remota DFS (RDC) duas ou três vezes mais rápida do que o rsync 2.6.2

Testes internos da Microsoft consideraram o RDC duas vezes mais rápido que o protocolo rsync 2.6.2 em relação a arquivos de 4 MB e três vezes mais rápido em relação a arquivos de 290 MB.

Operações

40% menos tempo gasto no gerenciamento de atividades operacionais de replicação

Economia de 50% em gerenciamento de conteúdo
30% de economia em problemas de replicação

Sinopse

O grupo de Tecnologia da Informação da Microsoft Corporation (TI da Microsoft) utiliza a tecnologia de Sistema de Arquivos Distribuído (DFS) do Microsoft® Windows Server™ 2003 R2 para auxiliar e melhor gerenciar servidores em cerca de 140 filiais em todo o mundo. O DFS, juntamente com o Windows Server 2003 R2, ajuda a garantir que os funcionários da Microsoft tenham sempre acesso aos dados de que necessitam, ao mesmo tempo em que reduz significativamente a largura de banda utilizada na replicação entre sites. O sistema operacional Windows Server 2003 faz parte do aplicativo de servidor integrado Microsoft Windows Server System™.

Situação

A Microsoft, como muitas outras empresas, considera que a manutenção de localidades remotas gera custos operacionais e desafios administrativos significativos. Um dos maiores desafios é garantir que aplicativos, ferramentas, relatórios, tutoriais e outros conteúdos internos freqüentemente acessados pelos usuários estejam disponíveis na localidade mais próxima. Um dos objetivos principais é otimizar o uso da largura de banda para que os mesmos dados acessados por vários usuários em uma WAN (rede de longa distância) a partir do site remoto sejam copiados pela mesma conexão de rede e disponibilizados em um servidor local. O desafio nesse caso é exacerbado pelo volume e pela variedade de dados replicados em operações no mundo inteiro nos sites da Microsoft, incluindo a replicação entre cerca de 250 servidores.

A dificuldade provém principalmente da natureza distribuída das redes que conectam as filiais aos hubs regionais e à central corporativa. Essas WANs geram efeitos indesejáveis no funcionamento adequado das filiais. Um dos principais problemas da integração das filiais é a dependência das operações de sistema de arquivos. A maioria dos protocolos de sistema de arquivos, como o Network File System (NFS) do UNIX e o Common Internet File System (CIFS) da Microsoft, não funciona com eficiência em redes com baixa largura de banda ou de alta latência. Esses protocolos foram desenvolvidos originalmente sob a premissa básica de que não existiam restrições de largura de banda. A TI da Microsoft precisava de uma solução melhor para conectar cerca de 140 filiais a três hubs regionais: Redmond, Cingapura e Dublin. Também eram necessários relatórios de replicação melhores.

Solução

A TI da Microsoft está aprimorando o gerenciamento de servidores das filiais por meio da implantação do sistema operacional Windows Server 2003 R2. Suas tecnologias de base oferecem suporte à integração direta de servidores localizados em filiais da rede empresarial. O Windows Server 2003 R2 permite às organizações manter as vantagens de desempenho, disponibilidade e produtividade de um servidor de filial local, ao mesmo tempo em que evita as limitações de conectividade e a sobrecarga de gerenciamento.

O recém-reestruturado DFS possui uma tecnologia de habilitação por chave, com tecnologias modernas de replicação, gerenciamento e compactação que garantem o uso eficiente da largura de banda.

O DFS inclui tecnologias inteligentes de sistema de arquivos de largura de banda e oferece uma estrutura eficiente para a replicação de arquivos servidor a servidor. O DFS utiliza algoritmos de compactação modernos e mecanismos de replicação eficientes, que garantem a transferência de arquivos somente quando necessário, e a replicação apenas do conjunto mínimo de informações necessárias, mantendo, simultaneamente, a consistência dos arquivos distribuídos.

O DFS pode também ajudar a simplificar o gerenciamento e aumentar a produtividade geral das filiais de uma empresa. Os elementos principais de DFS incluem:

  • Espaços para nomes do DFS.Os espaços para nomes do DFS permitem que os administradores agrupem pastas compartilhadas localizadas em servidores diferentes e exibam-nas aos usuários como uma árvore virtual de pastas conhecida como “espaço para nomes”. Um espaço para nome oferece diversas vantagens, incluindo maior disponibilidade de dados, compartilhamento de carga e migração de dados simplificada.

    Em caso de indisponibilidade dos servidores locais, as configurações de espaços para nomes do DFS oferecem o failover do cliente por meio da seleção da localidade mais próxima e o failback para um servidor preferencial. Por exemplo, se a opção de emergência estiver habilitada em um link DFS com destinos tanto na filial quanto no hub, os clientes da filial executarão automaticamente o failover para o hub quando o serviço estiver indisponível e executarão automaticamente a emergência para a filial quando o serviço ficar disponível novamente.

    O espaço para nome é administrado por meio do Console de Gerenciamento DFS, que oferece uma exibição hierárquica do espaço para nome. O Console de Gerenciamento DFS incorpora a funcionalidade disponibilizada anteriormente por meio da interface de linha de comando. O Console de Gerenciamento DFS aplica recursos do MMC (Console de Gerenciamento Microsoft) 3.0, incluindo relatórios e diagnósticos em HTML em tempo real.

    Figura 1

    Figura 1. Quando o usuário acessa uma pasta no espaço para nome (1), os computadores clientes entram em contato com o servidor de espaço para nome e recebem uma referência. Computadores clientes acessam o primeiro servidor em suas respectivas referências (2).
  • DFS-R.DFS-R. DFS-R é um serviço de replicação de arquivos robusto multimestre significativamente mais flexível e eficiente na sincronização de servidores de arquivos em relação ao seu antecessor, o File Replication Services. O DFS-R também pode ser usado para replicar dados de filiais para outros servidores de filiais e de hub, cada qual podendo servir como fontes de backup caso o servidor de uma filial fique inativo. O DFS-R oferece suporte à recuperação automatizada de perda ou corrupção de bancos de dados. O DFS-R oferece suporte à programação de replicação e à otimização da largura de banda. O DFS-R utiliza um novo algoritmo de compactação conhecido como RDC.

  • RDC. RDC é uma tecnologia avançada de compactação compatível com WAN que otimiza a transferência de dados em redes de largura de banda limitada. Em vez de transferir dados semelhantes ou redundantes repetidamente, o RDC identifica com precisão as alterações (chamadas de “deltas”) dentro e entre os arquivos, e transmite apenas essas alterações para obter uma economia de largura de banda significativa. O RDC detecta a inserção, remoção ou reorganização de dados em arquivos, possibilitando ao DFS-R replicar apenas os blocos de arquivos alterados quando os arquivos são atualizados. Além de calcular os deltas de arquivo e transferir somente as diferenças, o RDC pode também copiar qualquer arquivo semelhante de qualquer cliente ou servidor que utilize dados comuns aos dois computadores. Isso reduz ainda mais a quantidade de dados enviados e os requisitos gerais de largura de banda para transferência de arquivos. Técnicas locais diferenciadas, algumas vezes chamadas de aplicação de “patches”, são usadas para transformar a versão antiga em uma nova versão. As diferenças entre duas versões conhecidas de um arquivo são calculadas em um servidor e, em seguida, enviadas ao cliente.

A TI da Microsoft implantou o DFS em 140 filiais e em três data centers principais, substituindo uma ferramenta de replicação interna denominada Robocopy que requeria script extensivo. A TI da Microsoft configurou o DFS para executar failover para o servidor de filiais mais próximo ou para o data center regional mais próximo, no caso de paralisação local. Quando o servidor local é restaurado, ele retoma automaticamente o papel de armazenador de dados principal.

O Console de Gerenciamento DFS (um plug-in para o MMC versão 3.0) é usado para configuração e como servidor.

Figura 2

Figura 2. O Console de Gerenciamento DFS oferece uma exibição hierárquica do espaço para nome.

Observações de implantação

Para habilitar todos os recursos dos Espaços para Nomes do DFS é preciso configurar os servidores e clientes da seguinte maneira:

  • Os servidores nos quais são processadas as tarefas de gerenciamento de espaço para nome devem ser executados no Windows Server 2003 R2.

  • Para aproveitar os novos recursos dos espaços para nomes, todos os servidores que os hospedarem devem ser executados no Windows Server 2003 SP1 ou Windows Server 2003 R2.

  • Para aproveitar os novos recursos dos espaços para nomes, todos os controladores de domínio devem ser executados no Windows Server 2003 SP1 ou Windows Server 2003 R2.

  • Os espaços para nomes devem ser criados em volumes de sistemas de arquivos NTFS.

  • Os clientes que acessarem os espaços para nomes podem executar qualquer sistema operacional de cliente para o qual haja suporte, contudo, somente clientes que executem os seguintes sistemas operacionais, service packs e hotfix de failback apropriado de clientes podem ser configurados para failback de cliente: Sistema Operacional Windows® XP com Service Pack 2 e Windows XP Cliente com hotfix de failback. Windows Server 2003 SP1 e Windows Server 2003 Cliente com hotfix de failback.

Observação: Os administradores podem solicitar que determinados servidores sejam listados no começo ou no final da lista de referência, independentemente da localização do site. Por exemplo, o administrador pode desejar designar um servidor usado para proteção de dados como o servidor de menor prioridade em todas as localidades. Esse servidor seria considerado um servidor de último caso, mesmo para os clientes locais.

Vantagens

A implantação do Windows Server 2003 R2 e do DFS ofereceu muitas vantagens à TI da Microsoft, incluindo uma redução significativa no uso de largura de banda e a habilidade de usar servidores locais como caches de serviço.

Redução Significativa no Uso de Largura de Banda

A TI da Microsoft considerou significativa a redução no uso de largura de banda com o DFS-R. Por exemplo, anteriormente, uma simples alteração de título em um gráfico de apresentação de 3MB do Microsoft Powerpoint® faria com que o arquivo inteiro fosse enviado pela rede para replicação, o que poderia levar um minuto ou mais. Como o RDC com base em delta do DFS-R, somente a mudança de título é enviada, e a replicação dura menos de um segundo. O teste de desempenho interno da TI da Microsoft detectou que o fator de redução de largura de banda variava de 37% a 95%, se comparado à solução personalizada anterior da Microsoft. A redução de largura de banda variou de acordo com o número de alterações de dados no arquivo e de acordo com o tipo de arquivo — arquivos de imagem apresentaram de um modo geral redução menor que documentos, planilhas e apresentações de PowerPoint.

Os testes da TI da Microsoft também demonstraram que o RDC é mais rápido que a tecnologia rsync, especialmente no caso de arquivos maiores. Os testes revelaram que o RDC era duas vezes mais rápido na compactação de arquivos do que o protocolo rsync 2.6.2 ao lidar com arquivos de 4MB, e quase três vezes mais rápido ao trabalhar com arquivos de 290MB.

Cache de Serviço

Com o DFS, os servidores em uma filial funcionam como um cache de serviço que não mantém um estado exclusivo e não requer backup do sistema. Se o servidor falhar, não haverá impacto na funcionalidade da filial, os clientes remotos apenas executarão o failover a partir do servidor da filial local para outro servidor — selecionando a localidade mais próxima e executando, em seguida, o failback para um servidor preferencial quando o serviço for restaurado.

Relatórios Precisos e Proativos

A solução anterior não possuía um mecanismo para monitorar e reportar o progresso, êxito ou a falha da replicação sem precisar fazer logon em cada um dos servidores e analisar o extremamente detalhado arquivo de log. O DFS-R inclui relatórios proativos que oferecem diversos parâmetros da topologia de replicação e da condição do servidor. Os relatórios são exibidos em um único painel de controle para todos os servidores em uma topologia de replicação, possibilitando aos membros da equipe de operações acessar os dados que precisam identificar e solucionar problemas em uma única página da Web.

Replicação entre arquivos

Antes de copiar um arquivo da origem para um servidor remoto, o DFS Cross-File Replication (Replicação entre arquivos do DFS) verifica se o arquivo já está disponível em outra localidade no mesmo servidor de chegada. Caso o arquivo seja encontrado, ele é copiado localmente, em vez de ser replicado e enviado, ajudando a otimizar o uso da largura de banda.

Menos tempo gasto com Gerenciamento de Servidor

A implantação do DFS pela TI da Microsoft resultou em uma redução de 40% do tempo gasto no gerenciamento de servidores em filiais. A TI da Microsoft obteve cerca de 50% de redução no tempo gasto em atividades como hospedagem de novo conteúdo, arquivamento de conteúdo antigo e adição e remoção de servidores. O grupo obteve uma economia de tempo de 30% no tratamento de problemas de replicação cotidianos. A TI da Microsoft pôde reduzir o suporte de Tier 2 em um funcionário, realocando a pessoa em outra função.

Lições aprendidas

É possível usar os Espaços para nomes do DFS quando os controladores de domínio e os servidores de espaço para nome executarem uma mescla de sistema operacional Windows 2000 Server, Windows Server 2003 R2, Windows Server 2003 com SP1 e Windows Server 2003 sem SP1, porém, parte da funcionalidade ficará desativada ou limitada, dependendo dos sistemas operacionais dos servidores. Seguem alguns exemplos de comportamento no modo misto:

  • Se os controladores de domínio ou servidores de espaço para nome estiverem sendo executados no Windows Server 2003 sem SP1, eles não poderão oferecer referências que dêem suporte à prioridade de destino ou ao failback de cliente.

  • Se os controladores de domínio ou servidores de espaço para nome estiverem sendo executados no Windows 2000 Server, eles não poderão oferecer referências que dêem suporte à prioridade de servidor de destino ou failback de cliente, nem poderão solicitar destinos por custo mais baixo em referências. É necessária a configuração adicional para permitir que esses servidores de espaço para nome e controladores de domínio detectem a localidade de cada servidor de destino no espaço para nome.

  • Se o snap-in Gerenciador DFS conectar-se a um servidor de espaço para nome que não esteja sendo executado no Windows Server 2003 SP1 nem no Windows Server 2003 R2, não será possível habilitar nenhuma das opções de configuração (ex.: failback de cliente e prioridade de destino).

Ambiente Global da TI da Microsoft

A empresa Microsoft é ampla, complexa e está em constante mudança. A missão do grupo de TI da Microsoft é bastante singular. Além de administrar um utilitário de ponta que mantém a produtividade dos negócios, sua principal missão é ser o primeiro e o melhor cliente da Microsoft. Isso envolve testar todos os softwares empresariais nos estágios iniciais de desenvolvimento beta, implantando-os em toda a empresa e fornecendo comentários valiosos para que os grupos de produtos possam garantir serviços previsíveis e confiáveis a consumidores, clientes e parceiros. Os dados a seguir dão uma idéia do ambiente em que tudo isso ocorre (os números são aproximados):

  • Cerca de 90.000 usuários de TI

  • Mais de 300.000 computadores e dispositivos

  • Suporte oferecido a mais de 400 sites em todo o mundo

  • Aplicativos LOB (line-of-business, linha de negócios) globais (por exemplo, Siebel, Clarify, MS Sales e World-Wide Sales e Marketing Database)

  • Suporte Virtual Global

  • Sete sites executando o Microsoft Exchange Server em âmbito global

  • 110 servidores executando o Exchange Server

  • 38 servidores de correio eletrônico

  • Mais de 3 milhões de mensagens de e-mail internas por dia

  • Mais de 8,8 milhões de mensagens de e-mail externas por dia

  • Mais de 6,8 milhões de mensagens de e-mail bloqueadas por dia

  • Mais de 7,5 milhões de conexões remotas por mês

Para obter mais informações

Entre em contato com o escritório local da Microsoft mais próximo em
http://www.microsoft.com/worldwide ou visite
http://www.microsoft.com/technet/itshowcase

.
Download

Sistema de Arquivos Distribuído da Microsoft
290 KB
Microsoft Word file

Isso foi útil para você?
(1500 caracteres restantes)
Agradecemos os seus comentários
A Microsoft está realizando uma pesquisa online para saber sua opinião sobre o site do MSDN. Se você optar por participar, a pesquisa online lhe será apresentada quando você sair do site do MSDN.

Deseja participar?
Mostrar:
© 2014 Microsoft