Share via


Estimar os requisitos de desempenho e capacidade dos ambientes de pesquisa

Atualizado em: 2009-05-21

Neste artigo:

  • Características principais

  • Ambiente de teste

  • Recomendações

Este cenário de planejamento de desempenho e capacidade incorpora um único farm do Microsoft Office SharePoint Server 2007 usado para pesquisa e indexação de conteúdo do Office SharePoint Server em um ambiente corporativo.

Importante

Algumas das instruções contidas neste artigo foram atualizadas para o Office SharePoint Server 2007 com SP1. Para obter uma lista abrangente de atualizações do Office SharePoint Server 2007 com SP1, consulte Manual disponível para download: Planejando e implantando o Service Pack 1 para Office SharePoint Server 2007 em um ambiente com vários servidores.

Características principais

A características principais descrevem fatores ambientais, características de uso e outras considerações que provavelmente serão encontradas em implantações baseadas neste cenário.

As características principais para este cenário incluem:

  • Tempos de resposta de usuários   Os tempos de resposta de usuários de destino para operações comuns, incomuns, de longo prazo e raras estão listados na tabela de tempo de resposta do usuário, em Planejar limites de software (Office SharePoint Server). Algumas organizações podem tolerar tempos de resposta maiores de usuários ou podem exigir tempos de resposta mais rápidos. O tempo de resposta de usuário esperado é um fator importante que determina metas gerais de taxa de transferência. (A taxa de transferência é definida como a quantidade de solicitações que o farm de servidores pode processar por segundo.) Quando há mais usuários, você exige uma meta de taxa de transferência maior para obter o mesmo tempo de resposta de usuário.

  • **Simultaneidade de usuários   **Pressupõe-se uma taxa de simultaneidade de 10%, com 1% dos usuários fazendo solicitações simultâneas em um dado momento. Por exemplo, para 10.000 usuários, 1.000 estão usando ativamente a solução simultaneamente e 100 usuários estão fazendo solicitações ativamente.

  • **Tarefas assíncronas de execução longa   **Tarefas como rastreamento de conteúdo e backup de banco de dados adicionam uma carga de desempenho ao farm de servidores. As características de desempenho gerais de topologias pressupõem que essas tarefas estejam sendo executadas fora do horário de pico, como durante a noite. Assim, as taxas de resposta de usuário durante o horário comercial não são afetadas.

Ambiente de teste

O teste deste cenário foi criado para ajudar a desenvolver estimativas de como configurações de farm diferentes respondem às alterações de vários fatores, incluindo:

  • Quantos usuários simultâneos estão usando o sistema.

  • Que tipos de operações de usuário estão sendo executadas.

  • Quantos documentos estão no índice que está sendo consultado.

É importante observar que, embora se possa tirar algumas conclusões dos resultados dos testes, os números específicos de capacidade e de desempenho nesta seção será diferentes dos números de ambientes reais. Os números mencionados neste artigo destinam-se a oferecer um ponto inicial para o desenvolvimento de um ambiente dimensionado de forma apropriada. Depois de concluir o design inicial do sistema, teste a configuração para determinar se o sistema será compatível com os fatores inerentes ao seu ambiente.

Dica

Esses testes foram realizados para simular um ambiente corporativo com milhões de documentos e uma base de usuários grande. O hardware usado no ambiente de teste foi configurado com processadores robustos e uma grande quantidade de memória e espaço em disco. Consulte as recomendações de hardware na seção Recomendações deste artigo para obter as recomendações de hardware iniciais.

Para obter mais informações sobre o teste da sua implantação, consulte Ferramentas para planejamento de capacidade e desempenho (Office SharePoint Server).

Pressuposições

  • Arquitetura de 64 bits   Apenas servidores de 64 bits foram usados no ambiente de testes. Embora o Office SharePoint Server 2007 possa ser implantado em servidores de 32 bits, é recomendável empregar servidores de 64 bits em implantações de farms do Office SharePoint Server 2007. Para obter mais informações, consulte a seção que compara 64 e 32 bits no artigo Sobre desempenho e planejamento da capacidade (Office SharePoint Server).

  • O cache baseado em disco está habilitado   O cache baseado em disco elimina a necessidade de acessar o banco de dados várias vezes para obter fragmentos de código ou arquivos binários grandes, como arquivos de imagem, som e vídeo. Habilitar o cache baseado em disco vai melhorar o desempenho da implantação toda. Lembre-se de que o cache baseado em disco não está habilitado por padrão. Para obter informações sobre como habilitar cache baseado em disco, consulte o tópico sobre cache baseado em disco de objetos binários grandes (https://go.microsoft.com/fwlink/?linkid=82617\&clcid=0x416).

Topologia de Laboratório

Algumas configurações de farm foram usadas no teste, variando de um a oito servidores de consulta, um servidor de indexação, um SSP e um computador servidor de banco de dados executando o software de banco de dados Microsoft SQL Server 2005. Todos os computadores servidores estavam executando a configuração padrão do Office SharePoint Server 2007 Enterprise Edition no sistema operacional Microsoft Windows Server 2003 com Service Pack 1 (SP1), Enterprise x64 Edition.

A tabela a seguir lista o hardware específico usado no teste.

Função do computador Itens de hardware Capacidade do disco rígido

Servidores de consulta

4 processadores dual-core Intel Xeon de 2,66 gigahertz (GHz)

32 gigabytes (GB) de RAM

40 GB para o sistema operacional (RAID 5)

956 GB para o índice de conteúdo e o arquivo de paginação do sistema operacional (RAID 10)

Servidor de indexação

4 processadores de núcleo dual Intel Xeon de 2,66 GHz

32 GB de RAM

40 GB para o sistema operacional (RAID 5)

956 GB para o índice de conteúdo e o arquivo de paginação do sistema operacional (RAID 10)

Servidor de banco de dados

4 processadores de núcleo dual Intel Xeon de 2,66 GHz

32 GB de RAM

40 GB para o sistema operacional (RAID 5)

956 GB de banco de dados SharedServices_Search_DB com controlador (RAID 10) de interface do sistema (SCSI) de computador pequeno dedicado

Os seguintes discos compartilharam um controlador SCSI:

273 GB de banco de dados SharedServices_DB (RAID 10)

273 GB de banco de dados TempDb (RAID 10)

273 GB para arquivos de log (RAID 10)

136 GB para o banco de dados do SharePoint_Config (RAID 10)

Uma rede de gigabit (1 bilhão de bits/s) foi usada no ambiente de teste. Recomendamos usar uma rede de gigabit entre servidores de um farm do Office SharePoint Server para garantir uma largura de banda de rede adequada.

Perfil de uso

As tabelas a seguir mostram o perfil de uso do ambiente de teste de pesquisa do Office SharePoint Server 2007.

Dica

Neste cenário de teste, somente as operações de consulta do usuário foram usadas para determinar o desempenho do sistema.

Cerca de 50 milhões de itens foram rastreados no teste. A tabela a seguir mostra o tipo e o número dos itens rastreados. Os itens tinham de 10 a 100 KB (kilobytes) de tamanho e incluíam itens de lista, páginas da Web e vários tipos de documento.

Tipo de item Número de itens

Conteúdo nos sites do SharePoint

10 milhões de itens, incluindo o seguinte:

  • 420 conjuntos de sites

  • 4.000 sites

  • 24.200 listas

  • 47.780 bibliotecas de documentos

Conteúdo nos compartilhamentos de arquivos

15 milhões de itens

Conteúdo HTTP

15 milhões de itens

Perfis pessoais

2,5 milhões

Stitch (ferramenta de teste da memória que gera documentos na memória)

7,5 milhões

Propriedades (metadados)

1 milhão

A tabela a seguir mostra o uso de espaço em disco.

Tipo de uso Volume

Tamanho do índice no servidor de consulta

100 GB*

Tamanho do índice no servidor de indexação

100 GB*

Tamanho do banco de dados de pesquisa

600 GB

Dica

Os tamanhos dos índices testados são menores do que o que pode ser observado em um ambiente de produção. No corpus gerado pelo teste, o número de palavras exclusivas é limitado e repetido com frequência.

O tempo para executar um rastreamento completo durante o teste foi de 35 dias (aproximadamente 15 documentos por segundo). Observe que esses resultados do teste foram observados em um ambiente de produção onde a latência da rede e a capacidade de resposta dos repositórios rastreados afetaram a velocidade do rastreamento. A velocidade de rastreamento medida por documentos por segundo pode ser significativamente maior em um ambiente de teste puro ou em ambientes com maior largura de banda e maior capacidade de resposta dos repositórios rastreados.

Se 2% de um corpus do tamanho usado no ambiente de teste forem alterados, um rastreamento incremental para capturar as alterações levará de 8 a 12 horas, dependendo da latência e da capacidade de resposta dos sites que estão sendo rastreados. Observe que as alterações nos metadados e nos links de saída levam mais tempo para processar do que as alterações no conteúdo dos documentos.

Recomendações

Esta seção fornece algumas recomendações gerais sobre desempenho e capacidade. Use-as para determinar as características de capacidade e desempenho da topologia inicial criada por você no artigo Planejar-se para redundância (Office SharePoint Server) e para determinar se é necessário aumentar os componentes ou o sistema da topologia inicial.

Dica

Aumentar o sistema significa adicionar mais servidores em uma função específica e aumentar os componentes significa aumentar o desempenho ou a capacidade de um determinado servidor adicionando memória, capacidade de espaço em disco ou velocidade de processamento.

Recomendações de hardware

A tabela a seguir lista o hardware recomendado para servidores Web, servidores de indexação e servidores de banco de dados.

Dica

As exigências de memória para servidores Web, de indexação e de banco de dados dependem do tamanho do farm, do número de usuários simultâneos e da complexidade dos recursos e das páginas no farm. As recomendações de memória da tabela a seguir podem ser adequadas a um farm de pouco uso, mas o uso de memória deve ser cuidadosamente monitorado para determinar se deve ser adicionada mais memória.

Função de servidor Hardware recomendado

Servidor Web (consulta)

Processadores dual de 2,5 GHz ou mais velozes (recomendados 3 GHz ou mais velozes)

Mínimo recomendado de 2 GB de RAM

3 GB de espaço disponível em disco

Unidade de DVD, acessível em modo local ou em rede

Servidor de indexação

Processadores dual de 2,5 GHz ou mais velozes (recomendados 3 GHz ou mais velozes)

Mínimo recomendado de 4 GB de RAM

3 GB de espaço disponível em disco

Unidade de DVD, acessível em modo local ou em rede

Servidor de banco de dados

Processadores dual de 2,5 GHz ou mais velozes (recomendados 3 GHz ou mais velozes)

Mínimo recomendado de 4 GB de RAM

O espaço em disco rígido para o banco de dados de conteúdo se baseia em uma escala de 1:1,2 de tamanho de conteúdo em relação à capacidade do banco de dados. Por exemplo, se você planeja ter 100 GB de conteúdo, serão necessários pelo menos 120 GB de espaço em disco disponível para o banco de dados de conteúdo, além de espaço adicional para logs de transação.

O espaço em disco rígido para o banco de dados de pesquisa se baseia em uma escala de 1:4 de tamanho do índice em relação à capacidade do banco de dados. Por exemplo, se o seu índice terá 100 GB de tamanho, serão necessários pelo menos 400 GB de espaço em disco disponível para o banco de dados de pesquisa, além de espaço adicional para logs de transação.

Unidade de DVD, acessível em modo local ou em rede

Dica

O espaço em disco necessário no servidor de banco de dados para os logs de transações depende das configurações do log. Para obter mais informações, consulte o artigo que ajuda a compreender e a gerenciar logs de transações (https://go.microsoft.com/fwlink/?linkid=82925&clcid=0x416).

Para obter mais informações sobre os requisitos mínimos e recomendados de sistema, consulte Determine hardware and software requirements (Search Server 2008).

Topologias iniciais

Você pode estimar o desempenho da sua topologia inicial comparando-a com as outras topologias iniciais fornecidas em Planejar-se para redundância (Office SharePoint Server). Isso pode ajudar a determinar se você precisa aumentar os componentes ou o sistema da topologia inicial para alcançar suas metas de desempenho e capacidade.

Capacidade e desempenho de topologias que aumentaram os componentes ou o sistema

Para aumentar a capacidade e o desempenho de uma das topologias de ponto inicial, aumente os componentes implementando servidores com uma maior capacidade ou aumente o sistema adicionando servidores à topologia. Esta seção descreve as características gerais de desempenho de várias topologias que tiverem aumento de componentes ou de sistema. As topologias de exemplo representam os seguintes métodos comuns de aumento de componentes ou de sistema de uma topologia em um ambiente de pesquisa:

  • Para acomodar uma maior carga de usuários, adicione servidores de consulta. Você também pode adicionar servidores de indexação e servidores de consulta dedicados para aliviar parte da carga de processamento dos servidores Web.

  • Para acomodar a maior carga de usuários, adicione capacidade à função de servidor de banco de dados aumentando a capacidade de um único servidor (agrupado ou espelhado), atualizando para um servidor de 64 bits ou adicionando servidores agrupados ou espelhados.

  • Mantenha uma taxa de proporção de no máximo oito servidores de consulta para um servidor de banco de dados (agrupado ou espelhado). O teste em nosso laboratório resultou em uma taxa de proporção ideal de 7x1x1 (sete servidores de consulta para um servidor de indexação e um servidor de banco de dados).

Estimando metas de taxa de transferência

Esta seção fornece dados de teste que mostram a taxa de transferência do farm em um número crescente de servidores de consulta e mais conexões de usuário.

Como o Office SharePoint Server 2007 pode ser implantado e configurado de várias maneiras, não há uma maneira simples de estimar a quantos usuários um determinado número de servidores oferecerá suporte. Portanto, é importante que você faça o teste no seu próprio ambiente antes de implantar o Office SharePoint Server 2007 em um ambiente de produção.

Há vários fatores que podem afetar a taxa de transferência, incluindo o número de usuários, complexidade e frequência de operações do usuário, cache e personalização de páginas e Web Parts. Cada um desses fatores pode surtir um grande efeito sobre a taxa de transferência do farm. Você deve considerar cuidadosamente cada um desses fatores ao planejar sua implantação.

Para obter mais informações sobre armazenamento em cache no Office SharePoint Server 2007, consulte os seguintes recursos:

Se a sua organização já tiver uma solução de pesquisa, você poderá exibir os logs dos Serviços de Informações da Internet (IIS) para determinar os padrões de uso e tendências no ambiente atual. Para obter mais informações sobre análise de logs do IIS, consulte o artigo sobre análise de arquivos de log (IIS 6.0) (em inglês) https://go.microsoft.com/fwlink/?linkid=78825\&clcid=0x416.

Se a sua organização estiver planejando implantar uma nova solução de pesquisa, use as informações da seção a seguir para estimar seus padrões de uso.

Resultados do teste: taxa de transferência por configuração de farm

A tabela desta seção mostra os resultados do teste com vários perfis de operação de usuário usando o hardware e o perfil de uso listados em Ambiente de teste, no início deste artigo. Lembre-se de que, para cada configuração de farm, foram testados de um a oito servidores de pesquisa com um servidor de indexação e um servidor de banco de dados. Portanto, uma configuração de farm 3x1x1 significa como três servidores de consulta por um servidor de indexação por um servidor de banco de dados. O teste não foi realizado em farms contendo vários servidores de indexação ou de banco de dados.

A tabela a seguir mostra os resultados do teste com operações de usuário relacionadas à pesquisa.

Tamanho do farm RPS Porcentagem de utilização de CPU do servidor de consulta Porcentagem de utilização de CPU do servidor de indexação Porcentagem de utilização de CPU do servidor de banco de dados Média de gravações/s do disco do servidor de banco de dados

1x1x1

24,01

99,49

1,98

7,23

6,11

2x1x1

48,04

96,98

3,95

13,02

2,66

3x1x1

71,07

94,73

5,61

20,56

2,29

4x1x1

93,11

91,77

8,81

29,21

2,41

5x1x1

114,95

90,50

10,27

39,38

2,45

6x1x1

133,34

87,29

11,91

52,94

2,83

7x1x1

148,52

80,20

15,24

63,72

3,14

8x1x1

146,94

65,65

15,15

69,15

2,87

O gráfico a seguir mostra alterações na taxa de transferência das operações de pesquisa quando o número de servidores de consulta muda.

Solicitações por segundo versus servidores de consulta

Estimar a janela de rastreamento

Em um ambiente de pesquisa do Office SharePoint Server 2007, geralmente o rastreamento de conteúdo é a operação mais demorada que não é iniciada pelos usuários. Você terá de fazer o teste em seu próprio ambiente para determinar o tempo necessário para rastrear conteúdo usando uma fonte de conteúdo específica e se a taxa de transferência consumida pelo rastreamento desse conteúdo interfere no tempo de resposta pretendido para o usuário. Normalmente, você deve verificar se o rastreamento de uma fonte de conteúdo específica pode ser feito em um período noturno de 12 horas.

Estimar requisitos de espaço em disco

Use as informações a seguir para planejar os requisitos de espaço em disco dos servidores de indexação, servidores de consulta e servidores de banco de dados de seu ambiente.

Requisitos de espaço em disco de servidores de indexação e de consulta

Use as informações a seguir para planejar os requisitos de espaço em disco dos servidores de indexação e de consulta de seu farm de servidores.

Dica

O tamanho do índice de conteúdo é geralmente menor que o corpus porque todas as palavras de ruído são removidas antes da indexação do conteúdo.

Dica

Se a função de servidor de consulta estiver habilitada em outro servidor que não seja o de indexação, o índice será automaticamente propagado nesses servidores de consulta. Para armazenar uma cópia do índice de conteúdo no sistema de arquivos de um servidor de consulta, é necessário que cada um desses servidores tenha a mesma quantidade de espaço em disco que o servidor de indexação usa para o índice de conteúdo. Para obter mais informações, consulte Planejar-se para redundância (Office SharePoint Server).

Para estimar os requisitos de espaço no disco rígido que contém o índice de conteúdo:

  1. Calcule quanto de conteúdo você planeja rastrear e o tamanho médio de cada arquivo. Se você não souber o tamanho médio dos arquivos no seu corpus, use 10 KB por documento como ponto de partida.

    Use a seguinte fórmula para calcular o espaço em disco necessário para armazenar o índice de conteúdo:

    GBs necessários de espaço em disco = Total_Corpus_Size (em GB) x File_Size_Modifier x 2,85

    onde File_Size_Modifier é um número da faixa abaixo, baseado no tamanho médio dos arquivos do seu corpus:

    • 1,0 se o seu corpus contiver arquivos muito pequenos (tamanho médio do arquivo = 1 KB).

    • 0,12 se o seu corpus contiver arquivos de tamanho moderado (tamanho médio do arquivo = 10 KB).

    • 0,05 se o seu corpus contiver arquivos de tamanho grande (tamanho médio do arquivo = 100 KB ou mais).

Dica

Esta equação destina-se somente a estabelecer uma estimativa inicial. Os resultados reais podem variar bastante conforme o tamanho e o tipo dos documentos indexados, bem como a quantidade de metadados que estão sendo indexados durante uma operação rastreamento.

Nesta equação, você multiplica Total_Corpus_Size (em GB) x File_Size_Modifier para obter o tamanho estimado do arquivo de índice. Em seguida, você multiplica por 2,85 para acomodar a sobrecarga das mesclagens mestras quando os dados rastreados são mesclados com o índice. O resultado final é a necessidade estimada de espaço em disco.

Por exemplo, para um corpus do tamanho de 1 GB que contém principalmente arquivos com um tamanho médio de 10 KB, use os seguintes valores para calcular o tamanho estimado do arquivo de índice:

1 GB x 0,12 = 0,12 GB

De acordo com esse cálculo, o tamanho estimado do arquivo de índice é de 120 MB.

Em seguida, multiplique o tamanho estimado do arquivo de índice por 2,85:

120 MB x 2,85 = 342 MB

Assim, o espaço em disco necessário para o arquivo de índice e para acomodar operações de indexação é de 342 MB ou 0,342 GB.

Dica

O volume dos dados rastreados pode diferir, dependendo do conteúdo que está sendo rastreado. Uma fonte de conteúdo é um conjunto de opções que você pode usar para especificar o protocolo a ser usado no rastreamento, em quais URLs iniciará o rastreamento, quando rastrear e em que níveis de profundidade.

  1. Com base em sua estimativa, se o índice de conteúdo couber no espaço em disco disponível dos servidores de indexação e de consulta, vá para a etapa 3. Caso contrário, adicione espaço em disco ou reavalie a etapa 1 antes de ir para a etapa 3.

  2. Rastreie parte do conteúdo.

  3. Avalie o tamanho do índice de conteúdo e o número de arquivos que foram rastreados. Use essas informações para aumentar a precisão do cálculo que você executou na etapa 1.

  4. Se o espaço em disco restante for adequado, rastreie mais algum conteúdo. Caso contrário, adicione espaço em disco conforme necessário ou reavalie quanto conteúdo você pretende rastrear.

  5. Repita as etapas de 3 a 5 até que todo o conteúdo seja rastreado.

    Depois de rastrear todo o corpus, recomendamos manter um registro do tamanho do seu índice de conteúdo e do banco de dados de pesquisa em cada rastreamento para poder determinar uma taxa média de aumento. Como um corpus costuma aumentar com o tempo, à medida que novo conteúdo é adicionado ao farm, você deve monitorar o espaço disponível no disco rígido para garantir que a capacidade adequada para operações de indexação seja mantida.

Requisitos de espaço em disco para o banco de dados de pesquisa

O banco de dados de pesquisa, que armazena metadados e informações de histórico do rastreador para o sistema de pesquisa, geralmente requer mais espaço em disco que o índice. Isso acontece especialmente quando você rastreia principalmente sites do SharePoint, os quais contêm muitos metadados.

Dica

Os metadados de todo o conteúdo indexado e do histórico do rastreador são armazenados no banco de dados de pesquisa. Por esse motivo, o banco de dados de pesquisa requer mais espaço de armazenamento que o índice de conteúdo.

Use a seguinte fórmula para calcular o espaço em disco necessário para o banco de dados de pesquisa:

GBs necessários de espaço em disco = Total_Corpus_Size (em GB) x File_Size_Modifier x 4

onde File_Size_Modifier é um número da faixa abaixo, baseado no tamanho médio dos arquivos do seu corpus:

  • 1,0 se o seu corpus contiver arquivos muito pequenos (tamanho médio do arquivo = 1 KB).

  • 0,12 se o seu corpus contiver arquivos de tamanho moderado (tamanho médio do arquivo = 10 KB).

  • 0,05 se o seu corpus contiver arquivos de tamanho grande (tamanho médio do arquivo = 100 KB ou mais).

Por exemplo, para um corpus do tamanho de 1 GB que contém principalmente arquivos com um tamanho médio de 10 KB, substitua os seguintes valores na equação para calcular o tamanho estimado do arquivo de índice:

1 GB x 0,12 = 0,12 GB ou 120 MB

Em seguida, multiplique o tamanho estimado do arquivo de índice por 4:

120 MB x 4 = 480 MB

Assim, o espaço em disco necessário para o banco de dados de pesquisa é de 480 MB ou 0,48 GB.

Determinando especificações para servidores de indexação, consulta e banco de dados

No Office SharePoint Server 2007, a pesquisa é um serviço compartilhado disponível no nível do SSP. O sistema de pesquisa do Office SharePoint Server 2007 consiste em duas funções de servidor principais: o servidor de indexação e o servidor de consulta.

Rastreamento e indexação são operações que utilizam muitos recursos, O rastreamento do conteúdo é o processo pelo qual o sistema acessa e analisa o conteúdo e suas propriedades para criar um índice de conteúdo a partir do qual as consultas de pesquisa possam ser atendidas. O rastreamento consome recursos de processamento e memória do servidor de indexação, do servidor ou servidores de consulta que estão atendendo às operações de rastreamento, do servidor ou servidores que hospedam o repositório de conteúdo que está sendo rastreado e do servidor de banco de dados que está atendendo ao farm do Office SharePoint Server 2007.

Os rastreamentos afetam o desempenho geral do sistema e afetam diretamente o tempo de resposta do usuário e o desempenho de outros serviços compartilhados no farm, bem como o serviço da Web no servidor de consulta que atende às operações de rastreamento. Você pode dedicar um servidor de consulta às operações de rastreamento para reduzir a carga em outros servidores do farm.

A indexação do conteúdo rastreado também poderá afetar o desempenho geral do sistema se as operações de rastreamento não forem atribuídas a um servidor de consulta dedicado. Se as operações relacionadas à pesquisa constituem uma parte significativa das operações do farm, considere a possibilidade de implantar um servidor de consulta dedicado. Consulte a seção Servidor de consulta dedicado para rastreamento deste artigo para obter mais informações.

Determinando especificações para servidores de indexação

Use as informações contidas nesta seção para especificar os requisitos dos servidores de indexação de seu farm do Office SharePoint Server 2007.

CPU do servidor de indexação

A velocidade do processador do servidor de indexação influencia a velocidade do rastreamento e o número de threads de rastreamento que podem ter uma instância criada. Embora não haja um número específico ou um tipo de processador que seja recomendado, você deve considerar a quantidade de conteúdo que será rastreado ao determinar os requisitos do servidor de indexação. Em um ambiente corporativo, o servidor de indexação deve ter vários processadores para lidar com uma grande carga de indexação.

A tabela a seguir mostra como a velocidade do rastreamento aumenta à medida que aumenta o número de processadores disponíveis no servidor de indexação.

Número de processadores Porcentagem de melhoria na velocidade do rastreamento

1

0,00

2

10,89

4

19,77

8

30,77

Memória do servidor de indexação

No servidor de indexação, os documentos são carregados nos buffers para processamento pelo mecanismo do rastreador. Em um farm com um corpus de aproximadamente 1 milhão de documentos, o servidor de indexação requer aproximadamente 1,5 GB de memória. Depois que um documento é processado na memória, ele é gravado no disco. Quanto maior a capacidade de memória, mais documentos o rastreador pode processar simultaneamente, o que resulta em uma maior velocidade do rastreamento.

Recomendamos no mínimo 4 GB de RAM no servidor de indexação para rastreamento de um corpus com mais de um milhão de documentos.

Velocidade do disco do servidor de indexação

Recomendamos especificar RAID 10 com tempo de acesso de dois milissegundos (ms) e tempo de gravação superior a 150 MB/s para gravações rápidas do disco.

Índice único e relevância

No SharePoint Portal Server 2003, o índice de conteúdo poderia ser dividido em vários servidores para criar subconjuntos do conteúdo indexado e acomodar melhor o crescimento. Embora o Office SharePoint Server 2007 ofereça suporte ao uso de vários servidores de indexação para aumento do sistema, cada servidor de indexação exige um SSP separado e não há como combinar os índices separados.

Número de servidores de indexação

Você pode implantar vários servidores de indexação em um farm quando desejar o isolamento completo entre SSPs ou para aumentar o sistema. Embora não haja limite rígido no número de servidores de indexação de um farm, o teste tem sido feito com no máximo quatro servidores de indexação em um único farm.

O número de servidores de indexação usados em um farm depende de como você deseja direcionar a sua experiência de pesquisa. Se a experiência de pesquisa exige que o conteúdo rastreado esteja em um único conjunto de resultados, implante um SSP com um único servidor de indexação. A maioria das organizações quer que todo o conteúdo rastreado esteja disponível para pesquisa pelos usuários e, portanto, não exige vários escopos de pesquisa.

Se for possível dividir a experiência de pesquisa entre escopos diferentes para fornecer conjuntos separados e relevantes de resultados da pesquisa em repositórios de conteúdo diferentes, use vários SSPs e servidores de indexação. Um exemplo de um cenário no qual diferentes escopos de pesquisa são desejáveis é uma empresa com uma divisão que mantém documentos sigilosos que só podem ser pesquisados por um grupo específico de usuários.

Dependendo dos requisitos de dimensionamento e segurança, você pode associar todos os SSPs a um único servidor de indexação ou associar cada SSP a um servidor de indexação diferente.

Dica

O Office SharePoint Server 2007 não oferece suporte à consulta entre vários SSPs para obter um único conjunto relevante de resultados.

Um único servidor de indexação com uma configuração de hardware robusta pode oferecer suporte a até 50 milhões de documentos. Se você estiver criando um único índice desse tamanho, recomendamos usar não mais de um servidor de indexação em um farm, pois o índice é propagado em todos os servidores de consulta do farm. Se um segundo servidor de indexação for adicionado, os índices dele também serão propagados em todos os servidores de consulta do farm, o que aumentará a carga nos servidores de consulta.

Para aumentar a capacidade de pesquisa adicionando SSPs, você também precisará aumentar o sistema. No mínimo, você terá de adicionar outro servidor de indexação, servidor de banco de dados e servidor Web dedicado. Se seu hardware atualmente oferece suporte à indexação de 10 milhões de documentos em um único SSP, você pode aumentar os componentes usando o mesmo hardware para hospedar 20 SSPs.

Dica

No Microsoft Office SharePoint Server 2007 for Search, você só pode usar um SSP.

Isso permitirá a indexação de cerca de dois milhões de documentos por SSP para um total de aproximadamente 40 milhões de documentos.

Dica

Um SSP é sempre associado a apenas um servidor de indexação. No entanto, um servidor de indexação pode acomodar vários SSPs.

Servidor de consulta dedicado para rastreamento

É uma prática recomendada dedicar um servidor de consulta às operações de rastreamento.

Em um farm habilitado para pesquisa, todos os servidores de consulta do farm atendem às operações de rastreamento por padrão. Quando uma operação de rastreamento começa, o servidor de indexação envia uma solicitação aos servidores de consulta, os quais, por sua vez buscam o conteúdo a ser rastreado e o entregam ao servidor de indexação. Quando a carga do usuário é alta, uma operação de rastreamento pode reduzir a capacidade de resposta do sistema às solicitações do usuário.

Para reduzir o impacto das operações de rastreamento sobre o desempenho do farm, configure um servidor de consulta dedicado para rastreamento. Dedicar um servidor de consulta ao rastreamento força o atendimento de todas as operações de rastreamento pelo servidor dedicado, enquanto todos os outros servidores de consulta do farm continuam a atender as solicitações de usuário. Essa configuração é particularmente útil em ambientes nos quais as operações de rastreamento não podem ficar confinadas a uma janela noturna ou em ambientes geograficamente distribuídos nos quais os usuários estão sempre fazendo solicitações.

Para obter mais informações sobre como dedicar um servidor de consulta ao rastreamento, consulte Configurar um servidor Web de front-end dedicado para rastreamento (Office SharePoint Server 2007).

Dica

Dedicar um servidor de consulta ao rastreamento pode afetar a execução de outros serviços no servidor. Um servidor de consulta usado dessa forma não pode ter a carga balanceada e não atenderá às solicitações do usuário final.

Otimização do desempenho do servidor de indexação

As operações de indexação aumentam a carga no servidor de banco de dados e podem reduzir a capacidade de resposta do farm. As operações de indexação também podem afetar outros serviços compartilhados no servidor de aplicativos que executa o serviço Indexação de Pesquisa. Você pode ajustar o nível de desempenho da indexação de cada servidor de indexação por um dos três seguintes valores:

  • Reduzido

  • Parcialmente reduzido

  • Máximo

O configuração padrão é Reduzido. Você só pode usar essa configuração para um servidor de indexação específico e não para o SSP.

Os rastreamentos afetam o desempenho do servidor de banco de dados porque o serviço de pesquisa do Office SharePoint Server grava todos os metadados coletados dos documentos rastreados em tabelas do banco de dados. É possível para o servidor ou servidores de indexação gerar dados em uma taxa que possa sobrecarregar o servidor de banco de dados.

Você deve fazer seus próprios testes para equilibrar velocidade de rastreamento, latência da rede, carga do banco de dados e a carga dos repositórios de conteúdo que estão sendo rastreados.

A tabela a seguir mostra o relacionamento entre a configuração de nível de desempenho e a utilização da CPU nos servidores de indexação e de banco de dados como testados.

Configuração de nível de desempenho Porcentagem de utilização de CPU do servidor de indexação Porcentagem de utilização de CPU do servidor de banco de dados

Reduzido

20

20

Parcialmente reduzido

24

24

Máximo

25

26

Considere os cenários e as recomendações de configuração de nível de desempenho da seguinte lista:

  • Se o servidor de indexação e os servidores de bancos de dados forem usados exclusivamente para os serviços de pesquisa do Office SharePoint Server, você poderá definir o nível como Máximo. No entanto, recomendamos que o aumento máximo na utilização da CPU do servidor de banco de dados relacionada à atividade do servidor de indexação não seja superior a 30%. Se o aumento na utilização da CPU do servidor de banco de dados ultrapassar 30% quando o nível do desempenho estiver definido como Máximo, recomendamos configurar o nível de desempenho com a próxima opção inferior.

  • Se o servidor de aplicativos e o servidor de banco de dados forem compartilhados por vários serviços compartilhados, como o serviço de pesquisa do Office SharePoint Server e os Serviços de Cálculo do Excel, recomendamos selecionar uma configuração de nível de desempenho inferior. Contudo, reduzir o máximo permitido da atividade de indexação reduz a velocidade na qual os índices são indexados, o que pode fazer com que os resultados da pesquisa fiquem desatualizados. Monitore o desempenho do servidor local para ajudar a determinar o nível de desempenho apropriado para o servidor de indexação.

Use o procedimento a seguir para especificar a configuração de nível de desempenho no servidor de indexação.

Ajustar o desempenho do servidor de indexação

  1. Clique em Iniciar, aponte para Todos os Programas, aponte para Microsoft Office Server e clique em Administração Central do SharePoint 3.0.

  2. Na Home Page da Administração Central, clique em Operações.

  3. Na página Operações, na seção Topologia e Serviços, clique em Serviços no servidor.

  4. Na página Serviços no Servidor, no menu Servidor, selecione o servidor de indexação que deseja gerenciar.

  5. Na seção Iniciar serviços na tabela a seguir, clique em Office SharePoint Server Search.

  6. Na página Configurar Definições do Serviço do Office SharePoint Server Search, na seção Desempenho do Indexador, selecione o nível de desempenho que deseja aplicar.

  7. Clique em OK para salvar suas alterações.

Regras de impacto do rastreador

As regras de impacto do rastreador são opções de configuração de pesquisa no nível do farm que especificam o número de solicitações simultâneas que o serviço de pesquisa do Office SharePoint Server gera ao rastrear usando uma determinada fonte de conteúdo. Quanto maior o número de solicitações simultâneas, mais rápido é o rastreamento. Lembre-se de que a frequência da solicitação especificada em uma regra de impacto do rastreador afeta diretamente a carga no servidor de banco de dados e no servidor que hospeda o conteúdo que está sendo rastreado. Se você aumentar a frequência da solicitação de um determinado site, deverá monitorar atentamente os servidores que estão sendo rastreados para avaliar se a carga maior é aceitável ou não.

O valor padrão é o número de processos no servidor de indexação. Portando, em um computador com quatro processadores, o valor padrão é oito. Recomendamos ajustar o valor e medir a carga no servidor de destino para determinar o número ideal de solicitações simultâneas. Você pode selecionar o número de solicitações simultâneas entre os seguintes valores disponíveis: 1, 2, 4, 8, 16, 32 e 64.

Você também pode criar uma regra para solicitar um documento por vez e aguardar um número especificado de segundos entre as solicitações. Uma regra como essa pode ser útil para rastrear um site que possua uma carga de usuários constante.

A tabela a seguir mostra o relacionamento entre o número de solicitações simultâneas e a utilização da CPU nos servidores de indexação e de banco de dados.

Número de threads de rastreamento Porcentagem de utilização de CPU do servidor de indexação Porcentagem de utilização de CPU do servidor de banco de dados

4

35

12

8

40

15

12

45

15

16

60

20

Você pode criar uma regra de impacto do rastreador usando o procedimento a seguir.

Criar uma regra de impacto do rastreador

  1. Clique em Iniciar, aponte para Todos os Programas, aponte para Microsoft Office Server e clique em Administração Central do SharePoint 3.0.

  2. Na página Administração Central, clique em Gerenciamento de Aplicativos.

  3. Na página Gerenciamento de Aplicativos, na seção Pesquisar, clique em Gerenciar serviço de pesquisa.

  4. Na página Gerenciar Serviço de Pesquisa, na seção Definições de Pesquisa no Nível de Farm, clique em Regras de impacto do rastreador.

  5. Na página Regras de Impacto do Rastreador, clique em Adicionar Regra.

  6. Na página Adicionar Regra de Impacto do Rastreador, na seção Site, digite o nome do site para o qual deseja criar uma regra. Não inclua o protocolo (por exemplo, não inclua http://).

  7. Na seção Frequência de Solicitações, especifique como o rastreador solicitará documentos desse site.

    1. Para solicitar vários documentos simultaneamente, selecione Solicite qualquer número de documentos de uma vez, até o limite especificado, e não espere entre solicitações e escolha o valor desejado na lista Solicitações simultâneas.

    2. Para solicitar um documento por vez, selecione Solicitar um documento por vez e aguardar o tempo especificado entre solicitações e digite o número de segundos de espera entre solicitações na caixa Tempo de espera (em segundos).

  8. Clique em OK para criar a regra.

Determinando especificações para servidores de consulta

Use as informações contidas nesta seção para determinar especificações dos servidores de consulta de seu farm do Office SharePoint Server 2007.

Memória do servidor consulta

Quanto maior a memória disponível, menor o número de vezes que o serviço de pesquisa do Office SharePoint Server precisará acessar o disco rígido para executar uma consulta determinada. Ter memória suficiente também permite um armazenamento em cache mais eficiente. O ideal é ter memória suficiente instalada nos servidores de consulta para acomodar o índice inteiro.

A figura a seguir mostra a relação entre o tamanho do índice nos servidores de consulta e o tempo de resposta do usuário por consulta.

Análise de desempenho e capacidade para pesquisa

Velocidade do disco do servidor de consulta

Recomendamos usar RAID 10 para obter gravações em disco mais rápidas.

Número de servidores de consulta

Você pode implantar vários servidores de consulta no farm para obter redundância e balanceamento de carga. O número de servidores de consulta usado depende do número de usuários presentes no farm e da carga máxima esperada por hora. Nós testamos até oito servidores de consulta por farm.

A figura a seguir mostra a taxa de transferência do servidor de consulta, a porcentagem de utilização da CPU do servidor de cada banco de dados e a porcentagem de utilização da CPU do servidor de consulta à medida que os servidores de consulta são adicionados ao farm. No teste que deu origem aos dados, o servidor de banco de dados usado foi compartilhado entre bancos de dados de conteúdo e os bancos de dados de serviço.

Gráfico de desempenho de servidor de pesquisa

Latência do servidor remoto

A latência do servidor é um fator importante que afeta o desempenho do rastreamento. O desempenho entre servidores do farm deve ser balanceado para que o desempenho do rastreamento de forma geral alcance seu potencial. Por exemplo, um servidor de indexação poderoso poderá operar com 25% de sua capacidade se o servidor de banco de dados que está sendo rastreado não estiver apto a responder de maneira suficientemente rápida. Nesse caso, você pode aumentar os componentes do servidor de banco de dados, o que aumentará a velocidade de rastreamento do farm todo.

Você deve fazer o seu próprio teste para avaliar a capacidade de resposta dos servidores em seu ambiente. O servidor de banco de dados que atende ao farm de destino é normalmente o afunilamento em casos em que o desempenho do rastreamento é insatisfatório. Para melhor o desempenho do rastreamento, você pode:

  • Aumentar os componentes do hardware do servidor de banco de dados adicionando ou atualizando processadores, adicionando memória e atualizando os discos rígidos com tempos de busca e gravação mais rápidos.

  • Aumentar a memória dos servidores de consulta do farm.

  • Fazer o rastreamento em horários que não sejam de pico para que o servidor de banco de dados que está sendo rastreado possa atender ao tráfego de usuários durante o dia e responder aos rastreamentos fora dos horários de pico.

Determinando especificações para servidores de banco de dados

O sistema de pesquisa do Office SharePoint Server 2007 rastreia dados do texto e metadados associados ao conteúdo. No Office SharePoint Portal Server 2003, todos os metadados coletados pelo sistema de indexação foram armazenados em um armazenamento de propriedades de banco de dados JET. No Office SharePoint Server 2007, o índice de texto completo invertido é armazenado no servidor de indexação e os metadados são armazenados no banco de dados de pesquisa. O servidor de indexação grava metadados no banco de dados e os servidores de consulta leem esses dados para processar consultas baseadas em propriedade emitidas pelos usuários.

Use as informações contidas nesta seção para determinar especificações dos servidores de banco de dados de seu farm do Office SharePoint Server 2007.

Taxa de transferência do banco de dados

O armazenamento de metadados do banco de dados é compartilhado pelo servidor de indexação e todos os servidores de consulta do farm. O servidor de indexação grava todos os metadados e os servidores de consulta leem esses dados para processar solicitações de pesquisa. A taxa de transferência da consulta depende bastante da capacidade de resposta do armazenamento de metadados.

À medida que o número de servidores de consulta aumenta no farm, a carga no servidor de banco de dados também aumenta e afeta a taxa de transferência geral da consulta. Você deve monitorar atentamente o servidor de banco de dados ao adicionar servidores de indexação ou de consulta ao farm para garantir que o desempenho do banco de dados continue adequado.

Distribuição de disco rígido do servidor de banco de dados

Como o serviço de pesquisa do Office SharePoint Server grava uma grande quantidade de dados no banco de dados de pesquisa durante os rastreamentos, recomendamos usar eixos separados para os bancos de dados SharedServices_Search_Db, SharedServices_Db e TempDb para obter melhor desempenho em cenários nos quais o índice contenha mais de 5 milhões de itens.

Velocidade do disco do servidor de banco de dados

Recomendamos usar RAID 10 para obter gravações em disco mais rápidas.

Baixar este manual

Este tópico está incluído no seguinte manual baixável para facilitar a leitura e a impressão:

Consulte a lista completa de manuais disponíveis na página de download de conteúdo do Office SharePoint Server 2007.

Consulte também

Conceitos

Configurar um servidor Web de front-end dedicado para rastreamento (Office SharePoint Server 2007)