Planejar a pesquisa corporativa global

Atualizado em: 2009-04-23

Neste artigo:

  • Arquiteturas de pesquisa recomendadas

  • Pesquisa centralizada

  • SSPs regionais com conteúdo sincronizado

  • Pesquisa centralizada mais pesquisa distribuída

  • Pesquisa distribuída

  • Pesquisa federada

Arquiteturas de pesquisa recomendadas

Se você planeja implantar mais de um farm de servidores executando o Microsoft Office SharePoint Server 2007 geograficamente, existem diversas arquiteturas de pesquisa que são práticas para ambientes de rede de longa distância (WAN). Este artigo aborda essas arquiteturas. O modelo de tamanho de cartaz a seguir oferece uma visão geral das soluções globais com suporte e das arquiteturas de pesquisa recomendadas: Implantando o Microsoft Office SharePoint Server geograficamente (em inglês) (https://go.microsoft.com/fwlink/?linkid=110982\&clcid=0x416) (em inglês). Este modelo foi criado no Microsoft Office Visio. Se você não tiver o Visio instalado, poderá baixar um visualizador gratuito (https://go.microsoft.com/fwlink/?linkid=73526\&clcid=0x416). Uma plotadora é a melhor opção para a impressão desse arquivo.

Dica

Este cartaz ainda não está atualizado com informações sobre a arquitetura de pesquisa federada.

O planejamento de uma arquitetura de pesquisa equilibra os seguintes tipos de requisitos com base nas prioridades de uma organização:

  • Experiência do usuário na localização de conteúdo usando consultas de pesquisa. A experiência do usuário inclui:

    • Problemas de desempenho relacionados à emissão de uma solicitação de consulta e ao recebimento de resultados da pesquisa.

    • Relevância e abrangência dos resultados que são retornados.

  • Problemas de desempenho relacionados ao conteúdo de rastreamento em uma WAN.

  • O custo de administrar um ambiente de pesquisa global.

Em alguns casos, compreender as opções de arquitetura de pesquisa em um ambiente de WAN ajudará a determinar quais das soluções de suporte global serão as mais apropriadas para a sua organização. Para obter mais informações sobre essas soluções, consulte Soluções globais com suporte no Office SharePoint Server.

Este artigo não discute as características de desempenho de emissão de consultas e pesquisa pela WAN ou o rastreamento de conteúdo pela WAN. No entanto, compreender o grau de suporte da sua WAN para esses tipos de operações é crucial para o planejamento de um ambiente global. Para obter mais informações sobre o desempenho do Office SharePoint Server 2007 em uma WAN, consulte Planejar requisitos de largura de banda.

Pesquisa centralizada

Com a arquitetura de pesquisa centralizada, o serviço de pesquisa no farm central rastreia conteúdo em todos os farms regionais. Consultas de pesquisa de usuários regionais são enviadas para o farm central.

A figura a seguir mostra uma arquitetura de pesquisa centralizada.

Arquitetura centralizada - implantação de pesquisa global

Se os links da WAN derem suporte ao rastreamento de conteúdo em locais regionais, essa será a arquitetura recomendada, uma vez que oferece uma experiência de pesquisa unificada para usuários que inclui os seguintes aspectos:

  • Os usuários sempre acessam o farm central para pesquisa.

  • A relevância de pesquisa é mantida nos resultados da pesquisa.

  • Os usuários podem pesquisar em todos os conteúdos em toda a organização para os quais tenham permissões de exibição.

Uma desvantagem dessa arquitetura, no entanto, é que não há nenhuma maneira de priorizar ou distinguir o conteúdo local nos resultados da pesquisa, a menos que um escopo de pesquisa seja criado com base na localidade do farm de conteúdo. Isto é, se um usuário em um site regional estiver procurando um documento armazenado no site regional, não haverá uma maneira fácil de distinguir onde documentos residem quando forem listados nos resultados da pesquisa.

Se os links da WAN não tiverem um bom desempenho, essa arquitetura pode apresentar vários riscos. O rastreamento de conteúdo pode sobrecarregar um link da WAN, o que diminui o desempenho das respostas a solicitações de usuários. Se houver um alto volume de dados com altas taxas de alteração, indexação de trabalhos pode não conseguir acompanhá-las. No entanto, existem maneiras para você otimizar o Office SharePoint Server 2007 para otimizar o rastreamento de conteúdo em uma WAN. Essas otimizações podem reduzir o tempo e o tráfego de rede usados durante o processo de indexação. Para obter mais informações, consulte o tópico sobre a "otimização para o rastreamento de conteúdo" em Otimizando o Office SharePoint Server para ambientes de WAN.

Finalmente, embora os links de WAN afetem o fato de você poder rastrear conteúdo remotamente — e, consequentemente, se é viável usar a arquitetura de pesquisa centralizada — links de WAN mais lentos também podem ter uma função na forma como a pesquisa utilizável é feita para usuários regionais. Links de WAN lentos podem desencorajar usuários a emitirem consultas. Você pode otimizar o desempenho da WAN no horário comercial ao agendar o rastreamento de conteúdo e outras operações que possam diminuir o desempenho para as horas de menor movimento. Mesmo com a otimização, no entanto, você terá de determinar como a arquitetura centralizada de pesquisa servirá às necessidades dos usuários regionais em links de WAN existentes.

Em muitos casos, o oferecimento da arquitetura de pesquisa centralizada ajuda a dimensionar o Office SharePoint Server 2007 para fornecer serviços a usuários regionais.

A tabela a seguir resume as vantagens e as desvantagens da arquitetura de pesquisa centralizada.

Vantagens Desvantagens

A relevância da pesquisa é mantida.

O gerenciamento do Provedor de Serviços Compartilhados (SSP) é centralizado.

O rastreamento do conteúdo pela WAN usa largura de banda.

Manter os índices atualizados pode ser difícil em ambientes com grandes volumes de dados e altas taxas de alteração.

O desempenho da consulta está sujeito ao desempenho de links de WAN.

SSPs regionais com conteúdo sincronizado

Se os links de WAN não dão suporte à arquitetura de pesquisa centralizada e se desejar oferecer pesquisa como um serviço para sites regionais, você poderá hospedar um SSP em cada site regional.

Existem diversas arquiteturas diferentes de pesquisa que englobam a hospedagem de SSPs em locais regionais. A primeira dessas arquiteturas baseia-se na sincronização de conteúdo em toda a organização para que cada site regional possua uma cópia de todo o conteúdo necessário para funcionários desse site regional. Essa abordagem de gerenciamento de conteúdo em toda uma organização global é descrita em Projetar a arquitetura e governança de informações globais. Como o conteúdo é sincronizado, não é necessário rastrear conteúdo remotamente na WAN.

A figura a seguir ilustra essa arquitetura.

Arquitetura de pesquisa sincronizada

Na figura:

  • Os projetos que estão prontos para ser compartilhados em toda a organização são publicados no site central, a despeito de onde o conteúdo é criado.

  • Depois que o conteúdo é publicado no site central, versões somente leitura de projetos são sincronizadas para todos os sites.

  • O serviço de pesquisa de cada farm rastreia somente o conteúdo do farm.

Da mesma forma, as informações corporativas são sincronizadas por toda a organização da mesma maneira, como ilustrado na figura a seguir.

Cenário de pesquisa global de Provedor de Serviços Compartilhados

Embora essa arquitetura elimine a necessidade de rastrear conteúdo pela WAN, ela exige o uso de links de WAN para sincronizar o conteúdo no ambiente. Para minimizar o efeito no desempenho da WAN, você pode agendar essas operações para as horas de menor movimento. A vantagem principal é que os usuários regionais terão acesso local ao conteúdo, usando o serviço de pesquisa local. Nessa arquitetura, o uso de links de WAN é agendado e gerenciado e os usuários não são impedidos pelo desempenho dos links de WAN de exercerem as responsabilidades de seus cargos.

A tabela a seguir resume as vantagens e desvantagens dessa arquitetura de pesquisa.

Vantagens Desvantagens

O conteúdo é rastreado localmente.

O desempenho da consulta de pesquisa não está sujeito ao desempenho de links de WAN.

A relevância da pesquisa é mantida dentro de cada farm.

Vários SSPs aumentam os custos administrativos.

A sincronização de conteúdo em uma organização aumenta a complexidade da solução.

Pesquisa centralizada mais pesquisa distribuída

Você pode criar uma arquitetura de pesquisa que combine pesquisa centralizada e pesquisa distribuída. Com essa arquitetura, o serviço de pesquisa em cada região rastreia todo o conteúdo dessa região e o farm central rastreia o conteúdo entre todos os farms da organização.

Com essa arquitetura, os usuários regionais podem pesquisar conteúdo local sem usar links de WAN. Os usuários regionais podem pesquisar em toda a organização global emitindo consultas no farm central.

A figura a seguir ilustra a pesquisa centralizada mais a arquitetura de pesquisa distribuída.

Configuração de farm para pesquisa distribuída e centralizada

No diagrama:

  • Cada farm hospeda um SSP. O serviço de pesquisa fornecido pelo SSP local rastreia conteúdo local em cada farm regional.

  • O serviço de pesquisa fornecido pelo SSP no farm central também rastreia conteúdo em farms regionais.

O principal benefício dessa arquitetura é que o desempenho da consulta é otimizado para conteúdo local enquanto a pesquisa global é fornecida como uma opção. Essa arquitetura funciona bem nas seguintes circunstâncias:

  • Funcionários regionais usam a pesquisa principalmente para acessar conteúdo local.

  • Links de WAN oferecem suporte ao rastreamento de conteúdo em sites regionais.

Semelhante à arquitetura de pesquisa central, no entanto, essa arquitetura depende do uso intenso de links de WAN para o rastreamento de conteúdo. Porém, com a opção da pesquisa local, a pesquisa global não tem uma função tão crucial na arquitetura geral da pesquisa, e esse recurso pode ser incluído nos rastreamentos agendados e contratos de nível de serviço.

A tabela a seguir resume as vantagens e desvantagens dessa arquitetura de pesquisa.

Vantagens Desvantagens

O desempenho de consultas é otimizado para conteúdo local.

Essa opção reduz significativamente a quantidade de consultas na WAN em comparação com o modelo de pesquisa centralizado.

A relevância de pesquisa é otimizada com base no escopo da pesquisa (local ou global).

Vários SSPs aumentam os custos administrativos.

O rastreamento do conteúdo pela WAN usa largura de banda.

Para usuários regionais que executam consultas globais, o desempenho de consulta é afetado pelo desempenho dos links de WAN.

Pesquisa distribuída

Se links de WAN não oferecerem suporte à capacidade de sincronizar conteúdo em um ambiente global, ou de rastrear conteúdo remoto em farms regionais, você pode fornecer a pesquisa somente no nível dos farms regionais. Com a arquitetura de pesquisa distribuída, cada farm regional hospeda seu próprio SSP e o serviço de pesquisa fornecido por cada SSP regional rastreia somente o conteúdo local.

A figura a seguir ilustra a arquitetura de pesquisa distribuída.

Pesquisa global de SSP em arquitetura distribuída

Considere a implementação da arquitetura de pesquisa distribuída sob as seguintes circunstâncias:

  • Sites regionais não estão bem conectados com links de WAN.

  • Sites regionais são autônomos em relação a outros sites regionais.

  • Sites regionais não se baseiam intensamente em uma conexão com o site central  — por exemplo, uma organização com filiais que operam de forma autônoma.

  • Existe um grande número de sites regionais e o modelo corporativo e os links de WAN não dão suporte a um modelo centralizado — por exemplo, uma organização com um número grande de filiais que não estão bem conectadas por links de WAN.

A tabela a seguir resume as vantagens e desvantagens da arquitetura de pesquisa distribuída.

Vantagens Desvantagens

A relevância da pesquisa foi mantida.

O conteúdo não é rastreado em links de WAN.

A pesquisa não é feita em toda a empresa.

Os usuários de farms regionais devem se conectar ao farm central para pesquisar seu conteúdo.

Pesquisa federada

A pesquisa federada é um recurso adicionado ao Atualização de infraestrutura para os Microsoft Office Servers. Esse recurso também está incluído no Microsoft Search Server 2008. A pesquisa federada permite que os usuários finais emitam uma consulta que pesquise várias fontes e exiba os resultados em Web Parts separadas em uma única página de resultados de pesquisa. Essas fontes podem ser repositórios de conteúdo corporativo, outros mecanismos de pesquisa ou partes do índice do seu Search Server. O uso da federação permite que você ofereça resultados de consulta mais extensos para seus usuários sem devotar seus recursos de servidor ao rastreamento e à indexação de conteúdo.

Em um ambiente distribuído com farms de servidores em regiões diferentes, a pesquisa federada pode ser configurada em cada uma das regiões que representa uma localidade federada diferente. O usuário verá os resultados da pesquisa de cada região em uma Web Part de resultados federados diferentes. Os resultados podem ser exibidos assim que forem recebidos. Por exemplo, é mais provável que os resultados da pesquisa do farm de servidores local sejam retornados antes dos resultados da pesquisa recebidos por conexões de WAN.

O diagrama a seguir ilustra o uso da pesquisa federada em um ambiente geograficamente distribuído no qual o Microsoft Office SharePoint Server foi implantado para cada região.

Conexão de pesquisa federada a um farm remoto

Neste diagrama:

  • Um usuário no Farm Regional 2 emite uma consulta.

  • O tráfego de consulta é enviado para um servidor Web no farm local. O servidor Web encaminha a consulta para os locais de pesquisa federada.

  • As consultas A e B são locais federados e são enviadas para os farms geograficamente distribuídos.

  • A Consulta C é uma pesquisa local servida pelo farm local.

  • Os resultados da pesquisa são exibidos em uma página da Web em Web Parts separadas.

Configurando a pesquisa federada em ambientes distribuídos

Usando a pesquisa federada, cada farm de servidores rastreia seu próprio conteúdo. Para farms de servidores que estejam executando o Office SharePoint Server, isso requer um SSP em cada farm regional. Você cria uma conexão federada para um farm de servidores remoto que esteja executando o Office SharePoint Server criando (no farm de servidores local) um local federado de OpenSearch. O local federado de OpenSearch deve apontar para o RSS feed de uma página de resultados de pesquisa em um centro de pesquisas no farm remoto. Você inclui o farm local na pesquisa federada criando um tipo de local federado "índice de pesquisa local". Para implementar a pesquisa federada em um ambiente distribuído, configure cada farm com locais federados para os outros farms.

O diagrama a seguir ilustra com mais detalhes uma conexão de pesquisa federada para um farm remoto.

Pesq fed, distr geo; cada região c/ implantação própria

Neste diagrama:

  • No Farm Central, um Centro de Pesquisa é adicionado ao conjunto de sites Company Info. Esse Centro de Pesquisa é configurado com o escopo que permite aos usuários pesquisarem através do farm. Esse Centro de Pesquisa inclui uma página de resultados de pesquisa. Um RSS feed é habilitado para esta página.

  • No Farm Regional, uma conexão de pesquisa federada (texto explicativo A) está configurada para se conectar à página Resultados da Pesquisa do Farm Central. Isso permite que os usuários locais do Farm Regional pesquisem conteúdo no Farm Central.

Em muitos ambientes com vários farms de servidores, nem todo o conteúdo de um farm de servidores será relevante para os usuários localizados perto de outros farms. Por exemplo, políticas da empresa para uma região específica podem se aplicar somente a essa região. Se você souber que existe um subconjunto de conteúdo que seja relevante para usuários de outras regiões, crie um escopo no farm para a pesquisa no subconjunto relevante de conteúdo. Quando criar uma conexão federada para o farm remoto, conecte-se ao mesmo RSS feed da página Resultados da Pesquisa, mas adicione o escopo como um parâmetro de URL. Por exemplo: https://server/searchcenter/_layouts/srchrss.aspx?k={searchTerms}&s=<yourcustomscope>

Para obter mais informações sobre a implementação de um Centro de Pesquisa, consulte o seguinte artigo:

Depois de concluir a criação e configuração de locais de pesquisa federada, será preciso conectá-los a uma Web Part de Resultados Federados para que os usuários possam ver resultados no local exibido em um Centro de Pesquisa. Configure uma Web Part de Resultados Federados diferente para cada farm. Quando configurar as propriedades da Web Part de Resultados Federados, certifique-se de selecionar a opção para processar resultados de forma assíncrona (essa é a configuração padrão). Com essa configuração, os resultados serão exibidos à medida que forem recebidos e os usuários não precisarão esperar por conexões mais lentas para começarem a exibir resultados. Por padrão, se assíncrono não estiver selecionado, os resultados não serão processados até que todos os locais federados tenham retornado os resultados ou tenham o tempo limite esgotado. O tempo limite é definido como 90 segundos e não pode ser alterado.

Uma consideração importante a avaliar ao usar a pesquisa federada é a exclusão dos resultados da pesquisa por motivo de segurança. Por padrão, a filtragem de resultados de pesquisa por motivo de segurança persiste para resultados retornados pelo seguinte:

  • Locais de indexação de pesquisa local (o farm local).

  • Locais de OpenSearch que utilizam credenciais comuns (um único conjunto de credenciais para todos os usuários).

  • Locais OpenSearch que usam a autenticação Kerberos por usuário.

No entanto, as credenciais de usuário não são passadas automaticamente para protocolos de autenticação diferentes de Kerberos. Para garantir que os resultados sejam filtrados por motivo de segurança para o usuário atual nesses cenários, estenda a Web Part de Resultados Federados para coletar credenciais de usuário. Para obter mais informações, consulte o tópico sobre a criação de uma Web Part de Pesquisa Federada personalizada com uma interface do usuário de credenciais (em inglês) (https://go.microsoft.com/fwlink/?linkid=121779\&clcid=0x416) (em inglês).

Além disso, considere o uso da Web Part de Principais Resultados Federados que exibe os principais resultados de vários locais federados. No entanto, essa Web Part está configurada para exibir resultados de forma síncrona e essa configuração não pode ser alterada. Consequentemente, o tempo de carregamento de página é tão rápido quanto o local mais lento configurado na sua Web Part de Principais Resultados Federados. Se a autenticação Kerberos não for usada, você também precisará estender essa Web Part para coletar credenciais de usuário se desejar garantir que os resultados da pesquisa para locais OpenSearch (todos os locais diferentes do farm local) sejam filtrados para cada usuário.

Por fim, embora a pesquisa federada ofereça aos usuários uma exibição de várias fontes de pesquisa, eles estão limitados às opções de pesquisa padrão. As opções de pesquisa avançadas não podem ser usadas com a pesquisa federada.

Usando a pesquisa federada com farms que estejam executando o Windows SharePoint Services

Para usar a pesquisa federada com um farm que esteja executando o Windows SharePoint Services, atualize o farm com o Windows SharePoint Services para o Servidor de Pesquisa 2008 Express ou o Search Server 2008. A atualização oferece a vantagem de oferecer uma pesquisa em todo o farm que esteja executando o Windows SharePoint Services, em vez de um escopo de pesquisa restrito a cada banco de dados de conteúdo. Além disso, o Servidor de Pesquisa é necessário para fornecer RSS feeds nos resultados. O RSS é necessário para criar um local federado OpenSearch para que os resultados de um farm remoto possam ser mostrados na página agregada.

O diagrama a seguir ilustra um ambiente geograficamente distribuído com farms que estão executando o Windows SharePoint Services atualizado para o Search Server 2008 nos locais regionais.

Amb distr geo; farms atualizados em regiões

Resumo da pesquisa federada

Existem muitas vantagens em usar a pesquisa federada em uma implantação geográfica. A pesquisa federada elimina a necessidade de rastreamento ou sincronização de conteúdo em conexões WAN. A exibição de resultados em Web Parts separadas ajuda os usuários a distinguirem onde o conteúdo está localizado, facilitando a identificação de conteúdo local. A compreensão de onde o conteúdo está localizado também pode ajudar um usuário a determinar quais resultados provavelmente são os mais relevantes.

No entanto, existem algumas desvantagens nessa arquitetura. Primeira, a relevância para toda a empresa não pode ser atingida nos resultados da pesquisa. Em vez disso, a relevância tem como escopo cada local federado. Em seguida, o desempenho da consulta para locais remotos está sujeito aos links de WAN. No entanto, normalmente os usuários recebem resultados de pesquisa para o farm local com rapidez.

A tabela a seguir resume as vantagens e desvantagens da arquitetura de pesquisa federada.

Vantagens Desvantagens

Oferece pesquisa em toda a empresa.

Existe uma limitação no número de documentos ou itens que podem ser pesquisados.

Conteúdo não é rastreado ou sincronizado em links de WAN.

O desempenho da consulta é otimizado para o conteúdo local e, ao mesmo tempo, oferece os resultados para o conteúdo remoto.

Os usuários podem pesquisar locais diferentes sem conectar-se em cada localidade separadamente.

Cada armazenamento de conteúdo pode ser gerenciado separadamente.

O Windows SharePoint Services com Search Server 2008 pode ser usado em farms regionais, em vez do Office SharePoint Server.

A filtragem de segurança será preservada para o farm local e para farms remotos se a autenticação Kerberos for usada.

A relevância da pesquisa não abrange toda a empresa. A relevância tem como escopo cada fonte de conteúdo.

A gerência de vários SSPs ou implantações do Search Server 2008 aumenta os custos administrativos.

O desempenho da consulta para locais remotos está sujeito aos links de WAN.

Como o conteúdo não é sincronizado no ambiente, os usuários baixarão documentos por links de WAN durante o horário de pico para utilização de largura de banda.

Os usuários não poderão usar opções de pesquisa avançadas.

Se Kerberos não for usado, preservar a filtragem de segurança dos resultados da pesquisa exigirá a extensão de Web Parts de pesquisa federada.

Baixar este manual

Este tópico está incluído no seguinte manual baixável para facilitar a leitura e a impressão:

Consulte a lista completa de manuais disponíveis na página de download de conteúdo do Office SharePoint Server 2007.

Consulte também

Conceitos

Soluções globais com suporte no Office SharePoint Server
Projetar a arquitetura e governança de informações globais
Planejar requisitos de largura de banda