Share via


Sobre fontes de conteúdo (Search Server 2008)

Atualizado em: 2009-04-28

Observação Observação:

Exceto quando especificado, as informações neste artigo aplicam-se tanto ao Microsoft Search Server 2008 como ao Microsoft Search Server 2008 Express.

Conteúdo é qualquer item que pode ser rastreado, como uma página da Web, um documento do Microsoft Office Word, dados corporativos ou mensagens de email. O conteúdo reside um um repositório, como um site, compartilhamento de arquivos ou site do SharePoint. Uma fonte de conteúdo especifica configurações que definem como o conteúdo será rastreado e como será feito o agendamento desse rastreamento. Inclui um ou mais endereços de um repositório de conteúdo de onde será iniciado o rastreamento, também conhecido como endereços iniciais. Essas configurações se aplicam a todos os endereços iniciais de toda a fonte de conteúdo.

Fonte de conteúdo padrão

Se a sua organização precisar rastrear somente o conteúdo dos sites do SharePoint, talvez não seja preciso criar uma fonte de conteúdo adicional. O Search Server 2008 define uma fonte de conteúdo padrão durante a implantação inicial. A fonte de conteúdo padrão é chamada de Local Office SharePoint Server sites. Os endereços iniciais de todos os aplicativos Web do farm de servidores são incluídos automaticamente como parte da fonte de conteúdo padrão. Essa fonte de conteúdo não é rastreada, por padrão. Para indexar o conteúdo da fonte de conteúdo padrão, você terá de iniciar ou agendar rastreamentos para ela manualmente.

Criando uma nova fonte de conteúdo

Quando você cria uma fonte de conteúdo, especifica configurações que definem o tipo de conteúdo que será rastreado, quando o conteúdo será rastreado e o comportamento do rastreamento, como a profundidade a ser rastreada no namespace do endereço inicial ou quantos saltos de servidor serão permitidos. Se houver vários tipos de repositórios de conteúdo a serem rastreados, ou se você quiser rastrear alguns repositórios de conteúdo em agendamentos diferentes, será preciso criar fontes de conteúdo adicionais. O Servidor de Pesquisa tem um Provedor de Serviços Compartilhados (SSP) que dá suporte a até 500 fontes de conteúdo. Para obter mais informações, consulte a seção "Planejar fontes de conteúdo" de Planejar para rastrear conteúdo (Search Server 2008). Para obter mais informações sobre como configurar o comportamento de rastreamento, consulte Limitar ou aumentar a quantidade de conteúdo rastreada (Search Server 2008).

Tipos de repositórios de conteúdo

Você só pode rastrear um tipo de de conteúdo por origem de conteúdo. Ou seja, você pode criar uma origem de conteúdo que contenha URLs para sites do SharePoint e outra que contenha URLs para compartilhamentos de arquivos. Entretanto, não é possível criar uma origem de conteúdo que contenha URLs para sites do SharePoint e compartilhamentos de arquivo.

A tabela a seguir lista os tipos de conteúdo que o Servidor de Pesquisa pode rastrear e indexar:

Este tipo de fonte de conteúdo Inclui este tipo de conteúdo

Sites do SharePoint

  • Sites do SharePoint do mesmo farm ou de farms diferentes de Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 ou Search Server 2008

  • Sites do SharePoint de farms do Microsoft Office SharePoint Portal Server 2003 ou do Microsoft Windows SharePoint Services 2.0

    ObservaçãoObservação:
    O rastreador do Search Server 2008 pode rastrear automaticamente todos os sites e subsites do Office SharePoint Server 2007, do Windows SharePoint Services 3.0 e do Search Server 2008. Ele pode rastrear versões anteriores dos produtos e tecnologias do SharePoint. Mas é preciso especificar a URL de cada site de nível superior (conjunto de sites) e de cada subsite a ser rastreado. Os sites listados no Diretório de Sites dos farms do Microsoft Office SharePoint Portal Server 2003 são rastreados quando o site de portal é rastreado. Para obter mais informações sobre o Diretório de Sites, consulte o artigo sobre o Diretório de Sites (em inglês) (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x416) (em inglês).

Sites

  • Conteúdo da Web na sua organização não encontrado no sites do SharePoint

  • Conteúdo em sites na Internet

    ObservaçãoObservação:
    O rastreador se comporta da mesma maneira com ambos os tipos de conteúdo: sites e sites do SharePoint. A diferença resume-se às configurações do rastreamento que você pode definir para os tipos de conteúdo.

Compartilhamentos de arquivo

  • Conteúdo em compartilhamentos de arquivo em sua organização.

Pastas públicas do Exchange

  • Conteúdo do Microsoft Exchange Server

Lotus Notes

  • Conteúdo armazenado nos bancos de dados do Lotus Notes

    ObservaçãoObservação:
    A opção de fonte de conteúdo Lotus Notes não aparecerá na interface do usuário até que você tenha configurado o servidor de indexação para que ele trabalhe com o Lotus Notes. Para obter mais informações, consulte Preparar para rastrear Lotus Notes (Search Server 2008).

Endereço inicial do conteúdo

Cada fonte de conteúdo mantém uma lista de endereços iniciais que o rastreador usará para se conectar ao repositório de conteúdo. Cada fonte de conteúdo pode conter até 500 endereços iniciais. Você não pode rastrear o mesmo endereço usando várias fontes de conteúdo. Por exemplo, se você usar uma fonte de conteúdo específica para rastrear um conjunto de sites e todos os seus subsites, não poderá usar uma fonte de conteúdo diferente para rastrear um desses subsites separadamente em outro agendamento.

Conteúdo do rastreamento

Você pode usar uma fonte de conteúdo para iniciar manualmente um rastreamento ou agendar o horário e a frequência para rastrear a fonte de conteúdo selecionada. Se desejar rastrear parte da fonte de conteúdo em um agendamento diferente, crie uma fonte de conteúdo separada. Por questões de desempenho e capacidade de gerenciamento, é recomendável usar o mínimo de fontes de conteúdo possível. Para obter mais informações sobre como iniciar ou agendar um rastreamento manualmente, consulte Rastrear conteúdo (Search Server 2008).

Authentication

Quando o rastreador acessa os endereços iniciais listados em uma fonte de conteúdo, deve estar autenticado e ter obtido acesso nos servidores que hospedam esse conteúdo. A conta de usuário utilizada pelo rastreador precisa ter pelo menos a permissão de leitura para rastrear conteúdo. Por padrão, o Servidor de Pesquisa usa a conta de acesso de conteúdo padrão e NTLM na autenticação com servidores. Para obter mais informações, consulte Configurar o modo de autenticação do rastreador (Search Server 2008).

Consulte também

Conceitos

Planejar para rastrear conteúdo (Search Server 2008)
Configurar pesquisas para retornar resultados de postagens no blog (Search Server 2008)
Configurar certificados de cliente para rastrear um site do SSL (Search Server 2008)
Configurar propriedades de Web Parts (Search Server 2008)