Partager via


À propos des sources de contenu (Search Server 2008)

Mise à jour : 2009-04-28

Note Remarque :

Sauf indication contraire, les informations de cet article s'appliquent à Microsoft Search Server 2008 et à Microsoft Search Server 2008 Express.

Le contenu peut être n’importe quel élément qui peut être analysé, tel qu’une page Web, un document Microsoft Office Word, des données métiers ou un message électronique. Le contenu se trouve dans un référentiel, par exemple un site Web, un partage de fichiers ou un site SharePoint. Une source de contenu spécifie les paramètres qui définissent la méthode et la fréquence de l’analyse du contenu. Elle comporte une ou plusieurs adresses d’un référentiel de contenu pour indiquer le début de l’analyse : ce sont les adresses de départ. Ces paramètres s’appliquent à toutes les adresses de départ situées dans la source de contenu.

Source de contenu par défaut

Si votre organisation a seulement besoin d’analyser le contenu des sites SharePoint, vous ne devez pas forcément créer une source de contenu supplémentaire. Search Server 2008 définit une source de contenu par défaut lors de son déploiement initial. La source de contenu par défaut porte ce nom : Local Office SharePoint Server sites. Les adresses de départ de toutes les applications Web de la batterie de serveurs sont automatiquement incluses comme éléments de la source de contenu par défaut. Par défaut, cette source de contenu par défaut n’est pas analysée. Pour en indexer le contenu, vous devez démarrer ou planifier manuellement des analyses.

Création d’une source de contenu

Lorsque vous créez une source de contenu, vous spécifiez des paramètres qui définissent le genre de contenu analysé, à quel moment le contenu est analysé et le comportement de l’analyse, notamment le degré de profondeur de l’analyse dans l’espace de noms de l’adresse de départ ou le nombre de tronçons de serveur autorisés. Si vous avez plusieurs genres de référentiels de contenu à analyser ou si vous souhaitez analyser des référentiels selon différentes planifications, vous devez créer des sources de contenu supplémentaires. Serveur de recherche possède un fournisseur de services partagés (SSP) qui prend en charge jusqu’à 500 sources de contenu. Pour plus d’informations, voir la section « Planifier les sources de contenu » dans Planification de l'analyse de contenu (Search Server 2008). Pour plus d’informations sur la configuration du comportement de l’analyse, voir Limiter ou augmenter la quantité de contenu analysé (Search Server 2008).

Types de référentiels de contenu

Vous pouvez analyser uniquement un seul genre de contenu par source de contenu. Autrement dit, vous pouvez créer une source de contenu qui contient des URL pour des sites SharePoint et une autre qui contient des URL pour des partages de fichiers, mais vous ne pouvez pas créer une seule source de contenu avec des URL pour des sites SharePoint et des partages de fichiers.

Le tableau suivant récapitule les genres de contenu que Serveur de recherche peut analyser et indexer :

Ce genre de source de contenu Inclut ce genre de contenu

Sites SharePoint

  • Sites SharePoint de la même batterie de serveurs ou de différentes batteries Microsoft Office SharePoint Server 2007, Windows SharePoint Services 3.0 ou Search Server 2008

  • Sites SharePoint de Microsoft Office SharePoint Portal Server 2003 ou batteries de serveurs Microsoft Windows SharePoint Services 2.0

    NoteRemarque :
    Le robot Search Server 2008 peut analyser automatiquement tous les sites et sous-sites Office SharePoint Server 2007, Windows SharePoint Services 3.0 et Search Server 2008. Il peut analyser les versions précédentes des produits et technologies SharePoint. Mais vous devez spécifier l’URL de chaque site de niveau supérieur (collection de sites) et chaque sous-site à analyser. Les sites répertoriés dans l’annuaire de sites des batteries de serveurs Microsoft Office SharePoint Portal Server 2003 sont analysés lorsque le site portail est analysé. Pour plus d’informations sur l’annuaire de sites, voir À propos de l’annuaire de sites (en anglais) (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x40C) (en anglais) .

Sites Web

  • Contenu Web de votre organisation non trouvé dans les sites SharePoint

  • Contenu sur des sites Web sur Internet

    NoteRemarque :
    Le robot se comporte de la même façon, qu’il utilise le type de contenu des sites Web ou le type de contenu des sites SharePoint. Seuls les paramètres d’analyse que vous pouvez configurer pour ces types de sources de contenu diffèrent.

Partages de fichiers

  • Contenu sur des partages de fichiers au sein de votre organisation.

Dossiers publics Exchange

  • Contenu Microsoft Exchange Server

Lotus Notes

  • Contenu stocké dans des bases de données Lotus Notes

    NoteRemarque :
    La source de contenu Lotus Notes n’est pas proposée comme option dans l’interface utilisateur, sauf si vous avez configuré le serveur d’index pour qu’il collabore avec Lotus Notes. Pour plus d’informations, voir Préparer l’analyse Lotus Notes (Search Server 2008).

Adresse de départ du contenu

Chaque source de contenu gère une liste d’adresses de départ que le robot utilise pour se connecter au référentiel de contenu. Chaque source de contenu peut contenir jusqu’à 500 adresses de départ. Vous ne pouvez pas analyser la même adresse avec plusieurs sources de contenu. Par exemple, si vous utilisez une source de contenu particulière pour analyser une collection de sites et tous ses sous-sites, vous ne pouvez pas utiliser une autre source de contenu pour analyser un de ces sous-sites selon une planification différente.

Analyse du contenu

Vous pouvez utiliser une source de contenu pour démarrer manuellement une analyse ou pour planifier le moment et la fréquence de l’analyse de la source de contenu. Pour analyser du contenu dans une partie de la source de contenu en utilisant une planification différente, vous devez créer une source de contenu distincte pour ce contenu. Pour des raisons de performance et de gérabilité, nous vous conseillons d’utiliser aussi peu de sources de contenu que possible. Pour plus d’informations sur le démarrage manuel ou la planification d’une analyse, voir Analyser du contenu (Search Server 2008).

Authentification

Lorsque le robot accède aux adresses de départ répertoriées dans une source de contenu, il doit être authentifié par les serveurs qui hébergent ce contenu et être autorisé à y accéder. Le compte d’utilisateur utilisé par le robot doit avoir au moins l’autorisation de lecture pour analyser le contenu. Par défaut, Serveur de recherche utilise le compte d’accès au contenu par défaut et NTLM pour l’authentification auprès des serveurs. Pour plus d’informations, voir Configurer l’authentification du robot (Search Server 2008).

Voir aussi

Concepts

Planification de l'analyse de contenu (Search Server 2008)
Configurer des recherches destinées à renvoyer des résultats de billets de blog (Search Server 2008)
Configurer des certificats clients pour l’analyse d’un site SSL (Search Server 2008)
Configurer les propriétés des composants WebPart (Search Server 2008)