Gérer les fichiers de mots vides (SharePoint Server 2010)

 

S’applique à : SharePoint Server 2010

Dernière rubrique modifiée : 2015-03-09

Un mot vide, ou mot parasite, est un mot qui est ignoré par le système de recherche dans les requêtes de recherche effectuées par l’utilisateur final. Un mot peut être désigné comme mot vide lorsqu’il apparaît si souvent dans une langue que son utilité est improbable dans l’identification ou l’affinage des résultats de recherche. Par exemple, des articles tels que « un » et « le » sont généralement spécifiés comme mots vides pour le français. Si un utilisateur tape la requête « la montagne la plus haute », « le » est supprimé de la requête s’il s’agit d’un mot vide, de sorte que la requête devient « montagne plus haute ». Les mots potentiellement injurieux sont également parfois désignés comme mots vides.

Dans cet article :

  • Présentation des fichiers de mots vides

  • Modifier un fichier de mots vides

  • Fichiers de mots vides par langue

Présentation des fichiers de mots vides

Les mots vides pour une langue donnée sont répertoriés dans le fichier de mots vides associé à cette langue. Le programme d’installation de Microsoft SharePoint Server 2010 installe automatiquement un fichier de mots vides pour chaque langue prise en charge par le produit. Suite à l’installation, une grande partie des fichiers de mots vides contiennent certains mots vides par défaut pour la langue associée. Par exemple, par défaut le fichier de mots vides pour l’anglais (États-Unis) (noiseenu.txt) contient les mots a, and, is, in, it, of, the, to. À tout moment après l’installation du produit, l’administrateur de recherche peut ajouter ou supprimer des mots dans un fichier de mots vides afin d’améliorer la pertinence des résultats de recherche ou afin de répondre aux exigences de l’organisation. Pour plus d’informations sur l’ajout ou la suppression de mots vides dans un fichier de mots vides, voir Modifier un fichier de mots vides plus loin dans cet article. Pour plus d’informations sur les langues prises en charge, voir Fichiers de mots vides par langue plus loin dans cet article.

Lors de la requête, l’analyseur lexical de la langue de la requête identifie les mots individuels en déterminant l’emplacement des limites de mots en fonction des règles lexicales propres à cette langue. Il supprime ensuite les mots de la requête qui figurent dans le fichier de mots vides.

Par défaut, les fichiers de mots vides pour toutes les langues prises en charge sont installés dans %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config. Lorsqu’un administrateur de batterie crée une application de service de recherche, le système de recherche copie automatiquement les fichiers de mots vides à partir de l’emplacement d’installation (y compris tout fichier de mots vides modifié par un administrateur de recherche) vers %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config, où GUID est le GUID de la nouvelle application de service de recherche. Le système de recherche effectue la même opération sur chaque serveur de requête qui exécute la nouvelle application de service de recherche. Ainsi, il existe une copie de chaque fichier de mots vides sur chaque serveur de requête qui exécute cette application de service de recherche.

Modifier un fichier de mots vides

Si vous modifiez un fichier de mots vides à l’emplacement d’installation, le système propage automatiquement le fichier de mots vides modifié vers les applications de service de recherche qui sont créées par la suite. En revanche, le fichier de mots vides modifié n’est pas propagé automatiquement vers les applications de service de recherche existantes. Pour chaque application de service de recherche existante à laquelle vous souhaitez appliquer les modifications, vous devez copier manuellement le fichier modifié vers le dossier d’application de service de recherche sur chaque serveur de requête qui exécute l’application de service de recherche.

Notes

  • Si vous supprimez un fichier de mots vides, le système de recherche risque de considérer tous les caractères uniques comme des mots vides et de les supprimer des résultats de recherche. Un fichier de mots vides doit contenir au moins une entrée, même s’il s’agit d’un simple point (.).

  • Si vous supprimez un fichier de mots vides et redémarrez ensuite le service SharePoint Server Search 14, le système de recherche remplace automatiquement le fichier en copiant le fichier du même nom à partir de %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config vers le dossier où le fichier a été supprimé.

Appliquez la procédure suivante pour modifier un fichier de mots vides.

Pour modifier un fichier de mots vides

  1. Vérifiez que le compte d’utilisateur qui exécute cette procédure est membre du groupe Administrateurs du serveur local.

  2. Ouvrez le fichier de mots vides dans un éditeur de texte. Pour plus d’informations sur la recherche et l’identification du fichier de mots vides approprié, voir Présentation des fichiers de mots vides plus haut dans cet article.

  3. Modifiez le fichier de manière à n’inclure que les mots qui doivent être ignorés par le système de recherche dans les requêtes de recherche.

  4. Enregistrez le fichier de mots vides.

    Notes

    Lorsque vous enregistrez un fichier de mots vides, utilisez toujours la valeur Codage par défaut, à savoir Unicode.

  5. Redémarrez le service SharePoint Server Search 14 à l’aide des étapes suivantes :

    1. Cliquez sur Démarrer, pointez sur Outils d’administration, puis cliquez sur Services.

    2. Cliquez avec le bouton droit sur SharePoint Server Search 14, puis cliquez sur Redémarrer.

      Les modifications de mots vides prennent effet après le redémarrage du service SharePoint Server Search 14.

      Notes

      Dans Microsoft Office SharePoint Server 2007, le système de recherche excluait les mots vides des requêtes et de l’index. Par conséquent, après la suppression par un administrateur d’un mot dans un fichier de mots vides, il était nécessaire d’effectuer une analyse complète afin d’indexer toute instance de ce mot vide susceptible d’être rencontrée par le robot. Par contraste, dans SharePoint Server 2010, le système de recherche exclut les mots vides des requêtes, mais par conception il n’exclut pas les mots vides de l’index. Par conséquent, dans SharePoint Server 2010, si vous supprimez un mot d’un fichier de mots vides, il n’est pas nécessaire d’effectuer de nouvelle analyse car le mot vide figure déjà dans l’index s’il a été rencontré durant une analyse. (Si vous ajoutez un mot à un fichier de mots vides, il est également inutile d’effectuer une nouvelle analyse car le système de recherche ne recherche pas de mots vides dans l’index.)

Fichiers de mots vides par langue

Lorsque vous installez SharePoint Server 2010, les fichiers de mots vides sont installés pour les langues suivantes. Si un fichier de mots vides n’existe pas pour une langue, le système de recherche utilise le fichier de mots vides neutre noiseneu.txt.

Langue Nom du fichier de mots vides

Arabe

noiseara.txt

Bengali

noiseben.txt

Bulgare

noisebul.txt

Catalan

noisecat.txt

Tchèque

noiseces.txt

Chinois (simplifié)

noisechs.txt

Chinois (traditionnel)

noisecht.txt

Croate

noisecro.txt

Danois

noisedan.txt

Néerlandais (Pays-Bas)

noisenld.txt

Anglais (Royaume-Uni)

noiseeng.txt

Anglais (États-Unis)

noiseenu.txt

Finnois

noisefin.txt

Français

noisefra.txt

Allemand

noisedeu.txt

Grec

noisegrc.txt

Gujarati

noiseguj.txt

Hébreu

noiseheb.txt

Hindi

noisehin.txt

Hongrois

noisehun.txt

Islandais

noiseice.txt

Indonésien

noiseind.txt

Italien

noiseita.txt

Japonais

noisejpn.txt

Kannada

noisekan.txt

Coréen

noisekor.txt

Langue neutre

noiseneu.txt

Letton

noiselav.txt

Lituanien

noiselit.txt

Malais

noisemal.txt

Malayalam

noisemly.txt

Marathi

noisemar.txt

Norvégien (Bokmål)

noisenor.txt

Polonais

noiseplk.txt

Portugais (Portugal)

noisepor.txt

Portugais (Brésil)

noiseptb.txt

Pendjabi

noisepun.txt

Roumain

noiserom.txt

Russe

noiserus.txt

Serbe (cyrillique)

noisesbc.txt

Serbe (latin)

noisesbl.txt

Slovaque

noisesvk.txt

Slovène

noiseslo.txt

Espagnol

noiseesn.txt

Suédois

noisesve.txt

Tamoul

noisetam.txt

Télougou

noisetel.txt

Thaï

noisetha.txt

Turc

noisetur.txt

Ukrainien

noiseurk.txt

Ourdou (Pakistan)

noiseurd.txt

Vietnamien

noisevie.txt