Modifier un fichier de mots parasites (Office SharePoint Server)

Mise à jour : 2008-12-11

Un mot parasite est un mot qui n’est pas utile dans une recherche, par exemple des mots tels que « le » et « un ». Les fichiers de mots parasites, parfois également appelés fichiers de « mots vides », contiennent des listes de mots à exclure ou à ignorer lorsqu’un utilisateur exécute une requête. Ces listes peuvent inclure des mots non pertinents pour la recherche, comme des conjonctions, des articles, des adjectifs et des adverbes, ainsi que des noms communs, offensants ou inappropriés.

Dans cet article :

  • Présentation des fichiers de mots parasites

  • Modification d’un fichier de mots parasites

  • Liste des fichiers de mots parasites par langue

Présentation des fichiers de mots parasites

Une liste de mots parasites pour une langue est stockée dans le fichier de mots parasites de cette langue. Si une liste de mots parasites n’existe pas pour une langue donnée, Microsoft Office SharePoint Server 2007 utilise le fichier de mots parasites neutre noiseneu.txt. L’analyseur lexical d’une langue donnée identifie les mots individuels en déterminant l’emplacement des limites de mots en fonction des règles lexicales propres à cette langue. Lorsque l’analyseur lexical d’une langue particulière rencontre des mots pendant la période d’indexation ou de requête, il supprime les mots qui figurent dans le fichier de mots parasites. Pour plus d’informations sur les langues prises en charge par les fichiers de mots parasites, voir la section « Liste des fichiers de mots parasites par langue ».

Par défaut, les fichiers de mots parasites sont créés et stockés à l’emplacement suivant sur le serveur de requêtes : Lecteur :\Program Files\Microsoft Office Servers\12.0\Data\Config. Les fichiers de mots parasites issus de cet emplacement par défaut sont copiés à l’emplacement de dossier suivant pour chaque instance du service Microsoft Search qui existe sur le serveur de requêtes : Lecteur :\Program Files\Microsoft Office Servers\12.0\Data\Applications\\<UID d’application>\Config, où <UID d’application> est le GUID associé à chaque instance du service de recherche.

NoteRemarque :

Si vous modifiez les fichiers de mots parasites situés dans l’emplacement par défaut, la version modifiée des fichiers sera copiée automatiquement chaque fois qu’un nouveau fournisseur de services partagés est créé. Si vous modifiez les fichiers de mots parasites situés dans l’emplacement par défaut après la création d’un fournisseur de services partagés, vous devrez copier les fichiers à partir de l’emplacement par défaut dans le répertoire spécifié pour chaque fournisseur de services partagés qui existe déjà.

Si vous ajoutez des mots parasites, il se peut que la précision de vos recherches diminue. Toutefois, la taille de l’index de contenu diminue également, ce qui améliore les performances. Vous pouvez supprimer des mots parasites si vous voulez que vos recherches prennent ces mots en compte.

Si vous supprimez des mots du fichier de mots parasites, les modifications ne prendront effet que lors de la réinitialisation de l’index de contenu et de l’exécution d’une analyse complète de tout le contenu incluant les mots clés supprimés. Si vous ajoutez des mots au fichier de mots parasites, il n’est pas nécessaire d’effectuer une analyse complète de tout le contenu, car les mots nouvellement ajoutés ne seront pas recherchés. Toutefois, la taille de l’index ne diminuera pas tant qu’une analyse complète n’aura pas été effectuée.

Ne supprimez pas des fichiers de mots parasites. Si vous ne voulez pas que des mots parasites soient supprimés durant une mise à jour ou une requête, supprimez ces entrées spécifiques du fichier. Si vous supprimez le fichier de mots parasites, tous les caractères uniques seront supprimés en tant que mots parasites.

Modification d’un fichier de mots parasites

Utilisez la procédure suivante pour modifier un fichier de mots parasites.

Modifier un fichier de mots parasites

  1. Démarrez le Bloc-notes, puis ouvrez le fichier de mots parasites. Pour plus d’informations sur la recherche et l’identification du fichier de mots parasites approprié, voir la section « Présentation des fichiers de mots parasites ».

  2. Modifiez la liste de manière à n’inclure que les mots que vous voulez ignorer dans une requête de recherche.

  3. Enregistrez le fichier de mots parasites, puis fermez le Bloc-notes.

    NoteRemarque :

    Lorsque vous enregistrez un fichier de mots parasites modifiés, utilisez toujours la valeur Codage par défaut.

  4. Redémarrez le service Office SharePoint Server Search à l’aide des étapes suivantes :

    1. Cliquez sur Démarrer, pointez sur Outils d’administration, puis cliquez sur Services.

    2. Cliquez avec le bouton droit sur Office SharePoint Server Search, puis cliquez sur Redémarrer.

  5. Pour que la recherche utilise les modifications apportées au fichier de mots parasites, vous devez démarrer une analyse complète de votre source de contenu. Pour plus d’informations sur la manière de procéder, voir Démarrer une analyse complète (Office SharePoint Server 2007).

Liste des fichiers de mots parasites par langue

Office SharePoint Server 2007 contient des fichiers de mots parasites pour les langues suivantes :

Langue Nom de fichier

Arabe

noiseara.txt

Bengali

noiseben.txt

Bulgare

noisebul.txt

Catalan

noisecat.txt

Chinois (simplifié)

noisechs.txt

Chinois (traditionnel)

noisecht.txt

Croate

noisecro.txt

Danois

noisedan.txt

Néerlandais (Pays-Bas)

noisenld.txt

Anglais (Royaume-Uni)

noiseeng.txt

Anglais (États-Unis)

noiseenu.txt

Finnois

noisefin.txt

Français

noisefra.txt

Allemand

noisedeu.txt

Grec

noisegrc.txt

Gujarati

noiseguj.txt

Hébreu

noiseheb.txt

Hindi

noisehin.txt

Islandais

noiseice.txt

Indonésien

noiseind.txt

Italien

noiseita.txt

Japonais

noisejpn.txt

Kannada

noisekan.txt

Coréen

noisekor.txt

Letton

noiselat.txt

Lituanien

noiselit.txt

Malais

noisemal.txt

Malayalam

noisemly.txt

Marathi

noisemar.txt

Neutre

noiseneu.txt

Norvégien (Bokmål)

noisenor.txt

Polonais

noiseplk.txt

Polonais

noisepol.txt

Portugais

noisepor.txt

Portugais (Brésil)

noiseptb.txt

Pendjabi

noisepun.txt

Roumain

noiserom.txt

Russe

noiserus.txt

Serbe (cyrillique)

noisesbc.txt

Serbe (latin)

noisesbl.txt

Slovaque

noisesvk.txt

Slovène

noiseslo.txt

Espagnol

noiseesn.txt

Suédois

noisesve.txt

Tamoul

noisetam.txt

Télougou

noisetel.txt

Thaï

noisetha.txt

Turc

noisetur.txt

Ukrainien

noiseurk.txt

Ourdou (Pakistan)

noiseurd.txt