Modifier un fichier de mots parasites (Office SharePoint Server)
Mise à jour : 2008-12-11
Un mot parasite est un mot qui n’est pas utile dans une recherche, par exemple des mots tels que « le » et « un ». Les fichiers de mots parasites, parfois également appelés fichiers de « mots vides », contiennent des listes de mots à exclure ou à ignorer lorsqu’un utilisateur exécute une requête. Ces listes peuvent inclure des mots non pertinents pour la recherche, comme des conjonctions, des articles, des adjectifs et des adverbes, ainsi que des noms communs, offensants ou inappropriés.
Dans cet article :
Présentation des fichiers de mots parasites
Modification d’un fichier de mots parasites
Liste des fichiers de mots parasites par langue
Présentation des fichiers de mots parasites
Une liste de mots parasites pour une langue est stockée dans le fichier de mots parasites de cette langue. Si une liste de mots parasites n’existe pas pour une langue donnée, Microsoft Office SharePoint Server 2007 utilise le fichier de mots parasites neutre noiseneu.txt. L’analyseur lexical d’une langue donnée identifie les mots individuels en déterminant l’emplacement des limites de mots en fonction des règles lexicales propres à cette langue. Lorsque l’analyseur lexical d’une langue particulière rencontre des mots pendant la période d’indexation ou de requête, il supprime les mots qui figurent dans le fichier de mots parasites. Pour plus d’informations sur les langues prises en charge par les fichiers de mots parasites, voir la section « Liste des fichiers de mots parasites par langue ».
Par défaut, les fichiers de mots parasites sont créés et stockés à l’emplacement suivant sur le serveur de requêtes : Lecteur :\Program Files\Microsoft Office Servers\12.0\Data\Config. Les fichiers de mots parasites issus de cet emplacement par défaut sont copiés à l’emplacement de dossier suivant pour chaque instance du service Microsoft Search qui existe sur le serveur de requêtes : Lecteur :\Program Files\Microsoft Office Servers\12.0\Data\Applications\\<UID d’application>\Config, où <UID d’application> est le GUID associé à chaque instance du service de recherche.
Remarque : |
---|
Si vous modifiez les fichiers de mots parasites situés dans l’emplacement par défaut, la version modifiée des fichiers sera copiée automatiquement chaque fois qu’un nouveau fournisseur de services partagés est créé. Si vous modifiez les fichiers de mots parasites situés dans l’emplacement par défaut après la création d’un fournisseur de services partagés, vous devrez copier les fichiers à partir de l’emplacement par défaut dans le répertoire spécifié pour chaque fournisseur de services partagés qui existe déjà. |
Si vous ajoutez des mots parasites, il se peut que la précision de vos recherches diminue. Toutefois, la taille de l’index de contenu diminue également, ce qui améliore les performances. Vous pouvez supprimer des mots parasites si vous voulez que vos recherches prennent ces mots en compte.
Si vous supprimez des mots du fichier de mots parasites, les modifications ne prendront effet que lors de la réinitialisation de l’index de contenu et de l’exécution d’une analyse complète de tout le contenu incluant les mots clés supprimés. Si vous ajoutez des mots au fichier de mots parasites, il n’est pas nécessaire d’effectuer une analyse complète de tout le contenu, car les mots nouvellement ajoutés ne seront pas recherchés. Toutefois, la taille de l’index ne diminuera pas tant qu’une analyse complète n’aura pas été effectuée.
Ne supprimez pas des fichiers de mots parasites. Si vous ne voulez pas que des mots parasites soient supprimés durant une mise à jour ou une requête, supprimez ces entrées spécifiques du fichier. Si vous supprimez le fichier de mots parasites, tous les caractères uniques seront supprimés en tant que mots parasites.
Modification d’un fichier de mots parasites
Utilisez la procédure suivante pour modifier un fichier de mots parasites.
Modifier un fichier de mots parasites
Démarrez le Bloc-notes, puis ouvrez le fichier de mots parasites. Pour plus d’informations sur la recherche et l’identification du fichier de mots parasites approprié, voir la section « Présentation des fichiers de mots parasites ».
Modifiez la liste de manière à n’inclure que les mots que vous voulez ignorer dans une requête de recherche.
Enregistrez le fichier de mots parasites, puis fermez le Bloc-notes.
Remarque : Lorsque vous enregistrez un fichier de mots parasites modifiés, utilisez toujours la valeur Codage par défaut.
Redémarrez le service Office SharePoint Server Search à l’aide des étapes suivantes :
Cliquez sur Démarrer, pointez sur Outils d’administration, puis cliquez sur Services.
Cliquez avec le bouton droit sur Office SharePoint Server Search, puis cliquez sur Redémarrer.
Pour que la recherche utilise les modifications apportées au fichier de mots parasites, vous devez démarrer une analyse complète de votre source de contenu. Pour plus d’informations sur la manière de procéder, voir Démarrer une analyse complète (Office SharePoint Server 2007).
Liste des fichiers de mots parasites par langue
Office SharePoint Server 2007 contient des fichiers de mots parasites pour les langues suivantes :
Langue | Nom de fichier |
---|---|
Arabe |
noiseara.txt |
Bengali |
noiseben.txt |
Bulgare |
noisebul.txt |
Catalan |
noisecat.txt |
Chinois (simplifié) |
noisechs.txt |
Chinois (traditionnel) |
noisecht.txt |
Croate |
noisecro.txt |
Danois |
noisedan.txt |
Néerlandais (Pays-Bas) |
noisenld.txt |
Anglais (Royaume-Uni) |
noiseeng.txt |
Anglais (États-Unis) |
noiseenu.txt |
Finnois |
noisefin.txt |
Français |
noisefra.txt |
Allemand |
noisedeu.txt |
Grec |
noisegrc.txt |
Gujarati |
noiseguj.txt |
Hébreu |
noiseheb.txt |
Hindi |
noisehin.txt |
Islandais |
noiseice.txt |
Indonésien |
noiseind.txt |
Italien |
noiseita.txt |
Japonais |
noisejpn.txt |
Kannada |
noisekan.txt |
Coréen |
noisekor.txt |
Letton |
noiselat.txt |
Lituanien |
noiselit.txt |
Malais |
noisemal.txt |
Malayalam |
noisemly.txt |
Marathi |
noisemar.txt |
Neutre |
noiseneu.txt |
Norvégien (Bokmål) |
noisenor.txt |
Polonais |
noiseplk.txt |
Polonais |
noisepol.txt |
Portugais |
noisepor.txt |
Portugais (Brésil) |
noiseptb.txt |
Pendjabi |
noisepun.txt |
Roumain |
noiserom.txt |
Russe |
noiserus.txt |
Serbe (cyrillique) |
noisesbc.txt |
Serbe (latin) |
noisesbl.txt |
Slovaque |
noisesvk.txt |
Slovène |
noiseslo.txt |
Espagnol |
noiseesn.txt |
Suédois |
noisesve.txt |
Tamoul |
noisetam.txt |
Télougou |
noisetel.txt |
Thaï |
noisetha.txt |
Turc |
noisetur.txt |
Ukrainien |
noiseurk.txt |
Ourdou (Pakistan) |
noiseurd.txt |