Gérer les fichiers du dictionnaire de synonymes (SharePoint Server 2010)

 

S’applique à : SharePoint Server 2010

Dernière rubrique modifiée : 2015-03-09

À l’aide des fichiers du dictionnaire des synonymes, un administrateur de recherche peut spécifier des remplacements ou des synonymes pour des mots ou expressions qui apparaissent dans les requêtes de recherche.

  • Spécification de remplacements pour des mots ou expressions de requête   Un administrateur de recherche peut désigner un ou plusieurs mots ou expressions comme remplacements pour des mots ou des expressions spécifiques qu’un utilisateur peut taper dans une zone de recherche. Par exemple, un administrateur peut spécifier que chaque fois que le terme « Longhorn » apparaît dans une requête, le système de recherche le remplace par « Windows Vista » ou « Vista ». De même, un administrateur peut spécifier que chaque fois que le terme « NT5 » ou « W2K » apparaît dans une requête, le système de recherche le remplace par « Windows 2000 ».

    Pour spécifier des remplacements pour des mots ou expressions de requête, l’administrateur de recherche insère un jeu de remplacement dans un fichier du dictionnaire des synonymes. Pour plus d’informations, voir Utilisation de jeux de remplacement plus loin dans cet article.

  • Spécification de synonymes pour des mots ou expressions de requête   Un administrateur de recherche peut spécifier un ou plusieurs mots ou expressions comme synonymes pour un mot ou une expression spécifique qu’un utilisateur peut taper dans une zone de recherche. Par exemple, un administrateur peut spécifier « IE », « IE8 » et « Internet Explorer » comme synonymes les uns des autres. Lorsqu’un de ces termes apparaît dans une requête, le système recherche également les autres termes. Par conséquent, une requête sur un de ces trois termes pourrait renvoyer des résultats de recherche contenant « IE », « IE8 » ou « Internet Explorer ».

    Pour spécifier des synonymes pour des mots ou expressions de requête, l’administrateur de recherche insère un jeu d’expansion dans un fichier du dictionnaire des synonymes. Pour plus d’informations, voir Utilisation de jeux d’expansion plus loin dans cet article.

Dans cet article :

Le programme d’installation de Microsoft SharePoint Server 2010 installe un fichier de dictionnaire des synonymes pour chaque langue que le produit prend en charge. L’installation fournit également le fichier du dictionnaire des synonymes indépendant de la langue, qui est nommé tsneu.xml. Ce fichier est appliqué à toutes les requêtes lors du traitement d’une requête, qu’il existe ou non un fichier de dictionnaire des synonymes spécifique à la langue de la requête. Pour plus d’informations, voir Fichiers du dictionnaire de synonymes par langue plus loin dans cet article.

Par défaut, SharePoint Server 2010 installe les fichiers du dictionnaire des synonymes pour toutes les langues prises en charge à l’emplacement %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Config. Lorsqu’un administrateur de recherche crée une application de service de recherche, le système de recherche copie automatiquement les fichiers du dictionnaire des synonymes à partir de l’emplacement d’installation (y compris tout fichier de dictionnaire des synonymes modifié par un administrateur) à l’emplacement %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Applications\GUID-query-0\Config, où GUID est le GUID de la nouvelle application de service de recherche. Le système de recherche effectue la même opération sur chaque serveur de requête qui exécute la nouvelle application de service de recherche. Par conséquent, il existe une copie de chaque fichier de dictionnaire des synonymes sur chaque serveur de requête qui exécute cette application de service de recherche.

Lors de l’installation, chaque fichier de dictionnaire des synonymes contient uniquement un échantillon de contenu inactif sous forme de commentaires. Par conséquent, vous devez modifier un fichier de dictionnaire des synonymes pour que le système de recherche puisse l’utiliser. Outre les jeux de remplacement et les jeux d’expansion, les fichiers du dictionnaire de synonymes contiennent une balise « diacritics_sensitive » (respect des caractères diacritiques) qui indique si les marques diacritiques telles que les accents sont ignorées ou respectées par le système de recherche. Par défaut, la balise diacritics_sensitive est définie sur 0 afin que les marques diacritiques soient ignorées. Pour que le système de recherche respecte les marques diacritiques, définissez la valeur de la balise diacritics_sensitive sur 1.

L’exemple suivant illustre le code XML par défaut d’un fichier du dictionnaire de synonymes :

<XML ID="Microsoft Search Thesaurus">

<!--  Commented out

    <thesaurus xmlns="x-schema:tsSchema.xml">
        <diacritics_sensitive>0</diacritics_sensitive>
        <expansion>
            <sub>Internet Explorer</sub>
            <sub>IE</sub>
            <sub>IE8</sub>
        </expansion>
        <replacement>
            <pat>NT5</pat>
            <pat>W2K</pat>
            <sub>Windows 2000</sub>
        </replacement>
        <expansion>
            <sub>run</sub>
            <sub>jog</sub>
        </expansion>
    </thesaurus>
-->
</XML>

Un administrateur de recherche insère un jeu de remplacement dans un fichier de dictionnaire des synonymes pour désigner un ou plusieurs mots ou expressions comme remplacements pour des mots ou des expressions spécifiques qu’un utilisateur peut taper dans une zone de recherche. Chaque remplacement défini dans un fichier de dictionnaire des synonymes est placé entre des balises <replacement>. Dans le jeu de remplacement, l’administrateur spécifie un ou plusieurs mots ou expressions de requête à remplacer en plaçant chaque mot ou expression entre des balises <pat> (modèle) et il spécifie un ou plusieurs remplacements en plaçant chaque remplacement entre des balises <sub> (substitution). Par exemple, le jeu de remplacement suivant remplace le terme de requête « Longhorn » par « Windows Vista » ou « Vista » :


<replacement>
    <pat>Longhorn</pat>
    <sub>Windows Vista</sub>
    <sub>Vista</sub>
</replacement>

De même, l’exemple suivant montre un jeu de remplacement qui spécifie que les termes de requête « NT5 » et « W2K » sont remplacés par « Windows 2000 » :


<replacement>
    <pat>W2K</pat>
    <pat>NT5</pat>  
    <sub>Windows 2000</sub>
</replacement>

En définissant un modèle par une substitution vide, l’administrateur de recherche peut indiquer qu’une requête sur un terme spécifique ne retourne aucun résultat. Dans l’exemple suivant, les requêtes sur le terme « bugs » ne retournent aucun résultat :


<replacement>
    <pat>bugs</pat>    
    <sub></sub>
</replacement>

Un administrateur de recherche utilise un jeu d’expansion dans un fichier de dictionnaire des synonymes pour désigner un ou plusieurs mots ou expressions comme synonymes les uns des autres. Une requête de recherche qui contient un mot ou une expression dans le jeu d’expansion est étendue de manière à inclure tous les synonymes du jeu d’expansion. Par conséquent, une requête de recherche qui inclut un mot ou une expression du jeu d’expansion retourne également des résultats de recherche contenant tous les synonymes du jeu.

Chaque jeu d’expansion est placé entre des balises <expansion>. Dans le jeu d’expansion, l’administrateur spécifie un ou plusieurs synonymes en plaçant chaque synonyme entre des balises <sub>. Par exemple, un administrateur de recherche peut spécifier un jeu d’expansion qui désigne les trois termes suivants comme synonymes : writer, author, blogger. Pour spécifier ce jeu d’expansion, l’administrateur de recherche ajoute les lignes suivantes dans le fichier de dictionnaire des synonymes :


<expansion>
    <sub>writer</sub>
    <sub>author</sub>
    <sub>blogger</sub>
</expansion>

Ce jeu d’expansion spécifie qu’une requête sur l’un des trois termes retourne également des résultats de recherche qui contiennent l’un des deux autres termes ou les deux.

Le séparateur de mots associé à une langue donnée identifie les différents mots dans une requête de recherche en déterminant leurs limites en fonction des règles lexicales appliquées dans la langue considérée. Si vous incluez dans un fichier du dictionnaire de synonymes un mot que le séparateur de mots pourrait ne pas le reconnaître en tant que mot unique, vous devez également inclure le mot dans un dictionnaire personnalisé afin que le séparateur de mots ne le scinde pas en sèmes plus petits. Par exemple, si vous utilisez le terme « IT&T » dans un jeu d’expansion, mais que vous ne l’incluez pas dans un dictionnaire personnalisé, le séparateur de mots risque de scinder le terme en trois termes distincts, « IT », « & » et « T ». Cela peut entraîner un dysfonctionnement du jeu d’expansion dans le fichier du dictionnaire de synonymes lorsqu’un utilisateur émet une requête de recherche portant sur « IT&T ». Pour plus d’informations sur la création et l’utilisation de dictionnaires personnalisés, voir Créer un dictionnaire personnalisé (SharePoint Server 2010).

Si vous modifiez un fichier du dictionnaire de synonymes dans l’emplacement d’installation, le système de recherche propage automatiquement le fichier modifié aux applications de service de recherche qui sont créées par la suite. Toutefois, le fichier modifié du dictionnaire de synonymes n’est pas automatiquement propagé aux applications de service de recherche existantes. Pour chaque application de service de recherche existante à laquelle vous souhaitez que les modifications soient appliquées, vous devez copier manuellement le fichier modifié dans le dossier de l’application de service de recherche sur chaque serveur de requête qui exécute cette application de service de recherche.

NoteNote
  • Un fichier nommé tsschema.xml est installé dans le même répertoire que les fichiers du dictionnaire de synonymes. Ne modifiez pas le fichier tsschema.xml. Il est utilisé par tous les autres fichiers du dictionnaire de synonymes. Sa modification pourrait engendrer des résultats imprévisibles.

  • Chaque balise <pat> ou <sub> compte pour un élément dans un fichier de dictionnaire des synonymes. Un fichier de dictionnaire des synonymes typique contient environ 1 000 éléments. Pour des raisons de performances, il est important qu’un fichier de dictionnaire des synonymes ne comporte pas plus de 10 000 éléments environ.

  • Si vous utilisez des mots dans un fichier de dictionnaire des synonymes qui sont spécifiés dans un fichier de mots vides, le système de recherche supprime ces mots du fichier de dictionnaire des synonymes. Pour plus d’informations, voir Gérer les fichiers de mots vides (SharePoint Server 2010).

  • Les entrées du fichier de dictionnaire des synonymes ne doivent pas contenir que des caractères spéciaux.

Utilisez la procédure suivante pour modifier un fichier du dictionnaire de synonymes.

NoteNote
Lors de la modification d’un fichier, vous devez utiliser des paires correspondantes de balises ouvrante et fermante autour de chaque entrée du fichier. Si les balises XML dans le fichier du dictionnaire de synonymes ne correspondent pas correctement, une erreur est consignée dans le journal des événements des applications.
Pour modifier un fichier de dictionnaire de synonymes
  1. Vérifiez que le compte d’utilisateur qui effectue cette procédure est un membre du groupe Administrateurs sur l’ordinateur local.

  2. Ouvrir un fichier de dictionnaire de synonymes dans un éditeur de texte. Pour plus d’informations sur la façon de localiser et d’identifier le fichier de dictionnaire de synonymes approprié, voir Présentation des fichiers du dictionnaire de synonymes plus haut dans cet article.

  3. Si vous modifiez le fichier du dictionnaire de synonymes pour la première fois, supprimez la ligne de commentaire <!-- Commented out au début du fichier, ainsi que la ligne de commentaire --> à la fin du fichier.

  4. Apportez les modifications nécessaires au fichier de dictionnaire des synonymes.

  5. Enregistrez le fichier de dictionnaire des synonymes.

    NoteNote
    Lorsque vous enregistrez un fichier de dictionnaire des synonymes, utilisez toujours la valeur par défaut de Codage, à savoir Unicode.

Une fois que vous avez modifié un fichier de dictionnaire des synonymes, vous devez redémarrer le service SharePoint Server Search 14 pour que les modifications prennent effet. Les modifications apportées au fichier du dictionnaire des synonymes prennent effet après le redémarrage du service SharePoint Server Search 14. Il n’est pas nécessaire d’effectuer une analyse pour que les modifications prennent effet.

Pour redémarrer le service SharePoint Server Search 14
  1. Vérifiez que le compte d’utilisateur qui effectue cette procédure est un membre du groupe Administrateurs sur l’ordinateur local.

  2. Cliquez sur Démarrer, pointez sur Outils d’administration , puis cliquez sur Services.

  3. Cliquez avec le bouton droit sur SharePoint Server Search 14, puis sur Redémarrer.

    Les modifications apportées au fichier du dictionnaire des synonymes prennent effet après le redémarrage du service SharePoint Server Search 14.

Les fichiers du dictionnaire de synonymes suivants sont installés automatiquement et prêts à l’emploi.

 

Langue Nom de fichier

Indépendant de la langue

tsneu.xml

Arabe

tsara.xml

Bengali

tsben.xml

Bulgare

tsbul.xml

Catalan

tscat.xml

Chinois (simplifié)

tschs.xml

Chinois (traditionnel)

tscht.xml

Croate

tscro.xml

Tchèque

tsces.xml

Danois

tsdan

Néerlandais (Pays-Bas)

tsnld.xml

Anglais (Royaume-Uni)

tseng.xml

Anglais (États-Unis)

tsenu.xml

Finnois

tsfin.xml

Français (standard)

tsfra.xml

Allemand (standard)

tsdeu.xml

Gujarati

tsguj.xml

Hongrois

tshun.xml

Islandais

tsice.xml

Indonésien

tsind.xml

Italien

tsita.xml

Japonais

tsjpn.xml

Kannada

tskan.xml

Coréen

tskor.xml

Lituanien

tslit.xml

Malais (Malaisie)

tsmal.xml

Malayalam

tsmly.xml

Marathi

tsmar.xml

Norvégien (Bokmål)

tsnor.xml

Polonais

tsplk.xml

Portugais (Brésil)

tsptb.xml

Portugais (Portugal)

tspor.xml

Pendjabi

tspun.xml

Roumain

tsrom.xml

Russe

tsrus.xml

Serbe (cyrillique)

tssbc.xml

Serbe (latin)

tssbl.xml

Slovaque

tssvk.xml

Slovène

tsslo.xml

Espagnol

tsesn.xml

Suédois

tssve.xml

Tamoul

tstam.xml

Télougou

tstel.xml

Thaï

tstha.xml

Turc

tstur.xml

Ukrainien

tsukr.xml

Ourdou (Pakistan)

tsurd.xml

Vietnamien

tsvie.xml

Afficher: