Condividi tramite


Procedura: Modifica di un file del thesaurus (ricerca full-text)

È possibile configurare il thesaurus per una lingua specifica modificando il relativo file XML. Durante l'installazione vengono installati file del thesaurus vuoti che contengono solo il contenitore <xml> e un elemento <thesaurus> di esempio costituito da commenti. Ai fini della corretta esecuzione delle query di ricerca full-text per la ricerca di sinonimi, è necessario creare un elemento <thesaurus> effettivo che definisca un set di sinonimi. È possibile definire due forme di sinonimi, i set di espansione e i set di sostituzione. Per informazioni sulla posizione e la struttura di un file del thesaurus, vedere Configurazione del thesaurus.

Restrizioni relative ai file del thesaurus

Alla modifica di un file del thesaurus si applicano le restrizioni seguenti:

  • Solo gli amministratori di sistema possono aggiornare, modificare o eliminare i file del thesaurus.

  • Quando si utilizzano editor di testo per modificare i file del thesaurus, è necessario salvare i file in formato Unicode e specificare gli indicatori per l'ordine dei byte (BOM).

  • Le voci del thesaurus non possono essere vuote e non è possibile eseguirne il word breaking in una stringa vuota.

  • Le frasi nel file del thesaurus non devono essere costituite da più di 512 caratteri.

  • Un thesaurus non deve contenere alcuna voce duplicata fra le voci <sub> dei set di espansione e gli elementi <pat> dei set di sostituzione.

Indicazioni per i file del thesaurus

È consigliabile che le voci del file del thesaurus non contengano caratteri speciali, in quanto i word breaker rivelano comportamenti imprevedibili in presenza di tale tipo di caratteri. Se una voce del thesaurus contiene un carattere speciale, i word breaker utilizzati in combinazione con la voce possono avere un comportamento imprevisto con implicazioni su una query full-text.

È consigliabile che le voci <sub> non contengano parole non significative, in quanto tali parole vengono omesse dall'indice full-text. Le query vengono espanse per includere le voci <sub> da un file del thesaurus e se una voce <sub> contiene parole non significative, le dimensioni della query aumentano inutilmente.

Per modificare un file del thesaurus

  1. Aprire il file del thesaurus nel Blocco note.

  2. Se si modifica un file del thesaurus per la prima volta, rimuovere le righe di commento seguenti all'inizio e alla fine del file, rispettivamente:

    <!--Commented out
    -->
    
  3. Aggiungere, modificare o eliminare un set di sostituzione o set di espansione. Per ulteriori informazioni, vedere Configurazione del thesaurus.

  4. Salvare il file e chiudere il Blocco note.

  5. Utilizzare sp_fulltext_load_thesaurus_file per caricare il contenuto del file del thesaurus in tempdb, specificando l'identificatore LCID corrispondente alla lingua del file del thesaurus. Per il file del thesaurus per la lingua inglese, denominato tsenu.xml, l'identificatore LCID corrispondente è 1033.

    USE AdventureWorks2008R2 ;
    EXEC sys.sp_fulltext_load_thesaurus_file 1033;
    GO