Share via


Verwalten von Thesaurusdateien (SharePoint Server 2010)

 

Gilt für: SharePoint Server 2010

Letztes Änderungsdatum des Themas: 2015-03-09

Mithilfe von Thesaurusdateien kann ein Suchadministrator Ersetzungen oder Synonyme für Wörter oder Ausdrücke angeben, die in Suchabfragen vorkommen.

  • Angeben von Ersetzungen für Abfragewörter oder - ausdrücke Ein Suchadministrator kann Wörter oder Ausdrücke als Ersetzungen für bestimmte Wörter oder Ausdrücke festlegen, die ein Benutzer in einem Suchfeld eingibt. Beispielsweise kann ein Administrator angeben, dass der Begriff "Longhorn" in Abfragen vom Suchsystem stets durch "Windows Vista" oder "Vista" ersetzt wird. Entsprechend kann ein Administrator angeben, dass der Begriff "NT5" oder "W2K" in Abfragen vom Suchsystem stets durch "Windows 2000" ersetzt wird.

    Zum Angeben von Ersetzungen für Abfragewörter oder -ausdrücke fügt der Suchadministrator eine Ersetzungsgruppe in eine Thesaurusdatei ein. Weitere Informationen finden Sie unter Verwenden von Ersetzungsgruppen weiter unten in diesem Artikel.

  • Angeben von Synonymen für Abfragewörter oder - ausdrücke Ein Suchadministrator kann Wörter oder Ausdrücke als Synonyme für ein bestimmte Wörter oder Ausdrücke angeben, die ein Benutzer in einem Suchfeld eingibt. Beispielsweise kann ein Administrator "IE", "IE8" und "Internet Explorer" als Synonyme angeben. Wenn einer dieser Begriffe in einer Abfrage vorhanden ist, wird auch nach den anderen Begriffen gesucht. Deshalb könnten für eine Abfrage nach einem dieser drei Begriffe Suchergebnisse zurückgegeben werden, die "IE", "IE8" oder "Internet Explorer" enthalten.

    Zum Angeben von Synonymen für Abfragewörter oder -ausdrücke fügt der Suchadministrator eine Erweiterungsgruppe in eine Thesaurusdatei ein. Weitere Informationen finden Sie unter Verwenden von Erweiterungsgruppen weiter unten in diesem Artikel.

Inhalt dieses Artikels:

  • Grundlegendes zu Thesaurusdateien

  • Verwenden von Ersetzungsgruppen

  • Verwenden von Erweiterungsgruppen

  • Verwenden eines Benutzerwörterbuchs mit einer Thesaurusdatei

  • Bearbeiten einer Thesaurusdatei

  • Liste der Thesaurusdateien nach Sprache

Grundlegendes zu Thesaurusdateien

Das Installationsprogramm von Microsoft SharePoint Server 2010 installiert für jede vom Produkt unterstützt Sprache eine Thesaurusdatei. Bei der Installation wird auch die sprachneutrale Thesaurusdatei (tsneu.xml) bereitgestellt. Diese Datei wird bei der Abfrageverarbeitung auf alle Abfragen angewendet, unabhängig davon, ob eine Thesaurusdatei speziell für die Abfragesprache vorhanden ist. Weitere Informationen finden Sie unter Liste der Thesaurusdateien nach Sprache weiter unten in diesem Artikel.

Standardmäßig werden von SharePoint Server 2010 die Thesaurusdateien für alle unterstützten Sprachen im Verzeichnis %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Config installiert. Wenn ein Suchadministrator eine Suchdienstanwendung erstellt, werden die Thesaurusdateien vom Suchsystem automatisch aus dem Installationsspeicherort (einschließlich aller Thesaurusdateien, die von einem Administrator bearbeitet wurden) in das Verzeichnis %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config kopiert. Dabei steht GUID für die GUID der neuen Suchdienstanwendung. Das Suchsystem führt denselben Vorgang auf jedem Abfrageserver aus, auf dem die neue Suchdienstanwendung ausgeführt wird. Demnach gibt es eine Kopie jeder Thesaurusdatei auf jedem Abfrageserver, auf dem diese Suchdienstanwendung ausgeführt wird.

Bei der Installation enthält jede Thesaurusdatei nur inaktive Beispieldaten in Form von Kommentaren. Deshalb müssen Sie eine Thesaurusdatei bearbeiten, bevor sie vom Suchsystem verwendet werden kann. Thesaurusdateien enthalten neben Ersetzungsgruppen und Erweiterungsgruppen das diacritics_sensitive-Tag, das angibt, ob diakritische Zeichen wie Akzente ignoriert oder vom Suchsystem berücksichtigt werden sollen. Standardmäßig ist diacritics_sensitive auf 0 festgelegt, sodass diakritische Zeichen ignoriert werden. Ändern Sie den Wert von diacritics_sensitive in 1, damit diakritische Zeichen vom Suchsystem berücksichtigt werden.

Das folgende Beispiel veranschaulicht den standardmäßigen XML-Code in einer Thesaurusdatei:

<XML ID="Microsoft Search Thesaurus">

<!--  Commented out

    <thesaurus xmlns="x-schema:tsSchema.xml">
        <diacritics_sensitive>0</diacritics_sensitive>
        <expansion>
            <sub>Internet Explorer</sub>
            <sub>IE</sub>
            <sub>IE8</sub>
        </expansion>
        <replacement>
            <pat>NT5</pat>
            <pat>W2K</pat>
            <sub>Windows 2000</sub>
        </replacement>
        <expansion>
            <sub>run</sub>
            <sub>jog</sub>
        </expansion>
    </thesaurus>
-->
</XML>

Verwenden von Ersetzungsgruppen

Ein Suchadministrator fügt eine Ersetzungsgruppe in eine Thesaurusdatei ein, um Wörter oder Ausdrücke als Ersetzungen für bestimmte Wörter oder Ausdrücke festzulegen, die ein Benutzer in einem Suchfeld eingibt. Jede Ersetzungsgruppe in einer Thesaurusdatei ist in <replacement>-Tags eingeschlossen. In der Ersetzungsgruppe gibt der Administrator zu ersetzende Abfragewörter oder -ausdrücke an, indem er jedes Wort bzw. jeden Ausdruck in <pat>-Tags (pattern) einschließt. Und der Administrator gibt eine oder mehrere Ersetzungen an, indem er jede Ersetzung in <sub>-Tags (substitution) einschließt. Beispielsweise wird mit der folgenden Ersetzungsgruppe der Abfrageausdruck "Longhorn" durch "Windows Vista" oder "Vista" ersetzt:

<replacement>
    <pat>Longhorn</pat>
    <sub>Windows Vista</sub>
    <sub>Vista</sub>
</replacement>

Entsprechend zeigt das folgende Beispiel eine Ersetzungsgruppe, mit der die Abfrageausdrücke "NT5" und "W2K" durch "Windows 2000" ersetzt werden:

<replacement>
    <pat>W2K</pat>
    <pat>NT5</pat>  
    <sub>Windows 2000</sub>
</replacement>

Durch Angabe eines Musters mit einer leeren Ersetzung kann der Administrator festlegen, dass eine Abfrage für einen bestimmten Begriff keine Ergebnisse zurückgibt. Im folgenden Beispiel werden bei Abfragen für den Begriff "bugs" keine Ergebnisse zurückgegeben:

<replacement>
    <pat>bugs</pat>    
    <sub></sub>
</replacement>

Verwenden von Erweiterungsgruppen

Ein Suchadministrator verwendet eine Erweiterungsgruppe in einer Thesaurusdatei, um Wörter oder Ausdrücke als Synonyme festzulegen. Eine Suchabfrage, die eines dieser Wörter oder Ausdrücke in der Erweiterungsgruppe enthält, wird um alle Synonyme in der Erweiterungsgruppe erweitert. Deshalb gibt eine Suchabfrage, die ein Wort oder einen Ausdruck in der Erweiterungsgruppe enthält, auch Suchergebnisse zurück, die Synonyme in der Erweiterungsgruppe enthalten.

Jede Erweiterungsgruppe wird in <expansion>-Tags eingeschlossen. In der Erweiterungsgruppe gibt der Administrator Synonyme an, indem er jedes Synonym in <sub>-Tags einschließt. Beispielsweise könnte ein Suchadministrator eine Erweiterungsgruppe angeben, mit der die folgenden drei Begriffe als Synonyme festgelegt werden: "writer", "author", "blogger". Zur Angabe dieser Erweiterungsgruppe fügt der Suchadministrator der Thesaurusdatei die folgenden Zeilen hinzu:

<expansion>
    <sub>writer</sub>
    <sub>author</sub>
    <sub>blogger</sub>
</expansion>

Diese Erweiterungsgruppe gibt an, dass bei einer Abfrage nach einem dieser drei Begriffe auch Suchergebnisse zurückgegeben werden, die einen oder beide der anderen zwei Begriffe enthalten.

Verwenden eines Benutzerwörterbuchs mit einer Thesaurusdatei

Die Wörtertrennung für eine Sprache erkennt einzelne Wörter in einer Suchabfrage anhand der Wortgrenzen, die in den lexikalischen Regeln der Sprache definiert sind. Wenn Sie einer Thesaurusdatei ein Wort hinzufügen, das von der Wörtertrennung nicht als einzelnes Wort erkannt wird, sollten Sie das Wort zusätzlich einem Benutzerwörterbuch hinzufügen, damit es von der Wörtertrennung nicht in kleinere Token aufgeteilt wird. Wenn Sie beispielsweise den Begriff "IT&T" in einer Erweiterungsgruppe verwenden, ohne ihn einem Benutzerwörterbuch hinzuzufügen, wird er von der Wörtertrennung u. U. in die drei Begriffe "IT", "&" und "T" aufgeteilt. Dies kann ein unerwartetes Verhalten der Erweiterungsgruppe in der Thesaurusdatei beim Ausführen einer Suchabfrage für "IT&T" verursachen. Informationen zum Erstellen und Verwenden von Benutzerwörterbüchern finden Sie unter Erstellen eines Benutzerwörterbuchs (SharePoint Server 2010).

Bearbeiten einer Thesaurusdatei

Wenn Sie eine Thesaurusdatei im Installationsspeicherort bearbeiten, wird die bearbeitete Datei vom Suchsystem automatisch an später erstellte Suchdienstanwendungen verteilt. Die bearbeitete Thesaurusdatei wird jedoch nicht automatisch an vorhandene Suchdienstanwendungen verteilt. Für jede vorhandene Suchdienstanwendung, auf die die Änderungen angewendet werden sollen, müssen Sie die bearbeitete Datei manuell in den Ordner der Suchdienstanwendung auf jedem Abfrageserver, auf dem diese Suchdienstanwendung ausgeführt wird, kopieren.

Hinweis

  • Im selben Verzeichnis wie die Thesaurusdateien wird eine Datei mit dem Namen tsschema.xml installiert. Ändern Sie die Datei tsschema.xml nicht. Sie wird von allen anderen Thesaurusdateien verwendet. Wenn Sie diese Datei ändern, könnte dies unvorhersehbare Ergebnisse zur Folge haben.

  • Jedes <pat>- oder <sub>-Tag zählt als Element in einer Thesaurusdatei. Eine typische Thesaurusdatei enthält etwa 1.000 Elemente. Aus Leistungsgründen sollten in einer Thesaurusdatei nicht mehr als etwa 10.000 Elemente vorhanden sein.

  • Wenn Sie in einer Thesaurusdatei Wörter verwenden, die in einer Stoppwortdatei angegeben sind, werden diese Wörter vom Suchsystem in der Thesaurusdatei herausgefiltert. Weitere Informationen finden Sie unter Verwalten von Füllwortdateien (SharePoint Server 2010).

  • Thesaurusdateieinträge dürfen nicht nur aus Sonderzeichen bestehen.

Gehen Sie folgendermaßen vor, um eine Thesaurusdatei zu bearbeiten.

Hinweis

Beim Bearbeiten einer Datei müssen Sie jeden Eintrag in der Datei zwischen paarweise öffnende und schließende Tags setzen. Wenn die XML-Tags in der Thesaurusdatei nicht übereinstimmen, wird im Anwendungsereignisprotokoll ein Fehler protokolliert.

So bearbeiten Sie eine Thesaurusdatei

  1. Stellen Sie sicher, dass das Benutzerkonto, mit dem dieser Vorgang ausgeführt wird, ein Mitglied der Gruppe Administratoren auf dem lokalen Computer ist.

  2. Öffnen Sie eine Thesaurusdatei in einem Text-Editor. Weitere Informationen zum Suchen und Identifizieren der entsprechenden Thesaurusdatei finden Sie unter Grundlegendes zu Thesaurusdateien weiter oben in diesem Artikel.

  3. Wenn Sie die Thesaurusdatei zum ersten Mal ändern, entfernen Sie die <!-- Commented out-Kommentarzeile am Anfang und die -->-Kommentarzeile am Ende der Datei.

  4. Bearbeiten Sie die Thesaurusdatei nach Bedarf.

  5. Speichern Sie die Thesaurusdatei.

    Hinweis

    Verwenden Sie beim Speichern einer Thesaurusdatei immer den Standardwert Unicode für Codierung.

Neustarten des SharePoint Server Search 14-Diensts

Nach der Bearbeitung einer Thesaurusdatei müssen Sie den SharePoint Server Search 14-Dienst neu starten, damit die Änderungen wirksam werden. Änderungen an einer Thesaurusdatei werden nach dem Neustart des SharePoint Server Search 14-Diensts wirksam. Es ist nicht erforderlich, eine Durchforstung auszuführen, damit die Änderungen wirksam werden.

So starten Sie den SharePoint Server Search 14-Dienst neu

  1. Stellen Sie sicher, dass das Benutzerkonto, mit dem dieser Vorgang ausgeführt wird, ein Mitglied der Gruppe Administratoren auf dem lokalen Computer ist.

  2. Zeigen Sie im Startmenü auf Verwaltung, und klicken Sie dann auf Dienste.

  3. Klicken Sie mit der rechten Maustaste auf SharePoint Server Search 14, und klicken Sie dann auf Neu starten.

    Änderungen an einer Thesaurusdatei werden nach dem Neustart des SharePoint Server Search 14-Diensts wirksam.

Liste der Thesaurusdateien nach Sprache

Die folgenden Thesaurusdateien werden automatisch installiert und können verwendet werden.

Sprache Dateiname

Sprachneutral

tsneu.xml

Arabisch

tsara.xml

Bengali

tsben.xml

Bulgarisch

tsbul.xml

Katalanisch

tscat.xml

Chinesisch (vereinfacht)

tschs.xml

Chinesisch (traditionell)

tscht.xml

Kroatisch

tscro.xml

Tschechisch

tsces.xml

Dänisch

tsdan

Niederländisch (Niederlande)

tsnld.xml

Englisch (Großbritannien)

tseng.xml

Englisch (USA)

tsenu.xml

Finnisch

tsfin.xml

Französisch (Standard)

tsfra.xml

Deutsch (Standard)

tsdeu.xml

Gujarati

tsguj.xml

Ungarisch

tshun.xml

Isländisch

tsice.xml

Indonesisch

tsind.xml

Italienisch

tsita.xml

Japanisch

tsjpn.xml

Kannada

tskan.xml

Koreanisch

tskor.xml

Litauisch

tslit.xml

Malaiisch (Malaysia)

tsmal.xml

Malayalam

tsmly.xml

Marathi

tsmar.xml

Norwegisch (Bokmal)

tsnor.xml

Polnisch

tsplk.xml

Portugiesisch (Brasilien)

tsptb.xml

Portugiesisch (Portugal)

tspor.xml

Pandschabisch

tspun.xml

Rumänisch

tsrom.xml

Russisch

tsrus.xml

Serbisch (Kyrillisch)

tssbc.xml

Serbisch (Lateinisch)

tssbl.xml

Slowakisch

tssvk.xml

Slowenisch

tsslo.xml

Spanisch

tsesn.xml

Schwedisch

tssve.xml

Tamilisch

tstam.xml

Telugu

tstel.xml

Thailändisch

tstha.xml

Türkisch

tstur.xml

Ukrainisch

tsukr.xml

Urdu (Pakistan)

tsurd.xml

Vietnamesisch

tsvie.xml

See Also

Concepts

Erstellen eines Benutzerwörterbuchs (SharePoint Server 2010)
Verwalten von Füllwortdateien (SharePoint Server 2010)