シソーラス ファイルを管理する (SharePoint Server 2010)

 

適用先: SharePoint Server 2010

トピックの最終更新日: 2015-03-09

シソーラス ファイルを使用して、検索の管理者は、検索クエリ内の語句の置換語句または類義語を指定できます。

  • クエリ語句の置換の指定   検索の管理者は、ユーザーが検索ボックスに入力する特定の語句の置換語句として、1 つまたは複数の語句を指定できます。たとえば、管理者は、クエリに "Longhorn" という語が含まれる場合に検索システムでそれらを "Windows Vista" または "Vista" に置換することを指定したり、クエリに "NT5" または "W2K" という語が含まれる場合に検索システムでそれらを "Windows 2000" に置換することを指定したりできます。

    クエリ語句の置換を指定するには、検索の管理者は、シソーラス ファイルに "置換セット" を挿入します。詳細については、後の「置換セットを使用する」を参照してください。

  • クエリ語句の類義語の指定   検索の管理者は、ユーザーが検索ボックスに入力する特定の語句の類義語として、1 つまたは複数の語句を指定できます。たとえば、管理者は、"IE"、"IE8"、および "Internet Explorer" を相互に類義語として指定できます。これらのいずれかがクエリに含まれる場合、システムでは残りの類義語も検索されます。したがって、これら 3 つの語のいずれかを検索するクエリの検索結果には、"IE"、"IE8"、または "Internet Explorer" の検索結果も含まれます。

    クエリ語句の類義語を指定するには、検索の管理者は、シソーラス ファイルに "拡張セット" を挿入します。詳細については、後の「拡張セットを使用する」を参照してください。

この記事の内容 :

  • シソーラス ファイルについて

  • 置換セットを使用する

  • 拡張セットを使用する

  • ユーザー辞書とシソーラス ファイルの併用

  • シソーラス ファイルを編集する

  • 言語別のシソーラス ファイル

シソーラス ファイルについて

Microsoft SharePoint Server 2010 のインストール プログラムでは、製品がサポートする各言語のシソーラス ファイルがインストールされます。また、言語に依存しないシソーラス ファイル tsneu.xml もインストールされます。このファイルは、クエリの言語に対応する特定のシソーラス ファイルがあるかどうかにかかわらず、すべてのクエリの処理時に必ず適用されます。詳細については、この記事で後述する「言語別のシソーラス ファイル」を参照してください。

既定では、SharePoint Server 2010 によって、サポートされているすべての言語のシソーラス ファイルが %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Config にインストールされます。検索の管理者が Search Service アプリケーションを作成すると、検索システムによって、シソーラス ファイルがインストール場所から (管理者がその場所で編集したシソーラス ファイルも含めて) %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Applications\GUID-query-0\Config に自動的にコピーされます (GUID は、新しい Search Service アプリケーションの GUID です)。これは、その新しい Search Service アプリケーションが実行されるすべてのクエリ サーバーにコピーされます。したがって、その Search Service アプリケーションが実行されるクエリ サーバーごとにそれぞれシソーラス ファイルのコピーが存在するようになります。

インストールの段階では、各シソーラス ファイルには、非アクティブなサンプル コンテンツのみがコメントとして含まれています。したがって、検索システムで使用する前に、シソーラス ファイルを編集する必要があります。シソーラス ファイルには、置換セットと拡張セットに加えて、"diacritics_sensitive” タグが含まれています。このタグは、アクセントなどの分音記号を検索システムで無視するか反映するかを表します。既定では、diacritics_sensitive は 0 に設定されているため、分音記号は無視されます。検索システムで分音記号を反映させるには、diacritics_sensitive の値を 1 に変更します。

シソーラス ファイル内の既定の XML の例を次に示します。

<XML ID="Microsoft Search Thesaurus">

<!--  Commented out

    <thesaurus xmlns="x-schema:tsSchema.xml">
        <diacritics_sensitive>0</diacritics_sensitive>
        <expansion>
            <sub>Internet Explorer</sub>
            <sub>IE</sub>
            <sub>IE8</sub>
        </expansion>
        <replacement>
            <pat>NT5</pat>
            <pat>W2K</pat>
            <sub>Windows 2000</sub>
        </replacement>
        <expansion>
            <sub>run</sub>
            <sub>jog</sub>
        </expansion>
    </thesaurus>
-->
</XML>

置換セットを使用する

検索の管理者は、シソーラス ファイルに "置換セット" を挿入して、ユーザーが検索ボックスに入力する特定の語句の置換語句となる 1 つ以上の語句を指定できます。シソーラス ファイル内の各置換セットは、<replacement> タグで囲みます。置換セット内では、置換する各クエリ語句を <pat> (pattern: パターン) タグで囲んで 1 つ以上の対象語句を指定し、各置換語句を <sub> (substitution: 代替文字列) タグで囲んで 1 つ以上の置換語句を指定します。たとえば、以下の置換セットでは、クエリ内の語 "Longhorn" を "Windows Vista" または "Vista" に置換します。

<replacement>
    <pat>Longhorn</pat>
    <sub>Windows Vista</sub>
    <sub>Vista</sub>
</replacement>

同様に、以下の例は、クエリ内の語 "NT5" および "W2K" を "Windows 2000" に置き換える置換セットを示します。

<replacement>
    <pat>W2K</pat>
    <pat>NT5</pat>  
    <sub>Windows 2000</sub>
</replacement>

検索の管理者は、あるパターンに対して空の代替文字列を指定することによって、特定の語句のクエリからは結果が返されないように指定できます。以下の例では、"bugs" という語に対するクエリの結果は返されません。

<replacement>
    <pat>bugs</pat>    
    <sub></sub>
</replacement>

拡張セットを使用する

検索の管理者は、シソーラス ファイル内で "拡張セット" を使用して、相互に類義語となる 1 つ以上の語句を指定できます。拡張セット内の語句が含まれるクエリは、その拡張セット内のすべての類義語を含むように拡張されます。したがって、拡張セット内の語句が含まれる検索クエリからは、それらの類義語も含まれる検索結果が返されます。

各拡張セットは <expansion> タグで囲みます。拡張セット内では、各類義語を <sub> タグで囲んで 1 つ以上の類義語を指定します。たとえば、検索の管理者が、"writer"、"author"、および "blogger" という 3 つの語を類義語として指定する拡張セットを指定するとします。この拡張セットを指定するには、シソーラス ファイルに以下の行を追加します。

<expansion>
    <sub>writer</sub>
    <sub>author</sub>
    <sub>blogger</sub>
</expansion>

この拡張セットは、これら 3 つの語のいずれかを検索するクエリでは、残りの 2 つの語のどちらかまたは両方が含まれる検索結果も返されることを指定します。

ユーザー辞書とシソーラス ファイルの併用

特定の言語のワード ブレーカーは、言語の語彙規則に基づいて単語境界が存在する箇所を決定することにより、検索クエリの個々の単語を識別します。ワード ブレーカーで 1 つの単語として認識されない単語をシソーラス ファイルに追加する場合は、ワード ブレーカーによって単語がさらに細かいトークンに分割されないように、ユーザー定義の辞書にもその単語を追加する必要があります。たとえば、拡張セットで "IT&T" という言葉を使用しており、ユーザー定義の辞書にその言葉を追加していない場合、ワード ブレーカーによってその言葉が "IT"、"&"、および "T" という別々の 3 つの単語に分割される可能性があります。この結果、ユーザーが "IT&T" の検索クエリを発行したときに、シソーラス ファイルの拡張セットが予期したとおりに動作しない可能性があります。ユーザー定義の辞書を作成および使用する方法の詳細については、「ユーザー辞書を作成する (SharePoint Server 2010)」を参照してください。

シソーラス ファイルを編集する

インストール場所にあるシソーラス ファイルを編集すると、それ以降に作成された Search Service アプリケーションには、編集したシソーラス ファイルが自動的にコピーされます。ただし、既存の Search Service アプリケーションには、編集したシソーラス ファイルは自動的にはコピーされません。既存の Search Service アプリケーションにも変更を適用するには、その Search Service アプリケーションを実行する各クエリ サーバーの Search Service アプリケーション フォルダーに、編集したシソーラス ファイルを手動でコピーする必要があります。

注意

  • tsschema.xml という名前のファイルがシソーラス ファイルと同じディレクトリにインストールされます。tsschema.xml ファイルは変更しないでください。このファイルは、その他すべてのシソーラス ファイルが使用します。このファイルを変更すると、予期しない結果が生じる場合があります。

  • シソーラス ファイル内の <pat> タグまたは <sub> タグは、それぞれが 1 つのアイテムとして見なされます。通常のシソーラス ファイルでは、1 ファイルに約 1,000 個のアイテムが含まれます。パフォーマンスの観点から、1 つのシソーラス ファイル内のアイテム数が約 10,000 個を超えないようにすることが重要です。

  • ストップ ワード ファイルに指定されている語をシソーラス ファイルに使用すると、検索システムによって、それらの語はシソーラス ファイルから除外されます。詳細については、「ストップ ワード ファイルを管理する (SharePoint Server 2010)」を参照してください。

  • シソーラス ファイルのエントリに、特殊文字だけを含めることはできません。

シソーラス ファイルを編集するには、次の手順を使用します。

注意

ファイルを編集するときは、ファイル内の各エントリを開始タグおよび終了タグの整合するペアで囲む必要があります。シソーラス ファイル内の XML タグが正しく整合しない場合、アプリケーション イベント ログにエラーが記録されます。

シソーラス ファイルを編集するには

  1. この手順を実行するユーザー アカウントがローカル コンピューターの Administrators グループに属するメンバーであることを確認します。

  2. テキスト エディターでシソーラス ファイルを開きます。適切なシソーラス ファイルおよびその場所を特定する方法については、前の「シソーラス ファイルについて」を参照してください。

  3. シソーラス ファイルを初めて変更する場合は、ファイルの先頭の <!-- Commented out コメント行と、ファイルの末尾の --> コメント行を削除します。

  4. 必要に応じて、シソーラス ファイルを編集します。

  5. シソーラス ファイルを保存します。

    注意

    シソーラス ファイルを保存するときは、必ず既定のエンコードUnicode を使用してください。

SharePoint Server Search 14 サービスを再起動する

シソーラス ファイルを編集した後、その変更内容を有効にするには、SharePoint Server Search 14 サービスを再起動する必要があります。シソーラス ファイルの変更内容は、SharePoint Server Search 14 サービスの再起動後に有効になります。変更内容を有効にするために、クロールを実行する必要はありません。

SharePoint Server Search 14 サービスを再起動するには

  1. この手順を実行するユーザー アカウントがローカル コンピューターの Administrators グループに属するメンバーであることを確認します。

  2. [スタート] ボタンをクリックして [管理ツール] をポイントし、[サービス] をクリックします。

  3. [SharePoint Server Search 14] を右クリックし、[再起動] をクリックします。

    シソーラス ファイルの変更内容は、SharePoint Server Search 14 サービスの再起動後に有効になります。

言語別のシソーラス ファイル

自動的にインストールされて使用可能になるシソーラス ファイルは、以下のとおりです。

言語 ファイル名

言語に依存しない

tsneu.xml

アラビア語

tsara.xml

ベンガル語

tsben.xml

ブルガリア語

tsbul.xml

カタルニア語

tscat.xml

簡体字中国語

tschs.xml

繁体字中国語

tscht.xml

クロアチア語

tscro.xml

チェコ語

tsces.xml

デンマーク語

tsdan

オランダ語 (オランダ)

tsnld.xml

英語 (英国)

tseng.xml

英語 (米国)

tsenu.xml

フィンランド語

tsfin.xml

フランス語 (標準)

tsfra.xml

ドイツ語 (標準)

tsdeu.xml

グジャラート語

tsguj.xml

ハンガリー語

tshun.xml

アイスランド語

tsice.xml

インドネシア語

tsind.xml

イタリア語

tsita.xml

日本語

tsjpn.xml

カンナダ語

tskan.xml

韓国語

tskor.xml

リトアニア語

tslit.xml

マレー語 (マレーシア)

tsmal.xml

マラヤーラム語

tsmly.xml

マラーティー語

tsmar.xml

ノルウェー語 (ブークモール)

tsnor.xml

ポーランド語

tsplk.xml

ポルトガル語 (ブラジル)

tsptb.xml

ポルトガル語 (ポルトガル)

tspor.xml

パンジャーブ語

tspun.xml

ルーマニア語

tsrom.xml

ロシア語

tsrus.xml

セルビア語 (キリル)

tssbc.xml

セルビア語 (ラテン)

tssbl.xml

スロバキア語

tssvk.xml

スロベニア語

tsslo.xml

スペイン語

tsesn.xml

スウェーデン語

tssve.xml

タミール語

tstam.xml

テルグ語

tstel.xml

タイ語

tstha.xml

トルコ語

tstur.xml

ウクライナ語

tsukr.xml

ウルドゥー語 (パキスタン)

tsurd.xml

ベトナム語

tsvie.xml

See Also

Concepts

ユーザー辞書を作成する (SharePoint Server 2010)
ストップ ワード ファイルを管理する (SharePoint Server 2010)