シソーラス ファイルを管理する (SharePoint Server 2010)
適用先: SharePoint Server 2010
トピックの最終更新日: 2015-03-09
シソーラス ファイルを使用して、検索の管理者は、検索クエリ内の語句の置換語句または類義語を指定できます。
クエリ語句の置換の指定 検索の管理者は、ユーザーが検索ボックスに入力する特定の語句の置換語句として、1 つまたは複数の語句を指定できます。たとえば、管理者は、クエリに "Longhorn" という語が含まれる場合に検索システムでそれらを "Windows Vista" または "Vista" に置換することを指定したり、クエリに "NT5" または "W2K" という語が含まれる場合に検索システムでそれらを "Windows 2000" に置換することを指定したりできます。
クエリ語句の置換を指定するには、検索の管理者は、シソーラス ファイルに "置換セット" を挿入します。詳細については、後の「置換セットを使用する」を参照してください。
クエリ語句の類義語の指定 検索の管理者は、ユーザーが検索ボックスに入力する特定の語句の類義語として、1 つまたは複数の語句を指定できます。たとえば、管理者は、"IE"、"IE8"、および "Internet Explorer" を相互に類義語として指定できます。これらのいずれかがクエリに含まれる場合、システムでは残りの類義語も検索されます。したがって、これら 3 つの語のいずれかを検索するクエリの検索結果には、"IE"、"IE8"、または "Internet Explorer" の検索結果も含まれます。
クエリ語句の類義語を指定するには、検索の管理者は、シソーラス ファイルに "拡張セット" を挿入します。詳細については、後の「拡張セットを使用する」を参照してください。
この記事の内容 :
シソーラス ファイルについて
置換セットを使用する
拡張セットを使用する
ユーザー辞書とシソーラス ファイルの併用
シソーラス ファイルを編集する
言語別のシソーラス ファイル
シソーラス ファイルについて
Microsoft SharePoint Server 2010 のインストール プログラムでは、製品がサポートする各言語のシソーラス ファイルがインストールされます。また、言語に依存しないシソーラス ファイル tsneu.xml もインストールされます。このファイルは、クエリの言語に対応する特定のシソーラス ファイルがあるかどうかにかかわらず、すべてのクエリの処理時に必ず適用されます。詳細については、この記事で後述する「言語別のシソーラス ファイル」を参照してください。
既定では、SharePoint Server 2010 によって、サポートされているすべての言語のシソーラス ファイルが %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Config にインストールされます。検索の管理者が Search Service アプリケーションを作成すると、検索システムによって、シソーラス ファイルがインストール場所から (管理者がその場所で編集したシソーラス ファイルも含めて) %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Applications\GUID-query-0\Config に自動的にコピーされます (GUID は、新しい Search Service アプリケーションの GUID です)。これは、その新しい Search Service アプリケーションが実行されるすべてのクエリ サーバーにコピーされます。したがって、その Search Service アプリケーションが実行されるクエリ サーバーごとにそれぞれシソーラス ファイルのコピーが存在するようになります。
インストールの段階では、各シソーラス ファイルには、非アクティブなサンプル コンテンツのみがコメントとして含まれています。したがって、検索システムで使用する前に、シソーラス ファイルを編集する必要があります。シソーラス ファイルには、置換セットと拡張セットに加えて、"diacritics_sensitive” タグが含まれています。このタグは、アクセントなどの分音記号を検索システムで無視するか反映するかを表します。既定では、diacritics_sensitive は 0 に設定されているため、分音記号は無視されます。検索システムで分音記号を反映させるには、diacritics_sensitive の値を 1 に変更します。
シソーラス ファイル内の既定の XML の例を次に示します。
<XML ID="Microsoft Search Thesaurus">
<!-- Commented out
<thesaurus xmlns="x-schema:tsSchema.xml">
<diacritics_sensitive>0</diacritics_sensitive>
<expansion>
<sub>Internet Explorer</sub>
<sub>IE</sub>
<sub>IE8</sub>
</expansion>
<replacement>
<pat>NT5</pat>
<pat>W2K</pat>
<sub>Windows 2000</sub>
</replacement>
<expansion>
<sub>run</sub>
<sub>jog</sub>
</expansion>
</thesaurus>
-->
</XML>
置換セットを使用する
検索の管理者は、シソーラス ファイルに "置換セット" を挿入して、ユーザーが検索ボックスに入力する特定の語句の置換語句となる 1 つ以上の語句を指定できます。シソーラス ファイル内の各置換セットは、<replacement>
タグで囲みます。置換セット内では、置換する各クエリ語句を <pat>
(pattern: パターン) タグで囲んで 1 つ以上の対象語句を指定し、各置換語句を <sub>
(substitution: 代替文字列) タグで囲んで 1 つ以上の置換語句を指定します。たとえば、以下の置換セットでは、クエリ内の語 "Longhorn" を "Windows Vista" または "Vista" に置換します。
<replacement>
<pat>Longhorn</pat>
<sub>Windows Vista</sub>
<sub>Vista</sub>
</replacement>
同様に、以下の例は、クエリ内の語 "NT5" および "W2K" を "Windows 2000" に置き換える置換セットを示します。
<replacement>
<pat>W2K</pat>
<pat>NT5</pat>
<sub>Windows 2000</sub>
</replacement>
検索の管理者は、あるパターンに対して空の代替文字列を指定することによって、特定の語句のクエリからは結果が返されないように指定できます。以下の例では、"bugs" という語に対するクエリの結果は返されません。
<replacement>
<pat>bugs</pat>
<sub></sub>
</replacement>
拡張セットを使用する
検索の管理者は、シソーラス ファイル内で "拡張セット" を使用して、相互に類義語となる 1 つ以上の語句を指定できます。拡張セット内の語句が含まれるクエリは、その拡張セット内のすべての類義語を含むように拡張されます。したがって、拡張セット内の語句が含まれる検索クエリからは、それらの類義語も含まれる検索結果が返されます。
各拡張セットは <expansion>
タグで囲みます。拡張セット内では、各類義語を <sub>
タグで囲んで 1 つ以上の類義語を指定します。たとえば、検索の管理者が、"writer"、"author"、および "blogger" という 3 つの語を類義語として指定する拡張セットを指定するとします。この拡張セットを指定するには、シソーラス ファイルに以下の行を追加します。
<expansion>
<sub>writer</sub>
<sub>author</sub>
<sub>blogger</sub>
</expansion>
この拡張セットは、これら 3 つの語のいずれかを検索するクエリでは、残りの 2 つの語のどちらかまたは両方が含まれる検索結果も返されることを指定します。
ユーザー辞書とシソーラス ファイルの併用
特定の言語のワード ブレーカーは、言語の語彙規則に基づいて単語境界が存在する箇所を決定することにより、検索クエリの個々の単語を識別します。ワード ブレーカーで 1 つの単語として認識されない単語をシソーラス ファイルに追加する場合は、ワード ブレーカーによって単語がさらに細かいトークンに分割されないように、ユーザー定義の辞書にもその単語を追加する必要があります。たとえば、拡張セットで "IT&T" という言葉を使用しており、ユーザー定義の辞書にその言葉を追加していない場合、ワード ブレーカーによってその言葉が "IT"、"&"、および "T" という別々の 3 つの単語に分割される可能性があります。この結果、ユーザーが "IT&T" の検索クエリを発行したときに、シソーラス ファイルの拡張セットが予期したとおりに動作しない可能性があります。ユーザー定義の辞書を作成および使用する方法の詳細については、「ユーザー辞書を作成する (SharePoint Server 2010)」を参照してください。
シソーラス ファイルを編集する
インストール場所にあるシソーラス ファイルを編集すると、それ以降に作成された Search Service アプリケーションには、編集したシソーラス ファイルが自動的にコピーされます。ただし、既存の Search Service アプリケーションには、編集したシソーラス ファイルは自動的にはコピーされません。既存の Search Service アプリケーションにも変更を適用するには、その Search Service アプリケーションを実行する各クエリ サーバーの Search Service アプリケーション フォルダーに、編集したシソーラス ファイルを手動でコピーする必要があります。
注意
-
tsschema.xml という名前のファイルがシソーラス ファイルと同じディレクトリにインストールされます。tsschema.xml ファイルは変更しないでください。このファイルは、その他すべてのシソーラス ファイルが使用します。このファイルを変更すると、予期しない結果が生じる場合があります。
-
シソーラス ファイル内の
<pat>
タグまたは<sub>
タグは、それぞれが 1 つのアイテムとして見なされます。通常のシソーラス ファイルでは、1 ファイルに約 1,000 個のアイテムが含まれます。パフォーマンスの観点から、1 つのシソーラス ファイル内のアイテム数が約 10,000 個を超えないようにすることが重要です。 -
ストップ ワード ファイルに指定されている語をシソーラス ファイルに使用すると、検索システムによって、それらの語はシソーラス ファイルから除外されます。詳細については、「ストップ ワード ファイルを管理する (SharePoint Server 2010)」を参照してください。
-
シソーラス ファイルのエントリに、特殊文字だけを含めることはできません。
シソーラス ファイルを編集するには、次の手順を使用します。
注意
ファイルを編集するときは、ファイル内の各エントリを開始タグおよび終了タグの整合するペアで囲む必要があります。シソーラス ファイル内の XML タグが正しく整合しない場合、アプリケーション イベント ログにエラーが記録されます。
シソーラス ファイルを編集するには
この手順を実行するユーザー アカウントがローカル コンピューターの Administrators グループに属するメンバーであることを確認します。
テキスト エディターでシソーラス ファイルを開きます。適切なシソーラス ファイルおよびその場所を特定する方法については、前の「シソーラス ファイルについて」を参照してください。
シソーラス ファイルを初めて変更する場合は、ファイルの先頭の
<!-- Commented out
コメント行と、ファイルの末尾の-->
コメント行を削除します。必要に応じて、シソーラス ファイルを編集します。
シソーラス ファイルを保存します。
注意
シソーラス ファイルを保存するときは、必ず既定のエンコード値 Unicode を使用してください。
SharePoint Server Search 14 サービスを再起動する
シソーラス ファイルを編集した後、その変更内容を有効にするには、SharePoint Server Search 14 サービスを再起動する必要があります。シソーラス ファイルの変更内容は、SharePoint Server Search 14 サービスの再起動後に有効になります。変更内容を有効にするために、クロールを実行する必要はありません。
SharePoint Server Search 14 サービスを再起動するには
この手順を実行するユーザー アカウントがローカル コンピューターの Administrators グループに属するメンバーであることを確認します。
[スタート] ボタンをクリックして [管理ツール] をポイントし、[サービス] をクリックします。
[SharePoint Server Search 14] を右クリックし、[再起動] をクリックします。
シソーラス ファイルの変更内容は、SharePoint Server Search 14 サービスの再起動後に有効になります。
言語別のシソーラス ファイル
自動的にインストールされて使用可能になるシソーラス ファイルは、以下のとおりです。
言語 | ファイル名 |
---|---|
言語に依存しない |
tsneu.xml |
アラビア語 |
tsara.xml |
ベンガル語 |
tsben.xml |
ブルガリア語 |
tsbul.xml |
カタルニア語 |
tscat.xml |
簡体字中国語 |
tschs.xml |
繁体字中国語 |
tscht.xml |
クロアチア語 |
tscro.xml |
チェコ語 |
tsces.xml |
デンマーク語 |
tsdan |
オランダ語 (オランダ) |
tsnld.xml |
英語 (英国) |
tseng.xml |
英語 (米国) |
tsenu.xml |
フィンランド語 |
tsfin.xml |
フランス語 (標準) |
tsfra.xml |
ドイツ語 (標準) |
tsdeu.xml |
グジャラート語 |
tsguj.xml |
ハンガリー語 |
tshun.xml |
アイスランド語 |
tsice.xml |
インドネシア語 |
tsind.xml |
イタリア語 |
tsita.xml |
日本語 |
tsjpn.xml |
カンナダ語 |
tskan.xml |
韓国語 |
tskor.xml |
リトアニア語 |
tslit.xml |
マレー語 (マレーシア) |
tsmal.xml |
マラヤーラム語 |
tsmly.xml |
マラーティー語 |
tsmar.xml |
ノルウェー語 (ブークモール) |
tsnor.xml |
ポーランド語 |
tsplk.xml |
ポルトガル語 (ブラジル) |
tsptb.xml |
ポルトガル語 (ポルトガル) |
tspor.xml |
パンジャーブ語 |
tspun.xml |
ルーマニア語 |
tsrom.xml |
ロシア語 |
tsrus.xml |
セルビア語 (キリル) |
tssbc.xml |
セルビア語 (ラテン) |
tssbl.xml |
スロバキア語 |
tssvk.xml |
スロベニア語 |
tsslo.xml |
スペイン語 |
tsesn.xml |
スウェーデン語 |
tssve.xml |
タミール語 |
tstam.xml |
テルグ語 |
tstel.xml |
タイ語 |
tstha.xml |
トルコ語 |
tstur.xml |
ウクライナ語 |
tsukr.xml |
ウルドゥー語 (パキスタン) |
tsurd.xml |
ベトナム語 |
tsvie.xml |
See Also
Concepts
ユーザー辞書を作成する (SharePoint Server 2010)
ストップ ワード ファイルを管理する (SharePoint Server 2010)