Share via


管理同義字檔案 (SharePoint Server 2010)

 

適用版本: SharePoint Server 2010

上次修改主題的時間: 2015-03-09

搜尋管理員可以使用同義字檔案,指定在搜尋查詢中出現之單字或片語的取代字或同義字。

  • **指定查詢字詞或片語的取代字:**搜尋管理員可將一或多個字詞或片語,指定為使用者可能在搜尋方塊中輸入之特定字詞或片語的取代字。例如,管理員可能會指定每當 "Longhorn" 一詞出現在查詢中時,搜尋系統會將其取代為 "Windows Vista" 或 "Vista"。同樣地,管理員可能會指定每當 "NT5" 一詞或 "W2K" 一詞出現在查詢中時,搜尋系統都將其取代為 "Windows 2000"。

    若要為查詢單字或片語指定取代字,搜尋管理員需將「取代字集」插入到同義字檔案中。如需詳細資訊,請參閱本文稍後的<使用取代字集>。

  • **指定查詢字詞或片語的同義字:**搜尋管理員可將一或多個單字或片語,指定為使用者可能在搜尋方塊中輸入之特定字詞或片語的同義字。例如,管理員可能會將 "IE"、"IE8" 與 "Internet Explorer" 互相指定為同義字。當以上的任一字詞出現在查詢中時,系統也會搜尋其他字詞。因此,對以上三個字詞之一進行查詢時,會傳回包含 "IE"、"IE8" 或 "Internet Explorer" 的搜尋結果。

    若要指定查詢字詞或片語的同義字,搜尋管理員應將「擴充字集」插入同義字檔案中。如需詳細資訊,請參閱本文稍後的<使用擴充字集>。

本文內容:

  • 了解同義字檔案

  • 使用取代字集

  • 使用擴充字集

  • 使用具備同義字檔案的自訂字典

  • 編輯同義字檔案

  • 依語言區分的同義字檔案

了解同義字檔案

Microsoft SharePoint Server 2010 安裝程式將會安裝該產品所支援之每種語言的同義字檔案。安裝同時也會提供與語言無關的同義字檔案,其名稱為 tsneu.xml。在查詢處理程序中,無論是否有查詢語言專屬的同義字檔案,都會為所有查詢套用此檔案。如需詳細資訊,請參閱本文稍後的<依語言區分的同義字檔案>。

SharePoint Server 2010 預設會在 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Config 處安裝所有支援語言的同義字檔案。當搜尋管理員建立 Search Service 應用程式時,搜尋系統會自動將同義字檔案從安裝位置 (包含管理員已進行編輯的任何同義字檔案) 複製到 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Server\Applications\GUID-query-0\Config,其中 GUID 是新 Search Service 應用程式的 GUID。搜尋系統會在執行新的 Search Service 應用程式之每部查詢伺服器上執行相同的作業;因此,執行該 Search Service 應用程式的每部查詢伺服器上,都會有每個同義字檔案的複本。

在安裝時,每個同義字檔案只會包含註解形式的非作用中的範例內容;因此,您必須先編輯同義字檔案,搜尋系統才可使用它。除了取代字集以及擴充字集之外,同義字檔案還包含一個指定搜尋系統會忽略或是採用之拼音符號 (如重音節) 的 "diacritics_sensitive " 標記。diacritics_sensitive 預設為 0,即會忽略拼音符號。為使搜尋系統採用拼音符號,請將 diacritics_sensitive 的值變更為 1。

以下範例顯示同義字檔案中的預設 XML:

<XML ID="Microsoft Search Thesaurus">

<!--  Commented out

    <thesaurus xmlns="x-schema:tsSchema.xml">
        <diacritics_sensitive>0</diacritics_sensitive>
        <expansion>
            <sub>Internet Explorer</sub>
            <sub>IE</sub>
            <sub>IE8</sub>
        </expansion>
        <replacement>
            <pat>NT5</pat>
            <pat>W2K</pat>
            <sub>Windows 2000</sub>
        </replacement>
        <expansion>
            <sub>run</sub>
            <sub>jog</sub>
        </expansion>
    </thesaurus>
-->
</XML>

使用取代字集

搜尋管理員可將「取代字集」插入同義字檔案中,以將一或多個單字或片語,指定為使用者可能會在搜尋方塊中輸入之特定字詞或片語的取代字。同義字檔案中的每個取代字集都會括在 <replacement> 標籤內。管理員可在取代字集中,透過將每個字詞或片語括在 <pat> (模式) 標籤中,以指定要取代的一或多個查詢字詞或片語,並透過將每個取代字括在 <sub> (替代) 標籤中,以指定一或多個取代字。例如,下列取代字集會將查詢字詞 "Longhorn" 取代為 "Windows Vista" 或 "Vista"。

<replacement>
    <pat>Longhorn</pat>
    <sub>Windows Vista</sub>
    <sub>Vista</sub>
</replacement>

同樣地,下列範例說明的取代字集可將查詢字詞 "NT5" 與 "W2K " 指定取代為 "Windows 2000"。

<replacement>
    <pat>W2K</pat>
    <pat>NT5</pat>  
    <sub>Windows 2000</sub>
</replacement>

搜尋管理員可指定具有空白替代的模式,指定特定的字詞查詢不傳回任何結果。在下列範例中,對 "bugs" 一詞的查詢不會傳回任何結果:

<replacement>
    <pat>bugs</pat>    
    <sub></sub>
</replacement>

使用擴充字集

搜尋管理員可在同義字檔案中使用「擴充字集」,以將一或多個單字或片語互相指定為同義字。包含擴充字集內任意之字詞或片語的搜尋查詢,可擴充以內含擴充字集中的所有同義字。因此,包含擴充字集內任意單字或片語的搜尋查詢,也會傳回內含該字集中任意同義字的搜尋結果。

每個擴充字集都會括在 <expansion> 標籤內。管理員可在擴充字集中,透過將每個同義字括在 <sub> 標籤內,以指定一或多個同義字。例如,搜尋管理員可能想要指定一個擴充字集以將下列三個字詞指定為同義字:writer、author 與 blogger。若要指定此擴充字集,搜尋管理員應在同義字檔案中新增下列行:

<expansion>
    <sub>writer</sub>
    <sub>author</sub>
    <sub>blogger</sub>
</expansion>

此擴充字集會指定針對以上三個字詞之一進行查詢,同時傳回包含其他任一或兩個字詞的搜尋結果。

使用具備同義字檔案的自訂字典

指定語言的斷詞工具會根據該語言的詞彙規則,決定劃分單字的範圍,以識別各個單字。如果您將斷詞工具無法識別為單一單字的單字包括在同義字檔案中,則同時應將其包括在自訂字典中,如此一來,斷詞工具就不會將其拆分為更小的 Token。例如,如果在擴充字集中使用字詞 "IT&T",但卻未將其納入自訂字典中,則斷詞工具可能會將該字詞拆分為三個單獨的字詞 "IT"、"&" 以及 "T"。如此將會導致使用者對 "IT&T" 進行搜尋查詢時,同義字檔案中的擴充字集運作方式會不符預期。如需如何建立及使用自訂字典的資訊,請參閱<建立自訂字典 (SharePoint Server 2010)>。

編輯同義字檔案

如果在安裝位置編輯同義字檔案,則搜尋系統會自動將編輯的檔案傳播至之後所建立的 Search Service 應用程式。但是,編輯過的同義字檔案不會自動傳播到現有的 Search Service 應用程式。對於要套用變更的每個現有 Search Service 應用程式,您必須手動將編輯過的檔案複製至執行該 Search Service 應用程式之每部查詢伺服器上的 Search Service 應用程式資料夾。

注意

  • 在和同義字檔案相同的目錄中,會安裝一個名為 tsschema.xml 的檔案。請勿修改此 tsschema.xml 檔案,其他所有同義字檔案都會使用此檔案,變更此文件可能會導致無法預測的結果。

  • 每個 <pat><sub> 標籤在同義字檔案中都會計為一個項目。同義字檔案一般包含約 1,000 個項目。考量到效能因素,同義字檔案中的項目不應超過約 10,000 個項目,這一點相當重要。

  • 如果您使用停用字詞檔中所指定的同義字檔案內的字詞,則搜尋系統會將那些字詞從同義字檔案中篩選掉。如需詳細資訊,請參閱<管理停用字詞檔 (SharePoint Server 2010)>。

  • 同義字檔案項目不能只包含特殊字元。

使用下列程序編輯同義字檔案。

注意

編輯檔案時必須對檔案中的每個項目,成對使用開始與結束標籤。如果同義字檔案中 XML 標記不成對,會在應用程式事件記錄檔中記錄一則錯誤。

編輯同義字檔案

  1. 確認執行此程序的使用者帳戶是本機電腦上管理員群組的成員。

  2. 在文字編輯器中開啟同義字檔案。如需如何尋找及識別適當之同義字檔案的資訊,請參閱本文稍早的<了解同義字檔案>。

  3. 如果是第一次變更同義字檔案,請刪除文件開頭的 <!-- Commented out 註解行,以及文件尾端的 --> 註解行。

  4. 視需要對同義字檔案進行編輯。

  5. 儲存該同義字檔案。

    注意

    儲存同義字檔案時,請一律使用預設的 [編碼] 值 (即 [Unicode])。

重新啟動 SharePoint Server Search 14 服務

編輯同義字檔案之後,您必須重新啟動 SharePoint Server Search 14 服務,變更才會生效。對同義字檔案所進行的變更,在重新啟動 SharePoint Server Search 14 服務之後會生效。您不必執行編目作業,變更即會生效。

重新啟動 SharePoint Server Search 14 服務

  1. 確認執行此程序的使用者帳戶是本機電腦上管理員群組的成員。

  2. 按一下 [開始],然後指向 [系統管理工具],再按一下 [服務]。

  3. 以滑鼠右鍵按一下 [SharePoint Server Search 14],然後按一下 [重新啟動]。

    對同義字檔案所進行的變更,在重新啟動 SharePoint Server Search 14 服務之後會生效。

依語言區分的同義字檔案

下列同義字檔案會自動安裝且可供您使用。

語言 檔案名稱

非語言相關

tsneu.xml

阿拉伯文

tsara.xml

孟加拉文

tsben.xml

保加利亞文

tsbul.xml

卡達隆尼亞文

tscat.xml

中文 (簡體)

tschs.xml

中文 (繁體)

tscht.xml

克羅埃西亞文

tscro.xml

捷克文

tsces.xml

丹麥文

tsdan

荷蘭文 (荷蘭)

tsnld.xml

英文 (英國)

tseng.xml

英文 (美國)

tsenu.xml

芬蘭文

tsfin.xml

法文 (標準)

tsfra.xml

德文 (標準)

tsdeu.xml

古吉拉特文

tsguj.xml

匈牙利文

tshun.xml

冰島文

tsice.xml

印尼文

tsind.xml

義大利文

tsita.xml

日文

tsjpn.xml

坎那達文

tskan.xml

韓文

tskor.xml

立陶宛文

tslit.xml

馬來文 (馬來西亞)

tsmal.xml

馬來亞拉姆文

tsmly.xml

馬拉提文

tsmar.xml

挪威文 (巴克摩)

tsnor.xml

波蘭文

tsplk.xml

葡萄牙文 (巴西)

tsptb.xml

葡萄牙文 (葡萄牙)

tspor.xml

旁遮普文

tspun.xml

羅馬尼亞文

tsrom.xml

俄文

tsrus.xml

塞爾維亞文 (斯拉夫)

tssbc.xml

塞爾維亞文 (拉丁)

tssbl.xml

斯洛伐克文

tssvk.xml

斯洛維尼亞文

tsslo.xml

西班牙文

tsesn.xml

瑞典文

tssve.xml

坦米爾文

tstam.xml

特拉古文

tstel.xml

泰文

tstha.xml

土耳其文

tstur.xml

烏克蘭文

tsukr.xml

烏都文 (巴基斯坦)

tsurd.xml

越南文

tsvie.xml

See Also

Concepts

建立自訂字典 (SharePoint Server 2010)
管理停用字詞檔 (SharePoint Server 2010)