管理停用字詞檔 (SharePoint Server 2010)

 

適用版本: SharePoint Server 2010

上次修改主題的時間: 2015-03-09

「停用字詞」(又稱為「非搜尋字」) 是指搜尋系統在使用者搜尋查詢中會忽略的單字。如果某個單字在該語言中頻繁地出現,以致於它不可能對識別或縮小搜尋結果有任何協助,即可將其指定為「停用字詞」。例如,英語中通常會有 "an" 和 "the" 這類的冠詞指定停用字詞。如果使用者輸入英文查詢 "the highest mountain",則會從查詢中刪除是停用字詞的 "the";如此一來,查詢就會變成 "highest mountain"。不雅的字詞有時也會指定為停用字詞。

本文內容:

了解停用字詞檔

所指定之語言的停用字詞會列在該語言的「停用字詞檔」中。Microsoft SharePoint Server 2010 安裝程式會為該產品所支援的每種語言,自動安裝一個停用字詞檔。在安裝之後,許多停用字詞檔都會包含相關語言中一些常見的停用字詞。例如,美式英語的停用字詞檔 (noiseenu.txt) 預設會包含單詞 a、and、is、in、it、of、the 和 to。在產品安裝之後的任何時間點,搜尋管理員都可以在停用字詞檔中新增或移除字詞,以改善搜尋結果的關聯性或符合組織標準。如需在停用字詞檔中新增或移除字詞的資訊,請參閱本文稍後的<編輯停用字詞檔>。如需所支援語言的資訊,請參閱本文稍後的<按語言區分的停用字詞檔>。

在查詢時,所查詢語言的斷詞工具會根據語言的詞法規則確定單字的邊界,以識別搜尋查詢中的各個單字。然後,斷詞工具會從查詢中移除停用字詞檔內所列出的所有單字。

所有支援語言的停用字詞檔預設會安裝在 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Office Servers\Config 中。當伺服器陣列管理員建立 Search Service 應用程式時,搜尋系統會自動從安裝位置將停用字詞檔 (包括搜尋管理員在此位置編輯過的任何停用字詞檔) 複製到 %ProgramFiles%\Microsoft Office Servers\14.0\Data\Applications\GUID\Config 中,此處的 GUID 為新 Search Service 應用程式的 GUID。搜尋系統會在執行新 Search Service 應用程式的每部查詢伺服器上,執行相同的操作。利用此方式,正在執行該 Search Service 應用程式的每部查詢伺服器上,都會有每個停用字詞檔的備份。

編輯停用字詞檔

如果在安裝位置中編輯停用字詞檔,系統會自動將編輯過的停用字詞檔,傳播到之後所建立的 Search Service 應用程式。但是,停用字詞檔不會自動傳播到現有的 Search Service 應用程式。針對您想要對其套用變更的每個現有 Search Service 應用程式,您必須在正執行該 Search Service 應用程式的每部查詢伺服器上,將已編輯的文件手動複製到 Search Service 應用程式資料夾中。

注意

  • 如果刪除某個停用字詞檔,則搜尋系統可能會將所有的單一字元視為停用字詞,並將其從搜尋結果中移除。停用字詞檔中必須至少包含一個項目,即使該項目只是一個句點 (.) 字元亦可。

  • 如果刪除了某個停用字詞檔後再重新啟動 SharePoint Server Search 14 服務,則搜尋系統會透過從 %Program Files%Microsoft Office Servers\14.0\Data\Office Server\Config 中複製相同名稱的文件到已刪除該文件的資料夾,自動取代該文件。

使用下列程序可編輯停用字詞檔。

編輯停用字詞檔

  1. 確認執行此程序的使用者帳戶為本機伺服器管理員群組的成員。

  2. 在文字編輯器中開啟停用字詞檔。如需尋找及識別適當停用字詞檔的資訊,請參閱本文稍早的<了解停用字詞檔>。

  3. 編輯文件,使其僅包含您希望搜尋系統在搜尋查詢中忽略的字詞。

  4. 儲存停用字詞檔。

    注意

    儲存停用字詞檔時,請一律使用預設 [編碼] 值,也就是 [Unicode]。

  5. 遵循下列步驟重新啟動 SharePoint Server Search 14 服務:

    1. 按一下 [開始],然後指向 [系統管理工具],再按一下 [服務]。

    2. 以滑鼠右鍵按一下 [SharePoint Server Search 14],然後按一下 [重新啟動]。

      在重新啟動 SharePoint Server Search 14 服務之後,停用字詞的變更才會生效。

      注意

      在 Microsoft Office SharePoint Server 2007 中,搜尋系統會從查詢與索引中排除停用字詞。因此,在管理員從停用字詞檔中刪除某個單字之後,有必要執行完整編目以對編目程式可能會遇到的該停用字詞出處進行索引編製。相反地,在 SharePoint Server 2010 中,搜尋系統僅會從查詢中排除停用字詞,根據設計,它並不會從索引中排除停用字詞。因此,在 SharePoint Server 2010 中,如果從停用字詞檔中移除了某個單字,則無需執行新的編目作業。這是因為在編目期間遇到該停用字詞時,該停用字詞已經存在於索引中。(如果在停用字詞檔中新增某個單字,也無需執行新的編目,因為搜尋系統不會在索引中尋找停用字詞)。

按語言區分的停用字詞檔

安裝 SharePoint Server 2010 時,會為下列語言安裝停用字詞檔。如果某個語言的停用字詞檔不存在,則搜尋系統將使用非特定語言的停用字詞檔 noiseneu.txt。

語言 停用字詞檔名稱

阿拉伯文

noiseara.txt

孟加拉文

noiseben.txt

保加利亞文

noisebul.txt

卡達隆尼亞文

noisecat.txt

捷克文

noiseces.txt

中文 (簡體)

noisechs.txt

中文 (繁體)

noisecht.txt

克羅埃西亞文

noisecro.txt

丹麥文

noisedan.txt

荷蘭文 (荷蘭)

noisenld.txt

英文 (英國)

noiseeng.txt

英文 (美國)

noiseenu.txt

芬蘭文

noisefin.txt

法文

noisefra.txt

德文

noisedeu.txt

希臘文

noisegrc.txt

古吉拉特文

noiseguj.txt

希伯來文

noiseheb.txt

印度文

noisehin.txt

匈牙利文

noisehun.txt

冰島文

noiseice.txt

印尼文

noiseind.txt

義大利文

noiseita.txt

日文

noisejpn.txt

坎那達文

noisekan.txt

韓文

noisekor.txt

中性語言

noiseneu.txt

拉脫維亞文

noiselav.txt

立陶宛文

noiselit.txt

馬來文

noisemal.txt

馬來亞拉姆文

noisemly.txt

馬拉提文

noisemar.txt

挪威文 (巴克摩)

noisenor.txt

波蘭文

noiseplk.txt

葡萄牙文 (葡萄牙)

noisepor.txt

葡萄牙文 (巴西)

noiseptb.txt

旁遮普文

noisepun.txt

羅馬尼亞文

noiserom.txt

俄文

noiserus.txt

塞爾維亞文 (斯拉夫)

noisesbc.txt

塞爾維亞文 (拉丁)

noisesbl.txt

斯洛伐克文

noisesvk.txt

斯洛維尼亞文

noiseslo.txt

西班牙文

noiseesn.txt

瑞典文

noisesve.txt

坦米爾文

noisetam.txt

特拉古文

noisetel.txt

泰文

noisetha.txt

土耳其文

noisetur.txt

烏克蘭文

noiseurk.txt

烏都文 (巴基斯坦)

noiseurd.txt

越南文

noisevie.txt