編輯非搜尋字檔案 (Office SharePoint Server)
所謂非搜尋字,係指對搜尋無益的字,例如 "the" 和 "an"。非搜尋字檔案 (有時也稱為「停用字詞」檔案) 是包含使用者執行查詢時要排除或忽略的字詞清單。這些清單可能會包含與搜尋不相關的字詞,如連接詞、冠詞、形容詞和副詞,甚至包括常見名稱、攻擊性或不當字詞。
本文內容:
瞭解何謂非搜尋字檔案
編輯非搜尋字檔案
各語言的非搜尋字檔案
瞭解何謂非搜尋字檔案
每個語言的非搜尋字清單是儲存在該語言的非搜尋字檔案中。如果某語言沒有非搜尋字檔案,Microsoft Office SharePoint Server 2007 會使用中性的 noiseneu.txt 非搜尋字檔案。特定語言的斷詞工具會依據該語言的詞彙規則,來判斷字緣,藉此識別每個字詞。當特定語言的斷詞工具在編製索引或查詢時遇到字詞,斷詞工具就會將非搜尋字檔案中所列的字詞加以移除。如需非搜尋字檔案支援哪些語言的詳細資訊,請參閱<各語言的非搜尋字檔案>小節。
根據預設,非搜尋字檔案是建立並儲存在查詢伺服器上的下列位置:磁碟:\Program Files\Microsoft Office Servers\12.0\Data\Config。預設位置上的非搜尋字檔案會複製到查詢伺服器上每個 Microsoft Search 服務執行個體所在位置,即:磁碟:\Program Files\Microsoft Office Servers\12.0\Data\Applications\\<應用程式 UID>\Config,其中的 <應用程式 UID> 係指與每個 Search 服務執行個體相關聯的 GUID。
注意
如果修改了預設位置上的非搜尋字檔案,之後只要每次建立新的共用服務提供者 (SSP),就會自動複製這些檔案的修改版本。如果是在建立 SSP 之後修改非搜尋字檔案,就要自行將這些檔案從預設位置複製到每個現有 SSP 的指定目錄。
如果新增非搜尋字檔案,搜尋的精確性可能會受到影響。不過,內容索引的大小也就會因此變小。內容索引變小將有助於提高效能。如果希望您的搜尋能傳回非搜尋字,則可以直接刪除這些字。
如果從非搜尋字檔案中移除字詞,您必須接著重設內容索引,並對所有包含這些已移除關鍵字的內容進行編目,這些變更才會生效。如果在非搜尋字檔案中新增字詞,就不需要對所有內容執行編目,因為並不會搜尋這些新增的字詞。但是,若要使索引變小,則必須執行完整編目。
請勿刪除非搜尋字檔案。如果不希望在更新或查詢時移除非搜尋字,請從檔案中移除所需的特定項目。如果刪除了非搜尋字檔案,所有單一字元都將視為非搜尋字而遭移除。
編輯非搜尋字檔案
使用下列程序可編輯非搜尋字檔案。
編輯非搜尋字檔案
啟動「記事本」,然後開啟非搜尋字檔案。如需如何找到及識別適當非搜尋字檔案的詳細資料,請參閱<瞭解何謂非搜尋字檔案>小節。
編輯該清單,使清單只包含搜尋查詢要忽略的字詞。
儲存非搜尋字檔案,然後關閉「記事本」。
注意
在儲存經過修改的非搜尋字檔案時,請一律使用預設的 [編碼] 值。
依照下列步驟重新啟動 Office SharePoint Server 搜尋服務:
按一下 [開始],指向 [系統管理工具],然後按一下 [服務]。
在 [Office SharePoint Server 搜尋] 上按一下滑鼠右鍵,然後按一下 [重新啟動]****。
為了讓搜尋能夠用到您對非搜尋字檔案的變更,您必須啟動內容來源的完整編目。如需如何執行這項操作的相關資訊,請參閱<開始完整編目 (Office SharePoint Server 2007)>。
各語言的非搜尋字檔案
Office SharePoint Server 2007 包含下列語言的非搜尋字檔案:
語言 | 檔案名稱 |
---|---|
阿拉伯文 |
noiseara.txt |
孟加拉文 |
noiseben.txt |
保加利亞文 |
noisebul.txt |
卡達隆尼亞文 |
noisecat.txt |
中文 (簡體) |
noisechs.txt |
中文 (繁體) |
noisecht.txt |
克羅埃西亞文 |
noisecro.txt |
丹麥文 |
noisedan.txt |
荷蘭文 (荷蘭) |
noisenld.txt |
英文 (英國) |
noiseeng.txt |
英文 (美國) |
noiseenu.txt |
芬蘭文 |
noisefin.txt |
法文 |
noisefra.txt |
德文 |
noisedeu.txt |
希臘文 |
noisegrc.txt |
古吉拉特文 |
noiseguj.txt |
希伯來文 |
noiseheb.txt |
印度文 |
noisehin.txt |
冰島文 |
noiseice.txt |
印尼文 |
noiseind.txt |
義大利文 |
noiseita.txt |
日文 |
noisejpn.txt |
坎那達文 |
noisekan.txt |
韓文 |
noisekor.txt |
拉脫維亞文 |
noiselat.txt |
立陶宛文 |
noiselit.txt |
馬來文 |
noisemal.txt |
馬來亞拉姆文 |
noisemly.txt |
馬拉提文 |
noisemar.txt |
中性 |
noiseneu.txt |
挪威文 (巴克摩) |
noisenor.txt |
波蘭文 |
noiseplk.txt |
波蘭文 |
noisepol.txt |
葡萄牙文 |
noisepor.txt |
葡萄牙文 (巴西) |
noiseptb.txt |
旁遮普文 |
noisepun.txt |
羅馬尼亞文 |
noiserom.txt |
俄文 |
noiserus.txt |
塞爾維亞文 (斯拉夫) |
noisesbc.txt |
塞爾維亞文 (拉丁) |
noisesbl.txt |
斯洛伐克文 |
noisesvk.txt |
斯洛維尼亞文 |
noiseslo.txt |
西班牙文 |
noiseesn.txt |
瑞典文 |
noisesve.txt |
坦米爾文 |
noisetam.txt |
特拉古文 |
noisetel.txt |
泰文 |
noisetha.txt |
土耳其文 |
noisetur.txt |
烏克蘭文 |
noiseurk.txt |
烏都文 (巴基斯坦) |
noiseurd.txt |