SharePoint Server 的搜尋結構描述概觀

 

**適用版本:**SharePoint Server 2013, SharePoint Server 2016

**上次修改主題的時間:**2017-07-24

**摘要:**了解如何使用搜尋結構描述來建置搜尋索引。搜尋結構描述包含從編目屬性對應到 Managed 屬性以及 Managed 屬性上的設定。

搜尋索引是搜尋的核心。搜尋索引中的物件決定了使用者輸入搜尋查詢或與網際網路或內部網路網頁互動來尋找資訊時可以找到的物件。

本文說明內容的收集標準以及如何使用搜尋結構描述從搜尋索引擷取內容。搜尋結構描述包含編目屬性、編目屬性類別、編目 Managed 屬性對應以及 Managed 屬性設定。Managed 屬性設定定義了您可以搜尋的項目和方法,例如,您是否可以精簡屬性或查詢屬性。

本文內容:

  • 編目與編目屬性

  • Managed 屬性與屬性對應

  • 搜尋結構描述

  • 搜尋索引

  • Managed 屬性設定概觀

編目與編目屬性

為了建立搜尋索引,必須先編目內容。您可以編目各種內容來源,例如:SharePoint Server 內容、檔案共用或使用者設定檔。編目項目的內容和中繼資料以「編目屬性」表示。

被編目並傳送到內容處理元件的每個項目,都會有關聯的編目屬性。屬性範例包括 AuthorTitle 以及 Creation Date。任何新增的編目屬性都能夠被自動探索。

編目屬性會依據項目的 IFilter 或通訊協定處理常式分組到各個類別。類別範例包括 Office (Word 文件、Excel 工作表的編目屬性等等)、Business Data (範例資料庫的編目屬性) 以及 Web (網站的編目屬性)。

如需編目的詳細資訊,請參閱<在 SharePoint Server 中規劃編目及同盟>。

Managed 屬性與屬性對應

若要在搜尋索引中包含編目屬性的內容和中繼資料,必須將編目屬性對應到 Managed 屬性。只有 Managed 屬性會被寫入搜尋索引。

Managed 屬性可以包含許多設定。Managed 屬性上的設定決定了搜尋結果中內容的顯示方式,以及使用者搜尋的方式。

您可以將多個編目屬性對應至一個 Managed 屬性。例如,您可以將 "Writer" 和 "Author" 編目屬性對應到 "Author" Managed 屬性;或者,將單一編目屬性對應到多個 Managed 屬性。

另外,編目屬性對應至 Managed 屬性的順序會決定 Managed 屬性的內容。例如,Managed 屬性可以有多個對應的編目屬性,並且可設定為包含所有對應的編目屬性之中的所有值。但是,如果您提供的編目屬性所包含的 SharePoint 標題優先順序高於對應中的其他標題,則將在搜尋結果中顯示 SharePoint 標題。

編目屬性與 Managed 屬性之間有一組已經定義的預設對應,請參閱<編目及 managed properties in SharePoint Server 的概觀>。

有些編目屬性類型會自動產生新的 Managed 屬性,並在編目屬性與 Managed 屬性之間建立對應。例如,SharePoint 文件庫的所有網站欄都有這個自動產生及對應的功能。您在清單中建立網站欄並編目該清單的時候,就會為網站欄自動建立編目屬性、Managed 屬性以及編目屬性與 Managed 屬性之間的對應。

您可以變更編目屬性與 Managed 屬性之間的預設對應或任何其他對應、建立新的對應或建立新的 Managed 屬性。建立新的 Managed 屬性或變更現有 Managed 屬性上的特定設定時,必須先完成完整編目,搜尋索引中才能包含新的 Managed 屬性及其值。如果新的或變更的屬性是在 SharePoint 文件庫或清單中,您可以針對該個別文件庫或清單重新編製索引,不需要啟動整個 SharePoint 內容來源的完整編目。這個動作的效果與完整編目相同。

如需詳細資訊,請參閱本文後續的 Managed 屬性設定概觀表格。

搜尋結構描述

搜尋結構描述儲存在搜尋管理資料庫中。搜尋結構描述包含:

  • 編目屬性與 Managed 屬性之間的對應。這可以是一個編目屬性對一個 Managed 屬性、一個編目屬性對多個 Managed 屬性、多個編目屬性對一個 Managed 屬性或多個編目屬性對多個 Managed 屬性的對應。

  • 將 Managed 屬性寫入搜尋索引的方式。例如,Managed 屬性的值應該寫入哪個全文索引,以及要寫入哪個權數群組 (內容)。

  • 不同 Managed 屬性的設定。例如,是否依特定 Managed 屬性搜尋、查詢或縮小搜尋結果。

  • 依據屬性的 IFilter 或通訊協定處理常式將屬性分組的編目屬性類別。如果編輯編目屬性類別,這個變更會套用到該類別內的所有編目屬性。這會影響效能以及搜尋索引中項目的儲存方式。

搜尋結構描述更新會每分鐘透過搜尋系統散佈出去。

多個搜尋結構描述

您可以建立多個搜尋結構描述。主搜尋結構定義於Search Service 應用程式,在管理中心中可以進行編輯。網站集合系統管理員與承租人系統管理員可以變更特定網站集合或承租人的搜尋結構描述。例如,網站集合系統管理員可以變更該網站集合的搜尋結構描述,自訂搜尋索引要包含的項目;這種作法可以自訂該網站集合的搜尋經驗。網站擁有者可以檢視搜尋結構描述,但不能變更它。

注意

您無法檢視或變更管理中心中的網站集合搜尋結構。若要檢視或變更網站集合的搜尋結構,您必須使用 [網站集合管理]。

搜尋索引

搜尋索引由伺服器上資料夾的一組檔案組成。內容處理元件會處理已編目的項目,使用搜尋結構描將編目屬性對應到 Managed 屬性,以及將 Managed 屬性轉譯為寫入搜尋索引的格式。除了各種全文檢索索引以外,還有個別的 Managed 屬性索引,分別標示為可擷取和可查詢。另外也有個別的屬性向量索引和數值索引。

索引更新群組

只要項目一變更,就必須在重新編目之後重新編製索引。為了降低重新編製索引的負荷,SharePoint Server 引入了數個個別的索引更新群組。

  • Default 包含大部分的 Managed 屬性。這個索引更新群組包含不屬於 Security、Link、Usage 或 People 索引更新群組的所有 Managed 屬性。

  • Security 包含文件存取控制清單 (ACL) Managed 屬性

  • Link 包含與連結結構相關的 Managed 屬性

  • Usage 包含與使用狀況資料相關的 Managed 屬性

  • People 包含與人員搜尋相關的 Managed 屬性

每個更新群組分別儲存於搜尋索引的個別資料夾。

全文檢索索引

全文檢索索引中包含所有可搜尋 Managed 屬性中的文字,儲存在全文檢索索引內。每個全文檢索索引被分為權數群組,也稱為內容。不同的內容與 Managed 屬性的相對重要性相關,這也是用來計算搜尋結果相關程度排名的排名功能之一。 內容的編號 (或 ID) 並不重要,排名模型是藉著指派比重加權給特定內容,來決定它的相對重要性。比重加權越高,排名分數也就越高。如需詳細資訊,請參閱<SharePoint Server 中的搜尋結果排名概觀>一文中的<使用搜尋結構描述來影響搜尋結果排名>小節。

除了預設全文檢索索引之外,還有兩個預先定義的全文檢索索引:SharePoint Terms 全文檢索索引 (SpTermsIdx) 和 People 索引 (PeopleIdx)。

依預設,大多數 Managed 屬性均已對應至合適的內容及全文檢索索引。建議您,不要變更任何現有可搜尋 Managed 屬性的內容。

Managed 屬性設定概觀

Managed 屬性上的設定決定內容儲存在搜尋索引中的方式,以及使用者搜尋並擷取內容的方式。

搜尋結構描述可以在管理中心、網站集合管理以及承租人管理中編輯。網站系統管理員可以檢視搜尋結構描述,但不能編輯它。下表說明不同的設定以及在不同的系統管理員層級上是否可以編輯它們。

Managed 屬性設定 功能 範例 可用於 變更設定後所需的完整編目或重新編製索引 SharePoint 清單/文件庫

可搜尋

能夠查詢 Managed 屬性的內容。這個 Managed 屬性的內容包含於全文檢索索引。

例如,如果屬性為 "author",則只要查詢 "Smith",即會傳回包含單字 "Smith" 的項目,以及作者屬性包含 "Smith" 的項目。

管理中心 / 網站集合管理 / 承租人管理

進階可搜尋設定

可檢視及變更 Managed 屬性所寫入的全文檢索索引,也可讓您變更相關性排名計算的 Managed 屬性的內容。建議您,不要變更任何現有 Managed 屬性的內容。如需詳細資訊,請參閱<SharePoint Server 中的搜尋結果排名概觀>一文中的<使用搜尋結構描述來影響搜尋結果排名>小節。

管理中心 / 網站集合管理 / 承租人管理

可查詢

能夠查詢特定 Managed 屬性。Managed 屬性名稱必須包含於查詢中,可以在查詢本身中指定或者以程式設計的方式包含在查詢內。

如果 Managed 屬性為 "author",查詢必須包含 "author:Smith"。

管理中心 / 網站集合管理 / 承租人管理

從停用到啟用。

可擷取

讓搜尋結果能夠傳回此 Managed 屬性的內容。為相關的 Managed 屬性啟用這個設定,以便在搜尋結果中顯示。

管理中心 / 網站集合管理 / 承租人管理

從停用到啟用。

允許多個值

允許此 Managed 屬性中同一個類型具有多個值。

如果是 "author" Managed 屬性且文件有多位作者,將每位作者的名稱在 Managed 屬性中會儲存個別值。

管理中心

可精簡搜尋

Yes - active:能夠在前端使用屬性作為搜尋結果精簡器。您必須手動在網頁組件中設定精簡器。

Yes - latent:能夠稍後將可精簡搜尋切換為啟用,而不用在切換時重新執行完整編目。

這兩個選項都需要完整編目才能生效。

重要

如果選取 [Yes - active] 或 [Yes - latent],必須也要將 Managed 屬性設定為可查詢。

如果 “author”Managed 屬性是設定為可精簡搜尋,則稍後可以在搜尋前端將 Author 設定精簡器。

管理中心

從停用到啟用 (如果尚未設定為可排序)

可排序

Yes – active:能夠在結果集傳回前先按照屬性排序結果集。

Yes - latent:能夠稍後將排序切換為啟用,而不用在切換時重新執行完整編目。

這兩個選項都需要完整編目才能生效。

用於無法同時排序和擷取的大型結果集。

管理中心

從停用到啟用 (如果尚未設定為 可精簡搜尋)

別名

如果想要在查詢和搜尋結果中使用別名而不是 Managed 屬性,這個設定可以定義 Managed 屬性的別名。請使用原來的 Managed 屬性而不是別名來對應編目屬性。

如果您不想或無權限建立新的 Managed 屬性,請使用別名。

管理中心 / 網站集合管理 / 承租人管理

Token 正規化

能夠傳回與查詢中使用之字母大小寫和讀音符號無關的結果。

查詢 "curacao" 也可以找到 "Curacao"、"curacao" 及 "Curacao" 的相符項目。

管理中心 / 網站集合管理 / 承租人管理

完全相符

查詢只會找到內容完全一樣的屬性。

如果您有 Managed 屬性 "ID" 包含字串 "1-23-456#7",完整比對只會傳回查詢 ID 為 "1-23-456#7" 的比對結果,而不會傳回 ID 為"1-23" 或 ID:"1 23 456 7" 的結果。

管理中心 / 網站集合管理 / 承租人管理

對應到編目屬性

清單中顯示與該 Managed 屬性對應的所有編目屬性清單。Managed 屬性可以從一或多個編目屬性取得內容。

您可以包含所有編目屬性的內容或只包含第一個不是空的編目屬性以下的內容 (按照指定的順序)。

管理中心 / 網站集合管理 / 承租人管理

公司名稱擷取

編目新的或更新的項目時,能讓系統從 Managed 屬性擷取公司名稱實體。擷取的實體稍後可以用來設定精簡器。

已經為公司名稱擷取內含一個預先填入的字典。系統會將原來的 Managed 屬性內容儲存在索引中,而且不變更內容,而且再將擷取的實體複製到 Managed 屬性 "companies"。"companies" Managed 屬性已設定為可搜尋、可查詢、可擷取、可排序和可精簡搜尋。

您可以在字詞庫中編輯公司名稱字典。

如需詳細資訊,請參閱<在 SharePoint Server 中管理公司名稱擷取>。

管理中心 / 網站集合管理 / 承租人管理

自訂實體擷取

允許一或多個自訂實體擷取器與此 Managed 屬性關聯。編目新的或更新的項目時,能讓系統從 Managed 屬性擷取實體。擷取的實體稍後可以用來設定精簡器。

如需詳細資訊,請參閱<在 SharePoint Server 中建立及部署自訂實體擷取器>。

管理中心 / 網站集合管理

See also

在 SharePoint Server 中管理搜尋結構描述
編目及 managed properties in SharePoint Server 的概觀
在 SharePoint Server 中規劃編目及同盟