規劃 FAST Search Server 伺服器陣列拓撲 (FAST Search Server 2010 for SharePoint)

 

適用版本: FAST Search Server 2010

上次修改主題的時間: 2012-01-20

本主題說明 Microsoft FAST Search Server 2010 for SharePoint 伺服器陣列拓撲,包括可以擴充到多部伺服器,以提升效能與容錯功能的各種元件。

如需整體 Microsoft SharePoint Server 2010 伺服器陣列拓撲的詳細資訊,請參閱<規劃搜尋拓撲 (FAST Search Server 2010 for SharePoint)>。

本文內容:

  • 內容流程

  • FAST Search for SharePoint 伺服器陣列中的元件

內容流程

FAST Search Server 2010 for SharePoint 會使用所支援的一或多個索引連接器擷取內容進行索引編製。FAST 內容 Search Service 應用程式 (SSA) 是預設的索引連接器,會從各種內容來源 (如 SharePoint 內容存放庫、網頁伺服器、Exchange 資料夾、主要商務資料與檔案伺服器等等) 擷取內容。您可以使用其他 FAST Search Server 2010 for SharePoint 索引連接器擷取更多特定種類的內容。如需索引連接器選項的詳細資訊,請參閱<規劃編目與同盟 (FAST Search Server 2010 for SharePoint)>。

項目處理會從擷取的文件中擷取可搜尋的內容,然後根據書寫語言處理項目。

索引元件會將可搜尋的內容轉換成反向索引,供查詢比對之用。

在實際針對索引進行查詢比對之前,查詢處理會藉由執行查詢轉換 (如同義字擴充) 來處理使用者查詢。

查詢比對會使用搜尋索引傳回符合使用者查詢的項目。這些項目在傳回時會列在查詢結果清單中,並依其與指定查詢間的相關程度排序。

FAST Search Server 2010 for SharePoint 會與 Active Directory 互動並宣告基礎結構,以解析權限與群組成員資格。接著,其會根據內容來源的設定,只傳回目前使用者有權檢視的項目。

FAST Search Server 2010 for SharePoint 伺服器陣列中的元件

FAST Search Server 2010 for SharePoint 可以在單一節點上執行。您也可將其擴充,在多個節點上的一或多個元件上執行。如此一來,系統不僅可以針對大量的項目編製索引,還可處理更多的項目更新、縮短索引延遲,或於每秒內回應更多的查詢。

下圖是 FAST Search Server 2010 for SharePoint 的主要元件。

FAST Search for SharePoint 伺服器陣列拓撲

FAST Search Server 伺服器陣列拓撲

下列各節說明各元件的功能。

項目處理

項目處理元件會從索引連接器接收要編製索引的項目,然後根據指定的設定加以處理。接著再將完成處理的項目傳送給索引服務。

項目處理服務的主要功能包括:

  • 將編目屬性對應到 Managed 屬性。   Managed 屬性包含要編製索引的內容,也包含項目相關的中繼資料。

    首先,您必須從初始的編目項目集中搜索編目屬性。您可以利用此作業變更 Managed 屬性的對應。

  • 剖析文件格式 (如 Word、Excel 及 PDF)。   這包含從這些格式中擷取可搜尋的文字與中繼資料。

  • 從編目內容擷取屬性。   擷取屬性會先偵測各種屬性 (如名稱與日期),然後再將其對應到 Managed 屬性。您可以利用此法查詢這些屬性,然後再以這些屬性為基準而套用「查詢精簡」。主要的擷取屬性包括公司名稱、人員姓名、位置與日期。

    您也可以建立自訂屬性擷取程式。舉例來說,您可以利用貴組織相關的產品名稱字典建立這類擷取程式。

  • 先對項目進行語言處理,然後再進行索引編製。   在搜尋中,語言會被定義成使用語言結構與變化的相關資訊,讓使用者可以更容易地找到相關的資訊。項目與查詢間的相關性未必取決於查詢與文件共用相同的字詞,而會擴大範圍到內容是否能夠滿足使用者對於資訊的要求。

    語言處理也會根據指定的語言偵測內容的書寫語言及語言正規化。語言正規化包括字元正規化與相關字詞變化的正規化。

FAST Search Server 2010 for SharePoint 可以讓您自訂項目的處理方式,例如可以指定要擷取何種屬性,以及這些屬性的查詢方式。

內容散發者會與索引連接器通訊,然後組織索引連接器到索引服務之間的文件饋送作業。您可以基於容錯的目的而設定主要及備份的內容散發者。

您可以基於容錯與效能的目的而設多個項目處理節點。某些項目處理作業因為需要密集進行處理,因此需要一個以上的處理節點處理饋送率。

網頁連結分析 (網頁分析器)

網頁分析器的兩大功能在於分析「搜尋點選連結」記錄與超連結結構。這兩項功能皆有助於找出排名較高的搜尋結果。

搜尋點選連結記錄中點選數較高的項目為熱門項目,因此排名得分會較檢視次數少的項目高。許多其他項目所連結的項目,因為會被視為與使用者之間的相關性高,所以也會獲取較高的排名得分。

網頁分析器會分析連結曲線,並根據連結基數將錨定文字與無關乎排名高低的查詢,新增到索引的項目中,藉此提升搜尋的相關性。錨定文字除可指出其所參照的項目,還可改善查詢字詞符合錨定文字時的重新叫用及相關生。項目如有許多連結指向其本身,將會獲得較高的排名。

您可以將網頁分析器擴充到許多節點,以縮短分析所需的總時間。若要達成此目標,可以新增專用的資料庫元件及用於分析連結的連結處理元件。

連結處理元件會在連結處理期間,從網頁分析器接收工作。大規模安裝會使用多個連結處理器。

查閱資料庫元件代表索引鍵/值查閱伺服器,可以擷取連結處理所產生的連結資訊。項目處理會以 URL 為索引鍵而查閱連結資訊。大規模安裝會使用多個查閱資料庫元件。

搜尋叢集

搜尋叢集提供主要的索引與查詢比對拓撲。這些元件必須用索引列/索引欄設定伺服器對照表而建立自有的擴充模型。下圖是搜尋叢集拓撲所使用的主要概念。

FAST Search 叢集架構

FAST Search 叢集架構

  • 索引欄   當完整可供搜尋的索引過大,無法存放在同一部伺服器上時,可以將其分割成多個各自獨立的索引欄。查詢會針對搜尋叢集中的所有索引欄求取結果,而得自每一個索引欄的結果將會合併到最終的查詢結果清單。

  • 搜尋索引列   一組搜尋節點,包含了搜尋叢集內所有經過索引編製的項目。搜尋索引列由搜尋叢集中,每個搜尋索引欄的各一個搜尋節點所組成。您可以使用多個搜尋索引列分擔效能負載與容錯。

  • 主要與備份索引器   您可以設定容錯的備份索引器節點。這兩個索引器會產生相同的索引集,但只有主要索引器會將索引散發到查詢比對節點。

重要

在部署設定檔 (deployment.xml) 中,主要與備份索引器節點會指定為「索引器索引列」。搜尋索引列與索引器索引列在部署設定檔中會使用相同的索引列編號。

索引

索引元件會以其所收到的項目為基礎而建立反向索引,然後再將這些反向索引傳送給查詢比對元件,供後續的查詢比對作業使用。

索引服務由索引發送程式元件與索引兩項元件組成。若將索引服務部署到多個節點上,亦會將這些元件的執行個體部署到多個節點上。

您如有多個索引欄,必須合併索引,才可得到一致的搜尋結果。因此,每個索引欄皆必須部署一個索引節點。索引發送器可以將經過處理的項目路由傳送至正確的索引欄。

索引服務會根據項目數量進行擴充。索引服務若是在單一節點上執行,則其每秒所能處理的項目數與索引所容納的項目總數皆會有所限制。若要擴充索引服務,可以將其部署在多個索引欄上。每一個索引欄皆包含索引的一部分,而將這些索引欄合併之,即是完整的索引。因此,每一個索引節點只會處理整個索引中的一部分,不僅擴充了每秒所能編製索引的項目數,項目總數也有所增加。除此之外,備份索引也可提供容錯處理。

在容錯及效能方面,您也可以使用多個索引發送程式。一般會將索引發送程式部署到相同的節點作為主要索引節點。

查詢比對

查詢比對服務會使用索引服務所建立的反向索引擷取符合查詢的項目,再將這些項目置於查詢結果清單內傳回。查詢通常由數個包含查詢運算子 (如 ANDOR) 的字詞組成。查詢比對服務會在索引中查閱每一個字詞,再擷取字詞所在項目的清單。以 AND 運算子為例,組成查詢結果清單的項目集中將會包含所有的字詞。傳回項目的順序會以所要求的排序機制為準,通常會採用複雜的排名機制 (計算各種項目屬性所得),或是根據一或多種項目屬性進行排序。.

查詢比對服務也可在傳回結果時,於查詢結果清單中醒目顯示每個項目的摘要。醒目顯示的摘要會包含醒目顯示之比對查詢字詞所在的原始項目片段。

查詢比對服務會進一步精簡出相關的查詢結果。查詢精簡可以利用從查詢結果計算所得的彙總統計資料,向下切入查詢結果。查詢比對服務會負責維護彙總資料結構,以便於能夠對大型結果集進行進一步的精簡。

您可以在索引列/索引欄設定中部署查詢比對服務,不僅可以具備容錯的功能,還可調節內容與查詢的數量。索引欄可以將整個索引分割成各自獨立的索引欄組,因此可以擴充內容容量。搜尋索引列可以將相同的索引分割區複製到多個查詢比對節點,因此可以擴充查詢容量。

重要

查詢比對服務中的索引欄數量一律等於索引服務中的索引欄數量。這是因為索引欄代表了分割的索引,且每一個查詢比對節點皆只可處理一個這類的索引分割區。

搜尋索引列與索引器索引列會各自擴充。前者藉由複製其他搜尋索引列而提供容錯功能及提升查詢容量。後者則會用為索引編製期間的容錯備份機制。

查詢處理

查詢處理元件會執行查詢的前處理與結果的後處理。查詢處理包括剖析查詢語言、語言處理及項目層級的安全性處理。結果處理包括合併多個索引欄的結果、格式化查詢結果清單、格式化查詢精簡資料,以及移除重複的項目。

查詢處理元件會與 FAST Search Authorization (FSA) 元件互動,藉此確保執行查詢的使用者只會見到其有權檢視的結果。查詢處理服務會驗證使用者的權限,並重寫內含對應到目前用者與群組成員資格之存取篩選的傳入查詢。

您可以將查詢處理服務擴充到多個節點,以處理容錯及增加每秒所能處理的查詢數。在此情況下,所有節點皆必須使用相同的方式設定。

系統管理

SharePoint Server 2010 管理中心與網站集合使用者介面提供管理 FAST Search Server 2010 for SharePoint 部署與功能的管理介面,諸如設定 UI 與 Cmdlet 系統與功能設定、記錄、索引結構描述管理與搜尋授權等常用的系統管理服務。

重要

某些管理作業只可透過 Windows PowerShell Cmdlet 或命令列工具執行。

此管理元件包含可以讓您控制搜尋經驗的功能,例如指定如何擷取屬性、確認所要使用的同義字,以及指定要用為首選的項目等等。

FSA 管理員是管理服務的一部分,可以管理索引內容的使用者授權,確保搜尋結果中只會出現使用者有權見到的項目。FSA 管理員會與宣告服務、Active Directory 服務或其他 LDAP 目錄服務通訊,以管理授權程序。

索引結構描述管理

索引結構描述管理是管理服務極為重要的一部分。索引結構描述包含產生設定檔所需的所有設定實體,而這些設定檔則與系統中其他所有服務的索引結構描述息息相關。

索引結構描述可以控制要編製項目的哪項 Managed 屬性、屬性的索引編製方式,以及可以包含在查詢結果清單中傳回的屬性。

排名設定檔是索引結構描述的一部分,可以控制查詢結果清單如何依據相關性進行排序。您可以使用一組排名設定檔參數,設定相關性的計算。

FAST Search Authorization (FSA)

FAST Search Authorization (FSA) 管理員是管理服務的一部分,可以管理索引內容的使用者授權。

FSA 管理員可以根據使用者對於內容來源存放庫的閱讀權限,授與使用者對於索引項目的存取權,以確保查詢結果清單中只會出現使用者有權見到的項目。

FSA 管理員會與 Active Directory 服務或其他 LDAP 目錄服務通訊,以管理授權程序。

FAST Search Web 編目程式

FAST Search Web 編目程式是選用的索引連接器,在像混合了網際網路與內部網路網站這類複雜的 Web 編目環境中,即可使用此連接器。

如需使用 FAST Search 內容 SSA 與 FAST Search Web 編目程式編目網站之不同處的詳細資訊,請參閱<規劃編目與同盟 (FAST Search Server 2010 for SharePoint)>。

FAST Search Web 編目程式會讀取網頁,然後依循頁面上的連結處理整個 Web 項目,然後再將擷取的項目傳送給項目處理服務。

如需 FAST Search Web 編目程式的詳細架構資訊,請參閱<使用 FAST Search Web 編目程式編目 Web 內容>。

See Also

Concepts

規劃搜尋拓撲 (FAST Search Server 2010 for SharePoint)
部署選項 (FAST Search Server 2010 for SharePoint)
規劃編目與同盟 (FAST Search Server 2010 for SharePoint)
規劃備援及可用性 (FAST Search Server 2010 for SharePoint)
規劃效能及容量 (FAST Search Server 2010 for SharePoint)

Other Resources

(已汰換) 規劃索引結構描述 (FAST Search Server 2010 for SharePoint)