本文為機器翻譯文章。如需檢視英文版,請選取 [原文] 核取方塊。您也可以將滑鼠指標移到文字上,即可在快顯視窗顯示英文原文。
譯文
原文

SharePoint Server 2013 中編目的最佳作法

 

適用版本:SharePoint Server 2013

上次修改主題的時間:2016-12-16

了解在 SharePoint Server 2013 中編目的最佳作法。

搜尋系統會編目內容,以建立可供使用者用來執行搜尋查詢的搜尋索引。本文包含有關如何有效管理編目的建議。

本文內容:

注意事項 附註:
因為 SharePoint 2013 在 Internet Information Services (IIS) 中以網站形式運作,所以管理員與使用者均依賴瀏覽器提供的協助工具功能。SharePoint 2013 支援所支援瀏覽器的協助工具功能。如需詳細資訊,請參閱下列資源:

預設內容存取帳戶是您指定 SharePoint 2013 Search Service 預設用來進行編目的網域帳戶。為了簡單起見,最好盡量使用此帳戶編目您的內容來源所指定的內容。若要變更預設內容存取帳戶,請參閱<變更 SharePoint 2013 中用於編目的預設帳戶>。

當您無法使用預設內容存取帳戶來編目特定 URL (例如,基於安全理由),可以建立編目規則以指定下列其中一種替代方式來驗證編目程式:

  • 不同的內容存取帳戶

  • 用戶端憑證

  • 表單認證

  • 編目的 Cookie

  • 匿名存取

如需詳細資訊,請參閱<在 SharePoint Server 2013 中管理編目規則>。

內容來源是 Search Service 應用程式中的一組選項,供您用來指定下列每一項:

  • 一或多個要編目的起始位址。

  • 起始位址的內容類型 (例如 SharePoint 網站、檔案共用或企業營運系統資料)。您僅可以在內容來源中指定一種要編目的內容。例如,您可以使用某個內容來源來編目 SharePoint 網站,並使用另一個內容來源來編目檔案共用。

  • 完整或累加編目的編目排程和編目優先順序,將會套用至內容來源所指定的所有內容存放庫。

當您建立 Search Service 應用程式時,搜尋系統會自動建立並設定一個名為 [本機 SharePoint 網站] 的內容來源。此預先設定的內容來源是用於編目使用者設定檔,以及用於編目與 Search Service 應用程式相關聯之 Web 應用程式中的所有 SharePoint 網站。您也可以使用此內容來源來編目其他 SharePoint 伺服器陣列中的內容,包括 SharePoint Server 2007 伺服器陣列、SharePoint Server 2010 伺服器陣列或其他 SharePoint Server 2013 伺服器陣列。

當您想要執行下列任何一項作業時,請建立額外的內容來源:

  • 編目其他類型的內容

  • 限制或增加要編目的內容量

  • 增加或減少編目特定內容的頻率

  • 設定不同的優先順序來編目特定內容 (此適用於完整與累加編目,但不適用於連續編目)

  • 在不同的排程編目特定內容 (此適用於完整與累加編目,但不適用於連續編目)

但是,為讓管理工作盡量保持簡單,建議您限制建立和使用的內容來源數目。

您可以編輯預先設定的內容來源 [本機 SharePoint 網站] 以指定編目排程;預設不會指定編目排程。對於任何內容來源,您可以手動啟動編目,但是建議您排定累加編目或啟用連續編目,以確保定期編目該內容。

基於下列原因,請考慮使用不同的內容來源,在不同的排程編目內容。

  • 配合伺服器停機與伺服器尖峰用量時段。

  • 將裝載於速度較慢之伺服器上的內容,和裝載於速度較快之伺服器上的內容分開編目。

  • 頻繁編目較常進行更新的內容。

將內容編目可大幅降低裝載內容之伺服器的效能。效果取決於主機伺服器是否有足夠的資源 (特別是 CPU 和 RAM) 可處理負載。因此,當您規劃編目排程時,請考慮採用下列最佳作法:

根據預設,在伺服器陣列的第一個 Search Service 應用程式中,預先定義的內容來源 [本機 SharePoint 網站] 至少包含下列兩個起始位址:

  • http://Web_application_public_URL,用於在 Web 應用程式中編目所有 SharePoint 網站

  • sps3://My_Site_host_URL,用於編目使用者設定檔

但是,如果您部署「人員搜尋」,建議您為起始位址 sps3://My_Site_host_URL 建立不同的內容來源,然後先為該內容來源執行編目。這麼做的原因是當編目完成後,搜尋系統會產生清單以標準化人員的名稱。如此一來,當某個人員的名稱在一組搜尋結果中有不同格式時,該人員的所有結果會顯示在單一群組 (稱為 [結果區塊])。例如,當搜尋查詢為 "Anne Weiler" 時,所有作者為 Anne Weiler 或 A. Weiler 或別名 AnneW 的文件都會顯示在標示為 "Documents by Anne Weiler" 的結果區塊。同樣地,作者為這其中任一項身分的所有文件都會顯示在精簡搜尋面板的 "Anne Weiler" 標題底下 (如果「作者」是其中一個類別)。

編目使用者設定檔然後編目 SharePoint 網站
  1. 確認執行此程序的使用者帳戶為您要設定之 Search Service 應用程式的管理員。

  2. 遵循<在 SharePoint Server 2013 中部署人員搜尋>中的指示。依據這些指示執行下列作業:

    1. 建立只用於編目使用者設定檔 (設定檔儲存) 的內容來源。您可以將該內容來源取名為 People。在新的內容來源中的 [起始位址] 區段,輸入 sps3://My_Site_Host_URL,其中 My_Site_host_URL 是 我的網站 主機的 URL。

    2. 開始對您剛建立的 People 內容來源進行編目。

    3. 從預先設定的內容來源 [本機 SharePoint 網站] 中刪除起始位址 sps3://My_Site_Host_URL

  3. People 內容來源的編目完成之後,等候約兩個小時。

  4. 開始內容來源 [本機 SharePoint 網站] 的第一次完整編目。

當您新增或編輯 [SharePoint 網站] 類型的內容來源時,[啟用連續編目] 是您可以選取的編目排程選項。連續編目會編目自上次編目後所新增、變更或刪除的內容。連續編目會在預先定義的時間間隔啟動。預設間隔為每隔 15 分鐘,但是您可以使用 Windows PowerShell,設定連續編目在更短的間隔內執行。連續編目由於執行頻率很頻繁,因此可以協助確保搜尋索引的新鮮度,即使面對的是經常更新的 SharePoint 內容也一樣。此外,當多次嘗試編目特定項目卻都傳回錯誤時,累加或完整編目會因此延遲,但是連續編目卻可以編目其他內容來保持索引的新鮮度,原因在於連續編目不會處理或重試傳回發生錯誤超過三次的項目 (若為已啟用連續編目的內容來源,則每四個小時會自動執行「清理」累加編目,以重新編目任何一再傳回錯誤的項目)。

單一連續編目會納入 Search Service 應用程式中已所有啟用連續編目的內容來源。同理,連續編目間隔會套用於 Search Service 應用程式中所有已啟用連續編目的內容來源。如需詳細資訊,請參閱<在 SharePoint Server 2013 中管理連續編目>。

連續編目增加編目目標及編目程式上的負載。請確定您計劃和向外延展據以這增加的資源使用率。啟用連續編目每個大型內容來源,我們建議您將一個或多個前端網頁伺服器設定為專用編目目標。如需詳細資訊,請參閱 <管理編目負載 (SharePoint Server 2010)

由於編目會耗用資源和頻寬,因此在初始部署期間,最好是編目您知道確實重要的少量內容,而不是編目為數較多、但可能有一部分並不相關的內容。若要限制編目的內容量,您可以基於下列原因建立編目規則:

  • 排除一或多個 URL,以避免編目不相關的內容。

  • 編目 URL 上的連結卻不編目 URL 本身。當網站本身不含相關內容但是含有相關內容的連結時,這相當有用。

根據預設,編目程式不會追蹤複雜 URL,也就是加上問號和額外參數的 URL,例如 http://contoso/page.aspx?x=y。如果您讓編目程式追蹤複雜 URL,可能會造成編目程式收集超乎意料或不適當的過多 URL。這麼做可能會使得編目程式收集不必要的連結、讓編目資料庫充滿冗餘的連結,而且讓索引無謂過大。

這些措施可以協助減少伺服器資源使用量和網路流量,並且可以增加搜尋結果的相關性。初始部署之後,您可以檢閱查詢和編目記錄,並適時調整內容來源和編目規則以納入更多內容。如需詳細資訊,請參閱<在 SharePoint Server 2013 中管理編目規則>。

當您編目 SharePoint Web 應用程式的預設區域時,查詢處理器會自動對應搜尋結果 URL,使其與從中執行查詢的備用存取對應 (AAM) 區域相關,然後才傳回 URL。如此可讓使用者馬上就能檢視及開啟搜尋結果。

但是,如果您編目預設區域以外的 Web 應用程式區域,查詢處理器不會對應搜尋結果 URL,因此這些 URL 就不會與從中執行查詢的 AAM 區域相關。搜尋結果 URL 會變成與所編目的非預設區域相關。因此,使用者無法馬上就檢視或開啟搜尋結果。

例如,假設您有下列 AAM 用於某個名為 WebApp1 的 Web 應用程式:

 

預設 公用 URL 驗證提供者

預設

https://contoso

Windows 驗證:NTLM

外部網路

https://fabrikam

表單型驗證

內部網路

http://fabrikam

Windows 驗證:NTLM

現在,假設您編目預設區域 https://contoso。當使用者從 https://contoso/searchresults.aspx 執行查詢時,來自 WebApp1 的結果 URL 會與 https://contoso 相關,因此其格式會是 https://contoso/path/result.aspx。

同樣地,當查詢是產生自外部網路 (在此案例中為 https://fabrikam/searchresults.aspx),來自 WebApp1 的結果會與 https://fabrikam 相關,因此格式會是 https://fabrikam/path/result.aspx。

在前述兩個案例中,由於查詢位置和搜尋結果 URL 之間有區域一致性,使用者馬上就能檢視和開啟搜尋結果,不需要變更為不同區域的安全性內容。

然而,現在假設您編目非預設區域,例如內部網路區域 http://fabrikam。在此案例中,對於從任何區域進行的查詢,來自 WebApp1 的 URL 結果一律會與所編目的非預設區域相關。也就是說,來自 https://contoso/searchresults.aspx、https://fabrikam/searchresults.aspx 或 http://fabrikam/searchresults.aspx 的查詢會產生以所編目的非預設區域開頭的搜尋結果 URL,因此格式會是 http://fabrikam/path/result.aspx。如此可能會造成非預期的或有問題的行為,像是:

  • 當使用者嘗試開啟搜尋結果時,系統可能會提示他們輸入他們沒有的認證。例如,外部網路區域中的表單型驗證使用者可能沒有 Windows 驗證認證。

  • 來自 WebApp1 的結果會使用 HTTP,但是使用者可能是從位於 https://fabrikam/searchresults.aspx 的外部網路區域進行搜尋。這可能會有安全性隱憂,因為結果並不會使用安全通訊端層 (SSL) 加密。

  • 精簡搜尋可能無法正確進行篩選,因為它們是對預設區域的公用 URL 進行篩選,而非對已編目的 URL 進行篩選。這是因為索引中的 URL 型屬性會與已編目的非預設 URL 相關。

您可以執行下列動作,減少在 SharePoint 編目目標 (也就是 SharePoint 前端網頁伺服器) 上進行編目造成的影響:

  • 對於小型 SharePoint 環境,將編目流量重新導向至單一 SharePoint 前端網頁伺服器。對於大型環境,將編目流量重新導向至特定一群前端網頁伺服器。如此可防止編目程式使用到用來呈現網頁與內容給使用者的相同資源。

  • 限制使用 Microsoft SQL Server 中的搜尋資料庫,以防止編目程式在編目期間使用共用的 SQL Server 磁碟與處理器資源。

如需詳細資訊,請參閱管理編目負載 (SharePoint Server 2010)

若要限制編目程式造成的影響,您也可以建立編目程式影響規則 (其會出現在 [Search_service_application_name:搜尋管理] 頁面)。編目程式影響規則會指定編目程式向一或多個起始位址要求內容的速率。具體而言,編目程式影響規則會指定要向 URL 一次要求指定數目的文件 (要求之間沒有等待時間),還是要向 URL 一次要求一份文件,並在要求之間等待指定的時間。每個編目程式影響規則均會套用至所有編目元件。

對於貴組織中的伺服器,您可以根據已知的伺服器效能和容量,設定編目程式影響規則。但是,對於外部網站可能無法這麼做。因此,您可能會不小心要求太多內容或太頻繁要求內容,造成外部伺服器上的資源使用過度。如此可能會使得這些外部伺服器的管理員限制伺服器存取,導致您難以甚至無法編目這些存放庫。因此,請設定編目程式影響規則來盡可能不影響外部伺服器,而您仍然能夠夠頻繁地編目足夠的內容,讓索引的新鮮度符合您的需求。

使用者或群組在網站上執行各種活動的能力是取決於您指派的權限層級。如果您個別新增或移除使用者的網站權限,或者如果您使用 SharePoint 群組來指定網站權限,而您變更群組的成員組成,則編目程式必須執行「純安全性編目」,以更新搜尋索引中所有受影響的項目來反映更新。同樣地,以不同的使用者或 SharePoint 群組新增或更新 Web 應用程式原則,將會觸發編目該原則涵蓋的所有內容。如此會增加編目負載並可能降低搜尋結果新鮮度。因此,若要指定網站權限,最好是使用 Active Directory 網域服務 (AD DS) 群組,因為這不需要編目程式在搜尋索引中更新受影響的項目。

當您建立 Search Service 應用程式時,預設搜尋拓撲會包含一個編目元件。編目元件會從內容存放庫擷取項目、將項目下載至裝載編目元件的伺服器、將項目和相關中繼資料傳送至內容處理元件,然後新增編目相關資訊至相關編目資料庫。您可以新增第二個編目元件以提供容錯。如果一個編目元件無法使用,另一個編目元件可以接管所有編目作業。對於大部分 SharePoint 伺服器陣列,有兩個編目元件即已足夠。

如需詳細資訊,請參閱下列 TechNet 文章:

當編目程式編目內容、將內容下載至編目伺服器 (即裝載該編目元件的伺服器),並將內容饋送至內容處理元件時,有好幾項因素可能會使效能降低。若要提升編目效能,您可以執行下列動作:

 

若要解決此潛在效能瓶頸 實作此解決方案

所編目伺服器的回應時間緩慢

提供更多的 CPU 與 RAM 和更快的磁碟 I/O

低網路頻寬

在每個編目伺服器上安裝一兩張 1Gbps 網路介面卡

內容處理

提供更多內容處理元件,並為每個內容處理元件提供更多 CPU 資源

索引元件的處理速度緩慢

為裝載索引元件的伺服器新增 I/O 資源

如需詳細資訊,請參閱下列資源:

在對搜尋拓撲進行變更之前,建議您先確認沒有編目正在進行中。否則,拓撲變更可能無法順利進行。

如果必要,您可以手動暫停或停止完整或累加編目,您也可以停用連續編目。如需詳細資訊,請參閱下列文章:

注意事項 附註:
暫停編目的缺點是編目元件的參照仍然留在搜尋管理資料庫的 MSSCrawlComponentsState 表格中。如果您要移除任何編目元件 (例如,因為您要從伺服器陣列中移除裝載這些元件的伺服器),則可能會造成問題。但是,當您停止編目時,MSSCrawlComponentsState 表格中對編目元件的參照就會刪除。因此,如果您要移除編目元件,最好是停止編目而不是暫停編目。

若要確認沒有編目正在進行中,請在 [Search_service_application_name:管理內容來源] 頁面上,確定每個內容來源的 [狀態] 欄位中的值為 [閒置] 或 [暫停] (當編目完成或您停止編目時,內容來源的 [狀態] 欄位中的值會變更為 [閒置])。

當伺服器中裝載編目元件時,從伺服器陣列移除該伺服器會讓搜尋系統無法編目內容。因此,在從伺服器陣列移除編目主機之前,強烈建議您先執行下列動作:

  1. 確定沒有編目正在使用中。

    如需詳細資訊,請參閱前一節<變更搜尋拓撲之前確定沒有編目正在使用中>。

  2. 移除或搬動該主機上的編目元件。

如需詳細資訊,請參閱下列資源:

建議您在變更設定或套用更新之後,測試伺服器陣列中的編目和查詢功能。下列程序是輕鬆執行此類測試的範例。

測試編目和查詢功能
  1. 確認執行此程序的使用者帳戶為您要設定之 Search Service 應用程式的管理員。

  2. 建立您僅會在此測試使用的暫時內容來源。

    在新的內容來源中,於 [起始位址] 區段的 [在下面鍵入起始位址 (每行一個)] 方塊指定起始位址,該位址包含尚未存在索引中的數個項目,例如某個檔案共用上的數個 TXT 檔案。如需詳細資訊,請參閱<在 SharePoint Server 2013 中新增、編輯或刪除內容來源>。

  3. 開始對該內容來源進行完整編目。

    如需詳細資訊,請參閱<在 SharePoint Server 2013 中啟動、暫停、繼續或停止編目>。當編目完成時,[Search_service_application_name:管理內容來源] 頁面上該內容來源的 [狀態] 欄的值將會是 [閒置]。(若要更新 [狀態] 欄,請按一下 [重新整理] 以重新整理 [管理內容來源] 頁面。)

  4. 當編目完成時,移至搜尋中心並且執行搜尋查詢以尋找這些檔案。

    如果您的部署還沒有搜尋中心,請參閱<在 SharePoint Server 2013 中建立搜尋中心網站>。

  5. 完成測試之後,刪除該暫時內容來源。

    如此會從搜尋索引中移除該內容來源所指定的項目,在您完成測試之後,這些項目就不會顯示在搜尋結果中。

編目記錄會追蹤所編目內容的狀態資訊。記錄中會包含內容來源、主機、錯誤、資料庫、URL 及歷程記錄的檢視。例如,您可以使用此記錄來判斷上次成功編目內容來源的時間、所編目的內容是否成功新增至索引、該內容是否因為編目規則而遭到排除,或者編目是否因為遇到錯誤而失敗。

編目狀況報表會提供有關編目速率、編目延遲、編目新鮮度、內容處理、CPU 和記憶體負載、連續編目及編目佇列的詳細資訊。

您可以使用編目記錄和編目狀況報表來診斷搜尋體驗的問題。診斷資訊可以協助您判斷調整各項元素 (如內容來源、編目規則、編目程式影響規則、編目元件及編目資料庫) 是否有幫助。

如需詳細資訊,請參閱<在 SharePoint Server 2013 中檢視搜尋診斷資料>。

https://technet.microsoft.com/zh-tw/library/jj219611.aspx
顯示: