規劃編目內容 (Office SharePoint Server)

本文內容:

  • 關於編目和索引內容

  • 識別要編目的內容來源

  • 規劃內容來源

  • 規劃驗證

  • 規劃通訊協定處理常式

  • 規劃管理編目的影響

  • 規劃編目規則

  • 規劃在伺服器陣列層級管理的搜尋設定

  • 以不同語言來為內容編製索引

  • 工作表

本文主旨為協助搜尋服務管理員瞭解 Microsoft Office SharePoint Server 2007 如何為內容編目及編製索引,並協助其規劃編目內容。

必須先編目要讓使用者查詢的內容,使用者才可以使用 Office SharePoint Server 2007 的企業搜尋。

本文中,內容是指可以編目的任何項目,例如網頁、Microsoft Office Word 文件、商務資料或電子郵件訊息檔。

在規劃編目內容時,應考量下列問題:

  • 要編目的內容實際位置?

  • 要編目的內容中,有部分是儲存在不同的來源嗎?例如檔案共用、SharePoint 網站、網站或其他地方。

  • 要編目特定來源中的所有內容,或只是一部分?

  • 要編目的內容是由什麼類型的檔案組成?

  • 要編目內容的時機及頻率為何?

  • 如何保護此內容安全?

使用本文的資訊來協助您回答這些問題,並針對要編目的內容,以及編目內容的方式和時機,制定必要的規劃決策。

我們會在本文的重點處,提示您填寫有關所閱讀之資訊的工作表區段。您可以在閱讀本文的過程中,將決定記錄在工作表上,或是在本文結束後一併記錄。無論哪一種方法,在部署搜尋解決方案時,完整的工作表都是無價的資產。

注意

本文說明將內容編目及編製成一個索引的規劃程序。如果在規劃編目內容的過程中,發現想要使用其他的內容索引,請在不同的工作表上記錄各共用服務提供者 (SSP) 的規劃決策。

Office SharePoint Server 2007 包含 Office SharePoint Server 搜尋服務,可用來為內容編目及編製索引。此服務是 SSP 的一部分,而使用特定 SSP 來編目的所有內容,都會編製在單一索引中。如需選擇用來為內容編製索引之 SSP 數量的詳細資訊,請參閱<規劃共用服務提供者>。

關於編目和索引內容

編目和索引內容是系統存取並剖析內容及其屬性 (有時稱中繼資料),以建立可供搜尋查詢之內容索引的程序。

若能成功將內容編目,編目程式就能存取及讀取想要供其搜尋查詢的個別檔案或內容組件。那些檔案的關鍵字和中繼資料儲存在內容索引中,有時稱為索引。索引是由儲存在索引伺服器之檔案系統中的關鍵字,以及儲存在搜尋資料庫中的中繼資料所組成。系統會維護以下三者之間的對應:關鍵字、與用來將關鍵字編目之個別內容組件相關聯的中繼資料,以及用來將內容編目的來源 URL。

注意

編目程式不會以任何方式變更主機伺服器上的檔案。反之,主機伺服器上的檔案只會被存取、讀取,而那些檔案的文字和中繼資料會被傳送到索引伺服器,以編製索引。然而,因為編目程式會讀取主機伺服器上的內容,所以主控特定內容來源的某些伺服器可能會更新所編目之檔案的最新存取日期。

識別要編目的內容來源

在很多情況下,貴組織的需求可能只是需要編目組織伺服器陣列中 SharePoint 網站包含的所有內容。在此情況下,可能不需要識別要編目的內容來源,因為可以使用預設內容來源,將伺服器陣列中的所有網站集合編目。如需預設內容來源的詳細資訊,請參閱本文後述的<規劃內容來源>。

很多組織也會需要將伺服器陣列外部的內容編目,例如網際網路上的檔案共用或網站。Office SharePoint Server 2007 可以將主控在其他 Windows SharePoint Services 或 Office SharePoint Server 伺服器陣列、網站、檔案共用、Microsoft Exchange 公用資料夾、IBM Lotus Notes 伺服器,以及儲存在資料庫中的商務資料之內容編目及編製索引。這樣可以大量增加可供搜尋查詢的內容數量。

然而,在許多情況下,您不會想要將伺服器陣列中的每個網站集合編目,因為儲存在某些網站集合中的內容可能在搜尋結果中是無關的。在此情況下,則必須執行其中一項作業,或二項都執行:

  • 記下不想編目的網站集合。如果您決定要使用預設內容來源,則必須確定不想編目之網站集合的起始位址沒有列在預設內容來源中。

  • 記下要編目之網站集合的個別起始位址。如果決定要建立其他內容來源,以用來編目此內容,則您需要知道這些起始位址。如需何時使用一或多個內容來源的詳細資訊,請參閱本文後述的<規劃內容來源>。

安裝 Infrastructure Update for Microsoft Office Servers 時,有兩種方式可以處理搜尋查詢,以便將搜尋結果傳回給使用者。您可以查詢 Search Server 內容索引,或者使用同盟搜尋。

提示秘訣:

請注意,Infrastructure Update for Microsoft Office Servers 提供具有同盟搜尋功能且先出現在 Search Server 2008 中的 Office SharePoint Server 2007。

這兩個方法各有優點。如需這兩種處理搜尋查詢之方式的比較,請參閱同盟搜尋概觀 (英文) (https://go.microsoft.com/fwlink/?linkid=122651&clcid=0x404) 。如需瞭解並使用同盟的文章清單和簡短描述,請參閱<使用同盟 (Office SharePoint Server)>。如需 Microsoft Office Servers 之基礎結構更新的詳細資訊,請參閱<安裝 Microsoft Office Servers 的基礎結構更新 (Office SharePoint Server 2007)>。

規劃內容來源

必須先決定內容位置,以及主控內容的伺服器類型,才可編目內容。收集此資訊之後,共用服務管理員可以建立一或多個用來將該內容編目的內容來源。這些內容來源會在編目期間提供下列資訊給編目程式:

  • 想要編目的內容類型,例如 SharePoint 網站或檔案共用。

  • 開始進行編目的起始位址。

  • 編目時所使用的行為,例如,從起始位址開始編目的深度,或是允許多少伺服器旋入。

  • 編目排程。

注意

使用特定內容來源編目內容,有時稱為「編目內容來源」。

本節將協助您規劃貴組織所需的內容來源。

預設內容來源叫做 [本機 Office SharePoint 伺服器網站]。共用服務管理員可以使用這個內容來源,將與 SSP 相關聯之所有 Web 應用程式中的所有內容編目及編製索引。根據預設,Office SharePoint Server 2007 會將在 Web 應用程式 (使用相同 SSP) 中建立的每個網站集合的最上層網站起始位址 (在此情況下為 URL) 新增到預設內容來源。

對某些組織來說,只使用預設內容來源來將其網站集合中的所有網站編目,即可滿足其搜尋需求。然而,許多組織都會需要其他內容來源。

建立其他內容來源的原因包括:

  • 將不同類型的內容編目。

  • 以與其他內容不同的排程來編目某些內容。

  • 限制或增加所編目之內容的數量。

共用服務管理員最多可以在每個 SSP 中建立 500 個內容來源,而每個內容來源最多可以包含 500 個起始位址。若要儘量簡化管理作業,應只建立所需的內容來源數量。

將不同類型的內容編目

每個內容來源只能編目一種類型的內容。亦即,可以建立一個包含 SharePoint 網站 URL 的內容來源,並建立另一個包含檔案共用 URL 的內容來源,但是無法建立單一內容來源來同時包含 SharePoint 網站和檔案共用的 URL。下表列出可供設定的內容來源類型。

此類型的內容來源 包括此類型的內容

SharePoint 網站

來自相同伺服器陣列或不同 Office SharePoint Server 2007、Windows SharePoint Services 3.0 或 伺服器陣列的 SharePoint 網站

來自 Microsoft Office SharePoint Portal Server 2003 或 Microsoft Windows SharePoint Services 2.0 伺服器陣列的 SharePoint 網站

注意

不像在 Office SharePoint Server 2007、Windows SharePoint Services 3.0 或 上編目 SharePoint 網站,編目程式無法從舊版 SharePoint 產品及技術來將網站集合中的所有子網站自動編目。因此,從舊版編目 SharePoint 網站時,必須指定要編目之每個最上層網站和每個子網站的 URL。將入口網站編目時,會將 Microsoft Office SharePoint Portal Server 2003 伺服器陣列之網站目錄中列出的網站編目。如需網站目錄的詳細資訊,請參閱關於網站目錄 (英文) (https://go.microsoft.com/fwlink/?linkid=88227&clcid=0x404) 。

網站

組織中不在 SharePoint 網站上的其他內容

網際網路網站上的內容

檔案共用

組織中檔案共用的內容

Exchange 公用資料夾

Microsoft Exchange Server 內容

Lotus Notes

儲存在 Lotus Notes 資料庫中的電子郵件訊息

注意

Lotus Notes 內容來源選項與所有其他類型的內容來源不同,必須安裝並設定適當的必要軟體,才會出現在使用者介面中。如需詳細資訊,請參閱<設定 Office SharePoint Server 搜尋以編目 Lotus Notes (Office SharePoint Server 2007)>。

商務資料

儲存在企業營運系統應用程式中的商務資料

規劃商務資料的內容來源

商務資料內容來源需要先將主控資料的應用程式登錄在商務資料目錄中。必須建立一或多個不同內容來源的商務資料內容來源類型來將商務資料編目。您可以建立一個內容來源來將登錄在商務資料目錄中的所有應用程式編目,或者可以建立分開的內容來源來將登錄在商務資料目錄中的個別應用程式編目。

負責規劃將商務資料整合到網站集合中的人員,通常與參與整體內容規劃程序的人員不同。因此,請將商務應用程式管理員納入內容規劃小組編制中,由他們指導您如何將其資料整合到其他內容中,並在網站集合上有效呈現這些資料。

如需規劃商務資料搜尋的詳細資訊,請參閱<規劃商務資料搜尋>。

依不同的排程來編目內容

共用服務管理員通常必須決定某些內容的編目頻率是否要比其他內容高。編目的內容量愈大,就愈有可能會從不同來源編目內容。這些不同來源的類型不一定相同,而且可能被主控在相對速度不同的伺服器上。

這些因素很可能會導致需要其他內容來源,在不同時間編目不同的內容來源。

依不同排程來編目內容的主要原因如下:

  • 要因應停機和用量尖峰期。

  • 增加較常更新之內容的編目頻率。

  • 將被主控在較慢主機伺服器上的內容與較快主機伺服器上的內容分開編目。

在許多情況下,必須在 Office SharePoint Server 2007 部署並執行一陣子之後,才可知道所有資訊。但有些決定是在作業階段期間制定的。然而,最好是在規劃期間考量這些因素,這樣就可以依據手邊的資訊的規劃編目排程。

以下二節將提供依不同排程來編目內容的相關資訊。

停機和用量尖峰期

考量主控要編目之內容的伺服器的停機和用量尖峰期。例如,若編目的內容是由伺服器陣列外的許多不同伺服器所主控,這些伺服器可能是依不同的排程備份;用量尖峰期也不同。通常無法控制伺服器陣列外的伺服器管理作業。因此,建議您與主控要編目之內容的伺服器管理員協調編目工作,以確保不會在停機或用量尖峰期嘗試編目其伺服器上的內容。

常見的情況會牽涉到不在組織控制內且與 SharePoint 網站內容有關的內容。可以將此內容的起始位址加入到現有的內容來源,或是為外部內容建立新的內容來源。由於外部網站的可用性會有很大的差異,所以為不同的外部內容加入個別的內容來源會很有幫助。這樣一來,外部內容的內容來源就可以與您的其他內容來源錯開編目時間。然後,可以依據負責各網站可用性的編目排程來更新外部內容。

經常更新的內容

在規劃編目排程時,請考量有些內容來源的更新頻率通常會比其他內容來源高。例如,若您知道某些網站集合或外部來源上的內容只在星期五更新,那麼一星期編目內容超過一次就會浪費資源。然而,您的伺服器陣列可能含有星期一到五都不斷更新,但通常不在星期六和星期日更新的其他網站集合。在這種情形下,可能會想要在每個工作日編目數次,週末只編目一或二次。

在環境中跨網站集合儲存內容的方法,可以指導您在各 Web 應用程式中為各網站集合建立其他內容來源。例如,若網站集合只儲存封存的資訊,則編目內容的頻率就不需要像儲存經常更新內容的網站集合那麼高。在這種情形下,您可能會想要用不同的內容來源來將這兩個網站集合編目,讓他們可以依不同的排程來編目,而不需要像其他內容的編目頻率來編目封存網站。

完整及累加編目排程

共用服務管理員可以為每個內容來源個別設定編目排程。他們可以針對每個內容來源指定一個時間來執行完整編目,在另一個時間執行累加編目。請注意,必須先為特定內容來源執行完整編目,才可執行累加編目。如果為尚未編目過的內容選擇累加編目,系統會執行完整編目。

注意

因為完整編目會將編目程式遇到且至少有讀取權限的所有內容編目,無論該內容之前是否曾編目過,所以完整編目會比累加編目花多很多的時間來完成。

建議您在規劃編目排程時,要根據執行搜尋服務之伺服器及主控編目內容之伺服器的可用性、效能和頻寬考量。

規劃編目排程時,請考量下列最佳作法:

  • 根據類似的可用性及可接受的整體資源使用量,為裝載內容的伺服器分組內容來源中的起始位址。

  • 在主控內容的伺服器為可用時,且伺服器的資源需求很低時,為每一個內容來源排定累加編目。

  • 以交錯方式編目排程,好讓伺服器陣列中的伺服器負載會分散在不同的時間。

  • 唯有在下一節列出之原因需要時,才排定完整編目。建議您執行完整編目的頻率要比累加編目少。

  • 排程必須在規劃完整編目之前立即進行完整編目的管理變更。例如,建議您將編目的建立時間排程在下次完整編目之前,如此一來即不需要再額外進行完整編目。

  • 請依據要執行編目之索引伺服器的容量來排定同時編目。建議您通常要錯開編目排程,這樣索引伺服器才不會同時使用多個內容來源來編目。為達最佳效能,建議您將內容來源的編目排程錯開。索引伺服器和主控內容的伺服器之效能決定了編目可重疊範圍。您可以隨著漸漸熟悉各內容來源的一般編目期間之後,再開發編目排程的策略。

執行完整編目的理由

搜尋服務管理員進行完整編目的原因包括:

  • 伺服器陣列中的伺服器上安裝了一或多個 Hotfix 或 Service Pack。如需詳細資訊,請參閱 Hotfix 或 Service Pack 的說明。

  • SSP 管理員新增了新的 Managed 屬性。

  • 要重新索引 Windows SharePoint Services 3.0 或 Office SharePoint Server 2007 網站上的 ASPX 頁面。

    注意

    編目程式找不到 Windows SharePoint Services 3.0 或 Office SharePoint Server 2007 網站上之 ASPX 頁面的變更時間。因此刪除個別清單項目時,累加編目不會重新編製檢視或首頁的索引。建議您定期對包含 ASPX 檔案的網站執行完整編目,以確保這些頁面都會重新經過索引。

  • 為解決累加編目連續失敗的狀況。在極少數的情況下,若累加編目在任何存放庫層級中連續失敗一百次,索引伺服器會將受影響的內容從索引中移除。

  • 已新增、刪除或修改編目規則。

  • 要修復損毀的索引。

  • 搜尋服務管理員已建立一或多部伺服器名稱對應。

  • 指派給預設內容存取帳戶或編目規則的帳戶已變更。

在下列情況下,即使是要求累加編目,系統還是會執行完整編目:

  • SSP 管理員停止了之前的編目。

  • 從備份還原了內容資料庫。

    注意

    如果正在執行 Infrastructure Update for Microsoft Office Servers,則可使用 stsadm 命令列工具的還原作業,以變更內容資料庫還原是否會引發完整編目。

  • 伺服器陣列管理員中斷後又重新連接內容資料庫。

  • 從未執行過網站的完整編目。

  • 變更記錄檔不包含正在編目之位址的項目。變更記錄檔中沒有正進行編目之項目的記錄時,無法執行累加編目。

  • 指派給預設內容存取帳戶或編目規則的帳戶已變更。

  • 要修復損毀的索引。

    依據損毀的嚴重性,如果在索引中偵測到損毀,系統可能會嘗試執行完整編目。

可以在初始部署之後,根據伺服器陣列中的伺服器及主控內容之伺服器的效能和容量,調整排程。

工作表動作

將針對初始部署所做的內容來源相關決定記錄在規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 之 [內容來源] 區段的表格內。

限制或增加所編目之內容的數量

可以針對各個內容來源選取要用多大的規模來編目該內容來源中的起始位址。也可以指定編目的行為,有時亦稱為編目設定。依據所選取的內容來源類型,可為特定內容來源選擇的選項會有些不同。然而,大部分選項都可以決定從內容來源中列出的每個起始位址算起,將要在階層中編目幾個層次深。請注意,此行為會套用至特定內容來源中的所有起始位址。如果需要將某些網站編目較深的層級,可以建立其他內容來源來包含那些網站。

依據所選取的內容來源類型,可用在各內容來源屬性中的選項各不相同。下表說明各個內容來源類型的編目設定選項。

內容來源類型 編目設定選項

SharePoint 網站

各起始位址之主機名稱下的所有項目

僅限各起始位址的 SharePoint 網站

網站

僅在各起始位址的伺服器中

僅限各起始位址的第一頁

自訂 — 指定頁面深度及伺服器旋入數目。

注意

此選項的預設值為不限頁面深度及伺服器旋入。

檔案共用

各起始位址的資料夾及所有子資料夾

僅限各起始位址的資料夾

Exchange 公用資料夾

各起始位址的資料夾及所有子資料夾

僅限各起始位址的資料夾

商務資料

編目整個商務資料目錄

編目所選取的應用程式

如上表所示,共用服務管理員可以使用編目設定選項來限制或增加所編目的內容數量。

下表說明設定編目設定選項時的最佳作法。

針對這個內容來源類型 如果此類型符合 請使用這個編目設定選項

SharePoint 網站

要包含網站本身的內容。

-或-

不想包含子網站上的可用內容,或是想要依不同排程來加以編目。

僅對每個起始位址的 SharePoint 網站進行編目

SharePoint 網站

要包含網站本身的內容。

-或-

想要以相同排程來將起始位址之下的所有內容編目。

編目各起始位址之主機名稱下的所有項目

網站

網站本身中的內容是相關的。

-或-

連結的網站的內容可能無關。

僅在各起始位址的伺服器中編目

網站

相關的內容只在第一頁上。

僅編目各起始位址的第一頁

網站

想要限制在起始位址上編目連結的深度。

自訂 — 指定要編目的頁面深度及伺服器旋入數目

注意

建議您先在連線狀況良好的網站上進行少量的編目,因為指定深度超過三個頁面或三部伺服器旋入,可能會編目整個網際網路。

檔案共用

Exchange 公用資料夾

子資料夾中的可用內容可能不是相關內容。

僅編目各起始位址的資料夾

檔案共用

Exchange 公用資料夾

子資料夾中的內容似乎是相關的。

編目各起始位址的資料夾及子資料夾

商務資料

登錄在商務資料目錄中的所有應用程式都含有相關的內容。

編目整個商務資料目錄

商務資料

並非登錄在商務資料目錄中的所有應用程式都含有相關的內容。

-或-

想要使用不同的排程編目某些應用程式。

編目所選取的應用程式

規劃檔案類型包含清單及 IFilter

唯有當相關的副檔名內含在檔案類型包含清單中,而且 IFilter 安裝在可支援那些檔案類型的索引伺服器上時,才能編目內容。在初始安裝期間,會自動包括數種檔案類型。當您在初始部署中規劃內容來源時,請決定您要編目的內容是否要使用不包含的檔案類型。如果檔案類型未包含在內,則必須在部署期間,在 [管理檔案類型] 頁面加入這些檔案類型,並確定已安裝並登錄支援該檔案類型的 IFilter。

Office SharePoint Server 2007 有提供數個 IFilter,而 Microsoft 及協力廠商有提供更多的 IFilter。如需如何安裝和登錄 Microsoft 提供之其他 IFilter 的相關資訊,請參閱如何針對 SharePoint Server 2007 與 Search Server 2008 註冊 Microsoft Filter Pack (https://go.microsoft.com/fwlink/?linkid=110532&clcid=0x404) (機器翻譯)。如有需要,軟體開發人員可以為新的檔案類型建立 IFilter。

另一方面,若要排除某些檔案類型不進行編目,可以從檔案類型包含清單中刪除該檔案類型的副檔名。如此將會排除具有該副檔名的檔案名稱,而不進行編目。

下表列出預設安裝之 IFilter 可支援哪些檔案類型,以及 [管理檔案類型] 頁面上預設啟用哪些檔案類型。

副檔名 預設的 IFilter 支援 預設包含的檔案類型

ascx

asm

asp

aspx

bat

c

cmd

cpp

css

cxx

def

dic

doc

docm

docx

dot

eml

exch

h

hhc

hht

hpp

hta

htm

html

htw

htx

jhtml

jsp

lnk

mht

mhtml

mpx

msg

mspx

nsf

odc

one

php

pot

pps

ppt

pptm

pptx

pub

stm

tif

tiff

trf

txt

url

vdx

vsd

vss

vst

vsx

vtx

xlb

xlc

xls

xlsm

xlsx

xlt

xml

IFilter 和 Microsoft Office OneNote

IFilter 無法供 Microsoft Office OneNote 所使用的 .one 副檔名使用。若希望使用者能夠搜尋 Office OneNote 檔案中的內容,則必須安裝 OneNote 適用的 IFilter。若要執行這項操作,您必須執行下列其中一個動作。

工作表動作

將針對初始部署之檔案類型包含清單及 IFilter 所做的相關決定記錄在 規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 的<檔案類型包含清單及 IFilter>一節中。

使用編目規則以限制或排除內容

當將起始位址新增至內容來源,並接受預設行為時,就會將該起始位址下的所有子網站或資料夾編目,除非使用一或數個編目規則來將其排除。

如需編目規則的詳細資訊,請參閱本文稍後的<規劃編目規則>。

規劃內容來源時的其他考量

無法使用多個內容來源來將相同的位址編目。例如,若使用特定的內容來源來將網站集合及其所有子網站編目,就不能依不同的排程,使用不同的內容來源來將其中一個子網站個別編目。為符合此限制,可能需要將部分網站個別編目。請考量下列案例:

在 Contoso 的 SSP 管理員想要將 http://contoso 編目,其中包含 http://contoso/sites/site1 及 http://contoso/sites/site2 子網站。他想要以不同於其他網站的排程來將 http://contoso/sites/site2 編目。為達此目的,他將 http://contoso 和 http://contoso/sites/site1 這兩個位址新增到一個內容來源,並選取 [僅對每個起始位址的 SharePoint 網站進行編目]。然後他將 http://contoso/sites/site2 新增到另一個內容來源,並且為該內容來源指定不同的排程。

除了將編目排程,在規劃內容來源時,還要考量其他事項。例如,要將起始位址分組在單一內容來源中,還是建立其他內容來源,主要依據管理方面的考量來將那些起始位址編目。管理員所做的變更通常會需要將特定內容來源完整更新。變更內容來源需要將該內容來源完整編目。若要簡化管理作業,就要用能夠讓管理員方便更新內容來源、編目規則及編目內容的方式來組織內容來源。

內容來源摘要

規劃內容來源時,請考量下列事項:

  • 特定內容來源只能用來編目下列內容類型之一:SharePoint 網站、非 SharePoint 網站的網站、檔案共用、Exchange 公用資料夾、Lotus Notes 資料庫及商務資料。

  • 共用服務管理員最多可以在每個 SSP 中建立 500 個內容來源,而每個內容來源最多可以包含 500 個起始位址。若要儘量簡化管理作業,應只建立絕對需要的內容來源數量。

  • 特定內容來源中的每個 URL 都必須是相同的內容來源類型。

  • 可以針對特定的內容來源,選擇要從起始位址開始編目的深度。這些組態設定會套用至內容來源中的所有起始位址。依據所選取的內容來源類型,有關可以從起始位址編目深度的可用選項會有所不同。

  • 您可以排程何時要對整個內容來源執行完整編目或累加編目。如需排程編目的詳細資訊,請參閱本文前述的<完整編目與累加編目排程>。

  • 共用服務管理員可以修改預設內容來源及/或建立其他內容來源來將其他內容編目。例如,他們可以將預設內容來源設定成也會將不同伺服器陣列上的內容編目,或是可以建立新的內容來源來將其他內容編目。

  • 若要有效編目貴組織所需的所有內容,則請使用要進行編目來源類型,以及規劃編目頻率所需的內容來源數量。

規劃驗證

當編目程式存取內容來源中列出的起始位址時,主控該內容之伺服器必須驗證編目程式,並授與其存取權。這表示編目程式所使用的網域帳戶必須至少具備該內容的讀取權。

預設內容存取帳戶是在將內容來源編目時,預設使用的帳戶。此帳戶是由共用服務管理員指定。或者,也可以使用編目規則來指定在特定內容編目時,使用不同的內容存取帳戶。無論是使用預設內容存取帳戶,還是藉由編目規則來指定的不同內容存取帳戶,使用的內容存取帳戶都必須要有所編目之全部內容的讀取權限,否則不會編目內容,也無法用於查詢。

建議您選取能夠最廣泛存取大多數編目內容的預設內容存取帳戶,並只有在安全性考量需要個別的內容存取帳戶時,才使用其他內容存取帳戶。如需如何建立個別內容存取帳戶,以編目無法使用預設內容存取帳戶來讀取的內容之詳細資訊,請參閱本文稍後的<規劃編目規則>。

請針對所規劃的每一個內容來源,識別預設內容存取帳戶無法存取的起始位址,並計劃為包含那些起始位址的 URL 模式新增編目規則。

注意

確定用於預設內容存取帳戶或任何其他內容存取帳戶的網域帳戶,不同於所編目之任何 Web 應用程式相關聯的應用程式集區所使用的網域帳戶。這麼做可讓 SharePoint 網站中未發佈的內容以及 SharePoint 網站中的次要版本檔案 (歷程記錄) 進行編目及編製索引。

如需內容存取帳戶規劃考量的詳細資訊,請參閱本文後述的<規劃編目規則>。

工作表動作

將編目程式在編目內容時所要使用的預設內容存取帳戶記錄在規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 的 [預設內容存取帳戶] 區段中。

另一項重要考量是編目程式必須使用與主機伺服器相同的驗證方法。根據預設,編目程式會嘗試使用 NTLM 驗證方法來驗證。若有需要,可以將編目程式設定為使用不同的驗證方法。如需詳細資訊,請參閱<規劃驗證方法 (Office SharePoint Server)>中的<編目內容的驗證需求>。

規劃通訊協定處理常式

編目的所有內容都需要使用通訊協定處理常式來取得該內容的存取權。Office SharePoint Server 2007 為所有常用的網際網路通訊協定提供通訊協定處理常式。然而,如果要編目之內容所需的通訊協定處理常式沒有隨 Office SharePoint Server 2007 一同安裝,則必須先安裝協力廠商或自訂的通訊協定處理常式,才可將該內容編目。

下表顯示預設安裝的通訊協定處理常式。

通訊協定處理常式 用於編目

Bdc

商務資料目錄

Bdc2

商務資料目錄 URL (內部通訊協定)

檔案

檔案共用

http

網站

https

安全通訊端階層 (SSL) 上的網站

Notes

Lotus Notes 資料庫

Rb

Exchange 公用資料夾

Rbs

SSL 上的 Exchange 公用資料夾

Sps

來自 Windows SharePoint Services 2.0 伺服器陣列的人員設定檔

Sps3

僅限 Windows SharePoint Services 3.0 伺服器陣列的人員設定檔編目

Sps3s

僅限來自 SSL 上之 Windows SharePoint Services 3.0 伺服器陣列的人員設定檔編目

Spsimport

人員設定檔匯入

Spss

來自 SSL 上之 Windows SharePoint Services 2.0 伺服器陣列的人員設定檔匯入

Sts

Windows SharePoint Services 3.0 根 URL (內部通訊協定)

Sts2

Windows SharePoint Services 2.0 網站

Sts2s

SSL 上的 Windows SharePoint Services 2.0 網站

Sts3

Windows SharePoint Services 3.0 網站

Sts3s

SSL 上的 Windows SharePoint Services 3.0 網站

工作表動作

將針對初始部署所做的通訊協定處理常式相關決定記錄在規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 的 [通訊協定處理常式] 區段中。

規劃管理編目的影響

將內容編目會大幅降低主控內容之伺服器的效能。這對特定伺服器的影響,取決於主機伺服器所經歷的負載量,以及伺服器是否具有足夠的資源 (尤其是 CPU 和 RAM),可在一般或尖峰用量之下維護服務層級協定。

編目程式影響規則可讓伺服器陣列管理員管理編目程式對所編目之伺服器的影響。您可以針對各編目程式影響規則來指定單一 URL,或是在 URL 路徑中使用萬用字元,以併入套用規則的 URL 區塊。然後您可以指定對指定的 URL 同時提出多少頁面要求,或選擇一次只要求一個文件,並等待您選擇的要求之間的秒數。

無論用來將位址編目的內容來源為何,編目程式影響規則都會減少或增加編目程式向特定起始位址或某範圍起始位址 (有時稱為網站名稱) 要求內容的速率。下表顯示新增規則時,可以在網站名稱中使用的萬用字元。

使用的萬用字元 結果

* 作為網站名稱

套用規則至所有網站。

*.* 作為網站名稱

套用規則至名稱中有句點的網站。

*.*site_name*.com 作為網站名稱

套用規則至 *site_name*.com 網域中的所有網站 (例如,*.adventure-works.com)。

*.*top-level_domain_name* 作為網站名稱

套用規則至以特定最上層網域名稱 (例如,*.com 或 *.net) 結尾的所有網站。

?

取代規則中的單一字元。例如,*.adventure-works?.com 會套用至 adventure-works1.com、adventure-works2.com 等網域中的所有網站。

可以建立套用至特定最上層網域中所有網站的編目程式影響規則。例如,*.com 會套用至位址以 .com 結尾的所有網際網路網站。例如,入口網站的管理員可能會新增 samples.microsoft.com 的內容來源。除非特地為 samples.microsoft.com 新增編目程式而影響規則,否則 *.com 的規則就會套用至這個網站。

可以針對組織中其他管理員所編目的內容來與那些管理員協調,並根據伺服器的效能和容量來設定編目程式影響規則。就大部分外部網站而言,此協調是不可能的。要求太多內容或提出要求過於頻繁,且所編目使用太多的資源或頻寬會致使這些網站的管理員限制您未來的存取。因此,最佳作法是降低編目速度。如此一來,就可以降低失去將相關內容編目之存取權的風險。

在初始部署期間,請將編目程式影響規則設定為盡量不要影響其他伺服器,而同時仍可經常編目足夠的內容,以確保編目內容的時效性。

在作業階段期間,可以根據您的經驗和編目記錄中的資料來調整編目程式影響規則。

工作表動作

將針對初始部署所做的編目程式影響規則相關決定,記錄在規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 的 [編目程式影響規則] 區段中。

規劃編目規則

編目規則會套用至特定 URL 或一組以萬用字元表示的 URL (也就是受該規則影響的路徑)。您可以使用編目規則來執行下列動作:

  • 排除一或多個 URL,以避免編目無關聯的內容。這樣也有助於減少使用伺服器資源及網路流量,並可增加搜尋結果的相關性。

  • 編目 URL 上的連結,但不編目 URL 本身。當包含連結的頁面沒有包含相關資訊時,這個選項對於具有相關內容連結的網站會很實用。

  • 讓複雜的 URL 可被編目。此選項會編目含有以問號來指定查詢參數的 URL。根據網站而異,這些 URL 不一定會包含相關內容。由於複雜的 URL 通常會重新導向至無關的網站,所以最好是只在已知複雜 URL 有提供相關內容的網站上啟用這個選項。

  • 使 SharePoint 網站上的內容成為 HTTP 頁面來進行編目。此選項是當 SharePoint 網站位於防火牆後面,或是當所編目的網站限制存取編目程式所使用的 Web 服務時,讓索引伺服器來編目 SharePoint 網站,。

  • 指定要使用預設內容存取帳戶、不同的內容存取帳戶,或是用來將指定 URL 編目的用戶端憑證。

注意

編目規則會同時套用在 SSP 中的所有內容來源。

特定網站位址的大多數內容通常都是相關的,但是特定子網站或該網站位址下的網站範圍則不相關。共用服務管理員可以選取一個集中的 URL 組合,為其建立排除不需要項目的編目規則,一方面可以充分提升索引內容的相關性,一方面可以充分降低對編目效能及搜尋資料庫大小的影響。當您規劃外部內容的起始位址時,建立編目規則來排除 URL 會特別有用,因為貴組織中的人員無法控制對資源使用量的影響。

在建立編目規則時,您可以在路徑中使用標準萬用字元。例如:

  • http://server1/folder* 包含 URL 以 http://server1/folder 開頭的所有 Web 資源。

  • *://*.txt 包括副檔名為 .txt 的所有文件。

由於編目內容會耗用資源和頻寬,所以包含您知道確實有關的少量內容會比包含大量但卻可能無關的內容更為理想。在初始部署之後,可以檢閱查詢記錄和編目記錄,並將內容來源和編目規則調整為更具相關性,然後再包含更多內容。

指定不同的內容存取帳戶

針對含有內容的編目規則,管理員可以選擇變更該規則的內容存取帳戶。除非編目規則中有指定其他帳戶,否則就會使用預設內容存取帳戶。為編目規則使用不同內容存取帳戶的主要原因,是因為預設內容存取帳戶沒有所有起始位址的存取權。可以為那些起始位址建立編目規則,並指定擁有存取權的帳戶。

注意

確定用於預設內容存取帳戶或任何其他內容存取帳戶的網域帳戶,不同於所編目之任何 Web 應用程式相關聯的應用程式集區所使用的網域帳戶。這麼做會導致 SharePoint 網站中未發佈的內容,以及 SharePoint 網站中的次要版本檔案 (歷程記錄) 被編目及編製索引。

工作表動作

將針對初始部署所做的編目規則相關決定記錄在規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 的 [編目規則] 區段中。

規劃在伺服器陣列層級管理的搜尋設定

除了在 SSP 層級進行的設定之外,在伺服器陣列層級管理的幾項設定也會影響內容的編目方式。在規劃編目方式時,請考量下列伺服器陣列層級搜尋設定:

  • **連絡人電子郵件地址:**將內容編目會影響所編目之伺服器的資源。您必須先在組態設定中提供當編目對伺服器有負面影響時,管理員可以連絡之組織人員的電子郵件地址,才可將內容編目。這個電子郵件地址會出現在所編目之伺服器的管理員記錄檔中,好讓那些管理員可以在編目對其效能和頻寬造成太大影響,或是發生其他問題時,有人可以連絡。

    該連絡人電子郵件地址的擁有者,應具備快速回應要求的必要專業知識與可用性。或者,您可以使用嚴密監視的通訊群組清單的別名來作為連絡人電子郵件地址。不論編目的內容是否會儲存在組織的內部,快速的回應時間都是很重要的。

  • **Proxy 伺服器設定:**可以選擇在編目內容時,是否要使用 Proxy 伺服器。所要使用的 Proxy 伺服器取決於 Office SharePoint Server 2007 部署的拓撲,以及貴組織中其他伺服器的架構。

  • **逾時設定:**逾時設定可用來限制 Search Server 在連接其他服務時,所等待的時間。

  • **SSL 設定:**安全通訊端階層 (SSL) 設定可決定 SSL 憑證是否必須完全符合編目內容。

工作表動作

將針對初始部署所做的伺服器陣列層級搜尋設定相關決定記錄在規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 的 [伺服器陣列層級搜尋設定] 區段中。

以不同語言來為內容編製索引

編目內容時,編目程式會決定在內容中找到的每個獨立文字。以空格分隔文字的語言相對地可讓編目程式輕易區別每個文字。在其他語言中,找出字與字之間的界限可能有點複雜。

Office SharePoint Server 2007 預設提供斷詞工具和字幹分析器,有助於以許多語言編目和索引內容。斷詞工具可以找出全文索引資料中的字緣,而字幹分析器能變化動詞。

如果您要編目下表所列的任何語言,Office SharePoint Server 2007 會自動使用該語言適用的斷詞工具和字幹分析器。星號 (*) 表示字幹分析功能預設是啟用的。

預設支援的語言 預設支援的語言

阿拉伯文

立陶宛文*

孟加拉文

馬來文

保加利亞文*

馬來亞拉姆文*

卡達隆尼亞文

馬拉提文

克羅埃西亞文

挪威文_巴克摩

捷克文*

波蘭文*

丹麥文

葡萄牙文

荷蘭文

葡萄牙文_巴西

英文

旁遮普文

芬蘭文*

羅馬尼亞文*

法文*

俄文*

德文*

塞爾維亞文_斯拉夫*

希臘文*

塞爾維亞文_拉丁*

古吉拉特文

斯洛伐克文*

希伯來文

斯洛維尼亞文*

印度文

西班牙文*

匈牙利文*

瑞典文

冰島文*

坦米爾文*

印尼文

特拉古文*

義大利文

泰文

日文

土耳其文*

坎那達文*

烏克蘭文*

韓文

烏都文*

拉脫維亞文*

越南文

當編目程式索引的內容為不支援的語言時,便會使用中性斷詞工具。如果中性斷詞工具未提供您想要的結果,您可以嘗試執行使用 Office SharePoint Server 2007 的協力廠商解決方案。

最佳作法是確定您已針對需要支援的每種語言安裝適當斷詞工具和字幹分析器。斷詞工具和字幹分析器必須安裝於所有執行 Office SharePoint Server 搜尋服務的伺服器上。

如需斷詞工具和字幹分析器的詳細資訊,請參閱<規劃多語系網站>。

工作表動作

將針對初始部署所做的斷詞工具及字幹分析器相關決定記錄在規劃編目內容工作表 (英文) (https://go.microsoft.com/fwlink/?linkid=73748&clcid=0x404) 的<斷詞工具及字幹分析器>一節。

工作表

若尚未這麼做,請將有關內容來源的規劃決策以及有關編目內容的其他決策記錄在下列工作表中:

如果決定在初始部署及設定期間,只建立部分已規劃的內容來源和編目規則,則可使用此工作表來作為持續作業的一部分。

下載本書

本主題隨附於下列可下載的叢書中,以便於閱讀與列印:

請參閱 Office SharePoint Server 2007 可下載的內容 (英文) 上提供的完整叢書清單。