编辑爬网程序影响规则 (Office SharePoint Server 2007)

本文解释了如何编辑爬网程序影响规则。在执行此过程之前,请确认以下内容:

Important重要说明:

您必须是服务器场管理员才能完成本文中提供的过程。

添加爬网程序影响规则时,可指定下列限制之一,以便对指定的网站进行爬网:

  • 爬网程序每次可从指定网站中请求的最大文档数。

  • 爬网程序可从指定的网站中请求文档的频率。

编辑爬网程序影响规则

在大多数情况下,可通过编辑爬网程序影响规则来调整爬网程序从特定网站请求不同的内容片段的频率。使用以下过程可编辑爬网程序影响规则。

编辑爬网程序影响规则

  1. 根据您的安装状态,完成以下步骤之一。

    • 如果安装了 Microsoft Office Server 的基础结构更新,请在管理中心“快速启动”的“共享服务管理”组中,单击某共享服务。

      在“共享服务管理”页上的“搜索”部分,单击“搜索管理”。

      在“搜索管理”页上的“爬网”部分,单击“爬网程序影响规则”。

      Note

      有关详细信息,请参阅 Microsoft Office Server 的基础结构更新说明 (https://go.microsoft.com/fwlink/?linkid=121886&clcid=0x804)。

    • 如果未安装 Microsoft Office Server 的基础结构更新,请在管理中心的“应用程序管理”选项卡上的“搜索”部分,单击“管理搜索服务”。

      在“管理搜索服务”页面上的“服务器场级搜索设置”部分中,单击“爬网程序影响规则”。

  2. 在“爬网程序影响规则”页上的“网站”列中,指向要编辑的爬网程序影响规则,然后单击显示的菜单中的“编辑”。

  3. 如果要更改此规则应用于的网站的名称,请转到步骤 5。否则,请跳至步骤 6。

  4. 在“编辑爬网程序影响规则”页上的“网站”部分的“网站”框中,键入将与此爬网程序影响规则关联的网站名称。

    备注

    键入该 URL 时,不得包含协议。例如,请不要包括 http:// 或 file://。

  5. 如果希望爬网程序一次最多请求指定的文档数,请转到步骤 7。否则,如果希望爬网程序一次请求一个文档,并在各请求之间等待指定的时间,请跳至步骤 8。

  6. 在“请求频率”部分中,选择下列选项之一:

    • 一次最多请求指定的文档数,并且在两次请求之间不等待。如果您选择此选项,则使用“同时请求数”列表来选择您希望爬网程序在对此 URL 进行爬网时一次请求的文档数量。可以指定 Office SharePoint Services 搜索服务在对此 URL 进行爬网时一次发出的最大请求数。

    • 一次请求一个文档,并在两次请求之间等待指定的时间。您可以指定在对此 URL 进行爬网时两次请求之间的延迟(秒)。选择此选项时,Office SharePoint Server 搜索服务一次向每个网站发出一个请求,然后等待指定的时间,之后再发出下一个请求。在“等待时间(秒)”框中,键入两次请求之间的等待时间(秒)。两次请求之间的最短等待时间为 1 秒,最长时间为 1,000 秒。

  7. 单击“确定”。