对内容进行爬网 (Office SharePoint Server 2007)

在部署服务器场时,已经对组织计划进行爬网以便可用于搜索查询的内容进行了爬网并编制了索引。对于本文,内容是可供爬网的项,例如网页、Microsoft Office Word 文档或 SharePoint 网站。但是,您必须持续执行内容爬网,而不只是为初始部署执行爬网,理由如下:

  • 您必须继续对在部署阶段创建的内容源进行爬网,以发现新内容并建立索引以及删除已从源服务器删除的内容的索引中的条目,等等。

  • 您需要定期评估是否需要对新的内容源进行爬网。例如,组织中的某个人可能需要允许服务器场的最终用户在文件共享、Internet 或 Intranet 上的网站或组织中的另一个 SharePoint 产品和技术服务器场中搜索内容。

此目标包括下面的子目标和任务:

  • 准备对内容进行爬网 (Office SharePoint Server 2007)。在确定了需要进行爬网的内容之后,您必须进行必要的准备才能对该内容进行爬网。这包括若干项任务,例如,创建一个或多个指定爬网内容的内容源;确保在索引服务器上安装了访问和分析该内容所需的 IFilter 和协议处理程序;以及考虑爬网对进行爬网的服务器的影响。

对于新的和现有的内容源,您通常至少要执行一次下面的任务(其中有些任务需要不断地执行):

另请参见

概念

规划内容爬网 (Office SharePoint Server)