收集有关当前搜索环境的信息 (SharePoint Server 2010)

 

适用于: SharePoint Server 2010

上一次修改主题: 2010-11-02

规划企业级搜索解决方案的一个重要步骤是收集有关当前环境的信息,其中包括以下类型的信息和报告:

  • 有关组织的信息

  • 有关拓扑的信息

  • 当前搜索设置

  • 性能和使用率报告

在规划搜索拓扑、爬网和联合、人员搜索以及最终用户搜索体验时需要用到这些信息。

组织信息

收集与组织有关的以下信息:

  • 企业级搜索解决方案的用户、业务和职能要求,以及任何服务级别协议 (SLA)。此信息将帮助您设计和构建搜索解决方案,并在测试过程中验证解决方案是否满足要求。

  • 现有服务器场管理员、搜索管理员、网站集管理员、网站所有者以及企业级搜索解决方案的任何其他利益干系人的联系信息。此信息将帮助您规划企业级搜索团队,它还将为规划、部署和运行期间进行的任何沟通与交流提供联系人列表。

拓扑信息

收集与拓扑有关的以下信息:

  • 当前拓扑示意图。在规划拓扑和人员搜索时需要参考这些示意图。

  • 应包含在搜索结果中的内容库的位置,包括 SharePoint 网站、网站、文件共享、Exchange 公用文件夹、业务数据源、用户配置文件存储、Lotus Notes 和外部网站。

  • 用户的位置。

当前搜索设置

如果从以前版本的 SharePoint 产品和技术开始,请收集有关当前搜索设置的以下信息:

  • 默认内容访问帐户

  • 内容源设置,包括每个内容源的以下设置:

    • 内容源名称

    • 内容源类型

    • 起始地址

    • 爬网设置

    • 完全爬网计划

    • 增量爬网计划

  • 爬网程序影响规则,包括每个爬网程序影响规则的以下设置:

    • 网站 (URL)

    • 请求频率

  • 爬网规则,包括每个爬网规则的以下设置:

    • 路径

    • 爬网配置(排除或包括的项目)

    • 内容访问帐户

  • 第三方或自定义连接器(在以前的版本中称为协议处理程序)

  • 文件类型包含列表中包含的文件类型,以及它们是否需要额外的 IFilter

  • 从文件类型包含列表中删除的文件类型

  • 为其安装了分词器和词干分析器的语言

  • 场级别的搜索设置,包括下列信息:

    • 联系人电子邮件地址

    • 代理服务器设置(地址、端口、对本地地址是否绕过代理服务器,以及不想对其使用代理服务器的地址)

    • 爬网程序超时设置(连接时间和请求确认时间)

    • SSL 证书警告配置

  • 范围设置

  • 爬网设置

  • 以下附加设置:

    • 联合位置

    • 服务器名称映射

    • 索引器性能设置

    • 已爬网属性

    • 托管属性

    • 删除搜索结果

    • 通知

    • 关键字

    • 最佳匹配

    • 权威页面

性能和使用率报告

收集以下性能和使用率数据:

  • 搜索管理报告中的性能指标(如果可用)。在规划拓扑时将会用到此信息。有关详细信息,请参阅使用搜索管理报告 (SharePoint Server 2010)

  • Web Analytics 报告中的使用率指标。在设计搜索的最终用户体验时将会用到此信息。

See Also

Concepts

确定企业级搜索团队和利益干系人 (SharePoint Server 2010)
规划爬网和联合 (SharePoint Server 2010)