在 SharePoint Server 中查看搜索诊断

 

**上一次修改主题:**2018-03-07

**摘要:**了解搜索和使用率报告、查询运行状况报告、爬网运行状况报告以及分析搜索系统运行状况的爬网日志。

您可以在 SharePoint Server管理中心中通过 Search Service 应用程序访问和分析多个查询和爬网运行状况报告、日志以及使用率报告,以便监视搜索系统的运行状况。

本文内容:

  • 开始之前

  • 查询运行状况报告

  • 爬网运行状况报告

  • 爬网日志

  • 使用率报告

开始之前

在开始此操作之前,请查看以下信息:

  • 只有在完成完全爬网后,运行状况报告和日志才会包含信息。

  • 要查看运行状况报告和爬网日志,您必须是 Search Service 应用程序的管理员。或者,Farm Administrators 组的成员管理员也可以授予用户帐户对 Search Service 应用程序的读取权限。拥有读取权限的用户帐户只能查看 Search Service 应用程序状态页、运行状况报告和爬网日志。

查询运行状况报告

SharePoint Server 提供以下与查询性能相关的报告:

  • 趋势

  • 整体

  • 主流

  • 联盟

  • SharePoint 搜索提供程序

  • 人员搜索提供程序

  • 索引引擎

查看查询运行状况报告

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员或者对 Search Service 应用程序具有读取权限。

  2. 在管理中心中的“应用程序管理”下,单击“管理服务应用程序”。

  3. 在“服务应用程序”页上,单击“Search Service”应用程序。

  4. 在“搜索管理”页上的“快速启动”中的“诊断”部分,单击“查询运行状况报告”。

  5. 在“Search Service 应用程序: 查询延迟趋势”页上,单击要查看的查询报告。

    下表显示了可用的报告。

    查询运行状况报告概述

    查询运行状况报告

    说明

    趋势(查询延迟趋势)

    在指定时间间隔内,以百分点值显示查询延迟(以毫秒为单位)。例如,所有查询中有 5% 的查询的延迟比图中第 5 个百分点值所示的延迟要低。

    图中包括指定时间间隔内重叠的查询率,其中查询率是查询对象模型 (OM) 每分钟返回的查询数。

    此图还包含重叠的爬网率和部分分析更新率。

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 客户端类型

    • 结果页(搜索结果页),仅当启用详细的日志记录时才显示。

    默认情况下,此图会显示 Search Service 应用程序所有结果页的数据。

    整体(整体查询延迟)

    在指定时间间隔内,显示具有重叠的查询延迟(以毫秒为单位)的查询率(每分钟的查询数)。

    显示以下各个方面的查询延迟:

    • 对象模型。此时间是 Web 服务器和后端之间通信所需的时间。

    • 后端。此时间是转换查询、执行索引查找、处理结果(例如移除重复项)以及将结果返回对象模型所需的时间。

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 客户端类型

    • 结果页(搜索结果页),仅当启用详细的日志记录时才显示。

    默认情况下,此图会显示 Search Service 应用程序所有结果页的数据。

    主流(默认 SharePoint 流查询延迟)

    在指定时间间隔内,显示查询和结果处理的主流查询延迟(以毫秒为单位)。该值指示系统处理查询并将结果返回 Web 服务器的速度。此图显示以下项的查询延迟:

    • 查询规则条件匹配

    • 查询转换

    • 查询传送

    • 结果混合

    • 版式选择

    • 查询日志记录

    • 其他

    图中包括指定时间间隔内重叠的查询率。

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 客户端类型

    联合(联合查询延迟)

    在指定时间间隔内,显示所有结果源类型的查询延迟(以毫秒为单位)。

    默认情况下,此图会显示 Search Service 应用程序所有结果页的数据。

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 客户端类型

    • 结果页(搜索结果页),仅当启用详细的日志记录时才显示。

    • 源类型(结果源类型):

    • 最佳匹配提供程序

    • Exchange 搜索提供程序

    • 本地人员提供程序

    • 本地 SharePoint 提供程序

    • OpenSearch 提供程序

    • 个人收藏夹提供程序

    • 远程人员提供程序

    SharePoint 搜索提供程序(本地 SharePoint 搜索流查询延迟)

    在指定时间间隔内,显示本地 SharePoint 搜索提供程序处理的所有查询的查询延迟(以毫秒为单位)。此图显示以下项的查询延迟:

    • 关键字分析

    • 语言

    • 建议安全修整

    • 安全令牌结构

    • 索引查找

    • 结果类型处理

    • 自定义安全修整

    • 摘要生成

    • 其他

    图中包括指定时间间隔内重叠的查询率。

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 客户端类型

    人员搜索提供程序(人员搜索流查询延迟)

    在指定时间间隔内,显示本地人员搜索提供程序处理的所有查询的查询延迟(以毫秒为单位)。此图显示以下各个方面的查询延迟:

    • 关键字分析

    • 语言

    • 人员预处理

    • 安全令牌结构

    • 索引查找

    • 结果类型处理

    • 自定义安全修整

    • 摘要生成

    • 其他

    图中包括指定时间间隔内重叠的查询率。

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 客户端类型

    索引引擎(索引引擎查询延迟)

    在指定时间间隔内,显示在其中执行筛选的每台索引服务器的查询延迟(以毫秒为单位)。默认情况下,此图会显示 Search Service 应用程序所有结果页的数据。可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 索引服务器(至少承载一个索引分区的计算机)

    • 结果页(搜索结果页),仅当启用详细的日志记录时才显示。

    图中包括过去指定时间间隔内重叠的索引查找时间。索引查找时间是在给定分钟数内索引引擎返回结果所需的平均时间。索引查找时间仅适用于索引引擎返回结果的查询。

爬网运行状况报告

SharePoint Server 提供以下爬网运行状况相关报告:

  • 爬网率

  • 爬网延迟

  • 爬网队列

  • 爬网新鲜度

  • 内容处理活动

  • CPU 和内存负载

  • 连续爬网

查看爬网运行状况报告

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员或者对 Search Service 应用程序具有读取权限。

  2. 在管理中心中的“应用程序管理”下,单击“管理服务应用程序”。

  3. 在“服务应用程序”页上,单击“Search Service”应用程序。

  4. 在“搜索管理”页上的“快速启动”中的“诊断”部分,单击“爬网运行状况报告”。

  5. 在“Search Service 应用程序: 爬网报告”页上,单击要查看的爬网运行状况报告。

    下表显示了可用的报告。

    爬网运行状况报告概述

    爬网报告

    说明

    爬网率

    在指定时间间隔内,显示以下内容的图形和摘要:

    • 每分钟爬网的内容项数。其中包括:

    • 总内容项数

    • 修改项数。这些项目是发生更改并重新爬网的内容项。

    • 未修改项数。这些项目是未发生更改并且未爬网的内容项。

    • 安全项数。这些项目是安全属性已更改的内容项。

    • 删除项数。这些项目是已在内容源中删除,同时还必须在索引中删除的内容项。

    • 每分钟执行的其他爬网操作的平均数。其中包括:

    • 重试次数(爬网重试次数)

    • 错误数(爬网错误数)

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 内容源(例如,本地 SharePoint 网站)

    • 计算机

    爬网延迟

    在指定时间内,显示构成爬网负载的以下各项的项数图:

    • 在爬网程序队列中

    • 等待提交进行内容处理

    • 已提交进行内容处理

    • 等待提交 (SQL)

    只能按计算机筛选此报告。

    在指定时间间隔内,同时显示爬网延迟的图形和摘要;各内容项通过馈送管道存在于以下各子系统中的时间(以毫秒为单位):

    • 爬网程序

    • 协议处理程序 (PH)

    • 存储库

    • SQL 时间

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 内容源(例如,本地 SharePoint 网站)

    • 计算机

    爬网队列

    在指定时间间隔内,显示以下两个爬网队列中的项数:

    • 链接到流程。此项是排队进行爬网的未爬网 URL 数。

    • 排队的事务数。此项是排队使用爬网管道处理的已爬网 URL 数。

    可以按开始日期/时间和结束日期/时间筛选此报告。

    爬网新鲜度

    在指定时间间隔内,显示由搜索系统编制索引的内容的新鲜度。可以比较各个文档上次修改的时间戳与图中指定的时间。您可以查看内容的新鲜度,如下所示:

    • 不到 1 个月以前

    • 不到 1 周以前

    • 不到 1 天以前

    • 不到 4 小时以前

    内容处理活动

    在指定时间间隔内,显示以下内容处理所用的时间:

    • 内容源

    • 计算机

    • 内容处理组件

    • 内容处理活动

    此图显示各种内容处理活动所用的时间,例如:

    • 语言处理

    • 文档分析

    • 文档摘要生成

    • 索引

    可以按以下条件筛选此报告:

    • 开始日期/时间

    • 结束日期/时间

    • 内容源

    • 计算机

    • 内容处理组件名称

    • 处理活动

    CPU 和内存负载

    在指定时间间隔内,显示使用 CPU 的百分比、内存使用量 (MB) 和这些过程的系统概述:

    • MSSDmn

    • MSSearch

    • NodeRunner

    • Timer

    可以按以下条件筛选此报告:

    • 计算机

    • 开始日期/时间

    • 结束日期/时间

    连续爬网

    在指定时间间隔内,显示这些过程所用的时间(以毫秒为单位)以及以下项目重叠的搜索时间(以分钟为单位):

    • 链接表中的时间

    • 队列表中的时间

    • 爬网程序时间

    • PH(协议处理程序)时间

    • 存储库时间

    • 内容管道时间

    • SQL 时间

    可以按以下条件筛选此报告:

    • 内容源

    • 开始日期/时间

    • 结束日期/时间

爬网日志

爬网日志可跟踪有关已爬网内容状态的信息。利用该日志,您可以确定是否已将已爬网内容成功添加到索引中,是否因爬网规则而排除已爬网内容,或者索引创建是否因错误而失败。爬网日志还包含有关上次成功爬网的时间以及是否应用了任何爬网规则的信息。您可以使用爬网日志诊断搜索体验问题。

查看爬网日志

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员或者对 Search Service 应用程序具有读取权限。

  2. 在管理中心中的“应用程序管理”下,单击“管理服务应用程序”。

  3. 在“服务应用程序”页上,单击“Search Service”应用程序。

  4. 在“搜索管理”页上的“快速启动”中的“诊断”部分,单击“爬网日志”。

  5. 在“爬网日志 – 内容源”页上,单击所需视图。

爬网日志视图

下表显示了在查看已爬网内容的状态时可以选择的不同视图。

爬网日志视图概述

视图 说明

内容源

按内容源汇总已爬网的项目。显示成功、警告、错误、顶级错误和已删除项目。该视图中的数据可表示每个内容源的索引中已有项目的当前状态。

还可以查看内容源上次爬网、过去 24 小时、过去 7 天和过去 30 天完成爬网所用的平均时间。可以查看爬网持续时间的发展情况,以及特定内容源大小是变小还是变大。

主机名

按主机汇总已爬网的项目。显示成功、警告、错误、已删除项目、顶级错误和爬网项目总数。该视图中的数据可表示每个主机索引中已有项目的当前状态。

爬网历史记录

汇总爬网过程中完成的爬网事务。一次爬网中每个项目可能有多个爬网事务,因此事务数可能大于项目总数。该视图可显示三种爬网数据:

  • 完全。对内容源中的所有项目进行爬网。

  • 增量。对自上次完全或增量爬网后更改的项目进行爬网。这种爬网仅按计划运行。

  • 删除。如果从内容源中删除起始地址,则在完全或增量爬网运行前,删除爬网时会删除与从索引中删除的起始地址关联的项目。这种爬网无法进行计划。

  • 连续。按非常短的间隔对 SharePoint 内容源中的项目进行爬网。

搜索管理数据库可提供该视图的数据。可以按内容源筛选结果。

此视图还会显示爬网率和存储库延迟。

错误细分

按内容源或主机名提供错误摘要。爬网数据库中的 MSSCrawlURLReport 表可提供该视图的数据。可以按内容源或主机进行筛选。

备注

筛选下拉框仅显示包含错误的内容源。如果没有显示在索引中的项目有错误,则该错误不会在此视图中列出。

数据库

使您可以查看此 Search Service 应用程序使用的爬网数据库的状态。

URL 视图

允许您按内容源、URL 或主机名搜索爬网日志,并查看索引中所有项目的详细信息。爬网数据库中的 MSSCrawlURLReport 表可提供该视图的数据。通过设置“状态”、“消息”、“开始时间”和“结束时间”字段,可以筛选结果。

请注意,URL 视图仅包含显示 URL。如果项目具有相同的显示 URL(例如,对于文件夹或视图),但访问 URL 不同,则同一显示 URL 将在此 URL 视图中出现多次。您可以直接查询爬网数据库,以查看具有相同显示 URL 的项目。

下表显示了哪些附加列可用于内容源、主机名和爬网历史记录视图。这些列将显示已爬网项目的相关信息。

内容源、主机名和爬网历史记录视图中的附加列概述

说明

成功

成功爬网并可搜索的项目。

警告

可能未成功爬网且可能不可搜索的项目。

错误

未成功爬网且可能不可搜索的项目。

顶级错误

首要文档(包括起始地址、虚拟服务器和内容数据库)中的错误。每个顶级错误被视为一个错误,但并非所有错误都被视为顶级错误。由于“错误”列包含“顶级错误”列中的计数,因此顶级错误不再计入主机名视图。

删除

已从索引中删除且不再能够搜索的项目。

未修改

在两次爬网之间未更改的项目。此列仅显示在爬网历史记录视图中。

安全更新

因项目安全设置发生变化而对其进行爬网。此列仅显示在爬网历史记录视图中。

安全错误

项目安全更新引起错误。此列仅显示在爬网历史记录视图中。

使用率报告

您可以使用“查看使用率报告”页上提供的使用率报告和搜索报告查看已收集的与此网站集有关的使用率数据。

查看使用率报告

  1. 确认执行此过程的用户帐户是 Search Service 应用程序的管理员或者对 Search Service 应用程序具有读取权限。

  2. 在管理中心中的“应用程序管理”下,单击“管理服务应用程序”。

  3. 在“服务应用程序”页上,单击“Search Service”应用程序。

  4. 在“搜索管理”页上的“快速启动”中的“诊断”部分,单击“使用率报告”。

  5. 在“查看使用率报告”页上,单击要查看的使用率或搜索报告视图。

下表显示了您可以选择的不同使用率报告和搜索报告。

使用率报告或搜索报告的概述

使用率报告或搜索报告 说明

查询数

此报告显示执行的搜索查询的数量。使用此报告可确定搜索查询量趋势,并确定较高和较低搜索活动的次数。

每天的热门查询

此报告显示最热门的搜索查询。使用此报告可了解访问者正查找的信息类型。

每月的热门查询

此报告显示最热门的搜索查询。使用此报告可了解访问者正查找的信息类型。

每天放弃的查询

此报告显示点击率较低的热门搜索查询。使用此报告可确定可能导致用户不满意的搜索查询,并提高内容的可发现性。然后,考虑使用查询规则改善查询结果。

每月放弃的查询

此报告显示点击率较低的热门搜索查询。使用此报告可确定可能导致用户不满意的搜索查询,并提高内容的可发现性。然后,考虑使用查询规则改善查询结果。

每天的无结果查询

此报告显示未返回结果的热门搜索查询。使用此报告可确定可能导致用户不满意的搜索查询,并提高内容的可发现性。然后,考虑使用查询规则改善查询结果。

每月的无结果查询

此报告显示未返回结果的热门搜索查询。使用此报告可确定可能导致用户不满意的搜索查询,并提高内容的可发现性。然后,考虑使用查询规则改善查询结果。

每天的查询规则使用

此报告显示查询规则触发的频率、它们使用的词典术语数以及用户点击其已升级结果的频率。使用此报告可查看查询规则和已升级结果对用户的有用程度。

每月的查询规则使用

此报告显示查询规则触发的频率、它们使用的词典术语数以及用户点击其已升级结果的频率。使用此报告可查看查询规则和已升级结果对用户的有用程度。