了解 Exchange Server 2013 管理包如何报告系统运行状况

适用于:Exchange Server 2013

本主题提供有关 Exchange Server 2013 管理包如何监视和报告 Exchange 系统运行状况的信息。 在 Exchange 2013 管理包中,运行状况信息以简单方式汇总。 每当运行状况设置出现问题并触发升级应答器时,Windows 事件日志就会记录以下事件:

托管可用性

我们对 Exchange Server 2013 进行了一些架构更改。 其中一个重要的更改就是托管可用性功能,所有 Exchange 2013 组件都含有可检测问题并尝试恢复服务可用性的内置监视器。 Exchange 2013 管理包需要依靠此功能。 任何无法自动恢复的问题都会作为警报升级至 Exchange 2013 管理包。 Exchange 2013 中的各组件使用探测器、监视器和应答器这三个基本组件对自身状态进行监视。

托管可用性。

  • 探测:这些是测量各种组件的数据收集器集。 探测器有三种不同的类型:

    • 可对测量实际流量的综合端到端用户操作和检查进行测量的综合事务。
    • 可对实际客户流量进行测量的检查。
    • 可允许 Exchange 立即采取措施的通知。 在证书到期时触发的通知就是一个很好的示例。
  • 监视器:探测收集的数据传递给监视器,用于分析特定条件的数据,并根据这些条件确定特定组件是正常还是不正常。

  • 响应者:如果监视器确定组件运行不正常,它将触发响应方。 如果该问题可以修复,应答器会尝试使用内置逻辑修复该组件。 每个组件有多个响应者可用,但与 Exchange 2013 管理包相关的一个响应 者是“升级响应方”。 当触发升级应答器后,它会生成 Exchange 2013 管理包可以识别的事件,并将相应信息提交至该警报,向管理员提供解决问题所必需的信息。

Exchange 2013 中的每个组件都使用一组特定的探测、监视器和响应程序来监视自身。 这些探测器和监视器被称为运行状况设置。 例如,有大量探测器可用于收集与 ActiveSync 服务各方面有关的数据。 该数据由一组指定的监视器进行处理,可触发相应的应答器以修复其在 ActiveSync 服务中检测到的问题。 这些组件合起来就组成了 ActiveSync 运行状况设置。

Exchange 中的运行状况设置分为以下与管理包仪表板对应的四类:

  • 客户接触点
  • 服务组件
  • 服务器资源
  • 关键依存项

有关 Exchange 运行状况集的完整列表,请参阅 附录 A:Exchange 运行状况集

若要详细了解托管可用性,请参阅 服务器运行状况和性能

运行状况的汇总方式

本主题提供有关 Exchange Server 2013 管理包如何监视和报告 Exchange 系统运行状况的信息。 在 Exchange 2013 管理包中,运行状况信息以简单方式汇总。 每当运行状况设置出现问题并触发升级应答器时,Windows 事件日志就会记录以下事件:

日志名称 Microsoft-Exchange-ManagedAvailability/Monitoring
Source ManagedAvailability
日期 <事件的日期和时间>
事件 ID 4
任务类别 监控
级别 Error
关键字 <没有>
User SYSTEM
计算机 <Exchange 服务器的 FQDN>
说明 <升级响应方动态生成>

管理包代理可以检测和处理该事件。 通过使用该事件,托管可用性可以在 SCOM 内生成警报。 当相应问题解决之后,运行状况设置会返回正常状态,Windows 事件日志会记录以下事件:

日志名称 Microsoft-Exchange-ManagedAvailability/Monitoring
Source ManagedAvailability
日期 <事件的日期和时间>
事件 ID 1
任务类别 监控
级别 信息
关键字 <没有>
User SYSTEM
计算机 <Exchange 服务器的 FQDN>
说明 <升级响应方动态生成>

对 Exchange 早期版本进行监视的管理包已完全集中。 各 Exchange 服务器上的代理会收集数据,中央关联引擎会比较和评估这些代理报告的所有数据,以判断服务的总体运行状况。 在大规模环境中,此过程会导致复杂的关联,从而导致警报生成延迟。 Exchange 2013 不再使用警报关联。 相反,各服务器自行执行监视,并在必要时向 SCOM 发出警报,适用于高度可扩展的架构。

根据事件的影响以及触发事件的运行状况设置,问题会显示在 SCOM 控制台的不同类型中。 如果事件对用户造成影响,那么客户接触点指示灯会显示为不正常。 如果事件导致整个组件(如 OWA)不可用,那么服务组件指示灯会显示为不正常。 如果这是特定服务器的问题,那么相应的服务器运行状况指示灯会显示为不正常。 最后,如果问题与 Exchange 依赖的资源相关,那么关键依存项指示灯会显示为不正常。 有关这些类别的详细信息,请参阅 Exchange Server 2013 管理包入门