监视 Exchange 事件

 

上一次修改主题: 2006-04-07

将 Exchange 管理包与 Microsoft Operations Manager (MOM) 结合使用,可提供综合的筛选和查看工具,有助于监视与 Exchange 组织相关的事件。MOM 包括两个默认的事件视图,可从“Microsoft Operations Manager 2005 - 操作员控制台”中访问该视图:

  • 事件   此处列出了从被监视服务器中收集的事件。这些事件包括警告、错误以及信息。若要查看 Exchange 的专有信息,可按来源或事件 ID 进行排序。使用此视图可快速发现在组织内的服务器之间所发生的事件。例如,假设您发现出现了服务器邮件流错误。其他检查和一个排序就能显示该事件只发生在特定的地理站点,且不会妨碍其他用户的性能。使用此视图集中资源并纠正问题有助于从中心位置即时收集数据。
  • 任务状态   此目录中列出了处理计划任务的 MOM 相关事件。对于此事件,邮件流是要监视的重要事件之一。此视图列出了常规信息、警告和错误。可根据不同的条件(如匹配单词、类别或严重性)筛选此视图中的事件。

Exchange 管理包在需要监视的的邮件功能方面,提供了显著的灵活性。最少应监视下表中列出的项目。

最少应监视的邮件功能

测试 详细信息

服务器可用性

  • 服务器检测信号
  • 必要的服务正在运行。
  • 数据库已安装。
  • MAPI 登录检查验证正在正确运行。
  • 邮件流验证正在正确运行。
  • 无意外的服务终止。
  • 前端服务器监视测试正在正确运行。

运行的服务

  • 验证所有必要的服务正在每个服务器上运行。请注意,可为每台服务器配置监视服务列表。
  • 服务不运行时生成警报。

已安装的数据库

  • 验证已安装所有数据库。
  • 任何数据库开始卸载时生成警报。

MAPI 登录检查

  • 验证服务器可用性报告中显示无错误。此测试可验证 MAPI 客户端是否可访问每个存储,且可隐式地验证 Exchange 和 Active Directory 功能。

登录到测试帐户的邮箱

  • 验证客户端到服务器的连接,包括验证 Exchange 是否正在运行,数据库是否已安装以及 Active Directory 是否正常运行。
  • 使用此数据编译服务器可用性统计信息。

前端服务器监视

修改注册表以启用前端服务器监视之后,要执行下列测试:

  • 验证前端服务器上的服务是否正在运行。
  • 验证 Internet 客户端(包括 Outlook Web Access、Outlook Mobile Access 和针对运行 Exchange Server 2003 的计算机的 Exchange ActiveSync)是否可以连接。
  • 验证默认情况下是否会启用本地主机监视。
  • 验证公共 URL 是否可解析以及是否成功地连接到前端服务器。
  • 验证通过防火墙和/或代理服务器的连接是否正在运行。
  • 验证是否已执行负载平衡。

邮件流验证

  • 通过定期向每个服务器上的测试邮箱发送电子邮件,验证所选服务器间的邮件流。
  • 出现连续失败时生成警报。
  • 记录邮件传递延迟。

服务器运行状况监视

默认情况下,会将脚本和规则配置为监视主要运行情况指示器。这些指示器包括:

  • 可用磁盘空间
  • 邮件队列阈值
  • 配置和安全性
  • 性能阈值
  • SMTP 队列

可用磁盘空间

磁盘空间不足是导致 Exchange 失败的常见、却可预防的原因。该测试可监视为下列性能对象指定的计数器阈值:

  • 所有磁盘
  • 日志磁盘
  • SMTP 队列磁盘

可用磁盘空间测试可识别群集和 IFS,并使用 WMI 收集信息。它不使用性能数据。

邮件队列

  • 验证所有邮件队列(SMTP、MTA 和内部邮件传递队列)是否根据阈值处理邮件。
  • 验证邮件是否正常流通。
  • 找出可能导致电子邮件传递缓慢的队列长度问题,并识别结构中需要关注的问题。
  • 此数据以性能数据和 Exchange WMI 类为基础。

服务器配置和安全监视

  • 验证是否已启动 IIS 锁定工具。
  • 验证邮件跟踪日志共享是否已锁定。
  • 验证 URLScan ISAPI 筛选器是否已安装并运行。
  • 验证 SMTP 虚拟服务器是否无法匿名中继(SPAM 保护)。
  • 检查前端服务器是否存在邮箱。
  • 确定是否需要 SSL。
  • 验证日志文件是否在备份后成功清除。
  • 验证 SMTP 目录位于 NTFS 格式化驱动器上。
  • 验证每个存储组是否都已禁用循环日志记录。
  • 验证 HeapDeCommitFreeBlock 阈值注册表项的值是否正确。
  • 验证邮件跟踪是否已启用。

服务器性能

  • 超过磁盘响应阈值时生成警报,表明磁盘低速。
  • RPC 请求队列长度超过预期阈值时生成警报。持续的高值可能表示存在资源瓶颈。
  • 对提交到服务器的所有 RPC 请求的平均 RPC 延迟进行监视。
  • 监视 Outlook Mobile Access 延迟响应时间。

服务器性能问题会迅速转变为用户响应时间问题。如果对正确的对象进行监视并根据 MOM 提示应注意的问题进行操作,可快速解决这些问题。

数据库检查点深度和内存使用情况

默认情况下,如果下列计数器超过了标识的阈值,会生成警报:

  • Disk Read Latencies:50 ms
  • Disk Write Latencies:50 ms
  • ESE Log Checkpoint Depth: 800
  • Information Store Private Bytes:1 GB
  • Information Store Virtual Bytes:2.9 GB
  • MSExchangeIS:RPC Requests: 25
  • MSExchangeIS:RPC latency:200 ms
  • Outlook Mobile Access:Last response time:60 sec
 
显示: