监视运行状况和性能

 

上一次修改主题: 2008-06-10

Exchange 服务器配有运行状况和性能问题的指示器。Exchange 管理包包含用于监视性能指示器(例如邮件队列、磁盘使用情况、CPU 负载和其他阈值)的规则。可以按照您的要求启用和禁用这些规则。上述规则可检查下列事项:

  • 可用磁盘空间阈值   必须检查磁盘空间的使用情况,以确保可用性并有助于规划升级。
  • 邮件队列阈值   此规则组中所包含的队列大小和延迟时间的阈值有助于提供与 SMTP 传输中的潜在故障有关的警报。
  • 服务器配置和安全   可以使用此组中的规则检查安全和设置。
  • 服务器性能阈值   可以使用此组中的规则检查与 CPU 使用情况、延迟时间等有关的整体服务器性能。
  • SMTP 远程队列阈值   可以使用此组检查出站队列、增长和大小。
  • Windows 更新   若要统一应用 Windows 更新,可以指定更新,并检查每台服务器以验证更新是否已安装。这样有助于保证一致且集中的更新策略。

每个组件及其功能将在以下各节中进行讨论。

可用磁盘空间阈值

“可用磁盘空间阈值”组中的规则可提供基于磁盘空间使用情况的警报。可用空间低于定义的阈值时,将生成警报。运行脚本的规则为“检查可用磁盘空间”规则。“检查可用磁盘空间”脚本将每个本地卷都归类为下面其中一个类别:

  • 包含带有 Exchange 2003 事务日志文件的卷
  • 包含带有 Exchange 2003 SMTP 队列目录的卷
  • 包含带有 SMTP 队列目录和事务日志文件的卷
  • 包含不属于上述类别且不带事务日志文件和 SMTP 队列目录的卷

根据卷类别,脚本会适时生成警告事件或错误事件。对于每个类别,脚本都有四个不同的阈值。其中两个阈值与警告事件相关,而另外两个与错误事件相关。如果严重性级别为“错误”或更高,则会发送通知。如果某个卷属于多个类别,并且为不同类别设置了不同的阈值,则会使用最保守的阈值。每个类别都包含绝对阈值和百分比阈值。如果希望自定义阈值,则必须确定相对于绝对阈值的百分比阈值。

此组包含下列事件规则:

  • Exchange 2003 事务日志驱动器的磁盘空间不足   发生 MOM 事件 9976 时,生成警报。此事件表明,对于包含 Exchange 事务日志文件的卷而言,可用磁盘空间的百分比和绝对大小都低于当前的警告阀值。
  • Exchange 2003 简单邮件传输协议 (SMTP) 队列和事务日志驱动器的磁盘空间不足   发生 MOM 事件 9978 时,生成警报。此事件表明,对于包含 Exchange 事务日志文件和队列的卷而言,磁盘可用空间的百分比和绝对大小都低于当前的警告阀值。
  • Exchange 2003 简单邮件传输协议 (SMTP) 队列驱动器的磁盘空间不足   发生 MOM 事件 9974 时,生成警报。此事件表明,对于包含 SMTP 队列的卷而言,磁盘可用空间的百分比和绝对大小均低于当前的警告阈值。
  • Exchange 2003 简单邮件传输协议 (SMTP) 队列驱动器的磁盘空间严重不足   发生 MOM 事件 9973 时,生成警报。此事件表明,对于包含 SMTP 队列的卷而言,磁盘可用空间的百分比和绝对大小均低于当前的警告阈值。这是一个更加严重的警报,在可用空间严重低于阈值时通知您。
  • 可用磁盘空间不足   发生 MOM 事件 9972 时,生成警报。此事件表明,对于本地磁盘而言,磁盘可用空间的百分比和绝对大小均低于当前的警告阈值。对于 Exchange 服务器,此事件是指除包含 Exchange 事务日志文件或 Exchange 队列文件的那些卷以外的卷。
  • Exchange 2003 简单邮件传输协议 (SMTP) 队列和事务日志驱动器的磁盘空间严重不足   发生 MOM 事件 9977 时,生成警报。此事件表明,对于包含 Exchange 事务日志文件和队列的卷而言,磁盘可用空间的百分比和绝对大小都低于当前的严重错误阀值。应该立即解决此问题,因为事务日志卷上的空间不足要花很长时间才能从中恢复。
  • 检查可用磁盘空间   此基础脚本可检查每个本地磁盘上可用空间的百分比。默认情况下,每隔 30 分钟运行一次。
  • 可用磁盘空间严重不足   发生 MOM 事件 9971 时,生成警报。此事件表明,对于本地磁盘而言,磁盘可用空间的百分比和绝对大小均低于当前的警告阈值。对于 Exchange 服务器,此事件是指除包含 Exchange 事务日志文件或 Exchange 队列文件的那些卷以外的卷。
  • Exchange 2003 事务日志驱动器的磁盘空间严重不足   发生 MOM 事件 9975 时,生成警报。此事件表明,对于包含 Exchange 事务日志文件的卷而言,磁盘可用空间的百分比和绝对大小都低于当前的警告阀值。

邮件队列阈值

“邮件队列阈值”规则组中的规则可检查邮件流。这些规则在邮件流中断时以及严重性级别为“错误”或更高时生成警报。这些规则可查看作为性能数据提供的所有邮件队列的长度。两个主要的队列类别是简单邮件传输协议 (SMTP) 和邮件传输代理 (MTA)。

根据所检查的计算机中邮件流的级别,可能必须调整阈值以使计算机对邮件流中断保持不同的敏感度。为了帮助确定适合特定部署的阈值,请使用随此管理包提供的视图检查这些队列的长度。

此组包含下列性能规则:

  • 发送到 MTA 的邮件的 Exchange Information Store 服务队列 > 50   此规则可跟踪当前传递到 MSExchangeMTA 的邮件数。它使用 MSExchangeIS Transport Driver 性能对象。
  • Exchange 2003: SMTP: 本地重试队列 >50   此规则跟踪那些等待传递到之前已传递失败的数据库中的邮件队列。它跟踪 SMTP Server 对象及其 Total Retry Queue Length 计数器。
  • Exchange 2003: SMTP: 暂缓路由的邮件 >50   此规则跟踪已经分类但尚未路由的邮件数量。它使用 SMTP Server 对象及其 Messages Pending Routing 计数器。
  • 公用文件夹复制: PF 接收队列深度始终为 >10   此规则跟踪公用文件夹复制接收队列。它使用 MSExchangeIS Public 对象以及 Receive Queue Size 计数器。大多数情况下,其值应接近零。如果队列深度持续大于 10,则表示公用文件夹未与其他服务器保持同步。
  • 邮箱存储: 接收队列 >25   此规则跟踪 MSExchangeIS Mailbox 对象及其 Receive Queue Size 计数器。Receive Queue Size 是邮箱存储接收队列中的邮件数。
  • 信息存储传输临时表条目 > 600   此规则跟踪 Exchange 传输所使用的 Microsoft Exchange Information Store 服务临时表中当前的条目数。它使用 MSExchangeIS Transport Driver 对象以及 TempTable Current 计数器。
  • 每个连接的 MTA 队列长度 > 50   此规则使用 MSExchangeMTA Connections 对象以及 Queue Length 计数器。此计数器跟踪排队等待传输到数据库和挂起重新路由队列的待处理邮件。
  • Exchange 2003: SMTP: 远程队列 >500   此规则使用 SMTP Server 对象和 Remote Queue Length 计数器。它跟踪远程队列,该远程队列可将邮件发送到其他服务器。这是所有远程队列的总数。
  • 邮箱存储: 发送队列 >25   此规则使用 MSExchangeIS Mailbox 对象和 Send Queue Size 计数器。它跟踪正在等待从 Microsoft Exchange Information Store 服务传输到 IIS 的邮件数。
  • Exchange 2003: SMTP: 远程重试队列 >500   此规则使用 SMTP Server 对象和 Remote Retry Queue Length 计数器跟踪远程队列中无法发送到目标服务器的邮件数量。
  • Exchange 2003: SMTP: SMTP 队列目录中的邮件 >500   此规则跟踪存储在物理磁盘上的队列中的邮件数。它使用 SMTP NTFS Store Driver 对象以及 Messages In Queue Directory 计数器。
  • MTA 工作队列 > 50   此规则跟踪 MTA 尚未处理完成的邮件数。它使用 MSExchangeMTA 对象以及 Work Queue Length 计数器。
  • Exchange 2003: SMTP: 本地队列 >50   此规则使用 SMTP Server 对象和 Local Queue Length 计数器跟踪等待传递到 Microsoft Exchange Information Store 服务的消息队列。
  • 来自 MTA 的邮件的信息存储队列 > 25   此规则跟踪从 MTA 传递到 Exchange 存储的邮件数。它使用 MSExchangeIS Transport Driver 对象以及 Current Message From MSExchangeMTA 计数器。
  • Exchange 2003: SMTP: 分类程序队列 >50   此规则通过 SMTP Server 对象和 Categorizer Queue Length 计数器跟踪分类程序队列。此队列将在本主题前面的“邮件流阈值”中进行讨论。

大邮箱

如果需要收集用于报告的信息,可以直接从日志分析数据或者访问 MOM 数据库以获取数据。应注意,MOM 数据库只收集前 100 位用户的信息。默认情况下,在 Exchange 管理包中存在一个用来限制收集前 100 个邮件跟踪日志条目的脚本参数。可以修改此脚本,以便收集更多或所有条目,但是不建议这样做。因为分析邮件跟踪日志、读取 MOM 数据库以及修改脚本可能会影响 Exchange 服务器的性能,应先在实验室中测试解决方案,然后再部署到生产服务器上。

服务器配置和安全

“服务器配置和安全”规则组中的规则可检查 Exchange 服务器中的配置错误和安全错误。此组包含的规则可用于验证循环日志记录、SMTP 匿名中继、前端服务器上的邮箱和日志文件截断等问题。

其他规则组包含与服务器配置有关的其他规则。包括检查相应的服务器上是否已启用 /3GB 开关。如果严重性级别为“错误”或更高,则会发送通知。

此组包含下列规则:

  • 验证是否已启动 IIS 锁定向导   此规则运行“Microsoft Operations Manager\规则\高级\脚本\Exchange 2003 - 验证 IIS 锁定”脚本,通过验证注册表项来确定是否已启动 IIS 锁定工具。IIS 锁定仅适用于 Microsoft Windows® 2000 Server 计算机。在较新的服务器上,该脚本不会运行。如果 IIS 锁定工具未启动,该脚本将生成事件 8144。
  • 匿名中继的 SMTP 虚拟服务器   可以使用虚拟 SMTP 服务器进行匿名中继。如果允许匿名访问 SMTP 虚拟服务器并允许通过此虚拟服务器中继所有 IP,则将生成警报。
  • URLScan ISAPI 筛选器已禁用   如果 URLScan Internet 服务器应用程序编程接口 (ISAPI) 筛选器未运行,则会生成警报和事件 ID 8164。此筛选器只对 Windows 2000 至关重要。通过检查 HTTP 头信息并根据 URLScan.ini 配置文件筛选请求,可用来保护 Web 服务器以免受到威胁。
  • 验证 URLScan ISAPI 筛选器是否已安装并运行   此规则通过运行脚本来确定 URLScan ISAPI 筛选器是否正在运行。
  • 验证 SMTP 虚拟服务器是否无法匿名中继(SPAM 保护)   此规则运行使用 Active Directory 服务接口 (ADSI) 和协作数据对象 (CDO) 的脚本,以此来确定每个 SMTP 虚拟服务器的匿名中继。该脚本为每个允许匿名中继的虚拟服务器生成事件 8083。
  • **检查前端服务器上是否存在邮箱 **  此规则通过运行脚本来查找前端服务器上的邮箱。为每台包含邮箱的前端服务器生成事件 8203。
  • Exchange 事务日志文件等于或超过允许的最大天数   如果日志文件等于或超过该设置中配置的最大天数,“Microsoft Operations Manager\规则\规则组\Microsoft Exchange 2003 Server\服务器运行状况监视\服务器配置监视\验证备份是否正在截断日志文件(按修改时间)”脚本将生成警报。
  • 需要使用 SSL 以便保护对 Exchange 服务器的 HTTP 访问   如果服务器配置允许对敏感数据进行非 SSL 数据传输,该规则将生成警报。为任何接受匿名身份验和基本身份验证的后端 HTTP 虚拟服务器配置安全套接字层 (SSL),且始终为任何前端服务器配置 SSL。
  • 邮件跟踪日志将“Everyone”组列在 ACL 权限中   为了避免未经授权的用户读取邮件跟踪日志,应将 Everyone 组从访问控制列表 (ACL) 权限中删除。如果授予此权限,则将生成警报。
  • 验证每个存储组的循环日志记录设置   此规则使用的“Microsoft Operations Manager\规则\高级\脚本\Exchange 2003 - 验证每个存储组的循环日志记录设置是否正确”脚本将确定每个存储组的循环日志记录设置是否正确。该脚本将为每个未正确设置循环日志记录状态的存储组生成一个事件。
  • HeapDeCommitFreeBlockThreshold 注册表项的值不正确   在物理内存为 1GB 的服务器上,HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\HeapDecommitFreeBlockThreshold 注册表项应设置为 262144,有助于减少堆碎片。如果设置为其他注册表值,此规则将生成警报。
  • 验证是否已启用邮件跟踪   此规则通过运行脚本来确定是否已启用邮件跟踪,如果未启用,则将生成警报。
  • SMTP 目录不在 NTFS 格式化驱动器上   此规则通过运行脚本来确定 Queue、Pick Up 和 BadMail SMTP 目录是否不在 NTFS 文件系统驱动器上。
  • 未启用邮件跟踪   必须启用邮件跟踪才能跟踪未传递邮件并解决邮件流问题。如果禁用邮件跟踪,则将生成事件 8043 和警报。
  • **在服务器上找不到 IIS 锁定 **  在 Windows 2000 服务器上,Exchange 运行 IIS 锁定工具。如果未运行,则将生成警报。

服务器性能阈值

“服务器性能阈值”规则组检查可以指示性能不佳的性能计数器。这些计数器包括 RPC requests、disk reads and writes 和 CPU use。如果严重性级别为“错误”或更高,则会发送通知。

除非明确指明,否则 Exchange 2000 Server 和 Exchange Server 2003 均包含下列性能规则:

  • MSExchangeIS:RPC 延迟 > 200 ms   此规则每分钟检查一次 RPC 请求的延迟。如果五分钟内的平均延迟超过 200 毫秒 (ms),则将生成警报。
  • MSExchangeIS: RPC 请求 >25   此规则跟踪在特定时间由 Microsoft Exchange Information Store 服务提供服务的 RPC 请求数量。可同时处理多达 100 个 RPC 请求。但是,当服务器正常工作时,该值通常相当低(低于 10)。
  • 磁盘写入延迟 > 50 ms   当磁盘写入延迟超过 50 毫秒时,将生成警报。
  • ESE 日志生成检查点深度 > 800   Microsoft Exchange Information Store 服务根据日志生成检查点深度来改变启动时间。如果此值大于 1000,则将断开受影响的存储组中的所有数据库。如果该值增大到超过 800 的阈值,则将生成警报。
  • 信息存储虚拟字节 > 2.9 GB   虚拟字节是进程正在处理的虚拟地址空间的当前字节大小。使用虚拟地址空间不一定意味着使用相应的磁盘或主内存页。虚拟空间是有限的,使用太多时,进程会限制其加载库的能力。如果虚拟字节大于 2.9 GB 的阈值,则将生成警报。
  • 磁盘读取延迟 > 50 ms   当磁盘读取延迟超过 50 毫秒时,将生成警报。
  • Outlook Mobile Access: 上次响应时间 >60 秒   当 Outlook Mobile Access 服务器响应时间值大于 60 秒时,将生成警报。
  • 非分页池字节 > 90 MB   此规则仅适用于 Exchange Server 2003。如果 Memory-Pool Nonpaged Bytes 的性能计数器超过 90 MB,则将生成警报。

SMTP 远程队列阈值

“SMTP 远程队列阈值”规则组检查 Exchange 远程队列的状态和运行状况。如果大量邮件正在特定位置排队,将提供警报。导致生成警报的队列邮件数通过 NumberOfMessages 参数的值进行定义,而该参数在“验证远程 SMTP 队列”定时事件所运行的脚本中定义。如果严重性级别为“错误”或更高,则会发送通知。

此规则组包含下列事件规则:

  • 远程简单邮件传输协议 (SMTP) 队列问题的警报   当 NumberOfMessages 值超过 200 时,将生成警报。若要修改此值,请访问规则“属性”对话框,依次单击“响应”选项卡、脚本、“编辑”和“编辑参数”。
  • 验证远程简单邮件传输协议 (SMTP) 队列   此规则每个小时运行一次脚本,确定远程 SMTP 队列的状态。如果 NumberOfMessages 参数中的指定数字超过特定阈值,该脚本将生成事件。默认情况下,NumberOfMessages 值为 200

Windows 更新

“验证 Windows 修补程序”规则组中的规则验证所有指定的 Windows 更新是否都安装在运行 Exchange 2003 的服务器上。如果没有安装指定的修补程序,将会生成警报。如果严重性级别为“错误”或更高,则会发送通知。

此规则组包含下列事件规则:

  • 验证所需的 Windows 修补程序   此规则每天运行一次脚本,检查是否有更新。可以指定脚本所搜索的更新,方法是访问此规则的“属性”,单击“响应”选项卡,然后选择脚本,再单击“编辑”。单击 HotfixID,然后单击“编辑参数”。在“值”框中,键入要求在 Exchange 服务器上安装的所有更新 ID,以逗号分隔。该脚本生成事件 9017,列出未安装的所有需要的更新。
  • 未安装所需的 Windows 修补程序   如果未安装所需的更新,此规则将生成警报。