Exchange 2010 SP1 中新的高可用性和站点恢复功能

Exchange 2010
 

适用于: Exchange Server 2010 SP1

上一次修改主题: 2015-03-09

Microsoft Exchange Server 2010 Service Pack 1 (SP1) 包括一些新增功能,以及对 Exchange 2010 的正式发布版本 (RTM) 中引入的功能的增强。 新功能和改进功能扩展了 Exchange 2010 环境实现数据和服务可用性的方案。

Exchange 2010 SP1 提供了下列新高可用性功能和对现有高可用性功能的改进:

  • 连续复制 - 块模式

  • 活动邮箱数据库重新分发

  • 增强的数据中心激活协调模式支持

  • 新增及增强的管理和监视脚本

  • Exchange 管理控制台的用户界面增强功能

  • 故障转移性能的改进

  • 挂起 I/O 的可扩展存储引擎恢复

下面将详细讨论这些功能。

在 RTM 版本的 Exchange 2010 和所有版本的 Exchange Server 2007 中,通过将主动数据库副本生成的日志文件副本传送给被动数据库副本来运行连续复制。 从 Exchange 2010 SP1 开始,这种形式的连续复制被称为“连续复制 - 文件模式”。 Exchange 2010 SP1 还引入了一种新形式的连续复制功能,称为“连续复制 - 块模式”。. 在块模式中,随着将每次更新写入主动数据库副本的主动日志缓冲区,也会将其传送到每个被动邮箱副本上的日志缓冲区。 如果日志缓冲区已满,每个数据库副本将在生成序列中构建、检查并创建下一个日志文件。 如果故障对主动副本造成影响,则将使用大多数或全部最新更新来更新被动副本。主动副本会在复制完成之前就开始排除复制问题对客户端体验的影响。

仅当文件模式下连续复制为最新时,连续复制 - 块模式才会处于活动状态。 日志复制程序自动执行切换进入块模式和从块模式切换出的操作。 块模式明显减少了从对主动副本做出更改到更改复制到被动副本之间的时间延迟。 除了复制每个日志文件写入,块模式还更改被动副本的激活过程。 如果发生故障时副本处于块模式,系统会使用激活过程中所有可用的部分日志内容。 这样可避免主动副本上的当前日志文件成为单一故障点。

Exchange 2010 SP1 包含名为 RedistributeActiveDatabases.ps1 的脚本,管理员可以定期运行该脚本以根据管理员配置的激活首选项在数据库可用性组 (DAG) 之间平衡主动数据库副本的分布。 此外,已向活动管理器最佳副本选择过程中添加了副本分布感知。具体来说,最佳副本选择的第一个阶段中针对无损切换的选择,现在根据首选项对可能目标进行排序,而不是根据损失最少。

Exchange 2010 RTM 包含面向 DAG 站点恢复支持的配置模式,称为“数据中心激活协调 (DAC)”模式。 在 DAC 模式中,可以使用 Exchange cmdlet 执行数据中心切换。 在 RTM 版本中,DAC 模式仅限于至少具有三个成员且至少有两个或更多成员位于主数据中心的 DAG。

在 Exchange 2010 SP1 中,DAC 模式已扩展为支持每个成员分别位于单独的数据中心的双成员 DAG。 DAC 模式对双成员 DAG 的支持使用见证服务器来提供其他仲裁。此外,DAC 模式已扩展为支持所有成员均部署在单个 Active Directory 站点(包括已扩展到多个位置的单个 Active Directory 站点)的 DAG。

Exchange 2010 SP1 包含一些新的增强的脚本,大大改进了管理和监视体验:

  • CheckDatabaseRedundancy.ps1(新增) 此脚本可用于检查复制数据库的冗余,并且在数据库恢复可能存在问题的情况下(如,复制数据库仅存在一个正常副本)生成事件。 与该脚本一起提供的 Microsoft System Center Operations Manager 2007 管理包更改可用于监视没有冗余的数据库,这在没有 RAID 的环境中特别有用。

  • StartDagServerMaintenance.ps1 和 StopDagServerMaintenance.ps1(新增) StartDagServerMaintenance.ps1 可用于使 DAG 成员停止服务以进行维护。 它会将主动数据库移出该服务器,并且阻止数据库移动到该服务器。 它还确保可能位于该服务器上的所有关键 DAG 支持功能(如,主要活动管理器 PAM 角色)移到其他服务器,并阻止其移回该服务器。 另一个脚本 StopDagServerMaintenance.ps1 用于完成操作并删除块。

  • CollectOverMetrics.ps1(增强) 可使用此脚本收集切换和故障转移数据。 此脚本在 Exchange 2010 SP1 中得到强化,包含了连续复制 - 块模式的指标,以及复制和重播管道的更多详细信息。 此外,还具有增强的报告功能。

  • CollectReplicationMetrics.ps1(增强) 此脚本会在运行时实时收集与连续复制相关的指标,属于主动监视。 该脚本支持允许您自定义脚本行为和输出内容的参数。

Exchange 2010 SP1 包含用于管理 DAG 的 Exchange 管理控制台 (EMC) 增强功能。 例如,EMC 当前包含对管理 IP 地址以及 DAG 备用见证服务器设置的支持。 无需再使用 Exchange 命令行管理程序来配置这些设置。

Exchange 2010 SP1 包括改善故障转移和切换的性能和行为的变更。 在 RTM 版本的 Exchange 2010 中,发生故障转移或切换时,激活的被动副本将立即停止重播已复制到该被动副本的日志文件。 然后,将卸除主动副本(如果还未卸除),并且剩余日志文件将被复制到激活的被动副本中。 假定任何缺失数据均包含在自动数据库装入拨号设置内,此被动副本将成为新的主动副本,并将在异常关闭状态下装入数据库。 此时,将重播已复制到以前被动(现为主动)副本的所有日志文件以使数据库处于一致状态。

在 Exchange 2010 SP1 中,发生故障转移或切换时,激活的被动副本上的 Microsoft Exchange 复制服务将继续重播已复制到该被动副本上的日志文件,直至主动副本生成的所有日志文件都复制到该被动副本为止。 这样就可以对几乎处于一致状态的数据库执行装入操作。

其他增强性能的更改包括提高故障转移性能以及故障转移之后的 I/O 性能的超时和其他算法详细信息。

Exchange 2010 SP1 采用了新的恢复逻辑,出现特定条件时,将利用内置的 Windows 缺陷检查行为。 具体地说,扩展存储引擎 (ESE) 已得到更新,可检测 I/O 挂起的情况,并采取纠正措施自动恢复服务器。 ESE 会保留一个 I/O 监视线程,检测 I/O 在特定时间段里处于未完成状态的情况。 默认情况下,如果数据库的某个 I/O 处于未完成状态达到一分钟以上,ESE 就会记录一个事件。 如果数据库的 I/O 未完成时间超过了 4 分钟,则 ESE 将记录一个特定的失败事件(在能够记录的情况下)。 是否能记录 ESE 事件 507、508、509 或 510 取决于挂起 I/O 的性质。 如果问题会影响操作系统卷或者影响写入事件日志的能力,则不会记录事件。 如果记录了事件,则 Microsoft Exchange 复制服务 (MSExchangeRepl.exe) 就会故意终止 wininit.exe 进程以引发 Windows 缺陷检查。

在有些情况下,挂起可能会影响整个存储堆栈,以致无法将失败事件写入 crimson 通道或其他任何 Windows 事件日志区域。 ESE 还会验证是否可写入事件日志,以此监视 crimson 通道。 如果写入事件日志长时间失败,则 MSExchangeRepl 将通过终止 wininit.exe 故意引发 Windows 缺陷检查。 如果操作系统 I/O 挂起,则系统显然无法将任何 ESE 事件写入事件日志。

注释注意:
应用程序和服务日志是 Windows Server 2008 中的一个新的事件日志类别。 这些日志存储来自单个应用程序或组件的事件,而不存储可能影响整个系统的事件。 此新事件日志类别被称为应用程序的“crimson 通道”。 有关详细信息,请参阅监视高可用性和站点恢复

Exchange 2010 SP1 中这种基于缺陷检查的新恢复功能用于从挂起 I/O 或挂起控制器中快速恢复,而不必不断重试或等待,直到存储堆栈引发导致故障转移的错误。 进行缺陷检查时,错误代码将如下所示:

 

CRITICAL_OBJECT_TERMINATION (f4)

对系统操作有关键作用的某个进程或线程意外退出或终止。

警告警告:
出现此缺陷检查错误代码并不一定意味着错误原因出在 Exchange 上。 任何 wininit.exe 终止(包括管理员使用任何管理器或其他任何管理工具执行的终止)都会导致相同的缺陷检查错误代码。
 © 2010 Microsoft Corporation。保留所有权利。
显示: