了解 Exchange Server 2003 的可用性和站点故障恢复解决方案

 

上一次修改主题: 2005-09-14

人们对公司的评估通常考察其维护运营和始终提供服务的能力。 服务或运营中断会给公司信誉带来毁灭性打击,代价可能会非常高。

一般来说,可用性是通过平衡风险降低措施(如站点故障恢复)和恢复选项(包括备份设备)完成的。 术语“站点故障恢复”是指将特定基础结构的逻辑拓扑从其主物理位置扩展到辅助物理位置的能力。

Microsoft® Exchange Server 2003 提供了可用于站点故障恢复基础结构的现成功能。 除这些现成功能外,第三方存储供应商还提供了支持在站点故障恢复基础结构中部署 Exchange Server 2003 的解决方案。

在本文中,将介绍影响站点故障恢复解决方案的多种因素,并为实现站点故障恢复解决方案提供最佳实践建议。 我们不讨论第三方存储供应商的特定解决方案,但将解释第三方存储供应商通常使用的三种主要方法。

尽管术语可用性和高可用性有时可以互换使用,但它们可能有不同的含义,具体取决于使用它们的上下文和涉及的受众。 在本文中,“可用性”是指组件或服务在规定的时间或时段内执行其所需功能的能力。 “高可用性”是指通过实现容错和冗余功能最大限度地减少或屏蔽故障。

因为客户经常错误地理解这些术语,所以他们很容易对可用性目标有不正确的预期。 还容易使客户要求比他们的付费更高级别的可用性。

成本含义涉及(但不限于)以下术语:

  • 硬件
  • 软件
  • 网络基础结构
  • 人员配备
  • 培训
  • 设备
  • 可服务性 “可服务性”是指与第三方服务提供商协定的合同安排或与组织中 IT 分部协定的运营级别协议,目的是提供或维护 IT 服务或组件。
  • 运营成本

Microsoft Operations Framework (MOF)(英文网页)详细介绍了可用性管理和服务连续性概念(包括成本因素)。 有关详细信息,另请参阅以下文章:

通过实现冗余可以提高可用性。 以下多种 Exchange Server 2003 服务器角色的功能可帮助您实现冗余:

  • 邮箱服务器   您可以利用 Microsoft Windows Server™ 2003 中的群集服务为邮箱服务器提供高可用性。
  • 公用文件夹服务器   您可以利用内置复制为公用文件夹服务器提供高可用性。 通过在一台或多台其他服务器上维护该文件夹副本可进行内置复制。 公用文件夹存储还可以驻留在 Windows 服务器群集中。
  • 桥头服务器   使用 Exchange Server 2003 SMTP 连接器和路由组连接器可以将多台服务器配置为源桥头服务器,从而为传输提供高可用性。 此外,SMTP 服务器还可以作为网络负载平衡 (NLB) 群集的一部分为 SMTP 服务器提供高可用性。
  • 前端服务器 Exchange Server 2003 前端服务器可以作为 NLB 群集的一部分,为 Microsoft Office Outlook® Web Access 和其他基于 Internet 的 Exchange 客户端提供可用性。

第三方存储供应商提供的 Exchange Server 2003 高可用性和站点故障恢复解决方案通常使用下列方法之一或这些方法的组合:

  • 数据复制
  • 地理位置分散的群集
  • 待机群集

从应用程序角度而言,Exchange Server 2003 不识别此类解决方案。 构建这些解决方案是为了不需要对 Exchange Server 2003 进行任何配置更改,并且该解决方案的运行对 Exchange Server 透明。

Deployment Guidelines for Exchange Server Multi-Site Data Replication(英文网页) 详细说明了 Exchange Server 2003 复制技术所基于的概念。不过,在探索 Exchange Server 2003 的可用性和站点故障恢复解决方案时,务必了解复制解决方案所基于的一些基本概念:

  • 在何处进行复制?   可以在主机级别或存储系统级别进行复制。
  • 如何进行复制?
    • 基于主机的复制使用软件截取 I/O 并管理复制过程。 在大多数情况下,基于主机的复制使用筛选器驱动程序。
    • 基于存储的复制在存储系统级别进行。
  • 复制的工作方式如何?
    • “同步复制”是指在主机接收写入完成响应之前将数据写入主存储和辅助存储中。
    • “异步复制”是指在将数据写入主存储后,主机从主存储接收写入完成响应,然后在后台进行复制。

表 1 显示了同步复制和异步复制的优缺点。

表 1   同步复制和异步复制的优缺点

复制类型 优点 缺点

同步复制

  • 同步复制通常可以确保不丢失任何数据,因为在收到写入完成响应之前,数据同时写入主存储和辅助存储。
  • 主存储数据和辅助存储数据之间没有任何区别。
  • Microsoft 完全支持复制的 Exchange Server 数据。
  • 存在性能和可伸缩性约束。
  • 距离会影响写入延迟,尤其是日志写入延迟。
  • 高延迟需要降低 I/O 写入需求才能保持可接受的用户体验。 因此,必须减少每台服务器的邮箱数。
  • 同步复制比较昂贵。

异步复制

  • 对性能和可伸缩性没有显著影响,因为在收到写入完成响应之前,主机不必等待数据写入远程存储。
  • 异步复制比较廉价。
  • Microsoft 不支持复制的 Exchange Server 数据。
  • 辅助存储上的数据可能不总是最新的。
  • 不正确的写入顺序保留可能导致 Exchange Server 数据损坏。 第三方存储供应商必须确保正确地写入数据。

用于地理位置分散的群集的解决方案也是依赖于 Windows 群集技术的第三方存储供应商解决方案。 有关地理位置分散的群集的详细信息,请参阅以下文章:

在考虑使用 Exchange Server 2003 地理位置分散的群集时,请注意以下几点:

  • 地理位置分散的群集解决方案基于 Windows 群集技术。 通过使用第三方存储供应商的硬件和软件组合可构建地理位置分散的群集解决方案。 在 Windows Server 目录的 Cluster Solutions, Geographically Dispersed Cluster Solution(英文网页)中可以找到详细信息。
  • 地理位置分散的群集可以是最少有两个节点的共享仲裁群集,或最少有三个节点的主节点集 (MNS) 类型的群集。
  • 地理位置分散的群集依赖于作为该解决方案一部分的数据复制。
  • 群集的每个节点都访问共享存储的副本。
  • 地理位置分散的群集解决方案要求将群集的公用网络接口使用的子网扩展到辅助物理位置。
  • 地理位置分散的群集解决方案要求将群集检测信号子网扩展到辅助物理位置。 在所有情况下,解决方案的网络延迟时间不得超过 500 毫秒。
  • 尤其是 Exchange Server,复制的 Exchange Server 数据要求使用同步复制解决方案才能由 Microsoft 支持。

现在我们了解一下使用 Exchange Server 2003 地理位置分散的群集的一些优缺点。

下面是使用 Exchange Server 2003 地理位置分散的群集的一些优点:

  • 地理位置分散的群集解决方案为邮箱群集提供站点故障恢复。
  • 地理位置分散的群集解决方案对用户完全透明,只需最少的人工干预即可实现故障转移。
  • 不会丢失数据。
  • 在故障转移过程中,对用户的影响最小。
  • Windows 硬件质量实验室 (WHQL) 认证的解决方案受 Microsoft 支持。

下面是使用 Exchange Server 2003 地理位置分散的群集的一些缺点:

  • 地理位置分散的群集解决方案实施成本比较高。
  • 地理位置分散的群集解决方案实施起来比较复杂。
  • 地理位置分散的群集解决方案需要较高的操作熟练程度和流程。
  • 使用同步复制会影响性能和可伸缩性。
  • 与独立的 Exchange 服务器相比,每台服务器的邮箱数会减少。

在 Exchange Server 2003 邮箱群集的站点故障恢复解决方案中可以使用待机群集。 Exchange Server 2003 的“待机群集”是具有以下特征的 Windows 服务器群集:

  • 待机群集在硬件和软件配置方面(包括 Windows Server 和 Exchange Server 的版本和软件更新)与生产 Exchange 群集完全相同。
  • Exchange Server 程序文件安装在待机群集上,但待机群集尚未配置任何 Exchange 虚拟服务器。
  • 只有在生产群集上的所有 Exchange 虚拟服务器都处于脱机状态时才能使用待机群集。

可以使用待机群集提供邮件拨号音功能,或者,在与数据复制解决方案一起使用时,待机群集可以在辅助位置提供完整的数据。 “邮件拨号音功能”是一种策略,当进行数据恢复工作时,用户可以使用该策略通过临时的空邮箱发送和接收邮件。

Exchange Server 2003 Disaster Recovery Operations Guide(英文网页)中详细说明了 Exchange Server 2003 待机群集的用法。

在计划 Exchange Server 2003 的站点故障恢复解决方案时,请考虑以下最佳实践:

  • 确定您的可用性需求。
  • 了解备用站点基础结构的外部情况。
    • 该位置是否具有包含电源、环境控制、网络设备和电信基础结构的空设施,以便组织可以在灾难恢复情况下安装自已的计算机设备? “灾难恢复”是指从备份源恢复用户数据和配置数据以便还原服务可用性的过程。
    • 该位置是否具有适当的、可以恢复服务的计算机设备和基础结构?
    • 该位置是否具有复制公司关键业务系统并可以在几乎不丢失数据情况下立即接管的专用计算机设备?
  • 您的基础结构中是否已经存在其他站点故障恢复服务?
  • 是否签订了服务级别协议? 客户的当前环境中通常没有定义良好的服务级别协议,许多客户不清楚站点故障恢复的可用性需求。 “服务级别协议”是服务提供商及其客户之间的书面协议,该协议记录了达成的服务可用性级别。
  • 在整个流程中尝试与第三方存储供应商结合。
  • 计划检验概念,确保要实施的解决方案经过测试,并得到 Microsoft 和第三方存储供应商验证。
  • 计划生产环境中的站点故障转移模拟。
  • 确定解决方案维持备用站点模式需要多长时间。
  • 确保很好地理解用于站点故障恢复的所有依赖关系需求。 这些依赖关系需求可能包括以下内容:
    • 网络
    • 客户端连接性和重定向
    • 名称解析
    • Active Directory® 目录服务
    • 传输连接性
    • 操作就绪情况
 
显示: