标识并分析实现高可用性的障碍

 

上一次修改主题: 2005-05-25

高可用性的障碍定义为有可能限制邮件系统可用性的任何问题。虽然不可能防止每种障碍对邮件环境的影响,但是熟悉那些最常见的高可用性障障,包括与之关联的风险,则是非常重要的。

获得高可用性的障碍包括下列问题:

  • 环境问题 邮件系统环境的问题可能降低可用性。环境问题包括电缆不足、电源中断、通信线路故障、火灾以及其他灾难。
  • 硬件问题 邮件系统使用的任何硬件的问题都可能降低可用性。硬件问题包括电源故障、处理器不足、内存故障、磁盘空间不足、磁盘故障、网卡故障以及硬件不兼容。
  • 通信和连接问题 网络的问题可能阻止用户连接到邮件系统。通信和连接问题包括网络电缆故障、带宽不足、路由器或交换机故障、域名系统 (DNS) 配置错误以及身份验证问题。
  • 软件问题 软件故障和软件更新可能降低可用性。软件故障问题包括内存泄漏引起的停机时间、数据库损坏、病毒和“拒绝服务”攻击。软件更新问题包括应用程序软件更新以及 Service Pack 安装引起的停机时间。
  • 服务问题 从企业外部获取的服务可能恶化故障并加剧不可用性。服务问题包括培训欠佳的工作人员、响应时间过长以及过时的联系人信息。
  • 过程问题 缺少正确的过程可能导致不必要的停机时间,并延长由硬件或软件故障引起的停机时间。过程问题包括操作过程不足或不存在、恢复规划不足或不存在、恢复训练不足或不存在以及未经测试便更改部署。
  • 应用程序设计问题 应用程序设计欠佳可能降低邮件系统可体验到的可用性。
  • 人员配备问题 工作人员不足、未经培训或不合格都可能导致不必要的停机时间,并延长还原可用性所需的时间。人员配备问题包括培训资料不足、培训预算不足、培训时间不足以及沟通技巧不足。

识别高可用性障碍之后,应估计各个障碍的影响,并考虑克服哪些障碍可以足够高效地利用成本,这一点很重要。

若要确定相应的高可用性解决方案,必须分析每个障碍(及其相应的风险)是如何影响可用性的。特别应考虑每个障碍的下列问题:

  • 发生故障时,系统不可用的估计时间
  • 障碍出现并导致停机时间的可能性
  • 与停机时间的估计成本相比,克服该障碍的估计成本

为了说明如何分析障碍对可用性的影响,请考虑硬件相关的风险 — 举个特例,与某个硬盘故障相关联的风险,而该硬盘包含了您 25% 的用户的数据库文件和事务日志文件。在本示例中,应该执行下列操作:

  1. 估计用户无法使用邮件服务的时间量。下列示例说明了两种具有不同恢复时间估值的存储策略:
    note注意:
    恢复该故障磁盘所需的时间量取决于要解决此问题的 IT 人员的经验和培训。
    • 如果故障硬盘是由容错的独立磁盘冗余阵列 (RAID) 所组成的磁盘阵列的一部分,则不需要从备份中还原系统。例如,如果 RAID 阵列由可热交换的磁盘组成,则可以在不关闭系统的情况下更换故障磁盘。但是,如果 RAID 阵列不包括可热交换的磁盘,那么停机时间等于关闭所需的服务器并且随后替换故障磁盘所花费的时间。若要将影响降低到最低程度,可以在非业务时间内执行这些操作。
    • 如果故障硬盘不是 RAID 磁盘阵列的一部分,并且已将它备份到磁带或磁盘,则可以替换该硬件,然后从备份中将 Exchange 数据库(或数据库)还原到主服务器。停机时间等于替换硬件、从备份中还原以及删除事务(如果这些事务可用)后重新提交事务所花费的时间。此时间长短取决于备份介质硬件和 Exchange 2003 服务器的硬件。
  2. 估计出现此障碍的可能性。在本示例中,可能性会受硬件的可靠性和使用期限的影响。
  3. 估计克服此障碍的成本。防止停机时间的成本取决于所选择的解决方案。此外,克服此障碍的成本可能还包括其他 IT 人员的开销。若要克服此障碍,请考虑下列选择:
    • 如果决定实现 RAID(无论是软件 RAID 还是硬件 RAID),则克服障碍的成本按新硬件的成本以及培训和维护的费用来度量。根据所选择的硬件类型,这些开销会有巨大差别。这些开销还取决于是否决定使用第三方供应商来管理系统,或者是否培训自己的人员。此解决方案显著地减少了停机时间,但是需要更高的开销来实现。
    • 如果决定替换硬件并从备份中还原数据库,则克服障碍的成本按从备份中还原数据所花费的时间,以及磁盘出现故障后重新提交事务所花费的时间之和进行度量。此解决方案会导致更多的停机时间,但是实现它所需的开销较低。有关计算停机时间成本的信息,请参阅了解故障时间中的“使用多个物理站点”。
    note注意:
    计算克服障碍的成本时,请记住针对一个障碍的解决方案可能还会除去其他障碍。例如,在辅助服务器上保留邮件数据库的冗余副本可以克服许多障碍。

本指南中讨论的高可用性解决方案包括有关冗余组件、冗余服务器以及数据库备份和还原的建议。这些建议中的每条都是获得高可用性邮件系统不可或缺的一部分。

其余章节讨论了这些解决方案的相关问题。阅读本指南后,为了帮助您部署和维护高可用性邮件系统,请参阅可在 http://go.microsoft.com/fwlink/?LinkId=34165 上获取的文档(英文)。

 
显示: