存储技术概述

 

上一次修改主题: 2006-05-08

若要提高 Exchange 2003 组织的可用性,Exchange 后端存储解决方案必须由冗余存储子系统提供支持。规划存储方案时,请先熟悉下列与存储相关的技术:

  • RAID 级别 提供了不同级别的性能和容错能力的磁盘阵列实现。
  • SAN 解决方案 通过高速网络来提供集中式数据存储的存储方案。
  • 网络附加存储解决方案 通过现有的网络连接直接连接到服务器的存储方案。
  • 复制技术 使用同步和异步数据复制技术,在站点内复制数据(使用 SAN 或 LAN)或将数据复制到独立站点(使用虚拟 LAN)的解决方案。

SAN 解决方案和网络附加存储解决方案通常包含了 RAID 技术。可以配置存储设备上的磁盘,以使用适合于性能和容错能力需要的 RAID 级别。请使用以下各节的信息对这些存储技术进行比较和对比。

important重要提示:
通常建议使用直接访问存储设备 (DASD) 或 SAN 附加磁盘存储解决方案,因为这些配置可优化 Exchange 2003 的性能和可靠性。Microsoft 不支持使用网络附加存储解决方案,除非它们满足特定的 Windows 要求。
note注意:
有关 SAN 和网络附加存储解决方案的信息,请参阅 Microsoft 知识库文章 328879“使用 ExchangeServer 与网络附加存储和网络附加存储设备”。

为 Exchange 2003 数据库部署存储解决方案之前,请向供应商核实,该端对端存储解决方案是否针对 Exchange 2003 而设计。许多供应商都有针对 Exchange 的最佳实践指南。

通过使用 RAID 解决方案,可以提高 Exchange 组织的容错能力。在 RAID 配置中,物理存储容量的一部分包括有关存储在硬盘上的数据的冗余信息。冗余信息是奇偶校验信息(RAID-5 卷的情况下)或完整的单独数据副本(镜像卷的情况下)。如果其中一个磁盘或访问路径发生故障,或无法读取磁盘上的扇区,则通过冗余信息可以重新生成数据。

note注意:
可以在主机系统(软件 RAID)或外部存储阵列(硬件 RAID)上实现 RAID 解决方案。通常,两种解决方案提供了相似的可靠性优点。但是,软件 RAID 增加了主机服务器上的 CPU 处理负载。本节假定使用了硬件 RAID 解决方案,而不是软件 RAID 解决方案。有关在 Microsoft Windows Server™ 2003 上使用软件 RAID 的信息,请参阅 Windows Server 2003 帮助。

若要确保 Exchange 服务器在发生单个磁盘故障时可以继续正常运行,请在硬盘上使用磁盘镜像和具有奇偶校验的磁盘条带化。通过磁盘镜像和具有奇偶校验的磁盘条带化,可为硬盘上的数据创建冗余数据。

虽然磁盘镜像创建了重复的卷,如果其中一个镜像中的磁盘发生故障,重复的卷可以继续工作,但磁盘镜像无法阻止已损坏的文件(或其他文件错误)被写到两个镜像中。由于这个原因,请不要使用磁盘镜像来代替对服务器上重要的数据进行及时的备份。

note注意:
使用冗余技术(如奇偶校验)时,会丧失某些硬盘 I/O 性能以实现容错。

由于事务日志文件和数据库文件对于 Exchange 服务器的操作极其重要,因此,应该在单独的物理驱动器上保存 Exchange 存储组的事务日志文件和数据库文件。还可以使用磁盘镜像或具有奇偶校验的磁盘条带化来防止单个物理硬盘的故障导致部分邮件系统发生故障。有关磁盘镜像和具有奇偶校验的磁盘条带化的详细信息,请参阅 Windows Server 2003 Deployment Kit(英文)中的“Achieving Fault Tolerance by Using RAID”。

若要实现 RAID 配置,建议只使用硬件 RAID 产品,而不使用软件容错的动态磁盘功能。

以下各节将讨论四种主要的 RAID 实现:RAID-0、RAID-1、RAID-0+1 和 RAID-5。虽然还有许多其他的 RAID 实现,但这四种类型已经足以代表各种 RAID 解决方案。

RAID-0 是条带化的磁盘阵列。每个磁盘在逻辑上被分割为多个“条带”,每个“条带”穿过阵列中的所有磁盘,从而创建一个逻辑分区。例如,如果将文件保存到 RAID-0 阵列中,并且要保存该文件的应用程序将其保存到驱动器 D 中,那么 RAID-0 阵列将在整个逻辑驱动器 D 上分布该文件。在本示例中,文件跨越了所有的六个磁盘。

2687677a-8ce3-433b-845b-16098951fdc2

从性能的角度来看,RAID-0 是最有效的 RAID 技术,因为它可以同时写入所有的六个磁盘。如果所有磁盘都存储应用程序数据,将是最有效的磁盘使用方式。

RAID-0 的缺点是缺乏容错能力。如果 Exchange 邮箱数据库存储在 RAID-0 阵列上,并且一个磁盘发生了故障,就必须将邮箱数据库还原到工作正常的磁盘阵列,并还原事务日志文件。此外,如果将事务日志文件存储在此阵列上,并且损坏了一个磁盘,则只能用最后一次备份对邮箱数据库执行“时点”还原。

RAID-0 不是 Exchange 的推荐解决方案。

RAID-1 是镜像两个磁盘的镜像磁盘阵列。

68d4f8a0-17e3-4183-9ffb-ae6eca3581c4

在三种 RAID 阵列中,RAID-1 是最可靠的,因为所有数据都在写入时被镜像。您只能使用磁盘的一半存储空间。虽然 RAID-1 似乎效率不高,但它仍然是需要最高可靠性的数据的首选解决方案。

若要获得数据的高可靠性和最佳性能,请考虑使用 RAID-0+1。RAID-0+1 通过使用 RAID-0 的条带化优点提供了高性能,同时还通过使用 RAID-1 的磁盘镜像优点确保了冗余。

e519ecd7-b74b-409a-ab02-9fe283e80ed7

在 RAID-0+1 磁盘阵列中,数据被镜像到两组磁盘 (RAID-1),然后跨驱动器形成条带 (RAID-0)。每个物理磁盘都在阵列中有自己的镜像副本。如果有六个磁盘的 RAID-0+1 磁盘阵列,则其中三个磁盘可用于数据存储。

RAID-5 是条带化的磁盘阵列,它在跨阵列分布数据方面与 RAID-0 类似。但是,RAID-5 还包括奇偶校验。其中有一个机制,该机制可维护阵列中所存储的数据的完整性,这样,如果阵列中的一个磁盘发生故障,可以从剩余的磁盘上重新构造数据。因此,RAID-5 是一个可靠的存储解决方案。

978020d4-cfcb-4e13-8f30-895de517f188

但是,若要在磁盘间维护奇偶校验,则将丧失 1/n 的磁盘空间(其中 n 等于阵列中的驱动器数目)。例如,如果有六个 9 GB 的磁盘,则拥有 45 GB 的可使用存储空间。为了维护奇偶校验,在 RAID-5 阵列中,一次数据写入将转换为两次写入和两次读取。因此,降低了整体性能。

RAID-5 解决方案的优点是,它非常可靠,并且可以比 RAID-1 和 RAID-0+1 更有效地利用磁盘空间。

规划 RAID 解决方案时,必须考虑性能、可靠性、磁盘容量以及成本。虽然成本和容量很重要,但是应主要考虑存储系统的性能和可靠性。

下表对四种不同的 RAID 解决方案的成本和可靠性进行了比较。

比较 RAID 解决方案的成本和可靠性

RAID 解决方案 驱动器数目 成本 可靠性

RAID-0

10 个 9 GB 磁盘

RAID-1

2 个 45 GB 磁盘

RAID-0+1

20 个 9 GB 磁盘

很高

很高

RAID-5

11 个 9 GB 磁盘

成本

可以通过计算支持阵列所需的磁盘数目来评估成本。RAID-0+1 实现的成本最高,因为磁盘空间量必须是所需磁盘空间的两倍。但是,相比具有相同容量的 RAID-5 配置,根据最高读写速率来判断,此配置的性能也高得多。RAID-1 的成本最低,因为它只需要两个 45 GB 驱动器来存储 90 GB 的数据。但是,使用两个较大的磁盘会使吞吐量大大降低。

可用性和性能

通过评估磁盘故障可能对数据完整性造成的影响来衡量可靠性。RAID-0 不具有任何冗余,因此,RAID-0 阵列上的一个磁盘出现故障,就需要执行完全数据恢复。RAID-0+1 是四种解决方案中最可靠的一个,因为在可能丢失数据之前,必须有两个或更多磁盘发生故障。

通过在一个测试环境中全面测试不同的 RAID 级别来评估性能。必须选择硬件、RAID 级别和存储配置,以符合或超过组织所需的性能级别。若要测试 Exchange 存储子系统的性能,请使用 Jetstress 以及其他 Exchange 容量工具。有关获得所需级别的性能、可靠性和可恢复性的最佳实践的信息,请参阅配置 Exchange 后端存储的最佳实践

建议使用 SAN 存储 Exchange 文件。此配置优化了服务器的性能和可靠性。

important重要提示:
通常建议使用直接访问存储设备 (DASD) 或 SAN 附加磁盘存储解决方案,因为这种配置可优化 Exchange 的性能和可靠性。Microsoft 不支持使用网络附加存储解决方案,除非它们满足特定的 Windows Logo 要求。有关受支持的网络附加存储解决方案的信息,请参阅本主题后面的“网络附加存储解决方案”。

SAN 为公司数据提供了存储和存储管理功能。为了在存储和应用程序之间提供快速可靠的连接,SAN 使用了光纤通道交换技术。

SAN 有三个主要组成部分:

  • 光纤通道交换技术
  • 用于存储和保护数据的存储阵列
  • 存储和 SAN 管理软件

硬件供应商销售完整的 SAN 产品包,其中包括必要的硬件、软件和支持。SAN 软件通过提供到存储数据的多个路径,来管理网络和数据流冗余。由于 SAN 技术是相对较新的技术,并且仍在迅速发展,因此,可以规划和部署完整的 SAN 解决方案,以便适应未来增长以及新兴的 SAN 技术。最后,SAN 技术实现了具有不同操作系统的多供应商系统与来自多个供应商的存储产品之间的连接性。

bf90c89e-33af-486f-9bbe-6fb39fa5d6cb

当前,SAN 解决方案最适合需要存储大量数据的公司和信息技术 (IT) 部门。

虽然部署成本可能是一个障碍,但 SAN 解决方案仍然可能是首选方案,因为其长期总拥有成本 (TCO) 会低于维护许多直接附加的存储阵列所需的成本。请考虑 SAN 解决方案的下列优点:

  • 如果目前有多个管理员管理多个阵列,那么,对所有存储进行集中管理将节省人力,使管理员可以去执行其他任务。
  • 在可用性方面,一个供应商所支持的 SAN 所提供的全面灵活的可靠性是任何其他单独的解决方案所没有能力提供的。当邮件服务和协作服务无法使用时,有些公司可能蒙受巨额的收入损失。如果您所在的公司可能因邮件服务不可用而遭受重大的收入损失,那么,部署 SAN 解决方案就是一种高效利用成本的选择。

在投资 SAN 之前,请计算当前的存储解决方案在硬件和管理资源方面的成本,并评估公司对可靠存储的需要。

以下是在 Exchange 2003 组织中实现 SAN 解决方案的优点:

  • Exchange 2003 需要很高的 I/O 带宽,而只有 SAN 附加(有时称为“通道附加”)存储阵列才支持这样的带宽。相反,依赖于通过网络堆栈访问 Exchange 2003 数据库文件的网络存储解决方案则可能会增加数据损坏和性能下降的风险。
  • Exchange 2003 还要求将邮箱和公用文件夹存储放在 Exchange 服务器的本地驱动器上。通过本地光纤通道连接来连接到 Exchange 服务器的 SAN 解决方案正好可以满足这种要求。而依靠网络重定向器来处理磁盘资源的其他存储解决方案则不能满足此要求。
  • SAN 具有高度的可伸缩性,这是 Exchange 的一个重要考虑因素。随着邮件数据的增加,邮箱限制不断受到挑战,必须增加存储容量和 I/O 速率。随着组织的扩展,通过 SAN 可以方便地添加磁盘。
    建议选择包含了存储虚拟化的 SAN 解决方案。通过存储虚拟化可以方便地添加磁盘,并快速地将额外容量重新分配给 Exchange 服务器。利用存储虚拟化,就可以根据容量要求和预算来购买额外的存储磁盘。
  • SAN 的可伸缩性还使您能够通过添加服务器来扩展 Exchange 组织。利用 SAN,可以将多个 Exchange 服务器连接到多个存储阵列,然后在这些存储阵列中划分存储。
  • 通过使用镜像和卷影复制备份(使用卷影复制服务),SAN 使备份、恢复和可用性都得到了增强。
    有关如何使用卷影复制服务增强存储解决方案的信息,请参阅 Best Practices for Using Volume Shadow Copy Service with Exchange Server 2003(英文)
  • 通过复制策略,其中包括将数据从一个站点中的 SAN 复制到另一个站点中的 SAN,可以在发生站点故障时,保护组织中的数据。此外,如果将实现地理位置分散的群集与站点复制策略配合使用,则邮件系统仍将正常运行。
    有关将数据复制到备用站点的信息,请参阅系统级别的容错措施中的“使用多个物理站点”。
    有关地理位置分散的群集的信息,请参阅规划群集时的考虑因素中的“地理位置分散的群集”。

网络附加存储是指使用服务器附加的方法进行数据存储的产品。在此方法中,存储硬件通过小型计算机系统接口 (SCSI)、光纤通道连接或最近新增的对 Internet SCSI (iSCSI) 的支持直接连接到以太网。网络附加存储产品是一个包含文件系统和可伸缩存储的专用服务器。在此模型中,数据存储被分散化。网络附加存储设备本地连接到部门服务器,因此,只有本地服务器才可以访问数据。

有关 iSCSI 的信息,请参阅 Microsoft Storage Technologies - iSCSI 网站(英文)。

有关在 Exchange 中支持 iSCSI 的信息,请参阅 Microsoft 知识库文章 839686“Exchange 服务器支持 iSCSI 技术组件”。

important重要提示:
Exchange 2003 具有本地数据访问和 I/O 带宽要求,而网络附加存储产品通常不满足这些要求。错误地将网络附加存储产品与 Exchange 2003 软件配合使用,可能会导致数据丢失,包括整个数据库丢失。

有关特定于 Exchange 2003 的网络附加存储解决方案的详细信息,请参阅 Microsoft 知识库文章 839687“使用与 Exchange Server 2003 网络附加存储设备上 Microsoft 支持策略”。

有关用于 Exchange 5.5 和更高版本的网络附加存储解决方案的信息,请参阅 Microsoft 知识库文章 317173“Exchange 服务器和网络附加存储”。

有关比较 SAN 和网络附加存储解决方案的信息,请参阅 Microsoft 知识库文章 328879“使用 ExchangeServer 与网络附加存储和网络附加存储设备”。

如果 Exchange 组织必须持续运行(即便发生站点灾难),则可以通过实现数据复制技术提高 Exchange 数据的可靠性,该技术将应用程序数据复制到一个或多个远程站点。通过这种数据复制技术可以在长途光纤网络或 IP 网络上,同步多个站点中的 SAN。这些解决方案中涉及的复制是同步复制或异步复制。

有关如何使用多个物理站点添加冗余以保护应用程序数据的信息,请参阅系统级别的容错措施中的“使用多个物理站点”。

有关如何将远程站点复制与 Windows 群集协同使用的信息,请参阅规划群集时的考虑因素中的“地理位置分散的群集”。

包含同步复制技术的解决方案可以帮助您获得 100% 的数据可靠性。同步复制技术都写入两个存储平台(主存储设备和复制存储设备)后,才向操作系统报告该写入成功完成。根据两个存储平台之间的距离,此延迟时间可能很明显(+50 毫秒)。延长的延迟时间造成服务器负载,此负载严重影响了 Exchange 客户端的体验。特别是,高写入延迟会导致大量的远程过程调用 (RPC) 队列,并可能耗尽所有 100 个 RPC 线程(在写入 I/O 上等待的线程),从而引起严重的可用性问题。

若要将对可用性的负面影响降到最低程度,请减少服务器和 SAN 上的用户数量。例如,请考虑一个包含同步复制的 Exchange 部署,在此部署中,即便服务器和 SAN 都能支持 4,000 个用户,仍将用户负载限制到仅 1,000 个用户。虽然同步复制具有很高的数据可靠性,但它的确表现出很明显的 I/O 写入性能限制。此 I/O 写入限制对于指定平台上受支持的用户数量是一个关键因素。

important重要提示:
与实现由四个处理器或八个处理器的服务器组成的合并模型相反,通过使用多个双处理器的服务器,可以最好地满足使用同步复制的解决方案。业已证明,可以使用同步复制技术减少服务器合并的使用。

异步复制对 Exchange 客户端性能不产生负面影响,因为在主存储写入完成之后,才会处理复制写入。异步数据复制的问题在于,它需要长达一分钟的时间(因各个 SAN 供应商而异)来完成复制写入,因而增加了灾难过程中发生数据丢失的可能性。异步复制没有写入性能限制,但是在数据可靠性方面,其可靠性较低。

important重要提示:
如果选择异步方法,请确保灾难恢复程序已经受良好测试。同时,还应了解在灾难过程中有可能丢失数据。因此,对于地理位置分散的群集,建议不要使用异步复制解决方案。

如果选择了同步方法,与实现任何存储子系统一样,请在测试环境中部署数据复制解决方案以便验证设计。Jetstress 工具所附带的文档中包含了有关如何测试数据复制解决方案的信息。有关 Jetstress 的信息,请参阅使用 Jetstress 测试磁盘性能

可以在 Microsoft Exchange Server Jetstress Tool 网站(英文)下载 Jetstress。

 
显示: