选择 SharePoint Server 的灾难恢复策略

 

**上一次修改主题:**2018-03-09

**摘要:**了解出现灾难时恢复 SharePoint Server 2016 和 SharePoint 2013 服务器场的灾难恢复选项和受支持的技术。

我们将灾难恢复定义为从承载 SharePoint Server 服务器场的主数据中心无法继续运行时从中恢复的功能。不论事件本质及其原因如何,数据中心中断都是严重事件,必须启动在组织的灾难恢复计划中定义操作。这意味着使用位于不受事件影响的数据中心中的计算机资源将完全运行的服务器场投入生产。

本文内容:

  • 简介

  • 备用数据中心恢复选项

  • 用于恢复的系统要求

SharePoint Server 2016 和 SQL Server 2014 Service Pack 1 (SP1) 或 SQL Server 2016 及 SharePoint 2013 和 SQL Server 2008 R2 Service Pack 1 (SP1) 或 SQL Server 2012 提供可满足出现灾难时业务所需的恢复时间目标 (RTO) 和恢复点目标 (RPO) 的配置和内容恢复选项。有关这些和其他灾难恢复概念的详细信息,请参阅 SharePoint Server 中的高可用性和灾难恢复概念

简介

SharePoint Server 服务器场的有效灾难恢复策略必须足以满足组织的业务需求,通常使用两个度量表示:恢复时间目标 (RTO) 和恢复点目标 (RPO)。RTO 和 RPO 要求通过确定发生灾难时组织的停机时间成本来决定。

重要

作为最佳做法,我们建议您在制定恢复策略和实施技术解决方案之前确定并量化组织的 RTO 和 RPO。重点关注什么是必需的,而不是如何做。

行业之间和行业内的停机时间成本明显不同,尤其是由于停机时间的不同后果。企业规模是最明显的因素,但并不是唯一的因素。设置度量意味着确定失败的性质和含义。即使降低到最简单的程度,关键应用程序故障也可能导致以下类型的损失:

  • 应用程序服务的损失。停机时间的影响因应用程序和业务而异。

  • 数据丢失。因系统中断造成的潜在数据丢失可能导致重大的法律和财务影响。

大多数组织都可能因上述两种类型的损失而遭受停机时间成本,但业务性质将确定哪种类型的损失的影响最大。Chris Preimesberger 在 eWEEK 上发表的以下文章重点介绍了数据中心停机时间的财务影响。未计划的 IT 停机时间每分钟成本高达 5 万美元:报告

大多数情况下,SharePoint 产品 是出现数据中心中断(即灾难)时必须恢复的几个应用程序之一。为此,我们未包括关于灾难恢复规划的信息,而是专注于确保您可以从其他位置的 SharePoint Server 2016 服务器场恢复的选项。

不论灾难的类型和规模如何,恢复涉及使用您可以将服务器场恢复到的备用数据中心。

备用数据中心恢复选项

如果当地冗余系统和备份系统无法从主数据中心中断恢复,将需要备用数据中心。使替换服务器场在其他位置启动并运行的时间和即刻努力通常称为热待机、温待机或冷待机。我们对这些服务器场恢复数据中心的定义如下:

  • 冷待机。可以在数小时或数天内提供可用性的辅助数据中心。

  • 温待机。可以在数分钟或数小时内提供可用性的辅助数据中心。

  • 热待机。可以在数秒或数分钟内提供可用性的辅助数据中心。

这些备用数据中心每一个都有特定的特征和要求,且具有运营和维护相关成本。

  • 冷待机灾难恢复策略:业务随附备份,以支持本地和区域脱机存储的定期裸机恢复,且签订了在其他区域的应急服务器租赁合同。

    优点:

    • 通常是运营维护成本最低的选项。

    • 通常是较昂贵的恢复选项,因为它要求物理服务器在发生灾难后正确配置。

    缺点:最慢的恢复方法。

  • 温待机灾难恢复策略:业务附带本地和区域灾难恢复服务器场的备份或虚拟机映像。

    优点:通常是相当经济的恢复选项,因为虚拟服务器场在恢复时所需的配置最少。

    缺点:维护可能非常昂贵和耗时。

  • 热待机灾难恢复策略:企业运行多个数据中心,但仅在一个数据中心内提供内容和服务。

    优点:通常恢复速度相当快。

    缺点:配置和维护成本可能非常昂贵。

重要

不论您决定应用上述哪个灾难恢复解决方案,可能都会出现一定程度的数据丢失。

冷待机恢复

在冷待机灾难恢复方案中,通过在新位置设置新的服务器场(最好是使用脚本部署)和还原备份来进行恢复。也可以通过使用 System Center 2016 - Data Protection Manager (DPM) 或 System Center 2012 - Data Protection Manager (DPM) 等备份解决方案还原服务器场来进行恢复。系统中心数据保护管理器 可保护计算机操作系统级别的数据,并允许分别还原每台服务器。本文不包含有关在冷待机方案中如何创建和恢复的详细说明。有关详细信息,请参阅:

温待机恢复

在温待机灾难恢复方案中,您可以通过在备用数据中心创建重复服务器场来创建一个温待机环境,并确保使用主服务器场的完全和增量备份定期更新。

虚拟服务器场待机环境

虚拟化提供了用于温待机恢复解决方案的经济有效的可行选项。您可以使用 Hyper-V 作为内部解决方案,或使用 Azure 作为托管解决方案,以提供必要的恢复基础设施。

可以创建生产服务器的虚拟图像,并将这些图像发送到备用数据中心。使用虚拟备用解决方案,必须确保虚拟图像的创建频率够高,以提供恢复场所必需的场配置级别和内容新近度。在辅助位置,必须有一个环境,可以在其中轻松配置和连接图像以重新创建场环境。有关详细信息,请参阅在 Azure 中为 SharePoint Server 2016 部署 SQL Server AlwaysOn 可用性

热待机恢复

在热待机灾难恢复方案中,您可在待机数据中心设置故障转移服务器场,以便它可以在主服务器场脱机后立即使用生产运营。具有单独故障转移服务器场的环境具有以下特征:

  • 必须在故障转移服务器场上维护单独的配置数据库和 SharePoint 管理中心网站内容数据库。

  • 所有自定义项都必须部署在这两个场上。

    提示

    两个场相互一致,并且为了降低错误可能性,我们建议您使用脚本部署创建使用相同配置设置和自定义项的主服务器场和故障转移服务器场。

  • 操作系统、SQL Server 和 SharePoint Server 软件更新必须应用到两个服务器场,以维护两个场之间的一致配置。

  • 可以使用异步镜像、可用性组复制的异步提交或日志传送将 SharePoint Server 内容数据库传送到故障转移服务器场。

    备注

    SQL Server 镜像仅用于将数据库复制到单个镜像服务器,但您可以将日志传送到多个辅助服务器。
    SQL Server 数据库镜像功能将在未来的版本中删除。我们建议您避免在新的开发工作中使用此功能。请计划更改当前使用该功能的应用程序。改用 AlwaysOn 可用性组。

  • 在是否可以将日志传送到服务器场方面,服务应用程序各不相同。有关详细信息,请参阅本文稍后的数据中心之间的服务应用程序冗余度。

热待机服务器场拓扑可以在多个数据中心之间重复,只要您对一个或多个额外数据中心配置 SQL Server 日志传送。

重要

使用故障转移方法进行灾难恢复时,可用的网络带宽和延迟是主要的考虑因素。
我们建议您咨询 SAN 供应商以确定是否使用 SAN 复制或其他受支持的机制在数据中心之间提供热待机可用性级别。

服务应用程序冗余

要在服务应用程序的数据中心之间提供可用性,我们建议对跨场运行的服务运行可以从主数据中心和辅助数据中心访问的单独服务场。

对于不能跨场运行的服务,为了给服务场本身提供可用性,在服务应用程序的数据中心之间提供冗余的策略有所不同。采用的策略取决于是否满足以下条件:

  • 在未使用的灾难恢复场中运行服务应用程序是否具有商业价值。

  • 与服务应用程序相关的数据库是否可以进行日志传送、异步镜像或使用异步提交复制。

  • 服务应用程序是否可以针对只读数据库运行。

在设计使用温待机或热待机数据中心的灾难恢复解决方案之前,请阅读 SharePoint 数据库的受支持的高可用性和灾难恢复选项一文。

用于恢复的系统要求

在理想情况下,故障转移组件和系统在所有方面符合主要组件和系统:平台、硬件和服务器数量。故障转移环境必须至少能够处理预计在故障转移时出现的流量。请记住,只有少数用户可以由故障转移网站提供服务。系统必须至少满足以下条件:

  • 操作系统版本和所有更新

  • SQL Server 版本和所有更新

  • SharePoint Server 版本和所有更新

除了以前的要求外,服务器场恢复时间也会受设施和基础设施组件的可用性影响。请确保满足以下要求:

  • 电源、冷却、网络、目录和 SMTP 完全冗余

  • 选择切换机制;DNS 或硬件负载平衡是否符合您的需求。

See also

SharePoint Server 中的高可用性和灾难恢复概念