建立服务级别协议

 

上一次修改主题: 2005-05-20

在考虑到停机时间对组织的影响并确定了在邮件环境中要实现的运行时间级别之后,就可以建立服务级别协议 (SLA) 了。SLA 需求决定了存储、群集以及备份和恢复等组件如何影响您的组织。

评估 SLA 时,应首先围绕计划的停机时间确定正常运行时间和期望。然后,应确定您的公司在可用性、性能和可恢复性方面的期望,包括邮件传递时间、服务器运行时间百分比、每个用户所需的存储量,以及恢复 Exchange 数据库所需的时间。

此外,应确定计划外停机时间的估计成本,以便可以在邮件系统内设计适当的容错量。

Exchange 2003 和 Windows Server 2003 中的功能,可能会影响您设计组织以满足 SLA 的方式。例如,通过卷影复制服务和 Exchange 恢复存储组功能,可以突破 SLA 以前的限制。有关如何实现这些功能以显著减少还原 Exchange 数据库所需时间的信息,请参阅 Exchange Server 2003 Disaster Recovery Planning Guide 中的“SAN-Based Snapshot Backups”(英文)。

下表列出了可能需要包括在 SLA 中的一些类别和特定元素。

典型的企业级别 SLA 中的类别和元素

SLA 类别 SLA 元素示例

运行时间

  • 用户可以使用邮件服务的时间
  • 专为计划的停机(维护)保留的时间
  • 因网络更改或其他可能影响用户的更改而产生的预先通知的数量

服务可用性

  • Exchange 服务运行时间百分比
  • 邮箱存储装入时间百分比
  • 域控制器服务运行时间百分比

系统性能

  • 邮件系统同时支持的内部用户数
  • 邮件系统同时支持的远程连接用户数
  • 每个时间单位支持的邮件事务数
  • 性能的可接受级别,如用户遇到的延迟

灾难恢复

  • 每个故障类型(如单个数据库故障、邮箱服务器故障、域控制器故障和站点故障)进行恢复所允许的时间
  • 提供备份邮件系统以使用户在不访问历史数据的情况下可收发电子邮件所需的时间(称为邮件传递拨号音)
  • 恢复故障点数据所用的时间

帮助中心/支持

  • 用户可以用来联系帮助中心的特定方法
  • 帮助中心对各类问题的响应时间
  • 帮助中心就问题升级过程提供的处理方法

其他

  • 每个用户所需的存储量
  • 需要特殊功能(如远程访问邮件系统)的用户的数量

在 SLA 中添加多种性能衡量方式,有助于确保满足用户的特定性能要求。例如,如果在客户端和邮箱服务器之间存在高延迟或低可用带宽问题,则用户应采用与系统管理员不同的方式查看性能级别。具体地说,当系统管理员认为性能可接受时,用户可能会认为性能级别较低。为此,监视磁盘 I/O 延迟级别是非常重要的。

note注意:
对于每个 SLA 元素,还必须确定要结合可用性目标来衡量性能的特定性能基准。另外,必须确定为 IT 管理和其他管理提供统计数据的频率。

许多对高可用性解决方案较为重视的公司,使用第三方供应商的服务来实现高可用性目标。在这种情况下,实现高可用性邮件系统需要外部硬件和软件供应商提供服务。如果供应商响应速度缓慢、工作人员培训不到位,则会降低邮件系统的可用性。

与每个主要的供应商就 SLA 进行协商是非常重要的。与供应商建立 SLA,有助于保证邮件系统按照规范执行操作,支持所需的增长态势,并可用于指定标准。如果没有 SLA,则会大大延长邮件系统不可用的时间。

important重要提示:
请确保您的工作人员清楚地知道每个 SLA 的条款。例如,许多硬件供应商 SLA 包含如下条款:只允许来自供应商的支持人员或您的组织内经过认证的工作人员打开服务器包装。如果不遵守这一条款,则会违反 SLA,并可能会导致任何供应商保修或责任条款无效。

除了与主要的供应商建立 SLA 之外,还应该通过进行支持请求训练来定期测试升级过程。为了确定您获得了最新的联系信息,请确保您还测试了寻呼和电话树。

 
显示: