可持续计算筛选漂绿

Dave Ohara

目录

数据的必要性
测量能源使用情况
功率因数
在生产中测量
Microsoft 企业工程中心
结束语

现在有相当多的产品和解决方案在宣传上都以环保、节能、高效为卖点。所有这些天花乱坠的广告宣传都会在市场上引发对相关产品是否确实环保的争论。即使在对各种产品的规格进行评估之后,IT 专业人员也很难(如果并非不可能)

确定在重点考虑环境影响时应使用哪种设备。在所有的演示中,好的节能效果始终都是亮点,您也会因此认定通过投资回报 (ROI) 就能更轻松地判定升级。毕竟,节省能源应该可以减少总体拥有成本 (TCO)。

由于各类公司都趋向于将其所有产品都冠以环保的头衔,并刻意打造环保解决方案,从而产生了“漂绿”这一概念,其含义是过分夸大环境方面的优势。那么,能源节省的真谛究竟为何?打个比方,它不能简单地界定为在您家中安装新型的节能灯泡。

随着人们对可持续 IT 工作的愈发关注及环保型 IT 设备市场的扩大,许多人和组织都转为部署节能型便携式计算机、台式机和服务器,并利用虚拟化减少能源消耗。但很少有组织会开展能源审计来确定其所购产品的真正价值。

虽然最好能在生产环境中积极进行评量,但成本可能相当高。如果您尚不能实施生产评量,可以通过先期执行能源审计而获得实效(在您的性能和评估实验室中完成审计)。(大部分公司都有一些实验室或小组负责在购买之前对设备进行测试和评估。)您可以在那里将能源性能作为一个新的测试条件,然后在做出购买决策时将这些结果考虑在内,而不是依赖于制造商所提供的数据。这样,随着您测试的进行,便创建了自己的设备能源消耗数据库。您也不会再为漂绿所左右,能挖掘出真正令自己受益的产品。

当然,我应该指出,如果您想要在真实工作环境中操作的精准数字,就需要监视您的生产环境。越早开始监视生产环境,您的组织受益越大,收效越好。这一过程对于您的长期成功非常关键。

数据的必要性

在理想情况下,应该有独立的测试来评估硬件设备在实际用户负荷下的能耗性能。但整个行业还处于开发和实施此类测试的初级阶段。那些现在可用的测试(如 SPEC Power 基准)仍处于其起步阶段。这些能源测试一旦得以完善,它们将会大展身手。但对于任何测试,制造商都将了解如何修改其设备以获得最佳的测试结果。

有经验的 IT 专业人员已经学会了质疑由测试实验室执行的测试。就像汽车公司确保其提供自己最好的汽车进行路面测试一样,IT 供应商也必将提供其最有效的设备配置来进行能源测试。

考虑使用虚拟化测试来比较一组超配置的服务器,其中没有执行任何服务器合并来显示虚拟化的优点。供应商忽视了其节能项目(如虚拟化)中可能存在的回弹效应等问题。从根本上来说,这是指能源效率在降低成本的同时导致需求增加,从而增加了能源消耗。当您看到某个解决方案(如虚拟化)被宣扬为节能的“万灵药”时,您应持怀疑态度。您必须确实了解所有工作是如何协作的以及随着时间的推移将产生哪些连锁反应。

那么,您如何找出适合您组织的途径呢?能对价格进行评估的顾问为数不少。但此方法有一些明显的不足之处。您确实想要将有效的专业知识传给您组织以外的人吗?您想依仗签长期合约的顾问并受制于他们的服务吗?

您可能使项目变得臃肿不堪,并且在确定您的环境可持续性策略时,参与的人员会过多。还应避免在您的环境中随便选取一个场所即开始评量。虽然主观意图没错,但方法没有任何意义,因为它只是一个随机操作。您需要找出消耗能源的真象以及您可以发挥影响的方面。

测量能源使用情况

您需要以一种新的方式来考虑什么在起作用。如果某项服务中断,IT 专业人员知道某个硬件何时不起作用。但是,就能源消耗而言,如何判定某个硬件在什么时候不能正常工作呢?这种测定可能会很难,因为许多组织都没有可建立其基准能源效率的数据。

您如何获取这些数字呢?一些人提出需要一个独揽能源大权的人。不过,这要求有人可以掌握公司组织的全面情况并且是能源问题的技术专家。一个简单易行的方法是将能源计量工具添加到性能实验室的现有功能中。

能源计量设备有许多。遗憾的是,此时却没有完全适合 IT 性能实验室的设备。在低端,您可以采用 Watts Up Pro。这是一台 USB 设备,提供了 120V 的内部功率测量。另一台设置是 Smart-Watt,一台可联网的功率消耗设备,其测量范围为 100-240V 和 15-30A。Smart-Watt 设备还配有温度和湿度传感器,用于测量环境因素。还有一些工业功率分析设备,例如 Extech Appliance Tester 380801 和 Fluke 345 Power Clamp。找到这些设备以满足实验室测试的需求应该不会出现什么问题。

功率因数

如果您首次测量功率,那么了解功率因数这一概念非常重要。交流电气系统的功率因数被定义为实际功率与视在功率的比值,其取值范围介于 0 和 1 之间。实际功率(瓦特)是电路的做功。视在功率 (VA) 是电路中的电流与电压之积。

您可能想知道这为什么很重要。看一下图 1。此图显示了 Smart Works 的能源监视设备,用于比较便携式计算机、灯泡和电容器的能源效率。灯泡的负载为 50 瓦特,视在功率为 50 VA,因此功率因数为 1.0。带有纯电容性负载的电容器的负载为 2 瓦特,视在功率为 193 VA,因此功率因数为 0.01。便携式计算机的使用功率是 22 瓦特,但视在功率读数为 48 VA,因此功率因数为 .47。便携式计算机的功率因数较低是因为设计的电源效率低下,而且很可能是制造成本目标的结果。

fig01.gif

图 1 便携式计算机、灯泡和电容器的能源消耗(单击图像可查看大图)

由于能源效率如此重要,供应商现在正努力改进预期条件下电源的性能。如果您将现有设备的功率因数与新设备的功率因数进行比较,您会发现,如果能选用电源效率和功率因数更高的解决方案,可以减小功率损失。

在生产中测量

在性能实验室中测量结果是为预测生产环境的性能。在生产中测量能源消耗所面临的问题是测量所有设备所花费的成本。但有一个策略可以减少在生产中功率测量成本,即使用机柜电源插座 (PDU) 测量,然后合计多个设备读数。图 2 显示了从 PDU 获取的能源读数示例,一个机柜上有同一设备的多个部件。由于每台服务器的平均能源消耗是可以计算的,因此这种测量方式为您提供了生产能源消耗的数据。

fig02.gif

图 2 使用机柜电源插座测量(单击图像可查看大图)

对设备各个部件进行测量时,应将能源信息集成到您的配置管理数据库中。如果这很难,您可以创建您自己的数据库,或者至少创建一个 Excel® 电子表格以列出设备及其能源消耗。随着设备的逐渐增多,您可以为其他设备填充估计值以创建计算整体功率值。请记住,与峰值状态相比,新型节能服务器在闲置时将消耗不到一半的功率负载。如果您的旧服务器还在运行过时的解决方案,那么这些旧服务器即使在闲置状态下也将消耗相当大的功率。如果在此方面有所改进,最容易提高利用率。

如果您要继续提高,接下来要计算您的数据中心中每个机架的功率。当您改变环境时还需了解功率和冷却能力。随着时间的推移,您将开始查看设备的功率需求,而不仅仅是该设备所需的空间。空间是一个简单的概念,它是静态的、可视的。IT 专业人员可以轻松讨论 1U、2U 和 4U 服务器,但开始讨论 200 瓦特服务器与 450 瓦特服务器时,您将发现这些 IT 专业人员的会谈就不甚流畅了。这是 IT 设备的新语言,在现在的数据中心十分常见。许多都拥有大量的空间,即使已经达到了其最大功率容量,也可以容纳更多的设备。

Microsoft 企业工程中心

Microsoft 企业工程中心 (EEC) 最近在其设备中添加了功率测量功能。EEC (microsoft.com/windowsserver/evaluation/eec/default.mspx) 位于华盛顿雷德蒙的 Microsoft 企业园区内,是最先进的试验场,能应对最复杂的计算环境。

EEC 在硬件和联网设备方面投入了 4000 万美元(请参见图 3),可以处理企业实际生产环境中最复杂的改造。该小组与许多一流的网络、存储和客户端/服务器解决方案提供商合作,将前沿技术与传统平台相结合。它的目标是确保每个测试准确反射客户的当前环境。在该设备中开发的最新服务是报告解决方案的能源消耗,为每瓦特性能提供基准。

fig03.gif

图 3 EEC 实验室中的一排设备(单击图像可查看大图)

在过去的几年中,EEC 看到许多数据中心操作员都用尽了其设备的功率和冷却能力。最先进的设备通常具有更高的功率密度,这会给装备施加更大的压力。EEC 的员工最先了解到了升级电源和冷却基础结构所涉及的成本和时间。为了提高操作效率和成本效益,EEC 已经实现了按设备测量功率。

编写本文时,EEC 使用的一些工具和设备还没有面市。由于这是一个新的解决方案,因此 EEC 将与客户、供应商和 Microsoft 开发团队合作,继续开发更好的技术。EEC 与客户直接共享其到目前为止所开发的方法以获得早期反馈,从而使客户可以创建其自己的基准。

不要认为结果将显而易见。EEC 公布了它在 EEC 性能实验室中使用能源监视功能时所看到的一些有趣结果:

  1. 关闭设备并不一定会减少所预期的能源消耗(请参见图 4)。在一个涉及服务器硬件的案例中,EEC 发现有一台设备在关闭但仍接通电源时实际消耗了 100 瓦特。这让许多人都感到吃惊,EEC 对设置进行了多次检查。他们最终使用红外温度计来测量入口和出口温度,并证实该设备在关闭时实际上确实消耗了 100 瓦特。
  2. 软件对功率消耗可能有极其重要的影响。在相同的网络交换机上(具有相同的硬件和 BIOS 配置),运行不同的网络软件在功率消耗方面呈现出了 21% 的差异。高端解决方案启用了更多进程和功能(如安全性和监视工具),与其更简单的低端解决方案相比,功率消耗要大得多。
  3. 在虚拟化环境中,EEC 测量了功率消耗与 I/O 利用率和 CPU 利用率,以确定给定的硬件最大化其每瓦特性能的时间。EEC 发现片面追求 CPU 利用率可能会导致物理机上加载的虚拟机过多,实际上这会降低整体的每瓦特性能。
  4. 正如您所料,高密度设备的电源和冷却问题更多。部署高密度系统时,应尽可能早地咨询您的电源和冷却设备人员。如果您知道环境中的电力有限,这些设备可能是生产中其自身功率监视设备的首选。
  5. 双电源消耗的能量可能要比单电源大得多。
  6. 看来即使相同的硬件有相同的配置,功率消耗也会显著不同。所观察到的差异足以使 EEC 员工再次对硬件进行检查以确保它们的实际配置相同。
  7. 产品铭牌上的瓦特额定值不是实际消耗数字,而是电源的额定功率。
  8. 维护每台设备和子组件的能源消耗测试和结果的数据库对于保留知识和比较数据而言至关重要。
  9. 相等量 RAM 的不同配置所消耗的能量不同。DIMM 数量越少,通常消耗的能量也越少,例如,4 个 2GB DIMM 与 8 个 1GB DIMM。但有一些情况下,DIMM 数量越少消耗的能量却越多。

fig04.gif

图 4 打开与关闭时的功能消耗比较(单击图像可查看大图)

结束语

通过在性能实验室中测量功率消耗,您可以使用实际负载的准确数据,在您自己的数据库中开始收集每台设备的能量消耗。部署这些解决方案时,您应审核闭环反馈结果以确定性能实验室测试的准确性。正如 EEC 通过运行其自己的测量测试所了解到的,您确实可以找到一些值得注意的细节,帮助您筛选出漂绿产品并发现真相。

这种在性能实验室进行的测量将会影响整体市场,帮助识别哪些产品确实最节能。随着时间的推移,制造商将会发现为其节能声明提供更加准确的数据是非常必要的。同样,IT 专业人员也会将每台设备消耗的瓦特数视为常用的采购条件。需要将其当成常规惯例,尤其是对于购买大量服务器的公司更应如此。不过,从现在开始,您可以率先将功率视为一项有价值的 IT 资源,对费用加以引导。

保持数据中心冷却

数据中心冷却设备为减少能源消耗提供了巨大的潜能。数据中心可能产生多少热量以及保持硬件冷却需要多少能量,这些数据是非常惊人的。但是如果您希望成功管理您的冷却设备,修复问题并开发更有效的冷却解决方案,您将需要一个温度监视解决方案。请考虑一下 Microsoft 数据中心使用的解决方案。

Microsoft 研究中心为数据中心构建了一个温度传感器网络,不但可以改善温度控制,而且还可以对各种冷却设备的改进进行评估。例如,一个 Microsoft 数据中心对用于改善冷热空气隔离的走廊末端空气幕进行了评估。安装空气幕后,一些服务器开始发出过热警报。操作工程师随之增大了冷却系统的气流,从而提供了更多的冷却空气。但令他们惊讶的是,有更多的服务器发出了过热警报。而且所有这些服务器都位于机架底部,而底部通常是架空地板冷却系统最冷的区域。

工程师通过传感器网络确认机架随着高度的增加温度降低,而机架底部是最热的部分。他们很快就发现了热空气来自于机架底部与地板之间的热过道,也就是柏努利原理的结果。他们通过将机架底部密封起来并减小气流速度轻松地解决了过热问题。

由于这恰恰是 Microsoft 企业工程中心在进行性能测试时所收集和分析的一类数据。因此,EEC 最近通知 Microsoft 研究中心他们已经做好了部署测试准备。在一天之内,将系统部署到 10 个机架中,仅花费一个小时就完成了安装。EEC 现在可以研究并更好地了解冷却问题及其与硬件性能的关系。

当然,仅仅监视本身并不是解决方案。真正的收益在于您能找出问题区域,可以修复、更改以及评估各种解决方案以了解它们是否能实现您所期望的结果。您当然不希望在新冷却解决方案意外导致机架过热时感到措手不及。

Dave Ohara 在技术方面已有 26 年的工作经验。他现在负责为多家公司实施环保计划。

© 2008 Microsoft Corporation 和 CMP Media, LLC。保留所有权利;未经允许不得复制本文的部分或全部内容。