如何扩容规划减少浪费 决定系统容量规划
- +1 你赞过了
【天极网办公频道】系统容量规划的目标是确保始终有足够的供电和制冷容量来支持IT负载。为了确保在必要时提供足够的容量,在设计规划时必须涵盖数据中心生命周期内任意点的最大预测负载。
旧办法:过度建设引起浪费
确保始终有足够容量的最简单的方法是一开始一步到位构建可以支持最大预测负载的基础设施。这是过去一直使用的策略,但这可能会极其浪费,因为在大多数情况下它会导致过度建设和容量得不到有效利用(图12)。造成这种浪费包括闲置设备的资本费用,以及闲置容量的运营费用。在数据中心生命周期内,对不需要的容量付出供电的成本,以及对其进行维护和修理的维修成本可能会非常庞大(参见APC 37号白皮书《避免数据中心和网络机房基础设施因过度规划造成的资金浪费》)。闲置容量一般有两种产生方式:
² 如果IT负载开始时较小并随着时间的推移而增长,系统在过渡期间会过度建设(图12a)。
² 如果IT负载永远达不到预测水平,说明系统在其整个生命周期内过度建设(图12b)。大部分数据中心永远达不到其预测的满容量——实际上,一般数据中心以低于一半的容量运行。
新方法:通过分阶段扩容规划减少浪费
如果基础设施可以分阶段部署,上面图12中所示的两种过度建设都可以大幅度降低。分阶段扩容具有三个重要优点:
² 过渡期间的容量浪费较少。如果IT负载存在过渡时间,那么分阶段扩容可以使容量在增长期间更紧密地匹配IT负载。除了始终有额外容量的安全容差以确保当前负载得到适当的供电和制冷(安全容差),分阶段规划还可以大幅度降低不必要的容量过大引起的的浪费(图13a)。
² 减少增长的不确定性。如果未来的IT负载存在不确定性(情况几乎总是如此),那么随着时间的推移且未来变得更加确定,每个阶段都提供了一个重新评估容量规划的机会(图13b)。有了信息的更新,就可以延迟下一个阶段、进行阶段性的扩大或缩小,或者完全停止阶段扩容。如果预测的IT增长无法实现,该策略可以避免建设过度。
² 使制冷架构的发展有据可依。机房中的制冷分布方式会影响支持高密度IT设备的能力。房间级制冷架构不能锁定高密度“热点”,使机房的物理区域不可用于高密度,即便机房的总制冷容量与机房设备所需的制冷容量相匹配。以递增的方式部署物理基础设施,以支持已知密度要求的行级增量为单位增加电力和制冷容量,这样可以避免无法使用的“分散容量”所造成的浪费。
可扩展和不可扩展组件
为了最大限度地减少过度建设,同时为IT负载确保足够容量的目标,基础设施的可扩展和不可扩展组件以不同的方式进行部署:
² 不可扩展组件在开始时安装,以适应数据中心生命周期内预期的最大负载(最终负载最大值参数)。不可扩展组件的例子包括物理机房大小、电气进线口容量,以及预先存在的机房级空调。遭遇这些“硬性”的容量限制可能会严重影响时间、可用性和费用,而且一般被认为是必须不惜一切代价加以避免的。
² 可扩展组件在开始时安装,用于低于最大值的负载(足以支持初始负载一段时间),然后根据分阶段扩容规划的步骤,随时间推移而逐步增加。可扩展组件的例子包括机架、机架级电源保护和分配,以及机架级制冷设备。
图14.容量规划的可扩展和不可扩展组件的部署
处理不确定性:“负载最小值”参数的关键作用
最终负载最小值参数是在模型中内置有关未来IT负载不确定性的信息的关键所在。
最终负载最大值参数早在几十年前就出现了,是在预测未来IT负载时处理不确定性的一种简单方法。由于供电和制冷容量必须适应将来可能产生的任意IT负载,因此传统的方法一直是选择一个通用的最大值,然后为了安全起见,在前期就将设施一次性部署到该水平。这种方法虽然有效,但是会造成浪费,前面的图12和13中显示了造成浪费的两个原因:(1)过渡时间的闲置容量;(2)数据中心生命周期内的闲置容量(如果永远达不到预测的IT负载)。
既然基础设施技术支持可扩展供电和制冷,所以最终负载最小值参数可以为物理基础设施的设计提供更多的信息。加上能够在分阶段扩容时扩展系统的主要部分,最终负载最小值参数为处理不确定性提供了一种强大有效的手段。最小值与最大值相差越大,预测未来IT负载时的不确定性就越大。
利用最小值与最大值之间的这种差值来衡量不确定性,可以决定是前期一次性部署整个系统还是设计一个分阶段扩容的规划:
² 无不确定性。如果最终负载最小值等于最终负载最大值——即最终负载没有不确定性,而且在达到最终负载之前有大量的过渡时间使容量与负载匹配,那么进行分阶段部署的唯一理由就是效率优势。阶段数量将通过权衡(阶段安装时)中断的成本与过渡期间因容量过大而浪费的成本来决定。
² 不确定性很小。如果最终负载最小值仅略低于最终负载最大值,分阶段扩容的过渡(提供重新评估点或将容量与负载匹配)的优点可能不足以解释由分阶段部署引起的中断。在这种情况下,前期的一次性部署可能是最佳选择。
² 不确定性很大。如果最终负载最小值比最终负载最大值小很多,则一般适合初期构建为小型并逐步扩容的规划,其扩容规模基于下一章节决定扩容规模的因素中描述的考虑因素。
图15显示了阐述上述原理的几种情形。
图15.显示IT负载不确定性和过渡时间如何影响系统容量规划按阶段扩容的情形:
确定扩容规模的因素
分阶段部署的规模是通过仔细考虑以下几个因素之间的权衡关系后决定的:
系统架构。考虑中的设计的基本架构将决定系统可以扩展到什么程度,即设计可以如何精细地分解为“积木”。如果有一个参考设计库可供用作设计模板,那么每一个设计都应该有一个“扩展性”属性,用来表示可能的扩容规模。
房间布局。房间物理布局一般会要求对部署步骤进行逻辑分解。这些步骤一般采用行级结构,每个阶段都包括很多行(以及可能的行级电力和制冷)。如果在安装下一阶段的过程中需要对系统进行物理隔离,可能有一个明显的位置可以构筑一道临时屏障。在这种情况下,该屏障的位置将决定物理空间的划分,进而决定扩容规模。
IT负载的不确定性。如果IT负载的未来规模不确定(最终负载最小值大大低于最终负载最大值),分阶段扩容可以为作出进一步部署的承诺之前的重新评估提供终止点。当不确定性较大时,更小、更频繁的阶段可以为基于开发条件的规划调整提供更多机会(参见图11)。对于极端的不确定性,这种分阶段部署的“救急”特点成为在设计扩容规模和频率时的主要考虑因素。
数据中心生命周期的不确定性。如果数据中心自身的生命周期不确定——例如,如果已经知道数据中心将不得不关闭或者在生命周期中途发生搬迁转移,分阶段扩容的规模可以将这种风险考虑进去,从而减少停止使用从未使用的备用容量而造成的潜在浪费。如果这种搬迁的可能性将会在短时间内出现,那么可以暂停分阶段扩容。
成本和中断。不论安装效率或设备价格如何,总会有一些与分阶段扩容部署相关的成本和中断。这必须与分阶段扩容规划的战略优势进行权衡。
最新资讯
热门视频
新品评测