本文来自千家网。
高性能计算(HPC)工作负载呈上升趋势,并且短期内没有放缓的迹象。预计到2032年,生成式AI有望成为价值1.3万亿美元的产业,而GPU的改进在短短10年内使IT性能增长了一千倍,其发展速度在更短的时间内迅速超越了之前的版本。
随着工作负载的增加,数据中心运营商也面临着由于能源需求激增而导致的功率波动加剧的挑战。这促使他们创新数据中心电源,以有效支持HPC工作负载。
可靠的电源供应始于确保可靠的动力传动系统和持续运行。在动力传动系统中,不间断电源(UPS)对于可靠性、防止电源中断、无缝地向IT设备供电以及维持运营效率至关重要。
了解人工智能的数据中心动力传动系统
电力输送系统是从公用电源到IT设备的配电结构,包括开关设备、UPS、配电单元(PDU)和其他重要组件。这些技术共同为数据中心提供电力。
集成系统可实现最大正常运行时间,提供可靠的电力和备用解决方案,以防止停电并保持连续运行。为了了解此设置的效率,让我们探索电流并检查每种技术对整体功能的贡献:
公用电网或可再生能源:这是数据中心基础设施电力的来源。
自动转换开关:在主电源发生故障时无缝切换到备用电源,确保持续运行。
燃料电池:以氢气为动力,可以作为主要或备用电源。
长寿命电池:比传统UPS电池提供更高的电力容量和弹性。
关键开关设备:防止外部故障(如公用电压波动或短路)的第一道防线,将电力引入数据中心网络。它也是重要的安全措施,在维护或维修期间隔离设备。
UPS:在电力中断期间提供关键电源备份。它们还充当缓冲器,过滤来自电网的任何电压波动或尖峰。当电网断电时,它会转向电池储能系统(BESS)。
BESS:缓冲电力并消除短期供电波动。与UPS一样,它也可以储存电力作为局部区域的能源储备。
静态转换开关:在电源之间提供电气负载的即时转换,从而保持电力的连续可靠。
电源分配单元(PDU)和远程面板:将电力有效地分配到各种计算节点和存储系统。
母线槽和机架PDU:为IT设备输送电力,准确满足已安装计算资源的需求。
AI工作负载正在重塑IT中的电力动态,为电网容量和运营复杂性带来新的挑战。尽管机架密度不断增加,但数据中心电力基础设施和技术保持不变。这种情况要求数据中心所有者和运营商确保电力系统中的每一项资产,都能无缝地将电力从公用事业企业输送到整个基础设施的关键组件。
UPS对于缓解停电期间的干扰、确保持续可靠的电力供应至关重要。选择正确的UPS系统可以帮助数据中心运营商管理HPC应用带来的电力负载。
UPS如何管理AI和HPC负载
UPS装置是数据中心电力系统的骨干,在稳定电力输送方面发挥着不可或缺的作用。UPS装置通过缓解电力波动并在断电期间提供即时备份,确保关键计算任务能够不间断地继续进行。
提供一致且平衡的电力
三相电力系统可以持续提供更高水平的平衡电力。三相系统中的每个电流相隔120度,确保当一个相达到峰值时,其他两个相仍在提供电力,从而防止电力供应下降。
另一方面,单相交流电系统的载流柱总是相隔180度。因此,存在没有电力输送到负载的周期,使其仅适用于家庭和轻型商业应用,以获得良好的能源供应。
三相系统能够持续不间断地供电,是高功率计算应用的理想选择。恒定且平衡的电力输送可以支持经常波动的AI工作负载需求,而不会影响性能或对关键设备造成任何损坏。它还可以更好地利用能源,减少电力浪费并提高效率。
实现持续、高质量的交流电
在线双转换UPS系统提供持续、高质量的交流电,这对于IT的平稳运行至关重要。交流和直流之间的转换可保护这些系统免受电压问题的影响并防止设备损坏。此外,它们还具有强大的内部旁路功能,可降低维护或故障期间停机的风险。
在线UPS系统可将关键负载与电源异常隔离,防止出现所有电源问题,并确保AI系统使用稳定、清洁的能源运行。它们能够在断电期间保持完美的正弦波输出,并为电池提供零传输时间,这对于防止数据丢失和保证不间断运行至关重要。
UPS系统中液体冷却技术的集成对于确保持续供电至关重要,这对于冷却剂分配中的机械负载至关重要。可靠的冷却系统可为设备和设施保持最佳温度。借助增强型UPS系统,数据中心运营商可以确保在电源故障期间冷却机制继续运行而不会中断,这强调了高密度计算环境中对恒定电源的需求。
无缝过渡至能源存储解决方案
电网互动式UPS系统与BESS等储能技术配合使用,帮助管理AI应用的电力需求。它们始终确保电力供应,即使在停电或需求高涨时也是如此。凭借快速频率储备(FFR)功能,UPS设备可以快速响应供需波动,实现无中断平稳过渡到储能。这对于具有密集AI和HPC工作负载的数据中心至关重要。
BESS与UPS配合使用来平衡AI负载,在需求低时存储额外的能量,并在高峰时段释放能量以保持AI运行供电(也称为“削峰”)。这种组合可防止过载,保持运行效率,并减少对传统电源的依赖。