智能时代,数据中心建设的新思考

随着各行各业数字化变革的不断深入,人类社会正加速迈向智能化。作为智能世界和数字经济的坚实底座,数据中心也迎来了蓬勃发展。

本文来自微信公众号“数据中心运维管理”。

一、智能时代,数据中心基础设施的新需求

随着各行各业数字化变革的不断深入,人类社会正加速迈向智能化。作为智能世界和数字经济的坚实底座,数据中心也迎来了蓬勃发展。面对ICT技术快速演进、建设需求激增以及绿色低碳要求,对数据中心基础设施的建设也提出了更高要求,具体表现在以下几个方面:

1.安全可靠,数据中心的核心需求

2022年-2023年期间,香港、新加坡、澳大利亚等地发生过大规模数据中心因基础设施故障导致的宕机事件,引起了业界高度关注。事实上,随着数字化的发展,整个社会的运转对数据的依赖程度越来越高,IT服务一旦中断,就会给生产生活带来不便,造成巨大经济损失,严重影响企业的声誉。尽管数据中心IT设施的虚拟化能力、业务迁移能力逐渐提升,但数据中心对基础设施安全可靠的要求并没有丝毫放松。随着政治产业环境日益复杂,引发事故的风险种类发生了一些变化,但安全可靠始终是数据中心最核心的需求,针对新兴的风险因素,要做好防范策略。

2.高效节能,双碳背景下的新目标

碳中和是全球的共识和使命,绿色低碳已经成为世界新的主题。随着数字化、智能化的发展,数据中心的规模在不断扩大,用于支持数据中心运行的能耗也在快速增加。世界各国各地纷纷出台各种政策或指导意见,牵引数据中心走向高效节能,绿色低碳。过去,大多数企业仅从经济效益来评判节能措施。现在,节能已经成为是否合规的重要考核指标,直接代表了企业的社会责任和形象。

3.经济适用,确保投资效益最大化

在数据中心建设规模较小的年代,数据中心在企业总资产中占比不高,企业对数据中心投资的经济性不是特别敏感。随着数字化的发展,数据中心建设的规模在增加,投资额急剧增加,其投资的经济性变得越来越重要。在数据中心建设过程中,既需要考虑整体TCO,还需要考虑分期部署和快速建设,力争快速形成收入,严格控制折旧等营运成本,确保投资效益的最大化。

4.智能运维,达成规划指标的最强助力

智能化是数据中心发展的必然趋势,只有智能化才能让操作更及时、更准确、更可靠、更经济,全面提升运行效率,确保达成规划指标。智能化还能减少人的干预,减少误操作,提升可靠性。此外,AI技术在智能化领域的应用,能够帮助数据中心进一步调优,提升运营效率。

二、创新的数据中心供电制冷解决方案

针对数据中心的这些发展和变化,以供电和制冷为主的数据中心关键设施的解决方案,也有了新的创新。

1.电力模块成为数据中心供配电首选解决方案

电力模块由变压器、进线母联柜、SVG柜、UPS、维修旁路柜、馈线柜组成,通过柜顶工厂预制铜排连接。电力模块内部集成一体化监控系统,可进行参数设置并实时监测设备状态、参数等。电力模块设备如图1所示。

640 (1).png

传统供配电系统设备来源多个供应商,设备间的连接铜排需要设备就位后测量、订货,铜排、线缆均需要现场制作安装,包括整体联调、系统验证,整个周期大于2个月。电力模块具有融合高密、部件模块化、工程产品化、产品预制化等特点,采用工厂组装预制化,标准流水化作业,出厂测试,安装施工环节引入外部风险小,相比传统方案单套交付时间控制在2周以内,品质可控,运行可靠性更高。电力模块方案采用了高密高效的UPS,并辅以配电柜结构优化设计,减小整体尺寸,通常能够节约20-40%以上面积,提升机房IT机柜的出柜率2-5%。全链路效率提升1-3%。电力模块内部功率模块、旁路模块、SVG模块、开关模块等易损部件均采用模块化热插拔设计理念,当系统出现故障后可以在线维护,时间仅需要5min,大大的提高了系统可用性。

华为推出的超融合电力模块解决方案,除具备上述电力模块所有优点外,在UPS架构、结构以及系统AI特性两方面进一步投入。超融合UPS内部架构融合UPS输入、输出开关和UPS主机,采用隔离开关+熔断器实现电源转换、电气隔离和保护功能,从而大大减小了整体占地面积,节约占地面积在40%以上。另外,超融合UPS模块化程度更高,整机内除隔离开关外其余部件均可以实现在线维护,做到真正的维护不断电。电气故障是影响全球数据中心安全运行的主要原因,华为电力模块具备独有的AI诊断功能,对部件使用寿命进行预测,提前发出告警,防患于未然,避免部件故障影响系统运行。

总之,较传统供配电产品和解决方案,电力模块节地、节能、省时、省力,可以提升数据中心建设过程的灵活性和使用过程的可靠性,因此,已经被广大数据中心从业者普遍接受并广泛应用。

2.以间接蒸发冷却空调系统为首的分布式制冷越来越普及

近两三年内,华为、腾讯、快手、万国、秦淮、中行、农行等涉及互联网、金融、政府多个行业的新建或待建的数据中心,更多采用了间接蒸发冷却的空调方案。海外众多数据中心运营商在最近几年的建设中,也在减少冷冻水方案的应用,取而代之的则是间接蒸发冷却空调方案。

所谓间接蒸发冷却空调系统(AHU),就是将新风蒸发冷却后得到的湿空气的冷量,通过非直接接触式换热器传递给机房的热回风,再辅以必要的过滤、补冷等措施,为机房提供满足要求的冷却送风。整个过程只有冷量的传递,没有物质的交换。间接蒸发冷却机组的内部结构如图2所示。

640 (1).png

间接蒸发冷却空调系统可以实现冷源与负荷中心近距离接触,利用逼近湿球温度的风侧自然冷却,实现全年应用自然冷却。即使最炎热的夏季,也只需要50%左右的机械制冷作为补冷,因此可以显著减少数据中心空调系统能耗。

除了节能,间接蒸发冷却空调系统还拥有很多传统冷冻水不具备的优点,AHU属于分布式架构的标准化产品,设计、施工、运维相对简单,故障率低,运行效果与设计偏差小。AHU故障定位相对容易,设备运行相对独立,互相之间无关联,故障影响面小。AHU建设施工周期短,调试时间短,改扩建不会影响已运行的模块,有利于分期投资。AHU无论是初投资,还是运行费用都低于传统冷冻水。该设施还可以辅以AI,进行自动调优运行。

华为最近推出的EHU设备,除了具备AHU的全部优点之外,还对其电气系统做了深度的优化,其供电架构如图3所示。

640 (1).png

新型的EHU,电源侧无需配备UPS主机,主备路电源切换过程可以通过电池供电,实现制冷无中断,机房温度零波动。电池供电负载可以通过控制软件灵活调整,自由选择风机、压缩机、水泵分别或组合由电池供电。只要电池容量配置得当,未来还可根据需要调整,大大提升灵活性。机组内置谐波治理装置,THDi<5%;具备校正功率因数功能,输入功率因数低至0.99,减小输入开关和输入电缆规格,提升项目的经济性。

总之,自然冷却利用率更高,系统更节能,分布式架构更可靠,TCO更优,运维管理更简单、更智能,这些优势完全匹配了数据中心的发展趋势,这是近年来数据中心普遍采用这种制冷方式的原因。

三、智能时代,数据中心建设面临的新挑战

数据中心可靠性的标准包括“数据中心设计规范(GB0174)”,“Telecommunications infrastructure standard for datacenters(ANSI/TIA-942-B)等,对数据中心的级别和冗余能力进行了细致规范,可以防范的故障种类主要包括地震、洪涝等环境灾害,市政停电停水、产品或系统正常运行中的故障等,基本没有针对恶意因素导致的故障。随着政治经济形式的变化,引发数据中心故障的原因也有所变化,比如网络安全和供应链安全。

1.网络安全已经成为数据中心的潜在风险

网络攻击具备检测难、防护难、恢复难的特点,对数据中心的危害极大。过去,因为发生概率低,很多数据中心并没有制定对应的防范措施。当前,数据中心的基础设施系统已经演进为复杂的智慧生命体,智能化这把双刃剑,在提升可靠性和效率的同时,也带来了网络安全的威胁,对于数据中心,其设备端、通信网络端、管理平台端都存在被攻击的可能性,不论是IT设施,还是机电设施,受到攻击,都会影响数据中心上层业务的连续性。我们需要在数据中心基础设施领域引入更多的网络安全相关的标准、认证,适时制定针对数据中心基础设施的网络安全标准,建设以网络安全为底线的软硬件一体化的防御体系,对抗网络攻击和威胁。

2.供应链安全正成为数据中心关注的新焦点

习近平总书记在党的二十大报告中指出,“着力提升产业链供应链韧性和安全水平”。供应链的韧性和安全水平反映企业抵抗风险能力的大小,对企业经济体系运行具有重要影响。针对产品的研发、采购、生产、供应,企业有必要采用多元化方案,避免独家供应或单一地区供应带来的风险,保障产品的可供应性。制造能力和运输能力也需要备份,确保突发事件下可启用备份运输路线,保障物流运输业务的连续性。近十年来,华为成功应对了许多重大自然灾害、政治、经济、贸易、网络病毒灾害等风险事件,充分表明华为建立的供应连续性管理体系和管理机制是完全有效的,能够保障供应连续性和产品以及客户服务的及时交付。

四、结束语

对于数据中心来说,安全可靠是发展的前提,绿色低碳是可持续发展的保证,相信同行会一起努力、一起践行,确保智能时代数据中心的高质量建设,高效率运营。(来源:《数据中心建设+》杂志)

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论