本文来自微信公众号“天翼智库”,作者/胡绯绯、孙浩。
算力是数字经济时代的新生产力,是推动数字经济发展的核心支撑力和驱动力。由于ChatGPT带来的人工智能爆发式增长,拥有巨大参数量的超大规模人工智能模型,对智算算力的需求显著提升,未来算力可能存在巨大的缺口,这使得计算能力逐渐成为政府及业界关注的重要领域。同时智能算力需求的高速增长,对未来数据中心、云计算等算力基础设施也将产生巨大的影响。
人工智能增长驱动下的全球算力发展趋势
全球算力规模超高速增长,智能算力是主要驱动因素。据信通院数据,2021年全球智能算力占总算力的38%,达232EFlops。2025-2030年,全球算力将进入高速增长阶段,年复合增长率超过70%,华为预测2030年智能算力将占总算力规模的94%。
1.人工智能爆炸式增长造成算力供给与需求的缺口增大
目前人工智能对算力需求增长的速度要快于算力供给增长的速度。据OpenAI的分析,自2012年以来,最大规模的人工智能训练中使用的计算量以3.4个月的倍增时间呈指数增长,相比之下摩尔定律的倍增周期为2年,对算力不断增长的需求远远超过了摩尔定律所带来的效率提升。未来人工智能将进一步推动算力需求爆炸式增长,据OpenAI推算,GTP-5的参数量将是GTP-3的100倍,需要的计算量则是GTP-3的200~400倍。
图一1 AI高速增长下算力供给与需求的差距在增大
先进的人工智能系统越来越依赖于高性能计算,人工智能、机器学习特别是深度学习作为高性能计算的重要工作负载持续增长,高性能计算市场迅速增长。据Hypersion Research预测,2022年全球市场规模达到370亿美元;2026年将超过520亿美元,年复合增长率10.7%。
2.算力需求爆发使全球数据中心建设进入新的扩张周期
Dell'Oro Group于2020年预测,2020-2025年全球数据中心资本支出CAGR为6%;而2023年新发布的预测显示2023-2025年全球数据中心资本支出CAGR增至11%。其中,超大规模云服务提供商的数据中心支出将在未来五年内翻一番。
近期,全球头部云厂商、数据中心提供商纷纷发布规划及预算,加速数据中心布局。Facebook预计2023年资本支出390亿美元,主要投资于服务器和网络基础设施。NTT于2023年宣布计划在未来五年内向数据中心、人工智能和其他“增长领域”投资590亿美元,其中至少110亿美元将用于扩大或升级其数据中心。
3.新一代人工智能数据中心成为建设重点
数据中心的设计建设模式需适应人工智能产生的需求,下一代数据中心需要投资人工智能专用硬件,采用新的数据中心设计,主要体现在四个方面:第一,人工智能数据中心通过异构计算突破算力瓶颈,包括CPU、GPU以及专用硬件如ASICs和FPGAs在数据中心的综合部署。第二,人工智能和机器学习可能需要三倍于传统数据处理的功率密度,冷却是广泛关注的主题,液体冷却和浸泡冷却可能是发展趋势。第三,高速的存储访问对于人工智能工作负载至关重要,数据中心将需要扩展其存储能力来满足不断增长的需求。第四,人工智能数据中心的效率与其网络的性能直接相关,零丢包、低时延、高吞吐的智能无损网络将成为人工智能数据中心的网络解决方案。值得注意的是,2022年Meta宣布取消或暂停部分正在建设的数据中心,对其11个正在开发的项目进行重新设计,彻底转向人工智能数据中心的建设。
4.高性能计算云化是大势所趋
高性能计算是使用并行工作的强大处理器集群,处理海量多维数据集,并以极高的速度解决复杂问题。随着大数据、人工智能与高性能计算技术融合,高性能计算应用场景更加丰富,高性能算力需求高速增长。高性能计算集群建设属于重资产,建设成本高、周期长。以云计算为载体,以高性能计算服务为核心的高性能计算云为利用高性能计算提供了一种更快捷、可扩展且更经济的方式。Hypersion Research预测,到2026年高性能计算云收入将超过110亿美元,市场增速将是线下高性能计算市场规模的2.5倍,2021年至2026年的年复合增长率达17.6%。
华为云、AWS、阿里云等大规模云服务提供商提供了高性能计算云解决方案,如华为云的高性能计算解决方案为工业设计、生物医药、能源勘探、图形渲染与异构计算等应用场景提供灵活弹性的高性能云服务器,基于分布式架构提供可弹性扩展的海量存储服务,并提供100G及以上高速计算网络。
全球各区域市场算力现状及发展趋势
全球各国算力规模与经济发展水平密切相关,经济发展水平越高,算力规模越大。全球算力目前主要分布在美国、中国、欧洲和日本,占全球总算力规模的86%(2021年)。
1.美洲算力规模稳居世界第一,政府支持力保长期处于算力领导者的地位
以美国为主的美洲算力发展一直排在全球第一的位置。根据信通院数据估算,2021年美洲算力总规模超230EFlops。在超算方面,目前超算TOP500中,美洲有美国、加拿大和巴西三个国家上榜,超算系统总数为145个,算力规模总和约2.2EFlops,排名全球第一,占比43.64%。
政府的重视及支持是美洲算力领先的主要动力。美国、巴西、加拿大等国都制定了人工智能国家战略,并建立了完善的促进人工智能发展的组织体制,同时提供长期大规模的财政预算支持,这将使得美洲未来很长一段时间内,仍能保持全球算力第一的位置。
2.欧盟整合欧洲各国资源统筹发展,提升欧洲整体算力水平
欧洲的算力大国主要以西欧国家为主,其中德国、英国算力规模仅次于日本,另外法国、荷兰、意大利、西班牙、波兰、瑞士、瑞典也是入围全球算力规模前20的国家,但是各国的算力规模与中、美的差距较大。另外,在超算方面,截至2022年11月,欧盟有17个国家拥有入围Top500的超算系统,数量占到全球的21%,算力规模占全球的16%。
欧盟在2018年通过联合倡议方式成立欧洲高性能计算联合委员会(EuroHPC JU),通过汇集欧盟、欧洲国家和私人合作伙伴的资金和资源,推动欧洲开发世界一流的超级计算生态系统,并负责算力资源在欧盟各国间的统筹调度和分配,并且不断加大算力基础设施建设和配套关键技术研发的投入力度,以保证欧洲在算力竞争中不会落后。
3.亚太区各国算力水平差距较大,投资差距是主要原因
亚太区除中国、日本以外,韩国、印度、新加坡、印尼也进入了全球算力规模排名前20,但整体的算力规模全球占比不高。在超算方面,韩国、澳大利亚、印度、新加坡等拥有超算系统,算力规模占全球的3.35%。
东盟各国高度重视人工智能的发展,新加坡、印尼、越南、菲律宾、马来西亚、泰国都制定了人工智能国家战略,但是由于不断扩大的人工智能投资差距,各国的算力水平差距非常大。2019年人工智能投资统计数据显示,新加坡人均人工智能投资68美元,泰国、马来西亚、印度尼西亚、越南和菲律宾的人均投资只有1美元。
4.中东非算力发展尚处于起步者阶段,正努力吸引外来投资
中东非只有沙特拥有6台超级计算机,整体算力水平比较差。各国重视人工智能的发展,出台了相关政策和国家方案,但是由于经济技术水平有限,大多寄希望于他国资本来开展投资建设。
运营商海外算力服务发展建议
中国算力建设处于全球领先地位,“东数西算”工程构建的全国“算力一张网”,提供了低成本的随处可用的算力资源。
运营商需积极探索基于自身云网优势、人才优势、技术优势的海外算力市场服务策略,通过离岸算力服务、云算力服务、本地化算力服务等多种模式,在全球算力服务市场获得一席之地,提升全球化竞争优势。
现阶段应积极参与“算力赋能”港澳。一方面加速推进“粤港澳大湾区”、自贸区算力资源服务港澳的相关政策出台,积极配合推进数据跨境的相关政策出台,助力港澳融入全国算力“一张网”。第二,把握市场机会,在香港建设智算中心,提升智能算力供给能力。第三,提升高性能云服务提供能力,依托天翼云等提供海外智能算力服务。
同时,运营商还需高度关注东盟市场的算力需求,积极促进东盟作为一个整体的算力共建共享。引领东盟整合各国资源、协同发展,实现东盟层面算力统筹调配,提高智算利用效率。依托在亚太区的网络、云服务、数据中心等算力基础设施资源,助力提升东盟整体算力水平。
数据来源:
1.Hypersion Research,2022