本文来自微信公众号“乐晴智库精选”。
全球新一轮AI浪潮爆发背景下,大模型和数据中心都需要庞大的算力来作为支撑,全球算力需求井喷。
全球算力规模将呈现高速增长态势:
资料来源:信通院
数据显示,ChatGPT需要7-8个算力500P的数据中心才能支撑运行。对于微软、谷歌、百度这样的巨头而言,算力成本显然并不会成为障碍,但对于中小团队来说,如此巨大的成本几乎就是一座不可逾越的大山,并不是每一家企业都有能力建设属于自己的算力矩阵。
为此,早前英伟达方面提出了一个新的模式——租算力。
英伟达CEO黄仁勋宣布了DGXCloud计划,将面向商业客户开放用于开发ChatGPT等人工智能技术的超级计算机,几乎任何企业都可以用云租赁的方式,使用这些强大、但成本昂贵的设备。
英伟达推出租赁算力服务,为的就是让更多创业者参与进来,特别是参与到大语言模型的市场竞争中。
据悉,英伟达的DGXCloud是其与甲骨文等合作伙伴打造的云服务,任何人只要有网络,就可以登录集成了多达3.2万个英伟达芯片的超级计算机;未来微软、谷歌云等厂商也将加入。
国内方面,随着头部互联网及科技企业纷纷推出大语言模型,国内厂商对算力资源的需求也将呈现井喷,算力云端租赁服务商有望新来发展空间。
政策方面,上海市发展改革委近日印发《上海市加大力度支持民间投资发展若干政策措施》提出,支持民营企业广泛参与数据、算力等人工智能基础设施建设。推动“补需方”改革,支持高校、科研机构、国有企业通过政府采购、租用等方式使用民间投资的数据储存和算力资源;通过科技创新券支持民营企业租用算力、存储资源。
北京和深圳也提出要提升算力资源统筹供给能力,建设城市级算力统筹调度平台。
根据中国信通院《中国算力发展指数白皮书》测算数据,预计2025年全球算力规模将达到3300EFlops,2021-2025年CAGR达52.2%。
图片资料来源:量子位,《Intelligent Computing:The Latest Advances,Challenges,and Future》SHIQIANGZHU等
01
算力行业概览
算力是通过对信息数据进行处理,实现目标结果输出的计算能力,可以说是信息的高速公路。
我国现在算力的总体水平已经达到了世界第二,仅次于美国。在15个国家有个统计数据:算力每提高一个百分点,对GDP的贡献就是1.8‰。
大规模智能算力基础设施是各科技公司训练AI大模型的前提,也是实现算力和算法租用的ALaaS服务的基础,正逐渐成为AI领域竞争的关键要素。
算力产业链基础设施包括数据中心、服务器、芯片、光通信、云服务等关键环节。
算力产业链图示及部分代表厂商:
图片资料来源:各公司官网、华泰研究
数据中心作为承载各类数字技术应用的物理底座,是算力关键基础设施。根据华为统计,2010-2025年间,数据中心平均单机柜功耗增长近7倍。
随着生成式AI的持续火爆,导致AI算力需求骤增,推动基础设施扩容,服务器、交换机加速迭代,并使得AI芯片中的GPU及高性能加速服务器需求大量增加。
云计算平台是AI算力主要的承载方式。
云计算的本质,是将大量的零散算力资源进行打包、汇聚,实现更高可靠性、更高性能、更低成本的算力。
具体来说,在云计算中,中央处理器(CPU)、内存、硬盘、显卡(GPU)等计算资源被集合起来,通过软件的方式,组成一个虚拟的可无限扩展的“算力资源池”。
根据美国国家标准与技术研究院(NIST)的定义,云计算是一种按使用量付费的模式。
在该模式下,用户通过与服务提供商的少量交互,即可随时随地便捷地通过网络访问进入可配置地计算资源共享池,根据需求调用网络、服务器、存储、应用软件和服务等各种资源。
云计算产业链:
02
算力租赁行业概览
当前全球大模型兴起以及数据流量爆发的的背景下,算力租赁兴起。
算力租赁就是对算力进行出租,是一种通过云计算服务提供商租用计算资源的模式。用户可以根据自己的需求租赁服务器或虚拟机实现大规模的计算任务,而无需拥有自己的计算资源。
算力租赁是一种灵活、高效、成本低廉的计算服务,适用于各种大规模计算需求的场景。
其优势包括:无需投入大量资金购买计算设备、高效稳定的计算服务、灵活的扩容或缩减,更好地满足用户的需求、非常灵活的计费方式,可以根据实际使用情况进行计费。
通过租赁计算资源,用户可以快速地启动项目,使用稳定高效的计算资源,大大缩短了研发周期和成本。
算力租赁服务提供商可以根据用户的需求提供不同配置的云服务器,并可以随时根据用户的需求进行扩容或缩减。
虚拟机是一种在一台物理计算机上模拟多个独立的计算机系统的技术,算力租赁服务提供商可以根据用户的需求提供不同配置的虚拟机,并可以随时根据用户的需求进行扩容或缩减。
此外,新技术如容器化和服务器less计算等也对算力租赁领域带来了更多的创新和便利。
广东联通算网研究运营基地市场总监骆益民介绍:“目前大模型还是基于整个节点租赁提供算力服务的这种模式。如果要满足这种超大规模计算、高通量的带宽,我们只能把业务的需求和算力节点更加靠近一点,来解决传输时延的问题,以及节点内通讯的问题。第二是要做算力梯次化、层次化、合理化布局,将来实现算力、标注、训练一体化的功能。
因此,在算力未来需求持续增加的情况下,网络带宽和时延限制(性能)和网络带宽成本限制(成本)导致的算力需求错配需要通过在边缘端部署算力进行支撑,构成“云-边-端”泛在算力部署方案。
03
算力租赁市场格局
由于算力是AI大模型的前提,因此国内公司会面临算力不足的情况,尤其是随着互联网企业以及科技企业纷纷推出大语言模型,国内对于算力的需求增加,算力云端租赁服务商也就开始兴起。
国内部分厂商已经开展算力租赁相关业务,包括亚康股份、南凌科技、英博数科(鸿博股份全资子公司)、朗源股份、利通电子、宝腾互联(中青宝旗下)、铜牛信息、顺网科技、世纪华通等。
国内服务器头部厂商包括中科曙光、浪潮信息、新华三(紫光股份旗下)、工业富联、拓维信息等也展开相关布局。
算力租赁不仅适用于科技公司和创业企业,也逐渐在各个行业中得到广泛应用。例如,在科学研究中,算力租赁可以用于模拟、数据处理和分析等任务;在金融领域,它可以应用于风险评估、交易分析和高频交易等方面。
对于大多AI企业和行业应用企业而言,轻资产的算力租售模式与企业资金实力和业务场景最为匹配,该模式有望快速在AI行业渗诱,掌握算力资源的企业将具备非常明显的先发优势。
另一方面,算力租售业务本身也是轻资产模式,通过管理城市云的闲置资源并进行调度最大化合理利用资源,租售收益与政府分成实现双赢,有利于城市云的进一步落地。
随着人工智能浪潮的持续爆发,云计算和虚拟化技术的不断进步,算力租赁服务变得更加智能化、弹性化和可靠性。提供商不断提升其基础设施的规模和性能,以满足不断增长的需求。