本文来自中国电子报、电子信息产业网,作者/宋婧。
近来,英特尔和谷歌云联手推出了“Mount Evans”芯片以提高数据中心性能;Arm为云计算和数据中心推出新一代芯片技术“Neoverse V2”;英特尔推新款数据中心GPU产品“Flex”;平头哥宣布自研的CPU“倚天710”已在阿里云数据中心实现大规模部署应用……一时间,数据中心芯片市场可谓风起云涌。
建信股权首席投资官李瑞指出:“数据中心市场已成为全球半导体产业的重要增长点,东数西算等大型工程的实施,进一步提升了对DPU这类数据中心核心芯片的需求。”
DPU差异化竞争成市场新热点
后摩尔时代,随着带宽不断提升,海量数据涌入,一些“CPU做不好,GPU做不了”的复杂数据处理工作,如网络协议处理、存储压缩、数据加密等,开始逐渐转向能够重新分配算力和优化算力资源的DPU。DPU因此被列为CPU、GPU之外的第三个主力芯片,成为新一代数据中心创新范式。
赛迪顾问的数据显示,从2023年开始,全球DPU市场规模将突破百亿美元,并进入年增长率超过50%的高速快车道。其中,中国DPU市场规模在2023年将超过300亿元,实现跳跃式增长。
阿里巴巴集团研究员、阿里云弹性计算产品线负责人张献涛坦言,对于云厂商而言,DPU是一个软硬件技术栈结合极其密切的工作,是软件定义的计算架构,DPU必须以自研为主,做到相关软硬件技术栈完全可控,且经过超大规模验证,而生产通用DPU的公司很难满足云厂商的需求。
一方面,云计算市场集中度较高,伴随云计算业务规模持续扩大,资源争抢、算力损失、性能瓶颈等问题日益严峻,云厂商迫切需要寻求破局之法。而通过虚拟化的方式减轻CPU内核负担,实现降本增效的DPU就成了云厂商不得不做的选择。另一方面,云厂商对于自身业务需求更为了解,因此自研DPU事半功倍。此外,DPU是由软件定义的架构,由客户需求或业务发展形态驱动,与客户整个后端软件栈结合非常紧密,很难做到通用程度。相较之下,云厂商更有机会获得差异化竞争优势。
英伟达、英特尔、Marvell等传统芯片厂商在DPU赛道上的竞争也相当激烈。作为DPU最大推手,英伟达在软硬件研发方面抢占了先机,BlueField-2、BlueField-3、BlueField-4等系列DPU产品及工具包DOCA(线上数据中心基础设施体系结构)等的推出受到业界广泛关注。英特尔则是以IPU对标DPU,IPU将承担原本由CPU处理的存储、网络虚拟化等基础设施层功能,从而释放CPU算力。此外,AMD公司通过收购赛灵思、Pensando等公司,快速补充了自身DPU产品生产能力。
中科驭数、云豹智能、星云智联等初创公司展现出良好发展势头。中科驭数第三代DPU芯片研发迭代已经接近尾声,第二代DPU芯片K2于今年初投片。云豹智能打造了目前为止国内最大量商用的DPU智能网卡。
“虽然国内厂商在芯片产品化环节相比国外一线厂商还有差距,但是对于DPU架构的理解却很独到。而且,我国目前在数据中心这个领域,无论是市场规模增速,还是用户数量,相较于国外都有着巨大优势。”中科院计算所研究员鄢贵海认为,国内厂商有望充分利用这一“应用势能”,加快发展步伐,在DPU赛道与国外厂商竞争。
绿色低碳促进芯片技术升级
数据中心正在加速朝着绿色低碳方向转型升级。而芯片制造工艺繁多,不少制造工序的功耗压力都比较大。据悉,过去几年,CPU、GPU和AI芯片的功耗增加到了300W甚至600W。如今,数据中心芯片市场上的主流选手,无论是芯片厂商,还是云厂商、初创公司等,均采取了相应的布局。
除了最重要的运算效能以外,功耗与效能功耗比也成了目前科技市场对芯片产品优劣评判的主要标准。高性能计算可以提高算力和性能,降低功耗和成本,又具备多类型任务的处理能力,能够较好地实现绿色低碳任务,受到新一代数据中心青睐。
据悉,英伟达推出的Grace CPU超级芯片就是一款面向AI基础设施和高性能计算的数据中心专属CPU。AMD计划在2025年之前,将旗下AI与HPC加速数据中心平台的能源效率提高30倍以上。国内浪潮、曙光、华为等服务器企业,以及网宿科技旗下的绿色云图、高澜股份等解决方案提供商,也在加大液冷领域的投入。
不过,正如英特尔中国区云兼行业解决方案部总经理梁雅莉所言,数据中心“绿色化”并非某个公司单打独斗就能完成,需要整个生态系统共同孵化。数据中心液冷散热模式的规范和标准需要联合云服务厂商、OEM、ODM共同制定推广,整个行业仍在摸索中前进。