本文来自微信公众号“半导体产业纵横”,作者/畅秋。
2022年12月中旬,业界传出消息,微软以约1.9亿美元的低价,收购了硅谷初创公司Fungible,该公司主业是研发DPU。前些天,也就是1月9日,微软官方正式发布了这一并购消息。
微软收购Fungible的目的是为其Azure云平台开发定制处理器,这是近些年各大互联网企业都在做的事情,包括亚马逊(Amazon)、Meta、谷歌等,区别在于根据各自的业务特点,定制处理器的类型会有所不同,而DPU似乎正在成为它们共同的选择。这是因为系统需要处理的数据量越来越大,传统的CPU、GPU已经不堪重负了,需要一种专门的数据处理器,承担相应的任务,以使CPU、GPU能够将主要资源和算力放在它们擅长的指令处理上去。简单来讲,数据处理器DPU,通过其可编程特点,将网络通信、存储、安全保障等任务分离出来单独处理,让CPU专心处理指令任务。
微软收购Fungible并不是个案,近些年,为了应对云计算应用中数据量的爆发式增长,无论是系统、互联网企业,还是芯片企业,关于DPU的并购屡屡出现,例如,英伟达在2019年收购了Mellanox,DPU这个概念正是从那时兴起的,其旗舰产品BlueField在业界知名度大涨。之后,AMD先后收购了Xilinx和Pensando(Pensando和Fungible是硅谷最知名的DPU初创公司),目的都是DPU(DPU的前身是智能网卡SmartNIC,Xilinx利用其FPGA,在智能网卡应用领域如鱼得水)。
在芯片企业并购的同时,大型互联网企业也在通过并购或自研的方式,加紧推出适合自身业务特点和需要的DPU产品,如亚马逊发明了Nitro DPU,谷歌为其云业务自研了云张量处理器,用于加速人工智能工作流程,同时,谷歌还与英特尔合作推出了Mount Evans IPU。
可见,亚马逊、谷歌、微软都开启了自研DPU业务,之所以如此,主要原因是:随着互联网云和边缘计算的发展,上层的软件业务对底层硬件要求越来越高,而传统的芯片公司,虽然有一些先进的技术,但受限于对具体应用场景的认知和理解,在云计算快速发展的情况下,这些技术并没有为系统和互联网客户带来更大的价值,或者说,它们的芯片功能和性能提升,明显落后于实际应用发展和变化的速度,甚至在某些方面,还会限制客户价值的发挥。
以上这些问题和矛盾,迫使一些有实力的系统和互联网企业,不得不自研它们需要的芯片。自研的芯片,与外购的芯片相比,具有更高的性价比,更重要的是,可以提供差异化功能和服务,以及更好地支持软件升级。有了这些优点,自研芯片,特别是DPU,就是顺理成章的事了。不过,自研芯片初期的风险较大,且需要较高的研发投入,更重要的是,其自身的体量要足够大,才能消化足够数量的芯片,这样才能摊薄成本,自研芯片才有意义。而大型互联网企业恰好具备这些特点。
01
DPU遇到困局
在这几大互联网企业当中,微软是较晚自研DPU的,该公司原本是想与Fungible合作,为其Azure云平台开发定制处理器,但应用的发展对自研的要求愈加迫切,还有一点很重要,那就是此次收购属于抄底,微软只需要付出较小的成本,就拥有了该公司。之所以如此,是因为Fungible发展遇到了瓶颈,运营出现困难。
Fungible由Juniper Networks联合创始人Pradeep Sindhu和苹果前软件工程高级副总裁Bertrand Serlet于2015年创立,并筹集了超过3亿美元的风险投资资金,但是在2022年8月,该公司透露已裁员并削减开支,11月缩减了产品线,显然,该公司陷入了困境,据悉,Fungible管理层原本想将该公司出售给Meta,但没有成功。12月,微软就出手了。
其实,Fungible遇到的困局并不是个案,近些年,包括中国大陆和美国,涌现出了一批DPU初创企业,在喧嚣过后,DPU的应用落地和企业发展问题凸显出来。
在前期投入方面,DPU与CPU/GPU量级相当,但是,虽然投入大(需要各种高性能IP,开发多种加速引擎)、难度高(把IaaS等很多上层软件服务融入到芯片的软硬件方案中,并且需要跟不同用户的不同应用场景进行对接),但其市场规模却有限,最起码现阶段是这样,并且,因为DPU跟业务和应用场景密切相关,如前文所述,很多DPU初创企业的用户都开始自研芯片,这使得公开市场规模雪上加霜,即使像英伟达这种级别的芯片企业,其DPU已经发布两年左右,目前仍没有得到大规模应用。
再来看Fungible,该公司表示,其DPU不仅可以提升服务器的效率,还能提高存储基础设施的效率,为此,Fungible构建了一个闪存系统,即Fungible Storage Cluster,该系统使用其DPU技术来压缩数据并运行纠删码算法,可以确保在硬件出现故障时信息仍然可用。该公司表示,单个Fungible Storage Cluster系统每秒可以执行1300万次数据输入和输出操作。
简单来讲,Fungible的DPU主攻数据中心的数据存储处理,为此,该公司推出了FS1600 NVMe阵列存储产品,它用DPU取代了x86控制器,用基于DPU的存储(DBS)取代了传统的基于CPU的存储(CBS)。
在此基础上,Fungible创始人想拓展出更大的应用市场,但就目前DPU的应用情况来看,拓展的难度很大,因为需要应对的应用场景大量增加,使得软硬件解耦难度加大,如果采用ASIC方案实现完全定制硬件加速,则是场景和硬件完全紧耦合,开发难度更大,灵活性更低,风险更高。软件生态方面,与CPU相比,DPU还没有成熟的软件支持能力。由于受到多种限制,Fungible的产品和应用拓展脚步困难重重,因此,Fungible在2022年将其业务重心重新放回到FS1600存储产品上,与此同时,创始人Pradeep Sindhu和董事会有了出售公司的想法。
微软趁机抄底了Fungible,只用了约1.9亿美元,作为对比,AMD收购Pensando花费了约19亿美元。Pensando的产品为分布式服务卡(Distributed Services Card,DSC),类似SmartNIC,但集成有CPU,最新一代的分布式服务卡Elba采用Arm CPU核。
02
IPU路线
众多芯片企业开发DPU,目的是减轻CPU的负担,而作为CPU行业霸主,英特尔没有推DPU,而是创造了IPU(基础设施处理单元)概念。
英特尔开发IPU始于使用FPGA进行在线加速,许多金融服务机构将其用于高速交易等应用,数据转换通常无需修改即可放入FPGA。不久之后,SmartNIC出现了,它具有各种网络和存储加速功能,原本在CPU上运行的程序、算法、协议和服务器上的操作系统,可以放在SmartNIC上处理了,但它没有类似于CPU的计算核心来运行软件定义功能。于是,英特尔推出了IPU。
IPU和SmartNIC的主要区别在于:IPU能够从主机卸载整个基础架构堆栈,并可以控制主机与该基础架构的连接方式,这为服务提供商提供了一层额外的防护和控制,由IPU在硬件中实施。SmartNIC具有与IPU相似的联网和卸载功能,但它作为外设,仍然在主机的控制之下。也就是说,IPU具备更高的独立性。亚马逊网络服务在其开发的Nitro智能网卡上采用了IPU。
实际上,IPU与DPU的基本功能是相似的,都是为了处理海量数据,从而解放CPU,主要区别在于具体实现方式不同。
03
中国DPU产业向何处去?
过去几年,看到DPU的价值和市场发展潜力后,中国也涌现出了一批初创企业,如北中网芯、芯启源、云豹智能、星云智联、大禹智芯、中科驭数等。同时,投资机构和产业资本也很看好DPU赛道,本土互联网企业也通过投资入股的方式参与到DPU研发和市场拓展当中。
然而,近一两年,中国DPU初创企业遇到多种问题,包括人才缺乏,产品落地难,以及资金不足等。
由于DPU是新生事物,没有标准和成熟的设计流程参考,前期需要大量投资,有统计显示,一家DPU企业从零做起,到实现产品规模量产,至少需要3亿美元。
从2021下半年开始,中国开始对资本市场去杠杆,半导体产业同样受到影响,进入2022年以后,多数投资者变得非常谨慎,半导体业迎来“融资寒冬”,初创企业不再像以前那么容易拿到投资人的钱了。在这种情况下,如果团队实力不过硬,已经很难按照原定计划发展,甚至生存都是问题。
与此同时,DPU产品落地遇到瓶颈期,有些企业为了短期利益,凭借前些年融到的资金,做一些相对容易的事情,如做基于FPGA的DPU解决方案,或者是传统的加速网卡,而不是自研DPU芯片。这样做,研发投入会少很多,且难度也大幅降低了。
DPU的一个特点是难以做到通用,DPU是软件定义的计算架构,它将软硬件技术高度融合在一起,芯片企业要让产品落地,需要跟客户建立深层次合作关系,针对每家客户做定制化方案,这是件很难操作的事情,其过程繁琐复杂,且没有成熟经验借鉴。DPU芯片不太适合走通用路线,这就是亚马逊、谷歌、微软等国际互联网大厂纷纷自建团队,或收购DPU芯片初创企业,开发自家芯片的主要原因。鉴于DPU的这种特点,以及当下遇到的各种困难,或许中国DPU初创企业被本土系统或互联网大厂收购是更好的归宿。
除了收购,DPU芯片企业与本土系统或互联网大厂采取深度合作方式也是一个选择,近些年,百度、美团等投资DPU创业企业就是在走这条路。
在技术迭代和优质资源整合方面,国外大厂已经走在了前面,它们正在加速抢占DPU产业生态系统主导地位。中国企业在这方面较为落后,没有形成合力,要想在将来的竞争中占有一席之地,还有很多工作要做。