本文来自微信公众号“AI芯天下”,作者/方文三。
英伟达的崛起是基于CUDA和GPU的,但随着人工智能、大数据和云计算的兴起,英伟达也需要不断创新来保持竞争力。
为此,他们开始着手开发DPU并推出了DOCA。
英伟达真正的护城河是软硬件生态
计算机处理器分为CPU和GPU,它们均可执行计算任务。然而,两者在计算方式上存在显著的差异。CPU更适合进行线性计算,而GPU则更擅长并行计算。
通过CUDA这一媒介,研究人员和编程人员能够使用编程语言与硬件设备进行交互,将复杂的数学问题分解成多个简单的子问题,然后分发给GPU的多个计算核心进行处理。
在航空航天、生物科学研究、机械和流体模拟以及能源探索等领域,有80%的研究工作是建立在CUDA基础之上的。
其实各厂商的AI芯片的性能差距并不很大,也可以追赶,拉开差距的关键在于英伟达的CUDA计算架构及软硬件生态。
通过CUDA技术的运用,原本仅用于3D渲染的GPU得以在通用计算领域发挥作用,从而将应用领域从游戏(图形渲染)扩展到了高性能计算、自动驾驶等多个领域。
英伟达作为GPU核心供应商,通过CUDA架构构建了一个高度稳定的开发者生态系统,推动了其从传统GPU供应商转型为平台化公司。
AI浪潮下,软硬件生态位发生变化
而在生成式AI时代,人工智能正在呈爆发式发展,成为数据中心算力需求的主要驱动力之一。
为了卸载、加速和隔离数据中心基础设施工作负载,DPU应运而生。
通过为高带宽、低延迟、数据密集的计算场景提供计算引擎,DPU成了继CPU、GPU之后,数据中心场景中的第三颗重要的算力芯片。
可以说,DPU是企业构建加速计算平台、AI工厂的关键。
DPU的最基本功能在于其能够取代CPU,从而构建以数据为中心的计算架构。
通过采用DOCA,开发者可以创建软件定义的、云原生的、由DPU加速的服务。
以此来对未来的数据中心基础设施进行编程,同时实现零信任保护,以满足现代数据中心日益增长的性能和安全需求。
不断进阶的DPU
去年英伟达发布了第一款DPU产品BlueField-2,今年的GTC上又发布了BlueField-3,BlueField-3会在明年上半年推向市场。
而从其路线图上也可以看出,其DPU产品的性能实现了很大的跨越。从BlueField-2到BlueField-3,它的整形计算能力提升了5倍。
BlueField-2目前为软件定义的网络安全和存储卸载了相当于125个CPU核的工作量,而BlueField-3则能达到300个CPU核。
到了BlueField-4以后,英伟达把GPU集成到DPU里来,DPU就真正成为一个完整的数据中心单元。
据预测,到2025年,DPU全球市场容量将达到120亿美金。
在这个领域,业界已经形成了一种共识,即采用可编程的、开放式的基础设施。
社会数字化转型浪潮下,潜在海量数据待处理,DPU的边界、职能、价值都尚在探讨前期。
DOCA软件堆栈同步DPU脚步
通过DOCA,开发人员可以利用行业标准的API在英伟达BlueField数据处理器(DPU)上快速创建网络,存储,安全以及管理服务,以及AI/HPC的一系列应用程序和服务。
因此,为了在这个市场获得更大的成功,英伟达必须努力提高DOCA的完善程度和普及程度。
在2020年的GTC大会上,英伟达发布了DOCA 1.0。
在2021年,随着DPU产品在市场上的成功,英伟达推出了与之配合的DOCA 1.2。
为了进一步扩大在DPU市场的份额,英伟达不断加大技术创新的力度,于2022年5月推出了DOCA 1.3。
DOCA框架为开发者提供了一致的开发体验,简化了开发环境和构建部署的复杂性,从而为开发者带来了诸多便利。
近日,据英伟达中国官方微博消息,英伟达今日发布首部DPU和DOCA编程入门书籍《数据处理器:DPU编程入门》,号称可为使用英伟达BlueField系列DPU和DOCA开发环境的开发者提供实用指南。
结尾:
英伟达的DPU和DOCA技术无疑是一项重大突破,但它们面临着激烈的市场竞争。
包括Marvell、Cisco和AMD等厂商也在积极研发DPU技术,亚马逊、阿里巴巴等云服务提供商也已经在数据中心中采用DPU技术。
竞争激烈,但英伟达凭借其丰富的经验和强大的研发实力,仍然有望在这个领域取得成功。
部分资料参考:硅基研究室:《英伟达的「镰刀」,不是AI芯片》,比特洞察:《英伟达DPU借DOCA积累更多致胜元素》,岑子时评:《CUDA如何改变了科学计算的规则》