单芯片超多核,又少了一块技术壁垒

周凯扬
在当下的数据中心中,基于Arm Neoverse的各种服务器芯片抢占了不少份额,比如AWS的Graviton等。这类服务器芯片以极高的性能和极低的功耗,为云服务厂商提供了极致的性价比方案。然而可以被视为功臣的,不只是背后的Neoverse核心IP,还有将数十个处理器核心连接起来的NoC IP。

本文来自微信公众号“电子发烧友网”,作者/周凯扬。

在当下的数据中心中,基于Arm Neoverse的各种服务器芯片抢占了不少份额,比如AWS的Graviton等。这类服务器芯片以极高的性能和极低的功耗,为云服务厂商提供了极致的性价比方案。然而可以被视为功臣的,不只是背后的Neoverse核心IP,还有将数十个处理器核心连接起来的NoC IP。

高端处理器芯片必备的NoC IP

在当下的SoC设计中,为何需要NoC这一互联IP。首先对于非x86的架构而言,要想在同规格的芯片中达到类似的多核性能往往很难实现,所以更多的核心数才是弯道超车的机会,这也就是我们看到Arm打入服务器阵营的首批产品,都是基于数十个Arm核心构筑的。

早在Arm早期的CoreLink CCN-512这一方案中,就已经支持到了48核的芯片,同时可以保证缓存一致性。而如今的CoreLink CMN-700更是已经支持到12x12的mesh网络和最高128个CPU簇。这样的NoC IP方案,也成了Arm Neoverse架构实现超多核配置的关键组件。

但Arm的CoreLink方案仅仅局限在Arm核心上,如果想用其他架构或是异构的多核方案,就必须寻找另外的选择。而在目前商业化较为成功的NoC IP中,除了Arm的CoreLink CMN系列以外,就非Arteris莫属了。其客户包含各大汽车芯片和AI芯片参加,包括海思、大疆、寒武纪、Mobileye等等。Arteris的NoC分为缓存一致和非缓存一致的NoC IP,分别为Ncore和Flex系列。

在Flex系列中,针对不同大小的SoC设计,Arteris推出了FlexWay入门级NoC IP,用于小型到中型的SoC设计,主要面向成本效益高、低功耗的IoT边缘设备,但同时也需要FlexWay提供的高带宽。而针对大型SoC设计,Arteris的FlexNoC提供了更大的Mesh生成选项(5x5)。

然而针对汽车、机器视觉以及高性能计算等场景,需要各个处理单元在共享内存上同步,同时需要解决多个一致性协议的兼容问题,比如CHI-E和CHI-B等。所以Arteris推出了Ncore这一缓存一致性NoC IP,支持以更高的处理器频率和更低的时延来打造多核SoC。诸如Mobileye、Tenstorrent和NXP等,都是Arteris Ncore IP的授权客户。

然而,即便对于Arteris的Ncore NoC IP来说,也并没有做到像Arm CoreLink CMN一样做到上百个核心的互联,尽管在最新的Ncore 3.6中最高支持到16个CPU簇,但市面上似乎并没有具体落地的产品。

开源NoC IP

今年5月21日,北京开芯院发布了全球首个开源的NoC IP,温榆河。据了解,温榆河的开发从2022年就开始了,并获得了多家企业的支持。同时,第二代NoC IP的研发工作也已经启动,后续产品会为“香山”RISC-V核心提供更紧密的适配和优化,并更好地支持AI加速器的互联与扩展。

温榆河不仅做到全球首个开源的NoC IP,更是实现了对64核互联的开发和验证。中国科学院计算技术研究所副所长包云岗也展示了在FPGA平台上使用“温榆河”实现16个RISC-V核互联,加载Linux并运行多个程序。

写在最后

温榆河的发布不仅是开源芯片设计的一次创举,也为打造更多基于RISC-V架构的服务器芯片提供了信心。目前市面上叫得出名字的RISC-V服务器芯片可谓少之又少,但基于Arm架构的服务器芯片却在如雨后春笋般冒头,而且设计者都是云服务厂商巨头。温榆河发布后,受益的不仅是开源核心,还有不少商业IP厂商,未来超多核的RISC-V服务器芯片又少了一块设计壁垒。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论