性能翻倍,下一代国产超算蓄势待发

周凯扬
作为每个国家最重要的战略计算资源之一,顶级超算尤其是科研用超算,可以用于制药、天气预测等关键场景。借助强大的算力,国家机关可以省下更多的人力和物力成本来实现政策目标。而曾经国内的两大超算之王系列,天河和神威,也都在近期迎来了继任者的新情报。

本文来自微信公众号“电子发烧友网”,作者/周凯扬。

作为每个国家最重要的战略计算资源之一,顶级超算尤其是科研用超算,可以用于制药、天气预测等关键场景。借助强大的算力,国家机关可以省下更多的人力和物力成本来实现政策目标。而曾经国内的两大超算之王系列,天河和神威,也都在近期迎来了继任者的新情报。

天河星逸

2013年研制成功的天河二号,曾经是代表了国内超算迈入国际超一流行列的标志,也在TOP500拿下过六连冠的殊荣。虽然经过这几年的发展,第一的位置已经多次变化,但天河二号在TOP500上依然可以排到14名的位置。

且随着这几年广州超算中心的应用扩展,其用户数已经从最初的300多个增长至30多万个。这样让广州超算中心成了全球用户数量最多、应用最广的超算中心之一。然而,为了进一步提高超算中心的高性能计算能力,还是需要打造新的系统。

近期举办的2023年超算创新应用大会上,新一代国产超算系统“天河星逸”终于面世。尽管广州超算中心没有公开这一新系统的具体配置信息,但根据已有的公开信息,采用了高性能多核处理器、高速互联网络和大规模存储的“天河星逸”,在CPU通用计算性能、网络能力和存储能力等较“天河二号”实现倍增。

这也就意味着在通用计算性能上,国产高性能CPU已经拥有了比肩国际一流处理器平台的实力。不过在AI计算上,这类主打HPC通用计算性能的超算系统还是有所局限。

下一代神威

除了天河外,中国的另一大超算系列神威也没有闲着。在今年的SC23上,虽然我们没有看到新的中国超算上榜,但申威终于展示了新SW26010 Pro众核处理器以及下一代神威超算的性能。

此次SW26010 Pro依然是采用异构众核的设计,与SW26010 4个Core Group的设计相比,SW26010 Pro采用了6个Core Group的设计,每个Core Group由64个CPE计算核心和一个MPE管理核心组成,单芯片核心数达到了390个。根据申威提供的数据,其峰值16bit浮点算力可达55.296Tflop/s。

相较上一代SW26010 DDR3-2133所提供的136.5GB/s总内存带宽,此次SW26010 Pro升级支持了DDR4-3200,理论内存带宽可达307.2GB/s。这与其他超算芯片的内存带宽表现还是有着较大的差距,也就导致了计算和网络活动争抢内存带宽的局面,同步内存访问下,NIC只能实现9.87GB/s的带宽,离理论网络带框56.25GB/s相差甚远。

不过在具体性能表现上,基于这一处理器的新神威超算却在HPL-MxP榜单上排到第二的位置。从其数据来看,新的神威超算核心数达到4114万224个,在HPC与AI计算同等重要的HPL-MxP测试下可以达到5.048Eflop/s的性能,仅次于Frontier。峰值半精度性能达5.92Eflop/s,半精度浮点效率高达85%,这样的销量也是一众异构超算系统中最高的,仅次于非异构的富岳超算。

写在最后

在推动数字经济持续发展的当下,算力并网已经成为了解决算力分布不均、供需失衡的关键方案之一,而超算恰恰是除了通算、智算之外的另一大重要应用。目前粤港澳大湾区拥有较为丰富的超算资源,打造多模式的融合应用支撑平台,加快多方并网生态构建,将成为推动算力规模突破10Eflops的关键路径。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论