本文来自微信公众号“半导体行业观察”。
作为数字经济时代新的生产力,算力已成为经济社会高质量发展的重要支撑。据信通院测算,去年中国算力核心产业规模1.8万亿元。算力每投入1元,将带动3~4元的GDP经济增长。
经过多年发展,我国算力产业已取得巨大进展,具备基础设施和算力资源的体量优势,但受制于算力资源跨主体与跨区域的互联互通,算力利用率较低。如何统筹调度算力供需,下好全网算力“一盘棋”,实现算力、网络、数据的协同联动,就成为了产业链必须面对的话题。
作为建设网络强国和数字中国、维护网信安全的国家队主力军,中国电信研聚焦“东数西算”国家重大战略布局,坚决将科技创新作为企业高质量发展,持续打造算力网络自主创新能力和核心竞争力,通过原创性、引领性技术攻关,形成面向“云网融合3.0”时代的算力网络技术标准体系完整拼图,实现了核心网络协议的自主掌控。
特别是在新型算力网关层面,作为践行云网融合,解决算力供给不均衡的关键抓手,中国电信研究院聚力推进关键核心技术攻关和产业升级,携手英特尔等产业链合作伙伴,突破多项核心关键技术,完成了业界首个面向“东数西算”场景的落地试点应用,取得了预期的效果。
三大维度突破
助力算力网络应用落地
长久以来,运营商的计算资源和网络资源是相对割裂的;云网融合理念的提出,就是通过技术创新突破,实现网络与算力的深度融合,但基于云网融合的算力网络应用落地绝非易事。
中国电信依托网络开展多样化算力的感知、管理和业务分发调度的探索研究,同时加强与科研院所合作,探索多方异构算力统一服务新模式,重点实现了三个技术维度的突破。
首先是是算力标识与度量,由于不同行业、不同应用场景对算力的需求并不完全相同,是多样化的;同时,各类算力中心提供的算力资源通常也是多元异构的,缺乏统一的度量手段。针对这个问题,中国电信联合业界各方共同推进算力标识度量的标准化工作,将多元异构的算力量化,并建立统一的描述语言。
第二个维度是算力的感知和分发,核心问题是如何让网络获取并通告算力信息,中国电信创新提出基于BGP的算力网络核心协议CP-BGP,能够实现算网信息的有效分发和路由调度,并与主流网络设备保持良好的协议一致性,从而保证了现网可平滑引入算力网关设备。
最后一个维度是算网编排及交易,根据交易合约统一分配算网资源,为算力使用方匹配最佳资源。为此,中国电信建设了支持多云纳管的算网一体化调度平台,实现了从算力注册、算力产品上架、算力交易、算力资源开通、应用部署、算力调度及算力监控的全流程闭环,并成功试点,全方位验证了技术方案可行性。
据悉,中国电信今年计划面向具体算力业务实施部署5个省的试点,主要验证算力网络在不同业务需求条件下可行性,对现网网络部署的影响等技术路线验证。
创新算力网关
牵住科技创新“牛鼻子”
在算力网络的创新实践中,算力网关是实现全局优化的关键,也是技术自主创新的“牛鼻子”。与传统网关相比,算力网关具备业务感知、算力感知、以及算力路由等功能,它能够基于业务需求、算力信息、网络信息融合计算,动态选择满足业务需求的转发路径和服务节点,从而实现算力和网络资源的全局优化,达到降本增效的目的。
比如在东数西算、东数西渲、CENI网络等业务场景中,算力网关解决了跨域的算力感知、网络感知能力,能够帮助客户在多维的算力提供商间感知其算力信息,并通过CP-BGP网络协议进行传输与同步,以达到业务需求第一时间感知并反馈的效能,结合当前的算力状况和网络状况生成路由信息并发布到网络,将计算任务报文路由到合适的计算节点。
目前中国电信算力网关是一种软硬件解耦的开放网络设备,它基于开源的SONiC网络操作系统,将算力网络相关功能模块放在独立的Docker容器中运行,既可以适配X86通用服务器也可以适配各种芯片的白盒交换机,实现物理硬件和网络操作系统(NOS)的解耦,让标准化的硬件与算力网络相关协议进行组合适配,这样的架构设计让算力网关具备了灵活、高效、可编程等特点,极大的方便了算力网络演进过程中的协议扩展。
从应用场景来看,算力网关分为用户侧网关和资源池侧网关。用户侧网关作为用户的接入设备,流量负载相对较小,性能要求不高,可以利用NFV技术部署虚拟化的用户网关;而资源池侧网关作为算力资源池的出口设备,其流量负载较大,对转发性能要求高。中国电信在产品设计中,引入第三代英特尔®至强®可扩展处理器作为其计算处理引擎,使算力网关能够有效应对构建算力路由表所需的大量计算负载。同时更大的内存带宽以及更多的英特尔®超级通道互联通道让算力网关可以应对算力信息交互所需的密集I/O负载。同时,中国电信还引入了基础设施程序员开发工具包(Infrastructure Programmer Development Kit,IPDK)、数据平面开发套件(Data Plane Development Kit,DPDK)等软硬件产品与技术,实现了算力网关产品提供跨平台的方案部署和性能加速。
今年5月,中国电信研究院与英特尔公司也面向业界发布了首个算力网关白皮书,阐述了算力网关的设计理念和技术架构,为打通东西数据通路,巩固“东数西算”工程基础提供有益的参考实践。
持续迭代演进
加速走向规模商用
为了更好地加速“东数西算”落地,实现算力全国“一盘棋”,算力网关也将持续演进,后续迭代的重点主要为面向业务本身的两种算力网络解决方案。
首先以Overlay网络技术为主的方案,可以在不改动现网设备的前提下部署算力网关设备,实现算力感知和网络感知能力,并将其能力反馈给云管平台、控制器、编排器等,补充现网设备无法感知的能力;其次在underlay网络方案中,算力网关串联在物理网络中,功能除了算力感知与网络感知外,还具备APN6业务需求感知、SRv6指导转发、算力匹配、网络调度、会话保持与网络负载等能力,以分布式部署的方式彻底解决中心化网络负载压力等问题。
作为算力网关的主要设计单位,中国电信研究院网络技术研究所副所长雷波表示,中国电信算力网关产品当前还处于初期,走向规模商用还需要解决与性能和稳定性相关的技术问题,如优化算力网关的计算性能、提升网络传输速度等。其次还要提升算力网关安全性和隐私性,加强对算力网关的防护措施,包括防止恶意攻击、数据泄露等安全问题。此外,为了商用部署,算力网关的商业模式需要进一步明确和完善,包括产品的收费标准、用户服务模式等,以确保商业可行性和可持续发展。
生态系统同样是决定算力网关产业发展前景的关键。中国电信将会与包括云服务提供商、软件厂商和应用开发者等在内的合作伙伴携手,共同推动算力网关的发展和应用。同时,中国电信还会提供开发者支持计划,包括开发者社区、开发者文档和工具等,积极拥抱全面国产化进程,以吸引更多开发者参与到算力网关的应用开发中。