本文来自微信公众号“工信头条”,作者/浪潮电子信息产业股份有限公司。
中国算力规模,尤其是智能算力规模,正在高速增长。2021年中国智能算力规模达155.2百亿亿次每秒浮点运算(EFLOPS),2022年中国智能算力规模将达到268EFLOPS,预计2026年中国智能算力规模将进入每秒十万亿亿次浮点计算(ZFLOPS)级别,达到1271.4EFLOPS。2021年中国通用算力规模达47.7EFLOPS,预计到2026年通用算力规模将达到111.3EFLOPS。2021—2026年期间,预计中国智能算力规模年复合增长率为52.3%,同期通用算力规模的年复合增长率为18.5%。伴随人工智能算力需求的高速增长,建立健全助商惠民的数字基础设施服务体系、推进算力基建化发展势在必行。
本文即从算力基础架构层面,对人工智能芯片、服务器、计算架构、算法,及应用等方面的发展近况进行分析。
芯片:需求日益增长,发展空间广阔
在中国,人工智能芯片产业发展体现出以下趋势。
人工智能芯片发展驱动力增强,未来发展前景广阔:芯片产业不仅是信息产业的核心部分,也是国家信息安全的硬件保障。在政策支持以及资本推动等多重因素驱动下,人工智能芯片专利数量不断增加,产业链和应用场景持续完善扩充,人工智能芯片产业发展前景广阔。
不同类型人工智能芯片发展进度参差不齐:在面向人工智能领域的芯片中,用于终端产品的应用层芯片发展较快,而用于云计算等领域的通用基础层芯片发展则较为滞后。
人工智能芯片低能耗为大势所趋:低功耗人工智能芯片是时代之需,这对实现数据中心的总功耗降低具有重要价值。此外,低功耗人工智能芯片也是实现边缘智能的重要环节,能满足更多复杂、极端的边缘侧应用场景的需求。
产业分工初成雏形,逐步完善生态建设:企业面对多元化的算力和海量的数据,期待技术创新可以为企业带来活力。但由于芯片架构繁杂,开发工具匮乏,系统软件、应用开发平台配套少,应用难以迁移,资源不能复用和共享等问题使得生态复杂离散。面对这样的现状,芯片技术厂商(含设计、制造、应用等流程)应联合上下游厂商,建立技术生态系链条,加速人工智能场景的落地。
目前,中国大部分基础芯片主要依靠国外厂商的供应,国产芯片厂商在全球产业链中不具有明显优势。
服务器:中国市场领跑全球,绿色节能引领未来
人工智能服务器仍是人工智能市场增长的主力军。IDC数据显示,2021年全球人工智能服务器市场的同比增速超过全球整体人工智能市场的增速,是整体人工智能市场增长的推动力。
根据IDC数据,2021年中国人工智能服务器市场规模达到59.2亿美元,与2020年相比增长68.2%。其中,浪潮信息、新华三、宁畅、安擎、华为等诸多中国厂商正加速推动人工智能基础设施产品的优化更新,探索赋能技术升级,为人工智能技术的用户带来价值。IDC调研显示,超过80%的中国企业将在未来一年持续增加人工智能服务器的投资规模,中国人工智能服务器市场将在未来五年保持稳定增长,预计到2026年,中国人工智能服务器市场规模将达到123.4亿美元。
从工作负载角度而言IDC认为,企业将更多地使用人工智能服务器处理推理工作负载。伴随企业人工智能应用成熟度逐步递增,企业将把精力更多从人工智能训练转移到人工智能推理工作负载上,这意味着人工智能模型将逐步进入广泛投产模式,这将对企业的人工智能基础设施规划带来影响,企业需要更好地制定运营支出规划,提升服务器利用率。据IDC数据,2021年中国数据中心用于推理的服务器的市场份额占比已经过半,达到57.6%,预计到2026年,用于推理的工作负载将达到62.2%。
从部署位置而言,产业侧对于低时延人工智能服务应用需求递增。相较于科研、重型产业能够通过大模型、高密度人工智能计算满足需求的场景,便捷、低时延的人工智能应用场景愈发普遍。越来越多的数据将在边缘位置进行收集、分析等操作,并可被移动到数据中心以进行进一步价值挖掘。越来越多的企业将构建跨本地数据中心、云、边缘的全链路人工智能基础设施,形成一个包括数据收集、分析、汇总和存储等所有环节的人工智能战略。
绿色节能化发展:人工智能服务器将朝着绿色节能的方向发展,实现低功耗、高效率的计算。
计算架构:以系统创新为基础,支持多元算力发展
在通用算力技术演进节奏放缓的大背景下,针对特定问题或特定领域来定义计算架构成为市场的普遍诉求,基于DSA(Domain-Specific Architectures,特定领域架构)思想设计的人工智能芯片,在特定人工智能工作负载上表现出远超通用芯片的处理能力,大大推动了人工智能芯片的多元化发展,并为产业AI化的加速提供了重要的产业基础和更加丰富的选择。
然而,多元算力从“能用”到“好用”并且为企业创造业务价值,还有比较长的路要走,尤其是以百花齐放的AI算力芯片为核心,打造出一个通用性强、绿色高效、安全可靠的计算系统,对于推动人工智能技术普及应用至关重要。
在系统层面,由于人工智能芯片发展呈现多元化趋势,各厂商采用不同技术路线,产业面临硬件体系孤岛和生态割裂问题。加速人工智能技术产业发展,系统级产品创新是关键——在基础硬件、基础软件、核心应用、上层生态间建立起统一的技术路线及标准API接口,将加速器模块标准化,简化人工智能基础架构设计,缩短硬件开发和产业赋能的周期。
在异构协议层面,为了提高CPU与多元算力芯片间的数据传输效率,业内在互联技术方面展开了新的探索,近年涌现了一系列新兴的互连协议标准,包括QPIUPI、CXL、GenZ、CCIX等,其中浪潮信息研发了支持CXL高速总线的智能加速器F26A,与传统的PCIe、DMA方式相比,CPU与加速器之间的平均数据访问延迟降低80%,同时可扩展2倍的内存容量。
在跨节点层面,节点之间的网络通信所产生的RPC、协议处理、内存拷贝、压缩会占用30%左右的CPU资源,成为数据中心级的“通信税”。业内尝试通过智能网卡卸载计算密集型业务,将NVMe-oF、无损网络能力等功能迁移到智能网卡上由专有硬件负责处理,能够提升通信性能并降低CPU占用率。通过智能数据处理单元和高速网络形成分布式互连交换,可实现CPU与各种加速芯片的算力协同以及内存池化、新型存储池化,节点间的数据访问延迟可低至亚微秒级别。
云服务:市场规模稳步提升,算力设施提供强力支撑
云计算的出现为企业提供更丰富的算力支持。通过AIaaS(AI即服务)提供AI平台和AI服务,因其快速的产品迭代能力和丰富的场景化人工智能能力,越来越被用户接受。
在图像视频领域,视频结构化、多模态人工智能等技术的创新促进了该领域市场增长。公有云厂商一方面通过视觉开放平台输出图像视频领域的人工智能能力,另一方面则专注于开发基于场景的解决方案。在自然语言处理方面,2021年NLP市场较2020年实现了126.9%的增长;在技术方面,得益于大型模型的推广;在市场方面,与应用场景的发展(如机器翻译、文档处理、智能写作等)息息相关。同时,智能语音公有云服务市场已经实现了高增长,2021年市场规模较2020年增长52.3%,目前已进入应用场景深化阶段。智能客服、客服质量控制、客服数据分析、智能营销等应用推动了对话式人工智能的市场增长,2021年较2020年增长109.6%。
算法模型:加速大模型行业落地,助力实体经济发展
大模型是在智算算力驱动下最为典型的重大创新之一。得益于模型泛化能力强、长尾数据的低依赖性,以及下游模型使用效率的提升,大模型被认为具备了“通用智能”的雏形,并成为业内探索实现普惠人工智能的重要途径之一。
从算力的视角看,语言类、视觉类模型容量和相应的算力需求都在快速扩大。如果用“算力当量”(PetaFlopss-day,PD),即每秒千万亿次的计算机完整运行一天消耗的算力总量,来对人工智能任务所需算力总量进行度量,AI+Science领域的AlphaFold2、自动驾驶系统、GPT-3等模型训练需要几百甚至几千PD的算力支持,如GPT-3训练需要3640PD的算力。
大模型的发展同样给算力带来巨大的挑战。大模型训练的计算和存储资源开销之大,对加速计算系统和人工智能软件栈都有很高的要求,训练千亿、万亿模型动辄需要上千块加速卡,对大模型的推广和普惠带来了很大的挑战。同时,受限于边际递减效应,模型复杂度与精度的进一步提升将会需要更大比例的计算资源开销,对计算效率问题的顾虑会限制大模型参数规模的持续扩张。
在学术界,除了对预训练大模型进行性能优化,有大量研究集中在提升大模型的落地能力上,包括降低模型在预训练、适配下游任务和推理过程中的算力开销,通过模型压缩、剪枝、蒸馏等方式加快模型部署效率。
在工业界,互联网企业推动自研大模型在电子商务、社交网络、搜索引擎、广告推荐等重点业务场景落地,并将内部大模型部署的成功经验固化为预训练平台,以标准化服务的形式将预训练模型的能力下沉到各行各业,通过集中式的数据和算力开发模式提供平台黏性,以期实现人工智能普惠化目标。加速硬件供应商提供分布式加速计算集群解决方案,通过并行算法与计算资源的合理匹配,提升加速计算集群整体利用率和大模型的训练效率,并优化推理加速库,以最少的计算资源达到最好的推理服务速度。
生态:推进产业化布局,发挥平台价值
对于人工智能产业,快速将创新要素转化为物质或知识资本,并形成规模效应和范围效应,关键在于协同创新平台的搭建。近年来,包括政府、企业、科研机构都在尝试构建人工智能协同创新平台,聚焦当前阶段产业AI化的落地应用需求,平台的存在可以更快实现人工智能生态伙伴的业务聚合、资源聚合和战略聚合,平台内的各方主体以人工智能算力输出、服务能力优化,及人才培养等层面的要素供给,达成产业链上下游的通力合作形态,以生态聚合成就行业用户。
标准化是技术规模化应用的必要前提,但对于目前的人工智能技术及基础架构来说,定制化的工作量依然很大,主要集中在多元人工智能芯片适配,人工智能算力资源管理和调度,数据整合及加速,深度学习开发环境部署等各个方面。
近年来,包括公有云厂商和服务器厂商,都在推出具有标准服务能力的人工智能异构计算平台和算力、算法一体化的新型基础设施,一方面布局建设智算中心,统筹算力的生产、聚合、调度和释放,为传统行业数字化转型、区域产业升级和基础科学研究等需求提供算力服务、数据服务和算法服务;另一方面从定制化DSA芯片、人工智能计算系统、高速互联网络、大吞吐低时延并行文件系统、人工智能增强容器调度等层面,输出多年技术沉淀和实践经验,为多样化人工智能场景提供软硬一体解决方案。
应用:场景化落地纵深发展,加速智算力向创新力转化
对于宏观层面而言,人工智能算力为国家创造力的发展带来实质性推进。
创新环境。如“十四五”规划所讲,人工智能已然成为“事关国家安全和发展全局的基础核心领域”,所以中国将持续瞄准前沿领域的发展,补足自身在人工智能基础理论研究、算法研究、芯片研发、原创性模型及框架的研发与迭代等方面存在的短板和劣势,加速人工智能单点技术的研究和创新,以政策支持、行业落地和企业推进为支撑点,加速相关产业的发展和人才培养。
创新科研。作为创新的原动力,科学研究是人类发展和社会变革最主要的推动力量。随着人工智能技术的快速发展,人工智能不仅在应用科学的突破上发挥了重要作用,也开始渗透到基础科学领域,极大提高了科学研究的效率,并加速科学发展的进程,包括生命科学、数学、化学等多个领域。人工智能算力的重要性不言而喻。与行业应用不同的是,人工智能在科研领域所需要的数据精准度更高、模型更复杂,对于算力需求也更大。因此,人工智能算力、算法、数据和平台的结合能够为科研创新发挥更大的作用。
创新产业。据工信部数据,目前,中国人工智能核心产业规模超过4000亿元,企业数量超过3000家,领军龙头企业覆盖无人机、语音识别、图像识别、智能机器人、智能汽车、可穿戴设备、虚拟现实等诸多领域,已经在智能芯片、开源框架等关键核心技术取得重要突破。根据美国斯坦福大学《2021年人工智能(AI)指数报告》,中国在2021年提交了全球一半以上的人工智能专利申请,2021年全球约三分之一的人工智能期刊论文和人工智能引用是由中国研究人员所贡献。
对于企业而言,人工智能算力可为企业带来切实的创新成效。
根据IDC针对企业应用人工智能现状调研发现,企业利用人工智能应用获得了显著收益,尤其是在研发速度和流程的创新,产品和服务的创新,以及决策制定的创新等维度。
研发速度和流程:根据IDC针对企业应用人工智能及算力现状调研发现,目前借助人工智能,资源利用率平均提升12%,员工生产和研发效率增加8%。
产品和服务:人工智能在为企业开发更多定制化和精细化产品与服务方面带来显著支撑,未来三年,有望在提高资产利用率、降低人力需求等方面获得更显著收益。
决策制定:人工智能为企业带来更丰富、及时的信息,为企业决策者提供敏锐洞察,可显著提升决策的速度和质量,辅助企业处理复杂的不确定性,占领市场先机,创造价值。从技术的行业应用而言,创新应用场景逐步增多。除了相对成熟的应用场景之外,物流、制造、能源、公共事业和农业等在人工智能的应用方面得到快速发展,创新应用场景逐步增多。
算力是数字经济时代的核心生产力,以人工智能为首的新兴技术应用在数字经济发展中起到了重要的作用,用于支撑人工智能应用的智能算力决定了创新力的实现。不管是新型场景还是成熟场景,对算力都提出了极大的挑战,率先布局智能算力的企业将在未来竞争中获得优势。
来源:中国工业和信息化