本文来自微信公众号“IDC圈”,作者/Leo。
今年初,ChatGPT爆火,随之带来了“蝴蝶效应”,推进了整个AI大模型相关技术及产品的快速发展,仿佛如今哪个互联网科技公司没有在AI大模型领域有相关布局就将被时代“淘汰”,AI大模型时代已至。
笔者认为,在此背景下,算力产业将会进入快速发展的新阶段,“算力即服务”的时代已离我们不远了。与此同时,结合当下算力产业的发展情况,当下我国算力主要面临了两大痛点,如何解决这两大痛点,将成为我国算力产业能否实现高质量发展的关键。
大模型时代已至,算力需求激增
今年初,随着ChatGPT的“横空出世”,AI大模型成为整个科技圈关注的焦点。ChatGPT的出现,对于人工智能领域来说是一场技术的变革。这场变革除了影响到了人工智能的发展方向以外,还对底层重要支撑—算力基础设施带来的深远的影响。
大数据、大算力、大算法是业界公认的,决定大模型发展的三大因素,而这其中,算力是最难“满足”的一个,ChatGPT的成功不仅依赖人工智能,还要依赖于底层的大型智算中心为其提供了强大的算力训练支持,算力对于大模型的发展起到了决定性的作用。
在ChatGPT的影响下,越来越多的生成式AI如“雨后春笋”般出现在人们的视野中。与之相对应的,这些大模型带来了庞大的算力需求。
随着AI大模型的发展,对算力的需求越来越大,如何从技术层面满足这些算力需求,成为当下数据中心发展过程中,需要关注的焦点,以目前行业来看,亟需为这些大模型提供具备高效的算力支持的智算中心,这些智算中心将涉及从单体芯片功能,到芯片之间的连接,甚至网络、网卡之间的适配等诸多方面。
算力网络建设的两大“痛点”
算力产业的重要性越来越凸显,但算力市场仍存在需求与供给之间的鸿沟。据研究机构预测,未来三年新产生的数据量将超过过去三十年的总和。然而,数据总量在增长,真正被有效利用的数据占比却微不足道。
此外,东西部算力不平衡已成为当下行业需要面对的重点问题,而“东数西算”工程的核心价值之一,也是解决东西部算力不平衡的问题。
在“东数西算”工程的大背景下,算力基础设施和网络基础设施的整体布局与技术架构都将迎来翻天覆地的变化,如何打造更好的“算”“网”基础设施,成为我国算力产业发展的关键所在。
“算”的层面,芯片性能的提升,是我国当下的研发重点。自研芯片因为某些众所周知的因素,成为我们必须要走的路。而芯片性能是否强大也直接决定了“算力”能否跟得上“需求”;
“网”的层面,现阶段,我国数据中心、智算中心之间的连接技术相较于国际上的先进水平还有一定差距,如何能够让“网”更好地服务于“算”,让数据可以以更低的时延传输,建立更优质的算、网基础设施是当下我们面对的主要问题之一。
除了“算”“网”基础设施建设层面,如何将“各自为战”的各个运营商、算力服务商的算力整合起来,打通彼此之间的“算力壁垒”,也是当下我国算力产业亟待解决的一大问题。
基于此,如何更好地实现“算”“网”的调度,实现不同厂家、不同云之间的算网融合,以及将数据、算力跟AI更好的结合,这些问题是实现更好的算力服务的基础,也是当下行业需要重点关注的话题。
算为中心,网为根基
总结现阶段我国算力网络建设的特点,笔者认为,可以将我国算力网络建设分为三个阶段,即:第一阶段,将原本分离的“算”和“网”拉通,实现“网能调算,算能拉网”;第二阶段,建设算网大脑,统一调度,实现更多的融合统一;第三阶段,实现完全的算网融合,最终将实现“算”“网”从协议和架构层面全面的融会贯通。
纵观我国算力市场,现阶段,我国算网建设的“主力军”还是以移动、联通、电信等基础电信运营商为主。
数据显示,截至2022年上半年,中国移动对外可用IDC机架达42.9万架,净增2.2万架,投产云服务器59.3万台;中国电信目前拥有700多个数据中心,新建天翼云服务器8.1万台,截至2022年年底,算力规模达3.8EFLOPS,同比增长81%;中国联通IDC机架较上年底增加1.9万架,总数达32.9万架。
根据规划,2022年,中国移动拟投入480亿元用于算力网络建设,计划可用IDC机架达45万架,累计投产云服务器超66万台;中国电信拟投入140亿元用于算力网络建设,新建16万台云服务器,拟投入65亿元用于IDC建设,新建IDC机架4.5万架;中国联通拟投入145亿元用于算力网络建设。
中国移动在2021年就提出了算力网络建设,以“算”为中心的网络,将算力看成数字经济的核心生产力。作为基础电信运营商,是数字基础设施建设的主力军,需要建立满足企业数字化需求的基础设施。
“以算为中心,网为根据”是现阶段中国移动对算力网络的定义。将网、云、数、智、安等一系列技术融合,提供一体化服务的信息基础设施,实现算力、网络能够像水跟电一样即取即用的社会级服务,这是目前中国移动给自身算力网络建设定下的目标。
针对当下算力产业发展趋势,结合“以算为中心”,中国移动提出了“四个融通”:一是,跨地域物理融通。实现全国各地的数据中心、智算中心的全互联;二是,跨层次的逻辑融通。实现云网边端一体化融会贯通;三是,实现异构计算的融通;四是,跨主体融通。打造算力网络,真正将算力“服务化”。
中国联通主要聚焦在“算网创新”方面,计划实现超大规模的算力供给。布局全面承接国家“东数西算”工程的“5+4+31+X”新型数据中心体系,建成数据中心880个,机架规模超过40万架,推动联通云“一市一池”覆盖200多个城市。
中国联通还大力推进算网融合发展,构建算力网络,推动数字经济的发展。基于3.0基础的网络,从算力供给、输送、算力调度到算网一体化的“5﹢4﹢31﹢X”的布局,构建服务覆盖全国云网边一体化的多层次算力网络。
与此同时,中国联通还坚持“强基固本、守正创新、融合开放”的战略定位,聚焦“大联接、大计算、大数据、大应用、大安全”五大主责主业,制定“1+9+3”战略规划,全面承接国家“东数西算”的战略部署,打造“联接+感知+计算+智能”的新一代数字信息基础设施。
中国电信则是联合中国信通院,在6月5日共同发布我国首个实现多元异构算力调度的全国性平台——“全国一体化算力算网调度平台(1.0版)”。据悉,该平台汇聚通用算力、智能算力、高性能算力、边缘算力等多元算力资源,针对通用、智算、超算等不同客户的不同需求,设计异构资源池调度引擎,实现不同厂商的异构资源池的算力动态感知与作业智能分发调度。
特别在AI训练作业调度流程中,作业可在智算资源池上进行训练推理,在通用算力资源池部署,从而实现跨资源池/跨架构/跨厂商的异构算力资源调度,目前已接入天翼云、华为云、阿里云等。
值得注意的是,目前,中国电信已在全国范围内拥有超过700座数据中心,47万架机柜,算力规模已达3.8EFLOPS(每秒浮点运算次数)。
目前,我国还处于算力网络建设的初期阶段,“国家队”是现阶段算力网络建设的主力军。不过在AI大模型的快速发展的背景下,可以想见,随着各行业对算力的需求将会越来越大,算力即服务的时代已拉开序幕。