云计算:国内AI大模型的强大算力支撑

算力作为数字经济时代最核心的生产力之一,在经济社会各领域和各层面都得到了广泛的应用。尤其是近来AI大模型爆发,对算力的需求更是达到了空前的高度。

本文来自微信公众号“信创专研社”,作者/YOU。

据美国《华尔街日报》4日报道,拜登政府正在准备限制中国企业使用美国云计算服务,从而防止中企绕开美国对华先进制程人工智能(AI)芯片的出口禁令。美国在限制中国“算力”的增长进而试图拖慢中国AI人工智能的发展方面,已经是全方位打压,到了无所不用其极的疯狂地步。

1.png

毫无疑问,“云计算”产业的巨大算力对于AI人工智能行业的发展有着至关重要的支撑作用!

算力作为数字经济时代最核心的生产力之一,在经济社会各领域和各层面都得到了广泛的应用。尤其是近来AI大模型爆发,对算力的需求更是达到了空前的高度。

在我国,算力上下游产业链中,直接为企业提供算力的基本都以云厂商的“云计算”服务为主。工信部公布数据显示,1-5月我国云计算和大数据实现收入4366亿元,同比增长接近17%。可见云计算在企业数字化转型的过程中占据重要的部分。据中国信通院数据,预计2023年中国云计算市场规模将达到3800亿元。

1.png

众所周知,AI大模型的训练用到的基本是智算和超算,它不但需要基于超算架构的GPU的强大计算能力,还需要长周期、稳定可靠的计算环境,保障计算任务不中断。训练成本相当之高。

因此国内很大一部分超级AI大模型的打造都以自身强大的“云计算”算力为支撑,比如阿里云的“通义大模型”,华为云的“盘古大模型”,以及这两天电信推出的TeleChat等,都是如此。

那“云计算”是如何为AI大模型训练带来算力支撑的呢?

01

云厂商的算力升级

在AI大模型到来前,传统的“云计算”基本偏向于通用算力,以CPU为主,加上部分的GPU算力。而随着市场需求的升级,算力市场的焦点瞬间集中在了智算和超算上面,因此国内头部云厂商在近几年发展过程中,都全力加大建设以GPU为主的智算中心和超算中心,以强化市场优势:

2022年8月,阿里云张北和乌兰察布两座超大规模智算中心启动,其中张北超级智算中心总建设规模为12 EFLOPS(每秒1200亿亿次浮点运算)AI算力,将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心。

中国电信天翼云三年内相继启动了天津、广州等10个国家级超算中心,30+个城市智算中心正在推动或已投入使用,并在今年4月发布了天翼云智能超算云平台。

移动云最近也在“5G创新引领数智融合共赢”发布会上透露中国移动将持续推进算力资源建设,加快建设企业级集中智算中心,预计到2024年,中国移动超大规模智算中心将投产。

1.png

这些云厂商超大规模的智算、超算中心将具备巨大的、高效的、可靠的智算、超算能力,可以为自身和行业内AI大模型训练,以及其他各大算力消耗行业提供庞大计算资源与大数据服务。

02

“云网融合”的升级:算网融合

“云网融合”是中国电信率先在全球提出的发展理念,推动了“网是基础、云为核心、网随云动、云网一体”的技术与应用演进,“算网融合”则是“云网融合”升级2.0版本,通过构建云、边、端协同的梯次化智能泛在算力网络,提供“公私专混”多样化部署模式,实现算力多元化供给,促进通用算力、智能算力、超级算力的协同发展。

1.png

在“东数西算”政策背景下,作为“国家队”的三大电信运营商一直在推动算网融合的落地。特别是中国电信的天翼云更是经过不断迭代升级,成为此领域绝对的先行者,在今年6月联合中国信通院共同发布我国首个实现多元异构算力调度的全国性平台——“全国一体化算力算网调度平台(1.0版)”。该平台针对通用、智算、超算等不同客户的不同需求,通过异构资源池调度引擎,实现了算力动态感知与作业智能分发调度。

这使得AI大模型打造流程中参数和循环次数相对少,单次算力需求较小的“推理”过程及小规模测试验证可以在基于云网的算力资源池中进行作业。极大地推动了算力资源的精准配置和按需获取,有效降低了算力能源消耗。

03

借力大模型

建立云市场MaaS新生态

随着AIGC发展浪潮袭来,很多传统企业也都想通过AIGC在自身行业领域中获得红利,因此,发展包含算力服务在内的大模型一站式服务平台MaaS(Model-as-a-Service)成为了各大云厂商共同追逐的趋势,纷纷在各自AI大模型的基础上推出了相应的MaaS服务。

腾讯云TI平台为开发者、企业客户提供全栈式人工智能开发服务,基于太极Angel的大模型能力和工具箱,支持客户结合自己的产业场景数据进行精调训练,创建和部署AI应用。

阿里云智能集团首席技术官周靖人也曾就ToB业务提到,“未来每一个企业在阿里云上,既可以调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。”

百度智能云“文心千帆大模型平台”,是全球首个一站式的企业级大模型生产平台,不但提供包括文心一言在内的大模型服务及第三方大模型服务,还提供大模型开发和应用的整套工具链。目前全国首个区域私有化部署已在无锡落地。

1.png

结束语:

不难看出,国内“云计算”对AI大模型的算力支撑在规模、效率、可靠性方面已经逐步趋向完善,加上国产GPU的急速赶超,中国算力在自主创新背景下,将一步步突破欧美的封锁和限制。

目前在中国公有云IaaS+PaaS厂商市场份额占比中,美国的亚马逊AWS云、微软云等仅有10%不到,拜登政府意图通过限制中国企业使用美国云计算服务来打压中国AI大模型的发展,可以说是痴心妄想。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论