本文来自脑极体,作者/风辞远。
东数西算正在成为各行业的普遍机遇,对于运营商来说也是如此。
东数西算带来了全新的算力网络建设需求,以及各行业普遍的网络升级需求。在这一大背景下,运营商还需要一系列细分的价值节点来推动业务进步,打开市场空间。换言之,东数西算的路有了,运营商接下来更需要关注路上跑哪些车。
在东数西算的整体架构中,AI预训练大模型的价值值得关注。近年来,大模型可谓AI领域最受关注的方向。高鲁棒性的模型效果,卓越的数据集表现,以及跨模态等领域的不可替代性,让大模型成为产业界与学界共同关注的对象。一时间,“炼大模型”成为了AI产业的共同需求,为此也衍生出配套产业的全新机遇。
大模型的算力要求非常严苛,并且需要一系列软硬件基础设施的支撑,比如基于昇腾AI的人工智能计算中心。不过,单个的计算中心之间算力供给存在差异,因此在东数西算的背景下,将东部算力需求有序引导到西部,优化数据中心建设布局,促进东西部协同联动,能更好地促进大模型产业发展。
对于运营商来说大模型带来了一系列全新的AI市场空间。运营商帮助大模型进行跨地域训练,完成算力资源适配,构成了新的服务机会;而运营商本身运用大模型,也可以提升服务能力与产业效率。
运营商的新赛道:
大模型训练带来的市场想象
OpenAI在2018年发布了一份著名的调查报告,从2012年开始,全球AI算力在六年间增长了30万倍,并且还在持续增长。而当大模型时代正式到来,全球AI算力需求进一步加大。AI算力成为了限制产业智能化发展的主要挑战。
2018年,谷歌发布了NLP领域的预训练模型Bert,其优越的能力快速得到业界认可。OpenAI打造的GPT-3在多项任务中实现了跨越级的表现,推动全球大模型迎来了爆发式的发展,模型参数呈现了指数级的增长。“大数据+大模型”成为了AI产业最受重视的发展之路。
但在实践过程里,我们却可以发现大模型在训练与部署中存在着诸多挑战。比如部署场景中存在的模型性能不足问题;不同场景下大模型的泛化能力不强;预训练大模型参数多、计算量大,训练成本高企等等。其中,如何低成本、高效率地完成大模型训练,成为首先需要解决的问题。在这种背景下,将大模型在东数西算背景体系下进行模型训练,正在成为越来越多企业与学术机构的选择。
比如中国科学院自动化研究所在2021世界人工智能大会上发布了跨模态通用人工智能平台——“紫东.太初”。其依托面向超大规模的高效分布式训练框架,构建了具有性能优良的中文预训练模型、语音预训练模型和视觉预训练模型,并开拓性地通过跨模态语义关联实现了“视觉-文本-语音”三模态统一表示,构建了三模态预训练大模型,赋予跨模态通用人工智能平台多种核心能力。从应用层面上看,“紫东.太初”兼具跨模态理解和生成能力,在“以图生音”和“以音生图”等方向上具有广泛的应用空间,可以实现AI为视频配音、AI语音播报、AI海报创作等应用场景。
2022年,千博信息基于昇腾AI和昇思MindSpore AI框架,利用“紫东.太初”三模态大模型,打造了手语教考一体机,开创性地实现手语动作与示意图片和文字的联动。目前,该一体机已在湖南数十个学校陆续上线,一定程度上缓解了手语师资短缺问题,带来了重要的社会价值。
而在“紫东.太初”大模型的训练过程中,就非常能够展现出东数西算背景下,大模型进行“东数西训”的典型逻辑。这一模型由中科院自动化所相关团队主导,基于昇腾AI基础软硬件平台,在武汉人工智能计算中心完成训练。可以说提前替更多大模型尝试了“东部数据-中西部算力训练-东部应用”的产学研结合方式。
以此为案例,我们可以看到运营商的AI新市场正在快速打开。而能够让运营商服务大模型的新市场打开,产业底座的完善性至关重要。
昇腾底座:
为运营商AI赛道保驾护航
大模型走上“东数西训”之路,有几个必要的产业条件:算法、数据、算力、训练所需的软硬件基础设施、算力网络。
从目前阶段来看,大模型的训练算法已经日益完善,国际与国内的大模型训练基础门槛不断降低。接下来是数据,东部地区的企业、高校、科研机构积累了丰富的数据,可以有效投入大模型的训练当中。这也是中国在大模型之路上虽然后起,却能够奋起直追的原因。
接下来是算力,随着各地人工智能计算中心拔地而起,以集群化、集中化的AI算力来完成大模型训练,已经成为可能。昇腾AI提供的AI算力体系,既可以作为人工智能计算中心的建设基础,也可以通过多种方式赋能产学研各界,带来充沛、完整的AI算力供给。
而在软硬件配套设施层面,昇腾AI基础软硬件平台,包括Atlas系列硬件和伙伴硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX、全流程开发工具链MindStudio和一站式AI开发平台ModelArts等。为了能够满足越来越多企业与学术机构的大模型训练需求,昇腾AI已经打造了大模型的全流程使能体系。该体系包含从大模型规划、大模型开发到大模型产业化的全流程,可以实现端到端加速大模型产业落地。
我们可以看到,在大模型的需求与基础技术崛起后,以昇腾AI为代表的规模化、产业化AI基座已经走向完善。大模型不但是能训,更加走上了简单、高效、低门槛可训的新周期。
大模型的最后一个关键需求就是网络与网络配套服务,而这可以成为运营商的重大机遇。可以说,昇腾为运营商的AI赛道起到了保驾护航的价值。
以AI拓展未来:
运营商创新正当时
AI技术在运营商业务版图中的重要性正在不断上升。早在2020年,Omdia的ICT-Enterprise Insights就公布了一项调查数据,有近80%的全新运营商认为使用AI技术是一项“重要”或“非常重要”的IT项目,其中近60%的运营商计划增加对AI工具的投资。
我们可以看到,如今在运营商使用AI、应用AI的场景与价值已经非常广泛。比如面对5G网络复杂的运维管理需求,主流运营商都已经使用AI技术来实现网络的智能分析、实时预测和自动化运维。在智能客服与智能外呼平台中,NLP与多轮对话技术已经成为提升运营商服务触达效率的关键。AI技术也是运营商专网服务等新模式的重要助力,比如在冬奥期间,中国联通就通过AI、云计算、区块链技术与5G结合,护航智慧冬奥。与此同时,运营商在AI技术上的投入与建设水准也在不断加强。
在这个大背景下,用好AI技术,以及服务客户用好AI技术都成为运营商的关键需求。而昇腾底座恰好可以为运营商带来广泛且关键的支撑作用。比如说,浙江移动就依托九天平台+昇腾底座,构建了全栈自主创新的行业AI赋能试验平台,提供面向行业的人工智能基础设施,可实现数据赋能、算法赋能、应用赋能。该平台预置了900+算法和800+预训练模型,可快速定制算法模型,以满足城市多样化的场景应用需求。通过开放标准化接口,模块化方案组合,为城市管理提供多场景的AI服务,全力推进算力成为像水电一样“一点接入,即用即取”的公共服务。
面向未来,我们可以看到更行业、产学研各界都在涌现出大模型的训练与部署需求。进一步来看,大模型属于产业级AI能力与应用的一部分。除了一般意义上的预训练大模型,还有更多重度AI模型、AI能力需要践行跨地域的训练。
与此同时,运营商本身也是大模型与重型AI能力的需求主体。5月16日,浙江移动在电信日发布的“杭小忆”就是基于“紫东.太初”,叠加杭州特色景点——南宋御街的场景,进行高效的本地化增量训练打造而成的文旅数智人。
面向未来,会有越来越多的大模型踏上东数西算之路。不久之前,“中国算力网-智算网络”正式上线,这是中国算力网络建设迈出的重要一步。接下来,会有包括大模型在内的大量AI任务在算力网络中完成训练与部署。而运营商可以在算力网络的基础上,共同参与建设算力网络统一大市场,实现全程全网的社会级算力服务,这对于运营商来说是一个巨大机遇。运营商既可以成为算力网络建设的主力军,也将从AI带来的网络增量中主要获益。
这些趋势与变化,正在构成运营商的全新赛道。大模型训练带来网络需求增加,配套网络服务更加复杂。这些特点都可以为运营商带来极高的价值增量,并且助力打开东数西算大背景下的连续性市场空间。
大模型的产业纪元面前,运营商手中掌握着大模型产业化的最后一块拼图。运营商关注、发力这一市场,也有助于大模型走向规模化应用与产业级繁荣。
未来,大模型训练者、昇腾AI、运营商与产业需求的“四方联动”,将构成一个高效率、低门槛的产业范式,推动AI黄金时代的到来。