本文来自微信公众号“AI云原生智能算力架构”,【作者】AIsoar。
“普慧”算力助力充分释放数据红利中国数字经济体量有望突破百万亿元
当前,数据对提高生产效率的乘数作用不断凸显,是最具时代特征的生产要素,与其他生产要素相比,数据具有可复制、非消耗、边际成本接近于零等新特性,打破了自然资源有限供给对增长的制约,能够为经济转型升级提供不竭动力。
中国网民数量、数据资源、数字化应用场景全球领先,14亿人口所产生的数据资源将支持中国数字经济发挥规模经济、范围经济和网络经济优势。“普慧”算力作为数字经济的基础设施,可以强有力地推动跨层级、跨地域、跨部门数据汇聚融合、共享交换和开发应用,提升数据要素的整体流通效能和经济社会价值。
数据+“普慧”算力的双向驱动,将充分盘活数据资产,释放“数据红利”,为中国数字经济的发展提供坚实底座。
据中国(深圳)综合开发研究院技术团队预测,2020-2025年,中国数字经济年均增速将保持在15%左右。
到2025年,数字经济规模将突破80万亿元,占GDP比重达55%。到2030年,数字经济体量有望突破百万亿元37。
“普慧”!算力推动大小模型协同进化,通用人工智能将真正走向落地
中国是世界人工智能重要领军国家之一,各级政府、科研机构、企业等都在积极推动AI大模型发展。
例如北京市经济和信息化局发布的《2022年北京人工智能产业发展白皮书》中,明确提出支持头部企业打造对标ChatGPT的大模型,着力构建开源框架和通用大模型的应用生态。
此外,智源研究院、清华大学等单位联合研发了全球最大的智能模型“悟道2.0”,模型参数规模达到了1.75万亿38,国内各大科技公司也纷纷推出了自家的大模型产品,AI大模型的竞赛正在打响。
数据、算法、算力三大核心要素是各类大模型竞争焦点,现阶段投入商用的大模型参数量基本在千亿级,以百度的“文心一言”为例,其模型参数量为2,600亿。公开资料显示,目前在追赶GPT3.5的中国团队约有10个,能够拥有或持续获取算力将是决定未来竞争格局的关键,对比当前国际头部大模型团队1万张H100(约10万A100)的算力规模来看,中国科技公司仍面临诸多挑战39。
值得注意的是,AI大模型的真正价值最终将体现在具体场景中,未来产业竞争将从“规模”转向“应用”目前大模型训练都在云端实现,所用算力是中心化的,精度要求高且成本高,意味着大模型落地必然会面临能耗和性能平衡的难题。
破局之道在于大小模型协同进化,即在利用大参数训练完大模型之后,通过高精度压缩,将大模型转化为端侧可用的小模型,大模型相当于超级大脑,小模型相当于垂直领域专家,共同推动AGI落到实处。而这一过程中,算力由中心化走向泛在化,由通用化走向智能化,恰恰也是“普慧”算力释放价值的过程。
“普慧”算力作为通用人工智能的核心动力,既是帮助科技公司搭建AI模型的“卖铲人”,又是检验算力公司创新能力、制造能力的“试金石”,更是推动中国迈向科技强国的“加速器”。
在全球算力供给告急的背景下,“普慧”算力正在迎来规模化、产业化发展机遇。
“普慧”算力要求安全不容有失,数据、算法、算力三位一体
数据安全:已上升至国家立法层面
中国已将数据安全提升至国家立法的层面,《国家安全法》《网络安全法》《数据安全法》及《个人信息保护法》等共同构筑了数据安全保护的法律法规框架体系。
推动算力发展过程中数据流动和安全发展的矛盾将逐渐显现,必须严守数据安全防线,规避数据泄露、数据贩卖数据滥用等风险。
《全国一体化大数据中心协同创新体系算力枢纽实施方案》强调,“加强对基础网络、数据中心、云平台、数据和应用的一体化安全保障,提高大数据安全可靠水平。
具体来说,可从数据要素全生命周期加强安全防范。在数据传输流转阶段,可以利用区块链分布式、透明性、可追溯性和不可篡改性等特征,促进数据流动过程透明化,不断增强数据流动的时效性和安全性。
在数据存储阶段,可以不断提高相关数据设施的容灾能力,合理评估并积极应对不同类型、不同级别数据的泄露风险;在数据访问阶段,要加快数据清权确权,建立数据权责清单,让各使用主体以规治数、按权用数、决策循数。
在数据使用、共享阶段,要落实事前可预防、事中可阳断、事后可溯源的全方位数据安全,实现数据“可用不可见”
算法安全:伦理规范问题不可忽视
任何一项新技术或应用的诞生,都必然伴随着风险和争议,公开资料显示,ChatGPT已经引起美国、欧盟等关于人工智能立法的讨论,实际上AI决策难以解释、不可问责一直是棘手难题,导致了无人驾驶、手术机器人等难以落地,数字金融欺诈、大数据杀熟、牛物特征识别等更是不断引发信任危机。
随着ChatGPT等生成式AI走向应用,AI在“可解释性”上面临的挑战可能更加严峻,例如,现阶段ChatGPT有能力完成各种基于文本的任务,但它不可避免地会产生-些与事实不符的内容40,原因是ChatGPT在回答问题时只是根据前一个单词“预测下一个单词”,进而生成答案,这一过程绕不开神经网络运行机理产生的黑箱效应,运行过程难以解释部分运行结果的说服力也将大打折扣,某种程度上,AI缺乏“可解释性”带来的“不可信”正在阻碍AI大规模应用,也是算力发展必须克服的难关。
中国正在以算法安全可信、高质量、创新性发展为导向,建立健全算法安全治理机制,构建完善算法安全监管体系,推进算法自主创新,《关于加强互联网信息服务算法综合治理的指导意见》《互联网信息服务算法推荐管理规定》等政策文件出台,中国开始迈向对算法进行事前事中全流程、动态规制与监管的“算法法”时代。
算力安全:战略地位将进一步提高
对比数据安全、算法安全来看,未来中国算力安全的战略地位有机会且有必要进一步提升。
在国家政策层面,算力安全受到的重视程度相对不足,多以地方政府级别的政策为主,例如,上海市经济信息化委发布了《上海市推进算力资源统一调度指导意见》,提出鼓励建设国产自主可控、安全可靠的算力基础设施和基于国产自主可控的算力应用生态。
2023年1月,成都发布全国首个算力产业政策《成都市围绕超算智算加快算力产业发展的政策措施》,直接提出鼓励智算中心建设国产自主可控、安全可靠的人工智能算力基础设施和技术路线生态,打造全球领先的人工智能计算平台、城市智脑平台等,提供普惠算力服务。
保障算力安全需要国家从顶层设计发力,推动各界共同努力。2022年8月,美国政府限制英伟达向中国出口GPU计算芯片A100和H100,而高端GPU计算芯片作为算力核心一旦受限,中国算力产业发展将受到明显影响。
具体来说,高端芯片、数据中心、网络等基础设施是算力产业可持续发展的重要保障,要以核心技术自主创新为牵引,加快研发突破,通过产学研联合攻关增强算力产业链的稳定可控性,不断提升算力的自主可控水平。
此外,中国超大型、大型数据中心仍有较大发展空间,需坚持适度超前原则,以建代用,尽可能提高算力基础设施的承载能力。
“普慧”算力发展任重道远绿色化、场景化、市场化三措并举
举措一
算力绿色化关乎可持续发展,吸需提高单位能耗的计算能力
能量和信息是科技发展的主线,计算的本质是利用能量对信息进行处理加工,信息越多,计算就越复杂,需要的能量也越多,当能量增长跟不上近乎无限扩张的信息时,提高能量利用率将成为必然选择。
从能量和信息转换的角度来说,不断提高单位能耗的计算能力是算力发展的重要底层驱动力之一而公开资料显示,目前大约80%的电能消耗只是在维护计算机状态,只有不到20%的电能消耗在做计算41。
此外,“双碳”目标背景下,数据中心等能耗大户带来的碳排放问题需得到解决,根据开放数据中心委员会测算,2020年中国数据中心能耗总量为939亿千瓦时,碳排放量为6,464万吨,预计到2030年,中国数据中心能耗总量将达到3,800亿千瓦时左右,碳排放增长率将超过300%42
因此,算力绿色化不仅符合科技发展的基本规律,更关乎人类命运共同体前途,已成为全产业链的关键课题。
算力绿色化核心目标是提高每瓦功耗所产生的算力,主要发展思路包括提高绿色能源使用占比、采用创新型制冷技术降低数据中心散热过程中能耗、综合管理IT设备提高算力利用效率等。
例如,在用能方面,可以提高光伏等新能源系统发电占比;在降耗方面,可以进一步推动液冷、温水水冷取代传统风冷;在提效方面,可以利用服务器虚拟化等技术提高设备使用率。
举措二
算力场景化面临知识壁垒,吸需业务、数据、算力高效联动
算力要落地到具体场景中才能真正转化为生产力,而行业愈是细分、业务愈是复杂,算力场景化落地面临的“知识壁垒”就越高。
例如,大量行业垂直类软件要求高度凝练总结行业经验、最佳实践等知识,这一知识软件化的过程,经常伴随着非结构化和半结构化数据占比不断升高、数据负载从单一负载转向混合负载等结果,会使得数据流通、压缩存储、加密解密等对算力的需求趋向复杂化和定制化,正倒逼着算力服务商不断提高行业理解力、强化数据资产沉淀、提高算力针对场景化需求的适配度等。
可以预见,随着各行业全要素、全流程、全场景迈向数字化和智能化,数据架构和业务架构将不断向更强大的算力平台上迁移,实现“业务、数据、算力”之间的高效联动,是保证算力资源按需匹配、精准赋能的必要前提。
举措三
算力市场化仍需加强,吸需多方共同推动算力统一交易
当前算力需求增长确定性高,算力供给规模相对有限,通过市场化交易可以大幅提升算力资源配置效率,是破解算力供需矛盾,推动算力产业生态进入正向循环的关键。各方仍在积极探索算力交易模式,吸需解决算力归属复杂、难以度量定价、区域发展不平衡等问题。
针对算力归属复杂的问题,主要原因在于当前规模化算力基础设施大多由多方共建,要求算力建设方明确划分算力资源占比,保证算力产权可溯源;针对算力难以度量定价的问题,可以提倡由行业管理部门和龙头类企业带头建立统一标准,为算力定价提供可靠依据。
针对算力区域发展不平衡问题,在“东数西算”工程稳步推进过程中,各级地方政府部门可以结合区域算力资源禀赋和市场环境,“因地制宜”建设算力基础设施,积极融入全国算力一体化网络,大力建设算力供需适配平台、算力交易平台等,畅通区域间算力流通、共享、按需分配。