AI未来的下一个“风口”是什么?

在谈到AI未来的下一个“风口”时,人们往往会从技术与应用的角度予以关注,但不能忽视更加深层次的因素,即社会与政治等对AI未来的影响。

本文来自“中国现代国际关系研究院”微信公众号,作者:李 艳 翟一鸣。

1.png

在谈到AI未来的下一个“风口”时,人们往往会从技术与应用的角度予以关注,但不能忽视更加深层次的因素,即社会与政治等对AI未来的影响。

以ChatGPT为代表的大语言模型技术及其产品掀起的新一轮AI研发与应用狂潮,充分彰显了人类社会对未来智能时代前所未有的热情与期待。谁掌握了AI,谁就掌握了未来的论断被越来越多的人所津津乐道。经过一年多的发展,最初的惊喜与狂热已更多转向理性与务实,人们开始将更多精力放在如何确保此轮AI能够稳定“续航”而非昙花一现。

为此,各方一方面探索下一个“技术风口”,即从技术端探讨未来更有价值的技术路线;另一方面寻找下一个“应用风口”,即从应用端寻找未来最有潜力的应用场景。而这事关能否真正在AI发展中获得真正的优势,因为在新兴技术领域,只有前瞻性的布局和引领式的发展,才能成为真正的赢家。

技术路线并不单一

通用人工智能(AGI)如何实现和应用都是其中绕不开的话题甚至是最终目标。目前关注度最高的以ChatGPT为代表的大语言模型路线只是AGI的一个分支,虽然现在其“独领风骚”,但业界对此有不同看法。

大语言模型批判声音不断。作为生成式大语言模型的“领路人”,OpenAI坚持以“大数据、大算力、大模型”的路线发展AGI,这一路线近年招致多位业界“大佬”批评。早在2023年ChatGPT推出时,图灵奖得主、Meta公司AI首席科学家杨立昆(Yann Lecun)就表示,就基础技术而言,此类产品并不具备太多创新性和革命性;今年5月,杨立昆又在接受媒体采访时提出现有大模型存在“逻辑理解能力极差、无持久记忆、无层次规划推理能力”等重大缺陷,称大语言模型“永远无法达到人类智能水平”。AI研究领域大拿、深度学习框架Keras创建者弗朗索瓦·肖莱今年6月批评OpenAI竭力炒作大语言模型的行为导致其他AGI研究领域资源和人才匮乏,称AGI研究进展因此推迟了五到十年。

AGI未来或有多种技术路径。虽然近两年AI界的“头版头条”几乎都被大模型所占据,但业界并未停止对AGI其他实现路径的研发。Meta公司AI实验室自2022年起在杨立昆领导下研究“可以模拟世界运作方式的AI系统”,该理论认为生命在遗传进化过程中构建起了一套独特的与物理世界交互的世界模型,真正的智能就蕴含其中。相关研究人员计划设计一套AI学习范式和架构,使机器能够以自监督而非人类干预的方式学习并掌握世界模型。杨立昆在今年5月接受采访时称计划10年内完成世界模型系统的研发。

人脑科学驱动的AI技术也是话题度较高的一种发展路线。2022年10月,AI、神经科学、计算神经科学等领域的27位西方顶尖学者联合发布《迈向下一代人工智能:催化神经人工智能革命》白皮书,力推神经科学与AI交叉结合,利用对人脑运行机制的研究推动AGI发展,文中甚至将此上升到维持美国AI研究领先优势的高度。

不同研发路线其实为AI发展注入了更多活力,AI已进入快速发展变革期,究竟是大模型继续给世界带来更多惊喜,还是新领域新方法“横空出世”“大放异彩”,我们拭目以待。

“具身智能”或成未来风潮

不管技术路线如何,从应用端来看,人类对于未来AGI应用的期待无疑更多地集中在“具身智能”上。动漫《哆啦A梦》中机器猫陪伴大雄成长的故事给几代人留下了深刻印象,当下哆啦A梦的神奇口袋还遥不可及,但具身智能(Embodied AI,EAI)研究或将陪伴人类的机器人变为现实。简单来说,EAI就是将AI融入机器人等物理实体,赋予它们感知、学习和与物理世界动态交互的能力。EAI提出时间可追溯到20世纪,但其研究进展缓慢,近年机器人相关技术逐渐成熟,加之GPT等大语言模型技术为EAI发展注入新动能,EAI的热度正逐步攀升。

“大佬”纷纷下场力推。早在2023年5月,英伟达首席执行官黄仁勋就公开表明AI的“前路”在EAI;2024年6月,黄仁勋又在公开演讲中称“AI的新一波浪潮是物理AI”,所谓物理AI是指AI能够理解现实世界物理定律,实现可以自主运行的AI机器人。2024年5月,多家媒体报道AI界著名科学家李飞飞正聚焦“空间智能”进行创业,引发业界关注,李飞飞此前曾在TED演讲中介绍“空间智能”,该研究涉及AI如何“观察”、“理解”现实三维空间,从中获取常识推理能力,进而引导机器人等物理实体开展行动,同样与EAI密切关联。

相关产品已加速涌现。近年EAI领域相关论文、模型、系统甚至机器人成品井喷式涌现,各类探索式研究“百花齐放”。国外方面,谷歌在ChatGPT发布后不久就推出PaLM-E具身多模态语言模型,随后持续发布相关模型和机器人训练数据集等;英伟达自去年起相继发布多模态EAI系统Nvidia VIMA、人形机器人通用基础模型Project GR00T等产品;此外,特斯拉、Meta、OpenAI等公司同样跟进相关技术和产品布局,积极投资“押注”并壮大自身研发团队。国内方面,华为于近期发布盘古具身大模型,实现更高水平机器人复杂任务规划、场景学习和人物执行;小米公司自去年起发布并逐步完善全尺寸人形仿生机器人CyberOne;此外,各顶尖院校和科研院所,以及银河通用、星动纪元等初创公司投身EAI研究热潮,形成了EAI研发的良好生态。

未来发展面临一些“桎梏”。一是“智能核心”能否进化。比如当前的大模型技术已广泛应用于EAI研发,显著增强了EAI系统处理视觉和文本等信息的能力,成为了多数EAI系统的核心“大脑”。但正如一些技术专家指出,大模型技术本身存在逻辑理解和推理能力匮乏等缺陷,无法解决EAI系统自适应、自学习物理环境的难题,真正能够支撑未来应用的“智能核心”还需要更加“聪明”一些;二是数据难题亟待解决。比如EAI所要面临的是物理世界的各个场景,不同场景所需数据量、数据形式各异,数据获取和高质量融合应用难度大。目前EAI系统训练数据量较为匮乏,大量训练依赖仿真数据,系统泛化能力弱、进化速度慢。此外,软硬件水平不兼容、政策跟进有限等问题同样限制着AI的进一步发展。

诚然,在谈到AI未来的下一个“风口”时,人们往往会从技术与应用的角度予以关注,但笔者仍想提醒的是,不能忽视更加深层次的因素,即社会与政治等对AI未来的影响。

技术从来不是“纯粹”的技术,它是在与社会的不断互动中,尤其是社会的规制与选择中找到自身演进的轨迹与方向。比如当前对于AI的诸多讨论,无论是安全风险还是社会变革性影响,都是在从社会维度进行发展与安全的平衡性选择,“奥本海默纠结”或多或少都会有所体现;再比如众所周知的百年未有之大变局与新一轮科技革命的迭加共振,AI无疑是大国博弈的重中之重,不可回避的是,这种基于竞争的逻辑有促进技术进步的一面,但亦有限制技术进步的一面,而这些无疑都会给AI未来带来深远影响。

因此,AI未来的下一个“风口”何时会来,又会以一种什么形式来,来了之后又会给世界带来怎样的变化,不单单取决于技术本身的演进,还取决于凌驾于技术之上的社会因素。我们在期待AI发展下一个“风口”的同时,需要深刻认识到,我们也正在塑造AI的下一个“风口”。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论