谷歌组建新AI团队开发“世界模型”：通往AGI的关键路径

本文来自极客网（www.fromgeek.com），作者 | 小刀。

极客网·极客观察1月8日最近谷歌组建一个新团队，专门开发可以用来模拟物理世界的AI模型，也就是所谓的“世界模型”（World Models）。

蒂姆·布鲁克斯（Tim Brooks）原本是OpenAI的一名高管，也是视频生成工具Sora的主要开发者之一。去年10月，他加入谷歌DeepMind，成为新领导之一。模拟物理世界的AI模型团队是谷歌DeepMind的一部分。

布鲁克斯说：“DeepMind有着宏大的计划，它准备开发巨大的生成式模型，可以模拟物理世界。我受聘之后将会成为新团队的一员，努力帮公司达成新使命。”

新团队将会与谷歌Gemini、Veo、Genie团队合作，努力解决关键性新问题。Veo是谷歌自己的视频生成模型；Gemini相当于谷歌的旗舰AI模型，它可以分析图片，生成文本，可以模拟游戏、3D环境；最新的Genie版本于去年12月揭开面纱，它已经可以生成巨大多变的可玩性3D世界。

“世界模型”是通往AGI的关键路径

在新团队招聘信息中能看到这样的话：“我们相信在视频、多模态方面扩大AI训练规模是通往AGI的关键路径。”

AGI是顶尖AI企业共同追求的目标，它指的是AI可以像人一样完成任何任务。

AI行业人士认为，世界模型就是AI的下一个大事件。“世界模型”这个术语实际上是从人类心智派生出来的，它是人类自然进化而来。

人类大脑会从感官中抽象一些表征，从而加深对周围世界的理解，形成所谓的“模型”，大脑会根据这些模型进行预测，继而影响人对世界的感知。

棒球手打球时，只需要几毫秒就能判断如何击球，耗费的时间比视频信号传到大脑还要短。人类之所以能击中时速达到100公里的棒球，主要是因为我们能凭直觉判断球的运动方向。

一些科学家认为，人类之所以拥有超常智力，主要是能够在潜意识推理，这些推理是以世界模型作为基础的。

一旦技术取得突破，世界模型将会为多个领域赋能，比如视觉推理、模拟、嵌入式智能体规划、实时娱乐交互。

按照描述，新团队将会开发实时交互生成工具，它以谷歌之前开发的模型作为基础，新团队开发的模型会考虑如何与现有多模态模型整合，比如与Gemini整合。

不少AI公司都在布局“世界模型”

很多创业公司和科技巨头正在努力开发世界模型，比如李飞飞创建的World Labs，以色列Decart、Odyssey。大家相信，一旦世界模型获得成功，可以创建交互性媒体内容，比如游戏、电影，还可以为机器人搭建逼真的模拟环境。

对于这样的新技术，创意界意见不统一。比如，动视暴雪积极进入AI工具，提高生产力，结果导致部分员工被裁。Animation Guild不久前发布的报告称，在2026年之前，由于AI的应用，美国会有超过10万个电影、电视、动画职位被摧毁。

在“世界模型”开发领域，Odyssey算是新手，它宣称要与创意专业人士一起开发，并无替代创意人士的计划。谷歌的物理世界模拟AI会不会替代创意人士？还有待观察。

在版权方面，开发世界模型也存在障碍。有一些世界模型是根据视频游戏片段训练的，训练时并没有拿到版权，可能会引发纠纷。

谷歌是YouTube的所有者，它已经获得许可，准备用YouTube视频训练模型，只是现在还不知道具体会用到哪些视频。

当然，除了这些问题，世界模型还有很多技术难题没有解决，即使是谷歌，离成功也有不小的距离。

和所有AI模型一样，世界模型也存在“幻觉”。如果用欧洲城市数据训练模型，城市的天气一直晴朗，可能无法理解下雪的亚洲城市。没有充分的数据，模型不可能深刻理解世界。

Runway的CEO Cristóbal Valenzuela不久前说，由于数据和工程方面的问题，想精准捕捉世界上的“居民”（比如动物和人）存在巨大挑战。模型要为环境生成一致的地图，要在环境中导航、交互。

虽然存在巨大挑战，不过如果问题得到解决，世界模型可以让AI与真实世界更好联系在一起，到时不只虚拟世界生成工具会取得突破，机器人、AI决策也会地大踏步前进。

谷歌组建新AI团队开发“世界模型”：通往AGI的关键路径

最新评论（评论仅代表用户观点）

被质疑的OpenAI

喜力啤酒的科技革新之路：运用生成式AI助力成功

前苹果大牛Ive与OpenAI合研新品，将创造社交干扰比iPhone更少的计算体验

高通开芯片发布会，为何ARM急了？

本月热门

一文读懂量子传感器

《网络交易合规数据报送管理暂行办法》发布（附一图读懂）

从“卡脖子”到自主创新，中国封装材料产业链深度解析

企业级AI“脱虚向实”，落地还有几道槛？

重磅发声!多部委“剧透”新政→

英伟达会颠覆PC市场吗？

精选文章

关键信息基础设施领域网络威胁管控解决方案

汽车也能使用指纹解锁？现代汽车：没错

实力认证荣联获评“2023信息技术应用百佳企业”

实力认证丨荣联科技集团获评“2022行业信息化领航企业”

中国信通院栗蔚：《从算力互联互通到算力互联网探索》

2021第三届中国电子政务安全大会在北京隆重召开

热点资讯

华测导航加入IGS实时分析中心，跻身全球GNSS技术第一梯队

易立德：国产替代破局之路， ETRX研发套件驱动工业创新升级

业务需求落地难，AI建模智能体四步破解金融业务技术断层

第十一届全国CIO大会5月启幕, 聚焦“AI +数据赋能业务场景”

汉高亮相SEMICON China 2025 助力半导体产业在AI时代打造新质生产力

中国储能企业出海的正反面

2024，我们捕捉到跨境电商的五个关键信号

谷歌组建新AI团队开发“世界模型”：通往AGI的关键路径

最新评论（评论仅代表用户观点）

栏目推荐

被质疑的OpenAI

喜力啤酒的科技革新之路：运用生成式AI助力成功

前苹果大牛Ive与OpenAI合研新品，将创造社交干扰比iPhone更少的计算体验

高通开芯片发布会，为何ARM急了？

本月热门

精选文章

热点资讯

中国储能企业出海的正反面

2024，我们捕捉到跨境电商的五个关键信号