谷歌旗下 DeepMind 推出 Genie 2 模型，可生成长达 1 分钟的游戏世界

2024-12-05 17:04

IT之家

远洋

谷歌旗下人工智能研究机构 DeepMind 发布了一款名为 Genie 2 的新型模型，可通过单张图片和文字描述生成“无限”种类的可玩 3D 世界。作为今年初推出的 Genie 模型的升级版，Genie 2 标志着人工智能在虚拟世界生成领域的一次重大突破。

本文来自IT之家（www.ithome.com），作者| 远洋。

IT之家12月5日消息，谷歌旗下人工智能研究机构DeepMind发布了一款名为Genie 2的新型模型，可通过单张图片和文字描述生成“无限”种类的可玩3D世界。作为今年初推出的Genie模型的升级版，Genie 2标志着人工智能在虚拟世界生成领域的一次重大突破。

641_看图王.jpg

Genie 2能够根据用户输入的文本描述和图像，实时生成交互式的三维场景。例如，输入“森林中的可爱人形机器人”，模型便可构建一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作角色在世界中进行跳跃、游泳等互动。

DeepMind表示，Genie 2可以生成具有不同视角（如第一人称视角和等距视角）的连贯世界，持续时间长达一分钟，其中大多数持续10到20秒。

0 (1).gif

0 (2).gif

DeepMind还称，Genie 2在生成过程中能够模拟物体交互、动画、光照、物理反射以及“非玩家角色”（NPC）的行为。许多生成的场景画质接近AAA级别的电子游戏，甚至在物体视角一致性和场景记忆方面表现优异。

与之类似的模型还有李飞飞创立的World Labs和以色列初创公司Decart的产品，虽然大多数像Genie 2这样的模型——也就是世界模型——可以模拟游戏和3D环境，但存在伪影、一致性和幻觉相关的问题。例如，Decart的Minecraft模拟器Oasis分辨率低，并且很快就会“忘记”关卡的布局。然而，Genie 2可以记住模拟场景中不在视野范围内的一部分，并在它们再次可见时准确地渲染它们。（World Labs的模型也可以做到这一点。）

值得注意的是，DeepMind未详细披露Genie 2的训练数据来源，但业内推测其可能包括大量热门游戏的游玩记录。考虑到谷歌可访问YouTube海量视频资源，并声称拥有使用其内容进行训练的权利，这引发了外界对该模型是否侵犯知识产权的争议。

目前用Genie 2创建的游戏实际上不会那么有趣，因为每隔一分钟左右就会抹去进度。因此，DeepMind将其定位为研究与创意工具，应用于快速原型设计和AI智能体评估等场景。

DeepMind在其博客中写道：“通过Genie 2的泛化能力，概念艺术和手绘草图可以转化为完全互动的环境。这让研究人员能够快速生成多样化的环境，为未见过的任务场景提供评估支持。”

IT之家注意到，谷歌对世界模型研究的投入在持续扩大。今年10月，DeepMind聘请了OpenAI前视频生成项目负责人Tim Brooks，同时两年前从Meta挖来了以开放式实验闻名的Tim Rocktäschel。

THEEND

免责声明：凡注明为其它来源的信息均转自其它平台，由网友自主投稿和发布、编辑整理上传，对此类作品本站仅提供交流平台，不为其版权负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本站联系，我们将及时更正、删除，谢谢。联系邮箱：xiali@infoobs.com

本月热门

精选文章

iVX引领自动编程新时代：从百万应用到普适AST转换的技术突破

8月11日
冲量在线黄淼：“信创+”政务的隐私计算和数据流通

9月29日
大数据在AI时代已沦为“配角”？

11月8日
零信任落地案例

2月18日
构筑数智化转型新基座，中国知网基于“大模型+AIGC”的大数据知识管理系列产品重磅发布!

8月28日
中国信通院栗蔚：《从算力互联互通到算力互联网探索》

6月25日

热点资讯

新型漏洞攻击利用服务器进行恶意更新

谷歌旗下 DeepMind 推出 Genie 2 模型，可生成长达 1 分钟的游戏世界

2025 信息化观察网

长按扫描二维码阅读原文