据英国科技媒体 The Register 报道,近日,美国军事研究部门 DARPA 举办了一场人工智能 VS 人类的 “模拟空战比赛”,该比赛借助美国空军使用的飞行模拟器进行。最终,一个被称为 Falco 的人工智能战斗机在一系列虚拟空战中击败了一名战场经验丰富的美国空军教官。
该比赛采用 1V1 的对战模式,每位玩家坐在一架由计算机生成的 F-16 军用战斗机内,通过射击子弹来消耗对方的健康条,同时避免自身受到伤害。在这场比赛中,先是由不同公司或研究机构打造的 8 种不同的机器学习算法进行相互对决,排名第一的胜者将与一名资深人类战斗机飞行员进行人机互搏。最终,来自加州的美国国防供应商 Heron Systems 团队旗下的 AI 战机 Falco 脱颖而出,获得了与人类对战的机会。
代表人类作战的战斗机飞行员是一名绰号为 "Banger" 的美国空军教官,他拥有多年的实战经验。而被称为 Falco 的 AI 战机采用了深度强化学习代理,并采取了非常积极主动的作战策略,被视为一个恐怖的对手。不幸的是,代表人类出战的 Banger 在面对 AI 时几乎毫无招架之力。尽管 Banger 借助自己丰富的空战经验顽强抵御,但最终仍然以 0-5 的比分完败于 Falco 。
DARPA 方面表示,虽然这场比赛的结果或许会引发一些担忧,但暂时还不用担心现实中会出现像这样轻松碾压人类的杀手级 AI 无人机,因为现阶段的这种模拟对战仍然太过简单,与真实战争中的战斗场景相比相差甚远。
ACE 项目经理 Dan Javorsek 中校表示,“只有在 AI 算法能够像人类飞行员一样在战斗过程中做出预测、临场应变等策略性处理,模拟空中交战场景的难度和真实性才会增加。”
Heron Systems 公司则表示,他们的 AI 空战模型通过模拟训练,已经积累了相当于一名人类飞行员 30 年的飞行经验。该公司没有透露太多关于其强化学习算法的信息,但表示 Falco 是使用其开源的 AdeptRL 框架进行训练的。
Falco 采用的 AdeptRL 是一个开源的强化学习框架,旨在通过抽象化与深度强化学习相关的工程挑战来加速研究。该框架支持单个或多 GPU 训练,采用 PyTorch 的基线强化学习模型和算法,处理性能达到 3000 steps/s,12000 FPS(Atari)。同时使用自定义网络、代理和环境的模块化界面,内置张量板日志记录,具有模型保存、重新加载、评估和渲染功能。
一名 Heron Systems 的工程师透露,接下来他们将尝试在真实的无人机上搭载 Falco 进行测试。
美国军事研究部门 DARPA 在去年 9 月提出的空中战斗进化 “ACE 计划” 旨在创造能够在没有人类飞行员帮助的情况下进行空战的军用飞机。不过,就像车辆不会完全无人驾驶一样,DARPA 更感兴趣的是打造能够辅助人类飞行员进行战斗的人工智能。官方表示,该计划的最终目标是打造由 AI 控制的自动喷气式战斗装置,能够以闪电般的速度处理诸如躲开敌人火力等实时操作,而飞行员则承担一些更复杂的策略性任务,比如执行战略战斗指令和发射导弹等。
“我们设想的未来是,AI 能够处理视距内犬牙交错的战斗中分秒必争的快速机动,当飞行员将大量无人系统编排成一张具有压倒性效果的战斗网时,就能保持飞行员本身更安全,攻击更有效。” ACE 项目经理 Dan Javorsek 中校说,“ACE 的目标是开发能够自动驾驶飞机的算法,同时人类飞行员在战斗中专注于更复杂的战略功能,而不是简单地用机器取代军队。”