利用深度强化学习模型训练自动驾驶车辆识别路上行人

陈品蓁
新创公司Humanising Autonomy的技术是一套经过训练的机器学习(machine learning)模型,应用范围在于自动驾驶汽车行驶时,可以识别不同行人之行为。

图片来源:Humanising Autonomy

新创公司Humanising Autonomy的技术是一套经过训练的机器学习(machine learning)模型,应用范围在于自动驾驶汽车行驶时,可以识别不同行人之行为。该公司宣称其人工智能系统是一个几乎可以处理任何车辆摄像头上的图像,且因此获得一个国际投资基金获得了530万美元的种子基金。目前,Humanising Autonomy正与欧洲、美国和日本的移动供货商合作,致力于将产品商业化,其中几家公司包括:Daimler Mercedes Benz 和 Airbus。

Humanising Autonomy模型的优势包括两点:多样的数据来源,以及可根据硬件需求单独选择和调整的模块化模型设计。

该系统的数据来源涵盖了闭路电视摄影机(Closed-circuit television, CCTV)、各种分辨率的移动式摄影机、以及自动驾驶车辆的传感器等。而系统模块化的优点在于可以随着环境做出不同的预测和调整,例如,雨天风险大小、行人是否分心、地区差异等。利用深度学习(deep learning)的设计,该制程的可读性将会提高,也将改善该模型的效能。

真正的人工智能公司是拥有统一的自动化数据数据库,也就是一个战略数据采集的地方。在设计自动驾驶车辆的过程中,创建数据集以及使用数据集,将会是设计过程与机器模型深度学习中,一个互补条件下的完美结果。

开发深度学习模型时,特别困难的地方是确定哪些才是所谓真正的变量(variations)。大多数的情况下,图像和声音都会转换为数行和数列的数据,而普遍对深度学习的误解是,人工智能学习系统模型都需要使用大量数据做为讯息来源。但在预测自动驾驶路径时,如果为了同时考虑天气,而把因为下雨导致转弯速度下降所加入的道路标记,改成添加一个“下雨”的功能到软件里,模型将不需要再进行密集型学习,就能进一步提高其性能。

另一方面,由于数据都是由人类所产生,因此,在深度学习的情况下,加入心理学的概念将有助于理解为什么某些数据产生的结果,或者某些神经网络会存有误差。如果以行人过马路的行为为例,一般人皆可知道,伦敦的行为模式并不能转移到孟买,反之亦然。如此一来,学习过程将不再是训练一个全新的模型,而是收集并关注特定的数据,以便对新环境进行更新。

产品改良的过程,有一件事特别令人注目,也就是当用户使用产品时,设计人员能持续开发深度学习解决方案,并与用户交互学习,使得每个新生成的数据点变成动态的学习。这个过程结合了深度学习与强化学习,称为深度强化学习(deep reinforcement learning)。

深度强化学习可应用于多的地方,其中也包括自动驾驶车辆与行人之间的相互作用。举例来说,当行人了解每次只要将一只脚放在路上,车辆就都会停下来,那么当行人想要穿越马路时,就会更频繁的做这个动作。这件事若使用传统的深度学习算法,必须重新训练整个模型或至少是模型中几个层的训练成本,但深度强化学习的模型可以自动将这样的行为加到该项目中。

总而言之,在收集和准备数据的过程中,透过设计方法的改进,将可以改善大部分的数据管理作业。而借着设计和工程视角间的切换,将可以避免在特定领域遇到障碍,而有助于实现模型学习的结果。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论