服务机器人的中场战事

笼统而言,机器人可以被划分为“工业机器人”与“服务机器人”。前者主要指运用于工业生产领域,在流水线上进行加工作业的机器人类型;而后者则常见于家庭陪护、物流配送、医疗、教育以及特种作业等多元场景中。

QQ截图20211119092508.png

本文来自腾讯研究院,作者/T3。

1972年,在中科院沈阳自动化所工作的蒋新松,与两位同事一起,开始起草“关于人工智能与机器人”的研究申请报告。

这是中国科学家最早提出有关机器人的建议,也是“机器人”这个概念,第一次出现在正式公文里。长期关注国外机器人发展趋势的蒋新松认定,“研制机器人是装备制造业自动化的必然方向,是一个国家工业发达强盛的重要标志。”

尽管这种观点现在看起来稀松平常,在当时却遭到广泛的质疑。很多人疑惑不解:中国人口这么多,还要机器人干什么?有了机器人,人去干什么?

整整50年过去了,时间印证了蒋新松的大胆预想,他也因此被视作“中国机器人之父”。时至今日,机器人已经是社会生产生活中不可缺少的部分。

工业领域,机器人早已成为制造业皇冠顶端的明珠。《“十四五”机器人产业发展规划》指出,到2025年,我国将成为全球机器人技术创新策源地、高端制造集聚地和集成应用新高地。

与此同时,机器人的全面普及也正在加速。服务机器人,涌现而成另一片蓝海。从数据看,2021年全球服务机器人需求端销售额达到146亿美元,增速32.2%;目光投向现实,冬奥会馆中的炒菜机器人、送餐机器人尚历历在目,清洁机器人、配送机器人已随处可见。特斯拉、戴森等企业也纷纷投身到服务机器人的研发与制造领域。

初步面世之后,服务机器人的“战事”也已经转入中场。而这场战役决定着服务机器人嵌入社会系统的广度与深度,也决定着它是停留在“华而不实”“无所用处”的层面,还是能真正突破技术限阈,实现社会价值。

在这个当口,关于服务机器人的种种问题更亟需厘清:到底什么是服务机器人?哪些技术的突破和进展让它们有了走进家庭生活的可能?还有哪些挑战需要攻克与解决?

6月8日,腾讯研究院T3项目组组织了一场“人机协同的服务机器人离我们有多远?”的直播节目,并邀请到丁汉、徐迎庆、丁宁、张正友、余海洋、司晓等嘉宾,他们有的是科研人士,有的是业界专家,他们会怎么看待服务机器人的现状与未来?

服务机器人,“服务”什么?

笼统而言,机器人可以被划分为“工业机器人”与“服务机器人”。前者主要指运用于工业生产领域,在流水线上进行加工作业的机器人类型;而后者则常见于家庭陪护、物流配送、医疗、教育以及特种作业等多元场景中。

也正是因为使用场景的多元化,讨论“服务机器人”,最大的门槛其实在于定义。

按照国际机器人联盟(IFR)的定义,服务机器人是指用于非制造业、以服务为核心的自主或半自助机器人。但这个定义过于宽泛,日常所见的配送机器人、消杀机器人不必多说,在一些国家被广泛用于农业领域的种植机器人、耕地机器人也被视为“服务机器人”。那么扫地“机器人”算吗?外骨骼“机器人”呢?

QQ截图20211119092508.png

多元的使用场景带来服务机器人宽泛的定义,接受了不同定义的主体,对服务机器人产生不同的预期和认知,也就无法在同一概念基础上开展讨论。

在6月8日的这场交流中,与会者们也先就“服务机器人”的定义和范围进行了讨论。最后达成的一致是,基于服务对象和服务场景,要求“服务机器人”至少有两点特征:

其一,互动性。服务机器人与工业机器人最大的区别就是,服务机器人要服务于人。如腾讯首席科学家张正友所说,“它(服务机器人)必须要跟人有互动”。相比之下,工业机器人不必与人互动,它被安置于工厂流水线中,按照设置的指令运作即可。但服务机器人不同,不管是用于陪护、导览、售货,还是运输、安保,它的直接服务对象都是人。

服务对象的差别,要求服务机器人具备互动性,也延伸出了更多的特性要求。比如友好的互动界面,这不仅仅是指操作简便,也包括外形的友好。这也是为什么工业机器人大多以“机械臂”的形象存在,而服务机器人很多是轮式、足式,也有的会以宠物、人形的形象出现,就是考虑了互动对象的差异。同样,出于互动性的要求,服务机器人也要有沟通能力和交流能力。

其二,自主性。香港中文大学丁宁教授认为,“没有自主性,那就是自动化的机器而非机器人”。相对于工业机器人的固定应用场景——流水线来说,服务机器人的应用场景更加多元、不固定,它要适应环境的不确定性、与人交互的不确定性,解决突发情况、障碍物等情况,所以自主的互动能力很重要。

目前,服务机器人的非结构化环境的处理能力不强,基本上处于“半自主”的阶段,在相对封闭和确定的场景中,以及服务流程的标准化程度较高时,实用性才会更强一些,比如酒店送餐、引导停车等。但是随着应用场景的扩大,需要服务机器人自我设置任务完成线路,并且能“随机应变”地处理突发情况,都对它的“自主性”提出了考验。

服务机器人三要素:

耳聪目明、头脑灵光、手脚灵活

服务机器人下一步的发展,很大程度上取决于在互动性和自主性等维度上取得的进展。而这些领域是否能向前迈进,又都取决于背后技术瓶颈的突破。

腾讯首席科学家张正友将智能机器人的核心技术概括为七个英文字母:ABCDEFG,代表着七个方向和七个技术突破点:

A是人工智能(AI),机器人能看能听能说能思考,依托于AI;B是机器人本体,不同机器人本体能够实现不同能力;C是控制,ABC构成了机器人的基础能力层。

C之后,是机器人新的技术发展方向:D是发育学习(developmental learning),E是情商(Emotional Quotient),要能够理解人的情感并做出相应的反应;F是灵巧操控,这是与人共生共存的关键。通过学习能力、情感能力、操控能力以及与其他要素的交互,服务机器人就会变成G,即守护天使(guardian angel)。

这七个技术方向,推动机器从采集信息向分析决策、实现有意识自主的高阶智能发展,可进一步归纳为S(感知)、L(学习)、A(执行)、P(规划),也就是SLAP模型。

如果将服务机器人类比为一个人,他就要“耳聪目明、头脑灵光、手脚灵活”,既需要感知环境与情感,也能学习和规划,并能灵巧地执行任务,背后涉及到多种智能技术的交叉协作。那么,现在的机器人,还差在哪?

服务机器人要“耳聪目明”。计算机视觉让服务机器人“看到”,语音技术让它“听到”和“说话”。不仅如此,为了应对高度复杂、动态变化的人物事态,它还要能“触摸”,能“闻味道”,比如在家庭应用场景中,可以通过这两项能力监测燃气、安全检查等,并预警失火等危险情况。这就涉及到机器人的多模态感知能力。

QQ截图20211119092508.png

根据清华大学徐迎庆教授的介绍,目前机器人的视觉和听觉较为发达,原因之一是数据量大,其二是应用场景的需求量大,因而促进相关领域迅速发展。相比之下,目前对嗅觉感知和气味识别方面的研究还远远不够,触觉是下一个突破点,起步更晚一些。这些是下一代机器人以及人机交互研究领域必不可少的一个方向。

除了感知能力,机器人的智能程度也是关键。如果说多模态感知是为了让机器人“看到”、听到,那么智能水平就是为了让机器人“看懂”“听懂”,前者是感知智能,而后者是认知智能,也与前文中所述及的“自主性”和“互动性”息息相关。目前的服务机器人大多功能单一,只能在具体场景解决固定问题,主要挑战之一就在于智能程度不高。

AI是机器人的大脑,也是解决机器人认知智能的关键。丁汉院士认为,AI是推动机器人技术进步动力,与AI结合是本世纪机器人的突破点。如何将AI领域的发展成果运用于服务机器人领域,是后者取得实质性进展的核心问题。

一个耳聪目明、头脑灵光的人,倘若没有健全的体魄和灵活的四肢,也不能很好地改变世界。因此,机器人的躯体同样重要,它涉及到许多方面,比如运动能力。根据张正友介绍,腾讯机器人实验室RoboticsX将想要实现的服务机器人分解为三个支柱:灵敏运动、灵巧操作以及智能体(用以学习高效的运动能力和协作能力,分解复杂任务)。三个支柱要素都与机器人的“运动”能力有关。

同时,“手脚灵活”也涉及制造材料技术,如果材料很笨重,那就让机器人动弹不得。能源动力问题也是瓶颈之一,服务机器人在野外场景作业,需要能源供给。但现在的能源技术还不能还很好地支撑这一点。

关于能源动力问题,一个负面例子是日本本田公司研制的Asimo机器人:经过20多年时间开发,它已经掌握跑步、跳跃的能力,甚至能轻松模仿人类跳舞。但这个项目在2020年被终止,原因之一就是电池续航不足。Asimo背了一个大书包,里面装了一大块电池,即便如此,也只能支撑40分钟。

腾讯投资董事总经理余海洋也提出了这一点,他认为,电池、电机都需要突破,合在一起才能够解决服务机器人面临的问题。随着新能源汽车的投资热潮,大量资金和人才都在涌向电池行业,电池技术的突破是可期的,但电机领域还很难看到希望:

“即便是波士顿动力公司的机器人能够产生商业价值,但其动力系统和人形构造都需要很大的功率来支撑,续航已经成为最大的短板。”

人机协同的

服务机器人还有多远?

相较于工厂中执行固定任务的机械臂,服务机器人需要进入高度复杂动态变化的生活场景,与人流、车流、建筑环境等密切接触,才能并且执行复杂任务并真正服务于人本身。

腾讯研究院在《2022年十大数字科技前沿应用趋势》中,从机器人执行复杂家庭服务的难度切入进行了分析:尽管多模态融合驱动机器人进入了家庭场景,但是服务机器人仍然成为可以执行叠衣服、清洗玻璃杯、剪头发等复杂任务的多面手。这就要求机器人不仅需要本身“耳聪目明、头脑灵光、手脚灵活”,还要实现人机协同。

如何理解未来的人机协同,实现人与机器人的双向交流、理解和互动?张正友认为,广义上未来的人机协同,包括单人与单个机器人,单人与多个机器人,多人和多个机器人交互。人与人之间,可以通过视觉和语言相互交流,而机器人与人之间,则可以通过电信号进行更为高效的沟通。丁汉院士也谈到,机器人未来将向共融机器人方向发展,人和机器一定会在同一个物理空间紧密合作。

那么,留给我们的一个问题就是,让技术可解释、可信并更加安全,让人能够信任机器人。丁宁教授以机器人帮小孩洗澡的案例,非常精准的解释了机器人对于常识的表述、传承和表达方面仍然存在挑战:

假设你们家有服务机器人,你跟他一起帮小孩洗澡,你跟机器人说“洗完澡以后记得把水倒了”。机器人的做法很可能是把小孩洗干净,把盆端起来,连水带里面的小孩一起倒了,因为你跟它沟通的时候漏掉一个重要的信息:“把小孩洗完擦干以后,把小孩抱出来,再把水倒了”。

为什么把关键的信息跳过去?这是人的常识,人可以理解小孩和水,以及倒水这个动作衍生的所有内容,所以会把这些关键信息跳过去,是为了提高沟通效率。这些常识是人理解环境和自然整个运作机理很关键的内容,但怎么让机器理解,是一个挑战,不是简单让它背一个公式就可以的。

除了技术本身,从实验室走向市场,也要求机器人厂商在技术、成本和效率方面找到均衡,解决服务机器人落地最后一公里的问题。

对于这一点,腾讯投资董事总经理余海洋讲到,优秀的服务机器人公司,需要对特定的场景有比较深刻的理解。比如商务清洁,打扫地下停车场的时候,要预设到有地下停车减速带的停车场,机器人怎么通过这些减速带。此外,服务机器人的发展也还需要渐进式的优化。老龄化是非常大的需求,但缺乏供给的解决方案,如果可以在供给方面有一点提升,就可以产生比较大的商业价值。余海洋说道:

“要把大的需求切分成小需求,先一个一个解决小的需求,机器人可能没办法一下代替保姆护工,但是能不能把东西拆分出来看一下,有没有更好的方式实现。”

最后,服务机器人在融入社会的过程中,也不可避免会引发一系列社会争议甚至伦理挑战,例如就业替代、隐私泄露。腾讯研究院司晓院长介绍,此前通过腾讯新闻做的一个调研,很多网友都关注隐私和就业替代问题。以隐私问题为例,医疗机器人可以在非接触的情况下,从病人散发的气味识别病情,这在医院场景做检查是可以的,但如果是联网的机器人,可能就会有隐私问题。这些都需要产业界共同探讨,合理解决。

人机协同无疑是大势所趋,让机器服务于人,而非替代人,是初心和方向。面对人与机器人的多重互动关系,业界更需要坚持向善向上,让技术变得更可解释、更可信和更安全,让技术去增强人的能力,服务人的需求,共同创造更多人机协作的美好未来。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论