本文来自微信公众号“高工移动机器人”,作者/不及。
“为通用人形机器人构建基础模型是当今人工智能最令人兴奋的问题之一。”黄仁勋在GTC2024的开幕演讲中表示。
而科大讯飞董事长刘庆峰也在两会上预言,“2024年将是大模型走向落地应用的关键之年。”
“AI+机器人”的概念在这个春天被引爆。但除了科技大佬和投资人的狂欢以外,也有机器人从业者感到无法理解:小脑都没做好,就开始炒作“大脑”了?
有人直言:“AI+机器人纯粹是炒概念。”“这个概念太超前了,落地不现实。”
意见对立的根本矛盾在于,“AI+机器人”现在能不能跑通?进入工业还有多久?
未来太美,现在太远
如果去看“AI+机器人”描绘的未来,无疑是美好的。
当机器人实现任务级交互,完成通用性进化。那么就意味着在任何场景下,用户仅需向机器人明确抽象的任务目标,它便能理解自然语言并自主拆解任务内容,输出具体决策与操作指令。并根据反馈信息,对指令进行修正。
“大脑”进化之后,机器人的使用者将从掌握编程语言的专业算法工程师变为一般的普通用户,大大降低使用门槛。这也往往是一个产品或一个产业走向大规模快速爆发的起点。
这种设想已看到了现实的曙光,不少大模型形成了泛化能力。泛化能力指的是,大模型在训练数据中提炼共性,这样在面对从未见过的数据时也能具备很好的预测能力,做到只窥见物体的一部分,而能想象到全貌。
百度集团副总裁侯震宇认为,和上一轮AI落地不同,2023年的大模型参数动辄上千亿,这样规模的大模型才能在各个场景下具备通用能力,基于这种大模型精调出来才具备更好的产业应用效果。
在主客观因素影响下,全球基础大模型均主要面向To B行业市场。例如制造、零售、金融等行业,而机器人更是被认为是大模型的最佳载体之一,目前有大量企业及相关机构在瞄准“AI+机器人”赛道。
例如,拥有协作机器人和AMR产品线的Teradyne Robotics在GTC大会上宣布与英伟达合作,为协作和移动机器人添加新的AI功能;Figure AI的人形机器人搭载ChatGPT大模型,已能遵循指示并协助完成清理和移交物体等任务;近期瞄准机器人行业的多模态大模型公司若愚科技完成超5000万元天使轮融资……
更早之前,李飞飞教授联合斯坦福大学、加州理工、清华大学和英伟达几位学者打造的机器人VIMA,是一个带有机械臂的LLM,能接受多模态提示词、单个文本、图像、视频等信息结合,一度引发行业热议。
然而,在产业链深耕的部分从业者们对此持疑,“商业的本质是产生价值,而不是有高级的东西就买。”更多人认为,“AI+机器人”前景是美好的,但工业讲究务实,并不会只为好的概念而买单。
有人举例,“一分投入一分收获,智能驾驶投入了多少时间和人力物力,到现在都不是个合格的驾驶员,又怎么能指望AI能培养出来一个合格的工人?”
透过大模型未来繁荣的滤镜,机器人产业链更关注大模型何时能落地、现阶段又能产生何种价值。
“AI是很热,但是技术和钱是不一样的,钱在哪投都是钱,但是你做产品和技术在不同的领域都有可能不一样,不能被市场热点带着跑。”
“如果5-8年内,AI叠加到机器人身上,能解决一些特定的工艺问题,那还是有巨大市场的。”
然而,机器人要想像人类一样,具有广泛的知识、协调的肢体行为能力,短期来看是不现实的。
泛化的AI,还无法成为合格工人
已具备泛化能力的大模型,为何还无法成为一个合格工人?
如果说通用大模型是培养一个对社会生活有基础认知和处理能力的人,那么行业大模型的目标就是训练一个成熟掌握技能的工人。
行业大模型基于基础大模型能力做一些行业微调,针对性定制,不需要从零开始标注数据。
但难就难在“行业微调”,机器人面对千行百业,下游应用丰富,但终端行业数据具有封闭性,大模型要获得工艺数据的培训十分困难。
例如,工业场景复杂不标准,人的经验难以理论化,工艺更难靠理论推演。同一个场景下,不同的SKU、不同材质和形状的部件,都会有不同的处理方法。对人来说举一反三轻而易举,对AI而言却是能力的鸿沟。
因此,大部分人认为,“AI+机器人”不是不能加入工业场景,不过只能做一些简单的场景。
“如果只能解决低工艺场景,现在的技术都能做到,加不加AI有什么区别呢?”
“例如就拧螺丝而言,要给四个角拧螺丝,如果是机器人可能四个角就全拧死了,而在实际操作中,需要有先后次序,不能一下全部拧死。”如果没有对工艺库有深刻的理解,根本不知道这些细节。甚至焊接一类复杂的场景,都还没有形成可复制推广的工艺程序。
如果寄希望于行业开放工艺数据,又会陷入另一个僵局。工厂最值钱的是工艺和供应链,最难的是工艺库。而建工艺库,来自大量现场实践。作为工厂的核心机密之一,工艺库向来不假借于外人之手。
要撬开终端的数据库并不容易。但基于数据库的重要性,越来越多的机器人厂商与终端合作,典型是作为具身智能代表的人形机器人。
例如Figure AI与宝马的合作、Digit落地试点亚马逊仓库、Apollo进军奔驰车间等。
但这种模式的跑通显然不是一蹴而就的,有行业人士直指,AI+机器人能不能成功,要看特斯拉今年能不能在工厂内跑通。
另一种可能的路径是做行业大模型的人,本身就深谙机器人产业,对一些应用场景深入了解。正如许多汽车厂商躬身入局,开发人形机器人投入到汽车产线上。
但放眼整个机器人行业而言,都缺乏这类复合型人才,“以前行业不需要智能,现在需要智能的时候,这个产业链上的人都不是搞智能出身的。”
除了工艺库建设的难度外,硬件精度是实现机器人智慧操作的短板。
目前,机器人行业现状是,硬件不够软件凑。传感器精度的不足,常常需要依靠算法来弥补。但当算法已经成长为真正的“大脑“,此时的手脚失衡只会让机器人显得更笨拙。
有行业人士表示,如果要达成理想化的“AI+机器人”,当前的传感器强度就不支持。例如“大脑”已经完成了识别、规划,但受限于传感器精度,机器人可能按照规划路径都走不准。
“只靠理论推演,而不亲身实践,是走不通的。起码现在没有一个行业按照这种模式走得通,就说明AI不是万能的。”
理论永远无法推演实际,一套完美的逻辑化成现实,往往需要经过艰难的跋涉。
机器人不仅是走在科技前沿的新质生产力,更多是几十年的打铁功夫积累,看的就是一钉一凿之间的幽微之处。
而这钉凿之间的细微差距,已足以让AI深研良久。