本文来自微信公众号“高工移动机器人”,作者/Levi.。
人形机器人在2023年吸足了业界的眼球,资本对它们的青睐也显而易见。但由于迄今为止,还没有一个真正落地,甚至能正常运行展示的产品出现,大批厂商并没有轻易入局,而是在观望先锋企业是否能做出落地产品,再随后跟上。因此人形机器人与其说掀起了一波浪潮,不如说是雷声大,雨点小。
在年末回望,真正称得上今年业界的最大风口的,无疑是人工智能。
从资本的风向来看,人工智能可以说是2023年几乎唯一的亮点。由于全球经济形势并不景气,叠加地缘政治的因素影响,资本进入了寒冬期。
知名投融资分析机构PitchBook的数据显示,2023年上半年全球风投资金总额只有1739亿美元,同比下降48%,融资次数也下降19%。到了第三季度,情况并没有改善,全球融资额同比下降了31%。
而人工智能却逆势上升,第三季度全球人工智能企业融资额同比增长27%,达到了179亿美元,甚至超过了其他硬科技赛道的融资总额。
这也难怪某资本行业从业者说:“今年科技赛道只有两条,AI和其他。”
从产业端来看,尽管以Chatgpt为代表的AI大模型风头无两,但落地场景成谜,由于目前大模型在文字、图像生成领域表现出色,许多人认为这一波AI更可能首先在服务或设计行业落地。
但实际上,高工移动机器人发现,许多移动机器人企业认为人工智能是助推工业移动机器人爆发的关键技术,目前正在将人工智能的最新进展接入到他们的产品体系中,而且其中数家企业强调“这绝对不是噱头”。
有业内人士就表示:“你说今年行业没有亮点,我是不同意的。年初开始,AI对我们启发非常大,我觉得这个是行业进化的机会,是能够真正促使移动机器人爆发的变革。”
或许这波人工智能革命,首先落地的行业,将会是工业移动机器人。
01
大模型如何赋能工业机器人?
在年初被大模型革命性的能力震撼过后,业界人士目前已经回归理性,AI大模型的具体落地场景,能够带来多少收益,成为行业关心的核心。
据高工移动机器人走访,人工智能目前主要在三个领域加持工业机器人:
1、人机交互。一直以来,机器人的控制、调度与排障都需要熟悉相关知识的专业人员,这意味着高企的人力成本。由于大模型在自然语言处理与生成、语音识别等面向领域的算法惊人进展,在人工智能的加持下,现场工作人员能直接用自然语言,让大模型生成代码操控机器人,因此与机器人的交互能够实现低代码,甚至无代码的人机协作。
同时,与传统的人机交互方式不同,操作者能够输入多模态指令(比如图片、文字与语言),并且通过多轮命令修正机器人的行动。
实际上,这也是科技巨头试图落地大模型的主要途径之一。谷歌在3月时,推出的PaLM-E着重用自然语言指挥机器人抓取米饼;阿里在4月时就透露,正在实验将千问大模型接入工业机器人,用自然语言远程指挥机器人工作,并且放出了工程师实际操作的视频。
2、视觉检测。业内人士表示,尽管图像识别是人工智能最主要的应用领域之一,但直到今年,AI+在机器视觉领域的应用有了革命性的进展。据其介绍,过去应用人工智能,他们需要大量的图片标注,各种各样的瑕疵样本,但还是会有从未见过的新瑕疵出现,无论是训练的算力、部署的时间或是需要的人力成本都非常高。
现在由于大模型的出现,他们只需要提供良品样本,就能在消耗极小的算力下,在更短的时间完成在产线上的部署。与此同理,相比目前普遍运用的技术,移动机器人在例如强光等室内外复杂场景下,识别周边环境以及避障能力也得到了提升。
3、具身智能。由于大模型的发展,机器人理解与处理多模态信息的能力也得到了空前提高。机器人作为一个多传感的集成设备,能够同时通过视觉、触觉等方式获取信息,因此在视觉识别出某个原料后,就能根据材质调整夹取的力度或者加工的动作。
值得一提的是,如果冷静地观察人工智能以及机器人行业的发展,其实会发现,工业机器人与人工智能的融合,已经有相当长的历程,许多企业也摸索出了多条落地的路径。
某家老牌机器人企业的负责人告诉高工移动机器人,他们早在2017年前后,就开始探索人工智能在移动机器人上的应用,那个时候做的还是比较简单的语言识别的人机交互,可以用自然语言命令某个机器人移动到某个地点,进行某个动作。
今年以来Chatgpt领衔的大模型狂潮,与其说是彻底改变了工业界应用人工智能的路径,不如说是让企业探索这些路径的速度更快,想象空间更大。
当然,这并不意味着大模型是个噱头,它确实革命性地提高了人工智能的部署、迭代与进化速度。
某机器人企业产品线负责人就表示:“举个例子,大模型让机器人具备意图分析的能力,这相比之前就有巨大的差距。以前,你要很精确地告诉它,它要具体做ABCD的动作。但现在的话,它能够识别意图,你告诉它AB它就会主要询问你是否要做CD动作。当能够识别操作者的意图后,就意味着我们能够用更少的关键词录入,更短的训练时间,机器人自己就能进行关联和分析,让人工智能自主来处理。”
过去多年的研发与实践经验积累,以及保障人工智能运作的数字基础设施的持续建设(例如边缘计算技术、数据库、大数据平台等)让工业界能够在大模型的崛起后,迅速拥抱新兴技术,或许可能成为人工智能大模型率先落地并获得收益的行业。
02
AI+工业时代为何还未到来?
尽管未来前景很美好,但大模型在工业界的落地之旅其实还是崎岖难行。
这主要出于三方面的原因:
1、目前大模型的研制还处于初步阶段,大部分企业无力进行探索。高工移动机器人发现,许多企业都认为大模型肯定在工业领域大有可为,也已经投入了人力物力进行研究,但他们都表示需要的成本太高,因此只能是巨头们的游戏,以目前中国机器人企业的实力,从底层开始构筑基础模型近乎不可能。“我们是不想搞吗?不是啊,我们太弱太小了,没办法啊!”
2、训练数据缺乏。众所周知,人工智能大模型需要大量数据训练,但在工业领域,许多企业的数字化改造还是非常初步的阶段,无法提供足够训练人工智能的数据。况且,工业界的数据是各个厂商非常核心的资源,不可能共享出来,更不可能开放供外部的大模型训练使用,因此人工智能无法发挥它的全部实力。
另一方面,制造业中的细分场景纷繁复杂也让企业难以提供足够的训练数据。即使是同一个细分赛道中,同一生产链条上也会有相差甚远的场景,它们产生的数据与对人工智能的需求也各不相同。
有企业负责人就曾说过:“制造业远看是个万亿级的市场,近看就是一万个亿级的赛道。”这也意味着,要么针对不同的场景收集不同的数据,要么就在不同场景使用同一个通用的大模型。但前者的成本太高,也不一定有足够的数据;后者则很难适配相差甚远的不同场景。
3、成本依然居高不下。工业领域对每项技术的首要衡量标准就是投入产出比,对成本的核算非常仔细。
抛去雇佣训练大模型所需要的工程师团队的人力成本,而大模型目前的训练成本依然很高,人工智能需要进行计算,那么就需要相应的硬件成本,每日维持还需要高额的算力成本,尽管没有一个精确的数字,但这是大部分企业无法承担的费用。以Openai为例,仅在Chatgpt上,他们每日就要烧70万美元维护,因此需要包括微软在内的巨头提供源源不断的融资输血,这是绝大部分企业无法做到的。
此外,目前业界对它的使用还处于初步阶段,大模型还没有表现出它在降本增效方面的能力。在大模型高昂的成本之下,产出却依然成谜。直白而言,人机交互、具身智能这些功能,到底能为企业节约多少钱?提高多少效率?目前来看,企业其实很难算清楚,因此,目前工业界对大模型的普遍态度,还是认为需要时间探索。
每一个使用过Chatgpt的人,都不会怀疑人工智能将引发下一波科技浪潮;每一个了解机器人的人,也必然相信工业界的终极形态应该是全自动的智能工厂。AI与机器人的共同点就在此,大家都相信它们是科技发展的彼岸,但如何跨过中间的鸿沟,还要多久才能跨越?这些都犹未可知。
但或许,我们离未来只有一步之遥。