智元机器人研究院执行院长、智元具身智能事业部总裁姚卯青:人形机器人赛道宽到不用“卷”

产业对人形机器人的需求实际上是非常旺盛的,例如在比亚迪这样的头部车企,产线的工人大概有60万,大部分从事柔性的装配工作。其实也不仅是车企,3C电子制造厂商也有同样的需求。

本文来自微信公众号“中国电子报”,【作者】王伟。

编者按:2022年横空出世的ChatGPT极大加速了具身智能和人形机器人产业发展,明星企业如雨后春笋般涌现,智元机器人就是其中之一。成立仅6个月就发布首款人形机器人、率先达成1000台机器人量产、开源百万真实机器人数据集……智元机器人的发展速度惊人。

近日,《中国电子报》常务副总编连晓东与智元机器人研究院执行院长、具身业务部总裁姚卯青,围绕智元人形机器人发展规划、开源生态建设、人才教育培养等话题展开深度对话。

微信图片_20250304145435.jpg

对话人:

智元机器人研究院执行院长、具身业务部总裁姚卯青

《中国电子报》常务副总编连晓东

时间:2025年2月20日

地点:上海智元新创技术有限公司

明年头部人形机器人企业量产能力可达10万台

连晓东:能否介绍一下智元的人形机器人产品和生产情况?

姚卯青:智元成立于2023年2月,马上就到我们两岁生日。

公司成立同年就推出第一代的原型样机,也就是远征A1。2024年是智元的量产元年,我们的机器人开始实现量产并对客户发货,在2025年1月,我们的具身智能机器人已经实现了1000台下线的规模,其中大概有700台出货给了客户。

目前公司会有三条主打产品线,分别是远征、Genie和灵犀;远征主要是面对商用场景的双足人形机器人远征A1、A2系列;Genie主要是面向通用具身操作的轮式双臂机器人G1,以及一条用于拓展家用场景的小型人形机器人灵犀产品线;灵犀产品线目前已经发布了一款X1,预计会在下半年发布一款面向机器人发烧友的产品X2。

我们位于上海自贸区临港的智元机器人制造工厂已于2024年10月投产,还计划在上海张江建设年产能在1万台左右的人形机器人的二期工厂。

连晓东:听说智元这些产品线分布在中国不同地区?为何这样考虑?

姚卯青:目前双足式人形机器人和轮式双臂人形机器人在上海,规划中灵犀小型机器人业务在深圳落地会比较多。

因为上海ToB的基因会强一些,这两款机器人主攻ToB市场;灵犀机器人是成本比较低的、ToC端的产品线,更适合在珠三角这样消费电子制造基础、大规模控制成本能力会更加突出的地方落地。

连晓东:从创立至今有这样的建线、量产、出新(品)速度,应该说是非常难得的,你们内部认为,智元如此快速发展的原因有哪些?

姚卯青:从自身的角度,智元汇聚了一批非常有干劲、有想法、有目标的伙伴,大家以人形机器人量产为目标,非常努力地工作。同时我们的团队又集结了汽车、通信、消费电子等多个行业的精英,这种人才的优化组合,加速了机器人量产的实现。因为机器人最终的规模化量产,不仅需要有好的设计、研发,还需要强大的供应链管理、生产制造规划和质量检测等各种能力。

从市场的角度,我们认为整个人形机器人产业发展已经进入到加速发展阶段。我们也看到在近日召开的民营企业座谈会上,人形机器人的优秀友商也坐到了前排,我们这些从业者也备受鼓舞,坚信未来产业将会加速向前发展。

连晓东:智元在成立之初就确定了做人形机器人吗?您怎么预判人形机器人市场近年的发展速度?

姚卯青:是的,我们的使命就是以智能机器创造无限生产力,公司的愿景是成为智能机器人全球领军企业,开创通用机器人生态。

我认为2025年头部的人形机器人企业可能会达到万台出货量级别,2026年单一厂家的量产会达到10万台这样的规模。

连晓东:产业很多声音认为2025年是人形机器人量产元年,您怎么看?

姚卯青:就像前面介绍的,对智元来说,2024年是人形机器人量产元年,我们希望2025年是大规模商用元年。

连晓东:我们的产线建设是否能够匹配上明年的10万台量级?

姚卯青:我们正在以此为目标推进建厂计划,除了已有位于上海临港的生产制造工厂,我们还计划在上海布局更多的产线。同时,智元不同的产品线还会有一些合作的生产伙伴去推进生产,这不是一种简单的代工关系,而是更深度的合作。智元会负责规划整个生产工艺SOP、质量规划、测试标准、供应链等。智元负责生产制造的同事来自国内头部的消费电子厂商,具有丰富的生产制造和供应链经验,也可以为目标出货量保驾护航。

微信图片_20250304145445.png

智元远征机器人系列

中国发展机器人供应链优势极强

连晓东:您认为现阶段中国的人形机器人跟国外先进的人形机器人,如特斯拉的擎天柱相比,是否有差距?

姚卯青:我认为没什么差距。因为特斯拉的人形机器人供应链也离不开中国企业的支持。

如果要实现马斯克所说的一个人形机器人2万美金,约合人民币15万元的成本,就必须依靠中国的供应链体系,这是毋庸置疑的。而且特斯拉新能源汽车量产成功也已经证明了中国供应链的实力。特斯拉的高速发展离不开中国完备的新能源汽车供应链和现代化生产制造体系。

连晓东:从全球的角度来看,人形机器人的供应链是不是一定要依靠中国?

姚卯青:对的,我觉得中国供应链的优势有两方面,一方面是成本,另一方面是机电一体的高新技术、机器人的关节模组的研发和生产制造能力一流。

从全球的角度来看,东南亚的人力成本已经远远低于中国,但是他们在高端制造业产业基础和人才方面依然存在发展短板。

连晓东:智元的供应链国产化率情况怎样?

姚卯青:我们的上游供应链企业绝大部分是国内企业,极少数的芯片来自国外供应商,同时我们也在积极地丰富自己的供应商体系。

连晓东:高端芯片的缺口主要体现在哪些部分?

姚卯青:就人形机器人领域来说,高端芯片主要涉及两个方面,一方面是训练端,在云端服务器上面去训练大模型的芯片,这方面英伟达的护城河优势还是比较突出的。另一方面是在边缘侧机器人本体上做本地推理训练的芯片,这方面英伟达的边缘侧新品价格还是比较高的,我们也在积极寻找更经济的一些方案。随着当前新能源汽车自动驾驶方案和产品的成熟,地平线、黑芝麻等国产高阶智驾芯片供应商、“蔚小理”等汽车厂商自研了芯片,500T算力就已经可以很好地支撑人形机器人边缘侧的推理运算了。

随着机器人产业的不断发展,也会有更加完美适配机器人的芯片产品应运而生。

汽车和机器人对于芯片功耗方面没有那么强的需求,因此十几纳米制程的芯片产品用在机器人身上也是没有问题的。

人形机器人产业足够大到“卷”不起来

连晓东:当前人形机器人是否与10年前的新能源汽车发展情况类似?

姚卯青:我原来在新能源汽车从业。确实,我觉得这个领域比较像10年前的自动驾驶和新能源汽车,都是想象力非常大的赛道。

但是,我觉得机器人可能比新能源汽车的市场规模更大。马斯克也说过,特斯拉将成为一个30万亿美元市值的公司,其中5万亿是来自电车,剩下25万亿都是来自人形机器人。

因为在未来世界中,人与人形机器人的比例将是1:2——两个机器人服侍一个人。人形机器人可以应用于360行,是一个非常大的蓝海市场。

在这个蓝海市场中,大家甚至都可能卷不起来,因为这个赛道太宽了,大家都只能去吃其中很小的一块。

比起新能源汽车当前激烈的价格战和产品同质化来说,人形机器人还处于非常良性的阶段。我认为我们真正的挑战和对手甚至还没出现。

当然,我相信未来智元会迎接更多强有力的竞争对手的挑战,比如入局人形机器人的一些车企等,它们不仅有人才和资金储备,也有非常完整的供应链管理和大规模制造能力。

在目前这个时间窗口,智元希望能够快速形成“规模效应”,建立和不断优化供应链管理和生产体系,广招更多人才,一起去迎接人形机器人爆发的拐点时刻。

连晓东:在成立两周年的时间节点,智元对未来5~10年是如何规划的?

姚卯青:未来5~10年,在机器人产量方面,智元希望能够逐步实现一年量产1万台、10万台和100万台人形机器人的目标。

在场景方面,能够不断地精进机器人大模型的效果,能够在2025年和2026年实现在真实场景的落地甚至规模化落地——人形机器人能够在真实工厂产线上代替人类去7×24小时不停工作,作业成功率、投资回报比都被客户接受和认可,而且客户愿意为此付费。

连晓东:您所负责的智元机器人研究院职责是什么?

姚卯青:目前智元机器人研究院除了推动公司机器人产品化,也承担了一些技术摸高的工作,确保智元能够始终保持在人形机器人全球第一梯队。

例如去年,我们开源了汇集百万真实机器人数据的开源数据集——AgiBot World。我们还会在2月下旬发布AgiBot Digital World,它是一款专为机器人操作技能研究与应用设计的仿真框架,这可以说是全球第一个基于大规模、高质量自有数据,基于自主机器人本体训练出来的第一个机器人底座模型,目前即使是特斯拉、Figure等全球一流的人形机器人公司也没有做到。

连晓东:国内人才是否能够满足人形机器人企业的需求?你对于高校培养人形机器人人才有哪些建议?

姚卯青:我自己在美国工作了十几年,与很多优秀的AI工程师接触并共事。我认为在AI工程师相关领域,国内新一代高校毕业生的业务水平甚至高于硅谷的一线工程师,但是塔尖人才方面硅谷的密度会更高一些,今年DeepSeek公司的成功也说明中国拥有全球顶尖的AI人才。

智元一直在补强技术队伍,对于关键岗位的高端人才还是非常渴望的。作为用工企业,我们希望高校在教材和课程设置上面能够更加与时俱进,因为AI行业发展日新月异,教材和课程也要紧跟行业发展脚步,快速更新迭代。

将持续推动人形机器人数据开源生态建设

连晓东:智元成立以来推动了一系列开源计划,丰富了全球具身智能开源资源,智元成立之初就决定要做开源生态吗?还是且行且看?

姚卯青:我们在成立具身业务的时候就已经确定了做大规模数据驱动的大模型,这一路径已经在人工智能行业被充分证明了。Scaling Law在具身智能领域也会一直延续——数据量越大、计算量越大,训练模型的效果也会越好。

我们坚定了这种用数据驱动、端到端的机器人控制的路线,但是目前全球并没有这样一个大规模数据集可以用来训练大模型,所以我们要将智元的数据集开源推向行业。因为我们坚信,就像人工智能的成功,人形机器人的成功也一定是基于开源开放的生态体系。在人工智能领域,数据是开源的,社区的论文是免费的,代码是可以复现的,开放的生态推动了整个行业的快速发展。这也是人工智能比其他传统行业、研究科学发展更快的根本原因。

我们坚持具身智能机器人领域的开源,是我们相信不是所有的创新点都发生在智元。全球有那么多聪明的人、厉害的高校和研究机构,一定要汇聚全球的力量推动行业的发展。

连晓东:未来理想的具身智能机器人数据池应该是怎样的?

姚卯青:未来的具身智能机器人数据池应该是一个全球机构来贡献的大池子,这个池子形成的过程中需要大家相互磨合、配合,也要形成一套相应的数据格式标准和质量标准,这样数据的通用性和复用性才能够得到保障。

连晓东:这一标准是否会出现先到先得、体量越大越有话语权的情况?

姚卯青:有这样的可能。但是数据需要的是一个事实标准,数据的质量高低需要经过实践检验。

我们在数据开源的实践过程中,也得到了很多用户的反馈信息,比如哪些部分还需要提升,还需要扩充和丰富。数据在质量上还是有需要解决的问题。我们也会根据开源社区用户的反馈来不断提升数据采集过程中软硬件的问题,比如运营流程、审核规范等很多方面的问题。因此,我们的数据质量也是在不断提升的。

微信图片_20250304145447.jpg

工程师在训练机器人将衣服放入衣柜

连晓东:从这个角度来看,数据集生态建设应该有更多公司参与和赋能?

姚卯青:是的,肯定是希望大家都能来赋能,但是企业也需要探索和实现一些商业模式的创新。

例如,可以在真实场景中引入一些半自动化半人工远程遥控操作的方式,我们也在探索在海外更低成本的区域,使用远程非视距的遥控操作的形式降低人力成本。

我们用人和机器结合的方式完成实际有价值的动作场景,数据可以持续训练模型不断精进,最后人和机器人的作业混合比例会不断上升,最终目的是达到接近100%的机器自主执行的水平。

连晓东:在人形机器人数据集方面,中国是否会成为贡献率最大的国家?

姚卯青:是的,因为机器人行业有两个比较大的成本,一个是机器人本体的成本,目前中国完备的供应链已经可以将本体的成本控制到非常低,像马斯克所说的2万美元的成本,中国的供应链已经完全可以做到了,这并不是一个将来的目标。

其次就是机器人数据采集环节,数据采集员每天的薪资成本,目前中美之间还有近10倍的差距。在数据采集方面的成本,未来还有可能通过遥控操作等技术手段,进一步降低至目前的三分之一。

此外,从AI语料的角度来看,虽然语言是有区别的,但是机器人姿势和动作是无国界,是共通的。

连晓东:智元的数据会一直开源下去吗?

姚卯青:我们会一直开源下去的。一方面,贡献开源数据对行业是一个有力的推动。另一方面,在商业运营方面,这也是一个听到市场和开发者反馈声音的渠道。

更进一步来讲,数据也是我们生态的一部分,我们非常希望使用智元开源数据训练模型的用户,也能够使用我们的机器人本体来做测试和部署。

AI为人形机器人带来无限可能

连晓东:是否可以说近两年人形机器人、具身智能的快速发展是AI跨越式发展的伴生现象?

姚卯青:是的,具身智能技术的爆发以及投资热潮都是发生在2023年下半年,这也是基于ChatGPT的横空出世。人们看到了AI无论是从理论上、实践上都可以超越人类的智慧,那么人工智能是不是也可以进入工厂完成一些简单的任务。

在2023年,谷歌与柏林工业大学联合推出了一个名为PaLM-E的多模态具象化视觉语言模型(VLM),模型的参数规模达到了5000多亿个,里面集成了用于控制机器人的视觉与语言,可以很好地完成3D空间的理解、感知和规划。谷歌随后又接连发布了RT2和RT-X,在PaLM-E的基础上更上一层楼。

谷歌的大模型发布后,我们也看到很多具身智能创业团队先后成立,资本市场也开始逐渐加温。

连晓东:那么,DeepSeek的成功对人形机器人产业发展是否产生影响?

姚卯青:DeepSeek给中国AI相关产业从业者很强的信心,中国AI企业也可以在有优势成本前提下实现全球领先的技术。DeepSeek的成功也证明中国本土有很优秀的人才队伍,他们具备非常强的工程化思维和能力,可以做出惊艳全球的AI产品。

在机器人方面,DeepSeek在工程和算法方面有很多值得我们借鉴的东西,例如如何利用强化学习实现这种高阶的推理能力,这对于将来机器人大脑做任务时对一些规划环境的理解有很大帮助。同时DeepSeek作为一个开源模型也会成为我们训练机器人模型的很好的选项。

连晓东:机器人在自动化领域已经应用很久,人形机器人或具身智能带来的最大的改变是什么?

姚卯青:具身智能与上一代的工业自动化是完全不一样的。

工业自动化可以智能地完成特别固定、明确的任务,比如在流水线上把某个零件从A点移动到B点,是一个开环控制,它在执行任务的过程中没有任何反馈和调整,相当于闭着眼睛完成抓取动作,无论是移动的位置还是速度都是通过程序设定好,用一行行代码来控制的。

具身智能更多强调的是一种反馈式的闭环控制,它是可以在执行任务的时候实时调整自己去规划,甚至具备在出错的情况下去纠错和重新规划的能力。具身智能展现出一种很强的推理规划和柔性的能力,可以执行比较复杂的任务,例如拼搭乐高积木等。

连晓东:所以,人形机器人最先实现的规模化落地会是在工业场景吗?

姚卯青:对,任何事物的发展需要一个渐进式过程,从工业场景到家庭场景,是需要一步步去落地的。人形机器人的落地将是从工业到商业服务业这种半结构化场景,最终走向家庭的特定场景,例如厨房场景,最后才是在泛化的家庭场景大规模落地。

因为对于人形机器人来说,工业场景的任务非常明确,环境也相对结构化,更容易实现大规模落地。但是,人形机器人最终还是要走入家庭场景。世界上每个家庭都不一样,大小环境陈设都不同,用户给的任务也不明确,那么人形机器人必须达到和人一样灵活的身体、聪明的大脑才能完全胜任这些家庭场景的工作。

连晓东:目前工业界对人形机器人的需求大吗?

姚卯青:产业对人形机器人的需求实际上是非常旺盛的,例如在比亚迪这样的头部车企,产线的工人大概有60万,大部分从事柔性的装配工作。其实也不仅是车企,3C电子制造厂商也有同样的需求。

一方面上述产线工作是工业自动化无法完成的,另一方面确实存在招工困难的情况,年轻人不愿意从事这种枯燥、重复性的工作,人形机器人就是一个很好的替代人力的方案。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论