本文来自微信公众号“天翼智库”,作者/钱文胜、陈海龙。
随着多模态大模型发展,机器人产业将进入“具身智能”时代。具身智能使人形机器人成为通用服务机器人,将开创广阔的市场空间。
特斯拉引领人形机器人产业快速发展
特斯拉于2023年12月13日,发布了全新一代人形机器人Tesla Optimus Gen 2。和前代相比,Optimus Gen 2能够平稳地行走,步行速度比前代快了30%,同时它还能做一个90度左右的蹲下,11个自由度的手可以像人手一样操作,所有手指都具有触觉感应,能够灵巧拿捏鸡蛋等易碎物品。
在2021年8月AI Day上,马斯克官宣特斯拉人形机器人Tesla Bot,还只是几张PPT概念图,就连台上跳舞的亮相环节也是由穿着机器人套装的人完成。到第二年的AI Day 2022大会上,Optimus(擎天柱机器人)成了当天发布会的主角,无论是搬箱子、给植物浇花、还是在超级工厂里搬砖,Optimus都能干。到了2023年3月,Optimus再次迎来了史诗级进化,其中一个亮点是,Optimus从桌子上拿起了一个机械臂并将其固定到位,另一个Optimus则将其固定在仍在组装的第三个Optimus身上,执行任务敏捷且流畅。仅半年后,在9月份的AI Day上,Optimus不仅能够根据颜色对方块进行分类,还能自信地将双臂举在空中,用一条腿上摆出瑜伽姿势,展露出优异的平衡力和协调力。现在,Optimus Gen 2在运动和操作能力上已更加接近人类水平。Optimus的远景目标不仅仅是替代人类完成重复劳动、危险操作等任务,而是要成为一款通用服务机器人,融入到家庭、办公和商业等更复杂的场景中。国外还有波士顿动力、Engineered Arts、1X和东京大学等机构利用多模态大模型赋能,开展通用机器人研发测试及试用。
国内也有多个厂家已开展通用人形机器人研发展示及预售。达闼通用人形双足机器人“七仙女”小紫亮相2023世界机器人大会,支持实时接入达闼云端大脑,通过多模态大模型RobotGPT赋能,具备多模态融合感知、认知、决策和行为生成能力,以接近人类智慧的能力开展工作。2023年9月26日,傅利叶智能通用人形机器人GR-1开启预售,已具有较强的运动智能,可搭载通用或专用大模型,大幅提升认知智能,应对各类落地应用场景。国内还有小米、华为等公司也在研发通用人形机器人。
通用人形机器人带动产业链上游核心零部件快速发展。核心零部件包括电机、丝杠、伺服器、减速器、编码器、动力电池、专用芯片、传感器等;随着人形机器人功能的增加和性能的提升,对核心零部件提出了更高的要求;目前,国内企业在某些核心技术领域与国际先进水平相比还存在一些差距,参考国内企业在电动汽车产业中的发展路径可以看出,国内企业在技术研发成本和制造成本控制方面有明显优势;在政策扶持、资本市场推动和国内巨大市场需求驱动下,随着研发投入和生产规模的不断增大以及持续的技术创新,国内企业在人形机器人硬件技术上有望取得重大突破,在全球供应链中将逐渐占据更大的市场份额。
具身智能使人形机器人从专用升级到通用
在大模型之前,人形机器人属于专用设备,只能应用于某一场景,按照预设指令和规则执行相应动作。随着大模型的不断迭代升级,其泛化和涌现能力愈加强大,人形机器人在多模态大模型加持下,能够通过“感官”和肢体与物理世界不断交互,感知、学习和适应周围环境,做出行动和完成任务,成为具身智能机器人,其更接近人类自然智能,使人形机器人可应用于众多场景,成为通用服务机器人。当前,具身智能尚处于初级阶段,未来可像人一样与环境交互、感知、决策和完成复杂任务。
人形机器人从专用升级到通用,其体系架构也将从终端形态走向“云网端”形态,即“云大脑+5G网络+人形机器人终端”。“云大脑”包括多模态大模型、机器人元宇宙和机器人应用开发系统等。机器人元宇宙利用数字孪生技术构建物理世界实时数字化、极致真实的仿真环境,生产出数字孪生人形机器人工作数据,为人形机器人多模态大模型训练提供海量数据输入;机器人应用开发系统提供集成化的应用开发套件,帮助开发者实现低代码甚至零代码快速开发人形机器人应用。基于5G网络,利用虚拟骨干网(VBN)、5G网络切片等核心技术保障人形机器人终端与“云大脑”进行高速、安全、可靠的连接。人形机器人终端包括“小脑”和肢体,布放在服务场所,负责感知和服务,“小脑”与“大脑”高效协同,实施精细化行为控制,能够全身协同灵巧作业,为客户提供更智能、更高效的服务。
人形机器人未来应用场景广泛,市场规模巨大
随着大模型不断迭代升级、传感器和机器人技术不断进步,人形机器人的智能化水平和运动能力不断提升,将达到贴近真人水平;特斯拉入局人形机器人产业,凭借其电动车强大的软件技术和供应链能力,有望实现人形机器人制造成本明显下降。
人形机器人应用场景广泛。客户服务类场景:例如在酒店,人形机器人可以为顾客办理入住手续,回答常见问题,提供导向服务。医疗保健类场景:例如在医院,人形机器人可以给病人分发药物,帮助病人行走,监测病人基本健康状况。教育培训类场景:例如在学校,人形机器人可以协助教师进行语言教学,增加学生的参与度和兴趣。家庭服务类场景:人形机器人可以帮助打扫卫生、整理房间、照顾老人。紧急救援类场景:例如在受灾区,人形机器人可以穿过狭窄空间,定位生还者,甚至携带必要的药品或工具。娱乐行业类场景:例如在主题公园,人形机器人可以与游客互动,为他们提供导览,甚至表演节目。还有商品推销和展示类、军事用途类、太空探索类等场景。
人形机器人未来市场规模巨大。2022年马斯克预计,Optimus人形机器人将于3-5年内实现量产上市,最终数量将会达到百万级,而成本将降至2万美元左右;如果人形机器人和人的比例在2比1左右,那么人们对机器人的需求量可能是100亿至200亿个,远超电动车的数量。根据2023年5月GGII发布的报告预测,预计到2026年全球人形机器人在服务机器人中的渗透率有望达到3.5%,市场规模超20亿美元,到2030年全球市场规模有望突破200亿美元。根据艾瑞咨询,2022年中国智能机器人市场规模为76亿元,预计2027年市场规模将达到536亿元,2022-2027年CAGR有望达到47.9%。
人形机器人产业发展也将给电信运营商带来发展机会
从人形机器人体系架构可以看出,人形机器人产业发展对电信运营商的5G网络形成强依赖,对云资源也有明确需求,包括算力、云存储、云备份以及大数据资源等,特别是电信运营商云网融合的技术和运营优势能保障人形机器人终端与“云大脑”进行高速、安全、可靠的连接,更好为客户服务。电信运营商深耕行业及领域所积累的渠道资源优势和品牌优势也有望帮助人形机器人落地应用,推动人形机器人产业发展。