人形机器人 3D 视觉路线之争:激光雷达、双目和 3D - ToF 谁更胜一筹?

吴子鹏
在人形机器人的设计方案中,3D 视觉技术是实现环境感知与智能化决策的核心支撑之一。它能够助力人形机器人完成环境感知与建模、动态目标检测与跟踪、物体操作与精细控制等任务,显著提升人形机器人的安全性与鲁棒性。

本文来自微信公众号“电子发烧友网”,作者 | 吴子鹏。

电子发烧友网报道(文/吴子鹏)在人形机器人的设计方案中,3D视觉技术是实现环境感知与智能化决策的核心支撑之一。它能够助力人形机器人完成环境感知与建模、动态目标检测与跟踪、物体操作与精细控制等任务,显著提升人形机器人的安全性与鲁棒性。

相较于其他类型的传感器,3D视觉传感器具有精度高、信息量大、集成度高等诸多优势。浙商证券的研究指出,机器人视觉承担了80%的信息获取任务。相关预测数据显示,人形机器人3D视觉传感器的市场规模将从2025年的1.4亿元大幅增长至2030年的91.5亿元,复合年增长率(CAGR)高达132%。

3D视觉技术发展路线

当前,人形机器人的3D视觉技术路线主要围绕“如何获取3D信息”和“如何处理3D数据”展开,主要包含以下几类:

首先是多目立体视觉。其原理是通过多个相机模拟人眼视差,进而计算像素级深度图。该技术具有成本低、结构简单、适合中距离场景的优势。然而,多目立体视觉的计算复杂度较高,需要对左右图像特征进行匹配,并且在弱纹理或低光照环境下,精度会有所下降。目前,有相当一部分人形机器人采用多目3D视觉传感器,例如优必选的Walker X、普渡科技的PUDU D9等。

其次是激光雷达,也被称为激光雷达的可视化技术,它利用激光雷达进行高精度三维重建。基于激光雷达和视觉的SLAM技术分别被称为激光SLAM和视觉VSLAM。激光SLAM又因传感器应用不同,分为单线(2D)和多线(3D)激光雷达两种。3D SLAM使用多线激光雷达获取环境三维数据,并通过三维数据的特征点匹配进行定位。三维动态成像能够精确知晓物体的形状和大小,对环境信息的还原度极高。不过,3D激光雷达的成本普遍较高,多用于工业或高端场景。

第三种是结构光(Structured Light)。其原理是将已知图案(如条纹、格雷码)投射到物体表面,通过畸变图案恢复3D形状。结构光具有高精度(亚毫米级)、高分辨率的优势,适合近距离(0.1-2米)物体重建,在近距离精度方面表现出色,适用于物体识别与交互场景。但它受环境光干扰较大,在户外场景中的效果欠佳,且硬件体积相对较大。

第四种是飞行时间法(ToF),通过测量光脉冲往返时间来计算距离,分为间接(iToF)和直接(dToF)两种,小米、波士顿动力等采用了此技术。ToF具有实时性强(帧率可达100Hz以上)、抗干扰能力强(主动发光)的特点,适合动态场景。然而,ToF的精度会随着距离的增大而降低,并且容易受到多路径反射的影响。目前,许多人形机器人在实时避障、手势识别等方面采用ToF方案。

第五类是单目视觉与深度学习结合。通过单目相机采集2D图像,利用深度学习模型(如DepthNet、MonoDepth)估计深度。这种方式的优点是成本极低(仅需单相机),并且可以通过大数据训练适应复杂场景。但它的缺点也十分明显,深度估计依赖先验知识,在遮挡区域或无纹理区域容易出错,需要进行后处理优化,比较适合教育类场景中对轻量化有需求的人形机器人。

当然,在目前的人形机器人中,3D视觉基本不是依靠某一种技术来实现的,多传感器融合是最为常见的方式。结合多种技术,如双目RGB+结构光、ToF+多目视觉、激光雷达+单目、激光雷达+多目等,以平衡精度与成本,同时提升在复杂场景中的鲁棒性。

国内3D视觉方案代表性厂商

当前,3D视觉正步入高速发展阶段,在消费电子、生物识别、机器人和汽车等众多领域得到广泛应用。人形机器人则是另一个极具潜力的应用场景。根据《人形机器人产业研究报告》,预计2025年中国人形机器人市场规模约为53亿元,同比2024年实现翻倍增长;到2029年,中国人形机器人市场规模或将达到750亿元,占世界总量的32.7%,比例位居世界第一;到2035年,有望达到3000亿元规模。

目前,国内已经形成了较为完备的3D视觉传感器产业链。上游主要提供各类3D视觉传感器的硬件,包括感光芯片等核心元器件,具有较强的定制化、专用化需求;中游是3D视觉感知方案商,基于深度引擎算法,结合具体应用进行3D视觉传感器的方案设计;下游是各类终端开发者,根据中游提供的方案,开发出相应的应用算法方案。同时,国内也涌现出一批具有代表性的3D视觉方案公司,如奥比中光、天准科技等。

奥比中光作为全球领先的3D视觉感知技术企业,构建了覆盖结构光、双目、iToF、dToF、激光雷达(LiDAR)、工业三维测量六大技术路线的全栈式解决方案。其产品广泛应用于服务机器人、工业检测、3D扫描、刷脸支付等领域,服务全球超1000家客户,在中国服务机器人3D视觉传感器市场占有率超过70%。该公司也被誉为国内“3D视觉第一股”,在全球率先完成具身智能机器人视觉的核心技术布局。

华捷艾米作为国内3D视觉感知领域的先行者,其技术路线和产品方案深度融合了结构光、自研芯片与AI算法,形成了覆盖消费电子、智能家居、教育交互等场景的完整生态。华捷艾米的核心技术围绕单目结构光展开,通过自主研发的激光发射芯片、衍射光学元件(DOE)及深度算法,实现高精度3D感知。

天准科技是国内工业视觉装备领域的领军企业,其3D视觉传感方案以高精度、高可靠性为核心优势,深度融合光学设计、AI算法与精密制造技术,形成了覆盖半导体检测、工业自动化、消费电子、新能源等领域的完整解决方案。

此外,国内较为知名的3D视觉方案公司还有华睿科技、光鉴科技、深视智能、安思疆科技、驭光科技、灵明光子、禾赛科技、知微传感和速腾聚创等。

结语

综上所述,人形机器人的3D视觉技术路线各有优劣。多目立体视觉、激光雷达、结构光、飞行时间法(ToF)以及单目视觉与深度学习结合等技术,在精度、成本、场景适应性等方面各有特点,而多传感器融合正逐渐成为平衡性能与需求的主流选择。随着人形机器人市场规模从2025年的53亿元向2035年3000亿元的宏伟目标迈进,3D视觉作为核心感知技术,不仅要在技术创新上突破精度、实时性与环境鲁棒性的瓶颈,更需在成本优化方面加速推进,以满足消费级场景的规模化需求。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论