本文来自微信公众号“CPS中安网”,作者/罗超。
3D所造,无限视界。
这是另一个视界,以前我们所说机器视觉,通常是指2D的视觉系统,即通过摄像头拍到一个平面的照片,然后通过图像分析或比对来识别物体,能看到物体一个平面上特征。
过于“平面”的2D机器视觉,在AI初探阶段和应用上半场,是主流也可发挥几大应用价值;而当转型深水区,痛点应用场景与深挖数据价值,就难以继任了。
专攻场景,那为了更加透明与彻底的“开眼看世界”,3D机器视觉,随即而至。
01.
3D机器视觉,入安防
而关于这一切,可追本溯源。
对于3D的AI机器,被大众所关注,还源于苹果公司2017年iPhone X中首次搭载3D结构光技术,其技术原理是通过近红外激光器向物体投射具有一定结构特征的光线,再由专门的红外摄像头进行采集获取物体的三维结构,通过运算对信息进行深入处理成像。
该技术经过多年轮转与进化,依然沿用至今,可见3D机器视觉技术,还是早晨七八点中的太阳,仍然升起中。
除了最为人所知的结构光技术,3D机器视觉另外两大技术方向是双目视觉、ToF(飞行时间法)。
之于安防,从平面到立体的视觉革命也可追溯,双目技术应用也在2017年左右,头部企业的双目摄像机初出茅庐,而发展至今连很多智能门禁产品也采用双目技术来增加视觉的立体感。
既然是安防行业应用最为成熟的3D机器视觉雏形,还是有必要介绍下,何为双目视觉。
它的原理就像我们人的两只眼睛,用两个视点观察同一景物,以获取在不同视角下的感知图像,然后通过三角测量原理计算图像的视差,来获取景物的三维信息。
这绝非1+1=2的两个摄像头简单堆料,而是从三维角度在视觉中的立体感知,所以,很多双目摄像机就仅仅只是多了个摄像头的视觉场景而已,这绝非本文探讨之处。
江河入海流,安防要流入AIoT汪洋大海,在机器视觉的征途,才万里长征第一步。
而接下来的一步,是着力提升图像视频类感知的深度和纬度,一改2D时代过于依赖于光照和颜色/灰度变化,提升测量精度易受变量照明条件制约能力,同时,让4K等超高清真正规模化,这是3D的擅长,在主动光技术、空间三维数据、背景分离等方面带来质变。
那随之而解的问题是,安防中的2D与3D场景应用,有何不同。
其一,是光线,2D摄像头在光线较暗的场景下成像质量非常差,尤其是需要附加类似智能分析的功能时,分析效率存在较大问题,会有很多错检、漏检,虽然会有红外光进行补充,但实际上在红外上做智能分析会缺失很多信息。
其二,是人体特征检测,2D只有XY这样的平面信息,缺乏深度数据,无法对目标进行精准定位与持续跟踪。
最后,目标重叠的时候,2D摄像头很难把分析目标从背景中分离出来。而且2D无法做活体检测,人脸识别中,如果没有3D的活体检测,很容易受到照片与视频的伪装攻击。
为此,3D机器视觉入安防,视界前所未见。
首先,3D是主动光技术,可以在完全无光照环境下正常的工作。在强光、逆光环境下也能达到较好成像效果。
第二,可以获取空间中的三维数据,包括尺寸测量,空间中人、车的位置,身高、体重、距离、速度等,都可以精准的计算出来。
另外还可以进行背景分离,实现实时的、动态的人体人像抠图,在进行智能分析时去除背景干扰,提高算法分析准确率。
还可以进行活体检测与识别,在家庭安防、车内安防等私密场景中,我们只需要一些深度信息,即可以实现这种安全监控与行为分析。
总之,人工智能的核心任务之一就是让机器能够像人一样感知世界、理解世界。
人类对于世界的理解主要依靠视觉,视觉信息占人脑处理信息比重高达85%,声音及其他感官占15%,处理视觉信息的神经元也在人脑中占面积最大。
并且,人眼是非常典型的三维相机,人脑处理的也是立体的视觉信息,正是由于人类具备立体视觉能力,在生物进化过程中才能躲避天敌、围捕打猎、使用工具等,实现与三维世界的准确交互。
要让机器像人一样,先要具备人眼一样的立体感知能力,还要有能够处理和理解三维信息的大脑算法,即三维全栈技术的相机和算法两个方面。
3D机器视觉,打开新的成长空间,开启另一个视界。
02.
一片蓝海,抢票市场“入场券”
心在桃园外,兀自笑春风,3D机器视觉以场景为靶心,技术能力的进阶之风将吹满地,看其市场,可谓“满城尽带黄金甲”。
一来,新基建的几年在疫情肆虐下,尽管AI科技向善,为战疫写下了浓墨重彩一笔,但3D机器视觉的应用却鲜而有之,这一市场,仍然是方兴未艾。
多年积压的市场痛点与刚需,在国家发布诸多利好政策下,推动3D机器视觉产业发展,同时工业制造智能化升级的市场需求旺盛,政策、需求“双动力”打开了3D机器视觉市场蓝海。
这一片蓝海,究竟有多大?据GGII数据预测,2025年中国机器视觉市场总规模将达到468.74亿元,其中2D视觉市场规模将超过360亿元。
数据还显示,2021年我国3D视觉市场增速超过100%,预计到2023年3D视觉市场规模将达到35亿元左右,到2025年3D机器视觉市场规模将超过100亿元。
从数据中可以看出,2D视觉技术仍是当下主流,但3D视觉技术则是未来趋势。
目前,金融支付、智能门锁、轨道交通、智能汽车等领域都对3D传感器以及3D算法有着极大的需求,保守估计已成千亿级蓝海市场。
海阔天空任鱼跃,尽管是市场蓝海,但谨慎者也不乏一众,认为3D机器视觉仍然处于长尾市场,需求还需培育中。
同时,算法的高山,还得再攀登。就像建筑一幢高楼,人们在感概华丽外壳的同时,更应该注意到它打下的牢固地基。目前市面上基于3D视觉的应用可千姿百态,而如何从“同质化”中获取独树一帜的体验,还得看核心功底,即背后的算法了。
03.
围捕打猎,场景争夺战一触即发
专攻赛道后,很多3D机器视觉厂家尽管先行一步,但后继者前仆后继,如围捕打猎,在场景之中,定胜负。
其实可以看到这一市场格局或现状,为客户创造价值,这仿佛是每家AI企业不变的企业愿景和努力方向,但真正做到的,却并不多,这也是很多AI企业光有技术却无场景落地的尴尬现状。
关于三维机器视觉在安防应用场景,从技术端可以从视频结构化和识别技术上突破,来反哺场景,实现技术价值。
以识别技术为例来看,3D机器视觉的这个三维不仅体现在数据收集上,在识别算法上,采用的也是针对三维数据的人脸识别算法,因此在准确率、安全性等方面都应提升。
作为苹果同源结构光技术,基于结构光能够保证在近距离情况下的极高精度,用于识别的三维深度感知技术在4K分辨率5米范围内,精度达到1mm误差,人脸重建精度保持在平均1.5mm以内,三维人像识别错误率可做到十亿分之一。可以将重建精度做到毫米级,且移动设备帧率达到40帧/秒。
这个精度,保证了可以动态采集并重建场景中的三维信息,同时提高对身份信息的采集和管控效率结构光深度感知、三维实时高精度重建、三维跟踪识别及感知等技术方向,再进一步。
当然,从应用端来看,智能所向往是安防业务从事后查证向事前预警前移的需求变化。
而行业逻辑是越是高清,越是数据量丰富与立体的感知,越能为最终智能决策与分析,提供最优感知源,这也是3D机器视觉可以破局之道。
在智能时代谁都不可能一肩担起,生态共创与共建,是放之四海而皆准的另一法则,征途不易,除了自身加强还得广结良友,与之为伴,一荣俱荣。
除了三维机器视觉的千万场景的遍地开花需要生态之力,在行业壁垒的破局中,也如此。
现阶段3D视觉行业的核心难点集中在产业链匹配并不完善,由于三维机器视觉仍属于较前沿的技术,供应链匹配上存在技术难度高、标准不统一等诸多问题,整合产业链是3D视觉产业化应用的必要路径。
3D视觉技术栈和产业链相比2D更长,3D视觉技术栈包括深度感知、三维重建和三维应用,每个环节都有较高的技术门槛,要做3D机器视觉全栈技术的企业,只能低作堰、浅淘滩。
归根结底,无限之界、无限视界,3D机器视觉场景争夺与排位赛,必然又是一次洗礼。远行至远方,每一步,都铿锵。