本文来自中国电子报,作者/宋婧。
奔驰智能驾驶辅助系统
“Hey Mercedes(你好,奔驰),附近最适合游泳的海滩在哪里?”“你可以去这里游泳,晒日光浴或者冲浪。另外,你可以散步、野餐,或者只是放松和看书。如果你精力充沛,你还可以和朋友玩沙滩排球或者飞盘。无论你选择做什么,我希望你能玩得开心。”一段真实用户的体验视频揭开了搭载ChatGPT后奔驰AI智能语音助手的神秘面纱。
近日,ChatGPT掀起的大模型之火,蔓延到了智能汽车场景之中。梅赛德斯-奔驰和微软官宣正在合作测试车载ChatGPT人工智能,并将面向约90万车主开启测试。这是ChatGPT首次“上车”,标志着智能汽车领域的大模型之战正式开启。
智能汽车的“ChatGPT时刻”来了?
大模型将重构各行各业虽已成为业界共识,但ChatGPT“上车”远比预想中来得更快。作为继家庭和办公场所之外的“第三空间”,汽车正在变成一个新型智能终端。人车交互是汽车智能化的标签,而AI语音助手则成为了智能汽车的“标配”。
与普通的语音助手不同,奔驰的车载ChatGPT语音助手可以处理完整的对话,例如追问,并且能保持对前后文的理解。据悉,微软还在与梅赛德斯-奔驰探索ChatGPT的插件生态系统,为第三方服务集成开辟可能性。驾驶员未来有望通过车载系统就能完成预订餐厅、预定电影票等任务,进一步提高便利性和生产力。
大模型上车带来的不仅是AI语音助手的升级,还将推动智能驾驶技术的进阶。继奔驰搭载ChatGPT之后,理想汽车也发布了自研大模型MindGPT,宣布新一代理想汽车不再依赖高精地图的城市NOA产品,将做到接近人类司机的驾驶表现。业内专家分析称,大模型具备对海量数据的处理能力以及多维度分析能力,可以提供更精准、更全面的数据分析和预测能力,持续优化模型,提高智能驾驶的准确性和可靠性。
与此同时,车载操作系统正在被大模型重塑。近日,斑马智行第三代汽车AI能力体系Banma Co-Pilot在阿里通义千问大模型的赋能下,实现了AliOS车载操作系统的全面升级。开源证券研报指出,大模型时代,第三方科技巨头的加入有望通过提供强大工具链形成自动驾驶行业的“安卓”,帮助整车厂构建自己的自动驾驶算法和数据闭环系统,同时依靠大模型的数据生成能力,缩小与头部玩家在数据领域的差距。
接入大模型后的随心百变空间智能座舱演示
此外,大模型还将激起汽车产业的生产、研发模式的创新变革。理想汽车创始人李想举了这样一个例子:“过去我们一年要做大概1000万帧的自动驾驶图像的人工标定,所以我们请了很多外包公司进行标定,大概6元到8元钱一张,一年的成本接近一亿元,这仅仅是来做自动驾驶方面的图片标定。但是当我们使用大模型,通过训练的方式进行自动化标定,过去需要用一年做的事情基本上3个小时就能完成,效率是人的1000倍。”如何快速和汽车产业原有的知识体系相融合,如何与大模型的学习能力、泛化能力协同,形成更有效率的生产、研发方式,正在成为汽车产业接下来研究的核心课题。
可见,大模型正在从研发设计模式、人机交互、智能驾驶、用户生态等方方面面给整个汽车产业带来深刻影响,加速驱动产业生态的智能化、高效化、安全化和可持续发展。
国内汽车厂商围绕大模型展开多方探索
尽管奔驰与微软的合作被称作是ChatGPT在汽车领域的首个应用,但也有观点认为,奔驰实际上是赶了个“晚集”。在前不久的上海汽车展上,国内众多汽车厂商皆展示了大模型方面的布局。
“ChatGPT成功后,如今正向多应用生态发展,车企也想将GPT的热度引导到智能车联网领域。”浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林表示。从功能上来看,目前人工智能在汽车上主要有两种落地形式:一类是用于人工智能交流对话领域,多数应用在智能座舱,比如百度的文心一言,已有东风日产、红旗、长城等近十家车企宣布接入;上海车展期间,商汤科技亮相日日新Sensenova大模型,展示了其中文语言模型“商量SenseChat”以及“如影SenseAvatar”等与座舱的结合;此前阿里巴巴也宣布AliOS智能汽车操作系统已接入通义千问大模型进行测试等。
另一类是聚焦智能驾驶,比如毫末智行发布了自动驾驶生成式大模型DriveGPT,帮助解决认知决策问题,最终实现端到端的自动驾驶。理想汽车自研大模型MindGPT,摆脱对高精地图的依赖,让汽车做到更接近人类司机的驾驶表现。蔚来、小鹏、长城、奇瑞四家车企也已注册申请了多个与GPT相关的商标。
乘联会数据显示,2022全年我国销售新能源乘用车523.3万辆,其中智能汽车240.4万辆,占比45.94%。比亚迪、长安、岚图、问界等国内品牌已经走在智能汽车行业前列。
相较于通用型大模型,垂直领域的大模型训练和使用成本较低,或许会成为更容易实现商业落地的领域。业内人士分析称,汽车有着明确的交互需求,且相较于通用大模型,垂直领域的应用场景相对较小,对参数的量级要求也没有通用型AI那么大。因此,无论是传统汽车厂商、造车新势力,还是大模型科技厂商,普遍认为智能汽车最有可能成为率先实现大模型落地的B端场景。
大模型真正“上车”仍需时日
ChatGPT的首发“上车”已经拉开了智能汽车领域大模型之争的序幕,但需要指出的是,现阶段距离大模型真正落地汽车行业还有一段距离。
专家普遍认为,目前汽车领域对于大模型的应用仍处于初期的尝试阶段。对于想做大模型的汽车厂商而言,多模态数据的收集、处理、训练是一个难题。自动驾驶所需传感器数据包括激光雷达、毫米波雷达、超声波雷达,以及高清摄像头、GPS等。这些数据来自不同的坐标系,带有不同的触发时间戳,且要考虑到硬件损坏等问题;同时,需要大量的场景数据,比如交通标志线、交通流、行为模型等。这让汽车大模型的研发、训练门槛变得很高。
数据来源:汽车销量数据为上险数据,汽车之家研究院
中国工程院院士、清华大学教授、国家智能网联汽车创新中心首席科学家李克强指出,模型数据调动管理需要利用智能网联汽车以及计算技术平台、云控技术平台等平台,只有大量的数据汇聚才可做交叉,特别是垂直领域,这和娱乐系统、服务系统不一样,从产业互联网的角度来看,若基础云平台不能打通,很难实现向深层领域推进。
在加拿大工程研究院院士、人工智能与数字经济广东省实验室(深圳)执行主任于非看来,驾驶中有信息系统模型、思考模型、执行模型三部分,生成式的AI大模型意味着在知识方面和信息方面取得了突破,但并不意味着目前它能在汽车上执行,也就是控制层面取得突破。于非也认为,“车路人云”协同可以让行业产生大裂变,但要AI大模型发展对智能网联汽车发展产生突破性影响还需要时间。
地平线CTO黄畅认为,GPT在自动驾驶场景中最先应用的很可能是环境模型的预测和交互式规控和规划。“这个场景不需要特别的大规模参数模型,因为它不是一个完整的端到端闭环,尤其因为它更关注于预测和规划,不用花太多精力在感知这个层面上,因此很可能在百Tops级别的算力平台上就能应用,在3~5年内就可以初步上线。而从感知到定位地图到规控,整个端到端的闭环做出来,则需要一个更大规模的参数模型,大概需要5~10年的时间。”他说。
从部署方面看,大模型需要高规格的硬件配置,包含高性能计算能力、大容量内存和低时延等特点,但车载设备的硬件条件相对有限,无法提供足够的计算资源支撑大模型运行。例如在自然语言处理领域的GPT-3模型就需要数万亿Tops的计算能力。这要求芯片的算力至少要在万级Tops以上才能够胜任大型模型的计算任务。但是,在车载部署场景下,芯片的算力往往只有数百Tops,远远达不到大型模型的要求。
小鹏汽车和阿里云合建智算中心“扶摇”
智算中心被视为大模型落地汽车行业必不可少的基础设施。特斯拉发布了独立的云端智算中心——Dojo,总计使用了1.4万个英伟达的GPU来训练AI模型。小鹏汽车和阿里云合建了智算中心“扶摇”,专门用于自动驾驶模型训练,算力规模达600PFLOPS。毫末和火山引擎联合打造了国内自动驾驶行业最大的智算中心“雪湖·绿洲(MANA OASIS)”,每秒浮点运算可达67亿亿次。有业内人士呼吁,自动驾驶行业的大模型要成功,全自动驾驶行业的数据需要像互联网数据一样公开,这需要监管机构、行业参与者等共同推进。
此外,奥纬咨询董事合伙人张君毅表示,车企们争相独立布局大语言模型技术,技术资源和注意力容易被分散,由于基层算法人才的趋利流动和大算力GPU的分配,有可能会在一定程度上影响干扰自动驾驶的市场发展。产业链上下游应加强分工合作,避免“重复造轮子”。