引言:智能网联汽车四大核心技术——芯片、操作系统、算法、数据共同形成生态闭环,其中,芯片是智能网联汽车生态发展的基石,算力提升是新一代汽车发展的核心方向。因此,在汽车产业快速变革的时代,如何实现软件定义算力、算力定义汽车是产业高速发展中需要思考的重点。
汽车产业发展现状
汽车产业已经进入存量博弈时代,智能网联和自动驾驶技术成为其发展新变量。
自2014年以来,中国汽车产业开始进入中低速增长的发展阶段。2017年中国品牌乘用车销量达到1084.7万辆,成为近十年来的阶段性顶峰,自此以后连续三年下降,意味着中国汽车产业已经进入存量博弈时代。在这一关键竞争节点,汽车领域的变革也随之而来。而2021年的销量反弹,正是由于新能源汽车的爆发式增长。
随着近几年国家对新能源汽车的大力推广,汽车产业逐渐从油气时代转变为电动时代,而汽车智能化、网联化成为下一个历史性发展机遇。软件定义汽车的趋势愈发明确,汽车的功能属性和定义范围持续扩大,具备通用计算平台和内容休闲服务特征,成为第三移动空间。自动驾驶技术能够将驾驶员从繁琐的驾驶操作中解放出来,满足上述趋势变化需求,成为汽车智能化的核心环节。
于是,自动驾驶技术成为汽车产业发展新变量,整车厂、出行运营平台以及各大科技公司与新兴独角兽企业纷纷抢滩自动驾驶赛道,它们从自动驾驶各大细分领域中寻找机会,从Robotaxi到港口货运,从干线物流到无人配送,近几年都有着突飞猛进的发展,展现了自动驾驶未来的想象空间。目前,自动驾驶正处于从技术路线到落地场景、从合作模式到行业生态、从初级发展阶段向高速发展阶段过渡的过程中。
自动驾驶与AI算力
智能化自动驾驶汽车是人工智能技术落地的最大应用场景之一,智能化汽车很有可能成为未来万物互联的终端,成为继智能手机之后,深刻改变社会形态的产品,软件定义汽车成为未来发展的趋势。
从AI角度来看,算力、算法、数据采集及用户数据是决定AI发展能力的关键因素,对应于自动驾驶,具体为AI芯片、决策软件、传感器、用户数据等,对于实现完全的无人驾驶同样高度依赖于这四个基本要素,并且缺一不可。而其中算力能力的倍增速度,关系着车载端和数据中心端核心基础能力对自动驾驶技术发展和突破的支撑力度。
自动驾驶研发的每一个阶段几乎都要涉及到AI深度学习算法和算力的参与,机器视觉,深度学习,增强学习、传感器技术等均在自动驾驶领域发挥着重要的作用,自动驾驶发展的瓶颈主要在于这些AI底层技术和AI算力发展水平上能否实现突破。
特别是计算机视觉领域,是自动驾驶最重要、使用最频繁的AI技术,计算机视觉技术水平关系着自动驾驶整体水平的提升速度,而计算机视觉算法又对算力能力提出了很高的要求,为了迭代出更准确的算法,用户需要对每天的路测数据进行处理,对自动驾驶模型反复训练优化,这些大量验证测试的工作,都需要大量算力资源在背后支撑。而业界目前对昂贵的算力资源的管理,缺乏一套行之有效的解决方案,这成为每个车企或自动驾驶公司都亟待解决的难题。
趋动科技OrionX猎户座AI算力资源池化解决方案
趋动科技OrionX AI算力资源池化解决方案,为汽车和自动驾驶行业客户带来创新的GPU资源管理和分配方案,引入软件定义算力概念,将OrionX软件部署在多台不同类型的GPU服务器上,通过网络互联,构建了一个统一的GPU资源池化层,实现了GPU资源的统一调度、灵活分配、弹性伸缩等云化能力,为上层应用提供强大而灵活的GPU算力资源。
趋动科技GEMINI双子座AI训练平台解决方案
趋动科技GEMINI双子座AI训练平台,提供强大的AI资源管理服务以及高效的算法开发和训练支持,能够化繁为简,帮助车企和自动驾驶企业建好AI平台、管好AI资源、用好AI服务,能够满足汽车和自动驾驶行业客户对一站式AI平台解决方案的诉求。
趋动科技自动驾驶行业落地案例
落地案例1:AI开发测试环境解决方案
项目背景:
某头部自动驾驶公司A,有大量AI算法工程师需要环境进行AI图像识别技术开发测试工作,因此会消耗大量的GPU资源,这对自动驾驶公司数据中心平台管理和运维都提出了很高的要求。
客户痛点:
由于公司发展迅速,参与到自动驾驶算法开发团队众多,每个算法工程师都需要申请独立GPU资源来完成算法开发工作。但是由于算法开发工程师不会100%时间使用GPU,从而造成了大量GPU资源高占用、低消耗的情况,从实际统计来看,GPU资源峰值使用量不到30%,所以客户希望通过GPU资源池化技术,提升资源利用率。
使用趋动科技解决方案后客户收益:
趋动科技通过OrionX AI算力资源池化解决方案为客户构建自动驾驶数据中心GPU动态资源池。在采用OrionX软件之前,客户的每位算法工程师都会被分配一张或几张独占的物理GPU卡。在采用OrionX软件之后,每位算法工程师仍然会被分配一张或几张虚拟GPU卡,这些虚拟GPU卡在算法工程师看来还是“独占”的,这样算法工程师的工作方式和体验并没有改变。但是在算法工程师真正开始运行代码之前,OrionX软件并不会为算法工程师预留任何物理GPU资源。只有在算法工程师开始运行代码后,OrionX软件才会自动从资源池中为其分配物理GPU资源,等代码运行完成后,这些物理GPU资源又会被自动回收到资源池中。这样借助OrionX软件按需分配、灵活调度、动态挂载和释放等能力,就可以实现使用少量物理GPU资源支撑大量算法工程师对独立开发环境的需求,打破一人一卡占用造成利用率极低问题,即便不切分GPU仍然能显著提升GPU利用率,某些场景适度切分GPU后整体利用率还能够继续提升;
通过OrionX远程调用+RDMA网络能力,使AI开发环境不再局限在某一台GPU服务器上运行,而是在集群中任意一台服务器(即使是CPU服务器)都能实现对GPU资源的调用能力,GPU资源池的灵活度大幅提升,减少GPU资源消耗,利用率提升3倍以上;
打造统一GPU资源池,统一图形化管理,统一资源调度分配。通过OrionX的GUI界面实时监控GPU资源使用情况,有效辅助运维工程师管理GPU集群。
落地案例2:AI开发训练平台解决方案
项目背景:
某头部自动驾驶公司B,致力于打造无人驾驶核心大脑的软硬件一体化系统,自主研发面向L4/L5级别无人驾驶全栈解决方案。随着业务发展、团队扩展,硬件资源也在快速积累,目前对GPU资源提出了更高的平台侧管理要求。
客户痛点:
该公司早期专注于算法研发,缺乏管理平台,随着企业快速发展扩张,算法工程师人数和资源需求都在成倍增长,对平台层和运维侧工作提出了很高的要求,但由于运维团队人力有限,基于物理机/卡的资源管理越发困难,整体集群利用率低,无统一监控告警规则,所以希望建设一个基于云原生的具备完整AI开发训练能力的管理平台,帮助团队高效完成AI开发训练和资源运维管理工作。
使用趋动科技解决方案后客户收益:
趋动科技Gemini AI开发训练平台是集成AI开发、训练、运维的一体化管理解决方案,能够帮助客户完成CPU、物理GPU、OrionX vGPU和存储资源的统一纳管和统一分配。因其与OrionX深度整合,所以Gemini AI训练平台在简化运维工作的同时,还能大幅提升GPU利用率。
深度整合的算法开发环境与离线模型训练环境,代码开发完成后一键提交,简单易用,避免中间迁移出错。
平台实现AI任务所需数据、镜像、代码的集中管理,方便数据复用和分享,在保障算法工程师高效协同的同时,兼顾了企业的信息安全保障。
具备完善的平台账户管理、权限管理、配额管理能力,配合丰富的可视化监控视图,方便运维工程师实现高效清晰的运维管理工作。
支持AI分布式多机多卡训练,让AI训练任务不受单节点GPU数量限制,加速自动驾驶AI训练结果输出。
总结
软件定义算力,算力定义汽车。这句话在5年前听起来还遥不可及,但是近几年智能网联汽车的大规模落地、自动驾驶技术快速发展,算力定义汽车已成为主流。随着算力成为汽车行业发展的核心要素,软件定义算力的重要性就体现出来了——统一的算力资源池化平台能满足算力资源的灵活分配和调度,在大幅提升资源利用率的同时降低TCO,赋能汽车行业的智能化升级。趋动科技基于自身技术优势为车企和自动驾驶企业提供优质的算力资源池化平台解决方案,助力汽车产业再次腾飞。
关于趋动科技
趋动科技于2019年成立于北京中关村高新技术园区,拥有专业的研发、运营和服务团队,被评WISE2020「新基建创业榜」最具成长性创业公司TOP20、「REAL 100创新家」、「2021创业邦100未来独角兽」、「投中2021年度中国人工智能与大数据产业最佳投资案例Top10」等。趋动科技专注于为企业用户构建数据中心级AI算力资源池和AI开发平台,趋动科技的OrionX猎户座AI算力资源池化软件能够帮助用户提高资源利用率和降低TCO,提高算法工程师的工作效率。趋动科技的双子座GEMINI AI训练平台,为客户提供强大的AI算力管理服务以及高效的算法开发和训练支持,能够化繁为简,帮助企业建好AI平台、管好GPU、用好AI服务。
趋动科技创始人兼CEO王鲲博士表示,凭借标准化、可复制的产品架构,趋动科技得到了包括互联网、金融、电信运营商、科研机构和高校等大量行业头部客户的认可。资本市场对于趋动科技的发展充满信心——趋动科技成立两年多已经完成近亿美元的融资,顶级的投资机构持续支持趋动科技的发展,包括国开装备基金、沙特阿美旗下多元化风投基金Prosperity7 Ventures、元禾重元、招银国际、顺为、高瓴、嘉御、戈壁、讯飞和涌铧在内的国内外顶级VC正在见证趋动科技锐意进取的脚步。