本文来自微信公众号“电子发烧友网”,文/周凯扬。
随着机器学习与AI快速发展,摩尔定律却在逐步放缓,从架构设计上寻求创新就成了当下芯片设计的主流解决方案,尤其是在低功耗的AI加速器芯片上。这些用于边缘端的AI加速器芯片弥补了传统传感器方案计算能力缺乏或算力有限的问题,让传感器专注于感知层的提升,而算力上的提升和应用场景上的扩展,则可以放心交给低功耗AI芯片解决。
低功耗芯片也不缺席AI训练
全新兴起的这股边缘AI热,自然也对不少传统半导体厂商产生了冲击,为此他们也开始发力边缘AI领域,罗姆正是其中之一。去年,罗姆宣布已经开发出了用于IoT边缘计算的端侧学习AI芯片,其功耗甚至可以做到低至30mW。该芯片集成了罗姆自研的8位CPU tinyMicon MatisseCORE,以及2万门的AI加速器AxlCORE-ODL。
罗姆端侧AI芯片原型架构/罗姆
Matisse这一CPU不仅做到了极小的面积,在性能上也要超过寻常的8位CPU,甚至符合ISO 26262、ASIL-D的车规标准。AxlCORE-ODL则选择了由输入层、中间层和输出层来组成简单的三层神经网络。
除了极低的功耗,罗姆这颗芯片的最独特之处在于可以像云端AI芯片一样,完成训练任务。传统的低功耗AI芯片由于算力限制,往往是只能用于简单的推理任务,而罗姆的AI SoC却同时支持这两种工作负载。
不过该芯片毕竟是主打端侧低功耗的,无法进行较为复杂的训练任务,罗姆对其定位主要是用于对端侧传感器和电机的实时故障预测。在无需连接云服务器的前提下,该芯片就可以将未知的输入数据和模式生成非常规数值输出,从而预测内置传感器或电机设备的潜在故障。
终端摄像头迎来新升级
耐能作为一家专注于边缘AI SoC芯片开发的厂商,此前已经推出了KL520、KL530与KL720这一系列低功耗的AI芯片,也在去年11月推出了新一代的低功耗终端AI芯片KLM5S3。
从性能和特性来看,耐能的新产品KLM5S3是一款专门面向终端摄像头市场的低功耗AI芯片。KLM5S3基于ARM Cortex A5并采用28nm工艺设计,NPU算力达到0.5eTOPS INT8,支持Cafee、Tensorflow/lite、Pytorch等常见框架。
KLM5S3 AI SoC芯片/耐能
针对终端摄像头应用,KLM5S3支持双路HDR处理、电子防抖和鱼眼校正等等,这些特性可以使其广泛用于安防、记录仪等场景,甚至可以用于ADAS系统。车规图像传感器除了高动态范围外,另一大要求就是对LED闪烁的抑制,因为行驶过程中各种不同频率的LED闪烁可能会对图像输出造成干扰。
耐能的KLM5S3AI芯片在搭配车规级摄像头时,可以在NPU进行计算和输出红绿灯和其他交通标志的识别结果,从而降低驾驶风险。
小结
从这几年推出的低功耗AI加速器来看,采用模拟和ASIC这两种实现方式的芯片居多,加速对象以CNN居多,其次是DNN和RNN。因为CNN主要用于图像识别这样简单的视觉AI任务,与视觉传感器更为契合。而DNN和RNN之类的神经网络加速更多用于一些语音、文本处理任务。
至于负载类型,100W以下功耗的AI芯片主要还是单独用于推理,训练任务绝大多数还是交给大功率的AI芯片在云端完成。这并不是说传感器这样的边缘硬件不需要训练,而是现阶段的简单模型已经可以解决这些传感器的大部分需求,但随着未来数字孪生等应用对传感器性能的要求进一步提高,低功耗AI芯片势必会成为最有效的辅助硬件。