本文来自半导体行业观察,内容编译自arm。
安谋昨日释出2025 年最新预测,此次预测囊括芯片、AI 与市场三大面向,其中在芯片设计领域,预计芯粒(Chiplet) 将对架构产生深远影响,并「重新校准」摩尔定律,半导体产业需要重新思考和校准摩尔定律及其对产业的意义,也探讨商业化、标准化、生态系及AI 软件设计的新趋势。
Arm 指出,公司在技术生态系中具备的独特地位,因此了解全方位高度专业化、互联的全球半导体供应链,包括物联网、资料中心等所有市场,对未来技术的发展方向及未来几年可能出现的主要趋势,有着广泛且深刻的洞察。
Arm 此次对 2025 年及未来的技术发展做出预测,范围涵盖技术的各个方面,从 AI 的未来发展到芯片设计,再到不同技术市场的主要趋势。
一、芯片领域
Arm 认为,从成本和物理学角度来看,传统的芯片设计定案(Tape-out) 变得越来越困难,产业需要重新思考芯片的设计,突破以往传统的方法。如人们逐渐意识到,并非所有功能都需要整合在单独的单一芯片上,随着晶圆制造厂和封装公司探索新的途径以突破摩尔定律的极限,芯粒等新方法便开始崭露头角。
实作芯粒的不同技术正倍受关注,并对核心架构和微架构产生了深远的影响。对于芯粒,架构师需要逐步了解不同实作技术的优势,包括制程工艺节点和封装技术,进而运用相关特性来提升效能和效率。
芯粒技术已能有效应对特定市场需求和挑战,并预计在未来几年持续发展。在车用市场,芯粒可帮助企业在芯片开发过程中实现车规级认证,同时透过运用不同的运算元件,展现扩大芯片解决方案的规模并实现差异化。例如,专注于运算的芯粒具有不同数量的核心,而专注于记忆体的芯粒则具有不同大小和类型的记忆体。因此,透过系统整合商,可对这些不同的芯粒进行组合和封装,企业得以开发出更多高度差异化的产品。
在过去的摩尔定律,单一芯片上的电晶体数量已达到数十亿,其效能每年翻倍,功耗每年减少一半。然而,这种在单独的单一芯片上持续追求更多电晶体、更高效能和更低功耗的做法已经难以为继。半导体产业需要重新思考和校准摩尔定律及其对产业的意义。
其中之一,就是在芯片设计过程中,不再仅仅将效能作为关键指标,而是将每瓦效能、单位面积效能、单位功耗效能和总拥有成本做为核心指标。此外,还应导入一些新指标,关注系统实作方面的挑战(这也是开发团队面临的最大挑战),确保将 IP 整合到系统单芯片(SoC) 及整个系统之后,效能不会下降。
因此,这需要在芯片开发和部署过程中持续地进行效能优化。随着科技产业大规模地朝着更高效率的 AI 工作负载运算发展,这些指标将在相关领域变得更为重要。
为了借助芯片解决方案实现真正的商业差异化,企业不断地追求特定应用的芯片。这也反应在运算子系统的日益普及,这些核心运算元件使得不同规模的公司,能够对其解决方案进行差异化和个别化的订制,每个解决方案都经过配置,以执行或支援特定的运算任务或专业功能。
Arm 也强调标准化的平台和框架,对于确保生态系能否提供具有差异化优势的产品和服务相当重要,它们不仅能够增加真正的商业价值,还能节省时间和成本。随着整合不同运算元件的芯粒的出现,标准化变得空前重要,它将使来自不同供应商的不同硬件能够无缝地协同工作。
Arm 到目前为止已携手 50 多家技术合作伙伴一起开发 Arm 芯粒系统架构(Chiplet System Architecture, CSA),随着更多合作伙伴的加入,我们将共同推动芯粒市场的标准化进程。在汽车产业,这将与SOAFEE 的成立初衷相符,SOAFEE 的成立宗旨在于将软件定义汽车(SDV) 中的硬件与软件分开,进而提高运算元件之间的灵活性和互通性,以加速开发周期。
随着芯片和软件的复杂性不断增加,没有任何一家公司能独自承揽芯片和软件设计、开发与整合等所有工作。因此,生态系内的深度合作相当必要。此类合作能为各类规模的不同公司提供特有的机会,使各公司能够根据自身的核心竞争力提供不同的运算元件和解决方案。这对汽车产业尤其重要,汽车产业需要汇集包含芯片供应商、一级供应商、整车厂商和软件供应商等在内的整个供应链,分享各自的专业知识、技术和产品,以定义AI 驱动SDV的未来,让最终使用者能够享受到AI 的真正潜力。
随着AI 兴起,半导体产业将逐渐采用 AI 辅助的芯片设计工具,运用 AI 来优化芯片布局、电源分配和时序收敛。这种方法不仅能最佳化效能结果,还能加速优化芯片解决方案的开发周期,使小型公司也能凭借专用化芯片进入市场。AI 不会取代人类工程师,但它将成为因应现代日益复杂的芯片设计的重要工具,特别是在高效率的 AI 加速器和边缘端设备的设计当中。
二、AI领域
Arm 指出,在未来一年里,AI 推论工作负载将继续增加,这将有助于确保 AI 的广泛应用和持久普及。这个趋势的发展受惠于具备 AI 功能的设备和服务数量的增加。事实上,大部分日常 AI 推论,如文本生成和摘要,都能在智能手机和笔电上完成,为使用者提供了更快速、更安全的 AI 体验。为了支援这项成长,此类设备需要搭载能够实现更快的处理速度、更低的延迟和高效率电源管理的技术。Armv9 架构的 SVE2 和 SME2 两大关键特性,一起运行于 Arm CPU,使其能够快速而高效率地执行 AI 工作负载。
2024 年,Arm 看到越来越多的 AI 工作负载在边缘(也就是设备端) 运行,而不是在大型资料中心进行处理。这种转变不仅能为企业节省电力和成本,还能为消费者带来隐私和资安方面的保障。
到了2025 年,Arm 预期,很可能会看到先进的混合 AI 架构,这些架构能够将 AI 任务在边缘设备和云端之间进行有效分配。在这些系统中,边缘设备上的 AI 演算法会先识别出重要的事件,然后云端模型会介入,提供额外的资讯支援。决定在本地还是云端执行 AI 工作负载,将取决于可用电源、对延迟的要求、隐私顾虑以及运算复杂性等考虑因素。
边缘AI 工作负载代表着AI 去中心化的趋势,使设备能在资料来源附近实现更智能、更快速且更安全的处理,这对于需要更高效能和因应在地决策的应用市场,如工业物联网和智能城市,尤其关键。
随着技术的进步,规模更小、结构更精简、压缩率更高、量化程度更高、参数更少的模型正在快速演进。典型的例子包括 Llama、Gemma 和 Phi3.这些模型不仅具备更高的成本效益和效率,也更容易在算力资源有限的设备上部署。我们预计,2025 年这类模型的数量还将继续增加。这类模型能够直接在边缘设备上运行,不仅提升了效能,还能强化隐私保护。
Arm 预计,越来越多的 SLM 将用于设备端的语言和设备互动任务,以及基于视觉的任务,例如对于事件的解读和扫描。未来,SLM 将从大模型中萃取出更多经验和知识,以便开发本地专家系统。
目前,GPT-4 这样的大语言模型(LLM) 是基于人类文本进行训练的。当这些模型被要求描述某个场景时,它们只会以文字形式回应。但我们也开始看到包含文本、图像、音讯、感测器资料等多种讯息的多模态 AI 模型出现。这些多模态模型将透过能够听到声音的音讯模型、能够看到的视讯模型、以及能够理解人与人之间、人与物体之间关系的互动模型,来执行更复杂的 AI 任务。这将赋予 AI 感知世界的能力,就像人类一样,能听、能看、能体验。
如今,当使用者与 AI 互动时,通常是在与一个单一的 AI 进行互动,这个 AI 会尽可能独立完成使用者要求的任务。然后,透过 AI 代理,在使用者指定需要完成的任务时,这个 AI 代理会将任务委托给由众多 AI 代理或 AI 机器人组成的网路,类似 AI 的零工经济。目前,客服支援和程式设计辅助等产业已开始使用 AI 代理。随着 AI 的互联性和智能程度不断提高,我们预计在未来一年,AI 代理将在更多产业快速发展。这将为下一个阶段的 AI 革命奠定基础,使我们的生活和工作变得更有效率。
在 AI 的推动下,设备上将涌现更强大且个别化的应用。例如更智能、更直观的个人助理,甚至私人医生。应用的功能将从简单地回应使用者请求,转变为根据使用者及其所处环境主动提供建议,实现 AI 的个人化。这将导致资料的使用、处理和储存数量呈现指数级成长,因此业界和政府需要采取更严格的安全措施并提供监管指导。
医疗服务似乎已成为 AI 的主要应用场景之一,而这一趋势将在 2025 年加速发展。AI 在医疗领域的应用场景包括:预测性医疗、数位记录储存、数位病理学、疫苗开发和基因疗法等,以帮助治疗疾病。2024 年,DeepMind 的创办人因与科学家合作,利用 AI 预测复杂的蛋白质结构,且准确率高达 90%,被授予诺贝尔化学奖。同时,研究证明,使用 AI 可以将药物研发周期缩短 50%。这些 AI 创新为社会带来显而易见的益处,加速救命药物的研发和生产。此外,透过将行动设备、感测器和 AI 相结合,使用者将能获得更优质的健康相关资料,进而对个人健康做出更明智的决策。
AI 将加速融入永续发展的实践。除了使用高效率的技术,「绿色 AI」策略也将受到越来越多的重视。例如,为了因应日益成长的能源需求,AI 模型训练可能会逐渐选择在碳排放较低的地区和电网负荷较低的时间段进行,并可能成为未来的标准做法。透过平衡电网上的能源负载,这种方法将能缓解峰值需求压力,减少总体碳排放量。因此,我们预计会有更多云端服务提供者,推出针对效率优化的模型训练的调度服务。
其他方法还包括优化现有 AI 模型以提高执行效率,重复使用或重新定位预训练的 AI 模型,以及采用「绿色编码」,尽可能地减少能源消耗。在「绿色 AI」浪潮中,我们可能还会看到自发性标准的导入,随后逐步形成正式标准,以促进 AI 的永续发展。
可再生能源与 AI 的结合,有望推动整个能源产业的创新。目前,可再生能源在可靠性和灵活性方面不足,难以平衡峰值负载,这对电网脱碳进程造成阻碍。我们预计,AI 将能够更准确地预测能源需求,即时优化电网运行,并提高可再生能源的效率,进而帮助解决这些问题。电能储存解决方案也将受惠于 AI,AI 能够优化电池效能和寿命,这对于平衡可再生能源的间歇性特性至关重要。
导入 AI 不仅有助于解决预测和平衡峰值需求的难题,还能预测与识别维护需求,进而减少能源供应中断。智能电网则可利用 AI 进行即时电能流动的即时管理,有效降低能源损耗。AI 与可再生能源的深度融合,预计将可大幅度地提高能源系统的效率和永续性。
在广泛的 AI 应用中,尤其是在物联网领域,不同的 AI 需求将需要多种运算引擎。为了最大化部署 AI 工作负载,CPU 将继续成为现有设备部署的关键。新的物联网设备将搭载更大的记忆体和更高效能的 Cortex-A CPU,以强化其 AI 效能。而新推出的Ethos-U NPU 等嵌入式加速器,将被应用于加速低功耗机器学习(ML) 任务,并为工业机器视觉和消费性机器人等更广泛的应用场景提供高效率的边缘推论能力。
从本质上来看,在短期内,将看到多个运算元件被应用于满足特定 AI 应用的需求。这种趋势将持续彰显开发通用工具、软件技术库和框架的必要性,以便应用开发人员能够充分利用底层硬件的功能。边缘 AI 工作负载并不存在「万能」的解决方案,因此,为生态系提供灵活的运算平台非常重要。
三、市场方面
Arm 看好,虚拟原型加速了芯片和软件发展,使得公司能够在物理芯片准备就绪之前就着手开发和测试软件。这对车用芯片产业尤为重要。在车用产业,虚拟平台推出后,汽车开发周期缩短了多达两年。
2025 年,在芯片和软件发展流程持续转型的浪潮中,我们预计将有更多公司推出自己的虚拟平台。这些虚拟平台将无缝地运行,借助 Arm 架构提供的指令集架构同位(ISA Parity) 特性,确保云端和边缘端架构的一致性。透过指令集架构同位特性,生态系可在云端构建自己的虚拟原型,然后在边缘端进行无缝部署。
这将显著的节省时间和成本,同时让开发人员有更多的时间利用软件解决方案来提升效能。2024 年Arm 首次将 Armv9 架构导入车用市场,我们预计后续将有更多开发人员在车用领域运用指令集架构同位特性,并借助虚拟原型技术来更快地构建和部署车用解决方案。
生成式 AI 技术正被迅速应用于端到端模型中,可望解决传统自动驾驶(AD) 软件架构面临的可扩展性问题。受惠于端到端自监督学习,自动驾驶系统的泛化能力将获得提升,使其得以应对之前从未遇到的场景。这种新方可望有效加速营运设计领域的扩展,进而以更快的速度和更低的成本,将自动驾驶技术部署到高速公路和城市等不同环境中。
随着 L2+ 免持方向盘的驾驶控制辅助系统(DCAS) 和 L3 自动车道维持系统(ALKS) 等车辆法规在全球得到协调与共识,DCAS 和 ALKS 这些进阶功能将能更快、更广泛的部署。领先的汽车制造商正在投资与配备必要的硬件,以便在车辆的整个使用周期内、透过订阅服务来推行这些功能。
为了防止驾驶滥用自动驾驶系统,相关法规和「新车评估计划」越来越关注更为精密的车内监控系统,如驾驶监控系统(DMS)。例如,在欧洲,EuroNCAP 2026 的新评级机制,将鼓励直接感知式(如基于摄影镜头的)DMS,与先进驾驶辅助系统(ADAS) 和自动驾驶功能深度整合,以便针对不同程度的驾驶双手离开方向盘这类行为让车辆做出适当的回应。
在可见的未来,Arm 认为,智能手机仍将继续扮演主要的消费性电子设备。实际上,在未来的几十年内,它很有可能将继续成为消费者的首选设备,其他设备仍难以实质地挑战它。随着 Armv9 在主流智能手机中的广泛应用,预计到 2025 年,新旗舰智能手机将拥有更强的算力和更好的应用体验,这将进一步巩固智能手机做为首选设备的地位。但很显然,消费者会根据不同需求使用不同的设备,智能手机主要被用在使用应用程式、网页浏览和通讯,而笔记型电脑仍被视为生产力和工作任务的「首选」设备。
同样值得注意的是,智能眼镜等 AR 可穿戴设备正逐渐成为智能手机的理想搭档。智能手机之所以能够持续流行,关键在于其不断进化的能力,从应用程式到相机再到游戏,而现在,业界正在见证AR 新应用场景的涌现,而智能手机也开始支援可穿戴设备的AR 体验。
在整个科技产业中,设备将变得更加小巧时尚,例如 AR 智能眼镜和越来越小的可穿戴设备。这一趋势是多种因素相互影响的结果。首先,高效率技术的应用为设备提供了所需效能,以支援关键的设备功能和体验。其次,轻量化技术的应用让更小巧的设备成为可能,就AR 智能眼镜而言,它采用了超薄碳化矽技术,不仅可实现高解析度的显示,还能大幅减小设备的厚度和重量。此外,小巧的新语言模型正在提升这些小型设备的 AI 体验,使设备的沉浸感更强,互动性更好。展望明年,高效率的轻量化硬件将与小型 AI 模型加速结合,推动体积更小巧、功能更强大的消费性电子设备的发展。
2024 年,Windows on Arm(WoA) 生态系获得了显著进展,主流应用程式已纷纷推出 Arm 原生版本。事实上,一般 Windows 使用者 90% 的使用时间都在使用 Arm 原生应用程式。最近的一个例子是 Google Drive,它在 2024 年底发表了 Arm 原生版本。Arm 预计,该趋势将在 2025 年继续保持下去。随着包括 Google Chrome 在内、对使用者日常体验极为重要的 Arm 原生应用展现大幅度的效能提升,WoA 对开发人员和消费者的吸引力也将不断增加。