AI大模型通用好还是专用好?专家观点来了

作为算力供给的重要引擎,人工智能算力基础设施在建设布局等方面迎来“大考”。据不完全统计,全国有超过30个城市正在建设或提出建设智算中心,基本都是采用“政府主导、企业承建、联合运营“的模式。

本文来自微信公众号“中国电子报”,作者/宋婧。

伴随ChatGPT概念持续走红,AI技术与千行百业的融合进程加速,愈发多元、复杂的应用场景涌现出来,对算力服务提出了更高的要求。在近日举行的2023中国算力发展研讨会上,多位业内权威专家与学者围绕ChatGPT下算力的机遇与挑战,从技术、生态等多维度展开深度交流研讨,厘清算力产业的发展风向,并就当下人工智能基础设施及算力服务建设等课题给出应对之策。

算力基础建设的关键在于“通专结合”

作为算力供给的重要引擎,人工智能算力基础设施在建设布局等方面迎来“大考”。据不完全统计,全国有超过30个城市正在建设或提出建设智算中心,基本都是采用“政府主导、企业承建、联合运营“的模式。即由地方财政统一出资,建成后为各行各业提供公共算力服务。在此模式下,智算中心定位于公共服务设施,首先要满足广泛的应用场景,具备普适性,实现通用。其次,也要能支持部分对于计算精度、效率要求高的个性化应用场景,具备高效性,实现专用。

多位与会专家指出,“通专”结合将成为人工智能算力基础设施的建设关键。中科院计算所研究员张云泉表示,ChatGPT的出现首次实现了认知智能的智慧涌现,同时也让算力产业面临需求上升、多样化发展、能耗问题凸显、使用门槛过高等新挑战。人工智能算力基础设施在变局中求发展,算力融合、要素协同、生态协作是关键。

360截图16251112669372.png

科学计算最重要的是要提高可信度,人工智能同样如此。北京应用物理与计算数学研究所研究员袁国兴指出,要让模型更可信就得不断提高模型精度。现在为了提高精度,模型越来越大,也越来越复杂,数据增量也越来越大。然而超出一定范围之后,打造一个通用模型的代价太高,这就需要通过专用模型来解决问题,所以还是应该分类来研究这个问题。

中国科学院院士陈润生建议称,用大模型学术基础构架专业模型,既能达到高精度又能实现小能耗。他认为,人工智能算力服务要有布局也要有分工,不要一拥而上,也不要半途而废,要避免资源浪费。

中国科学院院士钱徳沛表示,通用还是专用的问题,不止出现在大模型领域,其实从计算开始的时候就一直存在。异构是一个趋势,不同的事情要用不同的高效工具来做。然而,在现代工业化体系下,要考虑成本,性能高了,能耗少了,但是设计成本、制造成本太高,也不行。要折中,既要达到高的性能,低的运营成本,又要有低的设计成本、制造成本,使得全系统成本是低的。在设计成本和制造成本容忍的情况下,应该尽可能地用更高效的异构结构和部件来支持不同的计算。

中国工程院院士廖湘科认为,通用模型可以服务各行各业,我们需要可以对标ChatGPT的通用大模型,而各行各业可以根据行业实际需求在通用大模型的基础上进行微调和推理,定制行业的专用模型。

专家们认为,一方面,人工智能算力基础设施应具备全精度算力,成为一个算力“通才”,让用户可以根据AI for Science、AI for industries等实际应用场景调配算力资源,包括通用算力、专用算力,乃至高性能的算力,来支持自身业务的发展。另一方面,“通专结合”的人工智能算力基础设施是一套综合性方案,更考验底层架构的开放性。既需要不同技术路线的百花齐放,也需要殊途同归的适配兼容,以便形成包罗万象的整体架构,在降低应用迁移门槛的同时,也带动产业生态的发展。

算力网络要连接资源更要连接生态

算力网络的发展也成为当下备受瞩目的话题。大模型热潮带来了庞大的算力需求,导致行业与区域算力分布不均问题日益凸显。对于算力网络建设而言,将遍布全国的各类型计算中心统一管理调度,实现对算力、存储、网络以及数据等分布资源的整合,只是初级阶段。更重要的建设环节,在于整个产业生态的深层连接,即连接人、连接应用和服务。

360截图16251112669372.png

中国工程院院士郑纬民坦言:“国内很多机构、企业都在做大模型,每个参与方都需要有很大的算力支撑,这有可能会造成算力资源的浪费,可以合起来组成一个大的算力,做模型来共享,并让这个模型成为新型基础设施,但实现这个目标还有很多问题有待解决,比如怎么才能把不同的模型连接起来,怎么实现传输,怎样才能既满足对算力的要求,又能比较节省成本。”

“在算力互联方面,中国目前有智算网络、超算互联等不同的方案。其中,超算互联网就是以互联网的思维运营超算中心,并连接产业生态中的算力供给、应用开发、运营服务、用户等各方能力和资源,构建一体化超算算力网络和服务平台。在算力网络建设大潮当中,中国最后走哪条路,怎么把我们国家算力资源连起来,调度起来用好,发挥作用,降低它的门槛,都是需要我们研讨的话题。”张云泉说道。

超算互联网作为算力网络的重要形态,从实践层面诠释了算力网络的建设本质。首先是狭义的互联,即在物理层面,连接不同体系架构的算力中心,构建可以统一使用、对外服务的基础设施,实现资源的调度、共享。其次是广义的互联,即在生态层面,以互联网的思维运营超算中心,基于计算、软件、应用解决方案等资源进行深度整合,建立一个以应用服务为主导的创新型平台,并通过市场化的运营和服务体系,紧密链接上下游,使供需方快速对接,快速找到各自需要的资源。

“从超算互联网的角度,我们期望不仅是把机器相联,还是希望把人、设备、应用都联起来,核心还是做超算平台,要让超算、智算都变得好用。”国家高性能计算机工程技术研究中心副主任曹振南表示。

通过物理及生态层面的双重互联,算力网络可进一步使能算力服务,合理配置、融合、释放算力,降低应用门槛。让算力资源从高不可攀的技术变成普适普惠的服务,支撑国家重大的科研项目、社会民生以及千行百业的发展。

曹振南认为,目前无论是超算、智算,在服务过程中面临的瓶颈和问题仍然非常多,其中最难的还是应用问题。他建议要加强软硬件协同发展,重视算力网络的生态建设。

国家信息中心信息化和产业发展部主任单志广表示,目前来看,算法和模型是未来有机会发力的地方。ChatGPT是采用集中式的算力来推动,未来我们或许可以换一条路,比如走下一代分布式路线,可以通过更先进的互联技术将国内的一些算力基础设施更好的连接起来,挖掘更强的计算能力。

“我们还是要从基本的计算模式演化规律和人工智能的发展规律上,去做基础性的探讨,避免一哄而上或者现象级跟风,否则就只能永远跟在别人后面跑,要知道计算机领域是隔代竞争,是越追越远的。”单志广说道。

“我认为通用的概念正在发生变化。”清华大学教授陈文光表示,人工智能计算形态在整个数据中心中占的比例会越来越大。不过现阶段AI算力中心仍处于非常初期的发展阶段,在这个阶段还是应该鼓励多方探索。

中国科学院计算机网络信息中心研究员陆忠华表示,随着AI的发展,AI服务的算力需求越来越多了,而且趋势是不可阻挡的,我们应该去迎接这个趋势。如何满足大家日益增长的算力需求,在5—8年的时间里,应该努力用好已经建设的超算中心、智算中心,使得已经投入建好的中心资源不要浪费。可以率先尝试在某些领域开展大模型应用,鼓励生态建设。另外,构建人工智能基础设施体系,不应过分强调一体化布局,还是应该在国家政策指导下支持百花齐放,把剩下的交给市场。

中国智能计算产业联盟秘书长安静表示,新算力时代已经到来,算力将是未来拉动数字经济向前发展的新动能,新引擎。与此同时,算力正在成为影响国家综合治理和国际话语权的关键要素,国与国的核心竞争力正在聚焦于以计算速度、计算方法、通信能力、存储能力为代表的算力,未来谁能掌握先进的算力,谁就能掌握发展的主动权。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论