本文来自微信公众号“电子发烧友网”,作者/吴子鹏。
近日,一份研究显示,中国在AI(人工智能)理论研究方面已经全面超越美国,是AI研究论文领域无可争议的第一名,在AI论文数量和质量上对美国形成了碾压的态势。
研究指出,2012年是全球AI新一轮爆发初期,美国在AI论文方面处于全球领先的位置。随后中国在这方面奋起直追,并很快在AI论文数量方面超越了美国。不过2012年-2018年期间,美国AI论文的质量明显更高,引用数量更多,但这种情况在2019年发生了变化。
中国AI相关论文数量领先
研究指出,2021年中国共发表了4.3万篇AI相关的论文,数量上已经是美国的两倍。正如上面所提到的,自2012年之后不久,中国在AI论文数量上一直都处于领先的位置。并且,2012年时,中美之间的AI相关论文数量差距也仅有204篇,当时美国以629篇位居全球首位,中国以425篇紧随其后。目前,中美双方在AI论文数量上都已达到了万级。
不过,长久以来,中国AI论文数量被指质疑“注水”,换言之也就是相关论文的质量不高。2019年发布的《中国新一代人工智能发展报告》曾特别指出,2013-2018年,全球人工智能(AI)领域的论文文献产出共304914篇,其中中国已经成为最大的贡献者,贡献了74408篇,超过了美国的51766篇。报告提到,提升论文质量是接下来的目标之一。
政策指引的效果是明显的,随后在2019年中国论文便由量变引起了质变,在AI论文引用数量方面超过了美国。2021年,中国AI相关论文被引用了7401篇,比美国多出70%左右。
研究指出,中国企事业单位在中国AI产业发展的过程中扮演重要的力量,腾讯、阿里巴巴、华为和国家电网均位列AI研究论文的前十大公司之中。当然在头部企业方面,美国依然占据着优势,AI研究论文前十大公司中另外六家公司全部来自美国。不过,情况已经相较2012年有了极大的改观。2012年时,AI研究论文前十大公司里只有一家中国公司。
在国内,企业的AI发展受政策影响很大。以腾讯来举例,腾讯AI Lab成立于2016年,2017年开始宣布加大研发投入。不过,在2019年腾讯依然被行业诟病AI布局迟缓。随后,国家在2019年将AI重要性提高了一档,发布了大量的相关政策,并在国务院《2019年政府工作报告》着重提到了人工智能。随后,马化腾亲自宣布腾讯将加大AI方面的投入。目前,腾讯在国内已经稳稳占据了第一梯队的位置。在NeurIPS 2022上,腾讯AI Lab共有13篇论文被本届会议接收,其中1篇被选为口头报告,以及2篇Spotlight;在国际权威研究机构Gartner最新出炉的2022年度《Magic Quadrant for Cloud AI Developer Services》研究报告上,腾讯在机器视觉技术上排名全球第二位。
在政策的引导下,中国已经逐渐成为AI强国,美国出台各项政策对中国AI企业进行制裁,也足见其对中国AI产业发展的重视。AI高速发展同时也带动了大数据、云计算、互联网等与人工智能密切相关的产业发展提速。根据IDC与浪潮信息联合发布《2022-2023中国人工智能计算力发展评估报告》,2022年我国智能算力规模达到268百亿亿次/秒(EFLOPS),超过通用算力规模,预计未来5年中国智能算力规模的年复合增长率将达52.3%。
中国AI的症结所在
实际上,中国AI不仅论文方面增长迅猛,并且市场规模的年复合增长也领先全球平均水平。不过,这些都无法掩盖国内AI这个产业存在的问题。
在2019年的《中国新一代人工智能发展报告》就已经提到,我国的AI产业存在基础层发展薄弱、产学研合作不够紧密等短板。实际上,到了今天有些问题依然没有得到有效的解决。
在基础层方面,近几年国内值得肯定的是在人工智能算法框架方面的突破,尤其是百度的飞桨以及华为的MindSpore,打破了人工智能核心算法框架均来自美国的局面。发展至今,百度飞桨已经非常成熟,成为继TensorFlow、PyTorch之后,全球第三大人工智能算法框架,击败了Amazon主导的MXNet和微软背书的CNTK等强劲对手。截止到2022年5月20日,飞桨已经凝聚了477万开发者、服务了18万家企业并创建了56万个模型。
这是好的一面,不好的一面是,目前国内在高端算力芯片方面完全受制于人。大家肯定还对去年上演的英伟达A100和H100芯片禁令“连续剧”印象深刻,当时产业大为恐慌,各种相关内容更是占据头版头条。随后,英伟达宣布向中国市场特供A800芯片,实际上只是在A100的基础上,将NVLink高速互连总线的带宽从600GB/s降低到400GB/s,不过这种降速是没有办法通过软件来提升的。一根“大棒”,一颗“糖丸”,很多业者对此忿忿不平,扬言要是实现高端算力芯片的自主化,实际上在GPGPU方面,国产芯片不仅硬件性能还和英伟达有很大差距,软件生态同样有一道鸿沟,同时我们还要时刻担心后续芯片的量产会不会被制裁。从产业现状来看,以高算力芯片为主的基础层仍将长期困扰中国人工智能产业的发展,这也是为什么部分美国分析师认为,美国不应该推动中美脱钩,而是通过芯片等关键技术长期牵制中国人工智能等产业的发展。
在产学研结合方面,近两年国内取得了积极的进展。随着各大高效纷纷开设人工智能专业,设立人工智能研究院或者是校企合作研究单位,再加上高端人才在高校和企业方面的流动,目前国内AI产学研协同发展很见成效。
不过,随着AI产业向前发展,我们也能够发现,目前AI的发展已经不仅仅是停留在产学研共同研究的层面,又多出来一个用的层面,因此现在叫产学研用。
目前,国内AI在应用落地方面明显遇到了新的瓶颈,因此产业从投资和技术落地有一种要进入寒冬的态势。在政策的引导下,虽然目前很多行业都在尝试使用AI技术,但这些应用实际上很单一,主要面向图像识别、机器智能场景,解决安防以及制造场景中的质检等重复性工作。正如创客总部合伙人、北大校友创业联合会副会长陈荣根所言,AI在落地过程中遇到了技术鸿沟、产品鸿沟和规模鸿沟。这些鸿沟的存在导致AI企业长期不能解决高成本的难题,目前大部分AI项目是定制性的,企业花费高额的成本研发出来,却无法迭代。到了2022年,国内“AI四小龙”商汤科技、旷视科技、依图科技、云从科技依然逃脱不掉持续亏损的魔咒。
落地难的背后是当前AI技术依然缺乏图灵奖获得者、中科院院士、美国科学院外籍院士、清华大学交叉信息研究院院长姚期智教授在2020年提到的“鲁棒性”,导致现阶段AI的适应性和迭代性都非常差,很难跨越产业化的鸿沟。而AI在鲁棒性和普适性上的缺失则因为国内缺乏交叉学科的培养体系,虽然部分院校已经启动了相关工作,不过人才的评估体系依然是“老一套”,导致徒有形式,难有成果。
写在最后
所谓十年磨一剑,这一轮AI发展大潮里,国内AI经过了十年的发展确实取得了很多积极的进展,在相关论文和产业规模方面取得了举世瞩目的成绩。不过,时至今日,国内的AI依然还是一个“不健全”的产业,与我们畅想的“AI+”愿景还有距离。在产业宣传时,我们当然可以扬长避短,但是真正技术落地、产业发展时,这些短板是掩盖不住的。