本文来自微信公众号“百度”。
5月22日,在法国巴黎举办的“欧洲科技创新展览会”(Viva Technology)主论坛上,百度创始人、董事长兼首席执行官李彦宏与阳狮集团监事会主席莫里斯•列维(Maurice Levy)对谈时表示,中国AI与西方的最大区别是应用,中国有数百个基础模型,但人们越来越多地在讨论什么是AI时代的超级应用。他介绍说,应用驱动了中国AI的快速发展。
VivaTech是欧洲最大科技创新盛会,从2016年创办至今已至第八届,谷歌、微软、IBM、三星、特斯拉等高管均为大会常客。今年大会以人工智能、可持续发展和移动化为关键内容,覆盖全球2500家初创企业和2000多名投资者。
01
比起GPT-5
更重要的是超级应用
“很多人都在关注GPT-5的发布时间,但我更感兴趣的是,哪些应用可以充分利用大语言模型的所有能力。”李彦宏表示,在中国,无论是初创公司、还是互联网大厂,都在努力寻找PMF(产品市场契合度),致力于探索最能发挥生成式AI能力、能被数十亿人使用的应用形态。
他举例说,在移动互联网时代,有大量DAU达到数亿、乃至十亿的超级应用;但在人工智能时代,无论是美国、欧洲还是中国,超过1亿日活的超级应用都尚未诞生。“超级应用最可能的形态是什么?是一个聊天机器人、还是Copilot,目前还不确定。”
李彦宏介绍,自去年上线至今,文心一言的累计用户已经达到2亿,每天都有数千万用户在使用百度搜索、百度文库等应用的AI功能。随着这些用户的快速增长,全新的AI应用形式会逐渐成型,成为超过1亿DAU的超级应用,“未来与我们今天看到的大不相同。”
02
应用创新
驱动基础模型创新
在李彦宏看来,关注应用并非是忽视基础模型的发展,与之相反,AI应用与基础大模型的发展相辅相成。
“应用的进步,可以推动基础模型的创新,也有助于加快从互联网时代向人工智能时代的转变。”他以百度搜索、直播电商数字人等应用举例说,应用端获取真实的用户需求和问题后,可以持续反馈模型,并由此推进基础模型的技术迭代。
在基础模型的数据训练方面,李彦宏表示,超级应用诞生后,还可以促进大量数据生成,为大模型提供更加充沛的训练数据。“有人说,随着模型参数越来越大,我们很快就会用完所有现存的数据,但我认为,当超级应用诞生时,数据会大量生成,所以我并不担心。”
谈话中,李彦宏也提及了百度基础模型的定位,“我们最主要的市场在中国,所以在中文上,我们一定要比世界上任何模型都做得好。现在,文心大模型4.0的中文能力已经超过了GPT-4。”
03
“我是人工智能的长期信仰者”
“我是人工智能的长期信仰者,”李彦宏回顾过往,早在30多年前上大学时,就已学习了人工智能课程;创立百度后,他意识到AI是解决搜索问题的核心技术,因为两者的本质,都是让机器理解人类语言。“所以在十多年前,我们就开始积极投入研发人工智能,尤其是与自然语言相关的人工智能。”
李彦宏介绍说,百度于2019年推出1亿参数规模的文心大模型1.0版本,在2.0版本升级至10亿参数,ChatGPT发布后不久,即推出了3.0版本,发布速度远超全球其他上市公司,“是因为我们准备得更加充足、工程师非常努力,我们一直在朝着这个方向努力。长期的信念,让我们为这样的颠覆性创新做好了准备。”
不过,与他的预想相比,人工智能技术的进步速度并不算快,“过去几年,每个人都对技术的发展速度感到震惊,但对我来说,它太慢了。”此前,他曾在另一场演讲中提到,人工智能的概念首次提出至今已超过70年,历经多次技术浪潮,但仍然未达到真正的“AGI时代”。
“很多人都在谈论AGI(通用人工智能),他们说可能还要两年或者五年,”李彦宏感慨,但要真正抵达理想中的AGI时代,“我认为还要十年以上”。