本文来自文汇网,作者:沈湫莎,编辑:范菁。
正如人类历史上无数次科技创新所展示的那样,爆炸式创新、现象级产品总是突然地、从人们未曾预料的地方冒出来。2023年初最“出圈”的科技新词非“ChatGPT”莫属,最近一周,它的服务器访问量始终处于满负荷状态(2月5日本报第三版“热点聚焦”刊登报道《ChatGPT火热“出圈”,我们如何应对新挑战》)。
有人将人工智能(AI)比喻为飞驰的列车,人们只有一秒钟与它擦肩而过,之后它就呼啸着离人远去,“擦肩”寓意AI与人类的智力水平相当之时。如今,ChatGPT的火爆程度已无需用语言描述,人们更想知道我们已经到了与呼啸列车“擦肩”的时刻了吗?
“简单粗暴”更胜一筹?
同一理论基础,两条技术路线
在ChatGPT爆火之前,AI领域的翘楚当属谷歌,不仅论文发表数量最多,其对思维链路提示、大模型涌现现象的研究也走在前列。从技术路线看,谷歌所推出的各种大模型和OpenAI推出的ChatGPT都源自2017年AI领域的一篇重磅论文《一种采用自注意力机制的深度学习模型Transformer》,但在模型构建上,两者选择了不同的技术路线。
中国计算机学会术语工委副主任、同济大学特聘研究员王昊奋表示,谷歌采用的是理解与生成相结合的路线,在编码端投入更多精力,以便让机器理解输入内容的意图和情感,也就是先理解再生成,这似乎更接近于人脑的工作模式。而OpenAI团队则认为,“如果机器能够输出内容,那么它肯定能理解这些内容”,于是舍弃了编码端的工作,专注于解码,即让机器生成人可理解的内容。相比谷歌,OpenAI的模型显得有些“简单粗暴”。
从目前的结果来看,似乎是“离经叛道”的OpenAI暂时领先于“名门正派”的谷歌。ChatGPT已经成为史上用户增速最快的消费级应用程序,推出仅两个月便突破了一亿用户,对于以数据和应用驱动的AI产业来说,更多用户意味着更多数据、更多应用场景和更多训练。
非线性增长突变如何发生?
消化全球互联网2/3文本语料
王昊奋曾问过ChatGPT所依赖的大规模语言模型GPT-3这样一个问题:“我能请猴子来装修房子并付给它们工资吗?”GPT-3的回答是“可以”。同样的问题交给ChatGPT,它的回答是“不行,因为它们是动物”。王昊奋说:“基于OpenAI选择的技术路线,我们尚无法从理论层面解释这究竟发生了什么。”
有专家认为,ChatGPT横空“出圈”或许是基于模型规模方面的“大力出奇迹”。复旦大学计算机科学技术学院教授邱锡鹏表示,以前人们认为语言模型的能力增长是线性的,参数规模越大,规模带来的边际效益会越来越小;ChatGPT则向人们展示了另一幅图景:当模型规模大到一定程度时,其能力突然迎来了一个非线性的增长突变。
GPT-3是一个拥有1750亿参数、利用45万亿字节文本数据进行训练的AI算法模型。由于OpenAI关闭了接口,因此无法得知ChatGPT的规模大小。但根据它训练好的参数量、单词量和使用数据源等信息反推,业内估算,ChatGPT已经消化了全球互联网2/3的文本语料。
聊天机器人何以谈颠覆?
或开启自然语言对话界面时代
就功能而言,ChatGPT似乎并没有多少创新性可言。你可以把它看成一个聊天机器人,微软小冰、天猫精灵以及苹果的SIRI,早已经出现在我们的生活中。
但为何ChatGPT能够一鸣惊人?王昊奋认为,ChatGPT有两个突出特点:一是它是个全语言模型,任何人都能用母语对它提问;二是它是个全场景模型,不管是写论文、编代码还是单纯求一碗“心灵鸡汤”,它都能胜任。“过去几乎所有的大模型都是根据有限场景去做的,ChatGPT的通用性让大家意识到,这可能是走向通用AI的一条道路。”
ChatGPT的出现,在产业界引发了一场“地震”,其竞争也日趋白热化。谷歌已经宣布将基于旗下LaMDA模型推出竞品Bard(巴德),百度、阿里、字节跳动等国内企业也纷纷宣布即将推出类ChatGPT产品或拥有类似技术积累,甚至老牌搜索企业雅虎也期望借助它重回主流视线。
全球顶尖互联网企业从ChatGPT的火爆中“嗅”到了什么?王昊奋的答案是“接口”。过去,我们在不同场景中借助不同软件与虚拟世界相连,这意味着我们还处于图形界面用户时代;未来,ChatGPT有望将我们带入自然语言对话界面时代,就如钢铁侠拥有了AI助手贾维斯。
腾讯研究院研究员胡晓萌认为,ChatGPT的火爆并非昙花一现,它的出现已致底层技术和产业生态形成新的格局,AI技术正从感知、理解世界跃迁到生成、创造世界,AI的下一个时代正在到来。
中国的机会在哪里?
丰富文本语料,完善AI飞轮
谷歌搜索显示,目前全球讨论ChatGPT最热的地方就在中国,国产版本何时诞生是人们最关注的话题。这或许是因为在AI领域,中美是最有资格掰掰手腕的两个国家。根据去年发布的《2021全球AI创新指数报告》,中美两国处于AI领域的第一梯队,中国距离美国的差距正不断缩小。胡晓萌表示,在与ChatGPT相关的核心技术方面,我国有着前期积累,业内统计我国千亿参数以上的大模型占全球1/3,美国占1/2。这也就不难解释,为何百度能如此迅速地拿出类ChatGPT产品。专家预计,年内国内至少有四五款同类产品即将上线。
不过,王昊奋认为,想要达到ChatGPT的水准,国产竞品还需突破三大难点:一是要丰富文本语料的规模,中文文本数据量和质量与英语语料之间差距较大;二是要加大数字基础建设,加大面向多机多GPU或类GPU的高效分布式训练框架的投入;三是要强化模型的持续更新和对用户反馈的收集与利用,完善AI飞轮。
ChatGPT的惊人表现引发了人类被AI加速替代的恐慌,王昊奋认为对此不必过度焦虑。在他看来,ChatGPT的出现,相当于当年苹果推出了iphone或者谷歌推出了搜索引擎,“这只是一款工具”。未来,人们将在这款新工具的基础上叠加各种应用,也会产生各种新的工种。这意味着,一些旧的机会将会消逝,更多的未来空间将浮现在眼前。