本文来自微信公众号“天翼智库”,作者/魏玥、王浩彬。
自1987年钱天白教授发出中国第一封电子邮件,我国互联网似乎每12年出现一次重大迭代。1999年前后,腾讯、阿里、百度陆续成立,PC互联网蓬勃发展。2011年,微信面世宣告移动互联网正式到来,智能手机成为重要载体,各种用于随时随地获取、分享、创造信息的App应用层出不穷。2023年,受ChatGPT和GPT-4驱动,百度文心一言、阿里通义千问、商汤商量等竞相上线,同时,微软和阿里已经或正在将大模型能力陆续接入全系自有业务。未来,互联网应用或是“大模型原生”,或被“大模型重构”,人们的生活和生产都将由“智能”重新定义,以大模型为基础的智能互联网时代已然开启。全新时代,机遇与挑战并存,如何顺应时势成为英雄值得思考。
机遇:窗口期和巨人的肩膀
1.ChatGPT存在使用限制,为我国大模型发展提供窗口期
对于ChatGPT,无论是以聊天形式交互的网页版,还是将能力输出的API,国内用户均无法通过官方途径访问或调用(Azure OpenAI服务底层模型是GPT-3),存在使用门槛。另外,ChatGPT训练语料库中的中文数据占比仅为5%,对中文的理解与反馈并不十分到位,仍有较大优化空间。
因此,我国大模型研发尚存窗口期,嗅觉敏锐者已纷纷行动。当前有数十家机构宣称已经完成或正在研发大模型,阿里、美团、快手等多家互联网大厂高层也陆续离职创业投身大模型。国产大模型理论上更熟悉中国市场,更能提供符合我国用户需求和使用习惯的AI服务,进而在我国智能互联网中占据主导。
2.巨头开源或为趋势,我国厂商可站在巨人的肩膀上
移动互联网初期,谷歌面对苹果公司iOS操作系统先发优势,战略性开源Android操作系统,迅速聚拢一大批硬件制造商和软件开发者,不仅令Android份额快速超过iOS,也加速了Android更新迭代。随Android普及,预置应用广告和应用市场抽成等收益也随之而来。
这一次,面对ChatGPT先发优势,谷歌、Meta等科技巨头也可能使用开源策略,以此拉拢开发者,提高自家模型市占率。当前,Meta已经“开源”(供非商用目的)LLaMA,后续不排除加大开放力度,如允许商用。在基础大模型巨头混战中,我国大模型厂商及上层应用玩家或有机会坐收“渔翁之利”。
挑战:高高筑起的竞争壁垒
1.GPT系列模型已领先多个身位
ChatGPT和GPT-4发布前已经大量调优和评估,公众接触到的模型通常是OpenAI半年甚至更久之前的研究成果。例如,GPT-4的训练工作22年8月已完成,彼时ChatGPT尚未发布。因此,我们合理推测,GPT-5或许已经完成训练。
而国内近期上线的模型仍在对标ChatGPT,且从表现来看,性能差距不小。例如,百度“文心一言”回答的准确性、逻辑性、流畅性虽基本可用,但整体而言还远未到完善程度;阿里“通义千问”中英文对话流畅,但在生成代码方面有所欠缺。因此,面对GPT系列模型,我国AI产业需要追赶的不仅是代内时间差,更有可能是难以跨越的代际差。
2.已形成“赋能应用—独家数据—调优模型”成熟闭环
对内,微软已将GPT-4能力接入Bing搜索、Edge浏览器、Office套件、Teams、GitHub等全线互联网及软件服务。微软本就是办公软件霸主,这样一来,实力更是鹤立鸡群。试想一下,WPS面对可通过自然语言交互做表画图的Excel,根本毫无“招架之力”。这些以GPT-4加持可大幅提升生产力的工具将迅速渗透,当其他厂商推出类似产品时,微软用户早已产生惯性并为GPT-4贡献了大量真实数据。对外,ChatGPT在开放API基础上,已进一步开放插件功能,可与5000+应用集成,这意味着ChatGPT可触达场景与领域更加丰富,能获取到的真实数据更加多样。占尽市场先机与数据优势的GPT系列,正在将其他企业越甩越远。
“智能互联网”元年:新思考
1.参与者应找准自身定位
虽然大模型是智能互联网时代基石,但大模型研发与运营成本相当高昂,构建动辄需要数十亿美元的基础投入,ChatGPT按1亿用户每天10次对话计算,运营成本高达1000万美元/天。对于是否从事大模型底层架构实现,权衡能否承受资金与时间成本十分必要。若难度较大,不如将目光放宽至大模型上下游。
上游,GPT-4的出现将对算力供应和数据行业带来前所未有的市场空间。一方面,GPT-4的模型架构比以往模型更加复杂,训练需要更强大的CPU、GPU、TPU等计算资源。另一方面,数据对模型性能至关重要,将带动数据清洗、数据标注,甚至数据存储服务。下游,中小企业或创业公司更适合瞄准应用场景基于大模型实施二次开发。
2.大模型需突显中国特色
PC互联网和移动互联网时代不乏海外巨头在中国水土不服最终败北而走的例子,如新闻领域的雅虎,电商平台领域的亚马逊。当前,ChatGPT难以为中国用户提供本土化服务是我国厂商最大机遇,需牢牢抓住,以发展中文服务为目标和特色,尽快推出更适应中国市场的产品,更加个性化和定制化的服务,从而在本土市场上获得更多市场份额和用户认可。
3.另辟蹊径或能出其制胜
我国目前上线的大模型服务形态与应用领域与ChatGPT比较类似,正面硬刚也许不是最佳途径。移动互联网时代,抖音以直播爆火后切入电商领域,以直播带货掐到淘宝命门,可见从旁路切入反而易于攻城。ChatGPT只是大模型能力的一种表现形式,从业者可积极探索更多新颖玩法。
魏玥,副主任分析师,英国布里斯托大学通信网络与信号处理硕士,就职于中国电信研究院,长期从事通信行业研究,近年来专注云计算产业及传统产业数字化转型。
王浩彬,副主任分析师,硕士,就职于中国电信研究院,研究领域聚焦智能辅助决策技术,云网融合,人工智能产业分析等。