科创丨文心一言开启国产大模型时代,应用新机遇

方文三
无论如何,大模型良好的通用性、泛化性,以及显著降低人工智能应用门槛的优势,在ChatGPT上得到了淋漓尽致的展示。

360截图16251112669372.png

本文来自微信公众号“AI芯天下”,作者/方文三。

道德经言:[道生一,一生二,二生三,三生万物。]道即自然规律、宇宙运行规律,衍生出天地、阴阳、男女,再衍生为万物。其思想本质是天地万物可以用一个通用的理论来解释,可谓大道至简。

这与时下火热的生成式AI不谋而合,大模型就像[道],将衍生出万物。

ChatGPT上展现出了AI应用门槛的优势

GPT家族已经先后拥有GPT-1,GPT-2,GPT-3,以及图像预训练iGPT等模型,ChatGPT本质就是GPT-3.5,只不过因为强大的对话能力突然爆火起来。

不同的是,ChatGPT采用了新的指示学习和人工反馈的强化学习来指导模型的训练,前者带来了理解能力,后者增强了模型效果。

无论如何,大模型良好的通用性、泛化性,以及显著降低人工智能应用门槛的优势,在ChatGPT上得到了淋漓尽致的展示。

从这个意义上看,任何NLP领域的大模型,在良好的发展之后,都会、都可以生长出自己的ChatGPT,或者,更专业的概念称为ChatBot类产品。

大模型的背后蕴藏着一场人工智能落地模式的变革。如今火爆全球的ChatGPT背后的技术支撑正是大模型。

360截图16251112669372.png

大语言模型文心一言,让百度重新站到聚光灯下

在2019年,百度就推出了知识增强的语义理解框架ERNIE(文心大模型),并广泛应用于阅读理解、情感分析、智能搜索问答、视频推荐、CTR预测等领域。

2021年,百度又基于ERNIE发布了全球首个百亿参数的对话大模型PLATO-XL。

ERNIE系列模型也已经经过了多次的迭代,目前已经具备了较强泛化能力和性能,这也为大语言模型文心一言的推出打下了基础。

去年底,百度提出了AI大底座,旨在标准化地输出智能化的底层能力,把芯片、大模型、深度学习框架等高门槛的技术,变成像水电一样供客户按需取用。

360截图16251112669372.png

去年11月,OpenAI发布了ChatGPT后,百度团队感到了巨大的压力和危机感,觉得与国际水平的差距被进一步拉大。

于是加快了文心一言的研发进度,并在今年3月16日邀请内测。

昨天,在百度智能云闭门交流会上,百度正式推出了[文心千帆]大模型平台,这是百度面向客户提供企业级大语言模型服务的平台。

文心千帆大模型平台不仅包括文心一言,还包括百度全套文心大模型、相应的开发工具链,未来,文心千帆还会支持第三方的开源大模型。

此外,NLP与云业务密不可分,也必将变革云市场的游戏规则,百度在NLP领域占据的优势也会帮助百度智能云赢下更多的市场空间。

摩根士丹利认为:百度推出文心一言与公司的云业务战略方针步伐相同,可达到云业务中长期增长,并领跑行业。

360截图16251112669372.png

百度是国内少有大模型语言训练能力的公司

①模型储备方面:百度实现了全生态布局,具有算力积累和生态优势。

②平台方面:拥有自主生态的百度百舸·AI异构计算平台,具备高效率、多密度、高易用性、多场景部署、乐高式拼接等能力。

③算力方面:百度自身具有建设智能算力中心的实力,技术领先且自主可控,已有典型落地案例;

④服务器方面:拥有自研的昆仑芯云服务器;

⑤芯片方面:昆仑芯AI芯片是百度自主研发的芯片,2代芯片已量产,具备算力支撑强、高速互联等多重优势。

最终,IDC中国将大模型市场服务划分成了L1-L5五个层级,最终评价结果是当前大部分厂商能力处于L2-L3层级。

其中,最为凸显的是唯一处在第一梯队的百度文心大模型,产品能力、生态能力达到L4水平,应用能力达到L3水平。

360截图16251112669372.png

大模型带来的增长机会

①新型的云计算,商业模式变成模型即服务(MaaS),未来云服务的优劣将更多取决于框架、模型,以及模型、框架、芯片、应用这四层之间协同;

②进行行业模型精调的公司,作为通用大模型和企业之间的中间层,通过调用通用大模型能力,它们能为行业客户提供行业解决方案。

③应用服务提供商,创业者将围绕大语言模型做应用,未来可能涌现出一批创业明星公司。

基础软件是推动信息技术发展的根本驱动力。而进入到通用人工智能时代,大模型应用将成为这个时代的操作系统。

未来人工智能大模型将在不断迭代升级中推出更加强大的交通大模型、能源大模型、金融大模型、医疗大模型等等一系列应用大模型。

360截图16251112669372.png

国内有望复现类似模型并在细分场景使用

现阶段,大模型主要用于搜索、航程辅助、聊天机器人变种(猎头使用软件、智能客服,智能音箱、游戏NPC等);

1-5年内,会用于Office类工具,简单多模态方案(智能家居、工业视觉、行业化机器人)、行业专家(医疗、教育等)、智能助理(即时、工作安排、点外卖、购物等);

5-10年内,会用于复杂多模态方案(通用机器人、虚拟现实)等。

在财报后的全员信中,百度的多项主流业务与文心一言整合,包括搜索、智能云、Apollo自动驾驶、小度智能设备等。

360截图16251112669372.png

国内大模型赛道玩家少,都在酝酿应用

国内做语言大模型团队,包括互联网大厂、华为这些公司可能不超过10个团队,如果加上多模态领域,全国可以投的标的也不超过几十个。

大模型虽然是一个热门赛道,但投资机构和普通创业者能够抓住的机会不多,特别考验VC的合伙人的综合能力,不但要有资本洞察力,还要有产业经验理解技术。

人工智能与中国经典哲学思想殊途同归,其重要特点即[通用],一条理论解释万物。或许,宇宙万物背后也源自一个大模型。

目前国内第一梯队是百度、阿里、腾讯、字节、华为,第二是京东、讯飞、商汤、360和其他。

目前BAT、字节、华为等的国内大模型有很多令人期待的地方,比如21年年初发布的阿里通义M6大模型,是过千亿的中文参数语义大模型;

去年10月发布的腾讯混元,也是破千亿的语言大模型,近日腾讯宣布要发布腾讯版的chatgpt,叫做腾讯混元助手。

百度的文心一言发布了关于数据层的信息、下游生态的展望与商业前景,相对处于先发优势地位。

包括二线厂商和start-up,比如玄机、360、京东(ChatJD)、AI四小龙(商汤、旷视)、国内高校或科研院所(复旦的MOSS、智源研究院悟道)都有比较好或者前沿的技术层投入。

目前来看,颇有迎头赶上的趋势,大厂都在做积极投入,强势的应用也在积极酝酿中。

360截图16251112669372.png

结尾:

AI本身是一门跨学科、融合学科的行业,而大模型的终极目标就是要万法归一。

如今,AI大模型行业正处于浑然天成、万物初始的阶段。

只有看清与巨头之间的差距,瞄准细分领域,再加上人才集聚以及资本的合力,才能走出一条[道]。

部分资料参考:澎湃新闻:《李彦宏全面解读文心一言》,泽平宏观:《文心一言开启国产大模型时代,应用新机遇》,36氪:《大语言模型沸腾》,界面新闻:《没有大模型的土壤,开不出ChatBot的花》,光锥智能:《国产大模型,摸着OpenAI过河》,AI商业评论:《奔向大模型时代》

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论