百度、阿里、腾讯、京东、华为,中国版ChatGPT会是谁?

知情人士透露,此次文心一言落地,首站将直接接入百度搜索。一些相关功能已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等。

360截图16251112669372.png

本文来自微信公众号“数据观综合”,编辑|蒲蒲。

五天超过百万用户,两个月获得上亿用户,ChatGPT成为了史上扩散速度最快的应用。

据调研机构CBInsights统计,ChatGPT概念领域目前约有250家初创公司,其中51%融资进度在A轮或天使轮。2022年,ChatGPT和AIGC领域吸金超过26亿美元,共诞生6家独角兽,估值最高的就是290亿美元的OpenAI。

与此同时,ChatGPT还掀起了新一轮人工智能浪潮,全球科技巨头纷纷布局人工智能赛道。

ChatGPT的爆火,打开了AI和投资世界的新风口,且热度持续不减。

据全球早期资金调研机构CB Insights最新报告显示,2022年有110笔创投交易和ChatGPT概念有关,投资资金超过26亿美元。

该团队确认的ChatGPT概念领域,目前约有250家初创公司,33%尚未筹集任何外部股权资金,51%融资进度在A轮募资、或A轮之前。

360截图16251112669372.png

此外,CB Insights统计,AIGC领域已有6家独角兽,其中,推出了ChatGPT的OpenAI高达200亿美元,Hugging Face20亿美元,Lightricks 18亿美元,内容建立套件AI驱动企业Jasper 15亿美元,Glean和Stability AI为10亿美元。

ChatGPT概念中较小辈份的新创团队,在2022年也都有不错的募资成果,人工智能模型开发人员和研究机构Anthropic在B轮募了5.8亿美元,专注于人机介面的Inflection AI A轮募到2.25亿美元,NLP工具包开发团队Cohere在B轮从市场拿到1.25亿美元。

在ChatGPT风口抢占大战上,微软和谷歌率先开战。

2月7日,谷歌宣传将发布新品“Bard”,即AI聊天机器人服务;紧跟着微软也于2月8日凌晨在华盛顿雷德蒙德发布会上宣布,将推出由ChatGPT和GPT-3.5提供的全新搜索引擎Bing和Edge浏览器。两天后,微软就正式发布了ChatGPT版必应搜索和Edge浏览器。

国外两大巨头激烈争斗的同时,国内相关企业也迅速跟进,争相布局相关产品。

百度:「文心一言」3月见

在国内众多科技公司中,百度是最早针对ChatGPT做出明确表态的公司之一。

2月7日,百度正式官宣将在3月上线百度版ChatGPT——「文心一言」(英文名为ERNIE Bot)。据知情人士透露,百度搜索早就接入了文心相关技术,「文心一言」的推出或将对百度搜索的升级起到重大作用。

知情人士透露,此次文心一言落地,首站将直接接入百度搜索。一些相关功能已陆续在百度搜索内上线或内测,包括多答案回复、智能生成等。

前段时间,百度CEO李彦宏将2023年一季度OKR关键任务定为“引领搜索体验的代际变革”。同时,李彦宏提到,ChatGPT相关技术已达到临界点,百度在其中有较大的机会。

10cc1ff9abd24c50ba6b4889bf9e4457(1).jpg

百度方面表示,ChatGPT相关技术,百度都有。百度在人工智能四层架构中有全栈布局,包括底层芯片、深度学习框架、大模型以及最上层的搜索等应用。而文心一言位于模型层。

2月14日,上海报业集团旗下澎湃新闻、重庆日报报业集团旗下上游新闻、每日经济新闻等多家媒体平台宣布接入百度“文心一言”,成为生态合作伙伴。除媒体外,爱奇艺、携程、集度汽车、宇信科技、汉得信息、金蝶软件、宝宝巴士、智联招聘等企业也宣布加入百度文心一言生态圈。

360截图16251112669372.png

作为国内最早开始进行大模型研发的科技企业之一,百度在2019年3月率先发布中国首个正式开放的预训练模型ERNIE1.0,并持续投入于大模型的研发升级。2021年12月,ERNIE 3.0升级为全球首个知识增强千亿大模型,成为目前为止全球最大的中文单体模型。

腾讯:专项研究有序推进

2月9日,针对在ChatGPT的布局,腾讯方面回应称:“目前,腾讯在相关方向上已有布局,专项研究也在有序推进。腾讯持续投入AI等前沿技术的研发,基于此前在AI大模型、机器学习算法以及NLP等领域的技术储备,将进一步开展前沿研究及应用探索。”

2022年4月,腾讯对外正式宣布,腾讯“混元”AI大模型在MSR-VTT,MSVD,LSMDC,DiDeMo和ActivityNet五大跨模态视频检索数据集榜单中先后取得第一名的成绩,实现了该领域的大满贯。特别是在MSR-VTT榜单上,“混元”AI大模型将文字-视频检索精度提高到55%,领先第二名1.7%,位居行业第一。

360截图16251112669372.png

各模型方法在5个公开数据集上指标对比

这是腾讯首次对外披露“混元”AI大模型的研发进展,该模型包含但不限于:计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型。“混元”AI大模型基于腾讯太极机器学习平台进行研发,借助GPU算力,实现快速的算法迭代和模型训练。

360截图16251112669372.png

HunYuan_tvr模型架构示意图

目前,“混元“AI大模型已被广泛应用到广告创作、广告检索、广告推荐等腾讯业务场景中。一方面,该模型能够帮助广告创作者和腾讯平台方预测视频内容与消费者群体之间的兴趣关联,提升创作效率;另一方面,能够有效提升广告推荐的精准度,让内容搜索和匹配更加精确,有效优化用户体验。

阿里巴巴:目前处于内测阶段

2月8日,据阿里巴巴一名资深技术专家爆料,阿里达摩院正在研发类ChatGPT的对话机器人,目前已开放给公司内员工测试。

从曝光的截图来看,达摩院研发的对话机器人同ChatGPT一样,对用户提出的问题对答如流。

10cc1ff9abd24c50ba6b4889bf9e4457(1).jpg

针对此事,阿里巴巴回应称:“确实在研发中,目前处于内测阶段。”后续如有更多信息,会第一时间和大家同步。

从曝光截图来看,阿里巴巴可能将Ai大模型技术与钉钉生产力工具深度结合。钉钉方面也向媒体表示,阿里版本的ChatGPT的对话机器人将和钉钉深度结合。

从此前发布来看,早在2021年阿里即开始在AI大模型领域加码投入。当年11月,达摩院的多模态大模型M6,参数规模从万亿跃迁至10万亿,规模超越海外公司发布的万亿级模型,成为全球最大的AI预训练模型。相比之前业界标杆大模型,M6实现同等参数规模,能耗仅为其1%,极大减少了超大模型训练所需算力。

360截图16251112669372.png

2022年下半年,阿里巴巴达摩院发布“通义”大模型系列,核心模型通过“魔搭”社区向全球开发者开源开放,该动作降低了AI的应用门槛。通义打造了AI统一底座,构建了大小模型协同的层次化人工智能体系,为AI从感知智能迈向知识驱动的认知智能提供先进基础设施。

为了实现大模型的融会贯通,阿里达摩院在国内率先构建AI统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。通过这种统一学习范式,通义统一底座中的单一M6-OFA模型,在不引入任何新增结构的情况下,可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务,并达到国际领先水平。这一突破最大程度打通了AI的感官,受到学界和工业界广泛关注。近期M6-OFA完成升级后可处理超过30种跨模态任务。

京东:将推出「产业版」ChatGPT

2月10日,京东云通过官方公众号发布了将推出“产业版”ChatGPT——ChatJD的消息,同时公布了ChatJD的落地应用路线图“125”计划。具体为:

1个平台:ChatJD智能人机对话平台,即自然语言处理中理解和生成任务的对话平台,预计参数量达千亿级;

2个领域:零售、金融,得益于京东云在零售与金融领域10余年真实场景的深耕与沉淀,已拥有4层知识体系、40多个独立子系统、3000多个意图以及3000万个高质量问答知识点,覆盖超过1000万种自营商品的电商知识图谱,更加垂直与聚焦;

5个应用:内容生成、人机对话、用户意图理解、信息抽取、情感分类,涵盖零售和金融行业复用程度最高的应用场景,在客户咨询与服务、营销文案生成、商品摘要生成、电商直播、数字人、研报生成、金融分析等领域将发挥广泛的落地价值。

360截图16251112669372.png

ChatJD将通过在垂直产业的深耕,快速达成落地应用的标准,并不断推动不同产业之间的泛化,形成更多通用产业版ChatGPT,构建数据和模型的飞轮,以细分、真实、专业场景日臻完善平台能力,最终反哺和完善通用ChatGPT的产业应用能力。

京东集团副总裁何晓冬称,相较于传统聊天机器人,京东的场景更加垂直,必须解决用户的问题,更加聚焦于任务型多轮对话,考量的是对话的精准度、客户的满意度,满足成本、体验、价格、产品、服务等要素的要求。

在通用型Chat AI方向,京东云已经拥有包括京东智能客服系统、京小智平台商家服务系统、智能金融服务大脑、智能政务热线,言犀智能外呼、言犀数字人等系列产品和解决方案。

在语言生成方面,京东NLP团队提出的基于领域知识增强的预训练语言模型K-PLUG可以在一定程度上解决生成文本的「可控性」问题。目前,该模型已经覆盖了京东的3000多个三级品类,累计生成文案30亿字,应用于京东发现好货频道、搭配购、AI直播带货等。

华为:在大模型领域早有布局

对于华为在类似ChatGPT方向上的布局,华为计算产品线相关负责人表示,公司2020年在大模型开始有布局,2021年发布了鹏城盘古大模型,是业界首个千亿级生成和理解中文NLP大模型。

在大模型产业化方面,华为已发起了智能遥感开源生态联合体、多模态人工智能产业联合体,智能流体力学产业联合体等。华为将以联合体的模式把科研院所、产业厂商等结合起来,更好地让大模型产业形成正向的闭环回路。

据华为计算产品线相关负责人表示,公司2020年在大模型领域开始有布局。去年6月,在华为伙伴暨开发者大会2022上,华为发布人工智能大模型全流程使能体系,具体包括以下几点:

规划大模型沙盘,其实就是单点技术的聚合。让产业界多基于昇腾AI技术体系推出更多大模型,鼓励高校和科研机构开展大模型的研究与创新。

推出相关大模型开发套件,通过算法开发、并行计算、存储优化、断点续训,实现大模型的高效开发。

与伙伴一起共同成立AI流体力学、AI生物医药、以及智慧育种等产业联盟,助力相关领域的大模型创新和产业化发展。

字节跳动:当前不做过多回应

2月9日,有传闻称,字节跳动的人工智能实验室有开展类似ChatGPT和AIGC的相关研发,未来或为旗下PICO提供技术支持。

但随后,PICO相关负责人否认了传闻,说消息不实,PICO目前没有采用类似ChatGPT技术的产品规划。

ChatGPT成风后,字节跳动是为数不多与ChatGPT划清界限的企业。

在AIGC方向,字节跳动的研究成果包括非自回归模型DA-Transformer、端到端语音到文本翻译模型ConST、多颗粒度的视觉语言模型X-VLM、图片和文本统一生成模型DaVinci等。其中DA-Transformer在机器翻译上首次达到了Transformer同样的精度,而处理的速度提高了7~14倍。DA-Transformer不仅可以用于机器翻译,而且可以用于任意的序列到序列任务。

网易有道:将推出教育场景下的ChatGPT

据报道,网易有道AI技术团队已投入到ChatGPT同源技术AIGC(AI Generated Content)在教育场景的落地研发中。

网易有道向媒体证实了这一消息,并表示近年来一直在AIGC上有持续性投入。去年底尝试AIGC在教育场景中的落地应用,包括但不限于AI口语老师、中文作文打分和评价等。据相关负责人透露,近年来,有道团队在神经网络翻译、计算机视觉、智能语音AI技术、高性能计算等关键技术方面均取得重要突破。

网易有道表示:“产品的最终形态团队还在讨论中,需要匹配用户需求来决定,智能硬件、在线课程都可能是考虑落地的场景。”

据悉,网易有道已经布局AI产业多年,在神经网络翻译、计算机视觉、智能语音AI技术、高性能计算等方面具备核心技术,且一向注重技术在教育和翻译等场景中的商业化落地。

面向服务和信息检索维度,网易有道可提供问答机器人等功能,通过与系统用户进行交互,提供个性化的信息服务。据悉,目前该项技术支持人物、教育、动漫、小说、文学作品等垂类的基于结构化数据的精准问答,可直接满足用户的知识检索需求,已累积数亿次调用。

科大讯飞:5月进行产品级发布

从科大讯飞方面获悉,科大讯飞Al学习机将成为公司类ChatGPT技术率先落地的产品,并于今年5月发布。

据介绍,科大讯飞主导承建了认知智能全国重点实验室,是科技部首批20家标杆全国重点实验室之一,多年来始终保持关键核心技术处于世界前沿水平,去年获得CommonsenseQA 2.0、OpenBookQA等12项认知智能领域权威评测的第一。同时,已面向认知智能领域陆续开源了6大类、超过40个通用领域的系列中文预训练语言模型,成为业界最广泛流行的中文预训练模型系列之一,在Github平台的中文预训练模型的星标数达13346位列第一,是第二名的2倍。

360截图16251112669372.png

科大讯飞强调,公司已经在当前核心技术、产业场景、行业数据等深厚积累的基础上,于2022年12月份进一步启动生成式预训练大模型任务攻关,科大讯飞AI学习机将成为该项技术率先落地的产品,将于2023年5月6日进行产品级发布。该技术突破将在AI学习机的中英文作文辅导、中英文口语学习等方面带来显著提升。

360:正在构建ChatGPT安全应用

继前两年布局新能源汽车、入局元宇宙后,360近日也对外公布,计划推出类ChatGPT的demo版产品。周鸿祎表示:“如果企业搭不上ChatGPT这班车,很可能会被淘汰。”

在2月7日的答投资者提问会议上,360表示有200多亿的资金能够支持360进行类ChatGPT技术的研究和投入,虽不及谷歌、百度,但也强于许多A股上市的搜索引擎企业。

在技术积累上,360在2019、2020年左右便看到了技术变革的可能,成立了人工智能研究院,投入了相当的人力、算力去做人工AI场景,研发侧重点建立在自身的业务优势上,即安全AI。

随着ChatGPT的应用推广以及各大科技巨头陆续入局类ChatGPT赛道,产业界和学界也越来越重视ChatGPT类模型可能带来的安全风险。

360方面表示,当前对类ChatGPT的研发已经进行了数字安全AI识别。基于其训练的AI模型,刻画了专门针对于数字安全训练的大模型,并给它投喂了360安全卫士形成的安全类大数据。

不过360方面表示,类ChatGP测试版的推出时间以及实际效果均存在重大不确定性。

公司的类ChatGPT技术的各项指标只能达到略强于GPT-2的水平,与当前的ChatGPT相比尚有代差的落后,公司是否能够缩小与国外领先技术之间的差距尚存在不确定性。

小米:在ChatGPT领域有丰富落地场景

从接近小米人士处获悉,小米在ChatGPT领域有丰富落地场景,包括小爱对话、机器人等,其中小爱拥有庞大数据支撑,会让小米在大模型方面进展更迅速。此前小米在AI大模型上已有多路并行尝试,未来将加大相关领域人力和资源投入。

此前,雷军在推特上发文称,用ChatGPT询问小米13全球版发布时间,是问不出结果的。因为ChatGPT的数据库没有到2023年。

快手:已启动相关专项

作为一款国民级短视频App背后的公司,快手的业务和AIGC息息相关。因此,快手也对ChatGPT做出了回应。目前,快手正在开展大规模语言模型(LLM Large Language Model)正在开展大规模语言模型,并启动了相应专项,覆盖LLM模型训练、文案自动创作与生成、对话系统开发等领域。

内部有关人士介绍称,快手在LLM领域的研究,更聚焦于用户体验的提升,以及和业务场景的融合。例如,对话系统在快手中的主要应用场景包括虚拟人、电商智能客服、智能助理等人机交互或人人交互场景。相关研究的推进,将赋予LLM与人类自然交互的能力,对于to B类业务场景的扩展将有重要帮助。

“中国版ChatGPT”将花落谁家?

需要注意的是,由于目前全球还没有能有与ChatGPT抗衡的大模型产品,而且中国、美国在AI大数据、算法、大模型发展路径不同,除了微软、谷歌、Buzzfeed、Anthropic、百度等企业公布类似产品,或与OpenAI合作之外,国内暂时没有“中国版ChatGPT”。

尽管国内大厂都在纷纷官宣各自国产版ChatGPT的规划及进度,一些创业公司也在争取曝光机会,仍有冷静的旁观者认为OpenAI在国内复制成功的几率很小。

首先在技术能力上,有从业者指出,百度未来推出产品的效果还未知。迄今为止,国内尚未有任何一家公司或者科研机构能够做出与ChatGPT同等效果或者接近这个模型效果的成果。

在投入上,对于企业来说也成本不菲。“OpenAI是2015年成立的,7年多时间没有收入,而且投入非常大,这样的创业公司放在国内能不能存活很难想象。”一位AIGC领域创业者说。

即便获得当下的成绩,OpenAI创始人Sam Altman仍认为这离真正的AGI(Artificial general intelligence,通用人工智能)尚远,“我不认为我们已经快要实现AGI了。我最近一直在思考我们如何知道AGI会何时实现的问题。在过去五年多里,我对AGI的认知是它不会一蹴而就,将是一个渐进的过程,或者说是缓慢起飞。”

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论