配图来自Canva可画
本文来自微信公众号“刘旷”,文/刘旷公众号。
一直以来,追逐风口都是互联网企业的天性。因此,继元宇宙风口之后,横空出世并火遍全国的AIGC和ChatGPT,便又成为了各行业企业追逐的焦点。在此背景下,无论是国内互联网大厂,还是科技公司,亦或是内容平台,但凡有些实力的玩家都纷纷下场,围绕AI大模型展开了一场激烈角逐,“千模大战”也就此拉开了帷幕。
一场基于大模型的创业浪潮开始席卷开来,国内陆续布局大模型的企业也如雨后春笋般争相涌现。只不过,与百度、阿里、华为这类打造通用大模型的“高端”玩家不同,知乎、小红书、快手等则选择了另辟蹊径。而作为内容问答、短图文、短视频等主流内容形式的代表,知乎、小红书、快手这些小巨头们对大模型的探索,自然也就成为了外界关注的重点。
竞逐大模型
大模型无疑是今年最热的风口,国内企业早就陆续宣布对大模型展开探索,而不管是投资还是自建,已经开始进场分羹的不在少数,知乎、小红书、快手自然也不会错过这班“列车”。众所周知,互联网大厂对大模型展开研发及相关布局,是高度符合其产业互联网战略的,而相比之下,知乎、小红书、快手这三个平台的进场,虽是意料之外,却也依旧在情理之中。
一方面,AI技术逐渐普及,玩家们充分受益于人工智能技术浪潮,自然不想错过这个时代的变革。AI技术的发展将会带来产业的进步和新机遇的诞生,而伴随着人工智能技术不断取得突破,AI大模型也呈现蓬勃发展态势。AI大模型浪潮席卷全球,只有先上牌桌,才能抓住规则这张“王牌”,因此,知乎、小红书、快手等玩家进军大模型就变得刻不容缓了。
另外,对于这些玩家来说,一旦别家的大模型落地,或会对其构成一定的威胁,而为了防范风险,入局就变得顺理成章了。进入AIGC时代,基于深度学习的大模型将极大提升内容生产的速度和数量。在此背景下,拥有了“技术优势”的竞争对手很可能会迅速突破知乎、小红书、快手的护城河,因此,布局大模型就变成了这些小巨头们保持竞争力的一种方式。
另一方面,在移动互联网红利消退的背景下,选择拥抱大模型,可以让这些玩家的内容变得更加多元化,有望带来新的增长点。由决策式AI到生成式AI的演变正在将大模型应用推向更加多元化的场景,知乎、小红书、快手等平台推出大模型产品,则可以提高内容生产的速度和质量,以拓展更多新内容;还可以更好地满足用户的需求,从而吸引更多用户留存。
另外,这些玩家都或多或少地面临着商业化困境,而利用大模型,有望助其更好地实现商业化。一直以来,小红书都困于“站内种草,站外拔草”,商业化闭环难构建;知乎和快手也分别因为难抵广告收入下滑和营业成本高昂,以及深陷直播电商竞争,而常年处于亏损之中。而其对AI大模型的训练,能给内容社区带来一波红利,从而反哺业务增长以及商业化加速。
从以上角度来看,布局大模型,似乎已经成为了知乎、小红书、快手等小众玩家不得不打的一场仗。只不过,由于每家的商业逻辑和入场角度不同,每家在大模型上的优势和表现也是不尽相同。而凭借着自身在AI技术和内容上的积累,这些平台们也开始在大模型领域各显神通。
知乎快人一步
作为国内领先的问答社区及原创内容平台,知乎早就将大模型能力应用到了平台中。据悉,4月,知乎发布了大语言模型“知海图AI”,并内测首个站内大模型应用功能“热榜摘要”;随后,又发布了一款大模型智能应用功能“搜索聚合”。得益于此,知乎已经成为国内首批具备大语言模型能力的公司,而知乎之所以能加入生成式AI的战局,自然是具备了一些特色和优势。
一是,知乎大规模、高质量的中文数据池是训练大模型的良好素材,将大幅度提升训练效率。知乎PUGC的运营模式为其积累了海量、优质的数据。据悉,截至2022年第四季度,知乎社区上累计内容达6.5亿条,其中包括5.1亿条问答,就连微软NewBing都将其视作中文数据源之一。可见,知乎对于训练大模型类的AI来说,无疑是一个非常优秀的数据库资源。更何况,这些数据从形式上就十分契合大模型输入、输出的训练方式,能有效提升训练效率。
二是,知乎基于问答的讨论场是大模型天然的应用场景,能够快速精准地为用户提供大模型服务。众所周知,知乎是国内最有名的知识问答社区,这些年知乎积累了海量的问答资源,而提供这一资源的用户来自各行各业,拥有不同的知识背景和经验,他们的答案通常会更为专业、详细和科学,可以有效确保内容的准确性和深度。而这也就意味着,知乎大模型可以从多个角度学习和理解问题,并对用户进行更精准的推荐和问答。
三是,知乎与面壁智能的合作,能助其在训练人工智能模型时,获得更专业、更先进的技术支持。由于没有大厂的雄厚实力,知乎这类中厂便开始通过联合研发与战略投资的方式,与国内大模型团队共同开发中文大模型。知乎的合作伙伴——面壁智能是一家专注于大模型研发的企业,其在自然语言处理和机器学习领域拥有深厚的技术积累。与面壁智能的合作,可以为知乎AI大模型的研发提供更加专业和及时的技术支持。
小红书稳步推进
事实上,除知乎之外,小红书已秘密筹备了“大模型”团队,抢先参与到大模型技术的研发布局中。有消息报道称,小红书在4月悄然上线了一款名为“Trik”的AI创作应用,主打AI绘画。
显然,与大厂相比,小红书的资金储备和技术实力都不够雄厚,而鉴于大模型研发需要高昂的算力、数据以及人力成本,小红书参与大模型研发的概率并不高,更多地可能会聚焦大模型应用环节,围绕平台内用户运营,以及创作者工具提供等方向展开。尽管如此,小红书布局大模型,依旧有着自己的底气。
一来,小红书多类型数据的内容社区,是大模型极佳的实践场景。经过多年积累,小红书的社区内容生态中的内容量丰富且多样,据悉,小红书已经成长为一个月活超2亿的UGC内容社区,涵盖了视频、图片、文字、笔记、用户评论等多个类型的数据。而这些数据也将会为自然语言处理、AI辅助内容的生成提供多模态的数据基础和应用场景。
二来,小红书结构化的笔记内容,更方便大模型进行套路的学习和输出。根据小红书在“WILL商业大会2023”上公布数据显示,通过将笔记、用户行为数据结构化,小红书识别了26万的属性词、600万+的昵称词、700万+的情感描述词。而小红书可拆解、规律化的平台属性,更有利于大模型应用的模仿,从而也能够为平台带来生产效率的提升。
三来,小红书千人千面的推荐系统,有望成为大模型训练的样本。基于大规模的用户行为的产生,小红书团队根据用户的特点去做了更加个性化的搜索。小红书中的瀑布流或者内容流,就是系统根据用户行为中的规律,找出了用户感兴趣的内容并推荐给了用户。而针对小红书平台产生的海量数据参数,将有可能会被实时送到模型中去做预估,而且随着样本的不断变化,模型参数也将会不断更新。
快手跃跃欲试
知乎和小红书一直在积极筹备,快手自然也不能落后。据程一笑介绍,快手目前已组建了大模型研发团队,并依托过去在AIGC算法和大规模语言模型方面的技术积累,按计划推进大模型开发和训练,只是当前模型还处于训练阶段。快手虽然暂时没有对外发布大模型产品,但能看出其对大模型是持积极拥抱态度的。而在快手积极布局背后,自然也有着涉足大模型的驱动力。
一方面,快手的视频生成是生成式AI相对缺乏的细分领域,有助于形成差异化优势。入局大模型赛道的玩家有很多,但相比较而言,作为国民级短视频应用的快手的探索方向就显得十分与众不同。据了解,快手目前在大模型方面的尝试包括大规模语言模型、多模态预训练大模型、智能创作工具等。除了文本之外,快手还在语音、图像、视频、3D图形等各个模态的内容生成方面均有所尝试。
另一方面,快手短视频平台具有娱乐化属性,能给予大模型一定的试错空间。据目前透露的消息来看,快手大模型目前主要由两部分功能组成,一种是类似于Midjourney的文生图功能,一种是类似于ChatGPT的对话式AI工具。而尽管快手称“语言描述的精准度不及Midjourney”,但相较于极度追求专业化的Midjourney,以UGC为主的快手本身对大模型的要求不会有太高。
作为各行业的代表企业,知乎、小红书、快手争相拥抱大模型,固然有其必要性和优势条件,但AI大模型所伴随的深重危机感也不容忽视。上面所提到各个内容平台的表现,都只是其增加了一些有关大模型的“新功能”,其AI大模型产品距离成熟还有很远,实现商业化落地,更是难上加难。
目前来看,国内大中小厂扎堆大模型的现象已经是屡见不鲜,对于参赛的玩家而言,大模型的能力虽是比拼的重点,但具体的场景和落地应用同样关键。而最终谁能在这场“大模型混战”中存活下来,并拔得头筹,也还需要时间来检验。不过,可以肯定的是,知乎、小红书、快手想要从中突围,还有很长的路要走。
文/刘旷公众号,ID:liukuang110