本文来自微信公众号“ 技术领导力”,作者/ Mr.K。
在AI大模型浪潮席卷全球,大模型应用层出不穷之际,许多如AI办公助手、AI编程助手、AI作图等富有创新的产品,也开始飞入寻常百姓家,给大众的工作和生活带来了实实在在的便捷,但同时K哥也看到,市场上也充斥着一些失败的AI“缝合怪”,和不知所谓的“伪需求型”AI应用。再这么搞下去,国产大模型,就彻底凉了。思考很久,K哥还是决定冒着得罪许多大佬的风险,给大家做个盘点:
01
“套壳”大模型:AI不需要中间商
1、什么是“套壳”大模型?
K哥这里说的“套壳”大模型,是指把ChatGPT、Claude、文心一言等多个大型语言模型聚合在一起的工具平台。它们提供了一个更易用的界面,用户无需分别访问各个模型,就能一站式享受多个大模型的功能。乍听上去,似乎是一个很不错的想法。市面上也出现了不少这一类的“套壳”大模型,既卷又杂,优劣难辨。
客观来说,这样的“套壳”并非罪大恶极,也不是毫无价值。问题在于,你不能始于套壳,终于套壳,在这个“壳”上毫无作为,彻底躺平。这种不思进取、就想着舒舒服服做中间商、赚差价的想法,早晚把自己搞翻车。
2、“套壳”大模型为什么失败?
首先,从技术层面来看,"套壳"大模型的门槛实在过低。随着主流编程语言的普及,一个两三个人的小型创业团队,就可以在几周之内拼凑出一款界面华丽的"套壳"应用。缺乏技术壁垒,必然会导致同质化产品泛滥,难以形成独特的护城河。
其次,底层大模型玩家,都在不断努力提升用户体验。比如,OpenAI推出了ChatGPT Plus订阅服务,为用户提供了更为优质的响应速度和访问权限。Anthropic推出了会话界面重塑版Claude,呈现了更为友好的界面交互。可以预见,各路底层大模型,都会在体验优化之路,一路狂奔。届时,用户自然会选择数据源头直接获取服务,而非绕道"套壳"应用。
另外,大模型训练的资源投入巨大,最终能存活下来的,大概只有少数3~5家巨头。从以前的搜索引擎的发展历程可以看出,随着谷歌、百度等搜索引擎的体验不断提升,用户逐渐转向了这些直接提供高质量搜索结果的平台。而那些曾经风光一时的聚合搜索网站和应用,最终因为缺乏增值亮点和竞争力而逐渐消失。这一情况,也会在AI领域重现,大模型终究会抛弃它的“中间商”。
02
数字人直播:真人都卖不动,
何况数字人?
1、数字人直播是什么?
今年4月,“采销东哥”数字人,在京东采销直播间进场带货。直播不到1个小时,带货金额突破5000万,直播观看人数更是高达4000万。强悍的数据,不仅让“采销东哥”直接上了热搜,连带让“数字人直播”也成了热议的话题。
所谓数字人直播,顾名思义就是由虚拟数字化身代替真人,进行直播带货。以京东云言犀打造的"采销东哥"为例,它就是一位集成语音合成、面部捕捉、3D渲染等多种AI技术的硅基主播。强大的AI技术支撑,可以让采销东哥在直播时说一口地道的“宿迁普通话”,播到情绪高涨时,甚至还会激动地挥舞手臂。
京东强哥自带的流量和强大的影响力,带火了这场数字人直播。但事实上,数字人并不是今天才有,早在几年前就有不少人在玩了,比如咨询大咖刘润在2022年就公开使用数字人做短视频了。但为什么几年下来,数字人以及数字人直播间一直默默无闻、并没得到大的推广和普及呢?
2、数字人没有解决根本痛点
虽说“采销东哥”的直播数据很不错,但就连一手打造“他”的京东云言犀都表示:“数字人在研发过程中,就不是基于代替当下真人直播为目的,而是希望数字人凭借极高的可塑性与持续稳定的输出能力,与真人团队有机协同,拉满增量。”换句话说,数字人主播本来就不可能替代真人主播,最多也就是在真人主播时间不够或精力不济的时候,盯一盯场子。
商业世界里,无论在任何场景下,真诚都比套路更重要,情感连接都更能打动消费者。真人主播可以通过情感交流引起观众共鸣,从而和他们逐步建立信任。而消费者在下单前,也更愿意倾听真实主播分享自己的生活经验、个人故事或者使用心得,这样才更能激发大家下单购买的欲望。而这些恰恰是数字人的短板,即使声音再逼真、动作再流畅,也无法带来有温度的情感传递,这是数字人最致命也是最无解的Bug。采销东哥5000万的GMV 一直被人津津乐道。但如果让刘强东夫妇真人出境直播,K哥要说不管直播效果,还是带货数据要好上10倍以上,相信大家没意见吧?
03
AI搜索:绝不是“搜索+AI”
1、“搜索+AI”的产品误区
“把AI当搜索引擎用,是不对的。”李开复在接受某科技媒体采访时,专门用了较长的篇幅,就很多人“把AI当搜索引擎用”这一现象,表达了自己的态度。在李博士看来,如果只是查天气、查交通线路这样的基本问题,大家使用搜索引擎就够了,大可不必用AI工具。如果只是因为AI“长得”像搜索引擎,就把它当成搜索引擎,其实是忽视了AI的真正潜力,属于严重的大材小用。AI的能力远远超出简单的信息检索,它可以在多个领域提供创新的解决方案,包括NLP、机器学习、图像识别、预测分析等。
以Perplexity和new bing为例。Perplexity可以根据用户需求,和上下文理解,生成高质量的文章或报告。还可以分析大量数据,识别趋势和模型,为个人或企业决策提供更强大的支持。而New Bing同样具有传统搜索不具备的功能,比如可以根据用户的搜索历史和偏好,给出更接近用户需求的个性化建议,等等。AI的这些理解、学习和预测人类行为,提供个性化服务,甚至进行创造性工作的能力,是传统搜索难以相提并论的。
2、提问的能力,比获得答案的能力更重要
爱因斯坦有句名言:"一个人提问的能力,比回答的能力更重要。" 这句话在AI时代,显得尤为正确和深刻。身处AI时代,获取答案的能力其实已不那么稀缺。大模型技术大大扩展了普通人的能力边界,只要动动手指,各种智能助理和AI工具,就能马上满足你的各种知识需求。此时,拉开人与人差距的,已经变成了提出问题的能力。AI时代的"提问能力",如同信息时代的"编程能力"一样重要,只有会提问,才能用好AI,让AI更好地为自己服务。
04
AI换脸:AI应用不是法外之地
爱因斯坦说过:“科学是一种强有力的工具。怎样用它,究竟是给人带来幸福还是灾难,全取决于人自己,而不取决于工具。”新时代的AI技术,同样是一把可行善、可作恶的“双刃剑”。
黄晓明曾在某个节目中谈到,自己偶然看到一段本人为某品牌代言的视频,但却怎么也想不起有这回事。直到最后才被发现,是被人用AI换脸换声,动了手脚。其逼真程度差点连他这个当事人都骗了。除了换脸外,还存在其他如“一键去衣”等、利用AI技术开发的擦边球应用。由新技术衍生出的一些不法事件,不时出现在媒体报端,为社会大众敲响了警钟。
AI技术的滥用,不仅是法律问题,也是对社会治理的挑战。但网络不是法外之地,技术的进步也不应以牺牲法律为代价。只有在法律的框架内,合理利用AI技术,才能真正让科技为人类带来更多美好,而不是困扰。
05
ChatGPT增强类应用
1、在ChatGPT暂时薄弱的地方创业
OpenAI创始人奥特曼曾说过一句狠话:“任何试图在OpenAI爆炸半径内建立的初创公司或产品,都会被碾压。”话虽然听上去很狂,但从某个角度来看却是事实。非常值得那些试图在ChatGPT的“短板”和“不足”上发力,攻其不备,一战成名的AI领域创业者,好好思考。
众所周知,AI技术的发展如同摩尔定律般迅速。ChatGPT大模型更是以惊人的速度不断迭代,每一次迭代,都意味着能力的巨大提升,也一定程度上意味着竞争格局的重塑。那些准备在ChatGPT暂时薄弱的方向创业的人,就像在与一个不断进化的“怪兽”赛跑,很难有胜算。
2、ChatGPT每次更新,都会干死一个赛道
昔日的AIGC独角兽Jasper AI,被ChatGPT亲自下场爆锤,就是最好的案例。Jasper AI成立于2021年,是一家面向自媒体和广告营销群体的SaaS企业,其主打产品是使用GPT-3的API接口,为用户提供各种类型的文案生成服务。在ChatGPT引发热潮之前,他们的工具备受赞誉,第一年收入超4000万美金,2022年又翻了一倍达到8000万美元,估值一度高达十亿美元。直到2022年11月,Jasper AI的好日子算是到头了,OpenAI对ChatGPT进行了功能更新,允许用户上传多种形式的文档。亲自以“官方”之姿进场,轻松碾压了Jasper这个“二创”,让这家曾大受追捧的独角兽,灰头土脸,风光不再。
和Jasper有类似的遭遇的,还有那些英语陪练APP。它们当初也是备受推崇,但随着ChatGPT的出现,大模型的强大威力一下子让它们相形见绌。与陪练App相比,ChatGPT不仅可以更好地理解对话内容,还可以模拟更多的场景,扮演更多的角色,提供更自然、更多样化的练习体验,还可以进行更多即时的互动。这些效果都是陪练App难以望其项背的。
在崭新的AI时代,你的想象力将是唯一的限制。K哥非常赞同这句话。虽然上面说了这么“坑”,但K哥仍然由衷鼓励并大力提倡AI应用创新,这个世界确实有太多方面,值得用AI重做一遍。当然K哥也想提醒有志创业的朋友们,在创业方向的选择上,要更多考虑用户真实需求,而不是凭空想象场景,只有这样创业才能行稳致远。
作者| Mr.K