本文来自微信公众号“光子星球”,【作者】郝鑫。
“豆包”和“DeepSeek”(文中均指代应用)演绎了两个充满戏剧性的故事。
豆包是含着“金汤匙”出生的贵族,被家族上下寄予厚望。背靠字节雄厚的人力、资源和流量,成长为了“2024年国内用户量最大的AI应用”。
按照豆包的“养成计划表”,7000多万的月活还只是开始,今年MAU的目标是2-3亿,冲刺去年底ChatGPT的水平。
美好的计划被跑出来的“黑马”所打破,伴随着高涨的科技情绪,DeepSeek短暂地成为了春节期间的“国民App”。
“超越”以肉眼可见的速度具象化。据QuestMobile数据显示,1月28日,DeepSeek日活跃用户数首次超过豆包。随后7天狂揽1亿用户,甚至超过ChatGPT的用户增长速度,成为史上用户数增长最快的互联网产品。
另据央视财经,近期DeepSeek访问使用量急速上升,已经成为目前最快突破3000万日活跃用户量的应用程序。
需要特别强调的是,DeepSeek应用爆发完全属于自然增长,官方没有进行任何投流或营销动作。而豆包依靠垄断式投流,已经在市场跑了将近半年。如今,本来在C端AI应用市场上稳操胜券的豆包,有了新的对手,一切发生得始料未及。
DeepSeek成为了搅动市场的“鲶鱼”,给去年即将固化的格局带来了些许松动。
“All in”“不计投入”和“重视人才密度”,从某种程度上看,字节和深度求索公司在AI上有着相似的执念和追求。但结果是,字节仍困在绩效主义漩涡中,而深度求索则真正做到了“跳出大厂射程”。
正如《为什么伟大不能被计划》一书中所提到,若想实现更多所谓的丰功伟业,目标往往会成为绊脚石,比如与探索发现、创造力、发明或创新有关的目标。
“当最伟大的成就被设定为目标时,其实现的可能性就近乎渺茫了。”
无心插柳柳成荫
在很多公开采访中,深度求索都在向外界传递一个观念:专注探索研究,目标指向AGI。
国内标榜自己为AGI布道士不在少数,这也一度叩开了投资者的大门。
大厂为了防御,把鸡蛋放在了不同的篮子里。其他入场玩家迫于生存和融资压力,也不得不把精力留在了应用、To B等方向上。而深度求索在其中是一个另类,从最初的DeepSeek Coder代码大模型到R1推理模型,其方向一直在底层通用大模型能力上做突破。
光子星球了解到,在DeepSeek-R1诞生前,除了部分大厂外,绝大部分AI创业公司已经完全放弃了模型训练。
基础的模型训练犹如无底洞,真金白银砸进去也看不到质的提升。“套壳”和“粉饰”或许才是国内大模型的真相。据某知情人士表示,某AI六小虎在去年年初才开始自己训练大模型,但这丝毫不影响追赶GPT-o1的热潮。
在基础大模型之外,大致可以分为两派,即To B和To C。去年,C端AI应用打得火热,以字节豆包和月之暗面Kimi为首展开了几波线上、线下获客营销大战。初期,大厂和创业公司纷纷下场互不相让。但到后期,以用户量、日活为参考指标拉开了梯队,彼时强劲的选手只剩下了豆包、Kimi和文小言。
尽管投流营销备受诟病,但在功能和产品体验未能拉开明显差距的前提下,豆包和Kimi还是选择了用真金白银换用户增长。
于无形中诞生了一种潜规则:投流力度与日、月活呈正比。AI产品榜数据显示,截至去年12月份,豆包月活7116万,Kimi月活1669万。
DeepSeek的横空出世打破了上述逻辑,用一次智能升级驱动产品升级。在推理模型的加持下,DeepSeek的生成效果与同期竞品有了明显的提升,脱离了爬虫和网页检索逻辑,真正完成了“拆解-思考-推理-生成”的闭环。这就是DeepSeek连续“服务器繁忙”,但依然有大批用户愿意等待的原因,此外亦提供了市场上用户稀缺的价值。
在没有投流的前提下,DeepSeek仅上线一个月日活就超过3000万,这是豆包疯狂推广一年都未曾达到的成绩。
没有过多的优化、UI设计和功能聚合,仅仅是升级新模型能力后顺便上线的一款应用,却达成了意想不到的效果。
不排除有其他的因素放大了对DeepSeek的关注,但至少在AI时代证明了,投流获客逻辑不是万能的。一款能满足用户需求的AI产品,依然能够实现逆袭。
必选题和可选题
AI应用这道考题,深度求索和字节从一开始就出现了分歧。对前者而言是可选题,后者则是必选题。
面对泼天的流量,深度求索有两种选择。
一种是借着这股东风,顺势向C端方向转型,后期持续在该方向上投入资源。另一种是保持最小投入,像通义诞生初期一样,把应用产品作为大模型突破的副产品和展示窗口,主线仍保持不变。
从现在来看,深度求索对流量更多表现为谨慎和放弃。
在流量巅峰时期,其主动进行了锁区,禁止海外非中国用户注册和使用。此外,面对服务器资源紧张的情况,也没有选择扩容,而是暂停了API服务充值。现在打开应用,深度推理功能使用次数超过三次以上,显示服务器繁忙已是家常便饭。
接近DeepSeek的相关人士也告诉我们,深度求索的目标感一直很强,对做一款应用没有太大兴趣,未来的方向可能还是在大模型和开源上。
回到豆包,情况则大相径庭。字节本身就是C端属性很强的公司,豆包作为Flow部门主推的应用产品,前期投入已经消耗巨大,再加上投流和拉指标,沉没成本可见一斑。和DeepSeek角色不同,字节有火山引擎云和Agent平台,无需靠豆包来证明模型能力。
传统的搜索引擎正在被抛弃,AI搜索和Agent未来将一步步取而代之。字节等大厂都在试图创造新的流量入口,豆包现在更像是各类AI功能的集合体。一方面梳理了各类零散的AI应用,另一方面也在为打通软硬件、内外部体系做准备。未来的理想状态是,用户只需要一个对话框就能唤起功能,实现需求。上个时代,搜索引擎,如百度、谷歌掌握了话语权,而现在一切尚未可知。
流量就像潮汐一般,涨落是常态,DeepSeek这波亦是如此。
坦白来讲,DeepSeek现在的用户体验并不是很好,跟成熟的豆包仍有一定距离。DeepSeek赋予的推理能力优势是暂时,开源和公开技术报告的背景下,字节产品化能力依旧能发挥作用,追平只是时间问题。
DeepSeek爆火或许是新的思考时机,比如投流与用户之间的关系,模型能力与用户之间的关系以及产品体验与模型能力优化的平衡等等。
在字节刚结束的全员会上,反思已经开始。
据晚点报道,字节CEO梁汝波提出,2025年将不再把豆包DAU作为具体目标,转而将重点放在追求“智能”上限上。
“不忽略关键技术节点,把智能本身作为最重要的目标,可以激发更多尝试。”
“大力出奇迹”的AB面
“用于判断我们是否朝着正确方向前进的衡量标准,往往具有欺骗性,因为它阻碍了发掘必不可少的踏脚石。”
当站在企业文化维度审视字节和DeepSeek,他们就如同一枚硬币的正反两面,像又不像,在两套标准体系中奔向了不同方向。
拥抱AGI,探索未来世界,两家公司都抱有同样的决心。面对着充满不确定性的AI道路,抱持了不计成本、完全投入的心态,成为了行业中少有的“大力出奇迹”的范本。
但有意思的是,Scaling Law出现了A、B面。
在媒体报道中有一个细节,梁文锋和张一鸣在招聘时,会主动去接触尚在高校的研究生和博士生,并和其一起探讨论文研究中的细节。
落在候选人标准上,梁文锋和幻方一以贯之,“看能力,而不是看经验”,核心技术岗,基本以应届和毕业一两年的人为主。被问及大模型找人的必要条件时,梁文锋给出的回答是“热爱和扎实的基础能力”。
据说,DeepSeek内部有一个不成文的用人规则:工作经验超过8年,直接pass;超过5年,需要特别出色才能入选。
字节则心口不一,热衷于花大价钱挖掘行业中的高P。去年,字节连续出手,将Google原VideoPoet项目负责人蒋路,零一万物黄文灏,和阿里通义大模型原技术负责人周畅收入麾下。
一位曾在大厂体系内任职的人员告诉我们,大厂的机制最终阻碍了创新。
字节等大模型团队身负OKR,评判大模型效果的指标不是达到何种性能或在推理效果,而是能为多少个内部产品赋能,以及产生多少用户量。AGI的远大梦想在实际落地中显得不堪一击,这就导致很多时候越努力,越偏离航向。
深度求索通过顶会论文数量、获奖级别、竞赛级别等近乎苛刻的标准来筛选人才,虽然团队规模不大,但保证了人才质量。
高P华丽的履历却成为了漂浮在大厂上方的光环。
上述人员表示,“大厂在大模型上的投入可能比不上创业团队”。
大厂动辄上百号人,看上去数量十分庞大,但比较分散,落实到具体产品和业务条线错综复杂。由于业务分支过多,聚焦到某个核心环节可能只有十几号人,在这个维度,大厂的投入反而是不足的。
而所谓的大牛和高P,承担的角色更接近“指挥家”。“他们并不会实际参与到训练过程,亲自上手调参,仅在训练思路上给一些指导性意见”。
DeepSeek和豆包只撕开了创新困境的冰山一角。
从去年到现在,AI公司在努力跳出大厂射程,而大厂在试图打碎自身的禁锢,最终或许在深度求索身上看到了希望的影子。