本文来自微信公众号“王智远”,【作者】王智远。
刷到小红书的翻译功能了吗?
没有,没关系,告诉你怎么用。三步走:一.去手机应用市场更新最新版小红书;二.进入设置,找到「关于小红书」,点击「检测更新」;三.更新完成后重启小红书,就可以使用了。
然后,在评论区下面,看到纯英文、直接点击翻译按钮,就能实现;不仅如此,它还支持日语、韩语、法语、德语、西班牙语、意大利语等。
我体验一会儿,发现「翻译功能」越来越通人性了。
为什么这么说呢?
首先,在一些陌生网友的帖子下,我试着用非标准的英文表达,比如「you see see you,one day day,just know eat」,它竟然翻译成了「你看看你,一天天就知道吃」。挺有意思。
接着,我又尝试了几个网络流行语。比如:CPDD和on9。它告诉我,CPDD是「处对象」的意思,on9在香港粤语中意味着「傻」。
更让人惊叹的是,它不仅能够处理常规的文字翻译,还能应对一些特殊格式,比如:Unicode、CSS,甚至是摩斯密码,兼容性让人眼前一亮。
虽然不确定翻译是否百分之百准确,但至少目前看来,结果非常「人性化」。
我发现,小红书的翻译功能之所以能够做到这一点,是因为它基于大语言模型(LLM)提示词实现的。
所以,无论是非规范英文、网络用语、表情符号,还是语气词和缩写,它都能结合现状给出贴近实际语义的翻译结果。
不过,目前该功能也还存在一些局限性,对于中英文混合以及英文加表情等内容形式,并没有发现「翻译」按钮;还有,一些特殊语境下,结果还存在不够准确的情况,但总体来说,够用、满足日常需求。
我比较好奇:为什么小红书翻译功能这么厉害?
其实市面上有很多成熟的翻译工具,比如:谷歌翻译、有道翻译。它们各有优势,但小红书的翻译功能确实有一些独特的亮点。
首先,谷歌、有道翻译在处理常规语言时,表现得非常出色。不管是学术文章、正式商务邮件,它们都能提供非常准确、专业的结果。毕竟,在标准语法和正式文本方面,已经很成熟。
相比之下,小红书翻译功能在处理网络热梗、非标准表达时表现得非常灵活。比如:
「yyds、绝绝子」这些网络流行语,或者「you see see you」这种不太规范的英语表达,它能轻松搞定,这是其他产品暂时做不到的。
此外,它似乎有一个缓存机制。
如果某段内容已经被翻译过,它能瞬间完成翻译。不过,当我试图用一些特殊语言或符号进行“攻击”时,它的风控系统非常严密,完全无法突破。
举个例子:我故意输入了一段骂人的话,它会提示“翻译失败,请检查输入内容”。这种对敏感信息的精准识别和拦截,说明它的风控机制非常严谨。
还有一点,小红书的翻译功能与社交平台紧密结合,不需要切换到其他应用,这种无缝衔接的体验,让我的感受更自然。
当然,其他翻译工具也有它们的独特之处,像谷歌翻译有语音输入功能,这对于一些不善于打字的用户来说非常方便;有道翻译对学习外语的学生来说也非常实用。
所以,不同的工具适合不同的场景,小红书的翻译更像一个懂你的朋友。
那么,它到底用了哪家的大模型呢?关于技术细节,在站内直接提问,肯定得不到答案,因为相关回答都被过滤掉。
不过,通过查阅小红书技术团队的公开分享,我发现,他们之前开发了自研的RLHF框架,并使用了PPO(近端策略优化)算法,这是一种被广泛认可的强化学习算法。
此外,小红书在2023年还自研了大模型基座「小地瓜」,虽然目前尚不清楚翻译功能是否直接基于小地瓜,但可以推测技术架构与自研模型有紧密关联。
值得一提的是,它也可能使用了一些外部的API服务。
例如,有第三方插件RedTrans支持小红书的翻译功能,但这并不意味着官方翻译功能完全依赖外部模型,而是可能在某些场景下作为补充。
因此,一个结论是:小红书的翻译功能背后既有自研的大模型技术,也可能结合了外部模型服务。
不过,通过一些技巧,比如使用prompt、<s>、<bos>等标签,还是可以推测出部分系统提示词(system prompt)的内容,当然,这些是我的主观判断。
考虑到如此庞大的语料库和复杂的模型训练,小红书临时抱佛脚的推出这项能力,确实令人惊叹。
所以,这是否会让小红书在AI赛道中更进一步呢?
答案是肯定的。
昨天还看到一篇文章讨论:小红书是否应该做大模型或AI产品?我认为,它一定会做,但不会独立去做,而是会将能力深度融入现有产品中。
从过去举措中,我已经可以看到这种趋势。
比如,2023年3月,小红书筹备独立大模型团队;同年4月,上线主打中国风AI绘图的「Trik」;7月,推出了文生图功能「此刻」。
9月,又开发AI聊天功能「达芬奇」。这些动作都表明,小红书正在将AI技术逐步嵌入到产品的各个场景中。
这些产品里,我对「达芬奇」印象最深,它虽然挺好玩,但有时候也挺「傻」,在遇到复杂问题或者网络热梗,它有点应付不来,回答得不太准,有时候还显得特别死板,不够灵活。
但现在翻译功能,正好补上短板。它不仅能翻译得又快又准,还能识别敏感信息,连网络流行语都能搞定,这样一来,AI能力就更全面了。
除了这些,小红书还在不断探索新的AI应用场景,比如,AI搜索产品「点点」,通过多模态技术让用户可以拍照提问,获取更有“画面感”的回答。
综上,很明显看出:
通过翻译功能和聊天助手提升用户互动,通过AI绘图和内容生成丰富用户创作,小红书正在构建一个智能、便捷,有趣的社区,AI已经全方位渗透到各个场景中。
写到这,我觉得,它潜意识给大模型应用上了一课。
为什么这说呢?
一开始,我看到一些评论,比如:「这AI翻译太神了,完全不像机器翻译」,或者「yyds居然都能翻译出来」,我还以为大家是在开玩笑。
后来,类似评论越来越多,我才意识到,很多人根本不知道大模型已经发展到了什么水平,我们都陷入了信息茧房,关注的视野有限。
像LLM、RAG、MOE等术语,可能已经听惯了,但实际上,它们很小众。
有一个博主的评论让我特别震撼。他说:以后小红书就是我的翻译软件了。下面还有几百个人回复「天才」。这让我意识到,AI在普通用户中的落地应用,还有很大的空间。
因为很多AI产品现在处于一个「中间态」。它们有功能,但没有真正融入用户的工作流。就像你面前有一把锤子,但你不知道怎么用。结果,市场的潜力没有被完全开发出来。
这里我要提到一个概念:技术接受模型(TAM,Technology Acceptance Model),简称TAM。
这个模型到底是什么意思呢?
感知有用性,即,用户认为用了技术能提升工作效率,或者带来其他好处。比如:一个技术产品能让工作更快更好,或者让生活更舒适,大家肯定觉得它有用。
感知易用性,是用户觉认为技术用起来简单不费劲。比如,学起来容易不容易,操作起来顺不顺手,能不能轻松融入到日常生活中。
不过,技术有用不一定就容易用。
有时候,你认为某个技术很厉害,能帮大忙,用起来特别复杂,就会让人觉得麻烦,这是所谓的使用距离(perceived complexity)。
我第一次使用Adobe Photoshop时,头发差点掉光;它的功能藏在一层层的菜单里,连裁剪图片、调整颜色都要经过好多步骤,这种复杂的操作直接把我劝退。
如果用户觉得一个技术不好用、实际帮助不大,他们会对技术敬而远之。
虽然用小红书做翻译软件有点低效,直接用Kimi、豆包APP或者网页版大模型更方便,但很多人就想用小红书翻译功能,这说明小红书的「翻译」按钮是一个真正好用的产品设计。
这些用户可能不知道网页版大模型能做翻译,所以,从来没用过;小红书有了这个方便的翻译按钮后,大家都能轻松使用,这就成了他们的需求。
从今天起,我们得正视大模型落地应用的信息差,技术上微调一下还不够,直接用AI颠覆产品形态也很难,所以,小红书的创新,给我们提了三个醒:
一,AI技术不是高高在上的概念。要融入到产品里,让用户感觉不到它的存在,又能实实在在地帮助大家;二,易用性很关键。产品不能太复杂,得让它变得简单、易用、顺手。
三,市场潜力巨大。许多用户尚未意识到AI强大能力,比如翻译网络热梗或生成个性化图片,这些能力触手可及,恰巧是打开市场的机会点。
AI应用并非千篇一律的大招,希望做产品的朋友,不只盯着应用本身,多关注用户的具体需求和体验。嗯,是「具体的」需求,而非「组合型」需求。