模型之战:当金融业与生成式AI相遇

蔡鹏程
每当AI浪潮涌起,作为数据密集型产业典型代表的金融业,总是会被推上时代潮头。最新的案例无疑是大语言模型(LLM),自ChatGPT异军突起,国内外科技企业迅速涌入。

1.png

图片来源:视觉中国

本文来自钛媒体,作者|蔡鹏程。

行业进展轰轰烈烈,但真实情况可能并非如此乐观。

“今年3、4月份,中国科技企业都经过了一段焦虑期。最怕睡觉,因为一起床就发现又有一个新的论文和新的产品要研究。”蚂蚁集团副总裁、金融大模型负责人王晓航向钛媒体App回忆。

每当AI浪潮涌起,作为数据密集型产业典型代表的金融业,总是会被推上时代潮头。最新的案例无疑是大语言模型(LLM),自ChatGPT异军突起,国内外科技企业迅速涌入。

今年3月,彭博首度针对金融业推出大型语言模型BloombergGPT,引发市场对金融垂直领域大模型的关注;6月,哥伦比亚大学联合上海纽约大学推出FinGPT。在国内,7月,华为全新发布盘古大模型,金融行业大模型正是其中数个行业通用大模型之一;9月,蚂蚁集团正式发布自研“蚂蚁基础大模型”,以及在此基础上进行定制的“蚂蚁金融大模型”。

此外,度小满发布金融大模型“轩辕”,奇富科技发布“奇富GPT”,恒生电子发布“LightGPT”,“百模大战”显露硝烟。

事实上,金融行业对“模型”并不陌生。在营销、风控、投研、客服等领域,基于机器学习驱动的建模能力已经构成金融机构数智化转型的基础。但是,ChatGPT凭借其背后的大模型——本质是一个海量参数的深度学习算法,展现出的媲美人类水平的内容生成能力、理解能力和快速迭代能力,让大家似乎窥见了未来AI“无所不能”的时刻。

行业进展轰轰烈烈,但真实情况可能并非如此乐观。

大模型潮涌

伴随着科技公司争相入局,金融机构跟进迅速。

邮储银行、兴业银行、中信银行、江苏银行等已与百度展开合作;杭州银行、台州银行等选择阿里;一些国有大行与华为展开合作。比如,工行正通过盘古大模型来打造工行自己的金融大模型;建行、交行与华为当前的合作聚焦在代码辅助、知识检索等场景,已经完成百亿大模型部署。

刚刚过去的财报季中,工商银行、农业银行、中国银行、交通银行、招商银行、中信银行、兴业银行、华夏银行、浙商银行等9家银行,都在半年报中明确提出正在探索大模型应用。比如,交通银行明确提出已经“组建GPT大模型专项研究团队”。

腾讯云副总裁胡利明向钛媒体App表示,“对于大模型,不同金融机构大方向是有共识的,即不管是短期还是长期,基于大模型的金融领域应用一定要积极去拥抱,如果不去拥抱一定会被淘汰。”

从目前落地的情况看,与文本内容相关的营销、宣传、投研投顾是目前已经落地的主要领域。

比如,招行信用卡基于ChatGPT撰写宣传稿件,写出了“生命的舞台上,我们都是基因的载体”等诗意十足的文案。

投研方面,业内首份采用ChatGPT撰写的行业研究完成度颇高,这份研报介绍了当下轻医美的崛起、中国医美市场现状及相关法律法规、合规要求,盘点了全球医美行业主要参与者,甚至对疫情后中国和全球医美市场进行了预测。

智能客服是另一大被看好的领域。比如,美国互联网保险公司Lemonade推出了基于GPT-3技术面向用户的销售机器人玛雅(AI.MAYA)。当客户有购买保险的意图时,只需与玛雅约两分钟的简单聊天便能识别与处理客户信息,推荐适配的保险产品及报价,促成交易达成。

蚂蚁集团发布的支小宝2.0和支小助两款大模型落地产品同样聚焦在客服及投研领域——前者面向投资者,可以提供行情分析、持仓诊断、资产配置和投教陪伴等专业服务;后者为从业人员在投研分析、信息提取、专业创作、商机洞察、金融工具使用等环节提供服务。

奇富科技则向钛媒体App表示,经过大模型陪练机器人的帮助,奇富的电销系统通话时长提升了15.1%。通话时长的拉升,意味着用户的对话体验有了改善。

顺着这一逻辑再往上游走一步,一些金融机构已经在尝试利用大模型帮助进行产品设计。

以保险产品设计为例,某些险企正在尝试利用大模型优化风险因素识别,帮助分析健康险相关数据,包括历史赔付数据、人口统计和医疗资料等,从中识别出潜在的风险因素,产品精算人员可以更好地理解不同客户的风险特征,并制定相应保险策略。

再往长远观察,大模型背后所蕴含的由AI驱动的自动化投资框架,未来可能会对投资行业产生较大影响和变革。比如,投资决策转向数据与AI驱动,投资者将更多依赖于数据和模型,而非主观判断,这将改变投资行业的决策模式。

难以克服的“幻觉”

AI“无所不能”的时刻似乎近在咫尺,但真实情况并非如此乐观。

在一级市场,Atom Capital通过梳理海外大语言模型+金融领域的创业公司之后指出,大语言模型在金融垂直场景的落地应用出现了“青黄不接”的局面:1,当前创业公司融资金额普遍较小,以100万美金以下的种子轮居多;2,下注投资的大机构非常少;3,尚无能吸引市场注意的“明星项目”。

在广受关注的智能客服场景,一家头部城商行客服部门负责人向钛媒体App表示,“银行客服强调规范化、制式化,目前来看大模型对于客服的提升效果有限。同时我们眼下预算有限,并不打算投入在锦上添花的事情上。”

在投研投顾场景,腾讯云副总裁胡利明则向钛媒体App透露,“目前投研投顾的大部分尝试还没有出现明确的效果”。他提到,目前金融机构明确出效果的场景主要是客服助手和代码助手——即提高代码编写效率。

“幻觉问题”是大模型在落地金融应用时被讨论的最多的一个问题。

所谓“幻觉”,即大模型表现出的似乎具有理解和推理能力的现象,但实际上它们只是通过对大量数据进行模式匹配来实现预测。这种现象可能会给人一种错觉,认为模型具有智能和理解的能力,而实际上它们只是通过统计和概率来进行预测。

上海市数据科学重点实验室主任,复旦大学教授肖仰华将“幻觉”现象视作生成式大模型的“根本难题”。

“创造性是生成式大模型带来的独特价值,而创造性和追求事实之间往往存在矛盾。生成式大模型仅靠自身很难解决这一问题”。肖仰华向钛媒体App表示。

肖仰华还提到了与“幻觉”现象密切关联的缺乏忠诚度的问题,“行业中希望大模型按照我们给的规范、制度、文档回答问题,而不是你从通用领域习得的知识回答问题(Closed QA而非Open QA),大模型因为擅长发挥创造,它很有可能跳出你给定的内容去胡编乱造。”

Atom Capital则认为,“幻觉问题”反映的是大语言模型与金融业存在着内生性矛盾——大语言模型能得到最快速应用的场景,是幻觉能作为“Feature”(优势)而不是“Bug“(缺点)的领域。但金融业的本质之一是对风险的精准定价与管理,基于此为客户提供相应的产品与服务,以确保资产安全,保障投资者利益。

除了“幻觉问题”以外,大语言模型落地金融业还需要满足其他需求。

比如,隐私需求——保护客户账户信息、交易信息数据安全是机构的生命线;性能需求——大模型推理速度偏慢,但金融业常常要求实时决策;场景需求——金融领域有诸多特殊场景、特殊流程,特殊数据结构,或是特殊风险控制逻辑,一般的通用模型显然无法直接适应这些场景;成本需求——通用大模型非常“烧钱”,仅仅是GPT-3的训练所需算力成本就达到了1200万美元。

逐鹿行业大模型

一个基本的判断是:单单利用现在的通用大模型不足以解决以上诸多问题。

肖仰华教授建议,“当下我们要发展面向垂域的大模型,要发展通用大模型的外围插件,要采取大模型和知识图谱、传统知识库相结合的策略。”

与美国同业相比,中国确实普遍将目光聚焦在了针对垂域的行业大模型。腾讯、华为、蚂蚁集团等都在自研通用大模型基础上推出了金融行业大模型,度小满、奇富科技、恒生电子等则密集发布金融行业大模型。

通用大模型过于烧钱,行业大模型则可以显著降低成本。

AI大模型公司智谱CEO张鹏表示,“如果现在从头买显卡做大模型研发,假设需要一万张显卡,一张显卡十几万元,一次性就需要十几亿资金。并且现在这一赛道非常热,有钱一时半会也买不到。”

而据钛媒体App了解,目前金融机构与第三方公司合作私有化部署行业大模型的价格约在数千万元级别。而金融机构如果选择MaaS(Model as a Service)模式,开发者可以通过API调用来使用第三方公司的行业大模型功能,而不需要自己构建和训练模型,成本将更加显著下降。

胡利明提到,金融机构在与腾讯大模型合作时,腾讯可以基于已有行业大模型,以热启动的形式部署在金融机构内部,再叠加向量数据库、导入金融行业专业数据,整体训练成本将降低到训练大模型成本的几十分之一甚至几百分之一。

行业大模型显然也更加理解行业。中金公司在研报中形容,大模型的迭代是一场“暴力”填数据、拔规模而造就的“美学盛宴”。而小模型的训练数据量与参数量较少,其优势在于“专精”,贴近真实场景(具备行业know-how),可满足特定任务需求。

但是,行业大模型并无法改善“幻觉”现象。

对此,肖仰华教授提到,要“尤其注重大模型和相关技术,比如知识图谱技术的协同”。他表示,知识图谱技术往往擅长表达的是专业知识、私密知识,和可理解、可控的符号知识,其和大模型所表达的参数化的,不可理解的知识是一种紧密的互补关系,而不是对立关系。

对此,业内也已有所实践。王晓航向钛媒体App表示,蚂蚁金融大模型采用了“知识图谱与大模型相结合的双驱动方式”。“在需要严谨程度更高的场景,通过已积累的金融领域知识图谱来确保专业和严谨性。在投教或客服场景,会适当更放开一些,交给大模型参数知识。”王晓航表示。

同时,行业大模型往往需要处理敏感的行业数据,对数据隐私和安全提出更高的要求,这一点在金融行业体现尤甚。

关于这一点,胡利明向钛媒体App表示,数据同质化以及数据孤岛问题的依然存在,依然在影响着模型训练效果。“比如投研投顾方面,各家机构的数据比较同质化,与以前应用的数据源也比较类似,现在很难找到独特的数据源来明显提升模型训练效果。”胡利明提到,期待国家层面出台相关的具体标准和规范,使得行业和机构获得更加明确的指引。

商业化为时尚早

技术门槛相对较低,商业化潜力更高,是行业大模型受到追捧的重要原因。

诚然,开源大大降低了数据处理与技术开发的门槛。基于大通用模型的开源,只需要使用特定行业的数据进行微调,即可产生“行业大模型”,而行业大模型的出现似乎为各个垂直领域带来了巨大的机会。

国内金融机构对于大模型的早期探索正是主要基于彭博BloombergGPT与开源的金融大模型FinGPT,金融机构得以基于已有的开源框架进行指令微调,快速实现任务部署。

但目前情况正在出现某些变化。随着《生成式人工智能服务管理暂行办法》8月正式落地,传统金融机构对境外开源大模型的使用愈发谨慎,逐步转向基于境内开源大模型应用,为国内的金融行业大模型打开了更广阔的市场空间。

但也有市场观点认为,目前国内大量涌现的行业大模型可商用性比较低,并不具备真正的竞争壁垒。“技术上,因为它们大多基于相似的开源技术和通用大模型进行微调,很少有真正的技术创新。数据上,尽管行业数据是关键,但许多企业并没有真正挖掘、整合和利用这些数据的能力,使得其微调的效果并不理想。”

恒生研究院院长、恒生电子首席科学家白硕则充分肯定了行业大模型的商用意义所在,“真正的专业能力和专业资源掌握在行业手中。当大模型的语言能力几近封顶时,比拼的必然是专业资源和专业能力。”

在他看来,行业大模型商用的关键是大模型与行业的“对接”,“行业大模型不是要把这些资源和能力复制或者嵌入到大模型里,而是要把大模型的语言能力与行业的专业资源和专业能力相对接。行业的专业资源和专业能力,才是行业自然语言的真正grounding(语义落地的根基)。”

综合在国内金融大模型的应用接入情况,进展仍比较初步。度小满开源的“轩辕”金融大模型宣称已有上百家金融机构申请试用;恒生电子宣布已面向20家金融机构开启金融大模型“LightGPT”内测;蚂蚁集团“支小助”正与蚂蚁平台合作机构内测共建。

蚂蚁集团首席技术官何征宇认为,AI大模型现在还处于非常早期的阶段,尚不足以明确的去谈论商业化。同时,AI大模型的不精确性是阻碍其商业化的一大问题,“商业需要的是准确性,需要准确地衡量或者反馈价值,但AI大模型在某种意义上牺牲了精确性,而获得了泛化能力,这需要未来探索出一个新的商业模式。”

“当前是一个技术的婴儿期,你没有办法确定明天是当医生还是当警察。”何征宇向钛媒体App表示。

(本文首发于钛媒体App)

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论