本文来自微信公众号“科技云报到”。
是做通用大模型还是垂直大模型,这一个争论在“百模大战”的下讨论愈发热烈。
目前,以微软、谷歌、百度、阿里等为代表的发力于通用大模型的科技大厂,也都开始推动大模型在垂直领域的商业化落地。
比如说,微软和谷歌已将大模型技术融入操作系统、文档、搜索和邮件等产品中,展现了强大的实用价值。
垂直大模型则更为直接的深入特定行业和应用场景,如金融、医疗或零售等,相比于通用大模型,垂直大模型能够更精准地满足行业特定的需求。
说到底,无论是通用还是垂直大模型,其核心点还是落地场景和商业化。大模型重新定义了人工智能的边界和可能性,但更需要的是,在具体的商业环境中找到了新的生存空间和增长点。
在众多垂直领域中,大模型在智能商业BI领域落地尤为引人注目。作为商业决策的关键支撑工具,传统的BI在大数据时代已显得力不从心。
垂直大模型的加入,对话式BI的实现,则为BI带来了前所未有的可能性。
数据分析不再是特定专业人员的保留节目,通过对话式BI,企业每一位员工都可以通过自然语言与系统互动,得到更直观、更个性化的洞察。
从传统BI到对话式BI
第一个需要弄清楚的问题是,商业智能(BI)是什么?
商业智能(Business Intelligence,简称BI)是一套解决方案,通过分析、挖掘、整合和展示企业内外的大量非结构化数据,为决策者提供指导和支持。
具体来说,BI是一套完整的由数据仓库、查询报表、数据分析等组成的数据类技术解决方案,能够实现业务流程和业务数据的规范化、流程化、标准化,打通ERP、OA、CRM等不同业务信息系统,整合归纳企业数据。
BI可以帮助企业深入了解自身运营状况,监测业务流程,掌握市场动态,并基于数据分析来制定战略和战术。
比如BI可以制作满足不同部门、不同层级员工的数据可视化报表,可以帮助一线业务人员实现业务的追踪、预测、复盘等操作;也可以帮助企业高层管理人员,通过商业智能BI的管理驾驶舱、核心KPI指标、集团看板等.
然而,传统的BI系统常常复杂且难以使用,需要通过专业人员来操作和解读。这其中的时间延迟和技能门槛成为了效率和普及的障碍。
另外,数字化时代,无论产品研发、市场营销、财务管理还是客户服务,在经营各环节使用数据支撑决策已成为企业的日常,企业数据分析需求量大幅度上升。
同样,企业的管理者还是普通财务甚至是业务人员都需要利用BI来进行更高效的数据分析和决策。
对话式BI的出现,正是为了解决这些问题和需求。
与传统BI系统相比,对话式BI采用自然语言处理技术,允许用户通过自然语言询问,就像与人类分析师对话一样,从而获取所需信息。这一交互方式大大降低了使用门槛,提高了效率。
普及性与便利性:对话式BI不需要专业的技能和培训,让更多人员可以直接访问和利用企业的数据资源。
实时性与灵活性:对话式查询允许用户实时获取信息,快速响应临时或紧急需求,增强了企业的灵活性和响应能力。
个性化与智能化:通过智能大模型,对话式BI能够理解复杂的查询,并根据个人的需求和背景提供定制化的解答。
集成与扩展能力:对话式BI可以更容易地与其他系统集成,为企业提供更广泛的应用场景和扩展可能性。
对话式BI的崛起并不是偶然的现象,而是商业智能发展的必然趋势。它体现了现代企业对数据分析的迫切需求,以及对便捷、智能和高效工具的追求。
随着这一领域的不断创新和发展,对话式BI将成为未来企业决策支持的重要方向。
可信度挑战
虽然对话式BI提高了效率,但基于通用大模型的对话式BI,其答案的可信度却成了问题。
类ChatGPT产品并不能带来完全准确的回答,主要原因在于两点:首先,类ChatGPT产品更擅长处理自然语言文本数据相关任务,并非专门为数据分析而设计;其次,通用大模型可能存在捏造事实,也即“AI幻觉”。
一些产品可能存在所谓的“AI幻觉”。在BI领域可能是捏造字段,这在数据分析中可能成为致命问题。
为了解决这一问题,一些公司正在积极寻找解决方案。例如,网易数帆最近发布的有数ChatBI产品,就强调在需求理解、过程验证、用户干预和产品运营四个方面确保数据的可信。
网易数帆大数据产品线总经理余利华认为,AI幻觉的产生是由于训练数据不足、文本与表示之间的编解码错误等因素,可怕的是AI并不知道这是幻觉,单靠Prompt(提示)来纠正极为困难。
对此,网易数帆打造可信的有数ChatBI的核心点在于:需求可理解,过程可验证,用户可干预,产品可运营。
需求可理解,是指网易数帆为弥补用户认知和复杂工具之间的门槛,提升准确率,借助大模型的语言理解能力,先进行需求分析,这样即使是完全不懂BI的使用者也能通过需求分析内容判断系统的取数步骤是否正确。
过程可验证,即借助基于大模型的NL2SQL能力实现复核。为了提升NL2SQL能力,网易数帆有针对性地定制生成和优化了超过30万不同类型的问法和SQL。
余利华介绍,网易数帆调优出的NL2SQL领域模型,效果已达到GPT-3.5的水平。
用户可干预,即将数据模型和查询条件结构化,用户可干预可调整,切换数据模型或者查询条件。
产品可运营,即网易数帆为有数ChatBI产品构建了独特的运营反馈机制,用户可以反馈数据的准确性,管理员可运营知识库、标记及优化badcase,从而提升数据可靠性。
仅仅依靠分析领域具备GPT-3.5实力的NL2SQL模型,并不能保证对话式BI返回100%正确的结果,产品的设计对于落地显得尤为重要。
余利华表示,有数ChatBI实现可信的关键,是让用户在结果错误的时候能够认识到那是错的,并通过人工干预得到正确的结果。
在实际应用中,以大型连锁超市的销售部门场景为例,产品人员输入“我想看今年上半年华北地区每个月的利润”,有数ChatBI可给出相应结果,并用自然语言描述了查询的逻辑与步骤。
掌握SQL的专业人员可以点击“更多”按钮查看对应的SQL。如果逻辑有误,例如用户想看“订单日期”在上半年的数据,但是AI筛选的是“发货日期”,用户可点击“修改查询条件”进行对校正。
据网易数帆透露,目前,有数ChatBI在网易公司的应用,已经覆盖产品、运营、市场、财务等非技术人员。
寻找通用与
垂直大模型的平衡点
回到开头通用和垂直大模型的讨论上。
这一次,有记者在网易数帆城市行媒体沟通环节将这个问题抛给了网易。
网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源对此表示:网易目前的实际情况是既做通用的大模型,也做垂直的大模型,这两者之间是支撑的关系,最终的出口是做垂类的模型,从企业服务市场的角度,应用在软件开发和数据分析这两个最关注的领域。
为了实现这一目标,网易团队构建了一个“公共底座”——网易“玉言”大模型。该模型由网易伏羲实验室和杭研的人工智能团队共同推动,后期还将加入更多业务团队共同打造网易集团的大模型底座。
这一次在BI产品上的探索同样做到了在通用和垂直大模型上寻找平衡点。结合通用和垂直模型将有助于提升对话式BI的准确性和适用性,打破了传统商业智能的局限,开启了新的可能。
在大模型掀起的新时代里,许多企业都站在了一个十字路口,开始寻找通用大模型与垂直行业大模型之间的平衡。
通用模型以其强大的语言理解能力为人们提供了广泛的应用前景,而针对特定行业或需求的垂直模型则能更精准地满足实际要求。
实际上,通用和垂直大模型并不是孤立的存在,它们之间的协同作用可能正是推动商业智能向更高层次发展的关键。
通过精准地结合两者的优势,企业不仅能满足现实需求,还能为未来创新铺设坚实的基础。
未来,这一平衡的探索将更多地体现在产品设计和技术创新中。
通用模型可能会继续拓展其在各个领域的应用,同时垂直模型将更加聚焦于某些关键行业,如金融、医疗和教育等。这两者的结合将为实现更智能、更人性化的交互和服务打开新的大门。
从长远看,通用与垂直大模型的协同可能将推动人工智能技术的下一个里程碑。
是否可以在维持通用性的同时,达到针对特定需求的最优解?这不仅是一个技术问题,也涉及到产业战略、商业模式和伦理考量。
随着更多企业和研究机构的共同努力,寻找通用和垂直大模型的平衡点将成为推动商业智能持续创新和高质量发展的关键。
这一过程将揭示人工智能如何真正融入我们的日常生活和工作,为人类带来前所未有的便利和机遇。
结语
对话式商业智能代表了BI领域的一个新方向,其自然的交互方式和快速的响应时间正在改变企业的数据分析方式。
然而,随之而来的可信度挑战需要整个行业共同努力解决。
未来,通过更多的研发投入、跨企业合作以及对通用和垂直模型的深入研究,我们有望见到更加精确、可信和高效的对话式商业智能产品,推动整个商业分析领域向前发展。