本文来自大数据在线。
6月底,全球数据分析领域彻底炸锅了。
两大数据分析企业Databricks和Snowflake纷纷将目光瞄准了AI大模型。要知道,这两位对手平时没少对台戏,为性能、产品和技术经常开撕。但在今年的自家大会上,两家企业却出奇的一致,不约而同将主题定位为:Data+AI,并且宣布巨资加码AI大模型!
先是Databricks宣布以13亿美元收购AI大模型初创公司MosaicML,成为今年以来生成式AI领域内公布的最大一笔收购案。后是Snowflake宣布与NVIDIA合作,共同聚焦AIGC和专有大模型的开发。
可能有人会认为,数据分析企业“参和”到AI大模型领域,不是来添乱就是用于资本市场炒作。不过在笔者看来,数据分析企业们巨资加码AI大模型的背后,恰恰是大数据、人工智能技术经过多年发展与积累之后,数智生产力逐渐深入人心,如何高效、安全、便捷地释放数智生产力已成为数智时代千行百业的一道必答题。
Data+AI的本质:释放数智生产力
Databricks斥巨资收购AI大模型的背后逻辑是什么?
这其实是Data+AI的融合大趋势。
众所周知,进入到数字经济时代,数据已被公认为新的核心生产要素,而AI则被视为具有变革性的生产工具,二者结合有望真正带来生产力的飞跃。业界称之为释放数智生产力。
但高效、安全、便捷地释放数智生产力绝非易事。随着海量数据的增长,以及数据技术、人工智能技术的不断迭代与演进,千行百业的用户们也面临着极为复杂的局面:
其一、数据走向海量化和多样化,数据分析和各类模型也趋于复杂化。以OpenAI GPT大模型为例,近年来每一代GPT模型的参数规模呈指数级增加。如今,市场中千亿级的AI大模型屡见不鲜。
现在,训练一个大模型不仅需要耗费巨大的硬件成本,更需要花费大量精力在数据处理、训练等环节,这让很多用户对于AI大模型抱着“想用却不敢用”的心态。
其二、大量智慧场景的涌现,反向推动了更多的数据训练、推理和分析的需求,这对于数据处理、分析等环节要求会越来越高。而在行业领域,各个业务场景尝试接入AI大模型,除了会带来释放生产力之外,还会将数据处理等环节的要求提升到新的高度。数据处理、分析等需要走向自动化、智能化。
其三、数据消费群体持续扩大,带来了前所未有的数据消费局面。过去,数据消费群体往往是少数管理层;现在,大量的业务场景中均需要对数据进行分析、挖掘,这极大推动了数据消费群体的增加。比如,中国的一些股份制银行或者大型制造企业,其数据消费的月活员工早已过万,并且员工占比还在持续提升,在日常业务场景中,“用数”已经融入到各类员工的工作之中。
事实上,为了更好地帮助用户们高效、安全、便捷地释放数智生产力,数据分析企业这些年在加速推动Data+AI的融合。比如,集成TensorFlow等流行AI框架,支持机器学习工具的开发等。如今,布局AI大模型更像是Data+AI趋势的进一步演进,水到渠成和顺理成章。
那么,生成式AI或者AI大模型会对数据分析带来哪些改变?
首先,AI的融合一定会让数据分析的方式更加智能和便捷,持续降低数据消费和使用的门槛,而生成式AI或者AI大模型则会加速数据分析的智能化,且会对数据分析、智能用数方式带来革命性的影响。
例如,在查询和检索、数据清洗和准备、分析和可视化等诸多环节融入生成式AI能力,让数据分析极为简单与便捷。以数据分析需求的流转为例,过去以以人和人的对话、人和数据平台GUI的互动过程来完成,业务人员、数据分析师和数据工程师之间需要形成从解释需求到反馈方案的循环,且是预设流程,过程复杂、效率低下且优化迭代困难。
而将生成式AI融入之后,真正改变了过去输入方式、交互方式,可以让数据分析更好地契合用户想法。
国内领先的大数据分析和指标平台厂商Kyligence是业界最早探索Data+AI的突出代表。早在2019年,Kyligence就推出了AI增强引擎,可以根据实际的数据特征和查询习惯等主动分析业务用数模式,以实现数据模型自适应匹配业务查询需求,将高度依赖专家且工作量巨大的的数据建模开发与设计等工作变成自动化和智能化。
无疑,生成式AI和AI大模型的融入,带来更加出色的自然语言理解准确度、思考推理能力和以及自然语言的输出,除了进一步让数据分析加速走向智能化之外,也会彻底影响数据分析、数据消费、用数交互等方式,带来变革性的改变。
当下,无论是云服务商,还是数据分析企业,均认可生成式AI融入到数据分析之中,且在加速布局。据悉,在7月14日即将举办的Kyligence用户大会上,Kyligence将带来Data+AI的重磅新品,目标直指大模型时代下的智能用数。
其次,生成式AI或者AI大模型与数据分析平台的结合,未来会让行业的专有大模型训练、推理等变得更加简单,大模型成本未来有望大幅下降。
当前,大模型的训练与推理依然是一项复杂且成本高昂的工作,动辄数百万美元的训练和研发费用,让很多用户都叫苦不迭,降门槛和降成本对很多用户而言将是善莫大焉。
有专家就认为,数据分析平台和大模型技术的结合,未来有望让企业可以使用自己的专有数据来简单、快速、低成本进行生成式AI模型的训练和构建,在让用户拥有数据的控制权和所有权的情况下,便捷进行自定义AI模型的开发。
可以说,随着生成式AI的融入,Data+AI正在加速开启新时代,释放数智生产力也指日可待。
如何释放数智生产力:看这里,上海见!
著名AI专家吴恩达认为,随着开源AI算法的普及,成功运用AI技术的关键是数据为中心的AI(Data-centric AI)。深以为然。
今年6月底,13亿美元的收购案为Data+AI打响了第一枪。随着生成式AI、AI大模型开始与数据分析相结合,Data+AI的核心依然是以数据为中心。接下来,Data+AI会对数据分析的交互方式、企业数据使用方式甚至专有大模型的建立等带来哪些新变化和新影响?
即将在7月14日举办的2023 Kyligence用户大会值得密切关注。Kyligence由Apache Kylin创始团队于2016年创办,是目前领先的大数据分析和指标平台供应商,连续三年进入Gartner增强数据分析推荐厂商。
Kyligence在Data+AI的布局,表明中国数据分析企业一直走在业界变革的最前沿,对于AI大模型带来的数据分析交互革命、智能用数同样有着前瞻性的探索和布局。
据悉,在2023 Kyligence用户大会上,Kyligence将会发布Data+AI的重磅新产品。此外,本次大会还将云集海内外行业领袖、技术专家、企业高管以及合作伙伴。此外,来自中金、德邦、平安银行、中信银行、三一重工、亚马逊云科技等多个领域的专家将分享Data+AI领域的诸多重磅内容。
https://www.fromgeek.com/wemedia/267-594676.html