本文来自微信公众号“科技云报到”。
没有人能预见未来,但我们可以因循常识,去捕捉技术创新演进的节奏韵脚。
2023年最火的风口莫过于大模型。
2022年底,由美国初创企业OpenAI开发的聊天应用ChatGPT引爆市场,生成式AI成为科技市场热点,ChatGPT背后是深度学习大模型,其理解和生成文字的能力超过以往AI产品。
全球主要云计算公司加入其中,争夺算力、下场开发和销售大模型,云计算市场迎来新一轮竞争热潮,覆盖AI计算所需的算力、算法、数据各层面。
如今,大模型这把火已经从自然语言烧到千行百业。相较于花力气让大模型更流畅地应对各种刁钻问题,MaaS正成为AI大模型比拼的重点。
企业大模型
落地挑战重重
目前,行业大模型跟产业的结合,还处在比较早期的阶段。
一方面,大模型技术的发展日新月异,无论是算力层面、模型小型化、数据标注、数据训练还是开元模型层面,都在快速变化的过程中;另一方面,整个产业对大模型能力和应用方式的理解,也还在初级阶段。
通常来说,一家企业想要搭建行业大模型,有几个环节必不可少:挑选适合自己使用场景的模型,使用云厂商专业工具搭建一体化模型服务,梳理测试用例、建立服务质量评估流程,确保数据及模型应用安全、合规和可控。
而企业想要在实际业务场景中部署使用大模型服务,则面临着成本、数据和安全等诸多落地难题。
首先,计算资源少。大模型需要比较高的计算资源和存储资源。与一般服务器相比,GPU服务器的稳定性比较低,大模型训练需要的GPU经常达到上千张卡。
同时,在训练集群里,连接几百台GPU服务器所需要的网络速度极高,一旦网络产生拥堵,就会影响训练效率。所以很多算法团队倾向于选择专业的云服务厂商进行云服务运维支持。
其次,数据质量比较差。
搭建大模型本身就是一项成本极高的系统工程,需要大量的高质量数据进行训练和优化,还需要经过清洗和预处理,以消除噪声、填补缺失值并确保数据质量。如果导入的数据质量低,那训练出来的模型也会有问题。
第三,投入成本高,这也是大模型落地面临的主要困难之一。大模型需要投入大量的数据、计算资源、专业技术和时间来训练、调试、优化并部署实施。
第四,专业经验少。大模型的开发落地需要比较多的技术和人力资源,部署大模型需要考虑到计算资源、网络带宽和安全性等多方面问题,很多企业比较缺乏相关技术和人才,导致大模型无法顺利落地应用。
MaaS重塑
云计算服务范式
MaaS,即“Model as a Service,模型即服务”,是通过云服务将数据处理和机器学习模型的功能集成到现有业务中,为企业提供智能化、自动化的解决方案。MaaS的大模型可以通过从海量的、多类型的场景数据中学习,总结学习不同场景业务下的通用特征和规则,成为具有泛化能力的模型底座。
数据集仓库、模型仓库、算力平台通过提供零门槛模型体验、快捷的模型使用、完整链路的模型定制和云端模型部署向每个人开放。
从形式上看,MaaS是典型的云智一体。所谓“云智一体”,是三年前百度智能云在战略发布中提出的理念,通过云计算和人工智能融合创新,把算力、框架、模型,场景应用打造成标准化产品,进而降低企业获取和使用人工智能的门槛。
百度、阿里乃至更多云计算企业,如今将目光投向“云智一体”,印证了AI应用能力是云计算产业基础设施成熟后的核心能力。这种能力更在于“智”的水平,在智能基础设施之上的通用型AI产品能力。
从云计算服务范式看,大模型的迭代升级也重塑了传统的云计算服务。以往,云计算更专注算力能力,服务模型集中在IaaS、PaaS、SaaS三层;如今,云计算在大模型驱动下具备了更强的集成能力,在算力、算法和应用层中嵌入大模型,进而强化云计算的“智”,以智能底座集成应用并统一对外输出,实现场景端的生产力解放。
虽然MaaS目前针对的场景还处在基于自然语言处理(NLP)的领域,但是随着技术的迭代,遵循其核心思想进行延展,广义的MaaS恰恰有可能针对上述的难点,发挥重要作用。
在数据清洗和整合方面,MaaS可以帮助企业将来自不同系统和部门的数据进行清洗、整合和转换,形成完整、可靠的数据集。
通过将来自不同部门的数据整合到一个数据仓库中,MaaS可以确保数据的完整性和一致性。此外,MaaS还可以对海量数据进行自动化处理和分析,快速发现业务的异常情况和趋势变化。
在数据分析和挖掘方面,MaaS可以对业务数据进行分析和挖掘,从中发现业务之间的关联和规律,为企业提供更全面、准确的财务数据,并支持更好的决策和管理。
例如,当企业需要进行销售订单和库存的分析时,MaaS需要输入销售订单和库存数据,这些数据可以来自企业的不同部门,比如销售部门、库存管理部门等。之后,MaaS会使用NLP技术自动化处理和分析这些数据,例如,识别和分类订单的状态、计算库存周转率等。
在数据处理的过程中,MaaS会快速发现业务的异常情况和趋势变化,如订单的滞销和库存的积压等。
在智能化决策支持方面,MaaS可以为企业提供智能化的决策支持,通过机器学习模型预测未来的业务走势和财务状况,帮助企业做出更明智的决策。
MaaS会将分析结果转化为易于理解和操作的报告和图表,并提供定制化的业务解决方案。企业可以根据自身的业务需求和数据特点,选择不同的机器学习模型和数据处理算法,以实现更智能化、个性化的业务流程。
MaaS市场竞争激烈
今年3月,百度率先推出文心一言大模型。百度CTO王海峰在中关村论坛期间表示,未来MaaS将成为云计算的主流商业模式,各类应用将基于大模型来开发,每个行业需要打造行业自己的大模型。
大模型将与实体经济深度融合,赋能千行百业,加速产业转型升级,促进经济高质量发展。
4月,阿里也推出了自己的通义千问大模型。时任阿里巴巴集团董事会主席兼CEO、阿里云智能集团CEO张勇当时宣布,阿里巴巴所有产品未来都将接入通义千问大模型,进行全面改造。
阿里云CTO周靖人在今年5月的中关村会议上也提出,MaaS概念正在被广泛接受,模型会作为业务和开发系统开发的重要生产元素。
这背后,AI一直背负着商业化这个难题。而B端市场近年来越发成为互联网大厂的增量市场。
5月,腾讯发布的今年一季度财报显示,当期其营收1500亿元,同比增长11%;净利润258.4亿元,同比增长10%。
净利润(Non-IFRS)325.38亿元,同比增长27%。其中,身处B端市场的金融科技与企业服务板块今年一季度营收同比增长14%达到487亿元。据记者了解,该板块已连续八个季度在腾讯总收入中占比超过30%。
而此前各家云业务纷纷下调价格,不仅体现了B端业务的激烈竞争,在某种程度上也提现了大模型的开发对B端业务成本的影响。
张勇曾表示,未来希望在阿里云上训练一个模型的成本,能够降低到现在的十分之一,甚至是百分之一。即使是中小企业,也能通过云平台获得AI大模型的能力和服务。
目前,行业大模型的前景有赖于行业大模型的技术成熟度,大家的竞争点主要集中在行业数据源。行业不同,所形成的语料不同。厂商所在的优势行业,能够形成训练AI所需要的语料库,越完备的语料,意味着越有优势的AI产品。
同时,在大模型这一赛道上,从来就不是“后来者居上”。只有越丰富的供应,才能带来越多的客户;更多的客户,才能在数据反馈中帮助精进和迭代,从而产生“飞轮效应”。
如长期在机器学习模型有积累的社区Hugging Face,就基于社区已有的开源模型推出了HuggingGPT,以一个大模型调用多个AI模型的方式,迅速将长期积累的模型生态转变成更大的行业影响力。
这个阶段开始,生态的作用就会显现。而这也是为什么构建一个生态,决定了MaaS的高度。但无论处在哪个阶段,最核心的是,大模型依然是一个成本高昂的新事物。
不论在研发、迭代还是使用阶段,大模型都是一个消耗资源巨大、使用成本也不低的“奢侈品”。
所以只有构建一个生态,才能真正通过规模效应降低成本、帮助迭代精进,最后实现大模型和MaaS真正的商业可持续,这更需要生态。所以真正重视大模型,真正重视MaaS的玩家,一定会不遗余力打造生态。
在MaaS新范式的游戏规则中,大模型决定了一开始走多快,生态决定了最后走多远。