本文来自微信公众号“极客网”,作者:朱飞。
6月26日自2022年底以来,随着ChatGPT横空出世并迭代升级,全球各国、各行各业面对AI大模型似乎都FOMO了(Fear of Missing Out,错失恐惧症),动作频频生怕错失机遇。
然而迄今为止,在轰轰烈烈的“炼大模型”过程中,除了英伟达赚得盆满钵满外,其他玩家都还没找到稳定且持续的商业模式。相反,随着参数规模的日益膨胀,模型训练的算力开支越来越高,大投入却看不到产出的情况下,新的“焦虑症”又蔓延开来。
在大模型“军备竞赛”最激烈的美国,资本市场近乎进入“癫狂”状态。这两年来,美股市场只要跟AI相关的股票都涨疯了。苹果一个AI进展发布会,隔天市值就上涨2142亿美元;以微软为首的美股“Big 7”的市值,更是达到史无前例的14万亿,占据标普500的32%,纸面市值与实际价值倒挂,“癫狂”程度史无前例。投行分析师们开始焦虑一个比互联网泡沫更大的AI泡沫即将到来。
在中国互联网圈,巨头们焦虑与美国的差距的同时,开始不断压低每Token的价格,提前开启简单粗暴的价格战。其中,字节跳动豆包大模型将通用模型pro-128k版的推理输入价格定在0.005元/千tokens,较行业锐降95.8%;阿里通义千问将主力模型Qwen-Long的API输入价格降至0.0005元/千Tokens,直降97%;百度甚至宣布将文心大模型的两款主力模型ENIRE Speed和ENIRE Lite全面免费。
一方面是AGI的崇高理想,另一边是ROI的残酷现实,面对AI大模型这班开往未来的列车,不“上车”不行,“上车”后找不到好位置、坚持不到终点也不行,到底该何去何从?
在中国政企行业,一群富有远见的先行者将通用大模型与特定行业的专业知识相结合,打造属于自己的专属大模型,以加速行业AI应用落地,真正兑现大模型的价值,为业界走出AI大模型“焦虑症”找到了“最优解”!
中国大模型摆脱“焦虑症”,破局之路在行业
从全球“大模型之争”开启之初,“中美在AI领域差距有多大”就一直都是公众关注的热点议题,从1~2年到8~10年不等。
必须承认,我国在算力、算法和数据领域其实并不具备优势:高端算力卡被英伟达卡脖子无法供应,短时间内自有制程和设计又无法跟上;算法领域,虽然模型数量众多,但大多数是基于国外开源架构优化,缺乏自主性和领先性;数据领域,我们的开放数据和国外不在一个数量级上,中文语料严重不足。
这些差距是短期内难以抹平的,这时候,缩短差距的正确打开方式,自然不是以己之短博人之长。
从另一个角度看,我国有全球唯一的全工业门类、最多的金融消费人群以及最大规模的政务和城市体系,产生了丰富的场景和私有数据,这些都成为发展行业大模型的天然土壤。因此,比拼应用成为中国大模型破局的一条有效路径,通过大模型赋能一个个行业细分场景,最终形成战略突围。
以差异化优势入局,可以预见,今天率先拥抱大模型的行业企业和组织,面对的将是一个划时代的重大战略机遇。
政企行业大模型挑战重重,工程化能力是“胜负手”
当然,站在新时代的起点,政企行业打造大模型,依然是挑战重重,因为大模型的应用本身就是一个复杂的系统工程,除了单点技术的持续突破外,更需要基于场景和需求匹配合适的技术,通过全链路、多技术融合的系统性创新整体推进。
首先,大模型不是孤立的技术,必须重视软硬件基础设施的协同发展。除了大模型本身,我们还需要关注其背后的技术生态系统,包括开发工具、计算架构以及硬件设施如算力、存储和网络。在设计和验证过程中,必须考虑性能、可靠性、可维护性和兼容性,确保系统的高效和稳定运行。
第二,行业大模型需要AI-Native的基础设施。一般企业可以直接选择公有云享受云上的充沛算力,但对于政府、金融、电力等大型政企而言,为了满足安全合规要求,混合云才是更优选,即先借公有云的超大算力和数据训练基础大模型,再在私有云里结合私有数据二次训练得到企业专属大模型,最后在边缘云推理实现场景化应用。
第三,大模型需要建立AI开发工作流,促进模型确定性交付。大模型的开发是一个复杂的系统工程,需要跨团队协作和迭代开发。为了提高开发效率和质量,需要建立一站式的AI开发工作流,实现标准化和自动化,减少开发过程中的不确定性。
第四,大模型需要重视数据工程,打造优质数据集。高质量的数据是大模型成功的关键。目前中文数据集与英文存在差距,需要通过建立数据工程能力,优化数据的供应、流动和使用,为大模型高质量供数。
第五,行业大模型不适合孤军作战,需要着力培育产业生态。生态是发展大模型不可或缺的一环,这需要政府和行业头部企业从技术生态、数据生态、模型生态和应用生态四个层面,去构建AI时代开放、可闭环、有质量的生态体系。
最后,大模型不是一锤子买卖,需要持续运营与优化。大模型运营和建设同样重要,持续的运营和优化对于大模型平台的长期价值至关重要,这要求企业建立适合的流程、组织结构和人才队伍,不断优化现有场景并探索新的应用领域。
一言以蔽之,行业大模型考验的不是单项能力,而是全流程融会贯通的工程化能力。
先行者迈出坚实步伐,行业大模型未来可期
综上不难看出,尽管当前大模型在技术和价格上卷得如火如荼,但其兑现价值的“主航道”在行业,真正的赛点在于落地。在行业大模型的大赛道上,不盲目追求堆算力、堆参数量,而是聚焦技术与场景的深度融合,踏踏实实积累工程化能力,帮助行业大模型落地才是关键。从这个层面讲,AI for industries的华为云与政企行业先行者的联合创新实践,可谓走在了正确的道路上。
去年,华为云就率先发布业界首个大模型混合云华为云Stack。在近期的华为开发者大会上,华为云更进一步发布大模型混合云十大创新技术,包括多样性算力调度、算子加速、云边协同等等。既有根技术研发实力,又有业界最全的AI大模型全套工具链和软硬件产品,华为云Stack一套组合拳下来,行业大模型的焦虑也被治好了大半。
比如,从2022年开始,山东能源集团携手华为云基于混合云打造全球首个矿山大模型,已在煤矿领域9个专业40多个场景应用实践。今年1月,鄂尔多斯与华为联合打造内蒙古首个以行业AI大模型为核心的工业互联网平台,在煤矿领域提升、主运、安监、防冲、采煤、掘进、辅运、洗选、焦化等9个专业实现了26个场景智能化,达到可视、可管、可溯规范化作业,提升安全生产能力的同时有效提高了生产效率和效益。
更值得注意的是,先行政企的行业大模型不仅是自建自用,更是在牵头打造示范场景并沉淀经验,对外输出向行业赋能。比如,鄂尔多斯工业互联网平台目前已完成44个AI大模型应用开发,上架270多款商品,为28家AI企业、16家矿鸿企业共44家应用开发者以及当地300多家矿山生产企业提供了开放可靠的交易平台。
展望未来,相信在华为云及产业上下游各方的共同努力下,依托我国场景丰富的优势,大模型必将能够打开更广阔的行业智能化天地,加速迈向智能世界,释放更大的经济和社会效益!