大模型时代,AI芯片公司眼里的中国市场

有人说,在大模型时代,全球范围内真正能做大模型的只有两个国家,就是美国和中国。大模型需要足够大的人才、资本、技术和市场规模及密度,中国和美国是全球唯二具备这样规模的市场,长期机会非常大。

360截图16251112669372.png

本文来自微信公众号“半导体产业纵横”,作者/六千。

这是最好的时代。

有人说,在大模型时代,全球范围内真正能做大模型的只有两个国家,就是美国和中国。大模型需要足够大的人才、资本、技术和市场规模及密度,中国和美国是全球唯二具备这样规模的市场,长期机会非常大。

在大模型还没出现之前,传统人工智能面临着碎片化问题,不同的应用场景有着不一样的需求。而随着大模型的出现,业界相信人工智能将为各行各业带来范式转变。

“大模型是有用的”已经成为共识,谁能在“信息史上第三个平台”上发光发热,成为行业内关心的重要话题。人们相信大模型有能力重塑所有行业,AI芯片行业也不例外。作为算力行业的重要组成部分,芯片公司特别是AI芯片公司也已然开始摩拳擦掌。那么AI芯片公司怎么看待中国算力市场?又打算如何在中国市场打出差异化?

谁是大模型时代的“算力大户”?

大模型需要大算力,因此算力行业作为大模型的支撑行业也受到热议。中国算力市场规模大,同时也有着自己的产业特点。工信部数据显示,到2022年年底,中国算力总规模达到180EFLOPS,存力总规模超过1000EB,国家枢纽节点间的网络单向时延降低到20毫秒以内,算力核心产业规模达到1.8万亿元。

中国算力市场已经成长为全球第二大的算力市场,这样巨大的市场主要的参与者可以主要分为两类:电信运营商和科技公司。

2022年,三大运营商算力规模超过11.8EFLOPS。根据中国移动财报数据,2022年中国移动对外可用IDC机架达到46.7万架,累计投产云服务器超71万台,净超23万台,算力规模达到8.0EFLOPS。中国电信拥有700多个数据中心和3,000多个边缘DC,IDC机架达到51.3万架,算力规模达到3.8 EFLOPS;预计“十四五”末达16.3EFLOPS。中国联通IDC机架规模达到36.3万架,全年算力投资达到124亿元。从算力类型来看,三大运营商主攻底层网络。身为国家队,主导云网资源,乘着“东数西算”之风迅速扩张。

IDC发布的《2021~2022全球计算力指数评估报告》显示,全球计算力水平前三的行业分别是互联网行业、金融行业、制造业。整体来看,大模型时代,互联网成为大模型时代算力市场的主力军。而中国市场孕育了多家互联网巨头,面对上亿规模的用户,中国互联网公司的需求,会在大模型时代为中国算力市场带来新的挑战与机遇。

Graphcore总裁兼大中华区总经理卢涛认为,与被传统的三朵云占据的欧美市场不同,在中国既有很多优秀的云厂商,也有很多选择自建数据中心的大型互联网公司。在国外,即使像Netflix(网飞)这样的大型用户,也没有选择自建数据中心。中国市场头部用户的自建行为对AI芯片公司提出了更加具体、更加多样的需求。

大模型时代人人都要“被集成”

大模型是人工智能的“集大成者”,然而身处其中的玩家却都想“被集成”。

头部大厂如华为、阿里也认为被集成是当下的最优解。“被集成”体现的是在算力市场中,身处赛道中的玩家都需要专心做好自己的核心业务。当大厂选择这样的策略,这也为赛道上的后起之秀留下了机会。

在中国,Graphcore选择坚定地走“被集成”策略。Graphcore在英国以及其他大中华区以外的地区正在尝试向云的形式转型,不以单一硬件为产品进行销售;而面对中国市场,Graphcore选择仍以硬件作为公司的主打产品,坚定地走“被集成”策略。

“被集成”是另一种精益求精。以IPU为例,虽然这种产品在产业中还是“新概念”,但在中国这样巨大的市场,能够让客户满意仍要面对重重考验。因为中国的客户对产品也有着更高、更复杂的需求。中国互联网企业的一个产品可能会被应用在几亿用户的场景中,可以说这些公司对算力产品的使用是最深最透最广的。为这样的客户提供产品是一个“痛苦”的过程,但这样的过程也会打磨出经得起考验的产品。Graphcore相信,从这个角度来看,中国市场可以让行业内公司的产品进步得更快。

追赶者的决心:聚焦与定力

产业相信,在大模型技术高速发展的时代,一系列伟大的公司会因此诞生,新的商业模式将被创造,进而产生新的世界。而这样的时代,会给芯片产业带来怎样的改变?是否能有新的AI芯片公司登上大舞台?

未来怎样的AI芯片能成为主流将与未来算法模型迭代的方式息息相关。目前整个人工智能技术的基础还是以人脑为启发的;如果是这样的形态,就需要未来的芯片能支持巨大模型,要求存储很大,存储很快。

行业瞬息万变,AI芯片公司要积极拥抱变化。目前Graphcore的IPU在AI模型支持方面,已经实现对GPT-2 XL版本、GPT-J、Dolly 2.0、ChatGLM-6B(在使用中可以做到每个token 3.5毫秒)模型的支持。迅速实现对不同模型的支撑,也是一家AI芯片公司的竞争力。

行业的“后来者”如何在这样的市场中竞争?Graphcore表示公司要做的是两件事:一是“聚焦”,二是“定力”。

在大模型时代,寻找属于自己的价值点,是所有想分大模型一杯羹的公司的第一个作业。聚焦了不一定马上会有结果,结果的反射弧可能会比较长,需要一定时间,这时候就需要有定力。在聚焦和有定力的情况下存活下去,直到聚焦和定力产生了结果,最后实现突破。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论