本文来自千家网。
人工智能(AI)的发展,尤其是ChatGPT等生成式AI产品,在过去一年占据了各大媒体的头条新闻。除了颠覆或改善日常生活的潜力之外,人工智能以及所有广泛采用的技术经常被忽视的影响是对数据中心的影响。
经历过移动设备和云的引入和快速采用后,数据中心非常擅长采取积极主动的方法来使用新技术。
由于人工智能仍处于相对不成熟的状态,现在是数据中心专业人员考虑如何应对即将到来的人工智能热潮的关键时刻。
适应新的工作负载
可将人工智能分为四大类:自然语言处理(NLP)、计算机视觉、机器学习和机器人。虽然机器人技术对延迟特别敏感,通常需要边缘计算解决方案非常靠近所管理的流程的物理位置。但预计,前三个解决方案将真正增加对数据中心解决方案的需求。
满足这种不断增长的需求绝非易事。不仅需要考虑托管大量服务器以适应更高密度工作负载的物理影响,还需要考虑如何集成新技术,如液体冷却和沉浸式冷却,以对抗这些服务器将产生的热量。
此外,负载也不稳定。任何时候都可能出现巨大的激增,而从历史上看,数据中心管理的负载相当平稳、一致。
最大的挑战之一是,人工智能不是一个同质实体,而是一种分为两个不同阶段的技术:训练和推理。
成功的数据中心将学会适应这两种情况。人工智能训练将不再需要关注弹性和冗余,而是更多地关注成本、PUE和总体效率。另一方面,推理对延迟非常敏感,需要靠近城域中心,以确保用户界面和应用的快速响应时间。
监管方面
监管机构面临的困难在于不知人工智能将如何发挥作用。其在很大程度上还处于起步阶段,可以理解的是,监管机构希望涵盖所有潜在危险
欧盟的人工智能法案就是一个明显的例子,监管机构将应用分为四个关键风险级别:不可接受的风险、高风险、有限风险以及最小风险或无风险。在其他方面,NIS2指令将扩大预计遵守其网络安全原始法规的部门数量,其中包括现在的数字领域。
包括数据中心在内的许多行业面临的挑战将是确保遵守不断变化的法规。人工智能的发展速度比近年来所看到的任何事物都快,随着监管机构不断更新参数并定义新的风险边界,数据中心肯定会感受到连锁反应。
解决关键短缺问题
众所周知,微处理器的战略价值使其受到政府贸易限制。随着多样化人工智能采用的加速,以及这些应用所需的巨大工作负载,图形处理单元(GPU)变得越来越稀缺。
扩大生产规模并不是一个简单的解决方案。事实上,最近的数据发现,在美国或欧洲建造一座两纳米芯片工厂将花费约400亿美元。虽然有看到各方齐心协力将生产分散到多个地区,并且Vultr和Northern Data等企业正在认真转向创建一个全新的“人工智能云”行业,但在供应与需求相匹配之前,微处理器短缺肯定仍然是一个痛点。
数据中心短缺也是一个令人担忧的问题,但这里的挑战不在于创新,而在于有限的土地和电力资源,更不用说政治了。
解决数据中心短缺问题需要采取双管齐下的方法:a.最大限度地提高电力容量,以提供人工智能所需的低延迟水平;b.同时在有更多可用土地的地区也这样做。寻找偏远地点进行人工智能训练,这样就不会占用大量推理的大都市地区的工作量,这是一种非常有价值的方法。
为人工智能重新配置数据中心
这种最大化现有资源的概念,可以决定如何重新配置数据中心,因为其将可持续性置于战略的核心。
在法国,“零净人工化”是一项旨在阻止城市扩张并维护绿色空间生物多样性的协议。对于数据中心而言,这意味着充分利用现有建筑的潜力,并尽可能地使这些站点更加密集。但要做到这一点,需要进行一些重新配置。
需要评估如何最大限度地利用这些现有站点的空间,以便优先考虑效率,来支持高人工智能工作负载。可持续性不再是一个无形的概念,而是一个非常现实的问题,应该在全球范围内定义重新配置战略。
如果还不开始做出更好的决策,来延长数据中心产品的使用寿命,例如转向改用液体和沉浸式冷却技术,那么之前为适应人工智能密集型基础设施所做出的努力基本上将变得徒劳。
对于任何行业而言,包括数据中心,保持领先于人工智能革命都是一个雄心勃勃的目标。但通过采用先进的冷却技术、遵守不断变化的法规,并抓住一切机会倡导可持续发展,相信有潜力在这个新的技术时代蓬勃发展。