本文来自微信公众号“数据猿”,文/一蓑烟雨。
在这个信息爆炸的时代,数据中心就像是数字世界的动脉,默默地支撑着我们日常生活中的每一次搜索、每一条消息的传递、甚至是每一次智能设备的响应。随着人工智能、大数据分析等智能计算技术的飞速发展,数据中心正经历着一场革命。
不知不觉,智算中心已经在全国各地遍地开花了。
智算中心全国开花
目前,全国已经掀起了一股智算中心建设风潮,各个地方政府,与企业合作,建设了数十个智算中心。接下来,我们来梳理一下比较典型的智算中心。
武汉人工智能计算中心
该计算中心由武汉市委市政府牵头,武汉东湖高新区政府承建,湖北省科技投资集团有限公司与华为共同交付,2021年5月正式投入运行。具体投资规模未明确,但总建筑面积约2300平方米。
该算力中心的人工智能计算能力峰值可达200PFLOPS,HPC超算峰值性能达到4PFLOPS。该中心全面采用华为AI集群Atlas900,基于昇腾910和昇腾310芯片,支持多种AI模型训练及推理。为自动驾驶、城市大脑、智慧医疗等提供算力支撑。计划上线400PAI算力,以服务更多客户。
合肥先进计算中心
该算力中心由合肥市大数据资产运营有限公司运营,2021年6月正式运行。投资规模未公开,但作为重大科技基础设施,投资规模预计相当可观。
算力规模方面,双精度计算峰值12PFlops,整数计算峰值256Pops,数据总存储容量15PB。主要特色是采用浸没式液冷技术,提升能效比超30%。服务于科研创新和日常生活,推动科学技术发展和新兴产业创新。并且在探索超量融合计算在多个领域的应用,加速相关应用产业发展。
南京智能计算中心
由南京市麒麟科技创新园发起,浪潮、寒武纪共同打造,2021年7月正式投入运营,总投资13亿元人民币。
算力规模方面,二期建成后,算力能达到每秒180亿亿次(八进制下1800Pops)。采用寒武纪思元270和思元290智能芯片,提供强大的AI算力服务。支持蛋白质折叠、天文研究等前沿科技领域。采用“一中心、一底座、N平台”模式,支撑科技金融、智能制造等领域的应用创新。
中国电信京津冀大数据智能算力中心
中国电信投资建设,2021年8月投运。作为中国电信在京津冀地区的重要算力基础设施,旨在支持该地区大数据和智能计算需求,推动数字经济发展。
浙江(长三角)新一代全功能智能超算中心
由浙江省桐乡市乌镇高新技术产业园发起,2022年5月正式投入运营。总投资22亿人民币,总算力达到180P。
作为浙江首个超算中心,填补了浙江在国家超算中心领域的空白。该中心也称为“乌镇之光”超算中心,位于乌镇京杭大运河北岸,建筑面积约5万平方米。它标志着浙江在国家超算中心序列中的正式地位,对推动科学技术发展、促进新兴产业创新具有重要意义。
西安未来人工智能计算中心
由陕西省西安市雁塔区未来产业城投资,陕西建工第一建设集团有限公司承建,华为参与建设,2021年9月9日正式上线运营。总投资约为19亿元人民币,一期包含AI算力300P、HPC算力8P,未来总规划算力将达到1000P。
作为西北首个大规模人工智能算力集群,依托充沛的算力资源,致力于推动人工智能产业快速演进,打造西北人工智能创新发展新高地。实现人工智能和高性能计算全栈自主创新,突破软硬件基础关键瓶颈。
中原人工智能计算中心
华为与河南许昌市政府合作建设,2021年10月正式投运。规划建设算力规模300P,其中一期已建成规模100P。
国内第一个完全自主可控的全闪存、绿色低碳人工智能计算中心。采用华为的Atlas900AI训练集群,具有技术领先优势,强大的算力广泛应用于智能制造、智慧农业、无人驾驶、城市治理等科学研究和商业创新。同时,致力于打造绿色数据中心,电力能耗降低70%,存储效率提高35%。
哈尔滨人工智能先进计算中心
哈尔滨市政府投资建设,2021年12月投运。作为哈尔滨市推动人工智能产业发展的重要举措,该中心预计将在数据安全、隐私保护等方面达到国内先进水平,为人工智能核心技术的研究和应用提供支持。
阿里云张北超级智算中心
阿里云投资运营,2022年8月30日正式上线。
算力规模达到12000PFLOPS(每秒1200万亿次浮点运算),使其成为全球最大的智算中心之一。
该中心采用先进的功耗解决方案和清洁能源,实现了高能效比。通过飞天智算平台支撑建设,显著提升了算力效率,实现了千卡并行计算效率的大幅提升,支持AI大模型训练、自动驾驶、空间地理等人工智能探索应用。
此外,阿里云还有乌兰察布智算中心。作为阿里云全栈智能计算解决方案“飞天智算平台”的一部分,乌兰察布智算中心的建设和运营将进一步推动智能计算服务的发展。
商汤科技人工智能计算中心
商汤科技投资,2022年1月24日启动运营。投资约56亿元人民币,一期机柜数量5000个。算力规模方面,峰值训练算力达到3740PFLOPS,位列亚洲最大的人工智能计算中心之一。
该中心的主要特点是一个开放、大规模、低碳的先进计算基础设施,服务于大规模人工智能研发和产业化。将加速国产GPU等智能芯片的研发和应用进程,预计服务器全部到位时,硬件国产化比例将超过50%。
百度智能云-昆仑芯(盐城)智算中心项目
百度智能云投资,2022年9月上线。
算力规模为200PFLOPS,其核心特色是采用百度自研的AI芯片——昆仑芯片。盐城智算中心的上线,展示了百度在智能计算领域的技术实力和应用潜力,该智算中心的建设和运营将进一步推动百度在智能云服务方面的发展。
腾讯长三角(上海)人工智能先进计算中心
作为腾讯在长三角地区的重要布局,该智算中心预计将在推动区域人工智能产业发展方面发挥关键作用,该中心的建设和运营将进一步巩固腾讯在智能计算和人工智能领域的领先地位。
通过分析这些智算中心,可以发现一些明显的特征。比如:多数智算中心由地方政府牵头,联合科技企业共同建设,如武汉人工智能计算中心由武汉市委市政府牵头,合肥先进计算中心由合肥市大数据资产运营有限公司运营;智算中心广泛采用自主研发的AI芯片和技术,如南京智能计算中心采用寒武纪智能芯片,中原人工智能计算中心使用华为Atlas900 AI训练集群,百度昆仑芯(盐城)智算中心项目采用自研的昆仑芯片;智算中心服务领域广泛,不仅支持科研创新,还服务于智能制造、智慧农业、城市治理等多个行业,推动相关应用产业发展。
为什么地方政府和企业突然热衷建智算中心?
在短短几年时间,几十座智算中心在全国各地拔地而起。那么,是什么导致了这一轮的智算中心建设热潮呢?
智能计算数据中心,想象一下,它就像是那种能同时玩转传统画笔和数字平板的艺术大师。不仅能用传统方式储存和处理数据,还能玩转最新鲜的技术花样,比如人工智能和大数据。它们的本领不止于此,还能在处理海量信息的同时,用人工智能的大脑找出数据中的金矿。简单来说,这种数据中心就像是一个智能机器人,能自己思考,自己解决问题,而且效率惊人。
反观传统数据中心,它们更像是那种专注于传统手艺的匠人,基础扎实,专注于存储数据、保护数据不丢失,以及管理网络这样的日常任务。虽然它们做的活儿看起来没那么高大上,但在数字世界的早期,这些数据中心就像是坚实的砖石,支撑起了整个网络世界。
换句话说,智能计算数据中心就像是未来科技的先驱,不仅速度快,效率高,还能自学自进,而传统数据中心则更像是守护着互联网初期记忆的老兵,稳重可靠。两者之间的差异,就像是未来与过去的对话,既有鲜明的对比,也有相互学习的空间。
硬件、能效、运维等方面,智算数据中心都有很大的不同
在探索智能计算数据中心与传统数据中心的世界时,我们不得不提的一个关键差异就是他们的硬件部署策略。这就好比比较一辆配备了最新技术的超级跑车和一辆可靠的家用轿车,两者都有其独特的设计和功能,为不同的需求服务。
智能计算数据中心,这里的硬件就像是跑车的引擎,不仅要强大,还要智能。这种数据中心需要的不仅是速度,还有处理大规模、复杂数据的能力。因此,GPU密集型服务器成为了它们的标配。GPU,或者说图形处理单元,原本设计用来处理复杂的图形和视频内容,但现在它们被用于加速各种计算任务,特别是那些涉及到人工智能的应用。
除此之外,为了进一步优化智能计算的性能,这些数据中心还会部署专用的AI处理器。这些处理器专门为AI计算任务设计,能够提供更高效、更精确的计算能力,就像是跑车中专门为赛道设计的增压器,让数据中心的处理能力更上一层楼。
反观传统数据中心,它们的硬件部署策略就像是家用轿车的设计理念:可靠、标准化、适用于大众。这里的服务器和存储设备通常采用更为标准化的配置,以满足通用计算需求。这并不意味着它们的技术落后,而是说它们更注重于提供稳定、可靠的服务,而不是追求极致的性能。这样的硬件配置虽然可能无法处理最前沿的人工智能算法,但对于大多数日常的计算任务来说,它们绰绰有余。
这种差异,本质上反映了两种数据中心背后的设计哲学和目标用户的不同。智能计算数据中心追求的是边界,是将最新的技术创新应用于解决复杂问题的能力。而传统数据中心,则更多地注重于为广大用户提供稳定可靠的计算服务。就像超级跑车和家用轿车一样,两者都有其价值和用途,关键在于如何根据需求选择合适的解决方案。
除了硬件配置上的差异,智算中心在能效、散热、运维成本等方面,都与传统数据中心有很大的不同。
例如,智能计算数据中心往往利用最新的AI技术来优化能源分配,确保每一瓦特电力都能发挥最大效用。想象一下,这就像是一个智能的家庭助理,它能根据家中的活动安排和能源价格变化,自动调整家电的使用,以达到最优的能源效率。
此外,高效的电源和冷却系统也是智能计算数据中心不可或缺的部分,这些系统能够根据数据中心的实时需求自动调节,从而最小化能源浪费。
智能计算数据中心与传统数据中心,在建设和运维的成本上有着显著的差异,这些差异源自于它们不同的设计理念和技术应用。智能计算数据中心,就像是一辆装配了最先进技术的豪华车,其建设成本自然高于那些像是经典家轿的传统数据中心。智能数据中心投资于高性能计算硬件、先进的冷却系统和自动化能源管理系统,这些初期投入虽然高昂,但长远看来能够通过提高能源效率和减少人工干预来降低运维成本。
智算数据中心将逐步取代传统数据中心?
就像一位赛车手必须不断更新他的车辆以保持竞争力,智能数据中心也需要不断引进最新技术来处理日益增长的数据量和复杂的计算需求。然而,这种快速的技术更新不仅需要巨大的资金投入,还需要持续的技术评估和人员培训,以确保数据中心能够充分利用新技术带来的优势。
随着计算需求的增加,智能计算数据中心的能源消耗也水涨船高。如何有效管理这一高能耗,既满足计算需求又保持能源效率,成为了智能数据中心必须面对的难题。这就像是在保持赛车最高速度的同时,还要确保油耗处于可控范围内,需要精心的策略和管理。
智能计算数据中心的兴起,带来了对能源效率、高性能计算能力和环境可持续性的新要求,同时也推动了数据中心技术的创新和发展。
随着人工智能和机器学习技术的进步,数据中心将越来越多地采用这些技术来优化运营,包括能源管理、故障预测和自动化维护。随着技术的不断发展和对可持续性的增加重视,未来的数据中心将更加高效、智能和环保,为数字化社会的发展提供强有力的支持。
又一轮的数据中心“虚火”?
需要指出的是,中国已经经历了一轮数据中心热潮,建设了很多数据中心,导致不少数据中心的机柜利用率不高。那么,这一轮智算中心建设浪潮,是否会重蹈当初数据中心“产能过剩”的覆辙呢?
当前,中国正经历一轮智算中心的建设高潮,这背后既有对人工智能发展潜力的乐观预期,也有地方政府推动科技产业升级的强烈愿望。然而,正如此前数据中心建设热潮后遗留的一些问题所示,不加区分的大规模扩张可能会导致资源浪费和低效利用的问题。
智算中心的建设应以市场需求为导向,历史上数据中心的“产能过剩”部分原因在于前期过于乐观的市场预期与实际需求不匹配。智算中心的建设同样需要进行精确的市场调研,确保算力供给与未来的技术需求、产业升级需要相匹配。例如,深度学习、自动驾驶、生物医药等领域对于算力的需求正在快速增长,智算中心的规划建设应针对这些领域的特定需求,避免盲目扩张。
政府在智算中心建设中扮演重要角色,应通过政策引导避免同质化竞争和无序扩张。一方面,政府可以通过制定标准和引导资金,鼓励智算中心向绿色、高效、专业化方向发展。另一方面,通过区域协调和规划,实现智算中心的合理布局,避免资源在某一地区的过度集中和浪费。
智算中心的建设与产业链的协同也非常关键,通过与上下游企业——包括硬件供应商、软件开发商以及最终的应用场景企业——的紧密合作,智算中心能够更好地服务于产业需求,促进新技术的快速应用和产业化。
总的来看,虽然智算中心建设面临着重蹈数据中心“产能过剩”覆辙的风险,但通过市场导向的精准规划、技术与管理的持续创新、政策引导及区域协调、产业链的紧密协同等策略,可以有效避免这一问题,推动智算中心健康、高效、可持续地发展。
文:一蓑烟雨/数据猿