高密度人工智能工作负载正在重塑热策略,混合冷却正在成为可扩展、高效数据中心基础设施的基础。
人工智能不再只是未来的趋势,而是一股正在重新定义数据中心建设、供电和冷却方式的现实力量。这种演变正在给基础设施的每一层带来压力。
IDC 的数据中心愿景研究 预测,全球 IT AI 硬件支出将从 2024 年的 720 亿美元攀升至 2028 年的 2580 亿美元。支持这一激增的机架将变得更加密集,一些超大规模部署的功率将达到 130 kW。
密度的激增带来了一系列新的冷却动态。随着机架功率分布的快速变化,运营商需要能够根据计算需求扩展的自适应、高效的 AI 冷却策略。
混合冷却提供了一种实用的前进道路,它不是作为一种替代,而是一种战略增强,可以帮助数据中心更精确、更灵活地管理不断上升的热负荷。
灵活冷却的案例日益增多
根据 AFCOM 的《2024 年数据中心状况报告》,38% 的运营商表示他们目前的冷却解决方案不足,20% 的运营商正在积极寻求更具可扩展性的替代方案。
IDC 的数据显示,目前超过 80% 的 IT 领导者将生成性人工智能视为需要在电力和冷却方面进行新投资的战略性工作负载。
这一趋势正在重塑市场。Omdia 的预测显示,液体冷却在冷却市场的占比将从 2021 年的 8% 增长到 2028 年的 33% 。虽然空气冷却仍然至关重要,但这些数字预示着更广泛地转向更灵活、高容量的散热解决方案。 (见图1)
图 1. 液体冷却需求不断增长,以满足高密度需求,而空气冷却对于传统 IT 仍然至关重要,这凸显了混合解决方案的需求。来源:Omdia,2024 年 6 月
以上结果并非 Vertiv 的认可。任何依赖此结果的第三方均需自行承担风险。
提高机架功率只是其中一部分。更大的挑战在于规划不确定的未来。许多组织仍在评估如何以及何时扩展人工智能,这使得长期基础设施决策更加复杂。冷却系统必须足够灵活,既能支持当前的工作负载,又能适应未来的变化。—无论是液体冷却、空气冷却还是两者结合。
混合冷却如何与人工智能部署相协调
随着IT设备混合使用液冷和风冷,运营商正在寻找能够有效将两种技术整合到混合冷却系统中的解决方案。混合冷却部署将液冷和风冷的优势整合到一个优化的系统中,从而提供高冷却能力和高效率。定制液冷和风冷的组合可以提高部署策略的灵活性。这种灵活性能够满足人工智能的性能和效率需求,而无需将基础设施局限于僵化的设计。
现代数据中心需要与其支持的 AI 工作负载一样动态的冷却系统。有效的热管理需要根据特定机架密度定制方法。在低密度环境中,空气冷却仍然实用且高效。但随着机架功率接近或超过 50kW,尤其是在 GPU 密集型 AI 训练中,液体冷却对于管理核心热负荷至关重要。即使在这些高密度场景中,空气冷却仍然发挥着辅助作用,通常占散热解决方案的 20% 左右。 (见图 2)
图 2. 按机架密度推荐的冷却方法,显示传统 IT(3-30kW)采用空气冷却,高密度 AI 工作负载(50kW+)采用液体冷却,而混合解决方案则弥补了这一差距。
资料来源:IDC 数据中心愿景,2025 年 3 月
高密度部署通常采用混合策略,将直接液冷与后门热交换器或有源后门等技术相结合。这些配置支持精确的热管理,并支持高密度化,同时不影响性能或效率。

了解详情
高密度冷却:数据中心 AI 和 ML 工作负载的高级散热解决方案指南
人工智能 (AI) 和机器学习 (ML) 的发展,主要通过 ChatGPT 和大型语言模型 (LLM) 等技术,提高了对高性能计算 (HPC) 的需求。
如何冷却未来的基础设施
Uptime Institute 的 2024 年研究 表明,最初为支持 7-8 kW 机架而建造的数据中心现在面临着 30 kW 甚至更高的功率需求。在 AI 部署中,机架持续运行功率超过 100 kW 的情况并不少见。
密度的提升并不意味着传统IT工作负载的消失。低密度机架将继续在企业和主机托管环境中部署。然而,人工智能部署的增长率及其相关的热强度要高得多。
现在,冷却系统必须支持更广泛的机架密度,响应在同一空间内混合部署液冷和风冷IT系统,并随着需求增长而快速扩展。最有效的混合冷却策略具备以下几大运营优势:
- 适应性: 在混合环境中支持风冷和液冷的能力已成为运营商部署AI就绪基础设施的关键决策因素。这种方法可以加快部署速度,并提供灵活性,无需进行全面改造。
- 互操作性: 混合冷却需要所有热力资产的无缝协调。高效的系统能够同步混合冷却架构,保持风冷和液冷机架之间的性能平衡,并根据实时环境条件自动调整自然冷却运行模式,从而最大限度地提高能源效率。
- 可扩展性: 模块化设计支持快速、可重复的部署,并可随着AI工作负载的扩展而无缝扩展。该系统使标准化架构的混合冷却环境管理更加便捷。
- 可维护性: 混合冷却需要专门的液体冷却实施协议,包括 端到端的液体管理专业知识 和经过认证的生命周期维护。这种综合方法能够在不同的冷却环境中保持可靠的运行。
如今,许多运营商专注于扩展现有基础设施的灵活性,而非彻底替换。Vertiv ™ CoolPhase Flex 成套系统 等解决方案切实展现了这些功能。该装置可部署为风冷或液冷系统,并可根据未来业务需求的变化进行转换。这为运营商提供了一种切实可行的方法,使其能够随着人工智能需求的增长而扩展热性能。
为规模灵活性而设计
人工智能的快速普及促使运营商重新思考数据中心基础设施, 并越来越重视模块化、集成冷却和部署速度。在同一设施中同时支持传统IT应用和高密度AI工作负载,需要能够进行调整且无需大规模改造的基础设施。
Compass Datacenters 正在将这种方法付诸实践。该公司致力于设计和建造大型数据中心园区,并与 Vertiv 合作制定了混合冷却策略。该策略通过 一个支持单机风冷和液冷的系统实现。这为 Compass 提供了一种直接引入液冷的方法,并避免了客户需求变化时昂贵的改造。
利用混合冷却释放 AI 的全部功能
混合冷却正成为数据中心适应人工智能的关键策略。机架运行温度更高,工作负载变化更快,冷却系统需要更精准的响应。混合冷却系统允许运营商根据每个部署的具体需求使用空气和液体。它们支持更高的密度,降低升级成本,并在基础设施扩展时保持高效运行。随着人工智能在不同环境中的部署持续增长,这种级别的灵活性至关重要。
探索混合冷却如何将人工智能数据中心的热管理从机架级效率提升到芯片级创新。点击此处下载白皮书: 冷却的未来