The page you're viewing is for Simplified Chinese (China) region.

The page you're viewing is for Simplified Chinese (China) region.

人工智能领域的液体冷却:加速发展

Benny Bray •

您可能已经了解业界关于生成人工智能 (AI) 的热门话题和讨论以及其对我们的数据中心行业的影响。

也许您已经阅读过相关文章,甚至阅读过 DCD 杂志2023 年 4 月 17 日刊中概述的 AI 基础设施需求。AI 可能引发的需求浪潮将使计算密度进一步超出预期。

由于人工智能需要大量的计算能力,下一代硬件的功耗将产生大量的热量。这些热量会导致性能问题,如果IT设备没有在运行极限内冷却,则可能导致硬件故障。

对于那些为任何新兴技术(无论是人工智能还是低延迟流媒体和游戏)部署高密度解决方案的设施运营团队来说,解决热管理挑战至关重要。

当研究部署生成性人工智能所需的高性能计算所需的基础设施时,我们发现液体冷却系统作为解决空气冷却无法有效管理的高热问题的首要解决方案提供了一个令人信服的案例。

根据 Dell'Oro Group 的数据,随着企业采用更多的云服务并使用人工智能 (AI) 来支持高级分析和自动决策并支持区块链和加密货币应用 ,液体冷却市场收入到 2027 年将接近 20 亿美元,2020 年至 2027 年的 复合年增长率为 60%。

随着人工智能如今成为普通消费者的热门话题,希望将新兴技术纳入其运营的公司将受益于审查当今可用的、可以扩展到未来的液体冷却选项。

为人工智能计算设备部署液冷系统需要采用专门设计的创新型机架系统,以适应并高效管理液冷基础设施。这些机架系统通常配备后门热交换器 (RDHx) 等解决方案。

RDHx 不会占用数据中心的额外占地面积,是将液体冷却架构引入数据中心的绝佳选择,无需彻底改造整个空白空间。

这些热交换器采用不同的冷却介质配置:基于制冷剂、冷冻水和乙二醇,每种冷却介质都有各自的性能差异。

制冷剂介质具有优异的导热性,能够有效地将热量从组件中传导出去,从而提高冷却效率。此外,制冷剂介质还具有较高的热容量,这意味着它们可以在达到饱和状态之前吸收大量热量,即使在高负载下也能确保稳定的冷却性能。

冷冻水系统还具有可扩展性,因为它们可以设计用于处理不同的热负荷并适应未来的扩展。此外,冷冻水系统可以利用现有的基础设施,例如冷却塔或热交换器,从而节省成本并提高能源效率。

乙二醇具有优异的传热性能,能够有效地吸收和散发与其接触的部件的热量。此外,乙二醇的沸点比水高,从而降低了冷却液蒸发和系统过热的风险。

此外,RDHx 的设置将使用被动或主动冷却风扇将空气吸入热交换盘管。

将这项技术引入数据中心还可以提供“房间中性冷却解决方案”,这意味着离开 RDHx 的空气温度接近环境室温,从而减轻周边冷却装置的压力。

对于希望扩展至液冷的数据中心环境,RDHx 是添加更高密度机架的理想解决方案。从现在开始安装被动式后门,可以帮助您在未来密度增加时进行扩展。

RDHx 解决方案也提供了液冷解决方案,但许多企业正在为其集群寻求更精准的解决方案。在研究非改装液冷部署的配置选项时,重点关注两种主要方法:浸入式冷却和直接芯片冷却。

直接芯片液体冷却涉及一种设计,重点是将冷板直接耦合到高热组件、CPU、GPU,在某些情况下还包括内存模块和电源。

直接芯片冷却板位于主板发热组件的顶部,通过单相冷却板或双相流体散热。这些冷却技术可以消除机架内所有设备产生的约 70% 至 75% 的热量,剩余 25% 至 30% 的热量则可以通过风冷系统轻松排出。

浸入式冷却是液体冷却技术的另一种形式,可以将100%的热量转移到液体中。处理介电流体时会比较复杂,而且对于运营团队来说,这是一种与传统风冷方法截然不同的冷却方法。

液体冷却与空气冷却:热管理系统如何发展

当然,液体冷却也存在一些挑战。主要问题是泄漏或其他故障的风险,这些风险可能会导致关键硬件损坏。然而,通过精心设计和深思熟虑的实施,可以将这些风险降至最低,并有效利用液体冷却的优势。

数据中心运营商必须做好准备,转向液体冷却,才能在生成式人工智能时代保持竞争力。液体冷却的优势在于,它能够提高效率、增加机架密度并提升冷却性能,对于希望融入尖端技术并满足由此产生的高密度工作负载冷却需求的企业而言,它是一种必不可少的方法。

要了解液体冷却的未来发展,请阅读 DCD 和 Vertiv 的 《冷却转型》电子书

选择您的本国语言