Os sistemas de resfriamento líquido cruzam as fronteiras tradicionais entre TI e instalações, criando desafios, mas também oportunidades para serviços mais holísticos.
Perdida na transmissão
Às 2:00 AM, um alarme de CDU (Unidade de Distribuição de Refrigerante) é ativado em um rack de um data center. A unidade, parte do sistema de resfriamento líquido de TI, interage com o circuito de água gelada das instalações. A equipe de TI recebe o alerta através de suas ferramentas de monitoramento, mas não tem acesso ou autoridade para solucionar problemas de componentes mecânicos. A equipe de instalações tem a experiência, mas não está monitorando o CDU em tempo real. O resultado: um atraso de 45 minutos enquanto as equipes se coordenam, durante o qual as temperaturas do rack começam a aumentar.
Este é um cenário potencial para data centers que adotam resfriamento líquido. O resfriamento por ar mantém em grande parte as equipes em trilhas separadas. TI é proprietário de servidores e switches. As equipes de instalações gerenciam chillers e administradoras de ar. O resfriamento líquido muda isso. Os CDUs, coletores e tubulações em rack não se encaixam claramente em nenhum domínio. Criam lacunas operacionais que afetam tanto o desempenho quanto a confiabilidade.
Uma pesquisa da Uptime Intelligence, o grupo de analistas dentro do Uptime Institute, descobriu que aproximadamente 17% dos data centers usam resfriamento líquido, e mais de 61% estão considerando. Os dados indicam o crescente impulso após sua adoção. À medida que as cargas de trabalho de IA e HPC empurram as densidades de rack além dos 50kW, os operadores enfrentam infraestrutura que atravessa os limites tradicionais das equipes.
Onde o digital encontra o mecânico
O resfriamento líquido introduz uma nova camada entre a planta de resfriamento e o silício. Os CDUs condicionam e distribuem o refrigerante. Os coletores direcionam o fluido para componentes específicos. Estes componentes afetam tanto o desempenho de computação quanto a gestão térmica, tornando críticas as decisões de propriedade.
A complexidade operacional se multiplica quando os inquilinos hiperescala implementam seus próprios servidores resfriados a líquido enquanto dependem da infraestrutura das instalações do provedor de colocação. Os acordos de nível de serviço definem a responsabilidade, mas a realidade operacional frequentemente envolve múltiplas equipes em diferentes organizações. Quem monitora os níveis de fluido? Quem responde aos alertas de pressão? Estas questões destacam a desconexão entre os papéis documentados e a resposta em tempo real.
Quatro abordagens para a responsabilidade compartilhada
Segundo o Uptime Institute, o limite tradicional entre TI e instalações não se traduz claramente para o resfriamento líquido. Os operadores tipicamente adotam uma de quatro abordagens: (Ver Figura 1).
Opção A: Stack propriedade de TI
As equipes de TI gerenciam tudo: desde coletores de rack até placas frias de servidor. Isso simplifica a propriedade, mas assume que TI tem experiência mecânica para o manejo de fluidos e gestão de vazamentos.
Opção B: Stack propriedade de instalações
As equipes de instalações controlam toda a infraestrutura de resfriamento, incluindo os componentes em rack. Aproveita as habilidades mecânicas, mas pode complicar o acesso e o treinamento para sistemas gerenciados por TI.
Opção C: Divisão no limite do rack
Instalações gerencia até o CDU ou coletor do rack; TI maneja a tubulação interna do servidor. Esta divisão é comum em acordos hiperescala-colo onde os papéis operacionais estão claramente definidos.
Opção D: Instalações conecta, TI opera
As equipes de instalações manejam as conexões físicas; TI gerencia o monitoramento e manutenção básica. Adequado para ambientes multi-inquilino mas exige uma coordenação estreita.
Cada modelo funciona em contextos específicos, mas as implementações reais frequentemente envolvem arranjos personalizados.

Figure 1. Vertiv™ Facility and IT boundary responsibility options for a DLC system. Source: Uptime Institute, 2023
O que requer a colaboração
O resfriamento líquido muda mais que apenas o hardware. Muda como as equipes trabalham. TI e Instalações não podem operar de forma isolada quando os sistemas compartilham circuitos de fluido, controles e pontos de falha. A coordenação não é opcional; deve estar integrada no funcionamento da infraestrutura.
Assim é como se vê na prática:
Visibilidade compartilhada: Os alarmes de CDU e instalações devem ser visíveis tanto para TI quanto para Instalações, seja através de painéis integrados ou protocolos de relatórios acordados. O objetivo não é fundir sistemas, mas garantir que ambos os lados vejam os mesmos dados de estado a tempo de agir.
Consciência cruzada específica: O pessoal de TI não precisa se tornar especialista em dinâmica de fluidos, mas deve saber o que significa um alarme de vazamento ou falha de bomba para a disponibilidade do servidor. Da mesma forma, as equipes de instalações devem entender as implicações dos alertas a nível de servidor para poder conectá-las com o desempenho do resfriamento.
Regras claras de escalonamento: Definir quem maneja quais alertas, quando chamar a outra equipe e como conceder acesso a áreas restritas durante intervenções urgentes. Estas regras devem incluir contatos de backup, para que a resposta não seja bloqueada quando o ponto de contato principal não está disponível.
Suporte coordenado de fornecedores: Em ambientes multi-fornecedor, atribuir um papel de coordenação para problemas de integração em todo o stack. Isto não necessariamente significa um único contato consolidado, mas significa esclarecer quem gerencia a comunicação com cada fornecedor e como os conflitos são resolvidos.
Implementar resfriamento líquido com precisão
Quando os componentes como os CDUs caem entre equipes, os tempos de resposta se tornam mais lentos e o desempenho sofre. Evitar essas falhas requer mais que hardware. Requer papéis claros, visibilidade compartilhada e planejamento coordenado desde o início.
Os Serviços de Resfriamento Líquido Vertiv™ ajudam você a fechar essa lacuna. Do projeto até a operação diária, alinhamos a infraestrutura e TI para manter os sistemas funcionando sem os atrasos de transferência.
Entre em contato com um especialista da Vertiv e tome o controle de sua implementação de resfriamento líquido.