Na nossa recente publicação no blogue sobre a introdução do arrefecimento líquido num centro de dados arrefecido a ar, partilhei os resultados da primeira grande análise do impacto na eficiência energética e na eficácia da utilização de energia. Essa análise, realizada por uma equipa de especialistas da Vertiv e da NVIDIA, documentou uma redução de 18,1% na potência das instalações e uma redução de 10,2% na potência total do centro de dados, fazendo a transição de arrefecimento a ar a 100% para arrefecimento líquido direto a 75% em conjunto com outras otimizações para fornecer ar, água arrefecida e temperaturas de entrada secundárias.
Como a PUE é insuficiente na avaliação da eficiência do arrefecimento líquido
Embora a potência total do centro de dados tenha sido reduzida em mais de 10%, o PUE para a instalação que analisámos diminuiu apenas 3,3% entre os nossos estudos de linha de base e de otimização completa. A razão para tal torna-se óbvia quando analisa os dados recolhidos durante os quatro estudos incluídos na nossa análise.
No primeiro estudo, no qual o centro de dados foi arrefecido a 100% a ar, a potência total do centro de dados foi de 2.562,8 quilowatts (kW) e a potência de TI foi de 1860,4 kW, resultando numa PUE de 2.562,8/1.860,4 ou 1,38.
Com a primeira introdução do arrefecimento líquido (61,4% da carga), a potência do centro de dados foi reduzida para 2403,1 kW e a potência de TI para 1791,1 kW, produzindo uma PUE de 1,35. No Estudo 3, a percentagem de arrefecimento líquido foi aumentada para 68,6% e a potência total e a potência de TI caíram proporcionalmente. Como resultado, embora a energia do centro de dados tenha sido cortada em 1,8%, a PUE permaneceu plana em 1,35.
A nossa metodologia fornece um pouco mais de informação sobre o que estava a acontecer e aponta para uma métrica melhor que pode ser utilizada para avaliar a eficiência do arrefecimento líquido.
O consumo de energia da ventoinha do servidor diminuiu 41% entre o Estudo 1 e o Estudo 2 e 80% entre o Estudo 1 e o Estudo 4. Nos cálculos PUE, a potência do ventilador do servidor está incluída na potência de TI, pelo que a potência de TI foi reduzida em 7% entre o Estudo 1 e 4. Embora fisicamente integrada com o servidor, a potência do ventilador é funcionalmente mais infraestrutura do que a TI e incluí-la na potência de TI utilizada para calcular o PUE distorce o valor do arrefecimento líquido e pode influenciar o design de formas que podem impedir a verdadeira otimização. Isso levou-nos a procurar uma métrica que melhor reflicta as alterações que estávamos a ver e seja mais valiosa para os designers de centros de dados.
Eficácia total de utilização (TUE): Uma métrica melhor para avaliar a eficiência do arrefecimento líquido
Felizmente, esta métrica já tinha sido definida num artigo de 2013 apresentado na Conferência Internacional de Supercomputação, TUE: Uma nova métrica de eficiência energética aplicada no Jaguar da ORNL.
O TUE é uma métrica semelhante ao PUE que aborda as falhas no PUE quando é utilizado para comparar diferentes abordagens ao arrefecimento. A métrica TUE é calculada substituindo a energia total de TI utilizada no cálculo PUE pela energia total consumida para suportar diretamente funções de TI, tais como unidades de processamento centrais (CPUs), unidades de processamento gráfico (GPUs), memória e armazenamento. Isto separa o consumo de energia de ventiladores e outros auxiliares que não suportam diretamente processos de TI da energia de TI necessária para armazenamento e computação para fornecer uma imagem mais verdadeira da eficácia do uso de energia de TI e, portanto, da eficácia total do uso de energia.
Por exemplo, a PUE no nosso terceiro estudo não mudou da PUE no Estudo 2. Um designer que avalia que os dados podem concluir que não existe qualquer benefício a ganhar ao aumentar o arrefecimento líquido de 61,4% para 68,6%, como fizemos entre o Estudo 2 e 3.
Mas, se olharmos para a AUT para estes dois estudos, os benefícios tornam-se óbvios. A AUT para o Estudo 2 pode ser calculada como 24 03,1 (alimentação do centro de dados) dividida por 1 692,5 (a energia utilizada para suportar funções de TI) para uma AUT de 1,42.
No Estudo 3, o numerador na equação TUE é reduzido de 2.403,1 para 2.360,1, enquanto o denominador permanece constante e o TUE cai para 1,39 — um reflexo mais preciso das melhorias alcançadas através das alterações implementadas no Estudo 3.
A PUE continua a ser uma métrica valiosa para avaliar o efeito de algumas alterações de infraestruturas na eficiência do centro de dados e para comparar a eficiência da infraestrutura de uma instalação com outras instalações do mesmo tamanho e a operar num clima semelhante. Mas não deve ser utilizado para comparar a eficiência dos sistemas de arrefecimento líquido e a ar ou avaliar a eficiência dos designs de arrefecimento líquido. Para isso, a TUE provará ser uma métrica mais precisa e valiosa.
Pode saber mais sobre a metodologia, resultados e conclusões da nossa análise na nossa publicação do blogue sobre a introdução do arrefecimento líquido num centro de dados arrefecido a ar.