Dans notre récent billet de blogue sur l’introduction du refroidissement liquide dans un centre de données refroidi par air, j’ai partagé les résultats de la première analyse majeure de l’impact sur l’efficacité énergétique et l’efficacité de la consommation d’énergie. Cette analyse, menée par une équipe de spécialistes de Vertiv et NVIDIA, a documenté une réduction de 18,1 % de l’alimentation de l’installation et une réduction de 10,2 % de l’alimentation totale du centre de données en passant d’un refroidissement à l’air à 100 % à un refroidissement liquide direct à la puce de 75 %, de concert avec d’autres optimisations pour fournir de l’air, de l’eau glacée et des températures d’entrée secondaires.
Comment l’UEP ne parvient pas à évaluer l’efficacité du refroidissement liquide
Bien que la puissance totale du centre de données ait été réduite de plus de 10 %, l’UEP pour l’installation que nous avons analysée a chuté de seulement 3,3 % entre nos études de référence et d’optimisation complète. La raison en est évidente lorsque vous examinez les données recueillies pendant les quatre études incluses dans notre analyse.
Dans la première étude, dans laquelle le centre de données était entièrement refroidi à l’air, l’alimentation totale du centre de données était de 2 562,8 kilowatts (kW) et l’alimentation des TI était de 1 860,4 kW, ce qui a entraîné un PUE de 2 562,8/1 860,4 ou 1,38.
Avec la première introduction du refroidissement liquide (61,4 % de la charge), l’alimentation du centre de données a été réduite à 2 403,1 kW et l’alimentation des TI à 1 791,1 kW, produisant un PUE de 1,35. Dans l’étude 3, le pourcentage de refroidissement liquide a été augmenté à 68,6 %, et la puissance totale et la puissance informatique ont diminué proportionnellement. Par conséquent, même si l’alimentation du centre de données a été coupée de 1,8 %, l’UEP est restée stable à 1,35.
Notre méthodologie fournit un peu plus de renseignements sur ce qui se passait et indique une meilleure mesure qui peut être utilisée pour évaluer l’efficacité du refroidissement liquide.
La consommation d’énergie du ventilateur du serveur a diminué de 41 % entre l’étude 1 et l’étude 2, et de 80 % entre l’étude 1 et l’étude 4. Dans les calculs de l’UEP, l’alimentation du ventilateur du serveur est incluse dans l’alimentation des TI, donc l’alimentation des TI a été réduite de 7 % entre les études 1 et 4. Bien qu’elle soit physiquement intégrée au serveur, l’alimentation du ventilateur est fonctionnellement plus importante que l’infrastructure informatique et l’inclut dans l’alimentation informatique utilisée pour calculer l’UEP déforme la valeur du refroidissement liquide et peut influencer la conception de manière à empêcher une véritable optimisation. Cela nous a amenés à rechercher une mesure qui refléterait mieux les changements que nous voyions et qui serait plus utile pour les concepteurs de centres de données.
Efficacité totale de l’utilisation (VRAI) : Une meilleure mesure pour évaluer l’efficacité du refroidissement liquide
Heureusement, cette mesure avait déjà été définie dans un article de 2013 présenté à l’International Supercomputing Conference, TUE : Une nouvelle mesure d’efficacité énergétique appliquée à la Jaguar d’ORNL.
TUE est une mesure semblable à celle de l’UEP qui aborde les défauts de l’UEP lorsqu’elle est utilisée pour comparer différentes approches de refroidissement. La mesure TUE est calculée en remplaçant la puissance totale des TI utilisée dans le calcul de l’UEP par l’énergie totale consommée pour soutenir directement les fonctions des TI telles que les unités de traitement centrales (UC), les unités de traitement graphique (UCG), la mémoire et le stockage. Cela sépare la consommation d’énergie des ventilateurs et des autres auxiliaires qui ne prennent pas directement en charge les processus informatiques de l’alimentation informatique requise pour le stockage et l’informatique afin de fournir une image plus fidèle de l’efficacité de l’utilisation de l’énergie informatique et, par conséquent, de l’efficacité totale de l’utilisation de l’énergie.
Par exemple, l’UEP de notre troisième étude n’a pas changé par rapport à l’UEP de l’étude 2. Un concepteur qui évalue ces données pourrait conclure qu’il n’y a aucun avantage à tirer en augmentant le refroidissement liquide de 61,4 % à 68,6 %, comme nous l’avons fait entre les études 2 et 3.
Toutefois, si nous examinons l’ÉTO pour ces deux études, les avantages deviennent évidents. Le TUE pour l’étude 2 peut être calculé comme suit : 24 03,1 (alimentation du centre de données) divisé par 1 692,5 (la puissance utilisée pour soutenir les fonctions informatiques) pour un TUE de 1,42.
Dans l’étude 3, le numérateur dans l’équation TUE est réduit de 2 403,1 à 2 360,1 tandis que le dénominateur reste constant et que le TUE chute à 1,39, ce qui reflète plus précisément les améliorations réalisées grâce aux changements mis en œuvre dans l’étude 3.
L’UEP demeure une mesure précieuse pour évaluer l’effet de certains changements d’infrastructure sur l’efficacité du centre de données et pour comparer l’efficacité de l’infrastructure d’une installation à d’autres installations de la même taille et fonctionnant dans un climat similaire. Mais il ne devrait pas être utilisé pour comparer l’efficacité des systèmes de refroidissement par liquide et par air ou pour évaluer l’efficacité des conceptions de refroidissement par liquide. Pour cela, TUE s’avérera être une mesure plus précise et plus précieuse.
Vous pouvez en apprendre davantage sur la méthodologie, les résultats et les points à retenir de notre analyse dans notre billet de blogue sur l’introduction du refroidissement liquide dans un centre de données refroidi par air.