The page you're viewing is for French (EMEA) region.

Travailler avec un représentant du fabricant Vertiv permet de configurer des conceptions complexes en fonction de vos besoins spécifiques  Si votre entreprise recherche des conseils techniques pour un projet de grande envergure, Vertiv peut vous apporter l’assistance dont vous avez besoin.

En savoir plus

De nombreux clients travaillent avec un revendeur partenaire Vertiv pour acheter des produits Vertiv pour leurs applications IT. Nos partenaires disposent d’une formation et d’une expérience approfondies, et sont particulièrement bien placés pour spécifier, vendre et prendre en charge l’ensemble des solutions informatiques et d’infrastructure avec les produits Vertiv.

Trouver un revendeur

Vous savez déjà ce dont vous avez besoin ? Vous souhaitez profiter de la facilité d’achat et d’expédition en ligne ? Certaines catégories de produits Vertiv peuvent être achetées auprès d’un revendeur en ligne.


Trouver un revendeur en ligne

Besoin d’aide pour choisir un produit ? Parlez à un spécialiste Vertiv hautement qualifié qui vous guidera vers la solution qui vous convient.



Contactez un spécialiste Vertiv

The page you're viewing is for French (EMEA) region.

Comment la redondance N+1 supporte le refroidissement continu des data centers

Les charges de travail d’IA dépassent les limites du refroidissement par air. La redondance N+1 peut contribuer à réduire le risque d’interruptions du système.

Dans les environnements à haute densité actuels, même une courte perturbation du refroidissement peut provoquer une montée rapide de la température. Avec des racks atteignant 100 kilowatts (kW) ou plus, la marge d'erreur se réduit, tout comme le temps de réaction.

Le refroidissement est devenu un enjeu majeur de fiabilité. Selon l’enquête mondiale 2025 sur les data centers de l’Uptime Institute, 14 % des pannes graves sont maintenant liées à des défaillances de refroidissement. Les problèmes d’alimentation électrique restent en tête, mais le refroidissement suit de près (voir Figure 1).

Alors que les installations déploient des infrastructures optimisées pour l'IA, elles atteignent de nouveaux niveaux de performance et de densité de puissance. Par exemple, un rack unique de systèmes NVIDIA GB300 NVL72 peut consommer plus de 120 kW, dépassant largement les limites des conceptions de refroidissement conventionnelles. Cela crée une opportunité de repenser la conception du refroidissement.

C’est là qu’intervient la redondance N+1.

blobid0.png

Figure 1. Selon l’enquête de 2025 de l’Uptime Institute, les défaillances de distribution électrique sont responsables de 45 % de pannes graves, tandis que les systèmes de refroidissement représentent 14 %, soit un risque persistant d’une panne sur sept. Sans mesures d'atténuation adéquates, le taux de défaillance du refroidissement risque d'augmenter avec la hausse des densités des racks. La solution réside dans des mesures proactives : des systèmes de refroidissement redondants et des architectures de refroidissement secourues par une alimentation sans interruption (ASI) conçues pour les seuils de puissance de demain. Source : Uptime Institute

Ce que signifie N+1 dans les systèmes de refroidissement

La redondance N+1 ajoute une unité de refroidissement supplémentaire au-delà de ce qui est nécessaire afin de répondre à la charge thermique complète. Si votre système a besoin de quatre groupes de production d’eau glacée ou unités de distribution de liquide de refroidissement (CDU) pour maintenir les performances, N+1 signifie installer cinq unités. Si une unité tombe en panne, les autres peuvent toujours gérer la charge sans interruption.

Cette approche s’applique à l’ensemble du circuit de refroidissement, y compris les unités de traitement d’air, les boucles de refroidissement liquide, les groupes de production d’eau glacée, les pompes et les régulateurs. Cependant, la redondance doit être intégrée au système.

Un CDU de rechange n'a guère d'intérêt si un seul panneau de contrôle alimente l’ensemble de la boucle.

N+1 n’élimine pas les défaillances. Il peut aider à gérer les interruptions du système.

Que signifie N en matière de redondance ?

Dans la redondance des data centers, N désigne le nombre de composants ou d'unités nécessaires pour supporter la pleine capacité opérationnelle du système. C’est la quantité de référence requise pour un fonctionnement normal sans aucune sauvegarde.

Stratégies de redondance pour l’informatique haute performance

De nombreux opérateurs combinent des niveaux de redondance. Une installation peut opérer une alimentation 2N avec un refroidissement N+1. Cet équilibre dépend de la charge de travail et de la tolérance au risque. Cependant, comme le refroidissement devient un point de défaillance plus courant, la redondance N+1 est devenue le minimum standard dans le secteur pour la conception de systèmes de refroidissement dans les data centers modernes.

Niveau de redondance

Configuration

Protection contre les défaillances

Alignement de la stratégie de refroidissement

Cas d’utilisation typiques

N

Pas de redondance ; tous les systèmes fonctionnent à pleine puissance

Aucune protection ; toute défaillance provoque des temps d’arrêt

Non recommandé pour le HPC en raison du risque d’excursions thermiques

Laboratoires de développement, environnements de test non critiques

N+1

Une unité de secours au-delà de la puissance requise

Protection contre les défaillances uniques

Convient à la redondance des armoires de climatisation de précision/CDU/Pompe au niveau du rack ou de la boucle

HPC d’entrée de gamme, déploiements d’IA à petite échelle

N+2

Deux composants de secours au-delà de la puissance requise

Protection contre deux défaillances simultanées

Utilisé lorsque les exigences de disponibilité sont supérieures, mais que la sensibilité aux coûts demeure


Clusters de recherche, supercalculateur académique

2N

Duplication complète de l’ensemble du système de refroidissement

Un système entier peut tomber en panne sans interruption


Circuits d'alimentation et de refroidissement séparés, incluant souvent des CDU et des régulateurs entièrement dupliqués

Laboratoires nationaux, charges de travail de modélisation commerciale

2N+1

Duplication complète plus un composant supplémentaire de secours

Tolère plusieurs défaillances sur l’ensemble des systèmes

Refroidissement liquide haut de gamme avec circuits isolés, régulateurs redondants et instrumentation

Clusters d’IA à l’échelle du cloud, sites HPC de niveau IV

Distribué N+1

Redondance intégrée à travers les sous-systèmes modulaires

Basculement local au sein de chaque module

Idéal pour les infrastructures HPC conteneurisées ou préfabriquées

HPC modulaire, nœuds Edge IA avec refroidissement intégré

Avantages opérationnels de la redondance N+1

La redondance N+1 des systèmes de refroidissement permet aux installations de maintenir leurs performances en cas de problèmes d'équipement, de maintenance planifiée ou de variations de charge.

Protège la disponibilité du refroidissement pendant la défaillance de l’équipement

Si un groupe de production d’eau glacée ou une CDU tombe en panne, l’unité de secours peut prendre le relais avec un faible impact sur les performances. Cela évite les variations thermiques importantes qui pourraient autrement forcer une réduction de puissance ou déclencher des arrêts.

Permet une maintenance sans interruption

Les équipes peuvent entretenir ou remplacer des composants sans interrompre le refroidissement. Pour les environnements d’IA avec des charges supérieures continues, la flexibilité est essentielle.

Réduit les contraintes grâce à la répartition de charge

Dans de nombreux systèmes, toutes les unités de refroidissement opèrent ensemble à charge partielle, même les redondantes. Cela réduit la contrainte sur les composants et rend les transitions de défaillance plus fluides.

Améliore l’isolation des défauts

Les unités redondantes sont souvent alimentées et contrôlées séparément. Cela permet de contenir les défauts locaux comme les déclenchements de disjoncteurs ou les erreurs d'automate programmable (PLC) avant qu'ils ne se propagent.

Prend en charge la validation en direct

Grâce à N+1 en place, vous pouvez simuler des défaillances dans des conditions de charge réelles. Cela vous permet de tester les temps de réponse, la logique de basculement et le comportement thermique avec moins de risques.

Combler les écarts avant qu'ils ne deviennent critiques

La redondance N+1 ne résout pas tous les problèmes, mais elle vous donne le temps quand cela compte le plus : pendant une panne ou une fenêtre de maintenance. Il s’agit désormais de la référence pour le refroidissement des charges de travail à haute densité, aidant les sites à garder une longueur d’avance sur la demande, à maintenir la disponibilité et à évoluer en toute confiance.

Quelles sont les prochaines étapes ?

Examinez votre architecture de refroidissement. Déterminez le nombre d'unités nécessaires pour rester opérationnel, et si vous disposez d'une marge de sécurité. Cette marge de sécurité constitue votre +1.

L’évaluation des exigences de redondance pendant la planification initiale peut aider à soutenir l’efficacité opérationnelle.

Vous cherchez à optimiser le refroidissement pour les charges de travail à haute densité ? Parlez à Vertiv et explorez des stratégies de refroidissement liquide adaptées à votre data center.

PARTENAIRES
Partner Login

Langue & Localisation