¿Qué se necesita para soportar la IA a escala de gigavatios? Vertiv y NVIDIA ofrecen un plano con el GB300 NVL72 en su núcleo.
Cumplir con la promesa de la IA depende de la innovación continua en torno a grandes modelos de lenguaje, incluida la IA agéntica, así como los avances en el diseño de GPU. Sin embargo, también requiere una alineación más estrecha entre los modelos de IA, el hardware de TI y la infraestructura de las instalaciones de soporte desde una perspectiva de alimentación y enfriamiento.
Martin Olsen, vicepresidente de estrategia e implementación de segmentos para centros de datos en Vertiv, se centra en los puntos de contacto entre TI y TO relacionados con la IA y trabaja muy estrechamente con socios clave como NVIDIA. Recientemente, Martin analizó la colaboración continua entre Vertiv y NVIDIA, líder en IA, en varios frentes, incluido el diseño de referencia GB300 NVL72 lanzado recientemente y dirigido a implementaciones de IA a escala de gigavatios. Esta solución admite densidades de rack de hasta 142 kW y a la vez aprovecha el NVIDIA Omniverse para simulaciones basadas en IA.
¿Cómo describiría la asociación de Vertiv con NVIDIA, particularmente en el contexto del desarrollo de infraestructura de IA?
Martin Olsen (MO): Nuestra asociación con NVIDIA es fundamental, no solo estratégica. Nos permite mantenernos una plataforma de GPU por delante, lo cual nos da visibilidad de las próximas dos a tres generaciones de computación. Esta visión de futuro prepara nuestras soluciones de infraestructura para futuras implementaciones informáticas. Somos un actor clave en el ecosistema de NVIDIA y cubrimos pilares críticos como la alimentación, el enfriamiento, los controles térmicos y la optimización de la IA. Al integrar nuestra experiencia, permitimos que NVIDIA entregue su plataforma DGX, incluida la GB300 NVL72, más rápido y a escala, para cumplir con las expectativas de los clientes mientras se planifican las necesidades futuras.
¿Qué hace que Vertiv sea un socio valioso para NVIDIA en esta colaboración?
MO: NVIDIA valora nuestra larga historia de credibilidad y servicio para los principales clientes globales, lo cual da confianza a nuestra asociación. Ofrecemos el portafolio de alimentación y enfriamiento más completo de la industria, lo que reduce la complejidad para NVIDIA al minimizar las interfaces de infraestructura. Nuestra gran inversión en ingeniería, investigación y desarrollo impulsa la innovación, al abordar los complejos desafíos de los centros de datos. Esta capacidad integral, combinada con nuestro enfoque innovador de energía, térmica y controles, crea una relación simbiótica que mejora la capacidad de NVIDIA para implementar sistemas de IA avanzados como la GB300 NVL72.
Una plataforma de GPU por delante: Como señala Martin Olsen, mantenerse a la vanguardia significa mirar más allá de la generación actual de computación. Los líderes de centros de datos que obtienen una perspectiva temprana de las plataformas de próxima generación se encuentran mejor posicionados para diseñar una infraestructura que esté lista para lo que viene.
¿Por qué son importantes los diseños de referencia en su trabajo con NVIDIA y cómo benefician a los clientes?
MO: Los diseños de referencia son la piedra angular de nuestra colaboración con NVIDIA, ya que actúan como un estándar de oro para implementar la computación acelerada como la GB300 NVL72. Ofrecen una descripción completa de las especificaciones de infraestructura, la lista de materiales y los requisitos de rendimiento para admitir las plataformas DGX y los clústeres SuperPOD de NVIDIA. Estos diseños permiten velocidad, escala, eficiencia energética y capacidad de servicio. No son estáticas; los iteramos en un sistema de retroalimentación de circuito cerrado con clientes y socios, y esto mejora continuamente el rendimiento, el costo y la flexibilidad de implementación. Este plano en evolución simplifica la implementación de infraestructura para los clientes con agilidad y eficiencia.
¿Puede explicar qué es la NVIDIA GB300 NVL72 y su importancia desde la perspectiva de Vertiv?
MO: La NVIDIA GB300 NVL72 es una plataforma integral que abarca computación, red y almacenamiento optimizados para la computación acelerada en empresas. Es una unidad de computación, al igual que lo fue una computadora portátil históricamente, pero diseñada para la IA a escala de rack y fila. Vertiv proporciona el marco de energía, enfriamiento y control alrededor de esta plataforma; esto le permite operar de manera eficiente. La GB300 NVL72 es un estándar de oro para clústeres de IA, optimizada a nivel de servidor, rack y sistema. Nuestro rol es fundamental para permitir que esta plataforma ofrezca el máximo rendimiento para las cargas de trabajo de IA.
Más allá del enfriamiento líquido, ¿qué otro valor aporta Vertiv a la infraestructura de IA de NVIDIA, particularmente para la GB300 NVL72?
MO: Si bien el enfriamiento líquido es fundamental —ya que se está transicionando a un 80 % de enfriamiento líquido y a un 20 % de enfriamiento por aire para ahorrar energía—, nuestro valor se extiende aún más. Lideramos todo el tren de potencia, desde la red hasta el chip, con soluciones como sistemas de almacenamiento de energía con baterías y microrredes para gestionar las interacciones de la red. También gestionamos la cadena térmica, desde el chip hasta la reutilización del calor.
Nuestro software de orquestación integra sistemas de alimentación y térmicos para un rendimiento óptimo. Además, ofrecemos modelos de implementación flexibles, desde centros de datos modulares completamente prefabricados hasta patines preintegrados, lo cual reduce el riesgo y agiliza la implementación para sistemas de IA a gran escala como la GB300 NVL72.
Renderizado 3D de una infraestructura de IA de alta densidad diseñada para la plataforma NVIDIA GB200 y escalable para GB300. Admite una carga de 1,4 MW en 20 racks optimizados para DGX, con espacio para cargas de trabajo de próxima generación y cuenta con un diseño modular con el Vertiv™ SmartRun, un sistema aéreo prefabricado para el enfriamiento integrado, la alimentación de extremo a extremo y la gestión de cables.
¿Cómo aprovecha Vertiv la plataforma Omniverse de NVIDIA en esta asociación?
MO: Utilizamos la Omniverse de NVIDIA para crear gemelos digitales fotorrealistas basados en la física de nuestras arquitecturas de referencia, incluidas las de la GB300 NVL72. Esto permite la colaboración en tiempo real con arquitectos, ingenieros y clientes, lo cual se traduce en una rápida iteración y validación del diseño antes de la implementación. El gemelo digital simula virtualmente el rendimiento de la infraestructura, las variables de prueba y los escenarios de falla, para ahorrar tiempo y reducir los riesgos de los proyectos. Esta capacidad se extiende a las operaciones, al proporcionar optimización de bucle cerrado y controles de avance para mejorar continuamente el rendimiento del sistema, lo que la convierte en una herramienta dinámica para decisiones de infraestructura más inteligentes a lo largo del ciclo de vida.
¿Qué áreas futuras de colaboración prevé con NVIDIA, especialmente con respecto a la adopción empresarial y las tecnologías emergentes de IA?
MO: A medida que la IA evoluciona, pasamos de la capacitación a la inferencia, donde la monetización ocurre a través de aplicaciones empresariales como la radiología o la banca. Este cambio creará un ecosistema de IA distribuido, con modelos más pequeños implementados en las instalaciones, en coubicaciones o en el borde, impulsados por la seguridad de los datos, la soberanía, la latencia y las necesidades de integración. Nuestra colaboración con NVIDIA se centrará en respaldar este panorama distribuido, al aprovechar la Omniverse para el diseño y la optimización. También abordaremos áreas emergentes como la IA agéntica y la IA física, lo cual permitirá que nuestra infraestructura respalde la adopción empresarial en diversos sectores y geografías, para escalar desde fábricas de IA centralizadas hasta implementaciones en el borde.
Plano para la era de la IA
El trabajo de Vertiv con NVIDIA marca un cambio de las construcciones personalizadas a la infraestructura escalable y repetible para la IA. Los diseños de referencia como la GB300 NVL72 establecen un nuevo estándar: la integración de energía, enfriamiento y orquestación en un sistema unificado. A medida que la IA pasa del núcleo al borde, esta asociación está dando forma a la manera en la cual se implementa la próxima generación de computación.
Explore lo nuevo en infraestructura de IA: Centro de IA de Vertiv: Transformación de centros de datos modernos para respaldar las demandas de IA y HPC