O uso generalizado de cargas de trabalho e instâncias da inteligência artificial (IA) requer sistemas de alimentação de energia ininterrupta (UPS) capazes de gerenciar mudanças de etapa na carga da unidade de processamento gráfico (GPU) durante as operações, sem disrupções na alimentação de energia. Esta nota técnica detalha como os UPSs de grande porte da Vertiv mantêm com sucesso a estabilidade de energia de acordo com a IEC 62024-3 Classe 1 sob várias condições, servindo como referência de performance para implantações de UPSs que dão suporte aos clusters de IA.
Um teste de performance foi realizado no Vertiv™ Liebert® EXL S1, um sistema UPS de grande porte da Vertiv que compartilha a arquitetura de componentes com o recém-lançado Vertiv™ Trinergy™. No teste, o Vertiv™ Liebert® EXL S1 é interligado com cargas de potêcia de aplicações de computação de alta performnce em data centers de AI. O objetivo principal foi avaliar a capacidade do sistema UPS de manter estáveis a tensão e a corrente de saída.
O teste envolveu monitoramento e análise detalhados dos parâmetros de performance do UPS, incluindo tensão, corrente e frequência de entrada e saída. Ao longo de vários ciclos de treinamento da AI, foi dado foco específico à resposta do sistema UPS aos ciclos com grande quantidade de computação e aos ciclos ociosos da carga de trabalho de AI.
As principais métricas de desempenho foram avaliadas em três cenários diferentes:
- Durante a operação usando a rede elétrica
- Durante a transição da rede elétrica para o gerador
- Durante a operação com o gerador
Ciclo de treinamento de IA em computação de alta performance
A carga de potência da AI (funcionando na GPU NVIDIA H100) consiste em 2 segundos com alta carga de computação a 90% do valor nominal, seguidos por 2 segundos de ociosidade a 50% da potência nominal dos sistemas UPS em data centers de IA.
Visualização com zoom do perfil da carga de potência da IA:
Visualização macro do perfil da carga de potência da IA:
Cenário 1: Operação com a rede elétrica
Neste cenário, foi avaliado o desempenho do Liebert® EXL S1 ao lidar com cargas de trabalho de IA enquanto operava com energia da rede elétrica. A análise se concentrou na tensão, corrente e frequência de entrada e saída durante vários ciclos de treinamento da IA. A carga de potencia da AI introduziu rápidas mudanças na corrente, criando flutuações significativas nos sinais de entrada. Apesar dessas flutuações, o sistema UPS regulava eficazmente a saída, mantendo tensão e frequência estáveis. Observações detalhadas mostraram que o UPS lidou com a pulsante carga de potência da AI sem afetar significativamente os parâmetros de saída.
Tensão e corrente de saída instantâneas ao longo de vários ciclos de treinamento da AI:
Análise com uso de baterias
A seguir, é mostrada a visualização macro da tensão da bateria e da tensão do link de CC do UPS (traçado superior), da corrente de entrada da Fase A (2º traçado), tensão de saída da Fase A (3º traçado) e corrente de saída da Fase A (4º traçado). Não foi possível medir a corrente da bateria, pois ela só foi usada durante a transferência da rede elétrica para o gerador do tipo ‘break before make’. Caso contrário, a bateria nunca é usada já que a carga das aplicações de computação de alta performance pulsam. A tensão de saída é mantida adequadamente dentro da IEC Classe 1.
Cenário 2: Transição da rede elétrica para o gerador
Neste cenário, foi analisada a performance do Liebert® EXL S1 durante uma transição da alimentação pela rede elétrica para a alimentação pelo gerador. Os principais parâmetros, como tensão, corrente e frequência de entrada, foram registrados para observar os efeitos da transição do tipo ‘break before make’ da chave de transferência automática. O foco principal foi avaliar a capacidade do UPS de manter tensão, corrente e frequência de saída estáveis durante esse período crítico de transição. A natureza pulsante da carga de potência da IA introduziu flutuações nos sinais de entrada. Apesar disso, o sistema UPS manteve com sucesso parâmetros de saída consistentes, gerenciando transições de fonte da alimentação sem comprometer a estabilidade da carga.
Tensão, corrente e frequência de saída:
Tensão, corrente e frequência de entrada
Cenário 3: No gerador
Neste cenário, o Liebert® EXL S1 foi testado com carga de potência de IA enquanto operava com alimentação de energia do gerador. O teste incluiu visualizações com zoom e ampliadas dos ciclos de treinamento de IA, com foco na tensão, corrente e frequência.de entrada e saída. O gerador criou flutuações na tensão e na frequência, mas o sistema UPS regulou eficazmente a saída, possibilitando uma variação mínima na tensão e frequência fornecidas à carga de potência da AI. Observações detalhadas revelaram que o UPS de grande porte poderia lidar com flutuações rápidas e altas taxas de rotação na corrente de entrada e manter a estabilidade nas correntes e tensões de saída.
Visão em zoom de um ciclo de treinamento:
Tensão e corrente de saída instantâneas ao longo de vários ciclos de treinamento da IA
Resultado do teste
O teste do Liebert ® EXL S1 demonstrou a capacidade do sistema de proporcionar uma fonte de alimentação de energia confiável para cargas de potência da IA em vários cenários, incluindo operação com o gerador, com a rede elétrica e em transição. Isso facilita a operação contínua e consistente das aplicações da computação acelerada.
Os testes demonstraram que o Liebert EXL S1 pode proporcionar alimentação de energia consistente para cargas de trabalho da IA com um perfil de carga único, que efetivamente se parece com uma etapa de carga repetitiva seguida por uma queda de carga e mantém a conformidade com as especificações para performance da tensão da IEC 62040-3 Classe 1.
Os sistemas UPS Vertiv de grande porte são projetados para gerenciar cargas de potência da IA
As soluções de UPS da Vertiv™ são projetadas para lidar com mudanças de carga em etapas. Embora esses testes tenham sido realizados no Liebert EXL S1, o mesmo comportamento é compartilhado com outros UPSs de grande potência, incluindo o recém-lançado Vertiv™ Trinergy™ e o Vertiv™ PowerUPS 9000.
Além disso, os UPSs de grande porte da Vertiv™ têm capacidade de sobrecarga incomparável e são projetados para suportar também aumentos de carga muito além da potência nominal. Abaixo estão as superiores capacidades de sobrecarga do Vertiv™ Trinergy™:
Vertiv™ Trinergy™ | |
---|---|
Capacidade de sobrecarga a 25 °C |
110% contínua 125% por 10 min. 150% por 1 min. |
Capacidade de sobrecarga a 40 °C |
110% para 550 seg. 125% para 130 seg. 150% para 25 seg. |
Tabela 1. Capacidade de sobrecarga do Vertiv™ Trinergy™
Todos os UPSs da Vertiv são robustos e resilientes, com a habilidade de lidar com o perfil de carga pulsante das aplicações da computação de alta performance.
Conclusão:
As cargas de potência da IA estão mudando o padrão da demanda elétrica em data centers de IA de um padrão constante para um padrão muito variável.
Dois cenários possíveis a serem destacados:
- O usuário quer evitar usar a fonte de energia elétrica ou os geradores locais, que não são dimensionados para suportar a velocidade das mudanças exigida por essas cargas.
- O usuário quer evitar usar a bateria para evitar acelerar seu envelhecimento devido a ciclos de carga/descarga pequenos mas frequentes.
Na aplicação descrita acima, a energia da bateria só era usada quando o UPS de grande porte fazia uma transição aberta da rede elétrica para o gerador.
Os sistemas UPS da Vertiv™ podem dar suporte a ambos os cenários e permitir a proteção e qualidade da energia para todos os casos por meio do design resiliente e algoritmos flexíveis que gerenciam todas as fontes de alimentação em CA e CC disponíveis.