Artigo. Energia e lixo eletrônico: os tsunamis da IA generativa

Por Mark Kidd, Vice-Presidente Executivo e Diretor Geral da Iron Mountain Data Centers & Asset Lifecycle Management, nos escreve com exclusividade sobre uma nova onda.

*por Mark Kidd

A adoção recorde do ChatGPT despertou um enorme interesse - e investimento - em IA generativa. A capacidade do ChatGPT e de outros Modelos de Linguagem de Grande Escala (LLMs) de preencher a lacuna linguística entre humanos e máquinas capturou a imaginação popular e aumentou a conscientização sobre o potencial de automatizar e aprimorar muitos aspectos de nossas vidas. Gostaria de fazer uma breve análise dessa tecnologia fenomenal do ponto de vista da infraestrutura digital necessária para seu sucesso e como dois desafios-chave - a energia e o lixo eletrônico - exigirão atenção especial.

Seja assinante O POVO+

Tenha acesso a todos os conteúdos exclusivos, colunistas, acessos ilimitados e descontos em lojas, farmácias e muito mais.

Assine

A IA generativa impulsionará cada vez mais aplicações na próxima década. ChatGPT, DALL-E, GitHub Copilot e Stable Diffusion são apenas a primeira geração criando e classificando imagens, respondendo a perguntas complexas, criando websites e tornando a programação acessível a todos. Potência de alta densidade, arquitetura modular, conectividade de alta largura de banda para treinamento (input) e inferência (output) e resfriamento avançado são todos fatores críticos. Apoiar essas novas aplicações que prometem acelerar a inovação e até salvar vidas começa passa pela mudança de paradigma no design de infraestrutura que a indústria terá que fazer.

Explosão de energia

De longe, o maior desafio de apoiar a IA generativa é um enorme aumento na carga de energia. Os modelos de IA generativa usam chips de processamento gráfico (GPU) que requerem de 10 a 15 vezes mais energia do que uma CPU tradicional. Muitos modelos têm bilhões de parâmetros e exigem tubulações de dados rápidas e eficientes em sua fase de treinamento, que pode levar meses para ser concluída. O ChatGPT 3.5, por exemplo, possui 175 bilhões de parâmetros e foi treinado em mais de 500 bilhões de palavras de texto.

Para treinar um modelo ChatGPT 3.5, são necessários de 300 MW a 500 MW de energia. Atualmente, um data center típico requer de 30 MW a 50 MW de energia. Um dos maiores campi da Iron Mountain Data Center, no norte da Virgínia, EUA, tem capacidade para 10 data centers. Toda a carga de energia para este campus seria necessária para treinar o ChatGPT 3.5. Enquanto os LLMs definitivamente estão no extremo mais voraz por energia do boom da IA generativa, cada modelo generativo tem necessidades de processamento e energia que crescem exponencialmente, dobrando ou triplicando a cada ano.

Prever os requisitos de energia da IA generativa ao longo do tempo com precisão é difícil, mas a maioria dos analistas concordaria que os requisitos atuais aumentarão imensamente. Se estimarmos o crescimento composto atual dos data centers em modestos 15% (provavelmente está mais próximo de 20%), a capacidade global dobrará em 5 anos e quadruplicará em 10 anos. Com a IA generativa na equação, o CAGR poderia chegar a 25%, triplicando a capacidade em 5 anos e aumentando em nove vezes dentro de uma década.

Empresas, startups de IA e provedores de serviços em nuvem já estão correndo para garantir capacidade de data center para suas cargas de trabalho, com as nuvens de hiperescala liderando. Isso está acontecendo rápido. O analista TD Cowen relatou "um tsunami de demanda por IA", com 2,1 GW de contratos de data center assinados nos EUA (um quinto do total atual) no segundo trimestre de 2023.

Uma onda de lixo eletrônico

O segundo tsunami gerado pela IA é uma corrente de equipamentos usados. A IA está impulsionando uma inovação mais rápida em servidores, principalmente no design de chips, e os últimos chips de IA, como o Nvidia H100, tiveram tantos bilhões pagos antecipadamente para a sua fabricação e estão em tão baixa disponibilidade que são usados como garantia de dívida e disponibilizados para aluguel. Embora essa taxa de atualização seja fundamental para melhorar a eficiência, ela também - em conjunto com o aumento da capacidade - aumentará a escala do lixo eletrônico.

O lixo eletrônico é um dos resíduos em crescimento mais rápido no mundo. Até 2030, a produção anual de lixo eletrônico deve atingir 75 milhões de toneladas métricas. Acredita-se que o lixo eletrônico global contenha aproximadamente US$ 60 bilhões em matérias-primas como ouro, paládio, prata e cobre. No entanto, apenas 17% do total é documentado como coletado e reciclado adequadamente a cada ano.

Essas ondas na frente e na retaguarda do data center ocorrerão à medida que a crise climática se aprofunda e os deadlines das metas de emissão zero se aproximam. Haverá uma pressão sem precedentes sobre as redes elétricas para fornecer energia elétrica adicional para indústrias que estão se desvinculando dos combustíveis fósseis. É justo dizer que a IA generativa, em particular, estará sob intenso escrutínio ambiental. Para enfrentar o crescimento da capacidade e do lixo eletrônico, a indústria terá que estar pronta para o desafio.

Fontes de energia com baixa ou nenhuma pegada de carbono serão a chave para enfrentar os desafios de energia. As demandas de energia da IA generativa acelerarão esse foco e impulsionarão novas inovações em microrredes e fontes de energia de backup, como bateria, hidrogênio e nuclear. As energias renováveis também serão fundamentais. A maioria dos hiperescaladores e um número crescente de provedores de co-location têm aumentado a rede verde e eliminado o carbono a ponto de, hoje, os hiperscaladores serem os maiores compradores de energias renováveis do mundo.

Os proprietários de data center agora precisarão dar um passo adiante. Seguindo o exemplo do Google, há dois anos a Iron Mountain Data Centers se comprometeu a fornecer não apenas 100% de energias renováveis, mas também energia com pegada de carbono zero 24 horas por dia, sete dias por semana, como pode ser visto no documentário ”Transformando nosso Futuro”. Acredito que esse modelo substituirá, com o tempo, o atual modelo de Acordo de Compra de Energia Renovável ano a ano.

Novos chips e GPUs super-rápidas impulsionarão a revolução da IA, mas o que acontecerá com os antigos? Para desempenho eficiente e redução de impacto, os provedores de IA precisarão verificar se a otimização do ciclo de vida dos ativos de TI e a reciclagem, remarketing e a disposição segura estão disponíveis. A indústria tem sido relativamente lenta neste ponto, mas deve avançar. Milhões de drivers são higienizados por ano e mais de US$1 bilhão é gerado para os provedores de IA por meio de remarketing e reciclagem. Vemos um enorme potencial para esse segmento expandir e apoiar fornecedores de IA nos próximos anos. Da mesma forma que a IA generativa revolucionará as indústrias que executam suas aplicações, acredito que ela também revolucionará a indústria de infraestrutura que a suporta.

Dúvidas, Críticas e Sugestões? Fale com a gente

Os cookies nos ajudam a administrar este site. Ao usar nosso site, você concorda com nosso uso de cookies. Política de privacidade

Aceitar