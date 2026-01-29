O AlphaGenome, ferramenta de Inteligência Artificial (IA) do Google divulgada na quarta-feira (28), dá mais um passo na compreensão do genoma humano ao analisar como determinadas partes do DNA regulam a atividade dos genes na célula. A decodificação do conjunto do genoma humano em 2003 "nos deu o livro da vida, mas lê-lo continua sendo um desafio", destacou Pushmeet Kohli, vice-presidente de pesquisas da Google DeepMind, na apresentação do AlphaGenome na revista Nature.

"Temos o texto" — a sucessão de 3 bilhões de pares de nucleotídeos A, T, C e G que compõem o DNA —, mas "compreender a gramática e a forma como ela governa a vida constitui a próxima grande fronteira da pesquisa", ressaltou à imprensa.

Apenas 2% das sequências de DNA "codificam" diretamente proteínas, indispensáveis ao funcionamento dos organismos vivos. Os 98% restantes desempenham o papel de "maestro": coordenam, protegem e regulam a expressão da informação genética em cada uma de nossas células. Estas sequências, chamadas "não codificantes", contêm numerosas variantes associadas a doenças. É justamento isto que o AlphaGenome estuda, complementando outros modelos desenvolvidos pelo laboratório de IA do Google: AlphaMissense (análise das sequências codificantes do DNA), AlphaProteo (design de proteínas) e AlphaFold (predição da estrutura de proteínas, que recebeu o Prêmio Nobel de Química em 2024).

O modelo de aprendizagem profunda (em que uma rede neural aprende a reconhecer automaticamente padrões complexos) foi treinado com dados procedentes de grandes consórcios públicos, que mediram experimentalmente essas propriedades em centenas de tipos de células e tecidos em humanos e ratos. Ele é capaz de analisar uma longa sequência de DNA e "prever" a influência de cada par de nucleotídeos em diferentes processos biológicos da célula. - Eficaz, mas não perfeito -

Já existiam outros modelos, mas precisavam adotar um compromisso entre o comprimento das sequências analisadas e a precisão da resolução. Uma sequência longa, de até um milhão de pares de nucleotídeos, é "necessária para compreender o ambiente regulatório completo de um único gene", explica Žiga Avsec, um dos coautores do projeto. A precisão da resolução permite estudar o efeito de variantes genéticas comparando as previsões de sequências mutadas com as de sequências não mutadas.

Outro avanço é que o AlphaGenome modela simultaneamente a influência da sequência em 11 processos biológicos, enquanto até agora os cientistas precisavam utilizar vários modelos. Esta ferramenta "pode acelerar a nossa compreensão do genoma ao ajudar a cartografar a localização dos elementos funcionais e a determinar seus papéis a nível molecular", estima Natasha Latysheva, também coautora. "Esperamos que os pesquisadores o enriqueçam com mais dados e modalidades", assinala Kohli sobre o modelo, que já foi testado por 3.000 cientistas de 160 países e que agora está disponível em código aberto para pesquisa não comercial.