O aprendizado de máquina acelera a engenharia de proteínas para um desenvolvimento mais rápido de medicamentos e produtos

22

Uma nova estrutura de aprendizado de máquina chamada MULTI-evolve acelera drasticamente o processo de criação de proteínas de alto desempenho, eliminando a necessidade de incontáveis experimentos de tentativa e erro. Este avanço promete acelerar os avanços na medicina, nos biocombustíveis e em diversas aplicações industriais.

O Desafio do Design de Proteínas

As proteínas são fundamentais para muitas tecnologias modernas – desde medicamentos que salvam vidas até enzimas mais eficientes em detergentes para a roupa. Melhorar o desempenho das proteínas muitas vezes requer a realização de múltiplas alterações coordenadas em suas sequências de aminoácidos. No entanto, a troca de um aminoácido pode afetar o impacto das trocas futuras na função da proteína, criando um problema de pesquisa complexo que tradicionalmente exige muitas rodadas iterativas de testes laboratoriais. Como observa o bioengenheiro Patrick Hsu, esse processo tem sido historicamente “adivinhar e verificar”.

Como funciona o MULTI-evolve

O MULTI-evolve enfrenta esse desafio integrando o aprendizado de máquina com experimentos de laboratório direcionados. O processo envolve três etapas principais:

  1. Previsão de mutações únicas: O sistema usa dados existentes ou modelos de aprendizado de máquina para prever como as alterações individuais de aminoácidos afetam a função da proteína.
  2. Mapeamento de interações: Os pesquisadores criam e testam proteínas com mutações emparelhadas para determinar como essas mudanças interagem. Isto gera dados cruciais sobre os efeitos combinados.
  3. Treinamento do modelo: Os resultados laboratoriais alimentam um modelo de aprendizado de máquina, que então prevê o desempenho de proteínas com cinco ou mais mutações em uma única rodada.

Desempenho no mundo real

A equipe da Universidade da Califórnia, Berkeley, e do Arc Institute testou o MULTI-evolve em três proteínas, incluindo um anticorpo para doenças autoimunes e uma proteína usada na edição genética CRISPR. Em todos os casos, o modelo identificou combinações de mutações que superaram significativamente as proteínas originais em testes laboratoriais. Isto confirma que o sistema pode selecionar com segurança trocas eficazes.

Implicações e aplicações futuras

MULTI-evolve tem o potencial de revolucionar a forma como as proteínas são projetadas. Hsu destaca duas aplicações promissoras: rastrear o movimento de proteínas dentro das células e desenvolver terapias genéticas mais eficazes para deficiências enzimáticas. Espera-se que a ferramenta mude a forma como os cientistas abordam o design de proteínas, tornando o processo mais rápido, mais preciso e, em última análise, mais produtivo.

“Estamos entusiasmados com este trabalho”, diz Hsu. “Acho que há um enorme interesse em como isso realmente muda a prática da ciência.”

Esta nova estrutura de aprendizado de máquina representa um grande avanço na biotecnologia, oferecendo uma maneira mais eficiente e precisa de projetar proteínas para uma ampla gama de aplicações críticas.