Uma nova estrutura de aprendizado de máquina chamada MULTI-evolve acelera drasticamente o processo de criação de proteínas de alto desempenho, eliminando a necessidade de incontáveis experimentos de tentativa e erro. Este avanço promete acelerar os avanços na medicina, nos biocombustíveis e em diversas aplicações industriais.
O Desafio do Design de Proteínas
As proteínas são fundamentais para muitas tecnologias modernas – desde medicamentos que salvam vidas até enzimas mais eficientes em detergentes para a roupa. Melhorar o desempenho das proteínas muitas vezes requer a realização de múltiplas alterações coordenadas em suas sequências de aminoácidos. No entanto, a troca de um aminoácido pode afetar o impacto das trocas futuras na função da proteína, criando um problema de pesquisa complexo que tradicionalmente exige muitas rodadas iterativas de testes laboratoriais. Como observa o bioengenheiro Patrick Hsu, esse processo tem sido historicamente “adivinhar e verificar”.
Como funciona o MULTI-evolve
O MULTI-evolve enfrenta esse desafio integrando o aprendizado de máquina com experimentos de laboratório direcionados. O processo envolve três etapas principais:
- Previsão de mutações únicas: O sistema usa dados existentes ou modelos de aprendizado de máquina para prever como as alterações individuais de aminoácidos afetam a função da proteína.
- Mapeamento de interações: Os pesquisadores criam e testam proteínas com mutações emparelhadas para determinar como essas mudanças interagem. Isto gera dados cruciais sobre os efeitos combinados.
- Treinamento do modelo: Os resultados laboratoriais alimentam um modelo de aprendizado de máquina, que então prevê o desempenho de proteínas com cinco ou mais mutações em uma única rodada.
Desempenho no mundo real
A equipe da Universidade da Califórnia, Berkeley, e do Arc Institute testou o MULTI-evolve em três proteínas, incluindo um anticorpo para doenças autoimunes e uma proteína usada na edição genética CRISPR. Em todos os casos, o modelo identificou combinações de mutações que superaram significativamente as proteínas originais em testes laboratoriais. Isto confirma que o sistema pode selecionar com segurança trocas eficazes.
Implicações e aplicações futuras
MULTI-evolve tem o potencial de revolucionar a forma como as proteínas são projetadas. Hsu destaca duas aplicações promissoras: rastrear o movimento de proteínas dentro das células e desenvolver terapias genéticas mais eficazes para deficiências enzimáticas. Espera-se que a ferramenta mude a forma como os cientistas abordam o design de proteínas, tornando o processo mais rápido, mais preciso e, em última análise, mais produtivo.
“Estamos entusiasmados com este trabalho”, diz Hsu. “Acho que há um enorme interesse em como isso realmente muda a prática da ciência.”
Esta nova estrutura de aprendizado de máquina representa um grande avanço na biotecnologia, oferecendo uma maneira mais eficiente e precisa de projetar proteínas para uma ampla gama de aplicações críticas.
