Un nuevo marco de aprendizaje automático llamado MULTI-evolve acelera drásticamente el proceso de diseño de proteínas de alto rendimiento, eliminando la necesidad de innumerables experimentos de prueba y error. Este avance promete acelerar los avances en medicina, biocombustibles y diversas aplicaciones industriales.
El desafío del diseño de proteínas
Las proteínas son fundamentales para muchas tecnologías modernas, desde medicamentos que salvan vidas hasta enzimas más eficientes en detergentes para ropa. Mejorar el rendimiento de las proteínas a menudo requiere realizar múltiples cambios coordinados en sus secuencias de aminoácidos. Sin embargo, intercambiar un aminoácido puede afectar cómo los intercambios futuros impactan la función de la proteína, creando un problema de búsqueda complejo que tradicionalmente exige muchas rondas iterativas de pruebas de laboratorio. Como señala el bioingeniero Patrick Hsu, este proceso históricamente ha consistido en “adivinar y comprobar”.
Cómo funciona MULTIevolución
MULTI-evolve aborda este desafío integrando el aprendizaje automático con experimentos de laboratorio específicos. El proceso implica tres pasos clave:
- Predicción de mutaciones únicas: El sistema utiliza datos existentes o modelos de aprendizaje automático para pronosticar cómo los cambios de aminoácidos individuales afectan la función de las proteínas.
- Mapeo de interacciones: Los investigadores crean y prueban proteínas con mutaciones emparejadas para determinar cómo interactúan esos cambios. Esto genera datos cruciales sobre los efectos combinados.
- Entrenamiento del modelo: Los resultados de laboratorio se incorporan a un modelo de aprendizaje automático, que luego predice el rendimiento de proteínas con cinco o más mutaciones en una sola ronda.
Rendimiento en el mundo real
El equipo de la Universidad de California, Berkeley y el Instituto Arc probaron MULTI-evolve en tres proteínas, incluido un anticuerpo para enfermedades autoinmunes y una proteína utilizada en la edición de genes CRISPR. En todos los casos, el modelo identificó combinaciones de mutaciones que superaron significativamente a las proteínas originales en las pruebas de laboratorio. Esto confirma que el sistema puede seleccionar intercambios efectivos de manera confiable.
Implicaciones y aplicaciones futuras
MULTI-evolve tiene el potencial de revolucionar la forma en que se diseñan las proteínas. Hsu destaca dos aplicaciones prometedoras: rastrear el movimiento de proteínas dentro de las células y desarrollar terapias genéticas más efectivas para las deficiencias enzimáticas. Se espera que la herramienta cambie la forma en que los científicos abordan el diseño de proteínas, haciendo que el proceso sea más rápido, más preciso y, en última instancia, más productivo.
“Estamos entusiasmados con este trabajo”, dice Hsu. “Creo que hay un tremendo interés en cómo esto realmente cambia la práctica de la ciencia”.
Este nuevo marco de aprendizaje automático representa un gran paso adelante en biotecnología, ya que ofrece una forma más eficiente y precisa de diseñar proteínas para una amplia gama de aplicaciones críticas.


















