Un nouveau cadre d’apprentissage automatique appelé MULTI-evolve accélère considérablement le processus de conception de protéines hautes performances, éliminant ainsi le besoin d’innombrables expériences d’essais et d’erreurs. Cette percée promet d’accélérer les progrès de la médecine, des biocarburants et de diverses applications industrielles.
Le défi de la conception de protéines
Les protéines sont au cœur de nombreuses technologies modernes, depuis les médicaments qui sauvent des vies jusqu’aux enzymes plus efficaces contenues dans les détergents à lessive. L’amélioration des performances des protéines nécessite souvent d’apporter des modifications multiples et coordonnées à leurs séquences d’acides aminés. Cependant, l’échange d’un acide aminé peut affecter l’impact des futurs échanges sur la fonction de la protéine, créant un problème de recherche complexe qui nécessite traditionnellement de nombreuses séries itératives de tests en laboratoire. Comme le note le bio-ingénieur Patrick Hsu, ce processus a toujours consisté à « deviner et vérifier ».
Comment fonctionne MULTI-evolve
MULTI-evolve relève ce défi en intégrant l’apprentissage automatique à des expériences de laboratoire ciblées. Le processus comporte trois étapes clés :
- Prédiction des mutations uniques : Le système utilise des données existantes ou des modèles d’apprentissage automatique pour prévoir comment les modifications individuelles des acides aminés affectent la fonction des protéines.
- Cartographie des interactions : Les chercheurs créent et testent des protéines avec des mutations appariées pour déterminer comment ces changements interagissent. Cela génère des données cruciales sur les effets combinés.
- Formation du modèle : Les résultats du laboratoire alimentent un modèle d’apprentissage automatique, qui prédit ensuite les performances des protéines présentant cinq mutations ou plus en un seul cycle.
Performances réelles
L’équipe de l’Université de Californie à Berkeley et de l’Arc Institute a testé MULTI-evolve sur trois protéines, dont un anticorps contre les maladies auto-immunes et une protéine utilisée dans l’édition génétique CRISPR. Dans tous les cas, le modèle a identifié des combinaisons de mutations qui ont largement surpassé les protéines d’origine lors des tests en laboratoire. Cela confirme que le système peut sélectionner de manière fiable des échanges efficaces.
Implications et applications futures
MULTI-evolve a le potentiel de révolutionner la façon dont les protéines sont conçues. Hsu met en évidence deux applications prometteuses : le suivi du mouvement des protéines dans les cellules et le développement de thérapies géniques plus efficaces pour les déficiences enzymatiques. L’outil devrait changer la façon dont les scientifiques abordent la conception des protéines, rendant le processus plus rapide, plus précis et, à terme, plus productif.
« Nous sommes enthousiasmés par ce travail », déclare Hsu. « Je pense que la façon dont cela change réellement la pratique de la science suscite un énorme intérêt. »
Ce nouveau cadre d’apprentissage automatique représente une avancée majeure dans le domaine de la biotechnologie, offrant un moyen plus efficace et plus précis de concevoir des protéines pour un large éventail d’applications critiques.


















