Ein neues Framework für maschinelles Lernen namens MULTI-evolve beschleunigt den Prozess der Entwicklung von Hochleistungsproteinen erheblich und macht unzählige Versuch-und-Irrtum-Experimente überflüssig. Dieser Durchbruch verspricht, Fortschritte in der Medizin, bei Biokraftstoffen und verschiedenen industriellen Anwendungen zu beschleunigen.
Die Herausforderung des Proteindesigns
Proteine sind für viele moderne Technologien von zentraler Bedeutung – von lebensrettenden Arzneimitteln bis hin zu effizienteren Enzymen in Waschmitteln. Um die Leistung von Proteinen zu verbessern, sind häufig mehrere, koordinierte Änderungen an deren Aminosäuresequenzen erforderlich. Der Austausch einer Aminosäure kann sich jedoch darauf auswirken, wie sich zukünftige Austausche auf die Funktion des Proteins auswirken, wodurch ein komplexes Suchproblem entsteht, das traditionell viele iterative Runden von Labortests erfordert. Wie der Bioingenieur Patrick Hsu feststellt, war dieser Prozess in der Vergangenheit ein „Erraten und Überprüfen“.
Wie MULTI-evolve funktioniert
MULTI-evolve geht diese Herausforderung an, indem es maschinelles Lernen mit gezielten Laborexperimenten integriert. Der Prozess umfasst drei Schlüsselschritte:
- Vorhersage einzelner Mutationen: Das System nutzt vorhandene Daten oder Modelle des maschinellen Lernens, um vorherzusagen, wie sich einzelne Aminosäureveränderungen auf die Proteinfunktion auswirken.
- Kartierung von Wechselwirkungen: Forscher erstellen und testen Proteine mit gepaarten Mutationen, um festzustellen, wie diese Veränderungen interagieren. Dadurch werden wichtige Daten zu kombinierten Effekten generiert.
- Training des Modells: Die Laborergebnisse fließen in ein Modell für maschinelles Lernen ein, das dann die Leistung von Proteinen mit fünf oder mehr Mutationen in einer einzigen Runde vorhersagt.
Leistung in der Praxis
Das Team der University of California, Berkeley, und des Arc Institute testeten MULTI-evolve an drei Proteinen, darunter einem Antikörper gegen Autoimmunerkrankungen und einem Protein, das bei der CRISPR-Genbearbeitung verwendet wird. In allen Fällen identifizierte das Modell Kombinationen von Mutationen, die in Labortests die ursprünglichen Proteine deutlich übertrafen. Dies bestätigt, dass das System wirksame Swaps zuverlässig auswählen kann.
Implikationen und zukünftige Anwendungen
MULTI-evolve hat das Potenzial, die Art und Weise, wie Proteine hergestellt werden, zu revolutionieren. Hsu hebt zwei vielversprechende Anwendungen hervor: Verfolgung der Proteinbewegung innerhalb von Zellen und Entwicklung wirksamerer Gentherapien für Enzymdefizite. Das Tool soll die Herangehensweise von Wissenschaftlern an das Proteindesign verändern und den Prozess schneller, präziser und letztendlich produktiver machen.
„Wir sind begeistert von dieser Arbeit“, sagt Hsu. „Ich denke, es besteht ein enormes Interesse daran, wie dies tatsächlich die Praxis der Wissenschaft verändert.“
Dieses neue Framework für maschinelles Lernen stellt einen großen Fortschritt in der Biotechnologie dar und bietet eine effizientere und genauere Möglichkeit, Proteine für eine Vielzahl kritischer Anwendungen zu entwerfen.
