Nový rámec strojového učení nazvaný MULTI-evolve výrazně urychluje proces navrhování vysoce výkonných proteinů tím, že eliminuje potřebu nesčetných experimentů typu pokus-omyl. Tento průlom slibuje urychlení pokroku v medicíně, biopalivech a různých průmyslových oborech.
Výzva proteinového designu
Proteiny jsou základem mnoha moderních technologií, od život zachraňujících léků až po účinnější enzymy v pracích prostředcích. Zlepšení charakterizace proteinů často vyžaduje provedení více koordinovaných změn v jejich aminokyselinových sekvencích. Avšak substituce jedné aminokyseliny může ovlivnit, jak budoucí substituce ovlivní funkci proteinu, což vytváří složitý problém objevování, který tradičně vyžaduje mnoho opakovaných laboratorních testů. Jak poznamenává bioinženýr Patrick Hsu, tento proces byl historicky založen na „hádání a testování“.
Jak funguje MULTI-evolve
MULTI-evolve tento problém řeší integrací strojového učení s cílenými laboratorními experimenty. Proces zahrnuje tři klíčové kroky:
- Předpověď jedné mutace: Systém využívá existující data nebo modely strojového učení k předpovědi, jak změny jednotlivých aminokyselin ovlivňují funkci proteinu.
- Zobrazení interakcí: Výzkumníci vytvářejí a testují proteiny s párovými mutacemi, aby zjistili, jak se tyto změny vzájemně ovlivňují. To generuje důležitá data o kombinovaných účincích.
- Trénink modelu: Laboratorní výsledky jsou vkládány do modelu strojového učení, který pak předpovídá výkonnost proteinů s pěti nebo více mutacemi v jediném kole.
Skutečné výsledky
Tým z University of California, Berkeley a Arc Institute testovali MULTI-evolve na třech proteinech, včetně protilátky proti autoimunitním onemocněním a proteinu používaného při editaci genu CRISPR. Ve všech případech model identifikoval kombinace mutací, které v laboratorních testech výrazně překonaly původní proteiny. To potvrzuje, že systém dokáže spolehlivě vybrat účinné náhrady.
Důsledky a budoucí aplikace
MULTI-evolve by mohlo způsobit revoluci ve způsobu, jakým jsou proteiny navrhovány. Hsu identifikuje dvě slibné oblasti: sledování pohybu proteinů v buňkách a vývoj účinnějších genových terapií pro nedostatek enzymů. Očekává se, že tento nástroj změní způsob, jakým vědci navrhují proteiny, a učiní proces rychlejší, přesnější a v konečném důsledku i produktivnější.
„Jsme z této práce nadšení,“ říká Hsu. “Myslím, že je obrovský zájem o to, jak to vlastně mění vědeckou praxi.”
Tento nový rámec strojového učení představuje významný pokrok v biotechnologii a nabízí efektivnější a přesnější způsob navrhování proteinů pro širokou škálu kritických aplikací.
