Машинное обучение ускоряет разработку белков для более быстрой разработки лекарств и продуктов

23

Новая структура машинного обучения под названием MULTI-evolve значительно ускоряет процесс проектирования высокопроизводительных белков, устраняя необходимость в бесчисленных экспериментах методом проб и ошибок. Этот прорыв обещает ускорить достижения в медицине, биотопливе и различных промышленных областях.

Задача проектирования белков

Белки лежат в основе многих современных технологий — от спасающих жизнь лекарств до более эффективных ферментов в стиральных порошках. Улучшение характеристик белков часто требует внесения нескольких скоординированных изменений в их аминокислотные последовательности. Однако замена одной аминокислоты может повлиять на то, как будущие замены влияют на функцию белка, создавая сложную задачу поиска, которая традиционно требует множества итеративных лабораторных тестов. Как отмечает биоинженер Патрик Хсу, этот процесс исторически был основан на «угадывании и проверке».

Как работает MULTI-evolve

MULTI-evolve решает эту задачу, интегрируя машинное обучение с целенаправленными лабораторными экспериментами. Процесс включает три ключевых шага:

  1. Прогнозирование одиночных мутаций: Система использует существующие данные или модели машинного обучения для прогнозирования того, как отдельные изменения аминокислот влияют на функцию белка.
  2. Отображение взаимодействий: Исследователи создают и тестируют белки с парными мутациями, чтобы определить, как эти изменения взаимодействуют друг с другом. Это генерирует важные данные о комбинированных эффектах.
  3. Обучение модели: Лабораторные результаты передаются в модель машинного обучения, которая затем прогнозирует производительность белков с пятью или более мутациями за один раунд.

Реальные результаты

Команда из Калифорнийского университета в Беркли и Института Arc протестировала MULTI-evolve на трех белках, включая антитело для аутоиммунных заболеваний и белок, используемый в редактировании генов CRISPR. Во всех случаях модель выявила комбинации мутаций, которые значительно превосходили исходные белки в лабораторных тестах. Это подтверждает, что система может надежно выбирать эффективные замены.

Последствия и будущие приложения

MULTI-evolve может революционизировать то, как проектируются белки. Хсу выделяет два перспективных направления: отслеживание движения белков внутри клеток и разработка более эффективных генных терапий при ферментных дефицитах. Ожидается, что этот инструмент изменит подход ученых к проектированию белков, сделав этот процесс более быстрым, точным и, в конечном итоге, более продуктивным.

«Мы рады этой работе», — говорит Хсу. «Я думаю, что существует огромный интерес к тому, как это на самом деле меняет научную практику».

Эта новая структура машинного обучения представляет собой крупный шаг вперед в биотехнологиях, предлагая более эффективный и точный способ проектирования белков для широкого спектра критически важных применений.