Редактирование генов выведет биотехнологии на новый уровень
Во время своей лекции, посвященной Нобелевской премии по химии в 2018 году, Фрэнсис Арнольд сказала: "Сегодня мы можем практически читать, записывать и редактировать любую последовательность ДНК, но мы не можем ее скомпоновать". Это больше не так. С тех пор наука и техника продвинулись настолько далеко, что искусственный интеллект научился составлять ДНК, а с помощью генетически модифицированных бактерий ученые находятся на пути к разработке и изготовлению белков на заказ. Цель состоит в том, чтобы с помощью дизайнерских талантов ИИ и инженерных способностей редактирования генов ученые могли модифицировать бактерии, превращая их в мини-фабрики по производству новых белков, которые могут сокращать выбросы парниковых газов, переваривать пластмассы или действовать как видоспецифичные пестициды. Как профессор химии и специалист по вычислительной химии, изучающий молекулярную науку и химию окружающей среды, я считаю, что достижения в области искусственного интеллекта и редактирования генов делают это возможным.
Все живые организмы содержат генетические материалы — ДНК и РНК, которые обеспечивают наследственную информацию, необходимую для самовоспроизведения и производства белков. Белки составляют 75% сухого веса человека. Из них состоят мышцы, ферменты, гормоны, кровь, волосы и хрящи. Понимание белков означает понимание большей части биологии. Порядок расположения нуклеотидных оснований в ДНК или РНК у некоторых вирусов кодирует эту информацию, и технологии секвенирования генома определяют порядок расположения этих оснований. Проект "Геном человека" был международным проектом, в рамках которого с 1990 по 2003 год проводилось секвенирование всего генома человека. Благодаря быстрому совершенствованию технологий на секвенирование первого 1% генома ушло семь лет, а на остальные 99% - еще семь лет. К 2003 году ученые располагали полной последовательностью из 3 миллиардов пар нуклеотидных оснований, кодирующих от 20 000 до 25 000 генов в геноме человека. Однако понимание функций большинства белков и исправление их неисправностей оставалось сложной задачей.
Форма каждого белка имеет решающее значение для его функционирования и определяется последовательностью входящих в него аминокислот, которая, в свою очередь, определяется нуклеотидной последовательностью гена. Неправильно свернутые белки имеют неправильную форму и могут вызывать такие заболевания, как нейродегенеративные заболевания, муковисцидоз и сахарный диабет 2 типа. Понимание этих заболеваний и разработка методов лечения требует знания формы белков. До 2016 года единственным способом определения формы белка была рентгеновская кристаллография - лабораторный метод, который использует дифракцию рентгеновских лучей на монокристаллах для определения точного расположения атомов и молекул в молекуле в трех измерениях. В то время с помощью кристаллографии была определена структура около 200 000 белков, что обошлось в миллиарды долларов. Программа машинного обучения AlphaFold использовала эти кристаллические структуры в качестве обучающего набора для определения формы белков по их нуклеотидным последовательностям. И менее чем за год программа рассчитала белковые структуры всех 214 миллионов генов, которые были секвенированы и опубликованы. Все белковые структуры, определенные AlphaFold, были опубликованы в базе данных, находящейся в свободном доступе.
Чтобы эффективно бороться с неинфекционными заболеваниями и разрабатывать новые лекарства, ученым необходимы более подробные знания о том, как белки, особенно ферменты, связывают небольшие молекулы. Ферменты - это белковые катализаторы, которые запускают и регулируют биохимические реакции. AlphaFold3, выпущенный 8 мая 2024 года, может предсказывать форму белков и расположение, в котором небольшие молекулы могут связываться с этими белками. При разработке рациональных лекарственных средств лекарственные средства предназначены для связывания белков, участвующих в механизме, связанном с лечением заболевания. Низкомолекулярные лекарственные препараты связываются с белком и модулируют его активность, тем самым влияя на развитие заболевания. Благодаря способности предсказывать сайты связывания с белком, AlphaFold3 расширит возможности исследователей в области разработки лекарств.
Примерно в 2015 году разработка технологии CRISPR произвела революцию в редактировании генов. С помощью CRISPR можно найти определенную часть гена, изменить или удалить ее, заставить клетку экспрессировать больше или меньше ее генного продукта или даже добавить на ее место совершенно чужеродный ген. В 2020 году Дженнифер Дудна и Эммануэль Шарпантье получили Нобелевскую премию по химии "за разработку метода (CRISPR) редактирования генома". С помощью CRISPR редактирование генов, которое когда-то занимало годы и было видоспецифичным, дорогостоящим и трудоемким, теперь может быть выполнено за считанные дни и за небольшую плату. Искусственный интеллект и генная инженерия стремительно развиваются. То, что когда-то было сложным и дорогостоящим, теперь стало рутиной. Забегая вперед, можно сказать, что мы мечтаем о белках, разработанных на заказ и производимых с помощью комбинации машинного обучения и бактерий, модифицированных CRISPR. Искусственный интеллект будет разрабатывать белки, а бактерии, измененные с помощью CRISPR, будут производить белки. Ферменты, полученные таким образом, потенциально могут вдыхать углекислый газ и метан, выделяя при этом органическое сырье, или расщеплять пластмассы на заменители бетона.
Я считаю, что эти амбиции не являются нереалистичными, учитывая, что на долю генетически модифицированных организмов уже приходится 2% экономики США в сельском хозяйстве и фармацевтике. Две группы ученых создали с нуля функционирующие ферменты, разработанные с помощью различных систем искусственного интеллекта. Институт белкового дизайна Дэвида Бейкера при Вашингтонском университете разработал новую стратегию белкового дизайна, основанную на глубоком обучении, под названием "галлюцинация для всей семьи", которую они использовали для создания уникального светоизлучающего фермента. Тем временем биотехнологический стартап Profluent использовал искусственный интеллект, обученный на основе совокупности всех знаний CRISPR-Cas, для разработки новых функционирующих редакторов генома.
Если ИИ сможет научиться создавать новые системы CRISPR, а также биолюминесцентные ферменты, которые работают и которых никогда не видели на Земле, есть надежда, что сочетание CRISPR и ИИ можно будет использовать для разработки других новых ферментов на заказ. Хотя комбинация CRISPR и искусственного интеллекта все еще находится в зачаточном состоянии, когда она созреет, она, вероятно, будет весьма полезной и даже может помочь миру справиться с изменением климата. Однако важно помнить, что чем мощнее технология, тем больше рисков она представляет. Кроме того, люди не очень преуспели в инженерии природы из-за сложности и взаимосвязанности природных систем, что часто приводит к непредвиденным последствиям.