Исследователи создают ИИ, открывающий ферменты
|
|
Хотя E. coli является одним из наиболее изученных организмов, функция 30% белков, входящих в состав E. coli, до сих пор четко не выявлена. Для этого искусственный интеллект был использован для обнаружения 464 типов ферментов из неизвестных белков, а исследователи продолжили проверку предсказаний трех типов белков, которые были успешно идентифицированы с помощью ферментного анализа in vitro. Совместная исследовательская группа, в которую вошли Ги Бэ Ким, Джи Ён Ким, доктор Чон Ан Ли и заслуженный профессор Сан Юп Ли с кафедры химической и биомолекулярной инженерии KAIST, а также доктор Чарльз Дж. Норсигян и профессор Бернхард О. Палссон из Департамент биоинженерии Калифорнийского университета в Сан-Франциско разработал DeepECtransformer, искусственный интеллект, который может предсказывать функции ферментов по последовательности белка. Кроме того, команда создала систему прогнозирования, используя искусственный интеллект для быстрого и точного определения функции фермента.
|
|
Работа команды описана в статье под названием «Функциональная аннотация генов, кодирующих ферменты, с использованием глубокого обучения со слоями преобразователей». Статья была опубликована 14 ноября в журнале Nature Communications. Ферменты — это белки, которые катализируют биологические реакции, и определение функции каждого фермента важно для понимания различных химических реакций, существующих в живых организмах, и метаболических характеристик этих организмов. Номер Комиссии по ферментам (EC) - это система классификации функций ферментов, разработанная Международным союзом биохимии и молекулярной биологии, и чтобы понять метаболические характеристики различных организмов, необходимо разработать технологию, которая сможет быстро анализировать ферменты и номера EC. ферментов, присутствующих в геноме. Различные методологии, основанные на глубоком обучении, были разработаны для анализа особенностей биологических последовательностей, включая предсказание функций белков, но большинство из них имеют проблему черного ящика, в котором процесс вывода ИИ невозможно интерпретировать.
|
|
Также сообщалось о различных системах прогнозирования, которые используют ИИ для прогнозирования функций ферментов, но они не решают эту проблему черного ящика или не могут интерпретировать процесс рассуждения на детальном уровне (например, уровень аминокислотных остатков в последовательности фермента). Совместная команда разработала DeepECtransformer, искусственный интеллект, который использует глубокое обучение и модуль анализа гомологии белков для прогнозирования ферментативной функции заданной белковой последовательности. Чтобы лучше понять особенности белковых последовательностей, архитектура преобразователя, которая обычно используется при обработке естественного языка, была дополнительно использована для извлечения важных характеристик функций ферментов в контексте всей белковой последовательности, что позволило команде точно предсказать EC. номер фермента. Разработанный DeepECtransformer может предсказать в общей сложности 5360 чисел EC.
|
|
Совместная группа дополнительно проанализировала архитектуру трансформатора, чтобы понять процесс вывода DeepECtransformer, и обнаружила, что в процессе вывода ИИ использует информацию о каталитических активных центрах и/или сайтах связывания кофакторов, которые важны для функционирования фермента. Анализ «черного ящика» DeepECtransformer подтвердил, что ИИ способен самостоятельно определять особенности, важные для функционирования ферментов, в процессе обучения. «Используя разработанную нами систему прогнозирования, мы смогли предсказать функции ферментов, которые еще не были идентифицированы, и проверить их экспериментально», — сказал Ги Бэ Ким, первый автор статьи. «Используя DeepECtransformer для идентификации ранее неизвестных ферментов в живых организмах, мы сможем более точно анализировать различные аспекты, участвующие в метаболических процессах организмов, например, ферменты, необходимые для биосинтеза различных полезных соединений, или ферменты, необходимые для биоразложения пластмасс». добавил он. «DeepECtransformer, который быстро и точно предсказывает функции ферментов, является ключевой технологией функциональной геномики, позволяющей нам анализировать функции целых ферментов на системном уровне», — сказал профессор Санг Юп Ли. Он добавил: «Мы сможем использовать его для разработки экологически чистых микробных фабрик на основе комплексных метаболических моделей в масштабе генома, потенциально сводя к минимуму недостающую информацию о метаболизме».
|
|
Источник
|