ИИ катализирует исследования активации генов и ДНК
|
|
Искусственный интеллект взорвался в наших новостных лентах, а ChatGPT и связанные с ним технологии искусственного интеллекта стали объектом пристального внимания общественности. Помимо популярных чат-ботов, биологи находят способы использовать ИИ для исследования основных функций наших генов. Ранее исследователи Калифорнийского университета в Сан-Диего, изучающие последовательности ДНК, которые переключают гены, использовали искусственный интеллект для выявления загадочного фрагмента головоломки, связанного с активацией генов — фундаментальным процессом, связанным с ростом, развитием и болезнями. С помощью машинного обучения, разновидности искусственного интеллекта, профессор Школы биологических наук Джеймс Т. Кадонага и его коллеги открыли нижестоящую основную промоторную область (DPR), «воротной» код активации ДНК, который участвует в работе до трети наши гены.
|
|
Основываясь на этом открытии, Кадонага и исследователи Лонг Вонгок и Торри Э. Райн теперь использовали машинное обучение для выявления «синтетических экстремальных» последовательностей ДНК со специально разработанными функциями активации генов. В публикации в журнале Genes & Development исследователи протестировали миллионы различных последовательностей ДНК с помощью машинного обучения (ИИ), сравнив элемент активации гена DPR у людей и плодовых мушек (дрозофил). С помощью ИИ они смогли найти редкие, индивидуально подобранные последовательности DPR, которые активны у людей, но не у плодовых мушек, и наоборот. В более общем плане этот подход теперь можно использовать для идентификации синтетических последовательностей ДНК с активностью, которая может быть полезна в биотехнологии и медицине.
|
|
«В будущем эту стратегию можно будет использовать для выявления синтетических экстремальных последовательностей ДНК с практическими и полезными применениями. Вместо того, чтобы сравнивать людей (состояние X) с дрозофилами (состояние Y), мы могли бы проверить способность лекарства А (состояние X), но не препарат B (состояние Y) для активации гена», — сказал Кадонага, выдающийся профессор кафедры молекулярной биологии. «Этот метод также можно использовать для поиска специально подобранных последовательностей ДНК, которые активируют ген в ткани 1 (состояние X), но не в ткани 2 (состояние Y). Существует бесчисленное множество практических применений этого подхода, основанного на искусственном интеллекте. Последовательности ДНК могут быть очень редкими, возможно, одна на миллион — если они существуют, их можно найти с помощью ИИ».
|
|
Машинное обучение — это ветвь ИИ, в которой компьютерные системы постоянно совершенствуются и учатся на основе данных и опыта. В новом исследовании Кадонага, Вонгок (бывший постдокторский исследователь Калифорнийского университета в Сан-Диего, ныне работающий в Velia Therapeutics) и Райн (штатный научный сотрудник) использовали метод, известный как регрессия опорных векторов, для обучения моделей машинного обучения с 200 000 установленных последовательностей ДНК на основе данные реальных лабораторных экспериментов. Это были цели, представленные в качестве примеров для системы машинного обучения. Затем они загрузили 50 миллионов тестовых последовательностей ДНК в системы машинного обучения для людей и плодовых мушек и попросили их сравнить последовательности и идентифицировать уникальные последовательности в двух огромных наборах данных.
|
|
В то время как системы машинного обучения показали, что последовательности человека и плодовой мушки в значительной степени перекрываются, исследователи сосредоточились на основном вопросе: могут ли модели ИИ выявлять редкие случаи, когда активация генов высоко активна у людей, но не у плодовых мушек. Ответом было громкое «да». Модели машинного обучения успешно идентифицировали специфичные для человека (и специфичные для плодовой мухи) последовательности ДНК. Важно отметить, что предсказанные ИИ функции экстремальных последовательностей были проверены в лаборатории Кадонаги с использованием обычных методов тестирования (мокрой лаборатории).
|
|
«Прежде чем приступить к этой работе, мы не знали, достаточно ли «интеллектуальны» модели ИИ, чтобы предсказать активность 50 миллионов последовательностей, особенно «экстремальных» последовательностей с необычной активностью. Поэтому очень впечатляет и весьма примечательно то, что Модели искусственного интеллекта могут предсказывать действия редких экстремальных последовательностей, которые составляют одну на миллион», — сказал Кадонага, добавив, что будет практически невозможно провести сопоставимые 100 миллионов экспериментов в мокрой лаборатории, которые технология машинного обучения проанализировала с тех пор, как каждая мокрая лаборатория на завершение эксперимента уйдет почти три недели.
|
|
Редкие последовательности, идентифицированные системой машинного обучения, служат успешной демонстрацией и закладывают основу для других применений машинного обучения и других технологий искусственного интеллекта в биологии. «В повседневной жизни люди находят новые применения для инструментов ИИ, таких как ChatGPT. Здесь мы продемонстрировали использование ИИ для разработки индивидуальных элементов ДНК при активации генов. Этот метод должен иметь практическое применение в биотехнологии и биомедицинских исследованиях, — сказал Кадонага. «В более широком смысле биологи, вероятно, находятся в самом начале использования возможностей технологии ИИ».
|
|
Источник
|