ИИ ускоряет открытие лекарств в 10 раз
|
|
Усиление виртуального скрининга с помощью машинного обучения позволило в 10 раз сократить время обработки 1,56 миллиарда молекул, подобных лекарствам. Исследователи из Университета Восточной Финляндии объединились с промышленностью и суперкомпьютерами, чтобы провести один из крупнейших в мире виртуальных тестов на наркотики. В своих усилиях по поиску новых молекул лекарств исследователи часто полагаются на быстрый компьютерный скрининг больших библиотек соединений для выявления агентов, которые могут блокировать мишень лекарства. Такой мишенью может быть, например, фермент, который позволяет бактерии противостоять антибиотикам или вирусу, заражающему своего хозяина. За последние годы размер этих коллекций небольших органических молекул значительно увеличился. Поскольку библиотеки растут быстрее, чем скорость компьютеров, необходимых для их обработки, проверка современной библиотеки соединений размером в миллиард миллиардов долларов на предмет только одного лекарственного препарата может занять несколько месяцев или лет — даже при использовании самых современных суперкомпьютеров. Поэтому совершенно очевидно, что крайне необходимы более быстрые подходы.
|
|
В исследовании, опубликованном в Журнале химической информации и моделирования, доктор Ина Пёнер и ее коллеги из Фармацевтической школы Университета Восточной Финляндии объединились с организацией, располагающей мощными финскими суперкомпьютерами, CSC — IT Center for Science Ltd — и промышленными партнерами. из Orion Pharma, чтобы изучить перспективы машинного обучения для ускорения виртуальных экранов гигамасштабного масштаба. Прежде чем применить искусственный интеллект для ускорения скрининга, исследователи сначала установили базовый уровень: в ходе виртуальной скрининговой кампании беспрецедентного масштаба 1,56 миллиарда молекул, подобных лекарствам, были оценены по двум фармакологически значимым мишеням в течение почти шести месяцев с помощью суперкомпьютеров Mahti и Пухти и молекулярный докинг. Докинг — это вычислительный метод, который помещает небольшие молекулы в область связывания мишени и вычисляет «оценку стыковки», чтобы выразить, насколько хорошо они подходят. Таким образом, сначала были определены показатели докинга для всех 1,56 миллиарда молекул.
|
|
Затем результаты сравнили с экраном, усиленным машинным обучением, с использованием HASTEN, инструмента, разработанного доктором Туомо Каллиокоски из Orion Pharma, соавтором исследования. «HASTEN использует машинное обучение для изучения свойств молекул и того, как эти свойства влияют на оценку соединений. При наличии достаточного количества примеров, взятых из обычного стыковки, модель машинного обучения может предсказать показатели стыковки для других соединений в библиотеке гораздо быстрее, чем модель машинного обучения. подход к стыковке методом грубой силы», — объясняет Каллиокоски. Действительно, поскольку только 1% всей библиотеки был закреплен и использован в качестве обучающих данных, инструмент правильно определил 90% соединений с лучшими оценками менее чем за 10 дней. Исследование представляет собой первое тщательное сравнение инструмента стыковки с использованием машинного обучения с обычным базовым вариантом стыковки в гигамасштабе. «Мы обнаружили, что инструмент с поддержкой машинного обучения надежно и многократно воспроизводит большинство наиболее эффективных соединений, выявленных с помощью традиционной стыковки, в значительно более короткие сроки», — говорит Пёнер.
|
|
«Этот проект является отличным примером сотрудничества между академическими кругами и промышленностью и того, как CSC может предложить один из лучших вычислительных ресурсов в мире. Объединив наши идеи, ресурсы и технологии, стало возможным достичь наших амбициозных целей», — сказал профессор. Антти Посо, возглавляющий группу по разработке компьютерных лекарств в Исследовательском сообществе лекарственных технологий Университета Восточной Финляндии. Исследования сопоставимого масштаба в большинстве случаев остаются неуловимыми. Таким образом, авторы выложили в открытый доступ большие наборы данных, созданные в рамках исследования. Их готовая к использованию библиотека скрининга для стыковки позволяет другим ускорить свои усилия по скринингу, предоставляя 1,56 миллиарда результатов стыковки соединений для двух целей, которые можно использовать в качестве сравнительных данных. Эти данные будут стимулировать будущую разработку инструментов для экономии времени и ресурсов и в конечном итоге будут способствовать развитию области компьютерного открытия лекарств.
|
|
Источник
|