ИИ GPT-3 меняет химические исследования
|
|
Искусственный интеллект становится ключевым инструментом в химических исследованиях, предлагая новые методы решения сложных проблем, с которыми сталкиваются традиционные подходы. Одним из подтипов искусственного интеллекта, который все чаще используется в химии, является машинное обучение, которое использует алгоритмы и статистические модели для принятия решений на основе данных и выполнения задач, для которых оно не было явно запрограммировано. Однако для получения надежных прогнозов машинное обучение также требует больших объемов данных, которые не всегда доступны в химических исследованиях. Небольшие наборы химических данных просто не предоставляют достаточно информации для обучения этих алгоритмов, что ограничивает их эффективность.
|
|
Ученые из команды Беренда Смита из EPFL нашли решение в больших языковых моделях, таких как GPT-3. Эти модели предварительно обучены на большом количестве текстов и известны своими широкими возможностями в понимании и генерации текста, подобного человеческому. GPT-3 составляет основу более популярного искусственного интеллекта ChatGPT. Исследование, опубликованное в журнале Nature Machine Intelligence, раскрывает новый подход, который значительно упрощает химический анализ с использованием искусственного интеллекта. Вопреки первоначальному скептицизму, метод не задает напрямую вопросов о химическом составе GPT-3. «GPT-3 не знаком с большей частью химической литературы, поэтому, если мы зададим ChatGPT химический вопрос, ответы обычно ограничиваются тем, что можно найти в Википедии», — говорит Кевин Яблонка, ведущий исследователь исследования.
|
|
«Вместо этого мы настраиваем GPT-3 с помощью небольшого набора данных, преобразованных в вопросы и ответы, создавая новую модель, способную предоставить точную химическую информацию». Этот процесс включает в себя предоставление GPT-3 тщательно подобранного списка вопросов и ответов. «Например, для сплавов с высокой энтропией важно знать, состоит ли сплав в одной фазе или состоит из нескольких фаз», — говорит Смит. «Кураторский список вопросов и ответов имеет следующий вид: Q= 'Является ли (название сплава с высокой энтропией) однофазным?' А = 'Да/Нет'». Он продолжает: «В литературе мы нашли много сплавов, ответ на которые известен, и мы использовали эти данные для точной настройки GPT-3. В результате мы получаем усовершенствованную модель искусственного интеллекта, которая обучена отвечать только на этот вопрос - да или нет». В ходе тестов модель, обученная с относительно небольшим количеством вопросов и ответов, правильно ответила на более чем 95% самых разнообразных химических задач, часто превосходя точность современных моделей машинного обучения.
|
|
«Дело в том, что это так же просто, как выполнить поиск в литературе, который помогает решить многие химические проблемы», — говорит Смит. Одним из наиболее поразительных аспектов этого исследования является его простота и скорость. Традиционные модели машинного обучения требуют месяцев для разработки и обширных знаний. Напротив, подход, разработанный Яблонькой, занимает пять минут и не требует никаких знаний. Последствия исследования глубоки. Он представляет такой простой метод, как поиск литературы, применимый к различным химическим проблемам. Умение формулировать вопросы типа: «Высоок ли выход [химического вещества], полученного по этому (рецепту)?» и получение точных ответов может революционизировать планирование и проведение химических исследований. В статье авторы говорят: «После поиска литературы запрос к базовой модели (например, GPT-3,4) может стать рутинным способом запуска проекта за счет использования коллективных знаний, закодированных в этих фундаментальных моделях». Или, как лаконично выразился Смит: «Это изменит то, как мы занимаемся химией».
|
|
Источник
|