22.04.2023. - ИИ ChatGPT делает исследование материалов эффективнее

ИИ ChatGPT делает исследование материалов эффективнее

Разработчик искусственного интеллекта OpenAI обещает изменить то, как люди работают и учатся, с помощью своего нового чат-бота под названием ChatGPT. Фактически, в Университете Висконсин-Мэдисон модель большого языка уже помогает инженерам-материаловедам, которые используют ее возможности для быстрого и экономичного извлечения информации из научной литературы. В течение нескольких лет Дейн Морган, профессор материаловедения и инженерии в Университете Вашингтона в Мэдисоне, с большим успехом использовал машинное обучение, разновидность искусственного интеллекта на основе данных, в своей лаборатории для оценки и поиска новых типов материалов. Мацей Полак, штатный научный сотрудник, тесно сотрудничающий с Морганом, обдумал другие задачи, с которыми может помочь ИИ.

«ИИ может все чаще помогать в выполнении довольно сложных и трудоемких задач», — говорит Полак. «И мы подумали: «Что из того, что ученые-материаловеды делают очень часто, мы бы хотели, чтобы у нас было больше времени?» Одним из ключевых моментов является чтение статей для получения данных». Полак говорит, что материаловеды часто скачивают, а затем просматривают длинные исследовательские работы, чтобы найти одну небольшую группу чисел, чтобы добавить их к своим наборам данных. «Мы подумали, что можем просто переложить все эти трудоемкие задачи на ИИ, который мог бы читать эти документы для нас и предоставлять нам эту информацию», — говорит Полак. Попросить чат-ботов, даже таких мощных, как ChatGPT, просто искать и извлекать данные из полного текста статьи, остается за пределами их возможностей. Поэтому Полак усовершенствовал технику, попросив ботов просмотреть предложение за предложением и решить, содержит ли каждое из них релевантные данные или нет — задача сводила документы к одному или двум ключевым предложениям. Затем он попросил ботов представить информацию в виде таблицы, после чего исследователь-человек мог просмотреть таблицу и предложения, чтобы убедиться, что они верны и актуальны.

Этот метод дал точность около 90%, что позволило исследователям извлечь данные из набора статей для создания базы данных о критических скоростях охлаждения для металлических стекол. В феврале 2023 года Полак, Морган и их коллеги разместили статью об этой технике на сервере препринтов arXiv. В то время как этот метод уменьшил рабочую нагрузку исследователей по чтению бумаги примерно на 99%, Полак был заинтересован в том, чтобы улучшить его еще больше. «Я был тем человеком, который все еще выполнял последний шаг вручную — проверял точность таблиц», — говорит он. «Итак, я хотел найти способ полностью автоматизировать этот процесс». Чтобы достичь этого, команда занялась «оперативным» проектированием — выяснением точных вопросов и последовательности, которые заставят бота извлекать, а затем перепроверять нужную им информацию. Они применили свой первоначальный подход к извлечению таблицы данных, а затем задали боту ряд дополнительных вопросов, чтобы представить возможность того, что набор данных был неправильным. Это заставило ИИ вернуться назад, перепроверить данные и отметить ошибки. В подавляющем большинстве случаев ИИ смог выявить ошибочную информацию. «Это самое важное: он может признать свою ошибку», — говорит Полак. «Возможно, он не знает, как это исправить, но, по крайней мере, мы не получаем фактически неверную информацию».

Команда опубликовала отдельный документ об этой итерации метода на arXiv в марте 2023 года. Морган говорит, что такая оперативная разработка с помощью ChatGPT и других больших языковых моделей поначалу кажется необычной. «Это не программирование в традиционном смысле; метод взаимодействия с этими ботами — посредством языка», — говорит Морган. «Попросить программу извлечь данные, а затем попросить ее проверить, правильно ли она работает с обычными предложениями, — это ближе к тому, как я учу своих детей давать правильные ответы, чем к тому, как я обычно обучаю компьютеры. Это совсем другой способ попросить компьютер сделать это». Это действительно меняет ваше представление о том, на что способен ваш компьютер». По словам Полака, эта техника не требует больших усилий или глубоких знаний. «Раньше людям приходилось писать сотни строк кода, чтобы сделать что-то подобное, и результаты часто были не очень хорошими», — говорит Полак. «Теперь у нас есть такое огромное улучшение возможностей с такими инструментами, как ChatGPT».

Морган быстро отмечает, что интеграция ИИ в исследования не заменяет аспирантов и ученых. Вместо этого эти инструменты могут позволить исследователям заниматься проектами, на которые у них раньше не было ни времени, ни денег, ни людских ресурсов. «Я думаю, что эти инструменты изменят то, как мы проводим исследования, подобно тому, как Google изменил то, как мы проводили исследования», — говорит Морган. «Сегодня мы обычно изучаем область, используя Google и другие инструменты поиска, которые помогают нам находить документы и связанные ресурсы, а затем мы читаем эти документы и ресурсы для извлечения информации и данных. Теперь вы можете перейти к одной из этих больших языковых моделей, чтобы собрать информацию по теме и, используя методы, подобные тем, которые мы разрабатываем, создать базу данных для просмотра в течение нескольких часов».

Источник