11.08.2025. - С помощью ChatGPT пишется все больше научных статей

С помощью ChatGPT пишется все больше научных статей

С момента его выхода в ноябре 2022 года использование ChatGPT и других крупных языковых моделей (LLM) получило широкое распространение во многих дисциплинах, предоставляя помощь в написании всего, от выступлений до контрактов. Поэтому, возможно, нет ничего удивительного в том, что некоторые ученые могут использовать ChatGPT для ускорения темпов публикации своих исследований.

Мало что известно о том, как внедрение контента, созданного с помощью искусственного интеллекта, может повлиять на разнообразие, качество и надежность исследовательских работ. И поскольку эти технологии по-прежнему являются новыми и постоянно развиваются, пока не существует надежного способа выявления использования LLM, и многие учебные заведения все еще разрабатывают политику, направленную на ограничение их использования.

Чтобы лучше понять, как ChatGPT использовался в научной литературе за последние несколько лет, группа исследователей недавно провела исследование, проанализировав 1 121 912 научных статей и препринтов из журналов arXiv, bioRxiv и Nature portfolio. В исследовании, опубликованном в журнале Nature Human Behavior, использовалась новая структура на уровне популяции, основанная на изменении частоты встречаемости слов, для оценки увеличения контента, модифицированного LLM, в период с января 2020 года по сентябрь 2024 года.

Исследование показало, что чаще всего были затронуты тезисы и введение, в то время как разделы "Методы" и "эксперименты" в меньшей степени использовали искусственный интеллект, вероятно, из-за способности магистров к обобщению. Неуклонный рост вероятности использования ChatGPT наблюдался во многих областях обучения, наиболее заметным из которых стали компьютерные науки — дисциплина, тесно связанная с искусственным интеллектом.

Анализ показал, что к сентябрю 2024 года степень магистра права, вероятно, будет использоваться в 22,5% рефератов по информатике и в 19,5% вводных работ по информатике. В ноябре 2022 года эти показатели составляли всего около 2,4% и были одинаковыми для всех типов статей на тот момент. К 2024 году уровень использования LLM в электротехнике и системных науках также был относительно высоким - 18,0% для написания рефератов и 18,4% для введения.

Было обнаружено, что в таких областях, как математика, уровень использования LLM значительно ниже: 7,7% - для написания рефератов и 4,1% - для введения. Портфолио журналов Nature также продемонстрировало меньший рост использования искусственного интеллекта: 8,9% для рефератов и 9,4% для введения.

В дополнение к области исследования, анализ был дополнительно стратифицирован по частоте публикаций авторов, объему статьи и географическому региону, в результате чего исследователи обнаружили, что модификация LLM была более распространена в нескольких различных случаях. Авторы, которые чаще публиковали препринты, чаще использовали LLM в своих статьях, возможно, из-за возросшего спроса на публикацию большего количества статей в более быстром темпе. Более короткие статьи — те, что содержат менее 5000 слов, — также были связаны с большей помощью со стороны магистров права, а также тех, кто работает в более конкурентоспособных областях исследований, таких как компьютерные науки.

Обнаружить сгенерированный ИИ текст в географических регионах, где не говорят по-английски, сложнее, и в предыдущих методах обнаружения ИИ была отмечена некоторая предвзятость в отношении авторов научных статей, для которых английский не был родным. Это исследование действительно показало более высокое использование LLM в статьях из Китая и Континентальной Европы по сравнению с Северной Америкой и Великобританией, но, скорее всего, это связано с поддержкой английского языка.

Поскольку в ближайшие годы сфера искусственного интеллекта будет стремительно развиваться, у нее есть потенциал изменить то, как пишется и передается научная информация, что, в свою очередь, поднимает вопросы о прозрачности, оригинальности и будущем научных публикаций.

Авторы исследования указывают на многие вопросы, на которые необходимо ответить, поскольку наука продолжает внедрять эти технологии: "Наши наблюдения за ростом числа созданных или модифицированных статей открывают множество вопросов для будущих исследований. Как соотносятся такие статьи с точки зрения точности, креативности или разнообразия? Как читатели реагируют на тезисы и введение, подготовленные магистром права? Как соотносятся показатели цитируемости статей, подготовленных магистром права, с другими статьями в аналогичных областях? Как доминирование ограниченного числа коммерческих организаций в индустрии LLM может повлиять на независимость научных публикаций?

"Мы надеемся, что наши результаты и методология вдохновят на дальнейшие исследования широко распространенных текстов, модифицированных LLM, и на обсуждение того, как продвигать прозрачные, разнообразные и высококачественные научные публикации".

Источник