Как просто отличить текст, написанный ИИ
Команда исследователей из Сколтеха, МФТИ, Института искусственного интеллекта AIRI и других научных центров разработала метод, позволяющий не просто отличать тексты, написанные человеком, от сгенерированных нейросетью, но и понимать, по каким именно признакам классификатор принимает решение о том, является ли текст генерацией или нет. Анализируя внутренние состояния глубоких слоев языковой модели, ученые смогли выделить и интерпретировать численные признаки, отвечающие за стилистику, сложность и «степень уверенности» текста.
Работа принята на конференцию Findings of ACL 2025 и опубликована в виде препринта на портале arXiv. Стремительное развитие больших языковых моделей (LLM), таких как ChatGPT, Gemma и LLaMA, привело к тому, что сгенерированные ими тексты наполнили интернет, учебники, учебные пособия и даже научные статьи. Возникла острая проблема: как отличить оригинальное человеческое творчество от продукта машины? Существующие системы детекции сгенерированного текста часто работают как «черные ящики»: они выдают вердикт «человек» или «ИИ», но не могут объяснить, на каких конкретно свойствах текста основано их решение. Такая непрозрачность ограничивает их гибкость и надежность: если детектор ошибается, то бывает очень сложно понять, почему именно он ошибся и как избежать такой ошибки в будущем.
Исследователи решили подойти к проблеме с другой стороны. Вместо того чтобы создавать еще один «черный ящик», они задались целью заглянуть «под капот» нейросети и превратить ее внутренние состояния в набор четких и интерпретируемых характеристик текста. Для этого они использовали известную технику — разреженные автокодировщики (Sparse Autoencoders, SAE). Если представить внутреннее состояние нейросети как сложный коктейль из тысяч смешанных сигналов, то SAE работает как высокоточный сепаратор, который раскладывает этот коктейль на более чистые, атомарные «ингредиенты», которые легче интерпретировать. Каждый такой признак отвечает за определенный аспект текста: например, за сложность предложений или использование специфической лексики.
Лаида Кушнарева, старший академический консультант в компании Huawei, прокомментировала: «Люди, регулярно имеющие дело с текстами, сгенерированными ChatGPT, зачастую могут распознать такой текст по характерным чертам — например, неуместно сухому и формальному языку, чрезмерно длинным и “водянистым” вступлениям перед переходом к сути, повторяющимся формулировкам одной и той же мысли и низкой информационной плотности в целом. Однако большинство популярных детекторов сгенерированных текстов не показывают, в какой степени в тексте присутствуют эти и другие понятные человеку особенности.
В отличие от них, наш детектор на основе SAE позволяет автоматически раскладывать тексты на “атомарные” числовые признаки, многие из которых поддаются интерпретации в терминах, понятных человеку. При этом детектор обходит все существующие решения на том наборе данных, который мы использовали. Кроме того, мы показали, что с помощью SAE можно обнаруживать и некоторые осознанные попытки скрыть факт генерации текста — например, преднамеренное добавление лишних пробелов, артиклей или нестандартных символов с целью запутать детекторы. Другими словами, данная техника позволяет автоматически разобрать текст “по косточкам” и принять решение, обоснованность которого может быть впоследствии проверена человеком на основе выявленных признаков и их интерпретации».
В ходе исследования ученые подавали на вход нейросети Gemma-2-2B различные примеры текстов и сохраняли внутренние состояния с глубоких слоев модели для каждого текста. Далее, они выделили из этих внутренних состояний тысячи “атомарных” признаков с помощью SAE. Используя эти признаки, они обучили классификатор для распознавания сгенерированных текстов и приступили к самой интересной части — интерпретации. Они выявили как «универсальные» признаки, характерные для многих генерирующих моделей, так и специфические, присущие отдельным семействам ИИ или определенным типам текста (например, научным статьям и отзывам). Так, в текстах на научные темы ИИ склонен к излишне сложным синтаксическим конструкциям, а в текстах на финансовую тематику — к необоснованным, многословным рассуждениям о простых фактах.
Например, в работе показано, что «признак №3608 с 16-го слоя SAE» отвечает за синтаксическую сложность. Ученые обнаружили, что искусственное усиление этого признака в процессе генерации текста заставляет нейросеть создавать чрезмерно запутанные предложения, которые сложно читать. Наоборот, ослабление этого признака приводит к появлению коротких, «рубленых» фраз с минимальной связностью. Другой сильный признак, №4645, отвечает за степень уверенности текста, а №6587 — за многословные вступления и чрезмерно подробные объяснения.
Анастасия Вознюк, студентка МФТИ, добавила: «Помимо анализа того, на что конкретно модель обращает внимание при детекции, мы попробовали управлять моделью генерации. Признаки, которые мы определили ранее, можно усиливать или ослаблять, и в результате наблюдать что в некоторых случаях новый сгенерированный текст сильнее или, наоборот, слабее, характеризуется данным признаком. Например, при изменении признака определяющего уровень «академичности» языка текста, будет изменяться в соответствующую сторону и стилистика текста.
Результаты показывают, что если давать современным языковым моделям вроде ChatGPT стандартные запросы для генерации, то они с большой вероятностью генерируют текст с характерными чертами, который легко обнаруживается этим и другими детекторами. Однако исследователи предупреждают: если дать нейросети более персонализированное задание (например, попросить написать текст в каком-то необычном для нее стиле), эти характерные черты могут ослабнуть или даже исчезнуть, что может сделать задачу детекции значительно сложнее.
В исследовании был применен новый многогранный подход, который сочетает автоматическое выделение признаков, их ручную интерпретацию и экспериментальную проверку с помощью техники «управления» (steering). Это создает основу для разработки более интерпретируемых детекторов, которые смогут не просто выносить вердикт, но и предоставлять отчет о том, какие именно аномалии были найдены в тексте. Такие инструменты будут полезны для преподавателей, редакторов и исследователей дезинформации. В более широкой перспективе эта работа является важным шагом к демистификации искусственного интеллекта, позволяя нам лучше понимать, как нейросети «мыслят» и создают тексты.
Дальнейшие исследования будут направлены на применение этого метода к новым, более мощным языковым моделям и на изучение более сложных и трудноуловимых признаков, чтобы оставаться на шаг впереди тех, кто пытается использовать ИИ в недобросовестных целях, и при этом уменьшить вероятность ошибиться и несправедливо обвинить человека в том, что его текст был сгенерирован.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Ваш мозг редактирует вашу жизнь, пока вы спите

Галактика подтверждает существование Большого взрыва

Загадочное распределение водорода на Европе

Звезда пережила столкновение с черной дырой

Инопланетяне высадились рядом с авиабазой в Саффолке

Информатор делает мрачное предупреждение

Как обнаружить магнитные поля вокруг экзопланет

Маск готовится к масштабной установке имплантатов

Необычное магнитное поле вокруг протозвезды

Обнаружена новая экзопланета размером с Землю

Парашюты готовы к использованию на Марсе

Подтвердили наличие компаньона у Бетельгейзе

Самые странные встречи с НЛО в Британии

Скрытый слой Реальности

Тараканы-шпионы и ИИ-роботы

Темная энергия может изменяться со временем

У Земли более шести спутников

Футуристический ховербайк в стиле Звездных войн

Что, если правительство верит в НЛО больше, чем вы

Что-то странное творится в небе Техаса

Актриса видела НЛО в реальной жизни

Ванга и живой Нострадамус предсказывают одно и то же

Волшебство, лежащее в основе квантовых компьютеров

Дни НЛО пройдут в Эльмвуде

Конспирологи считают, что высадка на Луну - фейк

Можно безопасно прыгнуть в черную дыру

Нас всех затягивает в гигантскую невидимую структуру

НЛО в небе над Сан-Педру

НЛО посещают Землю с 16 века

Обнаружен таинственный убийца планет

Огромный астероид приближается к Земле

Одержимая кукла причиняет большие проблемы

Поворот событий с одержимой куклой Аннабель

Самые большие загадки Стоунхенджа

Скопление НЛО над базой ВВС Райт-Паттерсон

Скрытый в геноме человека призрачный код

Трамп должен рассказать правду о внеземной жизни

Трамп обнародовал план по внедрению ИИ во все сферы

Трамп уничтожает данные о глобальном потеплении

Хакеры нанесли удар по ядерному комплексу США

Башня и потерпевший крушение НЛО в Антарктиде

В Гавайском лесу лежит разбитый диск

В джунглях Перу потерпел крушение НЛО

Замаскированный пассажирский самолет

Звездолет на посадочной площадке

ИИ проиграл программисту в 10-часовом марафоне

ИИ способны тайно научить друг друга быть злыми

Как просто отличить текст, написанный ИИ

Люди перестанут понимать, как ИИ рассуждает

Может ли существовать жизнь на спутниках планет

Молния воскресила умершую девочку

Монстры из шкафа. Детская выдумка или что-то большее

Научились превращать углекислый газ в сахар

НЛО в облаке над островом Антилоп

Огромный НЛО над Род-Айлендом

Оранжевый диск над Антилоп-парком

Слова девочки заставили ее мать переехать

Суд восстановил москвичку, уволенную из-за ИИ

Треугольный НЛО, замаскированный под айсберг

Феномен светящейся женщины

Загадочная структура внутри клеток человека

Инцидент в Лейкенхит-Бентуотерс

Нашли утерянную Книгу мертвых

НЛО прилетали на Землю на протяжении веков

Новая эра неопознанных воздушных явлений

Облако в форме НЛО над восточным Китаем

Охотник за привидениями внезапно скончался

Пара вместо пропавшего ребенка нашла бигфута

Семья одурачила США самодельным НЛО

Странные встречи с НЛО из канадских архивов

Тайна строительства Стоунхенджа

Телепортация с записью состояний в память

Теории заговора могут угрожать демократии

Теперь у младенца может быть три родителя

У Бетельгейзе есть компаньон

Уфолог подтвердил подлинность видеозаписи НЛО

Число наблюдений НЛО в Великобритании растет

Что происходит в сверхсекретной Зоне 51

Электромобили вызывают у людей сильную тошноту

Я была замужем за призраком

Аэропорты привлекают внимание инопланетян

Древнее небесное тело за Плутоном

Жидкие солевые растворы могут образовываться на Марсе

Запечатлели рождение планет вокруг молодого солнца

Звезда разрушает свою новорожденную планету

ИИ вообще не обладает интеллектом

Канадский доклад рекомендует создать бюро по НЛО

Лунный грунт может поддерживать жизнь

Мы стали свидетелями рождения солнечной системы

Невероятные снимки далекого мира

Неужели так наступит конец света

Новые знания о скалистых экзопланетах

Обнаружили литий в экзосфере Меркурия

Освоение космоса должно быть более демократичным

Поиск пригодных для жизни экзопланет

Третий известный межзвездный объект

Три четверти подростков используют ИИ-компаньонов

Фестиваль НЛО стал мишенью воров

Черная дыра, которой не должно существовать

Эбби Клэнси заметила три НЛО, находясь за рулем

Более четкое понимание столкновений черных дыр

Будущее аванпостов на Луне и Марсе

Гигантская экзопланета скрытая в газопылевом диске

Земля родилась вместе с водой

Знакомимся с новейшим межзвездным гостем

ИИ может быть вашим помощником в онлайн-знакомствах

Колыбель жизни в Млечном Пути

Космические аппараты, оснащенные солнечным парусом

Открытие в стиле Индианы Джонса в Петре

Отслеживание молекул в межзвездной среде

Полеты черных дыр могут изменить орбиты экзопланет

Прямое доказательство рождения черной дыры

Путь от квантовой науки к квантовой технологии

Редкий объект в идеальной синхронизации с Нептуном

С чего начать строительство лунной базы

Самый большой кусок Марса продан

Смертельный танец сверхгорячего Юпитера

Спорадические порталы, появляющиеся в домах

Феноменальный Фолкеркский треугольник

Экзопланета движется по смертельной спирали

Как правильно рассчитать мощность и характеристики двигателя постоянного тока для оборудования

БАК может опровергнуть теорию струн

Вайнона Райдер в детстве видела НЛО

Десятки экзопланет могут оказаться крупнее

Мероприятие по вызову инопланетных кораблей

Найти океан на экзопланете было бы трудной задачей

НАСА выбирает приборы для лунного вездехода

Новый телескоп раскроет тайну происхождения жизни

Открыли новый вид человека

Путь к созданию протоклеток на Титане

Разгадали тепловую загадку Урана

Реальный криптонит с суперпотенциалом

Реальный способ получить снимки обитаемой экзопланеты

Самый большой кусок Марса на Земле

Секреты обратной стороны Луны

Сотрудники Зоны 51 были убиты невидимым врагом

Старейшая из когда-либо виденных комет

Темная материя может создавать темных карликов

Удивительная звездная система

Что известно о третьем в истории межзвездном объекте

Экзопланета заставляет свою звезду вспыхивать

Автоматизация и модернизация ИТ-инфраструктуры. Что можно передать скриптам уже сейчас

Где в бане можно применять силикатный рядовой кирпич без риска. Примеры узлов и решений

Ведущий канадский ученый опубликовал отчет об НЛО

Взрывные звезды образуются с помощью третьей звезды

Дайверы наткнулись на загадочный древний лик

Деревья выращивают камни внутри себя

Дрон снял странный НЛО в облаках Аргентины

Лечение псилоцибином продлевает жизнь клеток

Марс был более влажным, чем мы думали

Могут ли психоделические грибы повернуть время вспять

Обломки астероида осложнят усилия по отклонению астероидов

Поиск в облаках Венеры необъяснимых газов

Поиск первичных черных дыр

Приблизились к получению безграничной энергии

Происхождение египетских царей

Самые известные наблюдения НЛО в Канаде

Самый молодой базальтовый лунный метеорит

Солнечная загадка, которая ставила человечество в тупик

Тейя помогла подготовить почву для появления жизни

Управление публичными сообщениями о НЛО в Канаде

Уфологический фестиваль в Кексбурге

Череп единорога обнаружен близ Тинтагеля

Джо Роган проявляет большой интерес к НЛО

Житель Миссури шокирован странным НЛО

Исследователь обнаружил новую форму жизни

Канаде необходимо агентство для исследования НЛО

Лучшие фильмы и шоу об НЛО на Netflix

Любопытство к НЛО живо и процветает

Метеорит изменяет представление о Солнечной системе

Механизм, который приводит к образованию планет

Обнаружили аномалию вблизи пирамид

Пожар в Зоне 51 породил множество теорий о заговора

Президент Трамп может раскрыть правду об НЛО

Рапа-Нуи не так изолирован, как считалось ранее

Редкое облачное образование, похожее на НЛО

Рецензия на фильм об НЛО

Рождение солнечной системы, подобной нашей

Секреты ранней жизни на Земле

Старые фотографии раскрывают тайну планеты-изгоя

Столкнется ли астероид с Луной

Темные карлики намекают на природу темной материи

Уфолог умер во время гастролей с одержимой куклой

Большой пожар подбирается все ближе к Зоне 51

Где может начаться массовое вымирание

Житель городка в Неваде хранит секреты Зоны 51

Наверх
Яндекс.Метрика