|
Более половины интернет-контента создается ИИ
|
|
|
|
Специалисты технологической компании Graphite проанализировали случайную выборку из 65 000 англоязычных статей, опубликованных с января 2020 по май 2025 года. Используя детектор ИИ Surfer, любая статья, где 50% или более текста было сгенерировано большой языковой моделью, считалась ИИ-контентом. Как и ожидалось, анализ показал резкий рост ИИ-статей после появления ChatGPT: с примерно 10% в конце 2022 года до более 40% к 2024 году, а затем темпы роста немного замедлились.
|
|
|
|
Судя по всему, сегодня поток ИИ-контента достиг плато. После пика в ноябре 2024 года доля новых ИИ-статей и материалов, написанных людьми стабильно держится на уровне 50 на 50. На май 2025 года доля новых ИИ-статей составляет 52%, сменив положение вещей относительно предыдущего месяца, когда тексты людей получили недолговременное преимущество.
|
|
|
|
Возможно, доля человеческого контента на самом деле даже выше. Исследователи использовали открытый набор данных Common Crawl, включающий сотни миллиардов веб-страниц. Поскольку ИИ-компании использовали этот массив для обучения своих моделей, многие сайты с платным доступом начали блокировать индексацию Common Crawl. Эти статьи, почти наверняка написанные людьми, не попали в анализ Graphite.
|
|
|
|
|
|
|
Также стоит учитывать, что ИИ-детекторы не всегда точны. В тестах ИИ Surfer ошибочно классифицировал 4,2% статей, написанных людьми. Это типичная проблема подобных инструментов.
|
|
|
|
Почему доля ИИ-контента достигла плато, пока непонятно. Возможно многие издания и порталы осознали, что их низкокачественный контент все меньше индексируется поисковыми системами и не так часто используется чат-ботами: в Google Search 86% статей создаются людьми, и только 14% — ИИ.
|
|
|
|
С другой стороны, эта статистика может скрывать другую тенденцию: все больше авторов используют ИИ в процессе создания контента, что мешает детекторам ИИ и размывает границу между машинным и человеческим творчеством.
|
|
|
|
Источник
|