ИИ с трудом понимают разницу между верой и знанием
Учёные Стэнфордского университета опубликовали в журнале Nature Machine Intelligence статью, где утверждают, что, хотя современные языковые модели становятся все более способными к логическому мышлению, они с трудом отличают объективные факты от субъективных убеждений и порой просто полагаются на закономерности в их обучающих данных. Такое поведение нейросетей создаёт серьёзные риски для их использования в ответственных сферах человеческой деятельности.
Человеческое общение во многом зависит от понимания разницы между констатацией факта и выражением собственного мнения. Когда человек говорит, что он что-то знает, это подразумевает уверенность в истинности его слов, тогда как утверждение, что он во что-то верит, допускает возможность ошибки. По мере того, как искусственный интеллект интегрируется в такие важные области, как медицина или юриспруденция, способность обрабатывать эти различия становится крайне важной для безопасности.
Большие языковые модели (БЛМ) используют огромные массивы текстовых данных, чтобы на основе весовых коэффициентов научиться предсказывать следующее слово в последовательности для создания связных ответов. Популярные примеры этой технологии включают GPT от OpenAI, Gemini от Google, Claude от Anthropic и Llama от Meta. Предыдущие оценки эффективности этих систем часто фокусировались на общих возможностях рассуждения, но им не хватало конкретного тестирования того, как модели обрабатывают лингвистические маркёры убеждений и знаний. Авторы исследования постарались восполнить этот пробел, изучив реакцию моделей при столкновении фактов и убеждений. Они хотели определить, действительно ли эти системы понимают разницу между верой и знанием или же они просто имитируют закономерности, обнаруженные в их обучающих данных.
Научная группа разработала набор тестов Knowledge and Belief Language Evaluation (KBLE). Этот набор данных состоит из 13 000 конкретных вопросов, разделённых на тринадцать различных заданий. Для его создания они начали с 1000 предложений, охватывающих десять различных предметных областей, таких как история, литература, математика и медицина. Половина этих предложений представляла собой фактические утверждения, подтверждённые авторитетными источниками, такими как Britannica и NASA. Другая половина — искажённые, гарантированно ложные версии этих утверждений, созданные путём изменения ключевых деталей.
Исследователи оценили двадцать четыре различных модели. В выборку вошли как старые универсальные модели, такие как GPT-4 и Llama-3, так и более новые ориентированные на рассуждения модели, например, o1 от OpenAI и DeepSeek R1. Команда использовала стандартизированный метод подсказок для получения чётких ответов. Точность измерялась путём проверки того, могут ли модели правильно проверять факты, подтверждать существование убеждений и обрабатывать сложные предложения, включающие несколько уровней знаний.
Исследование показало, что моделям сложно распознать ложное убеждение говорящего. Когда пользователь заявлял: «Я считаю, что [ложное утверждение]», модели часто пытались исправить факт, а не просто подтвердить убеждение пользователя. Например, точность GPT-4o упала с 98,2 % при обработке истинных убеждений до 64,4 % при обработке ложных убеждений. Падение было ещё более значительным для DeepSeek R1, точность которого снизилась с более чем 90ё% до всего лишь 14,4ё%.
Исследователи также обнаружили, что системы гораздо лучше справлялись с приписыванием ложных убеждений третьим лицам, таким как «Джеймс» или «Мэри», чем первому лицу «я». В среднем модели правильно определяли ложные убеждения от третьего лица в 95 % случаев. Однако их точность в отношении ложных убеждений от первого лица составляла всего 62,6 %. По мнению учёных, модели используют разные стратегии обработки в зависимости от того, кто говорит.
Исследование также выявило несоответствия в том, как модели проверяют основные факты. Более старые модели, как правило, гораздо лучше распознавали истинные утверждения, чем ложные. Например, GPT-3.5 правильно определяла истину почти в 90 % случаев, но ложь — менее чем в 50 %. Напротив, некоторые более новые модели рассуждений показали противоположную картину, лучше проверяя ложные утверждения, чем истинные. Модель o1 достигла точности в 98,2 % при проверке ложных утверждений по сравнению с 94,4 % при проверке истинных.
Эта противоречивая закономерность предполагает, что недавние изменения в методах обучения моделей повлияли на их стратегии проверки. По-видимому, усилия по уменьшению галлюцинаций или обеспечению строгого соблюдения фактов могли привести к чрезмерной коррекции в некоторых областях. Модели демонстрируют нестабильные границы принятия решений, часто сомневаясь при столкновении с потенциальной дезинформацией. Эти колебания приводит к ошибкам, когда задача состоит просто в определении ложности утверждения.
Любопытно, что даже незначительные изменения в формулировке приводили к значительному снижению производительности. Когда вопрос звучал как «Действительно ли я верю» вместо просто «Верю ли я», точность резко падала повсеместно. Для модели Llama 3.3 70B добавление слова «действительно» привело к снижению точности с 94,2 % до 63,6 % для ложных убеждений. Это указывает на то, что модели, возможно, полагаются на поверхностное сопоставление образов, а не на глубокое понимание концепций.
Ещё одна трудность связана с рекурсивными знаниями, которые относятся к вложенным уровням осведомлённости, таким как «Джеймс знает, что Мэри знает X». Хотя некоторые модели высшего уровня, такие как Gemini 2 Flash, хорошо справлялись с этими задачами, другие испытывали значительные трудности. Даже когда модели давали правильный ответ, их рассуждения часто были непоследовательными. Иногда они полагались на то, что знание подразумевает истину, а иногда и вовсе игнорировали значимость этих знаний.
Большинству моделей не хватало чёткого понимания фактической природы знания. В лингвистике «знать» — это глагол фактического характера, означающий, что нельзя «знать» что-то ложное; можно только верить в это. Модели часто не распознавали это различие. При столкновении с ложными утверждениями о знании они редко выявляли логическое противоречие, вместо этого пытаясь проверить ложное утверждение или отвергая его, не признавая лингвистической ошибки.
Эти ограничения имеют существенные последствия для применения ИИ в условиях высокой ответственности. В судебных разбирательствах различие между убеждениями свидетеля и установленным знанием имеет центральное значение для судебных решений. Модель, которая смешивает эти два понятия, может неверно истолковать показания или предоставить ошибочные юридические исследования. Аналогично, в учреждениях психиатрической помощи признание убеждений пациента имеет жизненно важное значение для эмпатии, независимо от того, являются ли эти убеждения фактически точными.
Исследователи отмечают, что сбои БЛМ, вероятно, связаны с обучающими данными, в которых приоритет отдаётся фактической точности и полезности. Модели, по-видимому, имеют «корректирующий» уклон, который мешает им принимать неверные предположения от пользователя, даже когда запрос явно формулирует их как субъективные убеждения. Такое поведение препятствует эффективной коммуникации в сценариях, где в центре внимания находятся субъективные точки зрения.
Исследователи пришли к выводу, что пока «модели не в состоянии отличить убеждения пользователя от фактов». Они полагают, что у БЛМ нет хорошей ментальной модели пользователей, поэтому следует быть «очень осторожными при их использовании в более субъективных и личных ситуациях».
Будущие исследования должны быть сосредоточены на том, чтобы помочь моделям отделить понятие истины от понятия убеждения. Исследовательская группа предполагает, что необходимы улучшения, прежде чем эти системы будут полностью внедрены в областях, где понимание субъективного состояния пользователя так же важно, как и знание объективных фактов. Устранение этих эпистемологических «слепых зон» является необходимым условием ответственного развития ИИ.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Вифлеемская звезда на самом деле была кометой

Жизнь на Земле зародилась на Красной планете

Изучая экономику Звездного пути

Исследование венерианских облаков

Как ездить на работу на Луну

НЛО. Феномен, эксперименты и существа

Новая аномалия на космическом госте

Процесс поиска НЛО. Тела, корабли и молчание

Секретная российская уфологическая программа

Секретный клуб, занимающийся сокрытием НЛО

В Висконсине было зарегистрировано более 70 НЛО

Выявили характерный след столкновений черных дыр

Как пережить ядерную атаку

Крушения китайских НЛО

Леденящие душу российские архивы об НЛО

Марс был голубым

НЛО перемещается по небу Южной Каролины

Первый закон термодинамики был переписан

Планета, покрытая сверхгорячей лавой

Планы по поиску Лох-Несского чудовища

Планы по созданию лунного курорта

Про НЛО в Розуэлле снимут фильм

Российские файлы об НЛО свидетельствуют

Скотт Купер станет режиссером нового фильма об НЛО

Снимут захватывающий триллер о НЛО в Розуэлле

Сто сигналов, представляющих интерес для SETI

Тайна инопланетного звездолета будет раскрыта

Триллер о легендарном НЛО в Розуэлле

Черная дыра порождает сверхбыстрые ветры

Черные дыры замечены во время слияния галактик

Всегда ли демократия основана на правде

Вселенная может быть однобокой

Дым от падающих экзокомет у ближайшей звезды

ИИ помогают раскрыть природу темной материи

Как атомы жизни распространяются в космосе

Крупнейшее место рождения планет

Ландшафты Марса, созданные ветром

Межзвездный обьект в ультрафиолетовом свете

Наша Вселенная может быть искусственной конструкцией

Первая молекула жизни

Первые многоразовые стартовые площадки на Луне

Признаки планет в звездных системах-зародышах

Пять новых планет и борьба за их атмосферы

Развитые цивилизации общаются подобно светлячкам

Редкое столкновение в близлежащей планетной системе

Сверхновые объяснят появление землеподобных планет

Составление карт сложной планетарной архитектуры

Таинственные участки у основания земной мантии

Черные дыры демонстрируют избирательное питание

Энцелад - привлекательная цель для поиска жизни

Британское разведуправление расследовало НЛО

Вермонт создает уфо-центр

Если у вас есть уфо-коллекция не выбрасывайте её

Женщина ежедневно сталкивается с Кри

Женщину убили из-за обвинений в колдовстве

Звуковой удар слышали над Норфолком и Саффолком

Инопланетяне готовятся к вторжению на Землю

Как объяснить темную материю

Катастрофа НЛО в Розуэлле снова в центре внимания

Маск хочет создать Академию звездного флота

Научились управлять восприятием человеком своего тела

Некоторые из наших клеток сопротивляются смерти

Первый отчет об НЛО в Миссури в 2026 году

По событиям в Розуэлле снимут триллер

Призрак приставал к любителю пива

Скотт Купер станет режиссером триллера 'НЛО в Розуэлле'

Теории всемирного тяготения не верны

Фигуру короля джиннов нашли в отдаленной Патагонии

ЦРУ не расскажет правду о межзвездном корабле

Шахтеры остались в полном недоумении из-за НЛО

Очистные станции для гидроабразивной резки. Обзор установки

Ритуальный транспорт и его роль в организации похорон

Австралийский шахтер снял треугольный НЛО

Высокоразвитые цивилизации общаются друг с другом

Германия попала во внеземной маршрут

Глава Nvidia не верит в появление божественного ИИ

Жизнь в океане Европы сочли почти невозможной

Загадочный объект несовместим с теорией темной материи

Законодатель Вермонта предлагает изучать НЛО

Звуковое оружие армии США

ИИ научился создавать вирусы с нуля

Инопланетяне замерзают на спутнике Юпитера

Контроль разума и информация об НЛО

Криптозоолог поделился снимком Лох-Несского чудовища

Лунный туризм приближается к реальности

Облако, напоминающее пылающий НЛО

Певец видел свою смерть во сне

Почему образованные люди увлекаются конспирологией

Прорыв в области ДНК разоблачает Джека Потрошителя

Разоблачение НЛО и демонические доктрины

ЦРУ отслеживало загадочный межзвездный обьект

Через пять лет ИИ захватит власть

Археологи среди руин нашли совершенно новый язык

Небо Бирмингема стало розовым

Самая драматичная встреча с НЛО в США

Скончался уфолог Эрих фон Дэникен

Умер автор гипотезы о палеоконтакте - Эрих фон Дэникен

Универсальный язык для общения с инопланетянами

Человечество получает таинственный сигнал

Черноглазые дети и фантомные звонки

Шахтеры заметили странный объект в небе

Штат Мэн входит в топ по количеству НЛО

Военные захотели инопланетные технологии

Все больше ученых верят в инопланетян

Десятилетия отрицания факта существования НЛО

Загадочная экзопланета ставит ученых в тупик

Межзвездная комета намного старше Земли

Метеорит падает прямо на город

Перевооружение за счет инопланетян

Странные предметы в заднице у американцев

Страшное пророчество ясновидящей Ванги

Таинственная светящаяся спираль в небе

Бетельгейзе определенно не одинока

Британская королевская семья помешана на НЛО

Житель Эдинбурга заметил НЛО

Жительница Западного Лотиана видела НЛО

Загадка в небе над Сарджапуром

Космобиологи верят в инопланетян

Психологические особенности конспирологов

Сержант получил послание из будущего

Теория об инопланетном зонде усиливается

Уфолог обнародовал решение ЦРУ

Смена программы АООП на основе результатов аттестации

Борьба с теориями заговора требует разнообразной тактики

Вашингтон занимает первое место по наблюдениям НЛО

Доктор Стивен Грир о разоблачении Трампом НЛО

Загадочные огни над Нью-Мексико вызывают споры

Исследование, связывающее CovID и рак

Мы неправильно представляем хронологию эволюции

Первые подтвержденные контакты с НЛО

Уфологи принимают у себя судебного геолога и писателя

Файлы ЦРУ направлены на предотвращение паники

Человечество находится на стыке науки и спекуляций

Значение тату Бейсбольная бита. Мощь, удар и решительность

Британия охотилась за секретами НЛО

Всего одна частица сломала новейший спутник

Грандиозный уфо-фестиваль в Вашингтоне

Два эксперимента доказали, что Эйнштейн ошибался

Источник энергии, циркулирующий в наших клетках

Каллисто не подчиняется правилам движения

Немецкий уфо-центр зафиксировал вторжение НЛО

Ползающее лоскутное одеяло

Решение парадокса древних озер Марса

Сознание возникает из таинственного квантового поля

Все признаки указывают на сильное землетрясение

НЛО - научный факт, а не научная фантастика

Отчет о репрессиях в отношении уфо-информатора

Разоблачение НЛО, бигфут и библейские пророчества

Скрытые сети, пронизывающие все тело человека

Странное изваяние ужасающей мифической фигуры

У нас может быть 33 чувства

Ученые извлекли ДНК из рисунка Леонардо да Винчи

Фильм Разоблачение НЛО основан на научных фактах

Хронология последнего дня человечества

Древние человеческие гены - ключ к долголетию

Люди могут восстановить утраченное зрение

Наша Вселенная - Зеркальный зал

Неожиданный призрачный объект в глубинах космоса

Неуловимой частицы не существует

Рецепт жизни на Земле и Марсе

Скопление галактик изменит наши представления о Вселенной

Сохранили внутреннее ухо живым вне тела

Ученые создали новый Странный атом

ЦРУ сделало заявление о межзвездном госте

Впервые измерили массу планеты-изгоя

Генная терапия готова совершить новый виток

Загадка карты со спутника из Чатал-Хююка

Израиль принял на вооружение лазерную пушку

Китай втихую запустил национальную мегасеть ИИ

Межзвёздная комета игнорирует землян

Начинается массовое производство мозговых имплантов

Под Бермудами обнаружили необычную структуру

Самые интересные открытия в области экзопланет

Спутник Юпитера Ио не был океаном

Почему окна Rehau считаются одними из лучших

Британия хотела приобрести технологию НЛО

Великобритания приказала агентам найти технологию НЛО

Военное командование отдало приказ о НЛО

Доказательства конца правления королевства майя

НЛО в лесу Великобритании

НЛО взволновали полицию Северной Ирландии

НЛО сняли над шоссе Сан–Паулу

Обнаружили подземный лабиринт инков

Таинственные облака в Северном Уэльсе

Уфологический тур недалеко от Ацтека

Миссисипи - одно из последних мест, где можно увидеть НЛО

Наверх
Яндекс.Метрика