ИИ с трудом понимают разницу между верой и знанием
Учёные Стэнфордского университета опубликовали в журнале Nature Machine Intelligence статью, где утверждают, что, хотя современные языковые модели становятся все более способными к логическому мышлению, они с трудом отличают объективные факты от субъективных убеждений и порой просто полагаются на закономерности в их обучающих данных. Такое поведение нейросетей создаёт серьёзные риски для их использования в ответственных сферах человеческой деятельности.
Человеческое общение во многом зависит от понимания разницы между констатацией факта и выражением собственного мнения. Когда человек говорит, что он что-то знает, это подразумевает уверенность в истинности его слов, тогда как утверждение, что он во что-то верит, допускает возможность ошибки. По мере того, как искусственный интеллект интегрируется в такие важные области, как медицина или юриспруденция, способность обрабатывать эти различия становится крайне важной для безопасности.
Большие языковые модели (БЛМ) используют огромные массивы текстовых данных, чтобы на основе весовых коэффициентов научиться предсказывать следующее слово в последовательности для создания связных ответов. Популярные примеры этой технологии включают GPT от OpenAI, Gemini от Google, Claude от Anthropic и Llama от Meta. Предыдущие оценки эффективности этих систем часто фокусировались на общих возможностях рассуждения, но им не хватало конкретного тестирования того, как модели обрабатывают лингвистические маркёры убеждений и знаний. Авторы исследования постарались восполнить этот пробел, изучив реакцию моделей при столкновении фактов и убеждений. Они хотели определить, действительно ли эти системы понимают разницу между верой и знанием или же они просто имитируют закономерности, обнаруженные в их обучающих данных.
Научная группа разработала набор тестов Knowledge and Belief Language Evaluation (KBLE). Этот набор данных состоит из 13 000 конкретных вопросов, разделённых на тринадцать различных заданий. Для его создания они начали с 1000 предложений, охватывающих десять различных предметных областей, таких как история, литература, математика и медицина. Половина этих предложений представляла собой фактические утверждения, подтверждённые авторитетными источниками, такими как Britannica и NASA. Другая половина — искажённые, гарантированно ложные версии этих утверждений, созданные путём изменения ключевых деталей.
Исследователи оценили двадцать четыре различных модели. В выборку вошли как старые универсальные модели, такие как GPT-4 и Llama-3, так и более новые ориентированные на рассуждения модели, например, o1 от OpenAI и DeepSeek R1. Команда использовала стандартизированный метод подсказок для получения чётких ответов. Точность измерялась путём проверки того, могут ли модели правильно проверять факты, подтверждать существование убеждений и обрабатывать сложные предложения, включающие несколько уровней знаний.
Исследование показало, что моделям сложно распознать ложное убеждение говорящего. Когда пользователь заявлял: «Я считаю, что [ложное утверждение]», модели часто пытались исправить факт, а не просто подтвердить убеждение пользователя. Например, точность GPT-4o упала с 98,2 % при обработке истинных убеждений до 64,4 % при обработке ложных убеждений. Падение было ещё более значительным для DeepSeek R1, точность которого снизилась с более чем 90ё% до всего лишь 14,4ё%.
Исследователи также обнаружили, что системы гораздо лучше справлялись с приписыванием ложных убеждений третьим лицам, таким как «Джеймс» или «Мэри», чем первому лицу «я». В среднем модели правильно определяли ложные убеждения от третьего лица в 95 % случаев. Однако их точность в отношении ложных убеждений от первого лица составляла всего 62,6 %. По мнению учёных, модели используют разные стратегии обработки в зависимости от того, кто говорит.
Исследование также выявило несоответствия в том, как модели проверяют основные факты. Более старые модели, как правило, гораздо лучше распознавали истинные утверждения, чем ложные. Например, GPT-3.5 правильно определяла истину почти в 90 % случаев, но ложь — менее чем в 50 %. Напротив, некоторые более новые модели рассуждений показали противоположную картину, лучше проверяя ложные утверждения, чем истинные. Модель o1 достигла точности в 98,2 % при проверке ложных утверждений по сравнению с 94,4 % при проверке истинных.
Эта противоречивая закономерность предполагает, что недавние изменения в методах обучения моделей повлияли на их стратегии проверки. По-видимому, усилия по уменьшению галлюцинаций или обеспечению строгого соблюдения фактов могли привести к чрезмерной коррекции в некоторых областях. Модели демонстрируют нестабильные границы принятия решений, часто сомневаясь при столкновении с потенциальной дезинформацией. Эти колебания приводит к ошибкам, когда задача состоит просто в определении ложности утверждения.
Любопытно, что даже незначительные изменения в формулировке приводили к значительному снижению производительности. Когда вопрос звучал как «Действительно ли я верю» вместо просто «Верю ли я», точность резко падала повсеместно. Для модели Llama 3.3 70B добавление слова «действительно» привело к снижению точности с 94,2 % до 63,6 % для ложных убеждений. Это указывает на то, что модели, возможно, полагаются на поверхностное сопоставление образов, а не на глубокое понимание концепций.
Ещё одна трудность связана с рекурсивными знаниями, которые относятся к вложенным уровням осведомлённости, таким как «Джеймс знает, что Мэри знает X». Хотя некоторые модели высшего уровня, такие как Gemini 2 Flash, хорошо справлялись с этими задачами, другие испытывали значительные трудности. Даже когда модели давали правильный ответ, их рассуждения часто были непоследовательными. Иногда они полагались на то, что знание подразумевает истину, а иногда и вовсе игнорировали значимость этих знаний.
Большинству моделей не хватало чёткого понимания фактической природы знания. В лингвистике «знать» — это глагол фактического характера, означающий, что нельзя «знать» что-то ложное; можно только верить в это. Модели часто не распознавали это различие. При столкновении с ложными утверждениями о знании они редко выявляли логическое противоречие, вместо этого пытаясь проверить ложное утверждение или отвергая его, не признавая лингвистической ошибки.
Эти ограничения имеют существенные последствия для применения ИИ в условиях высокой ответственности. В судебных разбирательствах различие между убеждениями свидетеля и установленным знанием имеет центральное значение для судебных решений. Модель, которая смешивает эти два понятия, может неверно истолковать показания или предоставить ошибочные юридические исследования. Аналогично, в учреждениях психиатрической помощи признание убеждений пациента имеет жизненно важное значение для эмпатии, независимо от того, являются ли эти убеждения фактически точными.
Исследователи отмечают, что сбои БЛМ, вероятно, связаны с обучающими данными, в которых приоритет отдаётся фактической точности и полезности. Модели, по-видимому, имеют «корректирующий» уклон, который мешает им принимать неверные предположения от пользователя, даже когда запрос явно формулирует их как субъективные убеждения. Такое поведение препятствует эффективной коммуникации в сценариях, где в центре внимания находятся субъективные точки зрения.
Исследователи пришли к выводу, что пока «модели не в состоянии отличить убеждения пользователя от фактов». Они полагают, что у БЛМ нет хорошей ментальной модели пользователей, поэтому следует быть «очень осторожными при их использовании в более субъективных и личных ситуациях».
Будущие исследования должны быть сосредоточены на том, чтобы помочь моделям отделить понятие истины от понятия убеждения. Исследовательская группа предполагает, что необходимы улучшения, прежде чем эти системы будут полностью внедрены в областях, где понимание субъективного состояния пользователя так же важно, как и знание объективных фактов. Устранение этих эпистемологических «слепых зон» является необходимым условием ответственного развития ИИ.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Белый дом формирует научную группу по изучению НЛО

Добыча кислорода из лунной почвы

Заявления Спилберга о присутствии инопланетян

Как рассмотреть нашу Вселенную

Лаборатория естественной химии у протозвезд

Медицинские системы для Луны и Марса

Министерство обороны скрывает детали об НЛО

Мощный НЛО обнаружен в далекой черной дыре

Наблюдение НЛО в форме гигантской картофелины

Наше представление о календаре майя

Неразгаданные тайны Стоунхенджа

От морского дна до Марса

Сверхмассивные чёрные дыры - крупнейшие колыбели планет

Способ оценки масс новорожденных планет

Стремиться ли к Луне

Суперконтинент сделал из Земли снежный ком

Ученые обновляют план первого контакта

Фильм Спилберга об НЛО основан на достоверных данных

Хронология древних океанов Марса

Черная дыра образовалась раньше своей галактики

Артефакты на фотографии марсохода Кьюриосити

Белый дом опубликовал новые файлы с НЛО

Брифинг НАСА о инопланетной звездной базе

В архивах Ватикана нет записей об НЛО

В куклу вселился призрак собаки

Внутри особняка с привидениями в Денвере

Военные отслеживали антигравитационные технологии

Все cвидетельства путешествий во времени

Инопланетяне уже посещали Землю

НЛО над главным аэропортом Зимбабве

НЛО отслеживается самолетом ВВС США

НЛО пролетел по небу над Индией

Оранжевая сфера повергла рыбака в шок

Пентагон опубликовал 72 новых файла об НЛО

Путешественник во времени времен Второй мировой войны

Режиссер Стивен Спилберг заявляет, что мы не одиноки

Светящийся шар запустил рой загадочных объектов

Существование путешествий во времени

Убедитесь в реальности путешествий во времени

Черный шар засеивает облака дронами

Брифинг НАСА о инопланетной звездной базе на Луне

Где же все черные дыры промежуточной массы

Давно скрытые секреты выходят на свет

Диски, светящиеся шары и картофелина

Древние изменения климата Марса

Замечен всплеск наблюдений красных шаров

Исключение темной энергии из уравнения

Китай и Россия обладают сбитыми НЛО

Конференция по НЛО пройдет в Канаде

Красные карлики пожирают планеты, похожие на Землю

Лунные базы сталкиваются с невидимой угрозой

Новый телескоп может обнаружить 100 000 миров

Окончательная перепись близких звёздных систем

Почему первые галактики прекратили звездообразование

Размытые видеозаписи и никаких фактов

Странное квантовое свойство изолятора будущего

Триллер Стивена Спилберга об НЛО всех покорил

Туристы запечатлели яркий треугольный НЛО

Файлы об НЛО разжигают панику на Земле

Фильм Стивена Спилберга об НЛО бьёт рекорды

Эволюция городской мобильности. Все об электросамокатах

Встреча с инопланетянами в Розуэлле

За кулисами печально известного интервью Груша

Загадочная картофелина над Колорадо

Инопланетный корабль был всего лишь светом

Инопланетян по-прежнему нет

Наблюдения таинственных шаров

Недавно опубликованное досье Пентагона об НЛО

Новое внимание к исчезновению генерал-майора

Новые файлы НЛО могут содержать угрозу безопасности

Последние мгновения перед исчезновением генерала

Правительства скрывают правду об инопланетянах

Прозрачный НЛО искривил пространство

Разоблачитель НЛО заявляет о секретных расходах

Рецензия на фильм Стивена Спилберга

Сообщения о светящихся красных шарах

Странные огни, но мало неопровержимых фактов

США публикуют третью порцию файлов об НЛО

Трамп обнародовал третью порцию файлов об НЛО

Угрожает ли Вере раскрытие НЛО

Шкала сообщений об НЛО, заслуживающих изучения

Большинство американцев верят в НЛО

Вращающиеся диски и светящиеся шары

Время существует не везде

Инопланетяне могут существовать

Инопланетяне на чемпионате мира

Опубликованы новые файлы об НЛО

Официальные лица США приблизились к тайне НЛО

Пентагон опубликовал третью партию файлов об НЛО

Плазменные шары в центре внимания

Появление НЛО над Зимбабве летом 2008 года

Публичное раскрытие администрации Трампа

Пять сообщений правоохранительных органов о НЛО

Светящиеся шары на северо-востоке США

Создали ядерные шаровые молнии в лаборатории

США публикуют третью партию файлов об НЛО

Третья партия файлов об НЛО

Уфологические файлы Пентагона содержат видеозаписи

Фильм, который стоит посмотреть перед Днем раскрытия

Христианство совместимо с концепцией НЛО

Шаровые НЛО над северо-востоком США

Реальные истории, которые легли в основу фильмов ужасов

Артефакт обнаружен на фото марсохода

База инопланетян в районе северного полюса Луны

Восемь инопланетных существ, описанных властями

Грибы на Марсе сделают реголит плодородным

Загадочный водяной лед Меркурия

Замаскированный НЛО направляется к району ранчо Скинуокер

Инвестор ищет возможности, связанные с НЛО

Инопланетяне как никогда близки

Кладезь данных о гравитационных волнах

Марс может помочь нам понять маргинальные экзопланеты

Невероятный научно-фантастический мини-сериал

Новый опрос проливает свет на убеждения американцев

Обнаружена трижды затменная система звёзд

Одержимость Стивена Спилберга инопланетянами

Пилот видел НЛО размером больше авианосца

Правительственные секреты об инопланетянах

Привел ли инцидент в Варгинье к обнаружению инопланетян

Реальные доказательства или мистификация

Светящийся шар завис над городом

Умирающая звезда создала Хрустальный Шар

Величайшее сокрытие информации в истории США

День раскрытия информации хочет, чтобы вы поверили

Доказательство реальности путешествий во времени

Как использовать лунные ресурсы

Миллиарды секретных расходов, скрытых от Конгресса

Многие фильмы Спилберга об инопланетянах глубокие

Многомиллиардный секрет американских военных

Не верьте ажиотажу вокруг искусственного интеллекта

НЛО увеличивает число подписчиков блогеров

Определили физические признаки нашего Сознания

Отвечать на сигналы инопланетян запрещено

План на день, когда инопланетяне вступят в контакт

Почему размер популяции не спасает ее от вымирания

Связи ЦРУ с инопланетными технологиями

Скрытый порядок в многомерной случайности

Странные огни, бесшумные корабли и близкие встречи

США изучали комаров как биологическое оружие

ЦРУ собирает инопланетные технологии

Черные дыры делают экзопланеты непригодными для жизни

Эмили Блант изучала реальные истории о похищениях

Берегитесь Малдеров и Скалли

В файлах об НЛО христиане видят демонов

Внеземная жизнь может ускользать от зондов

Законодатели хотят, чтобы уфо-инсайдеры имели иммунитет

Как Великая пирамида пережила землетрясения

Конгрессмен осуждает препятствия на пути к правде

На острове Пасхи появилась новая статуя

Недалеко от Юпитера наши рой метеоритов

Нужно принять меры по обеспечению прозрачности

Обнаружили сверхземлю у близлежащего красного карлика

Писать письма инопланетянам нестоит

Правительство США вербовало детей-экстрасенсов

Правительству США известно об инопланетянах

Сильно покрасневшие загадочные квазары

Скептик посетил ранчо Скинуокер

Стивен Спилберг вызвал возмущение из-за НЛО

Стремление к раскрытию тайн НЛО

Уфо-инсайдеры штурмуют Капитолийский холм

Участники сообщества конспирологов на Reddit

Экзопланета размером с Сатурн и земной температурой

Адские планеты более распространены, чем экзоземли

Вот 15 лучших фильмов об НЛО

Встречи с инопланетянами. Факт или вымысел

Жанна д’Арк - девушка, которая определила будущее мира

Жуткий НЛО замечен в Бразилии

Инопланетяне - самозванцы

Испытали управляемый снаряд для рельсотрона

Как инопланетянам достичь Земли

Картина доказывает, что путешествия во времени реальны

Кристаллы пространства и времени

Людей отправляют в Ад чаще, чем в Рай

Обреченные экспедиции - почва для теорий заговора

Они прилетели из чужих миров

Откуда Земля получила фосфор и азот

Под водами озера Шамплейн скрывается чудовище

Правительству США известно о расах инопланетян

Решение проблемы Кардашева

Секретные программы обратного инжиниринга НЛО

Сотрудник ЦРУ рассекретил сеть инопланетных хабов

Что бы почитать про НЛО

Грузовики с КМУ от «Грузовик-ДВ»

Администрация Байдена стреляла ракетами по шарам

Архиепархия Вашингтона разошлась во мнениях о НЛО

Все предсказания Ванги на 2026 год

Наверх
Яндекс.Метрика