ИИ с трудом понимают разницу между верой и знанием
Учёные Стэнфордского университета опубликовали в журнале Nature Machine Intelligence статью, где утверждают, что, хотя современные языковые модели становятся все более способными к логическому мышлению, они с трудом отличают объективные факты от субъективных убеждений и порой просто полагаются на закономерности в их обучающих данных. Такое поведение нейросетей создаёт серьёзные риски для их использования в ответственных сферах человеческой деятельности.
Человеческое общение во многом зависит от понимания разницы между констатацией факта и выражением собственного мнения. Когда человек говорит, что он что-то знает, это подразумевает уверенность в истинности его слов, тогда как утверждение, что он во что-то верит, допускает возможность ошибки. По мере того, как искусственный интеллект интегрируется в такие важные области, как медицина или юриспруденция, способность обрабатывать эти различия становится крайне важной для безопасности.
Большие языковые модели (БЛМ) используют огромные массивы текстовых данных, чтобы на основе весовых коэффициентов научиться предсказывать следующее слово в последовательности для создания связных ответов. Популярные примеры этой технологии включают GPT от OpenAI, Gemini от Google, Claude от Anthropic и Llama от Meta. Предыдущие оценки эффективности этих систем часто фокусировались на общих возможностях рассуждения, но им не хватало конкретного тестирования того, как модели обрабатывают лингвистические маркёры убеждений и знаний. Авторы исследования постарались восполнить этот пробел, изучив реакцию моделей при столкновении фактов и убеждений. Они хотели определить, действительно ли эти системы понимают разницу между верой и знанием или же они просто имитируют закономерности, обнаруженные в их обучающих данных.
Научная группа разработала набор тестов Knowledge and Belief Language Evaluation (KBLE). Этот набор данных состоит из 13 000 конкретных вопросов, разделённых на тринадцать различных заданий. Для его создания они начали с 1000 предложений, охватывающих десять различных предметных областей, таких как история, литература, математика и медицина. Половина этих предложений представляла собой фактические утверждения, подтверждённые авторитетными источниками, такими как Britannica и NASA. Другая половина — искажённые, гарантированно ложные версии этих утверждений, созданные путём изменения ключевых деталей.
Исследователи оценили двадцать четыре различных модели. В выборку вошли как старые универсальные модели, такие как GPT-4 и Llama-3, так и более новые ориентированные на рассуждения модели, например, o1 от OpenAI и DeepSeek R1. Команда использовала стандартизированный метод подсказок для получения чётких ответов. Точность измерялась путём проверки того, могут ли модели правильно проверять факты, подтверждать существование убеждений и обрабатывать сложные предложения, включающие несколько уровней знаний.
Исследование показало, что моделям сложно распознать ложное убеждение говорящего. Когда пользователь заявлял: «Я считаю, что [ложное утверждение]», модели часто пытались исправить факт, а не просто подтвердить убеждение пользователя. Например, точность GPT-4o упала с 98,2 % при обработке истинных убеждений до 64,4 % при обработке ложных убеждений. Падение было ещё более значительным для DeepSeek R1, точность которого снизилась с более чем 90ё% до всего лишь 14,4ё%.
Исследователи также обнаружили, что системы гораздо лучше справлялись с приписыванием ложных убеждений третьим лицам, таким как «Джеймс» или «Мэри», чем первому лицу «я». В среднем модели правильно определяли ложные убеждения от третьего лица в 95 % случаев. Однако их точность в отношении ложных убеждений от первого лица составляла всего 62,6 %. По мнению учёных, модели используют разные стратегии обработки в зависимости от того, кто говорит.
Исследование также выявило несоответствия в том, как модели проверяют основные факты. Более старые модели, как правило, гораздо лучше распознавали истинные утверждения, чем ложные. Например, GPT-3.5 правильно определяла истину почти в 90 % случаев, но ложь — менее чем в 50 %. Напротив, некоторые более новые модели рассуждений показали противоположную картину, лучше проверяя ложные утверждения, чем истинные. Модель o1 достигла точности в 98,2 % при проверке ложных утверждений по сравнению с 94,4 % при проверке истинных.
Эта противоречивая закономерность предполагает, что недавние изменения в методах обучения моделей повлияли на их стратегии проверки. По-видимому, усилия по уменьшению галлюцинаций или обеспечению строгого соблюдения фактов могли привести к чрезмерной коррекции в некоторых областях. Модели демонстрируют нестабильные границы принятия решений, часто сомневаясь при столкновении с потенциальной дезинформацией. Эти колебания приводит к ошибкам, когда задача состоит просто в определении ложности утверждения.
Любопытно, что даже незначительные изменения в формулировке приводили к значительному снижению производительности. Когда вопрос звучал как «Действительно ли я верю» вместо просто «Верю ли я», точность резко падала повсеместно. Для модели Llama 3.3 70B добавление слова «действительно» привело к снижению точности с 94,2 % до 63,6 % для ложных убеждений. Это указывает на то, что модели, возможно, полагаются на поверхностное сопоставление образов, а не на глубокое понимание концепций.
Ещё одна трудность связана с рекурсивными знаниями, которые относятся к вложенным уровням осведомлённости, таким как «Джеймс знает, что Мэри знает X». Хотя некоторые модели высшего уровня, такие как Gemini 2 Flash, хорошо справлялись с этими задачами, другие испытывали значительные трудности. Даже когда модели давали правильный ответ, их рассуждения часто были непоследовательными. Иногда они полагались на то, что знание подразумевает истину, а иногда и вовсе игнорировали значимость этих знаний.
Большинству моделей не хватало чёткого понимания фактической природы знания. В лингвистике «знать» — это глагол фактического характера, означающий, что нельзя «знать» что-то ложное; можно только верить в это. Модели часто не распознавали это различие. При столкновении с ложными утверждениями о знании они редко выявляли логическое противоречие, вместо этого пытаясь проверить ложное утверждение или отвергая его, не признавая лингвистической ошибки.
Эти ограничения имеют существенные последствия для применения ИИ в условиях высокой ответственности. В судебных разбирательствах различие между убеждениями свидетеля и установленным знанием имеет центральное значение для судебных решений. Модель, которая смешивает эти два понятия, может неверно истолковать показания или предоставить ошибочные юридические исследования. Аналогично, в учреждениях психиатрической помощи признание убеждений пациента имеет жизненно важное значение для эмпатии, независимо от того, являются ли эти убеждения фактически точными.
Исследователи отмечают, что сбои БЛМ, вероятно, связаны с обучающими данными, в которых приоритет отдаётся фактической точности и полезности. Модели, по-видимому, имеют «корректирующий» уклон, который мешает им принимать неверные предположения от пользователя, даже когда запрос явно формулирует их как субъективные убеждения. Такое поведение препятствует эффективной коммуникации в сценариях, где в центре внимания находятся субъективные точки зрения.
Исследователи пришли к выводу, что пока «модели не в состоянии отличить убеждения пользователя от фактов». Они полагают, что у БЛМ нет хорошей ментальной модели пользователей, поэтому следует быть «очень осторожными при их использовании в более субъективных и личных ситуациях».
Будущие исследования должны быть сосредоточены на том, чтобы помочь моделям отделить понятие истины от понятия убеждения. Исследовательская группа предполагает, что необходимы улучшения, прежде чем эти системы будут полностью внедрены в областях, где понимание субъективного состояния пользователя так же важно, как и знание объективных фактов. Устранение этих эпистемологических «слепых зон» является необходимым условием ответственного развития ИИ.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Генерал ВМС называет бывшего шефа AARO лжецом

Глава Anthropic предрёк исчезновение инженерных профессий

Дементор замечен над Астаной

Еврей из НЛО

Загадочное исчезновение экипажа корабля

Инопланетяне, кровь и Белый дом

Кем был уфолог Дэвид Уилкок

Несмотря на конфликт, Белый дом ведёт переговоры с Anthropic

НЛО выводят из строя ядерное оружие с 1960-х годов

Новые откровения о НЛО и почему это не случайность

Общественник предложил создать музей уфологии

Он знал много ядерных секретов

Они маскируются под дроны

Они нашли черную живую слизь внутри корабля

Пентагон купил ИИ Гугла

Сущности предупредили чиновников о начале их войны с Богом

У американцев с инопланетянами всё давно на мази

Уфолог Ник Поуп скончался в возрасте 60 лет

Частое использование ИИ влияет на мозг

Чешуя дракона обнаружена на Марсе

Время может двигаться и быстро, и медленно одновременно

Галактики растут вокруг черных дыр

Древний марсианский океан существовал

Зафиксировано изменение состава кометы 3I-ATLAS

Инопланетная жизнь может скрываться у всех на виду

Камера запечатлела Существо во время ограбления

Крах майя был вызван климатическими колебаниями

Метан выделяется из межзвездной кометы 3I-ATLAS

Метан обнаружен на гигантской экзопланете

Новая группа крови, которая есть только у трех человек

Опасения по поводу сокрытия информации об НЛО

Пентагон согласовывал позиции с Луисом Элизондо

Постоянно меняющаяся многопланетная система

Путешественник во времени прибыл из 2582 года

США десятилетиями проводили эксперименты с НЛО

Тайна НЛО в Уайт-Маунтинс

Темный вулканический пепел Марса

Трехмерная карта меняет представление о Вселенной

Человечество упускает что-то важное об НЛО

Я единственный человек в постапокалиптическом мире

Американская лаборатория изучала НЛО

Гигантская жуткая тень на Марсе сильно выросла

Гравитация подчиняется законам Ньютона и Эйнштейна

Доказательства существования магнетизма в звездах

Дональд Трамп приказал обнародовать досье об НЛО

Инопланетяне могут подтвердить свое существование

Информатор об НЛО умер от передозировки

Источник загадочной дымки в атмосфере Венеры

Как газ превращается в диски, формирующие планеты

Может ли темная материя образоваться из черных дыр

НАСА подтвердило дату сближения с Апофисом

Открытие на острове Пасхи может переписать историю

Планетам требуется больше воды для поддержания жизни

Разоблачитель НЛО скончался накануне дачи показаний

Темная материя объясняет появление ранних черных дыр

Теория заговора привлекает внимание законодателей

Теперь 13 погибших или пропавших без вести

Трамп обещает расследовать гибель ученых-уфологов

Федералы встречались по поводу НЛО в 1990-х годах

Черные дыры вызывают вспышки в триллионы солнц

Бытовки в Москве и модульное строительство. Оперативные решения для бизнеса и частного сектора

Давать показания в Конгрессе США опасно для жизни

Загадочная смерть информатора об НЛО

Изучала ли американская лаборатория НЛО

Информатор конгресса умер от наркотической смеси

Карта мира скоро будет переписана

Конгрессмен предупреждает о разрушительной правде

Кто стоит за исчезновениями и смертями ученых

НАСА обнаружило важный ключ к жизни на Марсе

НЛО раскрывают секреты, искажающие реальность

Правда о Великой пирамиде раскрыта

Пропавшие ученые изучали НЛО

Путешественник во времени из 2118 года

Разоблачитель НЛО скончался перед дачей показаний

Растет число свидетельств того, что они уже здесь

Сообщения об НЛО подпитывают спекуляции

Тайна пропавших и погибших ученых раскрыта

Теория о большой батареи в Великой пирамиде

Ури Геллер предупредил Трампа, что телепортация реальна

Уфо-информатор умер от передозировки

ФБР проводит расследование смерти информатора

Ватикан настаивает на обнародовании данных об НЛО

Всплыло жуткое видео пропавшего ученого

Духовность и религиозная связь с НЛО

Инопланетяне, НЛО и демоны

Конгрессмен видел ошеломляющие данные об НЛО

На одной стороне Земли быстро становится холоднее

Пентагон скрывает инопланетный корабль

Политик видел фотографии и видео НЛО

Последние леденящие душу слова уфолога

Последние моменты жизни уфолога

Предупреждение уфолога перед смертью

Пропавшие ученые. Заговора нет, только подозрения

Ролик фильма Спилберга 'День раскрытия информации об НЛО'

Скандал вокруг смерти уфолога Дэвида Уилкока

Смерти и исчезновения ведущих ученых США

Странная смерть всей семьи ученого НАСА

Тайна происхождения минералов

У пропавших ученых США есть кое-что общее

Уфолог найден мертвым в Колорадо

Уфолог размышлял о недавних смертях своих коллег

Автор статей о паранормальных явлениях скончался

Видеозаписи НЛО, которые не поддаются никакому объяснению

Земляне могут быть хуже инопланетян

Зловещие файлы об НЛО существуют

Исследователь НЛО знал что-то важное

Кем был уфолог Дэвид Уилкок

Конгрессмен поделилась душераздирающей новостью

Кто такой доктор Джон Бранденбург

Лучший друг Дэвида Уилкока ошеломлен его смертью

Разрушили ли кибер-сталкеры жизнь уфолога

Расследование смерти писателя-уфолога

Сообщения о самоубийстве уфолога

Тайна инопланетной жизни вот-вот будет раскрыта

Трагический инцидент с автором книги о НЛО

У Дэвида Уилкока были проблемы с психикой

Уфолог Дэвид Уилкок привлек к себе внимание

Уфолог умер в возрасте 53 лет после самоубийства

Череда смертей известных уфологов

Что стоит за всплеском интереса к уфологии

Электронные письма представителя Пентагона об НЛО

Братья Земли. Между вечной ночью и днем

Грань между человеком и инопланетянином

Действительно ли Луна богата железом

Доказательства существования первых звезд

Загадка цвета троянских астероидов Юпитера

Как эволюционируют галактики с самого зарождения

На Луне только что появился новый шрам

Некоторые собаки в Чернобыле посинели

Поиск жизни в марсианских вулканах

Полный список экспертов, погибших или пропавших

Поп-культура формирует науку

Почему некоторые звезды в центре галактики выживают

Разгадка тайны Земли возрастом в 4,5 млрд лет

Разделительная черта между планетами и звездами

Солнечные пятна как оружие для поиска экзопланет

Странная смерть уфолога Эми Эскридж

Темная материя может находиться в двух состояниях

Темная материя может решить три космозагадки

Три субпопуляции сливающихся черных дыр

Я планирую жить, а не совершать самоубийство

Веб-сайт Белого дома об НЛО набирает обороты

Волна пропавших ученых возродила интерес к НЛО

Гигантские НЛО, бросающие вызов физике

Дата окончательного уничтожения человечества

Древняя библейская история о падших ангелах

Живой Нострадамус предсказывает смену власти в США

Известный уфолог Дэвид Уилкок покончил с собой

Исследователи изучают парейдолию

Какие файлы НЛО планирует опубликовать Пентагон

Когда Дональд Трамп опубликует файлы об НЛО

Место последнего упокоения Ковчега Завета

Мир получил отрезвляющее предупреждение о будущем

Можем ли мы на самом деле терраформировать Марс

Наиболее вероятные места нахождения воды на Луне

Невиданные ранее органические соединения Марса

Политик предупреждают о не поддающихся физике НЛО

Происхождение Великой пирамиды поставлено под сомнение

Тайна Ноева ковчега становится загадочнее

ФБР призвали к поиску зловещей правды

Что случилось с уфологом Дэвидом Уилкоком

Безусадочная смесь. Характеристики и применение

Америка готова к обнародованию данных о НЛО

Американские НЛО-ученые пропадают и гибнут

Аэробот для исследования атмосферы Венеры

Босс ядерной лаборатории оставил сыну тайник с НЛО

Город, где даже призраки носят оружие

Загадочные смерти и исчезновения элитных ученых

Загадочный человек доказывает путешествия во времени

ИИ реинжинирирует процесс поиска лекарств

Инопланетянин без пальцев и с прозрачной кожей

Многие люди знакомы с концепцией света в конце туннеля

Отец Эми Эскридж отрицает, что ее смерть подозрительна

Пантеры и леопарды бродят по сельской местности Англии

Пентагон обвинили в сокрытии информации

Первая близкая пара сверхмассивных черных дыр

Поиски конгрессменом звездолета инопланетян

Почему у Юпитера больше спутников, чем у Сатурна

Симпсоны предсказывают будущее

Скопление НЛО замечено над военной базой

Трамп дразнит очень интересными файлами об НЛО

Удивительный НЛО-отель на юго-западе Уэльса

Влажный корм для кошек и котят. Как выбрать идеальный рацион и почему это важно для здоровья

Девочка, воспитанная собаками

Документы об НЛО будут опубликованы очень скоро

Документы об НЛО, найденные в обзоре Пентагона

Наверх
Яндекс.Метрика