Ограничения ИИ в решении головоломок
Новое исследование выявило удивительный пробел в логических способностях самых продвинутых на сегодняшний день моделей зрительного языка ИИ. Несмотря на впечатляющие результаты в различных установленных тестах, недавнее исследование, опубликованное на arXiv, показало, что модели на основе визуального языка (VLM), такие как GPT-4o от OpenAI, с трудом справляются с задачами Бонгарда - набором визуальных головоломок, требующих абстрактного мышления на высоком уровне, подобном человеческому.
Исследование, включающее конкурентный анализ этих моделей по сравнению с участниками-людьми, ставит под сомнение предположения о когнитивных способностях ИИ в интерпретации визуального мира. “В то время как VLM-системы иногда успешно распознают отличительные концепции и решают некоторые проблемы, они часто дают сбои, не в состоянии понять визуальные концепции и обосновать их”, - пишут исследователи. “Удивительно, но даже элементарные концепции, которые могут показаться людям тривиальными, такие как простые спирали, представляют значительные трудности”.
“Более того, даже когда их просят четко сосредоточиться на этих концепциях и проанализировать их, они продолжают колебаться, что свидетельствует не только о недостаточном понимании этих элементарных визуальных концепций, но и о неспособности обобщить невидимые концепции”.
В мире, где искусственный интеллект (ИИ) быстро развивается для решения задач, которые когда-то казались исключительными для человеческого восприятия, недавнее исследование предлагает реальную проверку ограничений машинного интеллекта в понимании сложных визуальных сигналов.
Исследователи из различных европейских институтов сравнили продвинутые модели визуального языка (VLM), такие как GPT-4o и Claude, с набором классических головоломок, называемых задачами Бонгарда.
Разработанные в 1960-х годах, эти визуальные задания проверяют распознавание образов и абстрактное мышление, требуя от участников расшифровать концептуальные правила из простых геометрических фигур. Для искусственного интеллекта эти головоломки далеко не просты.
Задачи Бонгарда (BPs) требуют анализа набора из 12 диаграмм, разделенных на две группы, каждая из которых соответствует определенному, часто абстрактному правилу. Например, на одной стороне диаграмм могут быть исключительно вытянутые по вертикали фигуры, в то время как на другой - вытянутые по горизонтали.
Люди от природы хорошо справляются с такими задачами, которые требуют не просто выявления базовых закономерностей, но и формирования абстрактных концепций на основе минимальных данных. Это делает BPs особенно сложной задачей для моделей машинного обучения, особенно по сравнению с типичными тестами распознавания изображений.
Для этого исследования исследователи оценили производительность различных моделей vision-language, включая GPT-4o от OpenAI, Claude и две версии модели LLaVA. Каждой модели было поручено решить 100 задач Бонгарда, а их ответы оценивались большой языковой моделью “судья” для обеспечения объективной оценки.
Результаты были очевидными и поразительными: люди значительно превзошли искусственный интеллект во всех категориях. В среднем люди-участники достигли успеха в 84% случаев, в то время как наиболее эффективная модель визуального языка GPT-4o справилась только с 17%. Этот пробел подчеркивает уникальные когнитивные способности человека, особенно в области визуального мышления и абстракции.
Исследователи разделили задачи Бонгарда на пять категорий: существование, размер, концепция, количество и пространственные отношения. Люди показали лучшие результаты в категориях “существование” (наличие или отсутствие признака) и “пространственная ориентация” (spatial orientation), набрав более 90% баллов.
В отличие от этого, модели vision-language испытывали огромные трудности при решении пространственных задач, не достигая точности более 10% во всех моделях. GPT-4o немного преуспел в решении абстрактных “концептуальных” задач, возможно, из-за интенсивного обучения работе с разнообразными данными, но все равно не дотягивал до производительности человека.
Чтобы глубже разобраться в причинах ограничений ИИ, исследователи изучили эффективность модели vision-language в конкретных задачах Бонгарда, сосредоточив внимание на том, могут ли эти модели идентифицировать фундаментальные концепции.
Они выбрали четыре репрезентативных БП, каждый из которых требовал своего визуального понимания: БП №16 (направление спирали), БП №29 (подсчет фигур), БП №36 (взаимное расположение) и БП №55 (ориентация слева направо). В каждом случае модели испытывали трудности.
Например, при запросе определить, вращается ли спираль по часовой стрелке или против, GPT-4o и Claude часто выдавали неверные результаты. Модели, как правило, допускали ошибки в согласованности, ошибочно принимая одно направление вращения за другое при различных попытках.
Аналогичным образом, только Claude показал точные результаты при анализе BP # 29, который требовал различения фигур внутри или снаружи более объемной формы. Большинство моделей неправильно интерпретировали или не смогли правильно подсчитать, что указывает на проблемы с возможностями визуального подсчета ИИ.
Для теста №55, который включал ориентацию в пространстве, зрительно-языковые модели постоянно давали сбой, не позволяя определить, слева или справа от полости большей формы появился круг. Эта конкретная проблема подчеркивает более широкую проблему, с которой сталкиваются виртуальные машины, связанные с пространственными отношениями, что согласуется с другими исследованиями, предполагающими, что пространственное мышление является критическим ограничением ИИ.
Хотя эти результаты могут подчеркнуть ограничения современного ИИ, они также указывают на возможности для будущих инноваций. Исследователи предполагают, что специализированное обучение, возможно, включающее промежуточные этапы, позволяющие лучше различать концепции, может повысить производительность.
Например, многоэтапный подход, при котором модели сначала выявляют возможные закономерности, а затем тестируют эти закономерности, может улучшить способность ИИ решать абстрактные задачи, такие как головоломки Бонгарда. Другие стратегии могут включать пересмотр процессов визуального кодирования моделей и использование более продвинутых методов для улучшения распознавания образов и абстрактного мышления.
Перевод задач Бонгарда в реальные сценарии также может помочь моделям ИИ развить лучшие перцептивные и когнитивные способности. Используя реальные аналоги для решения этих головоломок, исследователи могли бы выяснить, помогает ли визуальный контекст ИИ более эффективно формировать абстрактные концепции и рассуждения. Это направление исследований может привести к созданию более универсальных моделей визуального языка, способных более глубоко воспринимать повседневные визуальные сигналы.
Полученные результаты ставят под сомнение предположения о способности ИИ отражать когнитивные способности человека и поднимают важные вопросы об адекватности стандартных критериев оценки эффективности ИИ.
Несмотря на успех в таких задачах, как классификация изображений и создание субтитров, недостатки модели vision-language в BPs показывают, что для оценки истинного понимания ИИ могут потребоваться более сложные тесты. Как предполагают авторы, перевод сложных абстрактных задач, таких как задачи Бонгарда, в контекст реального мира может дать представление о способности ИИ обрабатывать визуальную информацию и рассуждать о ней на человеческом уровне.
В то время как VLM, такие как GPT-4o и Claude, достигли впечатляющих успехов в соединении текста и видения, это исследование показывает, что путь к подлинному человеческому пониманию остается сложным.
По мере развития искусственного интеллекта преодоление этих ограничений восприятия будет иметь важное значение для создания систем, которые смогут взаимодействовать с окружающим миром так же легко, как это делают люди. Это исследование напоминает нам о сложности человеческого познания, побуждая исследователей в области искусственного интеллекта выходить за рамки существующих критериев и стремиться к достижениям, которые приближают машины к восприятию и рассуждениям на уровне человека.
В конечном счете, это исследование проливает свет на сложности человеческого познания, и ИИ еще предстоит пройти долгий путь, чтобы воспроизвести его. Хотя современные модели визуального языка представляют собой значительный прогресс, неспособность решить проблемы Бонгарда напоминает нам о проблемах, присущих моделированию абстрактного мышления и визуального восприятия.
По мере развития исследований в области искусственного интеллекта понимание и устранение этих пробелов будут иметь решающее значение для создания систем, способных понимать и интерпретировать мир так, как это делают люди.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Безумные изобретатели и машины для общения с мертвыми

Затягивание сети вокруг неуловимого нейтрино

Звездолет ATLAS резко меняет цвет

ИИ с трудом понимают разницу между верой и знанием

Илон Маск. Реальны ли инопланетяне

Инопланетяне могут вторгнуться на Землю

Инопланетяне не заметили попадания ракеты

Марс оказывает влияние на климат Земли

НАСА готовится к освоению марсианских небес

Нейтрино превратил изотоп углерода в азот

Осознанные сновидения - новое состояние сознания

Подтвердили существование временных отражений

Расшифровали загадочный космический сигнал

Странного вида НЛО, зависший над Боготой

Тайна инопланетного корабля может быть раскрыта

Тайна, окружающая радиационные пояса Урана

Трамп на 100% раскроет правду об НЛО

У чёрных дыр и Солнца нашлось кое-что общее

Хакерский ИИ уже почти обошёл человека

Черные дыры генерируют свет от падающей материи

Археологи сделали настоящее открытие в Петре

Брифинги Пентагона по НЛО

Врач увидел нечто во время ночной работы

Выяснили, чем питаются инопланетяне

Где спрятаться от ядерного удара

Загадочные вспышки, связанные с ядерными испытаниями

Знаменитое похищение инопланетянами в Аризоне

Инопланетяне навестили офицера разведки

История происхождения Древнего Египта переписана

Любопытный НЛО снят над колумбийским городом

НЛО появляются в небе над местом для серфинга

Новое открытие на острове Пасхи

Нострадамус и Ванга сделали ужасающие предсказания

Плаксивый криптид из Пенсильвании появиться в комиксе

Почему НЛО повсюду в современном искусстве

Радио Судного дня разослала серию зловещих сообщений

Точная дата столкновения звездолета ATLAS с Землей

Треугольный НЛО замечен над Веракрус

Уфологи приглашают взглянуть на небо

Являются ли НЛО результатом человеческого непонимания

Антихвост Атлас содержит нечто, чего нет у комет

Атлас - мирные хиппи, которые спасут нас от ядерной войны

Взгляды Илона Маска на Бога изменились

Во внутреннем ядре Земли скрыто суперионное состояние

Затерянный храм, который решает историческую загадку

Здравый смысл подсказывает, что в галактике есть жизнь

Илон Маск не видел свидетельств присутствия инопланетян

Исключили возможность появления четвертого нейтрино

Как поймать комету, которая еще не была обнаружена

Красные медузы породили теории о вторжении

Легенды о горе Шаста

Марсианская пыль - универсальный строительный материал

Некоторые недостающие элементы жизни на Земле

Обнаружили огромные вращающиеся нити галактик

Обнаружили планету, похожую на Татуин

Секретная правительственная программа по изучению НЛО

Спрайты замечены над замком Бейнак

Странные огни появляются в небе Йоркшира

Странный взрыв прогремел в Розуэлле

Язычество на подъеме в постконфессиональной Британии

Клининг в квартире или доме. Почему стоит довериться профессионалам

Белый Дом держали в неведении относительно НЛО

Залетные объекты из систем Веги, Фомальгаута и еще 18 звезд

Зафиксировали черную дыру в режиме реального времени

ИИ деградирует, обучаясь на собственных ошибках

Инопланетные гибриды живут среди людей

Мощные ветра дуют у рекордной черной дыры

Музыкант верит в бигфута, призраков и НЛО

НЛО над Британией был космической ракетой

Обнаружили ген, вызывающий психические расстройства

Океаны заслуживают более пристального внимания

Разоблачителя НЛО обвинили во лжи

Сверхновые производят элементы для зарождения жизни

Святой грааль уфологии выставлен на онлайн-аукцион

Секретная метеорологическая программа США

Снежный человек забрал девочку

Странное существо напугало аргентинского врача

Таинственный пожар вспыхнул в Ангаре-84

Тайна бесследного исчезновения мальчика

Фильм про НЛО превзошел студийные блокбастеры

Черная дыра, пойманная в критический момент

Квесты для детей в Самаре. 'Пиксель квест' и 'Прятки во тьме' - веселье гарантировано

Выставка 'Голос космоса. НЛО и паранормальные явления'

Гибриды инопланетян и людей живут на Земле

Загадочная полоса света над британским городом

Загадочные мегаструктуры под пирамидами в Гизе

Звезда, которая указывала путь мудрецам

Инопланетная комета содержит ключи к жизни

Инопланетяне живут среди людей

Информатор посоветовал Трампу назначить царя по НЛО

Конструкция моста Леонардо да Винчи работает

Марс мог быть тропическим оазисом

Наконец-то нашли Вифлеемскую звезду

Президент США полностью проинформирован об НЛО

Роботы уничтожат человечество в течение 100 лет

Семиногого осьминога выбросило на берег Шотландии

Сенатор попросил Трампа о встрече по НЛО

Скоро произойдет раскрытие информации об НЛО

Странная комета являются ключом к жизни на Земле

Странный дирижабль в 1897 году над Миссури

Трамп знает об инопланетянах

Я был похищен инопланетянами с тремя щупальцами

Как рассчитать расход пропанового баллона в быту

Проверка моих микрозаймов по фамилии

Архив исследований НЛО выставлен на аукцион

Загадочная библейская карта 1525 года

История похищения Барни и Бетти Хилл

Марс мог быть тропическим оазисом

Межзвездная комета может нести инопланетную жизнь

Последние данные о высадке инопланетян на Землю

Правительство США владеет инопланетными технологиями

Разоблачителям НЛО нужна амнистия

Самые странные случаи НЛО произошли в Бразилии

Свидетельства тропических осадков на Марсе

Скептики опровергли воскресение Иисуса

Скрытые мегаструктуры под египетскими пирамидами в Гизе

Таинственный пожар вспыхнул в Розуэлле

Тайна голубых диких собак Чернобыля

Треугольный НЛО сняли в Мексике

Физический варп-двигатель возможен

Что заставляет людей верить в невероятное

Что послужит толчком ко Второму пришествию

Экстрасенс предсказал дату конца человечества

Эпоха раскрытия пользуется большим успехом

Ажиотаж вокруг возможного обнародования досье об НЛО

Жевательная резинка обнаружена на астероиде Бенну

Знаменитый призрак из Уэзерспуна

Инопланетный корабль имеет два двигателя

Левитирующие датчики проложат путь к темной материи

Манхэттенский проект по созданию антивещества

Массивная галактика грандиозной формы

Моделирование венерианских вулканических выбросов

Перед полетами на Марс нам нужна лучшая защита

Плоская земля, духи и теории заговора

Разгадка тайны космической пыли

Религии, связанные с НЛО, и поиски смысла жизни

Скрытые звезды влияют на поиск техносигнатур

Спустя 50 лет после встречи с НЛО Нимиц отправляется на свалку

Сфера Буга вызывает разногласия у экспертов

Тайна затмения, которому 2700 лет

Трамп намерен рассекретить файлы об НЛО

Что происходит с кремами и лекарствами в космосе

Что связывает квантовую физику и гравитацию

Экзолуна вращается вокруг газового гиганта HD 206893 B

Квесты на детский день рождения в Ростове-на-Дону. 'Прятки в темноте' и другие идеи

Отделка фасада дома из панелей ЖБИ

Академическим кругам пора заняться изучением НЛО

Вирусные кадры с НЛО вызвали ожесточенные споры

Вода на планетах у переменных звезд

Воды у Калифорнии осветил подводный НЛО

Гели могут объяснить происхождение жизни на Земле

ИИ-модели готовы признаться в своих грешках

Конспиролог пропал при загадочных обстоятельствах

Крупные речные дренажные системы Марса

Насколько быстро расширяется Вселенная

НЛО заметили над Майами-Бич

НЛО поднялся из моря в Саффолке

Обнаружил ли телескоп экзолуну

Подводные НЛО - новая область интереса законодателей

Призрак, бродящий по коллайдеру ЦЕРНА

Путешествия во времени без парадоксов возможны

Сколько сейчас времени на Марсе

Страшные предсказания Бабы Ванги на 2026 год

Тайны сооружения возле Даррингтон Уоллс-хенджа

Утечка гелия на экзопланете WASP-107b

Ученые составляют карту ореолов темной материи

Все, что вам нужно знать о звездолете пришельцев

Женщина заметила таинственные огни в небе

Живой Нострадамус Атос Саломе предупреждает

Житель Келоуны заметил в небе НЛО

Загадочные подводные НЛО

Загадочный пожар вспыхнул в Розуэлле

Звездолет инопланетян намного быстрее наших

Знаменитый рестлер оказался втянутым в загадку НЛО

Инопланетяне могут быть ангелами или демонами

Исследования о существовании внеземной разумной жизни

Конфликт на экстрасенсорном фронте

Космическая жвачка необходимая для жизни

Межпространственные порталы в другие сферы бытия

Мы верим в разумную жизнь, но все еще одиноки

Найдите доказательство того, что Земля плоская

Найдите край Земли и станьте миллионером

Облака, похожие на НЛО, над горой Шаста

Синий человечек из Стадхема

Таинственное пламя вспыхнуло в Розуэлле

Только что открыли новый закон физики

Наверх
Яндекс.Метрика