Ограничения ИИ в решении головоломок
Новое исследование выявило удивительный пробел в логических способностях самых продвинутых на сегодняшний день моделей зрительного языка ИИ. Несмотря на впечатляющие результаты в различных установленных тестах, недавнее исследование, опубликованное на arXiv, показало, что модели на основе визуального языка (VLM), такие как GPT-4o от OpenAI, с трудом справляются с задачами Бонгарда - набором визуальных головоломок, требующих абстрактного мышления на высоком уровне, подобном человеческому.
Исследование, включающее конкурентный анализ этих моделей по сравнению с участниками-людьми, ставит под сомнение предположения о когнитивных способностях ИИ в интерпретации визуального мира. “В то время как VLM-системы иногда успешно распознают отличительные концепции и решают некоторые проблемы, они часто дают сбои, не в состоянии понять визуальные концепции и обосновать их”, - пишут исследователи. “Удивительно, но даже элементарные концепции, которые могут показаться людям тривиальными, такие как простые спирали, представляют значительные трудности”.
“Более того, даже когда их просят четко сосредоточиться на этих концепциях и проанализировать их, они продолжают колебаться, что свидетельствует не только о недостаточном понимании этих элементарных визуальных концепций, но и о неспособности обобщить невидимые концепции”.
В мире, где искусственный интеллект (ИИ) быстро развивается для решения задач, которые когда-то казались исключительными для человеческого восприятия, недавнее исследование предлагает реальную проверку ограничений машинного интеллекта в понимании сложных визуальных сигналов.
Исследователи из различных европейских институтов сравнили продвинутые модели визуального языка (VLM), такие как GPT-4o и Claude, с набором классических головоломок, называемых задачами Бонгарда.
Разработанные в 1960-х годах, эти визуальные задания проверяют распознавание образов и абстрактное мышление, требуя от участников расшифровать концептуальные правила из простых геометрических фигур. Для искусственного интеллекта эти головоломки далеко не просты.
Задачи Бонгарда (BPs) требуют анализа набора из 12 диаграмм, разделенных на две группы, каждая из которых соответствует определенному, часто абстрактному правилу. Например, на одной стороне диаграмм могут быть исключительно вытянутые по вертикали фигуры, в то время как на другой - вытянутые по горизонтали.
Люди от природы хорошо справляются с такими задачами, которые требуют не просто выявления базовых закономерностей, но и формирования абстрактных концепций на основе минимальных данных. Это делает BPs особенно сложной задачей для моделей машинного обучения, особенно по сравнению с типичными тестами распознавания изображений.
Для этого исследования исследователи оценили производительность различных моделей vision-language, включая GPT-4o от OpenAI, Claude и две версии модели LLaVA. Каждой модели было поручено решить 100 задач Бонгарда, а их ответы оценивались большой языковой моделью “судья” для обеспечения объективной оценки.
Результаты были очевидными и поразительными: люди значительно превзошли искусственный интеллект во всех категориях. В среднем люди-участники достигли успеха в 84% случаев, в то время как наиболее эффективная модель визуального языка GPT-4o справилась только с 17%. Этот пробел подчеркивает уникальные когнитивные способности человека, особенно в области визуального мышления и абстракции.
Исследователи разделили задачи Бонгарда на пять категорий: существование, размер, концепция, количество и пространственные отношения. Люди показали лучшие результаты в категориях “существование” (наличие или отсутствие признака) и “пространственная ориентация” (spatial orientation), набрав более 90% баллов.
В отличие от этого, модели vision-language испытывали огромные трудности при решении пространственных задач, не достигая точности более 10% во всех моделях. GPT-4o немного преуспел в решении абстрактных “концептуальных” задач, возможно, из-за интенсивного обучения работе с разнообразными данными, но все равно не дотягивал до производительности человека.
Чтобы глубже разобраться в причинах ограничений ИИ, исследователи изучили эффективность модели vision-language в конкретных задачах Бонгарда, сосредоточив внимание на том, могут ли эти модели идентифицировать фундаментальные концепции.
Они выбрали четыре репрезентативных БП, каждый из которых требовал своего визуального понимания: БП №16 (направление спирали), БП №29 (подсчет фигур), БП №36 (взаимное расположение) и БП №55 (ориентация слева направо). В каждом случае модели испытывали трудности.
Например, при запросе определить, вращается ли спираль по часовой стрелке или против, GPT-4o и Claude часто выдавали неверные результаты. Модели, как правило, допускали ошибки в согласованности, ошибочно принимая одно направление вращения за другое при различных попытках.
Аналогичным образом, только Claude показал точные результаты при анализе BP # 29, который требовал различения фигур внутри или снаружи более объемной формы. Большинство моделей неправильно интерпретировали или не смогли правильно подсчитать, что указывает на проблемы с возможностями визуального подсчета ИИ.
Для теста №55, который включал ориентацию в пространстве, зрительно-языковые модели постоянно давали сбой, не позволяя определить, слева или справа от полости большей формы появился круг. Эта конкретная проблема подчеркивает более широкую проблему, с которой сталкиваются виртуальные машины, связанные с пространственными отношениями, что согласуется с другими исследованиями, предполагающими, что пространственное мышление является критическим ограничением ИИ.
Хотя эти результаты могут подчеркнуть ограничения современного ИИ, они также указывают на возможности для будущих инноваций. Исследователи предполагают, что специализированное обучение, возможно, включающее промежуточные этапы, позволяющие лучше различать концепции, может повысить производительность.
Например, многоэтапный подход, при котором модели сначала выявляют возможные закономерности, а затем тестируют эти закономерности, может улучшить способность ИИ решать абстрактные задачи, такие как головоломки Бонгарда. Другие стратегии могут включать пересмотр процессов визуального кодирования моделей и использование более продвинутых методов для улучшения распознавания образов и абстрактного мышления.
Перевод задач Бонгарда в реальные сценарии также может помочь моделям ИИ развить лучшие перцептивные и когнитивные способности. Используя реальные аналоги для решения этих головоломок, исследователи могли бы выяснить, помогает ли визуальный контекст ИИ более эффективно формировать абстрактные концепции и рассуждения. Это направление исследований может привести к созданию более универсальных моделей визуального языка, способных более глубоко воспринимать повседневные визуальные сигналы.
Полученные результаты ставят под сомнение предположения о способности ИИ отражать когнитивные способности человека и поднимают важные вопросы об адекватности стандартных критериев оценки эффективности ИИ.
Несмотря на успех в таких задачах, как классификация изображений и создание субтитров, недостатки модели vision-language в BPs показывают, что для оценки истинного понимания ИИ могут потребоваться более сложные тесты. Как предполагают авторы, перевод сложных абстрактных задач, таких как задачи Бонгарда, в контекст реального мира может дать представление о способности ИИ обрабатывать визуальную информацию и рассуждать о ней на человеческом уровне.
В то время как VLM, такие как GPT-4o и Claude, достигли впечатляющих успехов в соединении текста и видения, это исследование показывает, что путь к подлинному человеческому пониманию остается сложным.
По мере развития искусственного интеллекта преодоление этих ограничений восприятия будет иметь важное значение для создания систем, которые смогут взаимодействовать с окружающим миром так же легко, как это делают люди. Это исследование напоминает нам о сложности человеческого познания, побуждая исследователей в области искусственного интеллекта выходить за рамки существующих критериев и стремиться к достижениям, которые приближают машины к восприятию и рассуждениям на уровне человека.
В конечном счете, это исследование проливает свет на сложности человеческого познания, и ИИ еще предстоит пройти долгий путь, чтобы воспроизвести его. Хотя современные модели визуального языка представляют собой значительный прогресс, неспособность решить проблемы Бонгарда напоминает нам о проблемах, присущих моделированию абстрактного мышления и визуального восприятия.
По мере развития исследований в области искусственного интеллекта понимание и устранение этих пробелов будут иметь решающее значение для создания систем, способных понимать и интерпретировать мир так, как это делают люди.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Астрономы обнаружили третий межзвездный объект

Более 2000 случаев наблюдения НЛО в США

Главный рекламный объект фестиваля НЛО украли

Двери откроет новый музей ужасов

Добыча полезных ископаемых на Луне становится ближе

Маргинальные американцы скептически относятся к ИИ

Обнаружение сети гравитационных волн

Образ Несси привлекает тысячи посетителей

Подземный город может находиться под Сфинксом

Проведение исследований в области солнечной геоинженерии

Скорость вращения звезд для оценки их возраста

Создание космических местообитания

Странное существо в лесу Мазамитла

Структуры, необходимые для обнаружения экзопланет

Таинственное существо нападает на баранов

Титан - объект для изучения атмосферы экзопланет

Третий межзвездный объект в Солнечной системе

Три разбившихся НЛО есть у Великобритании

Турист встретился с легендарным Укумаром

Эпоха разоблачителей НЛО часто кажется тупиковой

Более 2000 случаев наблюдений НЛО в США

Болид озарил ночное небо над Челябинском

Большое число на грани человеческих знаний

В Нью-Йорке зафиксировано 66 случаев наблюдения НЛО

Заказать место для посадки НЛО можно в Вене

Земные аэропорты видно с расстояния 200 светолет

Зловещее облако судного дня окутывает Мэриленд

Инопланетяне могут засечь работу наших радаров

Кости Иисуса спрятаны в тайных хранилищах США

Люди с высоким IQ оказались менее нравственными

Мир наполнен шумами

НЛО, инопланетяне и президенты США

Полеты НЛО над авиабазой Райт-Паттерсон

Полеты НЛО над ядерным объектом в Техасе

Путешествия во времени без парадоксов возможны

Пчелу превратили в киборга

Созданные ИИ вирусы научились обходить защиту ПК

Умение предсказывать будущее связали с IQ

Череп единорога нашли у замка короля Артура

Энтузиаст разработал интерфейс мозг-компьютер

Аэропорты могут помочь инопланетянам обнаружить Землю

ВМФ США утратил 500 страниц информации о НЛО

Жители Мичигана сообщили о трех десятках НЛО

ИИ Google начинает читать все ваши сообщения

Как менялась погода на Венере за 10 лет

Квантовая запутанность в мозге - Сознание

Место, где слои почвы находятся в перевернутом положении

Научно-фантастическом фильм - Похищение инопланетянами

Невероятные случаи похищения людей инопланетянами

Новое представление о том, как развиваются галактики

Открытие в подводном Стоунхендже переписывает историю

Охотники за метеоритами прочесывают Джорджию

Растущее число свидетельств эволюции темной энергии

Резьба, которая раскрывает секреты египетских царей

Сотрудник НАСА нарушил давнее молчание по поводу НЛО

Тайна межзвездного объекта, несущегося через нашу систему

Утраченную ветвь Древа человечества

ЦРУ неправильно обращается с файлами об НЛО

Чернобыльские собаки превратились в нечто новое

Экзопланета у тихой звезды-карлика

Вещество из галлюциногенных грибов продлило жизнь

Власти США считают, что они действительно сняли НЛО

Встреча с инопланетянами в Огайо

Вся наша галактика может находиться внутри Дыры

Доказательства существования НЛО находятся в Пентагоне

Жители Мичигана сообщили о трех десятках НЛО

Затерянный город древнейшей цивилизации Америки

ИИ неделями дурачил пользователей Spotify

ИИ создал первое в мире лекарство от рака

Инцидент в Розуэлле. Может ли он быть байкой

Крушение НЛО в Розуэлле. Мистификация

Нашли способ обратить вспять выпадение волос

НЛО летит по небу во время грозы в Мэриленде

Паскагула. Еще один свидетель

Плазма, которая может растопить законы Реальности

Подросток создал мифический луч смерти Архимеда

Современные компьютеры не подходят для мира ИИ

Сходка уфологов в районе Фолкерка

Теории о подземном городе под египетским Сфинксом

Фотографии пришельцев из Розуэлла

Вращение Земли неожиданно ускорилось

Загадочный случай с летчиком Виктором Годдардом

История гаданий и предсказаний

Конгрессвумен поделилась взглядами на ангелов

Крошечные различия между психопатами и нормалами

Легенда ЮФС делится своим выводами о встречах с НЛО

Опровергли один из величайших мифов острова Пасхи

Очевидцы что-то видят в озере Лох-Несс

Призрак мальчика из старинной кровати

Робот приготовил и посолил стейк с расстояния 1800 км

Смерть Вселенной наступит раньше

Столкновение неизвестного объекта с Сатурном

Тайны и заговоры удивительного мира Антарктиды

Технология 'мозг-компьютер' проходит клинические испытания

Удивительное открытие на острове Пасхи

Уфологи выявили места аномалий в России

Человечество неверно истолковало реальность

Черные дыры, появление которых Эйнштейн не мог предвидеть

Четыре яйца с инопланетными существами внутри

Эксперты уверены, что ИИ уничтожит человечество

Лучшие садовые качели для дачи

Лучшие инсектициды от комаров

Высокощелочной океан Энцелада влияет на поиск жизни

Где мы находимся во Вселенной

Жуткие подробности о зигзагообразных НЛО

Инопланетяне оставили череп у берегов канадского острова

Инопланетяне очень любят штат Нью-Йорк

Инопланетянин зашел на огонек

Как образуются сверхмассивные черные дыры

Как создать строительные блоки для лунной базы

Как ящерицы пережили падение астероида-убийцы

Место последнего упокоения графа Дракулы

НЛО завис над живописным устьем реки

Обнаружили клетку, о существовании которой не подозревали

Памятник древности, который может переписать историю

Светящаяся сфера повергла в шок жителей Альберты

Составили карту распределения темной материи

Споры вокруг НЛО не утихают

Странная вспышка больше года ставила астрономов в тупик

Странные случаи похищения людей инопланетянами

Хлоя Кардашьян рассказала паранормальных явлениях дома

Экзопланетологи искажают вероятность своих находок

Возможно, мы сможем увидеть первые галактики

ИИ будет чинить космический корабль

Как ИИ меняют профессию учителя

Как рассчитывают вероятность столкновения с астероидом

Как формировалась ранняя Вселенная

Криовулканизм на спутнике Плутона Хароне

Наблюдения за Несси основаны на физической реальности

Наблюдения НЛО в Иллинойсе

НЛО над Массачусетсом оказался вертолетом

Новые двигательные установки обеспечат полет к Седне

Новый способ обнаружения первичных черных дыр

Обитаемые миры распространены вокруг малых звезд

Обнаружение экзопланет - одно, а визуализация - совсем другое

Поиски признаков жизни на Марсе продолжаются

Пугающие пророчества о катастрофическом мега-цунами

Скрытая сложность сигналов из черных дыр

Статистический анализ обитаемости экзопланет

Столкнется ли астероид 2024 YR4 с Луной

Стратегии обнаружения океанов на спутниках Урана

Существование близкой экзопланеты подтвердили

Как узнать уникальность текста с помощью нейросети

Время имеет три измерения, а пространство является вторичным

Галогены и судьба лунной коры

Использование ChatGPT может привести к разрушению мозга

Как лучше понять экзотическое состояние вещества

Как менялась поверхность Марса миллиарды лет назад

Марсоход исследует породу в поисках деталей

Метеорит - распространенная аминокислота

Неожиданный минерал в зернах Рюгу

Новое представление о первых звездах

Обсерватория Вера Рубин поможет исследовать темную материю

Первый этап формирования планет после рождения звезды

Поиски сверхлегкой темной материи продолжаются

Распространял ли Пентагон ложные истории об НЛО

Расширенный обзор марсианской ионосферы

Спутники Земли в опасности, если астероид врежется в Луну

Строительство на Марсе - это шаг вперед

Таинственный шар, летящий по небу Альберты

Тайна пропавших метеоритов с Меркурия

Телескоп Джеймса Уэбба обнаружил свою первую экзопланету

У пульсаров могут быть крошечные горы

Астрономы ищут таинственную девятую планету

ВВС США опубликовали новое видео НЛО

Граф Дракула похоронен в Неаполе

ИИ может подорвать навыки критического мышления

Использование космолифта для доставки воды с Цереры

Как темные фотоны могут стать темной материей

Корабль инопланетян летит через Солнечную систему

Криптозоологи поженились на фестивале

Манчестерская одержимость НЛО

Миссури одна из горячих точек НЛО

Необъяснимые наблюдения в небе Северной Каролины

Оборотень замечен в Бридлингтоне

Переписка Пентагона с подрядчиком о НЛО

Посреди ангара стояла настоящая летающая тарелка

Природные НЛО еще более странные и загадочные

Редчайший спрайт заметили над Мексикой

У Вселенной есть кнопка самоуничтожения

Учения помогут понять и избежать конфликтов на Луне

Фотография оборотня, замеченного в лесах Великобритании

Экстраординарная находка внутри Великой пирамиды

Впервые отправили в стратосферу чипированных крыс

Есть ли в океанических мирах зоны, пригодные для жизни

Загадка пластины Эдмонтона

Наверх
Яндекс.Метрика