Ограничения ИИ в решении головоломок
Новое исследование выявило удивительный пробел в логических способностях самых продвинутых на сегодняшний день моделей зрительного языка ИИ. Несмотря на впечатляющие результаты в различных установленных тестах, недавнее исследование, опубликованное на arXiv, показало, что модели на основе визуального языка (VLM), такие как GPT-4o от OpenAI, с трудом справляются с задачами Бонгарда - набором визуальных головоломок, требующих абстрактного мышления на высоком уровне, подобном человеческому.
Исследование, включающее конкурентный анализ этих моделей по сравнению с участниками-людьми, ставит под сомнение предположения о когнитивных способностях ИИ в интерпретации визуального мира. “В то время как VLM-системы иногда успешно распознают отличительные концепции и решают некоторые проблемы, они часто дают сбои, не в состоянии понять визуальные концепции и обосновать их”, - пишут исследователи. “Удивительно, но даже элементарные концепции, которые могут показаться людям тривиальными, такие как простые спирали, представляют значительные трудности”.
“Более того, даже когда их просят четко сосредоточиться на этих концепциях и проанализировать их, они продолжают колебаться, что свидетельствует не только о недостаточном понимании этих элементарных визуальных концепций, но и о неспособности обобщить невидимые концепции”.
В мире, где искусственный интеллект (ИИ) быстро развивается для решения задач, которые когда-то казались исключительными для человеческого восприятия, недавнее исследование предлагает реальную проверку ограничений машинного интеллекта в понимании сложных визуальных сигналов.
Исследователи из различных европейских институтов сравнили продвинутые модели визуального языка (VLM), такие как GPT-4o и Claude, с набором классических головоломок, называемых задачами Бонгарда.
Разработанные в 1960-х годах, эти визуальные задания проверяют распознавание образов и абстрактное мышление, требуя от участников расшифровать концептуальные правила из простых геометрических фигур. Для искусственного интеллекта эти головоломки далеко не просты.
Задачи Бонгарда (BPs) требуют анализа набора из 12 диаграмм, разделенных на две группы, каждая из которых соответствует определенному, часто абстрактному правилу. Например, на одной стороне диаграмм могут быть исключительно вытянутые по вертикали фигуры, в то время как на другой - вытянутые по горизонтали.
Люди от природы хорошо справляются с такими задачами, которые требуют не просто выявления базовых закономерностей, но и формирования абстрактных концепций на основе минимальных данных. Это делает BPs особенно сложной задачей для моделей машинного обучения, особенно по сравнению с типичными тестами распознавания изображений.
Для этого исследования исследователи оценили производительность различных моделей vision-language, включая GPT-4o от OpenAI, Claude и две версии модели LLaVA. Каждой модели было поручено решить 100 задач Бонгарда, а их ответы оценивались большой языковой моделью “судья” для обеспечения объективной оценки.
Результаты были очевидными и поразительными: люди значительно превзошли искусственный интеллект во всех категориях. В среднем люди-участники достигли успеха в 84% случаев, в то время как наиболее эффективная модель визуального языка GPT-4o справилась только с 17%. Этот пробел подчеркивает уникальные когнитивные способности человека, особенно в области визуального мышления и абстракции.
Исследователи разделили задачи Бонгарда на пять категорий: существование, размер, концепция, количество и пространственные отношения. Люди показали лучшие результаты в категориях “существование” (наличие или отсутствие признака) и “пространственная ориентация” (spatial orientation), набрав более 90% баллов.
В отличие от этого, модели vision-language испытывали огромные трудности при решении пространственных задач, не достигая точности более 10% во всех моделях. GPT-4o немного преуспел в решении абстрактных “концептуальных” задач, возможно, из-за интенсивного обучения работе с разнообразными данными, но все равно не дотягивал до производительности человека.
Чтобы глубже разобраться в причинах ограничений ИИ, исследователи изучили эффективность модели vision-language в конкретных задачах Бонгарда, сосредоточив внимание на том, могут ли эти модели идентифицировать фундаментальные концепции.
Они выбрали четыре репрезентативных БП, каждый из которых требовал своего визуального понимания: БП №16 (направление спирали), БП №29 (подсчет фигур), БП №36 (взаимное расположение) и БП №55 (ориентация слева направо). В каждом случае модели испытывали трудности.
Например, при запросе определить, вращается ли спираль по часовой стрелке или против, GPT-4o и Claude часто выдавали неверные результаты. Модели, как правило, допускали ошибки в согласованности, ошибочно принимая одно направление вращения за другое при различных попытках.
Аналогичным образом, только Claude показал точные результаты при анализе BP # 29, который требовал различения фигур внутри или снаружи более объемной формы. Большинство моделей неправильно интерпретировали или не смогли правильно подсчитать, что указывает на проблемы с возможностями визуального подсчета ИИ.
Для теста №55, который включал ориентацию в пространстве, зрительно-языковые модели постоянно давали сбой, не позволяя определить, слева или справа от полости большей формы появился круг. Эта конкретная проблема подчеркивает более широкую проблему, с которой сталкиваются виртуальные машины, связанные с пространственными отношениями, что согласуется с другими исследованиями, предполагающими, что пространственное мышление является критическим ограничением ИИ.
Хотя эти результаты могут подчеркнуть ограничения современного ИИ, они также указывают на возможности для будущих инноваций. Исследователи предполагают, что специализированное обучение, возможно, включающее промежуточные этапы, позволяющие лучше различать концепции, может повысить производительность.
Например, многоэтапный подход, при котором модели сначала выявляют возможные закономерности, а затем тестируют эти закономерности, может улучшить способность ИИ решать абстрактные задачи, такие как головоломки Бонгарда. Другие стратегии могут включать пересмотр процессов визуального кодирования моделей и использование более продвинутых методов для улучшения распознавания образов и абстрактного мышления.
Перевод задач Бонгарда в реальные сценарии также может помочь моделям ИИ развить лучшие перцептивные и когнитивные способности. Используя реальные аналоги для решения этих головоломок, исследователи могли бы выяснить, помогает ли визуальный контекст ИИ более эффективно формировать абстрактные концепции и рассуждения. Это направление исследований может привести к созданию более универсальных моделей визуального языка, способных более глубоко воспринимать повседневные визуальные сигналы.
Полученные результаты ставят под сомнение предположения о способности ИИ отражать когнитивные способности человека и поднимают важные вопросы об адекватности стандартных критериев оценки эффективности ИИ.
Несмотря на успех в таких задачах, как классификация изображений и создание субтитров, недостатки модели vision-language в BPs показывают, что для оценки истинного понимания ИИ могут потребоваться более сложные тесты. Как предполагают авторы, перевод сложных абстрактных задач, таких как задачи Бонгарда, в контекст реального мира может дать представление о способности ИИ обрабатывать визуальную информацию и рассуждать о ней на человеческом уровне.
В то время как VLM, такие как GPT-4o и Claude, достигли впечатляющих успехов в соединении текста и видения, это исследование показывает, что путь к подлинному человеческому пониманию остается сложным.
По мере развития искусственного интеллекта преодоление этих ограничений восприятия будет иметь важное значение для создания систем, которые смогут взаимодействовать с окружающим миром так же легко, как это делают люди. Это исследование напоминает нам о сложности человеческого познания, побуждая исследователей в области искусственного интеллекта выходить за рамки существующих критериев и стремиться к достижениям, которые приближают машины к восприятию и рассуждениям на уровне человека.
В конечном счете, это исследование проливает свет на сложности человеческого познания, и ИИ еще предстоит пройти долгий путь, чтобы воспроизвести его. Хотя современные модели визуального языка представляют собой значительный прогресс, неспособность решить проблемы Бонгарда напоминает нам о проблемах, присущих моделированию абстрактного мышления и визуального восприятия.
По мере развития исследований в области искусственного интеллекта понимание и устранение этих пробелов будут иметь решающее значение для создания систем, способных понимать и интерпретировать мир так, как это делают люди.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Последние аномальные новости

Астролог рассказала о ключевых изменениях в вашей жизни

Возникновение плоской Вселенной и ее зеркала из ничего

Геологическая карта пояса астероидов

Два НЛО замечены над Вьетнамом

Загадочная ударная структура в австралийской глубинке

Информатор Дэвид Груш был нанят в качестве советника

Истинная личность неуловимого Ди Би Купера

Кеннеди был убит бандой агентов ЦРУ

Люди по всей Ирландии были озадачены необычным объектом

Мы с женой видели гигантский НЛО

Насколько тяжелы нейтронные звезды при рождении

НЛО возле линии электропередач над Далласом

НЛО завис у острова Каталина

НЛО над Агуадильи были просто фонарями

НЛО скрывается в облаке Пенсильвании

Новая компания планирует исследовать Луну

Огромный город обнаружили под пирамидами Гизы

Опубликованы записи об убийстве Джона Кеннеди

Первые прямые снимки углекислого газа на экзопланете

Под пирамидами Гизы обнаружен загадочный комплекс

Размещение ракет-перехватчиков в космосе

Странные пузырькоподобные структуры во Вселенной

Существуют ли на самом деле НЛО

Треугольный НЛО диаметром полмили в кратере на Луне

Ты не похожа на жену астронавта

Фильм о наблюдении НЛО в Карбондейле

Что самое смертоносное при взрыве сверхновой

Шесть реальных близких встреч с инопланетянами

Я видел доказательства существования Рая и Ада

Я убежден, что инопланетяне похитили меня

Астероид-убийца приближается к Земле прямо сейчас

Астероиды Паллады обладают уникальными спектрами

Горячая точка НЛО в Таиланде

Жители Альберты часто бывают похищены инопланетянами

Зона 51 в Таиланде, место встречи с НЛО или миф

ИИ распознает массу частиц космического излучения

Инопланетяне могут скрываться в подземных океанах Марса

Карта Вселенной может раскрыть тайну темной энергии

Крупнейшие разоблачения в досье Джона Кеннеди

Может ли жизнь закончиться Большим взрывом

Момент, когда в небе Ирландии был замечен НЛО

Наблюдение за мощью сверхмассивных черных дыр

Навредит ли нам взрыв Бетельгейзе

Нейтрино могут дать ключ к пониманию квантовой гравитации

Оптимус готовится к полету на Марс

Открытие ставит под сомнение теорию происхождения человека

Полет вертолета над ледниками и каньонами Марса

Радиоизотопные генераторы для зондов дальнего действия

Размер и расположение субнептуновых объектов

Режиссер фильма о НЛО рассказал поддержке в Конгрессе

Саммит уфологов привлек сотни людей

Самые смелые теории заговора о убийстве Джона Кеннеди

Создание спутника солнечной энергии из лунной пыли

Сталкивались ли астронавты с НЛО в космосе

Таиланд привлекает уфологов со всего мира

Теория экстрасенса о странных шарах в смартфоне

Уфологи пишут книгу о горячих точках НЛО в Шотландии

Физики создали квазикристалл Времени

Черные дыры оказывают благоприятное воздействие на жизнь

Четыре маленькие планеты обнаружены у звезды Барнарда

Архив документов об убийстве Джона Кеннеди

Гарри Поттер голосует так же, как и вы

Где расположены самые тучные пастбища инопланетян

Жалоба Луиса Элизондо на генерального инспектора МО

Земля - разумное существо

Конспирологи утверждают, что приводнение космонавтов в окружении дельфинов выглядит неестественно

Космические струны как ключ к путешествиям во времени

Метеорит оказался частью давно разрушенной планеты

Можно ли распознать копию нашей планеты

Невидимое существо заставило женщину в ужасе бежать

Опасности, поджидающие на Титане

Пациент прожил 105 дней с титановым сердцем

Поиски темной материи продолжаются

Призрак спас мою мать от падения с лестницы

Пришельцы прописались в Таиланде

Самые необъяснимые видеозаписи НЛО

Скелеты гигантов как элемент декора базилики

Сознание возникло из группы обкуренных обезьян

Установлены строгие ограничения на квантовую гравитацию

Человекоподобные роботы скоро станут массовыми

Снегоболотоходы ХИЩНИК. Надежная техника для экстремальных условий

Ад гораздо страшнее, чем вы можете себе представить

Блогер посетил Зону-51 Таиланда

Где сходятся квантовая теория и теория относительности

Загадочный блазар стреляет в нас плазмой

Извержение супервулкана на спутнике Юпитера Ио

Инопланетяне должны существовать

Картирование космосдвига для освещения темной энергии

Микроосвещение вызвало появление жизни на Земле

Многообещающий способ обнаружения жизни

НЛО был замечен над Калифорнией

НЛО длиной в милю видели над ветряной электростанцией

Нью-Йорк занимает 5-е место в США по наблюдениям НЛО

Поведение блазара не поддается классификации

Пылевые облака искажают представление о Вселенной

Сверхновые вызвали два массовых вымирания на Земле

Светодиодный эхолот размещен на поверхности Луны

Субнептун обнаружен в системе из двух экзопланет

Удивительные встречи с летающими инопланетянами

Флотилия НЛО вблизи военной базы Каттерик

Шесть солнц появилось над Лас-Вегасом

Как надевать и снимать контактные линзы

Африканский целитель съел труп инопланетянина

Жена астронавта рассказала о его встречах с НЛО

Загадочное наблюдение в глубине Вселенной

Загадочные радиоимпульсы из космоса

Инопланетяне реальны и уже живут среди нас

Материалы, необходимые для колонизации Луны и Марса

Мужчина обратился в больницу с болью в заднице

Неопознанные объекты преследуют самолеты над Россией

НЛО, потерпевший крушение в Нью-Мексико

Новые снимки таинственного спутника Марса Деймоса

Обсуждение вопроса о воде на Марсе

Первые в мире беспилотные истребители

Первые снимки экзопланеты, содержащей углекислый газ

Полицейские Британии раскрывают меньше сообщений о НЛО

Пророк предостерегает от общения с инопланетянами

Редкие снимки спутника Марса

Сталкеры исследуют каждый дюйм озера Лох-Несс

США опубликовали документы об убийстве Кеннеди

Черные дыры - не конец, а начало

Черные дыры выбрасывают мощные струи

Шины для внедорожника. Виды и правила выбора

Классические и страшные квесты в Тамбове на любой вкус

Вращающиеся черные дыры насыщены энергией

Датчики квантовой запутанности могут проверить гравитацию

Загадочные кольца у планетарной туманности

Изучение темной энергии с помощью взрывающихся звезд

Конспирологическое мышление способствует принятию лжи

Наличие жидкой воды и жизни под поверхностью Марса

Неожиданные изменения в электронах у Ио

НЛО, похищения и многое другое в долине Гудзона

Новый класс ледяных межзвездных объектов

Первое доказательство нового квантового явления

Помните тот астероид, который не столкнется с Землей

Секреты фазовых переходов в квантовом оборудовании

Сложный химический состав в первобытной галактике

Смелый подход к воображаемым числам

Существуют и другие планеты, похожие на Землю

Таинственное явление в центре нашей галактики

Тайна того, как зарождаются звезды

Тайна того, как скопления галактик остаются горячими

Четыре крошечные планеты у звезды Барнарда

Шерстистые мыши - первый шаг к возрождению мамонтов

Всемирный день контактов-2025

Вторая по близости к Земли звезда имеет четыре субземли

Глубокого океана на Марсе не было

Госслужащих Великобритании скоро заменит ИИ

Жена рассказала о бесчисленных встречах мужа с НЛО

Жизнь на Земле возникла благодаря микроосвещению

ИИ-поисковики поймали на лжи

ИИ-помощник программиста предложил научиться писать код

Инопланетяне не только реальны, но и уже среди нас

Инопланетяне потерпели крушение на Земле

Моя сестра убила меня и я переродилась

На месте смертельной аварии заметили призрака

Обнаружены убедительные признаки жизни на Марсе

Российские пилоты все чаще встречают НЛО

Смертоносное лучевое оружие, опередившее свое время

Странное существо напугало аргентинцев

Странные объекты найдены на картах Google

США будет создавать живые космические сооружения

Энтузиасты хотят поймать инопланетные корабли

Этот бинокль поможет вам увидеть НЛО

Арсенал инопланетных артефактов и технологий

Артефакт инопланетян обнаружен на Марсе

Битва между атмосферой Марса и солнечным ветром

В салуне Белль Старр водятся привидения

Вера в конспирологию вызвана плохим сном

Загадочные патагонские живые камни

Загадочный артефакт обнаружен на Марсе

Загадочный каменный круг возрастом 3200 лет

Инновационное древнее захоронение типа Стоунхенджа

Космические частицы возбуждают вспышки молний

Кровавый дождь стекает с иранских гор

Найден старейший кратер от падения метеорита

НАСА успешно принимает сигналы GPS на Луне

Научный сотрудник НАСА опровергает теорию плоской земли

НЛО замечен над графством Дарем

Пересадка митохондрий астронавтам

Роботы с искусственным интеллектом испытывают стресс

Самолет-шпион совершает таинственный облет

Тайна инопланетного сигнала после падения метеорита

Что делает человеческое сознание уникальным

Как вовремя выявить болезни сердца у кошек и собак. Симптомы, диагностика, лечение

Беспроводное электроснабжение уже на горизонте

Подписка на новости
Наверх
Яндекс.Метрика