Новые модели мыслящего ИИ начали глупеть
Недавно выпущенные OpenAI модели искусственного интеллекта o3 и o4-mini во многих отношениях являются самыми современными. Однако новые модели все еще галлюцинируют или выдумывают что—то - на самом деле, они галлюцинируют чаще, чем некоторые из старых моделей OpenAI.
Галлюцинации оказались одной из самых серьезных и трудноразрешимых проблем в области искусственного интеллекта, влияющей даже на самые эффективные системы на сегодняшний день. Исторически сложилось так, что каждая новая модель немного улучшалась в области галлюцинаций и вызывала меньше галлюцинаций, чем ее предшественница. Но, похоже, к o3 и o4-mini это не относится.
Согласно внутренним тестам OpenAI, o3 и o4-mini, которые являются так называемыми логическими моделями, галлюцинируют чаще, чем предыдущие логические модели компании - o1, o1—mini и o3-mini, а также традиционные “нерассуждающие” модели OpenAI, такие как GPT- 4о.
Возможно, более тревожным является то, что разработчик ChatGPT на самом деле не знает, почему это происходит.
В своем техническом отчете для o3 и o4-mini OpenAI пишет, что “необходимы дополнительные исследования”, чтобы понять, почему галлюцинации усиливаются по мере расширения моделей мышления. O3 и o4-mini работают лучше в некоторых областях, включая задачи, связанные с программированием и математикой. Но поскольку они “предъявляют больше требований в целом”, их часто заставляют предъявлять “более точные требования, а также более неточные / галлюцинаторные требования”, говорится в отчете.
OpenAI обнаружил, что у o3 были галлюцинации в ответ на 33% вопросов в PersonQA, внутреннем тесте компании для измерения точности знаний модели о людях. Это примерно в два раза превышает частоту галлюцинаций в предыдущих моделях рассуждения OpenAI, o1 и o3-mini, которые набрали 16% и 14,8% соответственно. O4-mini показала еще худшие результаты в PersonQA — галлюцинации наблюдались в 48% случаев.
Стороннее тестирование, проведенное Transluce, некоммерческой исследовательской лабораторией искусственного интеллекта, также выявило доказательства того, что o3 имеет тенденцию выдумывать действия, которые он предпринимал в процессе поиска ответов. В одном из примеров Transluce заметила, что o3 утверждает, что она запустила код на MacBook Pro 2021 года выпуска “вне ChatGPT”, а затем скопировала цифры в свой ответ. Хотя у o3 есть доступ к некоторым инструментам, она не может этого сделать.
“Наша гипотеза заключается в том, что обучение с подкреплением, используемое в моделях серии o, может усугубить проблемы, которые обычно устраняются (но не полностью) стандартными методами постобучения”, - сказал Нил Чоудхури, исследователь Transluce и бывший сотрудник OpenAI, в электронном письме TechCrunch.
Сара Шветтманн, соучредитель Transluce, добавила, что частота галлюцинаций, связанных с o3, может сделать его менее полезным, чем он был бы в противном случае.
Киан Катанфоруш (Kian Katanforoosh), адъюнкт-профессор Стэнфорда и генеральный директор стартапа Workera, специализирующегося на повышении квалификации, рассказал TechCrunch, что его команда уже тестирует o3 в своих рабочих процессах по программированию и что они пришли к выводу, что он на шаг превосходит конкурентов. Однако, по словам Katanforoosh, o3, как правило, выдает нерабочие ссылки на веб-сайты. Модель будет предоставлять ссылку, которая при нажатии на нее не работает.
Галлюцинации могут помочь моделям прийти к интересным идеям и проявить творческий подход в своем “мышлении”, но они также затрудняют продажу некоторых моделей предприятиям на рынках, где точность имеет первостепенное значение. Например, юридической фирме, скорее всего, не понравится модель, которая содержит множество фактических ошибок в контрактах с клиентами.
Одним из многообещающих подходов к повышению точности моделей является предоставление им возможностей веб-поиска. GPT-4o OpenAI с веб-поиском обеспечивает 90%-ную точность в SimpleQA, еще одном тесте точности OpenAI. Потенциально, поиск также может повысить частоту галлюцинаций в моделях рассуждения — по крайней мере, в тех случаях, когда пользователи готовы предоставлять запросы сторонним поисковым системам.
Если расширение масштабов моделей рассуждения действительно приведет к ухудшению галлюцинаций, поиск решения станет еще более актуальным.
“Решение проблемы галлюцинаций во всех наших моделях является постоянной областью исследований, и мы постоянно работаем над повышением их точности и надежности”, - сказал представитель OpenAI Нико Феликс в электронном письме TechCrunch.
В прошлом году индустрия искусственного интеллекта в целом сосредоточилась на моделях рассуждения, после того как методы улучшения традиционных моделей ИИ начали давать все меньшую отдачу. Рассуждения повышают производительность моделей при решении различных задач, не требуя больших объемов вычислений и данных во время обучения. Тем не менее, похоже, что рассуждения также могут привести к усилению галлюцинаций, что создает проблему.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Последние аномальные новости

Вселенная наполнена инопланетными цивилизациями

Гигантский отпечаток ноги в парке Драконов

Каменные лабиринты Севера

Каменные сферы острова Чамп

Медитация и осознанность могут иметь темную сторону

Мы можем проживать в симуляции

Ньютон предсказывал, когда наступит конец света

Обнаружили доказательство существования ауры

Сколько данных нужно для искусственного интеллекта

США нашли секретные базы инопланетян

База инопланетян спрятана в горе Хейс

Была ли посадка Аполлона-17 на Луну инсценировкой

Возможно ли получение изображений экзопланет

Гозекский круг - древняя обсерватория или портал

Деринкую - подземный город, который скрывает тайны

Древняя живопись Австралии включает в себя НЛО

Загадка таинственной Хобы

Космический корабль может тормозить в космосе

Линии Наски - послание древних или следы ВЦ

На древнем Марсе существовал углеродный цикл

Новые технологии или методы для анализа планетарных недр

Новый проект исследует тайны солнечной атмосферы

Планеты-изгои могут просуществовать недолго

Радиоактивная аномалия обнаружена под Тихим океаном

Свидетельства существования жизни на Марсе

Серебристый диск заметили над Ютой

Статуэтка Нампа, которой 2 миллиона лет

Таинственные встречи военных с бигфутом

Тайна образования массивных звезд

Хрустальные черепа - артефакты или подделка

Движущиеся камни Долины Смерти

Загадка мастаб и их значение в древней культуре

Загадочный инцидент с огнями Финикса в 1997 году

Загадочный молоток из эпохи динозавров

Квантовая теория гравитации приближает нас к 'Теории всего'

Молния оставила на спине мужчины изображение Христа

Невидимка дернул спящего мальчика за ногу

Озеро ртути под мексиканской пирамидой

Первый в мире ховербайк в стиле Звездных войн

Прослушали музыку ближайшей звезды, обнаружив сюрпризы

Рельеф поверхности Марса напоминает Земной

Современные видеокарты мгновенно взламывают пароли

Сообщения о НЛО вблизи полигонов ВВС Аризоны

Табличка, похожая на панель управления звездолетом

Тайны распространенного, но загадочного типа экзопланет

Удивительный шаттл Топраккала

Учёные научили его заглядывать в недра экзопланет

Фестиваль НЛО приурочен к 75-летию появления НЛО

Черная дыра управляет циклом эпох и массовых вымираний

Эксперимент по моделированию космической погоды

Гостиница с привидениями выставлена на продажу

Джон Леннон однажды написал текст песни об НЛО

Исследование марсианских долин с помощью вертолетов

Как 'морская революция' повлияла на жизнь в океане

Кометы принесли с собой сложные органические молекулы

Наноспутниковые технологии для лунной инфраструктуры

Некоторые истории из 'Звездных войн' уже стали реальностью

Необходимо отслеживать падение космического мусора

Обнаружен мозговой сбой противоположный дежавю

Первый намек на Девятую планету

Причина разрушения загадочной галактической кости

Психоделические путешествия не поддаются описанию

Робот в ярости нападает на своих дрессировщиков

Самые яркие обьекты Вселенной имеют темное происхождение

Создание отказоустойчивого квантового компьютера

Сотрудник НАСА видел НЛО с логотипом ВВС США

Стоит ли россиянам бояться нашествия НЛО

Таинственный объект найден в Колумбии

Флорида собирается запретить химиотрассы

Шведский фантастический фильм 'Наблюдай за небом'

Встреча с НЛО в Уэстолле

Генетики нашли мутацию, дающую редкую суперсилу

Глобальная геоинженерия в Британии

Джон Леннон отчетливо видел НЛО

Замаскированный НЛО над Канзасом

Замечен магнетар, проносящийся по Млечному пути

ИИ раскрыл загадочное изображение с Вояджера-1

Как роботы чувствуют себя в космосе

Квантовый прорыв доказал реальность телепортации

Космос в египетской культуре и религии

Лазерная система связи могла бы работать на Марсе

Луна является постоянным источником мини-лун

Медуза - ключ к человеческому бессмертию

Новоизбранный Папа может раскрыть секреты НЛО

Обнаружена самая холодная экзопланета

Организм может сам восстанавливать зрение

Певец призвал открыть секретные материалы Британии

Разглядели мысли в мозге под обычным микроскопом

Секретные архивы Ватикана об НЛО

Что за объект был замечен над Пальмерстоном

Бывший сотрудник НАСА видел шокирующие кадры НЛО

Власти США давным давно обнаружили внеземных существ

Вспышки на звездах могут создавать золотые планеты

Городские фермы накормят население после Апокалипсиса

Загадочные письмена обнаружены на Марсе

ИИ ChatGPT против студентов

Инопланетяне бегут из нашей галактики

Как системы образования могут адаптироваться к ИИ

Мэр Фэйрборна рассказал о уфо-фестивале

На дне Телецкого озера обнаружили 'лес мертвецов'

Наблюдательный пункт за НЛО близ Аламосы

Новый документальный фильм об НЛО

Пентагону необходимо бороться с дезинформацией об НЛО

Представлен фильм 'Охота на НЛО'

Пульсирующий НЛО парит над Калифорнией

Разоблачитель НЛО сделал все правильно

Священная пирамида, построенная забытой цивилизацией

Секретная бюджетная программа США по НЛО

Тайны продолжают раскрываться. От AATIP до NPSMS

Ученые обнаружили инопланетную технологию

Вблизи Солнечной системы обнаружено невидимое облако

Житель Техаса сообщает о наблюдении НЛО

Жителю Челнов удалили огромный рог на затылке

Загадочный самолет разбился в Грейт-Солт-Лейк

Конец света был предсказан Стивеном Хокингом

Конспирологические теории вокруг полета Кэти Пэрри

Крупнейшая в мире база данных об НЛО исчезла

НЛО в форме листа озадачил супружескую пару

Перламутровый шар был замечен над Гамбургом

Полиция Китая приняла на службу Робокопа

Проект эксперимента по изучению темной материи

Психическое путешествие Грея Баркера

Путешествия между галактиками могут стать реальностью

Российская поп–звезда была похищена инопланетянами

Сыщики из соцсетей обнаружили огромный НЛО

Таинственный пульсирующий НЛО парил над Калифорнией

Тайна диссонанса в черных дырах получила объяснение

Технология геоинженерии могла бы охладить планету

Что нужно ученым, чтобы заявить о внеземной жизни

Шаровая молния с ревом пронеслась по парковке в Теннесси

Американец ввел себе змеиный яд 856 раз

В ФБР есть отдел по изучению НЛО

Деревня, которая старше египетских пирамид

Дирижабли-призраки с человекоподобными существами

Дональд Трамп мешает поиску инопланетян

Загадка Лох-Несского чудовища остается

Как на самом деле можно заморозить человека в карбоните

Кто тайно взорвал ядерную бомбу в 1979 году

Многие люди по всему миру верят в карму

Новая гипотеза учёных угрожает теории эволюции

Ноутбук на древнем мраморном памятнике

Огромный 1000-футовый НЛО замечен в США

Осьминоги прилетели из космоса

Подводная дорога из желтого кирпича в страну Оз

Принц Филипп видел снежного человека в Балморале

Пульсирующий шестиугольный НЛО снят в Калифорнии

Путешествия между галактиками могут стать реальностью

Существуют ли параллельные вселенные

Таинственный блэкаут в Европе

Ученый из ЦРУ раскрыл количество потерпевших крушение НЛО

Военный осведомитель показал фото огромного НЛО

Волосы обладают сверхъестественной силой

Высокопоставленный чиновник НАСА нарушил молчание

Древние руины на Марсе

Жители Техаса проголосовали за Звездную Базу

Инопланетная правда или просто фермерские поля

Интриги и заговоры вокруг престола Британии

Круги на полях - послания пришельцев или мистификация

Необычные фотографии летающей тарелки

Ошеломляющее изображение летающей тарелки

Пилот чудом избежал встречи с кораблем инопланетян

Пирамиды были созданы задолго до появления египтян

По Марсу ходят поезда

С какой целью строили ирландские мегалиты

Слушания в Конгрессе по НЛО стали сенсацией

Таинственный город под египетскими пирамидами

Таинственный камень в Храме Надписей

Таинственный холм в Таиланде привлекает инопланетян

ЦРУ знает точные координаты трех баз инопланетян

Что за вспышка была в небе Юты

Разновидности онлайн-игр и преимущества их прохождения бесплатно на надежном сервисе

Байгунские трубки прошли все научные проверки

Буддист попал в Ад, когда совершил самоубийство

ВВС США тайно создали летающую тарелку

Древняя подземная база инопланетян у врат на Марсе

Люди-тени попали на камеру наблюдения в Мексике

Могли ли фараоны использовать электричество

Немецкий пастор шесть лет воевал с дьяволом

НЛО сняли на семейном барбекю во Флориде

НЛО шириной 1000 футов вблизи Фор-Корнерс

Обнаружил самую холодную экзопланету во Вселенной

Свидетельства ошибочности популярных теорий сознания

Сенаторы и элитные ученые втихаря изучают НЛО

Содом и Гоморра были уничтожены метеоритом

Старушка общается в комнате с кем-то невидимым

Странный объект может быть неуловимой девятой планетой

Наверх
Яндекс.Метрика