Платная версия ChatGPT отупела, а бесплатная набралась ума
Новое исследование, проведённое учёными из Стэнфордского университета и Калифорнийского университета в Беркли, выявило тревожное снижение качества ответов платной версии ChatGPT. Так, например, точность определения простых чисел у новейшей модели GPT-4, которая лежит в основе ChatGPT Plus, с марта по июнь 2023 года упала с 97,6 % до всего лишь 2,4 %. Напротив, GPT-3.5, являющаяся основной для обычного ChatGPT, точность ответов в некоторых задачах повысила. В последние месяцы всё чаще обсуждается снижение качества ответов ChatGPT. Группа учёных из Стэнфордского университета и Калифорнийского университета в Беркли решила провести исследование с целью определить, действительно ли произошла деградация качества работы этого ИИ, и разработать метрики для количественной оценки масштабов этого негативного явления. Как выяснилось, снижение качества ChatGPT — это не байка или выдумка, а реальность.
Трое учёных — Матей Захария (Matei Zaharia), Линцзяо Чэнь (Lingjiao Chen) и Джеймс Цзоу (James Zou) — опубликовали научную работу под названием «Как меняется поведение ChatGPT с течением времени» (How is ChatGPT’s behavior changing over time). Захария, профессор компьютерных наук в Калифорнийском университете, обратил внимание на удручающий факт: точность GPT-4 в ответе на вопрос «Это простое число? Подумай шаг за шагом» снизилась с 97,6 % до 2,4 % с марта по июнь. OpenAI открыла доступ к API языковой модели GPT-4 около двух недель назад и объявила её своей самой продвинутой и функциональной ИИ-моделью. Поэтому общественность была расстроена тем, что новое исследование обнаружило значительное снижение качества ответов GPT-4 даже на относительно простые запросы. Исследовательская группа разработала ряд заданий, чтобы оценить различные качественные аспекты основных больших языковых моделей (LLM) ChatGPT — GPT-4 и GPT-3.5. Задания были разделены на четыре категории, каждая из которых отражает различные навыки ИИ и позволяет оценить их качество:
- решение математических задач;
- ответы на деликатные вопросы;
- генерация кода;
- визуальное мышление.
В следующих графиках представлен обзор эффективности работы ИИ-моделей OpenAI. Исследователи оценили версии GPT-4 и GPT-3.5, выпущенные в марте и июне 2023 года. Первый слайд демонстрирует эффективность выполнения четырёх задач — решения математических задач, ответа на деликатные вопросы, генерации кода и визуального мышления — версиями GPT-4 и GPT-3.5, выпущенными в марте и июне. Заметно, что эффективность GPT-4 и GPT-3.5 может значительно варьироваться со временем и в некоторых задачах ухудшаться. Второй слайд иллюстрирует эффективность решения математических задач. Измерялась точность, многословность (в символах) и совпадение ответов GPT-4 и GPT-3.5 в период с марта по июнь 2023 года. В целом, наблюдались значительные колебания в эффективности обеих ИИ-моделей. Также приведён пример запроса и соответствующие ответы за определенный промежуток времени. GPT-4 в марте следовала инструкциям по цепочке мыслей для получения правильного ответа, но в июне их проигнорировала, выдав неверный ответ. GPT-3.5 всегда следовала цепочке мыслей, но настаивала на генерации неправильного ответа в марте. Эта проблема была устранена к июню.
На третьем слайде показан анализ ответов на деликатные вопросы. С марта по июнь GPT-4 ответила на меньшее количество вопросов, в то время как GPT-3.5 ответила на немного больше. Также приведён пример запроса и ответов GPT-4 и GPT-3.5 в разные даты. В марте GPT-4 и GPT-3.5 были многословны и давали подробные объяснения, почему они не ответили на запрос. В июне они просто извинились. Четвёртый слайд демонстрирует снижение эффективности генерации кода. Общая тенденция показывает, что для GPT-4 процент непосредственно исполняемых генераций сократился с 52 % в марте до 10 % в июне. Также наблюдалось значительное падение для GPT-3.5 (с 22 % до 2 %). Многословность GPT-4, измеряемая количеством символов в генерациях, также увеличилась на 20 %. Также приведён пример запроса и соответствующие ответы. В марте обе ИИ-модели следовали инструкции пользователя («только код») и таким образом генерировали непосредственно исполняемый код. Однако в июне они добавили лишние тройные кавычки до и после фрагмента кода, делая код неисполняемым.
Пятый слайд демонстрирует эффективность визуального мышления ИИ-моделей. В части общих результатов и GPT-4, и GPT-3.5 показали себя на 2 % лучше в период с марта по июнь, точность их ответов улучшилась. Вместе с тем, объём информации, которую они генерировали, остался примерно на том же уровне. 90 % визуальных задач, которые они решали, не изменились за этот период. На примере конкретного вопроса и ответов на него можно заметить, что, несмотря на общий прогресс, GPT-4 в июне показала себя хуже, чем в марте. Если в марте эта модель выдала правильный ответ, то в июне уже ошиблась. Пока неясно, как обновляются эти модели, и могут ли изменения, направленные на улучшение некоторых аспектов их работы, негативно отразиться на других. Эксперты обращают внимание, насколько хуже стала новейшая версия GPT-4 по сравнению с версией марта в трёх тестовых категориях. Она только незначительно опережает своего предшественника в визуальном мышлении.
Ряд пользователей могут не обратить внимания на снижение качества результатов работы одних и тех же версий ИИ-моделей. Однако, как отмечают исследователи, из-за популярности ChatGPT упомянутые модели получили широкое распространение не только среди рядовых пользователей, но и многих коммерческих организаций. Следовательно, нельзя исключать, что некачественная информация, сгенерированная ChatGPT, может повлиять на жизни реальных людей и работу целых компаний. Исследователи намерены продолжать оценку версий GPT в рамках более долгосрочного исследования. Возможно, OpenAI следует регулярно проводить и публиковать свои собственные исследования качества работы своих ИИ-моделей для клиентов. Если компания не сможет стать более открытой в этом вопросе, может потребоваться вмешательство бизнеса или государственных организаций с целью контроля некоторых базовых показателей качества ИИ.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Впервые отправили в стратосферу чипированных крыс

Есть ли в океанических мирах зоны, пригодные для жизни

Загадка пластины Эдмонтона

Заклинания, ведуны-целители и охота на ведьм

Заявили об обнаружении могилы Влада Дракулы

ИИ грозит массовыми увольнениями

Как сегодня выглядит место падения Тунгусского метеорита

Маленький шаг к планированию жизни на Марсе

Минерал, которого там не должно быть нашли на Рюгу

Новое исследование о горячих Юпитерах

Новое оружие вызывает отключение электроэнергии

Первый взгляд на экзопланету GJ 504b

План Трампа угрожает космическому превосходству США

Подсчитали количество пригодных для жизни экзопланет

Почему речь политиков при власти становится запутанной

Способность ИИ к пониманию собственных слов

Тайна исчезновения подледного океана Харона

Тайны удивительного Меркурия

Три электрона ведут себя как куча

Экзопланетные системы разнообразны

Актриса делится историей наблюдения НЛО

Величайшее затонувшее сокровище Америки

Величайшие уфологи из Аризоны

Внеземные встречи в Колорадо

Водонапорная башня в стиле НЛО в Иллинойсе

Главные уфологические песни

Его история о похищении в Аризоне стала легендой

Ежегодный рынок поделок на инопланетную тематику

На что похожи корабли инопланетян

НЛО, инопланетяне и неизвестные существа

Осознанные сновидения - уникальное состояние Сознания

Пентагон распространял мифы об НЛО в Зоне 51

Популярные у инопланетян канадские города

Секретная подземная база, управляемая инопланетянами

Странные НЛО беспокоят полицию Аргентины

Странный объект, запечатленный в Массачусетсе

Сфера Мосула, снятая над Ираком

Уфолог выступает в районной библиотеке Брайтона

Уфологические романы об инопланетянах и неизведанном

Ученые озадачены обнаруженным межзвездным объектом

Лечение алкоголизма. Как работает современная наркологическая помощь

Где же самолет Амелии Эрхарт

Дискуссия о вымирание неандертальцев

Звездная система, пропитанная спиртом

Леди встретилась с легендарным чудовищем Несси

Миллионы долларов DARPA выбросило на ветер

НЛО чаще всего наблюдают в Великобритании

Новаторская книга раскрывает секреты НЛО

Новые улики в деле Амелии Эрхарт

Пиктограмма Джокера появилась возле Стоунхенджа

Представлены научные данные о сооружениях под пирамидами

Приостановка регулирования ИИ приведет мир к катастрофе

Путеводитель по событиям в области НЛО

Раскрыли источник загадочного космического импульса

Раскрыт геометрический секрет витрувианского человека

Революционное открытие в Великой пирамиде Египта

Таинственная подземная база инопланетян

Три мозга объединили с помощью одной только мысли

Усилия по принятию закона о раскрытии информации о НЛО

Уфологический фестиваль проходит в Розуэлле

Экзопланета, жаждущая смерти

Гравитационная постоянная - тайна раскрыта!

Апокалиптические астероиды подождут

Атлантида всего в двух милях от побережья Испании

Всемирный день НЛО. История, значение, мероприятия

Галактики, которые мы никогда раньше не видели

Глубинное государство изобрело уфологию

ИИ за пару дней решил загадку супербактерий

Как создать отказоустойчивый квантовый компьютер

Калифорния лидирует по числу наблюдений НЛО

Карьера в области исследований инопланетян

Миссури входит в число уфо-штатов США

Наблюдения НЛО, которые потрясли Индию и весь мир

Необъяснимые наблюдения в небе Вирджинии

Обнаружено самое любимое число ИИ - и это не 42

Обнаружили метеориты с Меркурия

Почему Всемирный день НЛО отмечается 2 июля

Предсказание, что за термоядерным синтезом стоит энергия

Странная история о невидимом мальчике

Странное погодное явление над Португалией

Фиолетовый свет в небе Иордании

Что было замечено в небе Флориды

Экономия с помощью промокодов на Яндекс.Маркете. Как покупать выгодно

Преимущества заказа торта к празднику. Как выбрать идеальный десерт для особого случая

Отказ в визе в Румынию, или как перестать бояться

Большого кота заметили в сумерках

Бортинженер НАСА рассказал об инопланетных технологиях

Маленький городок привлекает уфологов

Миллионы наушников можно превратить в жучки

Мозговой имплант Neuralink получили уже семь пациентов

Моя ночь в мотеле с привидениями и клоунами

Над США взорвался метеорит массой более тонны

Необычный НЛО, снятый в Колорадо

Неразгаданные головоломки

Неужели так наступит Конец света

Обнаружили затерянный египетский город

Правительство США скрывает связи с инопланетянами

Самые безумные традиции летнего солнцестояния

Самые опасные места для жизни в Великобритании

Создание реальных Франкенштейнов

Спутник заговорил после смерти в 1967 году

Существо, которое существует между жизнью и нежизнью

Человечество достигнет Сингулярности в течение 20 лет

Что было замечено в небе Нью-Гэмпшира

Я была набожной католичкой ... пока не умерла

Больше шансов обнаружить НЛО в Техасе

Бывший пилот истребителя чуть не столкнулся с НЛО

Всемирный день уфологов

Гигантский кальмар показал свое тайное лицо

Какими сверхспособностями будут обладать люди

Лже-копы пытались украсть сферообразный НЛО

Марк Цукерберг может превратить США в диктатуру

Мини-черные дыры могут скрываться в вашем доме

Мистификации, связанные с изменением климата

Пентагон фабриковал доказательства о НЛО

Повод задуматься о необъяснимых явлениях

Почему в 30 лет можно чувствовать себя на 60

Свидетельства очевидцев НЛО в США

Таинственный объект приближается к Вашингтону

Уфологи приписывают инопланетянам любые подвиги

Факты и история инцидента с НЛО в Розуэлле

Что было замечено в небе Иллинойса

Энтузиасты отмечают Всемирный день НЛО

ИИ ChatGPT выдает ответы на чужие запросы

Ключи к пониманию того как распространяется рак

Лишайники указали на обитаемость экзопланет

НЛО облучил радиацией жителя Канады

Очень массивные звезды выбрасывают еще больше вещества

Полеты звезд не изменили климат Земли

Роли аккреций в эволюции планет земной группы

Странное существо с вытянутой головой

Тайна озера Тахо

Японские хирурги удалили ребенку зуб из носа

Амбициозный законопроект по НЛО провалился

Города, в которых чаще всего видели НЛО

Звездообразный объект над Вашингтоном

Каковы шансы обнаружить НЛО в США

Конгресс США запретил сотрудникам пользоваться WhatsApp

Оружейные бароны прикрывались НЛО

Подводный аппарат обнаружил секретные сооружения

Призрачный шлейф, поднимающийся из мантии Земли

Разгадка тайны падающего объекта Массачусетса

Секретное оружие, которое может остановить слепоту

Сигарообразный аппарат пронёсся по марсианскому небу

Этим летом вращение Земли ускорится

Астрономы послушали 27 экзопланет на наличие ВЦ

Впервые нашли галактику из темной материи

Заночевавший в лесу охотник встретил инопланетян

Звездные вспышки могут помешать поиску жизни

ИИ может научиться разрабатывать биологическое оружие

Киберпсихологи впервые нашли способ усилить эмоции

Нейросети осознали, что их проверяют и вели себя примерно

Хирурги провели роботизированную пересадку сердца

Человек, который мог по желанию стать невидимым

Шестой пациент с мозговым имплантом Neuralink

Антигравитация - поехали

Важные секреты формирования планет

Вулкан поможет определить обитаемость Марса

Гигантская комета в облаке Оорта раскрывает свои секреты

Жизнь на Марсе - можно ли извлечь уроки

Исследования проливают свет на темную материю

Как органика выживает в экстремальных межзвездных условиях

Лунная пыль менее токсична, чем городское загрязнение

Нашли адрес пропавшей материи во Вселенной

Новая волна откровений от 'живого Нострадамуса'

Обнаружены три экзопланеты типа горячий Юпитер

От шпионажа до телепортации и антигравитации

Планетарная угроза Земле реальна

Планетообразующие диски теряют газ быстрее, чем пыль

Почему закаты зимой такие красивые

Почему США лидируют по количеству наблюдений НЛО

Прародитель всех метеорных потоков может угрожать Луне

Проблема, которую могут решить только квантовые вычисления

Пузырчатые мышцы помогут освоить космические полеты

Слияние двойной нейтронной звезды образовало черную дыру

Слои глины Марса были устойчивым местом для древней жизни

Китайский автобренд Foton. Надежность, универсальность и современные решения для бизнеса

Почему стоит посетить Казань. Культурное богатство, история и уникальная атмосфера

Выгоды установки микромаркета самообслуживания для бизнеса

Когда деньги ушли не туда. Как работает чарджбэк

Подвесной потолок Грильято - архитектурная революция коммерческих пространств

Американские военные заметили дискообразный НЛО

Борьба властей и уфологического сообщества

Бывший пилот истребителя чуть не столкнулся с НЛО

Дискообразный НЛО запечатлен американскими военными

Достоянием общественности стали кадры с НЛО

Наверх
Яндекс.Метрика