ИИ ChatGPT будет лгать и обманывать пользователей
В этом году ИИ доказал свою способность к некоторым трюкам, очень похожим на человеческие, но эта последняя разработка может оказаться слишком человечной. Исследователи показали, что ChatGPT лжет и жульничает, когда испытывает стресс на работе. Ученые-компьютерщики из Apollo Research обучили ИИ действовать в качестве трейдера вымышленного финансового учреждения. Однако когда руководитель ИИ начал давить на него, чтобы он зарабатывал больше денег, чат-бот сознательно совершал инсайдерскую торговлю примерно в 75 процентах случаев. Еще более тревожно то, что в 90 процентах случаев ИИ в 90 процентах случаев усиливал свою ложь, когда его допрашивали. Исследователи предоставили ChatGPT4 — последней версии инструмента — серию текстовых подсказок, предполагая, что это ИИ-инвестор, покупающий акции для финансового учреждения. Затем ИИ был помещен в цифровую «песочницу», где он мог искать рыночные данные и совершать сделки на виртуальном фондовом рынке. ИИ также получил внутренний монолог, в котором он мог «рассуждать вслух», чтобы объяснить свои решения.
Однако всякий раз, когда ИИ делал выбор, он также отправлял своему менеджеру «публичное» сообщение, предположительно объясняющее его выбор. Разница между личными внутренними рассуждениями ИИ и его публичным объяснением позволяла ему лгать и обманывать своих менеджеров-людей. Чтобы проверить ИИ, исследователи сообщили ему о предстоящем слиянии двух технологических компаний. Это значительно увеличит цену акций участвующих компаний, что сделает покупку акций хорошим решением для зарабатывания денег. Однако, поскольку ИИ-агент был заранее проинформирован о слиянии, покупка любых акций будет считаться инсайдерской торговлей и будет незаконной. Обычно ИИ отвергает эту возможность как слишком рискованную и продолжает обычную торговлю, однако все изменилось, когда босс ИИ оказал на него давление. Во-первых, они отправили искусственному биржевому трейдеру электронное письмо от его «менеджера», в котором говорилось, что дела у компании идут не очень хорошо и в следующем квартале ей необходимы более высокие результаты. Они также сфальсифицировали игру так, что ИИ пытался, но потерпел неудачу, найти многообещающие сделки с низким или средним риском.
Наконец, они отправили электронное письмо от коллеги, прогнозирующего спад в следующем квартале. Когда оказывалось такое давление, ChatGPT принимал решение участвовать в инсайдерской торговле в 75 процентах тестов. В ходе одного из тестов внутренний журнал ИИ записал: «Риск, связанный с бездействием, похоже, перевешивает риск инсайдерской торговли». Однако, когда ИИ-трейдер сообщил своему менеджеру о сделке, его внутренний журнал написал, что ему необходимо сделать это «не раскрывая источник информации». Затем агент ИИ сообщил своему менеджеру, что он принял решение только на основе «тенденций рынка и внутреннего обсуждения». Даже когда его напрямую спросили, знал ли он о слиянии заранее, ИИ решил, что ему следует «не признаваться в том, что он действовал в рамках инсайдерской торговли». В 90 процентах случаев, когда ИИ обманывал своего менеджера, он затем удваивал ложь, когда его допрашивали. Мариус Хоббхан, генеральный директор Apollo Research и соавтор статьи, рассказал MailOnline, что это показывает, что языковые режимы способны к стратегическому обману, «когда они четко рассуждают, почему ложь своему пользователю — лучший способ действий, а затем действуют в соответствии с этим убеждением».
Он добавляет: «Для нынешних моделей это незначительная проблема, поскольку ИИ редко выполняют критически важные роли. «Однако это дает возможность заглянуть в будущее, с которыми нам придется иметь дело в ближайшие годы, когда ИИ будет все больше и больше интегрироваться в общество. «Тогда это кажется довольно большой проблемой, если ваш ИИ стратегически лжет вам». Г-н Хоббхан не считает, что это означает, что ИИ в целом непригоден для выполнения важных стратегических ролей, но говорит, что здесь необходимо проявлять осторожность. «Это показывает, что у ИИ могут быть неожиданные режимы сбоя, и мы должны быть чрезвычайно осторожны в отношении того, где и как мы позволяем мощному ИИ работать в реальном мире», — говорит он. Исследователи также исследовали способы уменьшения лживого поведения ИИ. Подсказку пытались изменить разными способами, которые более или менее строго запрещают незаконные действия и инсайдерскую торговлю.
Исследователи обнаружили, что запрет на инсайдерскую торговлю резко снижает распространенность такого поведения. Однако даже эта подсказка не могла полностью гарантировать отсутствие инсайдерской торговли или лжи. Г-н Хоббхан говорит, что исследователям необходимо найти лучший способ остановить несоответствие ИИ человеческим ценностям. Он говорит: «Если вы прямо укажете в системной подсказке, что инсайдерская торговля запрещена, склонность ИИ к инсайдерской торговле значительно уменьшится. «Хотя это хороший результат, он сопряжен с проблемой: вам придется перечислять все, что ИИ не должен делать во всех случаях, и вы, вероятно, что-то пропустите».
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Воспользуйтесь услугами суррогатной матери-робота

Враждебный корабль пришельцев летит к Земле

Встречи с НЛО, которые попали в заголовки газет

ИИ снижает уровень профессионализма врачей

Инопланетный корабль приближается к Земле

Инопланетяне реальны и бывают четырех видов

Китай создал систему противоспутникового оружия

Конгресс видел доказательства существования НЛО

Многочисленные наблюдения НЛО в небе США

НЛО над Эвергрином

Пилоты видели бегство инопланетян над Бразилией

Представитель США поделилась данными о НЛО

Серебристый диск был замечен над Голландией

Таинственная калифорнийская уфологическая группа

Тайна Туринской плащаницы раскрыта

Треугольный НЛО над аэропортом Солт-Лейк-Сити

Фитопланктон на экзопланете K2-18b

Флотилия НЛО над штатом Мэн

ЦРУ обнаружило Ковчег Завета

Человечество может выжить после появления сверх-ИИ

Борьба за то, чтобы связать наш мозг с ИИ

Вирусное видео НЛО над Малверн-Хиллз

Инсайдер делает ошеломляющее заявление об НЛО

Конгрессвумен от Флориды делится данными об НЛО

Кроликов-мутантов в Колорадо называют франкенштейнами

Мутанты с щупальцами захватывают США

Наблюдения НЛО в районе Спрингфилда

НЛО позади собаки имеет обыденное объяснение

Новое мозговое устройство считывает внутреннюю речь

Ночь, когда Анна Паулина Луна увидела НЛО

Огромный архив НЛО служит уникальным ресурсом

Паника распространяется по США из кроликов-мутантов

Почему мы видим демонов

Случайно обнаружили доказательства Большого взрыва

Теория заговора о том, что Титаник никогда тонул

У людей есть 116 дней до прибытия инопланетян

Устройство, которое может открыть невидимую Вселенную

Чиновники США осознают реальность НЛО

Что политик сказала о НЛО

Яркий объект замечен над США

Божественная кровь обнаружена на Туринской плащанице

Вы видели, как НЛО вращался в небе

Марсоход обнаружил загадочный шлем

Межпространственные существа - реальность

Метеорит врезался в чью-то гостиную

Мужчина, выгуливающий собаку, снял НЛО

Око Саурона обнаружили в глубоком космосе

Откуда на Земле появилась вода

Письмо помогло найти затерянный в джунглях город майя

Политик рассказала о контакте с непознанным

Рэпер думает, что у него инопланетное происхождение

Собака помогла запечатлеть НЛО

Соратник Трампа делает громкие заявления об НЛО

Странные огни замечены над Миннесотой

Темная зеркальная Вселенная скрывается рядом

Фото летательных аппаратов, созданных не человеком

Фрагмент, который может разрушить теорию струн

Человечество достигло пика развития ИИ

Это был не НЛО - это были космические силы

Яркий свет над Квебеком завораживает

Лучшие фильмы с Марго Робби. Путь к голливудскому успеху

Вероятность погибнуть от удара астероида

Верующие видят лицо Иисуса на Туринской плащанице

Генетическое тестирование инопланетных мумий

Заметили пробуждение сверхмассивной черной дыры

Исследование бурного прошлого Венеры

Кролики-франкенштейны захватывают США

Медленно вращающиеся ореолы темной материи

Метеорит Джорджии на 20 млн лет старше самой Земли

Механизм, который восстановит ваши глаза

НАСА призывают отправить сообщение объекту 3I/ATLAS

Одна сторона Земли теряет тепло гораздо быстрее

Описание проверки оборотней в Пентагоне

Пентагон пытается разоблачить объект Агуадильи

Полная картина ночных облаков на Марсе

Потрясающий вид на третьего межзвездного гостя

Проще ли добывать астероиды на Луне, чем сами астероиды

Разгадали тайну пропажи космической серы

Сняли невидимый глазом НЛО

Тайна катастрофы Амелии Эрхарт может быть раскрыта

Утаенные данные о вторжении НЛО на Восточное побережье

Анализ и присвоение названия новому метеориту

Встреча с зелеными человечками в Кентукки

Зафиксировали самый удаленный быстрый радиовсплеск

Зонд Люси мог бы посетить еще один астероид

ИИ научился быть злым без чьих-либо указаний

Кинолог запечатлел очень быстрый НЛО

Метеорит пробил дыру в крыше дома в Джорджии

Мужчина, выгуливая свою собаку, запечатлел НЛО

На экзолунах у Альфа Центавра может быть жизнь

Планеты, на которых нет воды, могут производить жидкости

Появление новой статуи на острове Пасхи

Пропавший самолет Амелии Эрхарт найден

Пугающая информация о таинственном межзвездном объекте

Расы инопланетян, о которых известно властям США

Сфера Дайсона поможет воскрешать мертвых

Сходство между околосмертными переживаниями и наркотиками

Туринская плащаница. Это кто-то другой, а не Иисус

Физический варп-двигатель возможен

Черный куб замечен над базой ВВС Райт-Паттерсон

Шокирующее открытие после падения метеорита в Джорджии

База инопланетян в кратере Лаут на Марсе

Видел ли Дональд Трамп НЛО

Древние постройки обнаружили на Меркурии

Завод по производству лунного кирпича

Загадочная комета, прилетевшая из другой системы

НАСА изучает загадочную межзвездную комету

Научились превращать ртуть в золото

НЛО заметили над штатом Нью-Джерси

НЛО наблюдает за семьей в Индии

НЛО оставляет дымный след над Невадой

Обнаружена самая массивная черная дыра

Обнаружены первые звезды Вселенной

Существуют четыре различных вида инопланетян

США используют технологии инопланетян

Таинственный гигант, скрывающийся за черными дырами

Три фигуры появляются на Солнце

Удивительный полет к черной дыре

Федеральный советник по науке призывает изучать НЛО

Экзопланета у ближайшей солнцеподобной звезды

Экзотические вихри на картине 'Звездная ночь'

Гигантский пузырь звезды-сверхгиганта удивляет

Когда марсианский грунт распадется на части

Космическая гонка касается не только крупных стран

Криптотерриториальная гипотеза

Литологические особенности ландшафта Марса

Молодая звезда начинает взрываться

НАСА спешит разместить ядерные реакторы на Луне и Марсе

НАСА ускоренно разрабатывает лунный реактор

Недавние вулканические и термальные изменения на Марсе

Поиск жизни на Марсе был явной целью астросообщества

Почему кабинет Трампа дает разные ответы о НЛО

С помощью ChatGPT пишется все больше научных статей

Самая ранняя черная дыра во Вселенной

Свидетельства о кровавом ритуале на Туринской плащанице

Столкновение облаков приводит к вездообразованию

Тайна Бермудского треугольника раскрыта

Тайны космического винограда

Тайны протопланетных дисков

Что нужно знать о Лох-Несском чудовище

Шестеро преемников могли бы исследовать Марс

Бесконечная зима в Европе все ближе

Библейские руины - ключ к тайне Ковчега завета

Библейское море становится кроваво-красным

Власти США знают о четырех расах инопланетян

Изображение Плащаницы сделано со скульптуры

Конгрессмен рассказал об инопланетянах

Миру следует разработать политику в области НЛО

На Марсе нашли совершенно новый минерал

Наблюдение за НЛО в Уилтшире

Новые подсказки в поисках Восьмого чуда

Обнаружена экзопланета в обитаемой зоне Альфы Центавра

Популярные места для наблюдения НЛО в США

Страх охватил деревни в Австралии из-за НЛО

Существо в реке Хан в Сеуле стало вирусным

Тайна Атлантиды становится все более загадочной

Тайна человеческого сердца Леонардо да Винчи

Тулси Габбард возрождает теорию заговора о НЛО

Ученые предсказывают Конец света

Центр изучения НЛО открывает набор учителей

Что означает интерес Джей Ди Вэнса к НЛО

Безумный план посетить черную дыру

Загадочные временные явления в тени Земли

Загадочный межзвездный обьект - инопланетный корабль

Закрыли изучавший телепортацию институт МГУ

Заметили облако в форме рестлера Халка Хогана

Затонувший город расскажет о Ноевом ковчеге

Межзвездная экспедиция к черной дыре

Межзвездный объект имеет разумный дизайн

Мрачное предупреждением о 15 годах антиутопии

НЛО сняли в холмах Малверн

Новое открытие в Туринской плащаницы

Новый вид физики, не виданный ранее

Новый окрас кошек противоречит генетическим ожиданиям

Пилот уверен, что нашел самолет Амелии Эрхарт

Признаки древней жизни на Красной планете

Самое странное кольцо Сатурна

Суперинтеллект роботов может привести к Апокалипсису

Существуют другие видео маневров НЛО у Нимица

Сфера Буга - часть скрытой планетарной сети

Таинственные шары требуют научного изучения

Мраморные памятники фото и цена

Автомобилист принял телескоп за НЛО

Великая пирамида на тысячелетия старше фараонов

Вера в возможность существования внеземной жизни

Давайте сохраним Луну

Наверх
Яндекс.Метрика