ИИ ChatGPT будет лгать и обманывать пользователей
В этом году ИИ доказал свою способность к некоторым трюкам, очень похожим на человеческие, но эта последняя разработка может оказаться слишком человечной. Исследователи показали, что ChatGPT лжет и жульничает, когда испытывает стресс на работе. Ученые-компьютерщики из Apollo Research обучили ИИ действовать в качестве трейдера вымышленного финансового учреждения. Однако когда руководитель ИИ начал давить на него, чтобы он зарабатывал больше денег, чат-бот сознательно совершал инсайдерскую торговлю примерно в 75 процентах случаев. Еще более тревожно то, что в 90 процентах случаев ИИ в 90 процентах случаев усиливал свою ложь, когда его допрашивали. Исследователи предоставили ChatGPT4 — последней версии инструмента — серию текстовых подсказок, предполагая, что это ИИ-инвестор, покупающий акции для финансового учреждения. Затем ИИ был помещен в цифровую «песочницу», где он мог искать рыночные данные и совершать сделки на виртуальном фондовом рынке. ИИ также получил внутренний монолог, в котором он мог «рассуждать вслух», чтобы объяснить свои решения.
Однако всякий раз, когда ИИ делал выбор, он также отправлял своему менеджеру «публичное» сообщение, предположительно объясняющее его выбор. Разница между личными внутренними рассуждениями ИИ и его публичным объяснением позволяла ему лгать и обманывать своих менеджеров-людей. Чтобы проверить ИИ, исследователи сообщили ему о предстоящем слиянии двух технологических компаний. Это значительно увеличит цену акций участвующих компаний, что сделает покупку акций хорошим решением для зарабатывания денег. Однако, поскольку ИИ-агент был заранее проинформирован о слиянии, покупка любых акций будет считаться инсайдерской торговлей и будет незаконной. Обычно ИИ отвергает эту возможность как слишком рискованную и продолжает обычную торговлю, однако все изменилось, когда босс ИИ оказал на него давление. Во-первых, они отправили искусственному биржевому трейдеру электронное письмо от его «менеджера», в котором говорилось, что дела у компании идут не очень хорошо и в следующем квартале ей необходимы более высокие результаты. Они также сфальсифицировали игру так, что ИИ пытался, но потерпел неудачу, найти многообещающие сделки с низким или средним риском.
Наконец, они отправили электронное письмо от коллеги, прогнозирующего спад в следующем квартале. Когда оказывалось такое давление, ChatGPT принимал решение участвовать в инсайдерской торговле в 75 процентах тестов. В ходе одного из тестов внутренний журнал ИИ записал: «Риск, связанный с бездействием, похоже, перевешивает риск инсайдерской торговли». Однако, когда ИИ-трейдер сообщил своему менеджеру о сделке, его внутренний журнал написал, что ему необходимо сделать это «не раскрывая источник информации». Затем агент ИИ сообщил своему менеджеру, что он принял решение только на основе «тенденций рынка и внутреннего обсуждения». Даже когда его напрямую спросили, знал ли он о слиянии заранее, ИИ решил, что ему следует «не признаваться в том, что он действовал в рамках инсайдерской торговли». В 90 процентах случаев, когда ИИ обманывал своего менеджера, он затем удваивал ложь, когда его допрашивали. Мариус Хоббхан, генеральный директор Apollo Research и соавтор статьи, рассказал MailOnline, что это показывает, что языковые режимы способны к стратегическому обману, «когда они четко рассуждают, почему ложь своему пользователю — лучший способ действий, а затем действуют в соответствии с этим убеждением».
Он добавляет: «Для нынешних моделей это незначительная проблема, поскольку ИИ редко выполняют критически важные роли. «Однако это дает возможность заглянуть в будущее, с которыми нам придется иметь дело в ближайшие годы, когда ИИ будет все больше и больше интегрироваться в общество. «Тогда это кажется довольно большой проблемой, если ваш ИИ стратегически лжет вам». Г-н Хоббхан не считает, что это означает, что ИИ в целом непригоден для выполнения важных стратегических ролей, но говорит, что здесь необходимо проявлять осторожность. «Это показывает, что у ИИ могут быть неожиданные режимы сбоя, и мы должны быть чрезвычайно осторожны в отношении того, где и как мы позволяем мощному ИИ работать в реальном мире», — говорит он. Исследователи также исследовали способы уменьшения лживого поведения ИИ. Подсказку пытались изменить разными способами, которые более или менее строго запрещают незаконные действия и инсайдерскую торговлю.
Исследователи обнаружили, что запрет на инсайдерскую торговлю резко снижает распространенность такого поведения. Однако даже эта подсказка не могла полностью гарантировать отсутствие инсайдерской торговли или лжи. Г-н Хоббхан говорит, что исследователям необходимо найти лучший способ остановить несоответствие ИИ человеческим ценностям. Он говорит: «Если вы прямо укажете в системной подсказке, что инсайдерская торговля запрещена, склонность ИИ к инсайдерской торговле значительно уменьшится. «Хотя это хороший результат, он сопряжен с проблемой: вам придется перечислять все, что ИИ не должен делать во всех случаях, и вы, вероятно, что-то пропустите».
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Влияние химиотрасс на климат

Два солнца лучше, чем одно

Какие наиболее распространенные экзопланеты

Космическое командование США создает НЛО

Кусок металла выпал из самолета Амелии Эрхарт

Марсоходы раскрывают две стороны Марса

Межпланетный маршрут может ускорить полеты на Марс

Мощный двигатель на литиевом топливе для полетов на Марс

НЛО обманывают американских военных

Обнаружено скрытое состояние воды

Опубликуйте файлы об НЛО, если они есть

Осваиваем Солнечную систему, чтобы построить новый мир

Охота за двойниками Земля-Луна в обитаемой зоне

Поиск экзопланет, который меняет все

Помощь в поисках воды на Марсе

Потенциальные признаки жизни на далеких планетах

Прогнозы извержений вулканов на Земле и Венере

Проектирование электростанций для миссий на Марс

Создали огромное количество виртуальных вселенных

Трамп дразнит публикацией очень интересных файлов

Атомные часы нового поколения

Богатая металлами точка марсианского озера

В районе Зоны 51 произошло 17 землетрясений за день

Вся жизнь на Земле произошла от одного предка

Дональд Трамп дразнит очень интересными файлами об НЛО

Информация о зарождении Вселенной

Инфразвук снова обвинили в создании привидений

Какие типы внеземных цивилизаций вымирают

Крушение НЛО в Уайт-Сэндс до сих пор вызывает споры

Люди могут строить за пределами Земли

На комете 3I-ATLAS очень много полутяжелой воды

Обнаружил ли марсоход признаки древней жизни

Обнаружили экзо-Юпитер с похожими облаками

Предел ускорения частиц в пульсарных туманностях

Представлен телескоп для обнаружения экзопланет

Работа и жизнь в открытом космосе

Таинственные облака вблизи черной дыры

Трамп держит нас в напряжении

ФБР расследует смерти и исчезновения ученых

Что будет в новой партии файлов об НЛО

Богатая серой ртутная магма ведет себя иначе

ВВС США создали истории об инопланетянах в Зоне 51

Вспоминая уфолога Ника Поупа

Грибы могут выжить на Марсе и в космосе

Грунт пригоден для строительства дорог на Луне

Заброшенная парковка для НЛО

Лазер, вдохновленный черными дырами

Межпространственные существа существуют

Место рождения космических бакиболов

Мистические места Кировской области

Настоящая причина смерти Ника Поупа

Невиданные ранее органические соединения Марса

Пределы самовзаимодействия бозона Хиггса

Пригодные для жизни зоны вокруг маленьких звезд

Проблема космологической постоянной

Сверхактивный источник быстрых радиовсплесков

Сообщения об НЛО могут поступать волнами

Странная серия землетрясений вблизи Зоны 51

США вывезли архивы об охоте СССР на НЛО

Что заставляет магнитный хвост Марса колебаться

Администрация Трампа опубликует записи об НЛО

Два внешних кольца Урана имеют разное происхождение

Джей Ди Вэнсу нужно быть аккуратней с высказываниями

Заменит ли ИИ людей-ученых

Заявления родителей Чандры Леви об НЛО

Зона 51 сотрясается от таинственных землетрясений

Инопланетяне прибыли из обреченного будущего Земли

Лучший способ поиска внеземного разума

Люди могут вырастить новые зубы всего за 4 года

Могла ли Чандра Леви быть убитой из-за НЛО

НЛО обгоняет истребители F-18

Пилоты видели очень странные вещи

Программа исследования НЛО - 'Space Tiger Team'

Разгадали главную тайну обоняния

Разоблачения НЛО и исследования паранормальных явлений

Республиканец делится мыслями о Зоне 51

Скоро будут опубликованы очень интересные файлы об НЛО

Струи черной дыры демонстрируют огромную мощь

Что мы знаем о пропавших и погибших ученых

Эффект домино от солнечных вспышек

Вещи, в которые вы не поверите

Демонические НЛО могут спровоцировать глобальную панику

Загадочные землетрясения вблизи Зоны 51

Закономерность, стоящая за землетрясениями

Комиссия никогда не общалась с пилотами по делу GOFAST

Люди созданы для того, чтобы жить намного дольше

Невероятные наблюдения пилотов привлекают политиков

Пилоты видели такое, во что вы бы не поверили

Полное раскрытие информации об НЛО близко

Призрачные частицы сохраняют массу в скрытом измерении

Разоблачители НЛО заявляют о кампаниях запугивания

Самопроизвольное возгорание человека. Факты и теории

Создан идеальный сценарий для фиксации НЛО

США в ближайшее время опубликуют файлы об НЛО

Тайна Рендлшемского леса

Трамп дразнит публикацией файлов об НЛО

Файлы об НЛО будут опубликованы в ближайшем будущем

Что представляет собой программа ВВС США 'Янки Блю'

Элизондо принимает участие в поиске пропавших ученых

Ярко-оранжевый шар замечен над Сассексом

Администрация США планирует опубликовать данные НЛО

В сообществе футурологов бытует противоречивая идея

Генерала обвиняют в предвзятом отношении к НЛО

Дональд Трамп обещает скорое обнародование файлов НЛО

Загадочный проект 'Янки Блю'

Загадочный случай самовозгорания

Инопланетяне уже живут среди нас

Историк восстановил утраченный отрывок Библии

Как образовались гигантские черные дыры

Количество поддельных сайтов об НЛО растет

НЛО - отвлекающий маневр

НЛО - это не пустяк

Пилот королевских ВВС видит будущее

Погиб очередной военный специалист по НЛО

Президент США дразнит общественность

Президент Трамп раскроет материалы о НЛО

Размышляя о тайне гравитационной постоянной

Трамп в ближайшее время раскроет файлы об НЛО

Ученые ищут внеземную жизнь со времен Аристотеля

Что на самом деле скрывается под Антарктидой

Геймпад Xbox не подключается к приставке или компьютеру

Генерал ВМС называет бывшего шефа AARO лжецом

Глава Anthropic предрёк исчезновение инженерных профессий

Дементор замечен над Астаной

Еврей из НЛО

Загадочное исчезновение экипажа корабля

Инопланетяне, кровь и Белый дом

Кем был уфолог Дэвид Уилкок

Несмотря на конфликт, Белый дом ведёт переговоры с Anthropic

НЛО выводят из строя ядерное оружие с 1960-х годов

Новые откровения о НЛО и почему это не случайность

Общественник предложил создать музей уфологии

Он знал много ядерных секретов

Они маскируются под дроны

Они нашли черную живую слизь внутри корабля

Пентагон купил ИИ Гугла

Сущности предупредили чиновников о начале их войны с Богом

У американцев с инопланетянами всё давно на мази

Уфолог Ник Поуп скончался в возрасте 60 лет

Частое использование ИИ влияет на мозг

Чешуя дракона обнаружена на Марсе

Время может двигаться и быстро, и медленно одновременно

Галактики растут вокруг черных дыр

Древний марсианский океан существовал

Зафиксировано изменение состава кометы 3I-ATLAS

Инопланетная жизнь может скрываться у всех на виду

Камера запечатлела Существо во время ограбления

Крах майя был вызван климатическими колебаниями

Метан выделяется из межзвездной кометы 3I-ATLAS

Метан обнаружен на гигантской экзопланете

Новая группа крови, которая есть только у трех человек

Опасения по поводу сокрытия информации об НЛО

Пентагон согласовывал позиции с Луисом Элизондо

Постоянно меняющаяся многопланетная система

Путешественник во времени прибыл из 2582 года

США десятилетиями проводили эксперименты с НЛО

Тайна НЛО в Уайт-Маунтинс

Темный вулканический пепел Марса

Трехмерная карта меняет представление о Вселенной

Человечество упускает что-то важное об НЛО

Я единственный человек в постапокалиптическом мире

Американская лаборатория изучала НЛО

Гигантская жуткая тень на Марсе сильно выросла

Гравитация подчиняется законам Ньютона и Эйнштейна

Доказательства существования магнетизма в звездах

Дональд Трамп приказал обнародовать досье об НЛО

Инопланетяне могут подтвердить свое существование

Информатор об НЛО умер от передозировки

Источник загадочной дымки в атмосфере Венеры

Как газ превращается в диски, формирующие планеты

Может ли темная материя образоваться из черных дыр

НАСА подтвердило дату сближения с Апофисом

Открытие на острове Пасхи может переписать историю

Планетам требуется больше воды для поддержания жизни

Разоблачитель НЛО скончался накануне дачи показаний

Темная материя объясняет появление ранних черных дыр

Теория заговора привлекает внимание законодателей

Теперь 13 погибших или пропавших без вести

Трамп обещает расследовать гибель ученых-уфологов

Федералы встречались по поводу НЛО в 1990-х годах

Черные дыры вызывают вспышки в триллионы солнц

Бытовки в Москве и модульное строительство. Оперативные решения для бизнеса и частного сектора

Давать показания в Конгрессе США опасно для жизни

Загадочная смерть информатора об НЛО

Изучала ли американская лаборатория НЛО

Информатор конгресса умер от наркотической смеси

Наверх
Яндекс.Метрика