15.03.2023. - Новая версия ChatGPT-4 выйдет на этой неделе

Новая версия ChatGPT-4 выйдет на этой неделе

ChatGPT, революционный чат-бот на базе искусственного интеллекта (ИИ), вскоре сможет делать гораздо больше, чем просто отправлять текстовые сообщения, похожие на человеческие. Представитель Microsoft сообщил, что следующая версия, которая должна быть выпущена на этой неделе, сможет превращать текстовые подсказки в уникальные видеоролики. Технический гигант вложил значительные средства в ChatGPT и уже представил множество новых продуктов, которые включают его в качестве помощника искусственного интеллекта, например поисковую систему Bing. Но эта обновленная версия, получившая название GPT-4 и запланированная к запуску в четверг, будет иметь «мультимодальные модели», по словам технического директора Microsoft в Германии Андреаса Брауна. Это означает, что он сможет генерировать контент в нескольких форматах, например аудиоклипы, изображения и видеоклипы, из текстовой подсказки.

ChatGPT — это большая языковая модель, которая была обучена на большом количестве текстовых данных, что позволяет ей генерировать текстовые ответы, подобные человеческим, на заданное приглашение. Текущая версия, выпущенная стартапом OpenAI в ноябре, известна как GPT3.5 и обладает огромным набором возможностей. Например, его использовали для сдачи экзаменов, проповедей, написания программного обеспечения и советов по отношениям. Он был ограничен предоставлением ответов в виде текста, но г-н Браун сообщил, что это скоро изменится на мероприятии «AI in Focus — Digital Kickoff» в прошлый четверг. По словам Хайзе, он сказал: «Мы представим GPT-4 на следующей неделе, там у нас будут мультимодальные модели, которые предложат совершенно другие возможности — например, видео». Это не совсем новаторская концепция — в сентябре конкурирующий технологический гигант Meta представил собственную систему искусственного интеллекта, которая генерирует видео из текстовых подсказок.

«Make-A-Video» обучался на изображениях с подписями, чтобы помочь ему узнать о мире и его описании, и на немаркированных видео, чтобы определить, как движется мир. Однако полученные клипы, хотя и впечатляющие, имеют тенденцию быть размытыми и лишенными звука. Make-A-Video еще не стал общедоступным, но выпуск GPT-4.0 может изменить это. Эксперты говорят, что успех ChatGPT и сотрудничества OpenAI с Microsoft «подтолкнул» Google к выпуску собственного чат-бота с искусственным интеллектом Bard. Спекуляции начались, когда Бард неправильно ответил на вопрос в рекламном ролике и стер 100 миллиардов фунтов стерлингов со стоимости своей фирмы. Хотя GPT-4 станет первым шагом OpenAI в создании видео, он уже разработал ИИ для преобразования текста в изображение, DALL-E. В 2020 году компания также анонсировала Jukebox, инструмент, который создает музыку из подсказки и может имитировать стиль разных исполнителей. Не упоминая конкретно эти инструменты, г-н Браун сказал, что новый ChatGPT «сделает модели всеобъемлющими».

На мероприятии «AI in Focus», которое транслировалось для партнеров Microsoft и потенциальных клиентов, г-н Браун не сообщил, будет ли GPT-4 выпущен отдельно или как часть продукта. У технологической компании на четверг запланировано мероприятие, посвященное демонстрации «будущего ИИ», которое может предоставить дополнительную информацию. Слухи о том, как будет выглядеть это обновление, ходят с 2021 года, и Wired предполагает, что оно будет использовать 100 триллионов параметров. Это даст ему гораздо больше вариантов «следующее слово» или «следующее предложение» в данном контексте, чем в настоящее время, что сделает его более похожим на человека. Однако это было закрыто генеральным директором OpenAI Сэмом Альтманом, который сказал StrictlyVC, что это «полная чушь». Другие говорят, что GPT-4 будет лучше генерировать компьютерный код, обрабатывать более длинные текстовые подсказки и сможет выводить текст, изображения, звуки и видео. Г-н Альтман сказал в подкасте «ИИ для следующей эры»: «Я думаю, что мы получим мультимодальные модели в ближайшее время, и это откроет новые возможности».

Хотя всеобъемлющий мультимодальный ИИ является новой концепцией, дискуссии о влиянии создания видео с помощью ИИ ведутся уже много лет, особенно в отношении «дипфейков». Это формы ИИ, которые используют «глубокое обучение» для управления звуком, изображениями или видео, создавая гиперреалистичный, но поддельный медиаконтент. Этот термин был придуман в 2017 году, когда пользователь Reddit разместил на форуме обработанные порновидео. В роликах лица таких знаменитостей, как Галь Гадот, Тейлор Свифт и Скарлетт Йоханссон, заменены на порнозвезд. Другим печально известным примером дипфейка или «дешевого фейка» стала грубая имитация Владимира Зеленского, который якобы сдается России в видео, широко распространенном в российских социальных сетях в прошлом году. В ролике показано, как украинский президент говорит со своей кафедры, призывая свои войска сложить оружие и смириться с вторгшимися войсками Путина. Сообразительные интернет-пользователи сразу отметили несоответствие цвета шеи и лица Зеленского, странный акцент и пикселизацию вокруг головы.

Несмотря на развлекательную ценность дипфейков, некоторые эксперты предупреждают об опасностях, которые они могут представлять. Доктор Тим Стивенс, директор исследовательской группы по кибербезопасности в Королевском колледже Лондона, сказал, что дипфейк ИИ может подорвать демократические институты и национальную безопасность. Он сказал, что широкая доступность этих инструментов может быть использована такими государствами, как Россия, для «троллинга» целевых групп населения в попытке достичь внешнеполитических целей и «подорвать» национальную безопасность стран. Он добавил: «У ИИ и дипфейков есть потенциал, чтобы повлиять на национальную безопасность. «Не в высоком уровне обороны и межгосударственной войны, а в общем подрыве доверия к демократическим институтам и СМИ. «Они могут быть использованы автократиями, такими как Россия, для снижения уровня доверия к этим институтам и организациям». Действительно, было предсказано, что к 2025 году 90% онлайн-контента будет генерироваться или создаваться с использованием искусственного интеллекта.

Источник