Корпорация NVIDIA анонсировала платформу для создания продвинутых ИИ-аватаров
|
NVIDIA анонсировала технологическую платформу NVIDIA Omniverse Avatar для создания продвинутых интерактивных аватаров для метавселенных, которые будут наделены искусственным интеллектом. Этих помощников можно будет применять практически в любой отрасли, например, для общения с клиентами. Эта платформа объединяет технологии NVIDIA в области речевого ИИ, компьютерного зрения, понимания естественного языка, механизмов рекомендаций и технологий моделирования. Созданные с её помощью аватары являются интерактивными персонажами с трёхмерной графикой с трассировкой лучей, которые могут видеть и общаться на самые разные темы и понимать смысл сказанного собеседником. |
Omniverse Avatar позволяет создавать помощников ИИ практически для любой отрасли. Это может помочь компаниям в обеспечении повседневного взаимодействия с клиентами — банковскими операциями, назначением личных встреч, бронированием столика в ресторане и т. д. В одной из демонстраций такой аватар помогал паре выбрать еду в кафе через экран самообслуживания. В другой же демонстрации в аватара превратили главу NVIDIA Дженсена Хуанга (Jensen Huang). |
«Omniverse Avatar сочетает в себе основную графику NVIDIA, технологии моделирования и искусственного интеллекта, позволяя создавать одни из самых сложных приложений реального времени, которые когда-либо выпускались», — отметил гендиректор NVIDIA. Omniverse Avatar использует элементы речевого ИИ, компьютерного зрения, понимания естественного языка, механизмов рекомендаций, лицевой анимации и графики, предоставляемые с помощью следующих технологий: |
- распознавание речи основано на NVIDIA Riva, комплекте разработки программного обеспечения, распознающем речь на нескольких языках. Riva также используется для генерации человеческих речевых ответов с использованием возможностей преобразования текста в речь; |
- понимание естественного языка основано на модели генерации естественного языка NVIDIA Megatron 530B, которая может распознавать, понимать и генерировать человеческий язык. Megatron 530B — предварительно обученная модель, которая может, с минимальным обучением или без него, составлять полные предложения, отвечать на вопросы большой предметной области, резюмировать длинные сложные истории, переводить на другие языки и обрабатывать контент во многих областях, для которых она не была специально обучена; |
- механизм рекомендаций аватара предоставляется NVIDIA Merlin, фреймворком, который позволяет предприятиям создавать рекомендательные системы глубокого обучения, способные обрабатывать большие объёмы данных; |
- Возможности восприятия поддерживаются NVIDIA Metropolis, фреймворком компьютерного зрения для видеоаналитики; |
- Анимация аватара основана на технологиях NVIDIA Video2Face и Audio2Face, 2D и 3D лицевой анимации и рендеринга на основе искусственного интеллекта. |
Эти технологии объединяются в приложение и обрабатываются в реальном времени с помощью NVIDIA Unified Compute Framework. Представленные в виде масштабируемых настраиваемых микросервисов, навыки могут быть безопасно развернуты, управляемы и организованы в нескольких местах с помощью NVIDIA Fleet Command. |
Источник |
При использовании материалов с сайта активная ссылка на него обязательна
|