Когда ИИ начнет озвучивать сериалы
Российские издательства уже экспериментируют с машинной записью аудиокниг, в перспективе искусственному интеллекту можно будет поручить перевод сериалов и озвучку их голосами любимых актеров. Об особенностях таких технологий и сколько времени понадобится на их создание. На YouTube автоматические субтитры для роликов создает программа распознавания голоса и перевода речи в текст. В ее основе — самообучающиеся нейросети. Этой опции более десяти лет, но результат все еще далек от идеала. Чаще всего удается лишь уловить общий смысл сказанного.
Допустим, объясняет Андрей Фильченков, руководитель лаборатории "Машинное обучение" Университета ИТМО, мы строим алгоритм для распознавания речи. Для этого требуется обучить нейросеть на большом массиве данных. Понадобятся сотни, тысячи часов записей речи и правильное сопоставление их с текстами, включая разметку начала и окончания фраз, смены собеседников и так далее. Это называется корпусом. Чем он больше, тем качественнее идет обучение нейросети, Для английского языка созданы действительно большие корпуса, поэтому распознавание значительно лучше. Но для русского или, скажем, испанского данных гораздо меньше, а для многих других языков нет вообще. "И результат соответствующий", — заключает ученый.
"Кроме того, значение слова, фразы в фильме мы оцениваем не только по звуку, важны и интонация актера, его мимика. Как интерпретировать это?" — добавляет Сергей Аксенов, доцент отделения информационных технологий Томского политехнического университета. "Как обработать особенности беглой речи? Нечеткую артикуляцию, отрывочность, междометия, паузы? Ведь в зависимости от этого меняется смысл, как в "казнить нельзя помиловать". Как научить машину определять, где у говорящего запятая? А в стихах?" — перечисляет Марина Болсуновская, заведующая лабораторией "Промышленные системы потоковой обработки данных" Центра НТИ СПбПУ.
Самые успешные проекты, по мнению эксперта, — в узких областях. Например — система распознавания профессиональной речи врачей с использованием медицинских терминов, разработанная группой компаний ЦРТ, помогающая докторам вести историю болезни. "Здесь можно четко очертить предметную область и выделить в речи ключевые слова. Врач специально подчеркивает интонацией определенные разделы: жалобы пациента, диагноз", — уточняет Болсуновская.
На еще одну проблему указывает Михаил Бурцев, заведующий лабораторией нейронных систем и глубокого обучения МФТИ. Дело в том, что пока машина успешнее распознает текст, когда говорит один человек, нежели несколько, как в кинофильмах. Возьмем какой-нибудь англоязычный ролик, например нарезку из сериала "Игра престолов", и включим автоматические русские субтитры. То, что мы увидим, скорее всего, нас рассмешит. Хотя в машинном переводе технологии достигли впечатляющих успехов. Так, Google Translate переводит тексты на распространенных языках вполне сносно, часто требуется лишь минимальная правка.
Дело в том, что нейросеть-переводчик также обучается на большом массиве исходных, правильно размеченных данных — параллельном корпусе, где показано, как каждая фраза на языке оригинала должна выглядеть по-русски.
"Строить такие корпусы очень трудоемко, дорого и долго, уходят месяцы, годы. Чтобы натренировать нейросеть, нужны тексты объемом с Александрийскую библиотеку. Модели универсальные, но многое зависит от языка. Если предоставить много данных, например на аварском, и перевод выдадут качественный, но для аварского просто нет такого объема данных", — говорит Андрей Фильченков.
"Перевод — это отдельный продукт, который связан с оригиналом, но не равен ему, — отмечает Илья Мирин, директор Школы цифровой экономики Дальневосточного федерального университета. — Характерный пример — переводы Дмитрия Пучкова (Гоблина) зарубежных фильмов в 90-е. Только после его работы стало понятно, что там происходит. Из VHS-версий мы не могли узнать ничего адекватного. Как вариант, попробуйте перевести на язык, который хорошо знаете, что-то из "Мастера и Маргариты". Например, "в черном плаще с кровавым подбоем". Машина этого не сумеет".
Нейросети хорошо обучаются на множестве типовых примеров, но фильмы полны сложных смыслов и коннотаций, шуток, машине не доступных — она не может их различить. "В каждой серии мультсериала Futurama есть отсылка к классическому американскому кинематографу — "Касабланке", "Римским каникулам" и так далее. В такие моменты переводчику, чтобы поймать и переупаковать смысл для тех, кто этих фильмов не смотрел, нужно придумать близкий аналог из российского контекста. Неправильный машинный перевод может сильно обескуражить зрителя", — продолжает Мирин.
По его мнению, качество машинного перевода близко к 80 процентам, остальное — специфика, которую надо добавлять вручную, привлекая экспертов. "А если 20-30 процентов фраз требуют ручной коррекции, то в чем польза машинного перевода?" — рассуждает исследователь. "Перевод — самый проблемный этап, — соглашается Сергей Аксенов. — Все упирается в семантику и контекст. Имеющиеся инструменты вполне можно использовать для перевода и машинной озвучки, например, детских мультиков с простой лексикой. Но вот с интерпретацией фразеологизмов, имен собственных, слов, отсылающих зрителей к каким-то культурным реалиям, возникают сложности".
В фильмах и видеороликах контекст всегда визуальный и нередко сопровождается музыкой, шумами. Мы по картинке домысливаем, о чем говорит герой. Речь, обращенная в текст, лишена этой информации, поэтому перевод затруднен. В такой ситуации оказываются переводчики, работающие с текстовыми субтитрами, не видя фильма. Они часто ошибаются. С машинным переводом та же история. Чтобы озвучить сериал, переведенный на русский, понадобится алгоритм генерации естественной речи по тексту — синтезатор. Их создают многие IT-компании, в том числе Microsoft, Amazon, Yandex, и получается у них неплохо.
По словам Андрея Фильченкова, пару лет назад минута озвучивания синтезатором речи занимала несколько часов, сейчас скорость обработки сильно выросла. Задача синтеза речи для некоторых областей, где требуются нейтральные диалоги, решается довольно хорошо. Многие уже принимают как данность разговор с роботом по телефону, выполнение команд автомобильного навигатора, диалог с Алисой в машине "Яндекс.Драйв". Но для озвучивания сериалов эти технологии пока недотягивают.
"Проблема в эмоциях и актерской игре. Мы научились делать машинный голос человеческим, но чтобы он еще звучал уместно контексту и вызывал доверие — до этого далеко. Плохой озвучкой легко убить восприятие фильма", — полагает Фильченков. По мнению Михаила Бурцева, синтез речи вполне реален. Однако это требует больших вычислительных ресурсов и не может выполняться в реальном времени за разумные деньги. "Существуют алгоритмы, которые синтезируют речь, похожую на голос конкретного актера. Это и тембр, и манера говорить, и многое другое. Так любой иностранный актер фактически заговорит по-русски", — прогнозирует Бурцев. Он ожидает заметный прогресс в ближайшие годы.
Сергей Аксенов дает пять-десять лет на развитие инструментов для перевода и озвучки сложных произведений с самых распространенных языков вроде английского. Ученый приводит в пример Skype, который несколько лет назад продемонстрировал возможность организации онлайн-уроков для школьников, говорящих на разных языках. Но даже тогда система не будет идеальной, ей постоянно придется учиться: набирать словарный запас, учитывать культурный контекст.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Последние аномальные новости

В небе Калифорнии замечен странный НЛО

Великобритания разрабатывает правила для ИИ

Город богов разрушило мегаземлетрясение

Еще один механизм выживания тихоходок в космосе

Жуткое послание убийцы Зодиака

Квантовый интернет все ближе

Ковчег Завета питал Великую пирамиду Гизы

Морской офицер выражает тревогу по поводу водных НЛО

Нет доказательств существования инопланетных технологий

Новая книга дает представление о космических поисках жизни

Обнаружили близкую массивную черную дыру

Перепись ближайших окрестностей Солнца

Проект по классификации гамма-всплесков

Пурпурный, а не зеленый цвет - цвет жизни на экзопланетах

Стивен Спилберг снимет новый фильм об НЛО

Тайна объекта в форме сердца на поверхности Плутона

Тайна орбитальной нестабильности планет-гигантов

Технология передачи энергии с космических электростанций

Церера таит в себе мрачную тайну

Электричество и батарейки древних египтян

Yeezy Boost 350 v2 Black Черные. Икона Стиля и Инновации

Билл Гейтс поддерживает искусственный интеллект

В небе Калифорнии замечен таинственный объект

В пещерах на Марсе могут находиться инопланетяне

Геолог-любитель получил сильные ожоги от НЛО

Житель Лондона принял вертолет за НЛО

За НЛО отправляйтесь в маленький городок в Висконсине

Звездолеты помогут в поисках новых физических явлений

Интернет может достичь квантовой скорости

Космические силы США готовятся к первой в истории миссии

Министерство обороны публикует документы Kona Blue

Нейтронные звезды нагреваются от аннигиляции темной материи

Нострадамус предсказал войну в 2024 году

Победителем президентских выборов в 2032 году станет робот

Подводные НЛО ставят под угрозу морскую безопасность США

Подводный НЛО сняло исследовательское судно

Проклятая могила с 450 обезглавленными вампирами

Рассекреченный отчет раскрывает дематериализацию НЛО

Тайна высоких уровней энергии в звездных сверхвспышках

Уважаемый астроном не верит в теории заговора об НЛО

Ярчайший гамма-всплеск породила коллапсирующая звезда

Франшиза Pro.Travel. Предпринимательский успех Татьяны Мамаевой

Возвращение денежных средств пострадавшим от брокеров-мошенников. Путь к справедливости

Встреча с НЛО, от которой у человека расплавились пальцы

Детеныш инопланетянина найден в мексиканской пещере

Инопланетяне помешали человечеству скатиться к ядерной войне

Как ученые сообщат человечеству об инопланетянах

Канадский рейтинг мест для наблюдения НЛО

Ключ к поиску жизни в отдаленных мирах

Лучшие наблюдения НЛО в Северной Каролине

Люди не верят, что никаких НЛО нет

Мужчина получил сильные ожоги при встрече с НЛО

Мужчина с разбитым сердцем построил Космические врата

Музей странного и чудесного в Канзасе

Настоящие убежища из сериала Fallout уже построены

НЛО заметили над долиной Нижнего Гудзона

НЛО около Антарктиды - ошибка программного обеспечения

НЛО представляют угрозу безопасность на море

Подводные НЛО ставят под угрозу морскую безопасность США

Призрачные нарушения звездных потоков темной материей

Термодинамика поможет описать расширение Вселенной

Что это за НЛО замечен над штатом Нью-Йорк

Эксцентриситет орбиты создал океан на Мимасе

Более четверти россиян верят в существование инопланетян

Гигантские человеческие скелеты в пещере Лавлок

Глобальное потепление лишит Антарктиду 76% метеоритов

Девочки-близнецы испытывают одинаковые чувства

Древнеиндийская мандала в районе линий Наска

Древние легенды и мифы рассказывают о ануннаках

Женщина чудом выжила после удара молнии

ИИ может притворяться более глупым, чем есть на самом деле

История об оборотнях пронизана загадками и тайнами

Клетки поджелудочной железы пересадят от свиньи человеку

Космические кладбища, затмение и ждать ли НЛО

Космические силы США планируют провести учения на орбите

Магическая сила, делающее тело неуязвимым

Маленькие человечки похитили мужчину

Под Уфой заметили НЛО

Таинственные лабиринты Чинканас

Тайна упавшей в Омске кометы и 17000 фото НЛО

Тайны европейских подземных тоннелей

Тело фанатки вампиров нашли обескровленным

Экстрасенс нашел место захоронения пропавшего мальчика

Гильотинные ножницы по металлу. Назначение и критерии выбора

Как выбрать массажное кресло

Франшиза CyberSeller под управлением Азата Аширова

Большинство людей хотят заниматься сексом с роботами

Будущие эпидемии могут возникнуть из-за ИИ

В Башкирии жители заметили НЛО в небе

В новом отчете Пентагона по НЛО есть серьезные недостатки

Вычисление точных размеров экзопланет

Зонд для поисков жизни на спутниках Юпитера

Кислород и углерод улетучиваются из магнитосферы Венеры

Мы не готовы к вторжению инопланетян

НЛО замечен небе над Екатеринбургом

Новая идея для космических солнечных батарей

Обнаружены звездные ветры от трех солнцеподобных звезд

Поиски неуловимого Лох-Несского чудовища

Призрак опрокидывает напитки в одном из пабов Британии

Странный сигарообразный НЛО над шоссе в Миссури

Существо-муравей замечено на Марсе

Тёмная материя повышенной плотности существует

Ужасающая реальность ядерной радиации

Уэльс - горячая точка внеземной активности

Человек-сатана сменил имя на Дьявол

Ярчайший гамма-всплеск произошел из-за коллапса звезды

Беспроводная передача энергии поможет изучить Луну

Бывшая жена призрака стала ведьмой

В поисках асимметрии между материей и антивеществом

Какая часть атмосферы Венеры образуется за счет вулканов

Наблюдения НЛО в Канаде продолжаются

НАСА попросили помочь в поисках Лох-Несского чудовища

Необъяснимая аномалия вблизи Антарктиды движется на север

Новый сейсмодатчик для обнаружения лунотрясений

Порнозвезда рассказала о своем столкновении с призраками

Раскрывая секреты НЛО. Взгляд доктора Стивена Грира

Солнечные паруса нового поколения готовы к запуску

Столкновение звезд раскрывает звездную тайну

Терминаторы могут появиться уже в следующем году

Триггеры нового поколения для детекторов ЦЕРН

Удивительные горячие точки НЛО в Техасе

Ученые БАК изучают звездные пути инопланетян

Физика и математика стоящие за 'Задачей трех тел'

Человек появился спустя 30 лет без памяти

Черная дыра замечена вблизи Кейптауна

Черный НЛО замечен над океаном около Тампы

Для изучения астероидов потребуются разумные зонды

Доказательство путешествий во времени

Дьявол будет парить в вышине, вызывая изумление

Если на Европе и есть гейзеры, то они очень слабые

Затмения лежат в основе усилий по изучению экзопланет

ИИ может воспроизвести голос любого человека

Как искусственные сотрудники повлияют на живых

Конспирологи опасаются демонических порталов

Люди плохо разбираются в теориях заговора

Новая свидетельница похищения инопланетянами в Паскагуле

Обнаружена новая молодая и теплая экзопланета

Питательные вещества для жизни на экзопланетах

Платформа из графита левитирует без электричества

Пугающая деталь в паспорте Нео

Роль Млечного Пути в древнеегипетской мифологии

Создатель аугментов вернулся к работе

Техас заменяет тысячи экзаменаторов-людей на ИИ

Технологии НАСА помогают защититься от лунной пыли

Фирма Synchron начинает испытания мозговых чипов на людях

Что будет с Землей, когда погаснет Солнце

Бигфут скрывается в горах с таинственной энергией

Биокомпоненты оказались стабильны в атмосфере Венеры

В Сочи корабли полетели над морем

Звезда бросает вызов происхождению быстрых радиовсплесков

НЛО в Розуэлле по-прежнему окутывает Вашингтон

Паранормальная природа встреч с НЛО и связь между ними

Почему так трудно бурить на поверхности планет

Разоблачители и поиск внеземной жизни

Самое необычное место для отдыха в Колорадо

Смотрите фильмы о непознанном на Netflix

Создали метажидкость с программируемыми свойствами

Тайна мумии русалки раскрыта

Тайна однобокой геологии Луны

Теории заговора вокруг Георга III и королевы Шарлотты

Ужасные рога мужчины-дьявола и женщины-носорога

Ученые БАК пытаются открыть пути инопланетян

Четыре ключевых вопроса об инопланетных технологиях

Что мы могли бы построить из лунного реголита

Южнокорейский зонд приняли за НЛО

Я был похищен долговязыми инопланетянами

Автостоянки у супермаркетов не интересуют НЛО

В Массачусетсе происходят массовые наблюдения НЛО

В Уэльсе было зарегистрировано 323 случая наблюдения НЛО

Если на Европе существует жизнь её обнаружат

Инопланетные шарики, выловленные из Тихого океана

Конспирологи считают ЦЕРН угрозой миру

Министерство обороны опубликовало досье об НЛО

НАСА сняло НЛО, летящий над Луной

НЛО был замечен над Арлингтоном

НЛО замечен над Техасом во время солнечного затмения

НЛО прилетают в Уэльс не за мясом

НЛО прилетают к нам через дополнительные измерения

Перуанские мумии инопланетян требуют новых исследований

Правда об НЛО вызовет беспорядки

Пульсирующий синий НЛО снят над Финиксом

Режиссер делится своим Ангельским опытом

Существуют ли НЛО на самом деле

Ускоренное расширение Вселенной замедляется

Файлы необъяснимого стал самым популярным шоу Netflix

Что такое Гаванский синдром

Подписка на новости
Наверх