Когда ИИ начнет озвучивать сериалы
Российские издательства уже экспериментируют с машинной записью аудиокниг, в перспективе искусственному интеллекту можно будет поручить перевод сериалов и озвучку их голосами любимых актеров. Об особенностях таких технологий и сколько времени понадобится на их создание. На YouTube автоматические субтитры для роликов создает программа распознавания голоса и перевода речи в текст. В ее основе — самообучающиеся нейросети. Этой опции более десяти лет, но результат все еще далек от идеала. Чаще всего удается лишь уловить общий смысл сказанного.
Допустим, объясняет Андрей Фильченков, руководитель лаборатории "Машинное обучение" Университета ИТМО, мы строим алгоритм для распознавания речи. Для этого требуется обучить нейросеть на большом массиве данных. Понадобятся сотни, тысячи часов записей речи и правильное сопоставление их с текстами, включая разметку начала и окончания фраз, смены собеседников и так далее. Это называется корпусом. Чем он больше, тем качественнее идет обучение нейросети, Для английского языка созданы действительно большие корпуса, поэтому распознавание значительно лучше. Но для русского или, скажем, испанского данных гораздо меньше, а для многих других языков нет вообще. "И результат соответствующий", — заключает ученый.
"Кроме того, значение слова, фразы в фильме мы оцениваем не только по звуку, важны и интонация актера, его мимика. Как интерпретировать это?" — добавляет Сергей Аксенов, доцент отделения информационных технологий Томского политехнического университета. "Как обработать особенности беглой речи? Нечеткую артикуляцию, отрывочность, междометия, паузы? Ведь в зависимости от этого меняется смысл, как в "казнить нельзя помиловать". Как научить машину определять, где у говорящего запятая? А в стихах?" — перечисляет Марина Болсуновская, заведующая лабораторией "Промышленные системы потоковой обработки данных" Центра НТИ СПбПУ.
Самые успешные проекты, по мнению эксперта, — в узких областях. Например — система распознавания профессиональной речи врачей с использованием медицинских терминов, разработанная группой компаний ЦРТ, помогающая докторам вести историю болезни. "Здесь можно четко очертить предметную область и выделить в речи ключевые слова. Врач специально подчеркивает интонацией определенные разделы: жалобы пациента, диагноз", — уточняет Болсуновская.
На еще одну проблему указывает Михаил Бурцев, заведующий лабораторией нейронных систем и глубокого обучения МФТИ. Дело в том, что пока машина успешнее распознает текст, когда говорит один человек, нежели несколько, как в кинофильмах. Возьмем какой-нибудь англоязычный ролик, например нарезку из сериала "Игра престолов", и включим автоматические русские субтитры. То, что мы увидим, скорее всего, нас рассмешит. Хотя в машинном переводе технологии достигли впечатляющих успехов. Так, Google Translate переводит тексты на распространенных языках вполне сносно, часто требуется лишь минимальная правка.
Дело в том, что нейросеть-переводчик также обучается на большом массиве исходных, правильно размеченных данных — параллельном корпусе, где показано, как каждая фраза на языке оригинала должна выглядеть по-русски.
"Строить такие корпусы очень трудоемко, дорого и долго, уходят месяцы, годы. Чтобы натренировать нейросеть, нужны тексты объемом с Александрийскую библиотеку. Модели универсальные, но многое зависит от языка. Если предоставить много данных, например на аварском, и перевод выдадут качественный, но для аварского просто нет такого объема данных", — говорит Андрей Фильченков.
"Перевод — это отдельный продукт, который связан с оригиналом, но не равен ему, — отмечает Илья Мирин, директор Школы цифровой экономики Дальневосточного федерального университета. — Характерный пример — переводы Дмитрия Пучкова (Гоблина) зарубежных фильмов в 90-е. Только после его работы стало понятно, что там происходит. Из VHS-версий мы не могли узнать ничего адекватного. Как вариант, попробуйте перевести на язык, который хорошо знаете, что-то из "Мастера и Маргариты". Например, "в черном плаще с кровавым подбоем". Машина этого не сумеет".
Нейросети хорошо обучаются на множестве типовых примеров, но фильмы полны сложных смыслов и коннотаций, шуток, машине не доступных — она не может их различить. "В каждой серии мультсериала Futurama есть отсылка к классическому американскому кинематографу — "Касабланке", "Римским каникулам" и так далее. В такие моменты переводчику, чтобы поймать и переупаковать смысл для тех, кто этих фильмов не смотрел, нужно придумать близкий аналог из российского контекста. Неправильный машинный перевод может сильно обескуражить зрителя", — продолжает Мирин.
По его мнению, качество машинного перевода близко к 80 процентам, остальное — специфика, которую надо добавлять вручную, привлекая экспертов. "А если 20-30 процентов фраз требуют ручной коррекции, то в чем польза машинного перевода?" — рассуждает исследователь. "Перевод — самый проблемный этап, — соглашается Сергей Аксенов. — Все упирается в семантику и контекст. Имеющиеся инструменты вполне можно использовать для перевода и машинной озвучки, например, детских мультиков с простой лексикой. Но вот с интерпретацией фразеологизмов, имен собственных, слов, отсылающих зрителей к каким-то культурным реалиям, возникают сложности".
В фильмах и видеороликах контекст всегда визуальный и нередко сопровождается музыкой, шумами. Мы по картинке домысливаем, о чем говорит герой. Речь, обращенная в текст, лишена этой информации, поэтому перевод затруднен. В такой ситуации оказываются переводчики, работающие с текстовыми субтитрами, не видя фильма. Они часто ошибаются. С машинным переводом та же история. Чтобы озвучить сериал, переведенный на русский, понадобится алгоритм генерации естественной речи по тексту — синтезатор. Их создают многие IT-компании, в том числе Microsoft, Amazon, Yandex, и получается у них неплохо.
По словам Андрея Фильченкова, пару лет назад минута озвучивания синтезатором речи занимала несколько часов, сейчас скорость обработки сильно выросла. Задача синтеза речи для некоторых областей, где требуются нейтральные диалоги, решается довольно хорошо. Многие уже принимают как данность разговор с роботом по телефону, выполнение команд автомобильного навигатора, диалог с Алисой в машине "Яндекс.Драйв". Но для озвучивания сериалов эти технологии пока недотягивают.
"Проблема в эмоциях и актерской игре. Мы научились делать машинный голос человеческим, но чтобы он еще звучал уместно контексту и вызывал доверие — до этого далеко. Плохой озвучкой легко убить восприятие фильма", — полагает Фильченков. По мнению Михаила Бурцева, синтез речи вполне реален. Однако это требует больших вычислительных ресурсов и не может выполняться в реальном времени за разумные деньги. "Существуют алгоритмы, которые синтезируют речь, похожую на голос конкретного актера. Это и тембр, и манера говорить, и многое другое. Так любой иностранный актер фактически заговорит по-русски", — прогнозирует Бурцев. Он ожидает заметный прогресс в ближайшие годы.
Сергей Аксенов дает пять-десять лет на развитие инструментов для перевода и озвучки сложных произведений с самых распространенных языков вроде английского. Ученый приводит в пример Skype, который несколько лет назад продемонстрировал возможность организации онлайн-уроков для школьников, говорящих на разных языках. Но даже тогда система не будет идеальной, ей постоянно придется учиться: набирать словарный запас, учитывать культурный контекст.
Источник
При использовании материалов с сайта активная ссылка на него обязательна
Отправить донат на поддержку проекта "Аномальные новости"
Меню
Архив материалов
Проекты наших читателей
Контакты исследователей
Подписка на новости
Проекты
Новости криптозоологии
Хроники природных катастроф
Новости
26.02.2002 - 05.07.2002
05.08.2002 - 23.10.2002 (562)
24.10.2002 - 17.01.2003 (585)
20.01.2003 - 07.04.2003 (709)
08.04.2003 - 01.08.2003 (709)
04.08.2003 - 18.11.2003 (763)
19.11.2003 - 31.03.2004 (721)
01.04.2004 - 13.08.2004 (825)
16.08.2004 - 22.11.2004 (782)
23.11.2004 - 28.03.2005 (756)
29.03.2005 - 29.07.2005 (807)
30.08.2005 - 02.12.2005 (927)
05.12.2005 - 21.04.2006 (912)
24.04.2006 - 23.10.2006 (999)
24.10.2006 - 03.05.2007 (999)
04.05.2007 - 28.01.2008 (999)
29.01.2008 - 12.01.2009 (999)
13.01.2009 - 07.07.2009 (966)
22.08.2009 - 21.01.2010 (996)
22.01.2010 - 22.06.2010 (1000)
23.06.2010 - 14.01.2011 (1042)
17.01.2011 - 31.05.2011 (1008)
01.06.2011 - 03.11.2011 (1003)
07.11.2011 - 16.03.2012 (996)
19.03.2012 - 09.06.2012 (1009)
13.06.2012 - 07.09.2012 (988)
10.09.2012 - 19.11.2012 (1004)
20.11.2012 - 14.01.2013 (1015)
15.01.2013 - 22.02.2013 (1000)
23.02.2013 - 08.04.2013 (991)
09.04.2013 - 31.05.2013 (1015)
01.06.2013 - 18.07.2013 (992)
19.07.2013 - 03.09.2013 (1014)
04.09.2013 - 20.10.2013 (1001)
21.10.2013 - 02.12.2013 (1001)
03.12.2013 - 18.01.2014 (997)
19.01.2014 - 07.03.2014 (994)
08.03.2014 - 24.04.2014 (1000)
25.04.2014 - 18.06.2014 (1005)
19.06.2014 - 15.08.2014 (1019)
16.08.2014 - 07.10.2014 (1006)
08.10.2014 - 16.11.2014 (995)
17.11.2014 - 25.12.2014 (1004)
26.12.2014 - 09.02.2015 (989)
10.02.2015 - 20.03.2015 (998)
21.03.2015 - 22.04.2015 (1001)
23.04.2015 - 29.05.2015 (997)
29.05.2015 - 30.06.2015 (995)
30.06.2015 - 29.07.2015 (990)
29.07.2015 - 26.08.2015 (998)
27.08.2015 - 24.09.2015 (988)
25.09.2015 - 22.10.2015 (991)
23.10.2015 - 18.11.2015 (1000)
18.11.2015 - 16.12.2015 (990)
17.12.2015 - 23.01.2016 (1000)
24.01.2016 - 25.02.2016 (1000)
26.02.2016 - 24.03.2016 (1000)
24.03.2016 - 16.04.2016 (990)
17.04.2016 - 19.05.2016 (999)
20.05.2016 - 22.06.2016 (993)
23.06.2016 - 01.08.2016 (995)
02.08.2016 - 12.09.2016 (990)
13.09.2016 - 25.10.2016 (989)
26.10.2016 - 05.12.2016 (995)
06.12.2016 - 15.01.2017 (995)
16.01.2017 - 23.02.2017 (990)
24.02.2017 - 03.04.2017 (994)
04.04.2017 - 18.05.2017 (1000)
19.05.2017 - 05.07.2017 (1000)
06.07.2017 - 24.08.2017 (1000)
25.08.2017 - 06.10.2017 (991)
07.10.2017 - 15.11.2017 (990)
16.11.2017 - 24.12.2017 (1000)
25.12.2017 - 04.02.2018 (990)
05.02.2018 - 17.03.2018 (1000)
18.03.2018 - 02.05.2018 (990)
03.05.2018 - 11.06.2018 (1000)
12.06.2018 - 18.07.2018 (990)
19.07.2018 - 24.08.2018 (1000)
25.08.2018 - 02.10.2018 (1000)
03.10.2018 - 07.11.2018 (990)
08.11.2018 - 13.12.2018 (990)
14.12.2018 - 23.01.2019 (1000)
24.01.2019 - 02.03.2019 (1000)
03.03.2019 - 12.04.2019 (1010)
13.04.2019 - 23.05.2019 (990)
24.05.2019 - 03.07.2019 (1000)
04.07.2019 - 11.08.2019 (1000)
12.08.2019 - 16.09.2019 (990)
17.09.2019 - 26.10.2019 (1000)
27.10.2019 - 12.12.2019 (1000)
13.12.2019 - 25.01.2020 (1000)
26.01.2020 - 06.03.2020 (990)
07.03.2020 - 16.04.2020 (1010)
17.04.2020 - 19.05.2020 (1000)
20.05.2020 - 25.06.2020 (990)
26.06.2020 - 04.08.2020 (995)
05.08.2020 - 16.09.2020 (1005)
17.09.2020 - 26.10.2020 (990)
27.10.2020 - 27.11.2020 (990)
28.11.2020 - 07.01.2021 (990)
08.01.2021 - 15.02.2021 (1000)
16.02.2021 - 31.03.2021 (1000)
01.04.2021 - 12.05.2021 (1000)
13.05.2021 - 14.06.2021 (990)
15.06.2021 - 26.07.2021 (980)
27.07.2021 - 31.08.2021 (990)
01.09.2021 - 07.10.2021 (1000)
08.09.2021 - 07.11.2021 (1000)
08.11.2021 - 10.12.2021 (1000)
11.12.2021 - 24.01.2022 (990)
25.01.2022 - 04.03.2022 (1000)
05.03.2022 - 10.04.2022 (990)
11.04.2022 - 17.05.2022 (1000)
18.05.2022 - 23.06.2022 (980)
24.06.2022 - 31.07.2022 (990)
01.08.2022 - 13.09.2022 (990)
14.09.2022 - 21.10.2022 (990)
22.10.2022 - 29.11.2022 (1000)
30.11.2022 - 22.01.2023 (1000)
23.01.2023 - 02.03.2023 (990)
03.03.2023 - 21.04.2023 (1000)
22.04.2023 - 13.06.2023 (990)
14.06.2023 - 02.08.2023 (1000)
03.08.2023 - 21.09.2023 (1000)
22.09.2023 - 06.11.2023 (990)
07.11.2023 - 24.12.2023 (990)
25.12.2023 - 18.02.2024 (1000)
19.02.2024 - 05.04.2024 (990)
06.04.2024 - 25.05.2024 (1000)
26.05.2024 - 26.07.2024 (1000)
26.07.2024 - 25.08.2024 (990)
26.08.2024 - 28.09.2024 (980)
29.09.2024 - 01.11.2024 (1000)
02.11.2024 - 02.12.2024 (980)
03.12.2024 - 08.01.2025 (990)
09.01.2025 - 09.02.2025 (1000)
10.02.2025 - 20.03.2025 (1000)
21.03.2025 - 03.05.2025 (990)
04.05.2025 - ...
Статьи
Статьи: раздел 1 (1024)
Статьи: раздел 2 (1006)
Статьи: раздел 3 (1000)
Статьи: раздел 4 (1044)
Статьи: раздел 5 (1001)
Статьи: раздел 6 (1000)
Статьи: раздел 7 (1000)
Статьи: раздел 8 (1013)
Статьи: раздел 9 (1000)
Статьи: раздел 10 (1000)
Статьи: раздел 11 (329)
Статьи: раздел 12 (1000)
Статьи: раздел 13 (730)
Лента новостей

Аномальные воздушные феномены в Аргентине

Астронавт МКС заснял неопознанный объект

В обломках НЛО нашли четыре вида инопланетян

Возможность миграции жизни с Марса на Землю

Воспроизвели механизм гибели нашей Вселенной

Вторая сфера обнаружена в джунглях Колумбии

Древние каменные горшки Лаоса оказались склепами

Из обломков НЛО извлекли четыре вида инопланетян

Конгресс переключают свое внимание на подрядчиков

Конспирология встречается с реальными новостями

Людьми манипулируют инопланетяне

Мегалитическая гробница переписывает историю

НЛО превосходят американский арсенал

Пост Трампа в социальных сетях стал вирусным

Рассекретили материалы об аномальных объектах

Рассекреченные правительственные документы об НЛО

Создают искусственный мозг из живых клеток

Сообщения о наблюдениях НЛО в регионе Лоукантри

Учёный ЦРУ раскрывает конкретные виды инопланетян

Что мы узнали из первой НЛО-публикации Пентагона

Вера в НЛО не является религией в традиционном смысле

Демоны мучили меня невообразимыми способами

Зомби, призраки и НЛО захватили Западную Вирджинию

Как будет выглядеть первый контакт

Картина того, чего на самом деле хотят инопланетяне

Моё пребывание в самом демоническом доме США

Мужчина арестован за звонок по поводу зомби

О полупрозрачных существах расскажут в июне

Они помнят каждый миг своей жизни

Пирамиды были гравитационными передатчиками

Раскрыт главный инопланетный секрет США

Рептилоиды, серые и нордики

Сайт Пентагона зафиксировал более 1 млрд посещений

Самые мрачные демонические видения

Старый снимок вновь взбудоражил мир уфологии

Тайна корабля-призрака Мэри Селест разгадана

Трамп вызвал хаос, опубликовав фото инопланетянина

Уфолог Климов рассказал о фото инсектоида

Феномен НЛО - дело рук дьявола

Фото с Аполлона не должны были публиковать

Британская Зона 51 хранит секреты инопланетян

Восьмиконечный НЛО был ангелом с крыльями

ИИ-помощник устроил настоящий кошмар

История Вселенной может быть переписана

Кракены эпохи динозавров

Мифы о полой Земле и нацистских НЛО

НЛО на Луне поддаются объяснению

НЛО нацелены на ядерные объекты

НЛО призваны раскрыть наши скрытые силы

Обнаружены минимум четыре инопланетных вида

От богомолов до рептилоидов

Пришельцы на крыше школы в Анлаби

Психоз, вызванный ИИ

Раскрыты секретные файлы Базза Олдрина об НЛО

Сын президента Байдена высказался о НЛО

Тайна скрытого храма под Сфинксом

Трамп публикует загадочные изображения

Тысячи подводных НЛО роятся вдоль побережья США

Ужасающие послания из космоса

Файлы об НЛО являются спусковым механизмом

Австрийский космонавт хотел бы увидеть инопланетян

Военным известно о четырех видах инопланетян

Документы об НЛО опубликованы в сети

Загадочный НЛО замечен над Ормузским проливом

Инопланетяне в земном обличье

Инопланетяне совершенней нас

Конгрессмен требует от частного подрядчика записи НЛО

Летчик раскрыл тайну рассекреченных файлов США об НЛО

Маск, очевидно, мы живем в симуляции

Новые механизмы торможения миграции планет

Обама отвергает теории заговора об НЛО

Полная история Кыштымского карлика Алешеньки

Правда об НЛО над Донкастером

Самые громкие сенсации из архивов ФБР по НЛО

Странные наблюдения в небе Джорджии

Странные наблюдения в небе Мэриленда

США обнаружили останки различных инопланетных видов

Телеканал пригласил уролога вместо уфолога

Христианские лидеры призывают к осторожности

Я остановилась в отеле из фильма Сияние

Аппараты ультразвуковой терапии помогают спортсменам быстрее восстанавливаться после интенсивных нагрузок

Астронавты напуганы таинственными НЛО

Бигфут пробирается через лес, оставляя свидетелей в ужасе

Великая пирамида Египта - планетарный маяк

Военный видел мифического зверя в Огайо

Восемь леденящих душу видеозаписей об НЛО

Встреча криптозоолога с девятифутовыми чудовищами

Данные Трампа о неопознанных аномальных явлениях

Женщину поцарапал демонический дух ребенка

Загадочные яркие огни и шары

Инопланетяне считают нас низшей формой жизни

Информация об НЛО от частного подрядчика

Конгресс заблокировал доступ к НЛО

Конспирологи не довольны данными об НЛО

Наблюдения НЛО вызвали череду загадочных смертей

Найдены отпечатки огромных лап бигфута

Новый фильм об НЛО вызвал бурную реакцию

Отец пропавшей ученой обвиняет ЦРУ

Очевидец видел инопланетян в скафандрах

Пасторы показали изображения полупрозрачных существ

Проповедникам рекомендовано подготовиться к НЛО

Разбитая машина пропавшего ученого

Ромбовидный НЛО был снят американскими военными

Самые громкие сенсации в файлах ФБР об НЛО

Сообщения о наблюдениях инопланетян вызывают сомнения

Тайная правительственная группа скрывала правду

У живого Нострадамуса есть предсказание

У нацистов была секретная программа создания НЛО

Ужасающие предсказания Нострадамуса на 2026 год

ФБР расследует случаи смерти и исчезновения ученых

ЦРУ пытало подопытных в рамках программы контроля сознания

Абсолютные доказательства существования инопланетян

Биоразнообразие и связь со снежным человеком

Британский советник предлагает создать комитет по НЛО

Версии вас из параллельных миров управляют вашей жизнью

Видео Пентагона с НЛО выглядят ужасно

Две пугающие новые реальности для США

Единая теория всего на свете

Ежегодный уфо-фестиваль в Макминнвилле

Есть ли там кто-нибудь

Информация о наблюдении НЛО в Абилине

Когда наступит конец Вселенной

Мой инопланетный ужас на ранчо Зона 51

НЛО могут быть падшими ангелами, а не инопланетянами

Опасения по поводу безопасности аэропортов из-за НЛО

Опасения политика по поводу НЛО

Открытие экзопланет меняет представления о космосе

Охотящийся на оленей бигфут замечен в Луизиане

Потрясающая фотография прозрачного инопланетянина

Пугающее послание инопланетян человечеству

Сверхсекретный самолет был замечен вблизи Зоны 51

Секретная операция ЦРУ по поиску НЛО

Спусковой крючок для пробуждения человечества

Странные наблюдения в небе Вирджинии

Странные наблюдения в небе Коннектикута

Странные наблюдения в небе Массачусетса

Тайная программа по распылению химикатов над США

Тысячи таинственных подводных НЛО у берегов США

Шпион-экстрасенс ЦРУ сделал предупреждение

Экс-баскетболист раскритиковал публикацию файлов об НЛО

Элиты исследовали дистанционное управление человеком

Археологи сделали настоящее открытие в Петре

Есть ли в архиве НЛО сенсация

Зеленые человечки и другие дела

Инопланетян нужно искать по химическому рисунку

Легендарное сокровище на Оук-Айленд

НЛО могут изменить сознание человечества

Певец предложил показать миру инопланетянина

Пилот выносит вердикт по поводу наблюдений НЛО

Пустыню обыскали в поисках древних линий Наска

Сверхлюди - это мы из будущего

Странное зрелище, которые видели астронавты

Странный объект над Казахстаном

США неспособны скрыть даже НЛО

США отыграло сценарий ядерного взрыва на орбите

Украинский военный дрон снял видео с НЛО

Файлы об НЛО не дают ответов, но что-то происходит

ФБР описало возможных пилотов НЛО

Чиновник поделился фантастическими кадрами НЛО

Что жду инопланетяне

Что на самом деле содержится в секретных материалах

Базирующееся в Оклахоме уфо-бюро

Венера - погибшая копия Земли

Видеозаписи, которые правительство не хочет показывать

Восьмиконечный корабль - библейский Ангел

До 60 % паролей взламываются менее чем за час

Живая сфера преследовала людей на озере

Кампания прозрачности Трампа

Кому понадобилось убирать элитных ученых

Конспирология выглядит более распространенной

Наш мозг не пустой при рождении

Полет вертолета с подозрительным шаром

Политтехнолог утверждает, что НЛО - попытка отвлечения

Стивен Кинг высказался о файлах про НЛО

Файлы об НЛО, опубликованные правительством США

Файлы Пентагона могут раскрыть секретные технологии

Фестиваль НЛО в Макминнвилле

Фотограф снял спрайт-медузу

Что содержится в новых американских файлах об НЛО

Ядерное оружие использовали для привлечения НЛО

Япония анализирует серию файлов об НЛО

Веб-сайт Пентагона об НЛО бьёт рекорды

Встречи с НЛО настораживают пилотов

За активностью НЛО стоят демонические силы

Загадочные наблюдения на Ближнем Востоке

Информация о наблюдении НЛО в Абилине

Наверх
Яндекс.Метрика