Мозговой имплантат на лету превратил мысли в речь
|
|
Спустя почти два десятилетия после перенесенного в возрасте 30 лет инсульта, в результате которого она потеряла способность говорить, женщина из США вновь обрела способность облекать свои мысли в слова в режиме реального времени благодаря новому интерфейсу мозг-компьютер (BCI).
|
|
Благодаря анализу активности ее мозга с интервалом в 80 миллисекунд и преобразованию полученных данных в синтезированную версию ее голоса, инновационный метод, разработанный американскими исследователями, устранил досадную задержку, которая была характерна для предыдущих версий технологии.
|
|
Способность нашего тела воспроизводить звуки в том виде, в каком мы их воспринимаем, - это функция, которую мы часто воспринимаем как должное. Только в те редкие моменты, когда мы вынуждены прерывать работу переводчика или слышим свою речь с задержкой в динамике, мы по достоинству оцениваем скорость, с которой работает наша собственная анатомия.
|
|
Для людей, у которых речевые центры мозга утратили способность формировать звуки, будь то из-за таких заболеваний, как боковой амиотрофический склероз или поражения важных отделов нервной системы, мозговые имплантаты в сочетании со специализированным программным обеспечением обещают новую жизнь.
|
|
|
|
В последнее время в ряде проектов BCI по переводу речи произошли грандиозные прорывы, каждый из которых направлен на сокращение времени, затрачиваемого на создание речи из мыслей.
|
|
Большинство существующих методов требуют изучения полного фрагмента текста, прежде чем программное обеспечение сможет расшифровать его значение, что может значительно растянуть время между началом речи и ее озвучиванием.
|
|
Это не только неестественно, но и может вызвать разочарование и дискомфорт у пользователей системы.
|
|
"Увеличение задержки синтеза речи и скорости декодирования имеет важное значение для динамичного разговора и свободного общения", - пишут исследователи из Калифорнийского университета в Беркли и Сан-Франциско в своем опубликованном отчете.
|
|
Это "усугубляется тем фактом, что синтез речи требует дополнительного времени для воспроизведения, а также для понимания пользователем и слушателем синтезированного звука", - объясняет команда, возглавляемая инженером-вычислителем из Калифорнийского университета в Беркли Кайло Литтлджоном.
|
|
Более того, большинство существующих методов основаны на том, что "говорящий" обучает интерфейс, открыто произнося слова. Для тех, кто не практикуется или всегда испытывал трудности с речью, предоставление достаточного количества данных в программное обеспечение для декодирования может оказаться сложной задачей.
|
|
Чтобы преодолеть оба этих препятствия, исследователи натренировали гибкую нейронную сеть с глубоким обучением на сенсомоторной активности коры головного мозга 47-летней участницы, в то время как она молча "произносила" 100 уникальных предложений из словарного запаса, насчитывающего чуть более 1000 слов.
|
|
Литтлджон и его коллеги также использовали вспомогательную форму общения, основанную на 50 фразах с использованием меньшего набора слов.
|
|
В отличие от предыдущих методов, в этом процессе участница не пыталась произносить слова вслух – она просто мысленно продумывала предложения.
|
|
Система расшифровала оба метода коммуникации на высоком уровне: среднее количество слов, переводимых в минуту, почти вдвое превысило показатели предыдущих методов.
|
|
Важно отметить, что использование метода прогнозирования, который мог непрерывно интерпретироваться на лету, позволило речи участницы звучать гораздо более естественно и в 8 раз быстрее, чем при использовании других методов. Это даже звучало как ее собственный голос, благодаря программе синтеза голоса, основанной на предыдущих записях ее речи.
|
|
Запустив процесс в автономном режиме без ограничений по времени, команда продемонстрировала, что их стратегия может даже интерпретировать нейронные сигналы, представляющие слова, на которых они не были специально обучены.
|
|
Авторы отмечают, что еще многое предстоит усовершенствовать, прежде чем метод можно будет считать клинически жизнеспособным. Хотя речь была разборчивой, она значительно уступала методам расшифровки текста.
|
|
Однако, учитывая, как далеко продвинулись технологии всего за несколько лет, есть основания для оптимизма в отношении того, что те, у кого нет права голоса, вскоре смогут восхвалять исследователей и их устройства для чтения мыслей.
|
|
Источник
|