Китайские разработчики научили ИИ говорить человеческим голосом

21.12.2018

0 Время чтения: 1 минута

Специалисты китайской лаборатории Baidu Research, принадлежащей крупнейшему поисковому гиганту Поднебесной, создали алгоритм ИИ Deep Voice, способный преобразовывать текст в речь.

Подобные проекты, существовавшие до этого, сталкивались с проблемой скорости синтеза звука, поэтому для генерации голоса предшественникам Deep Vice требовалось от нескольких минут до пары часов, чтобы корректно и максимально натуралистично воспроизвести текст человеческим голосом. Новая разработка китайских учёных основана на нейронных сетях и способна преобразовывать текст в голос в реальном времени.

Deep Voice умеет имитировать тембр, интонацию голоса и акцент, делая их очень правдоподобными и почти неотличимыми от настоящих, при этом голос может быть мужским или женским. Разработчики уверены, что их технологию можно использовать в качестве цифровых помощников, применять для записи голосов в идеоиграх или же вовсе использовать для синхронного перевода фильмов по субтитрам.

«Это настоящий прорыв с технической точки зрения, ведь мы смогли решить сложнейшую проблему, синтезировав живую речь со всеми ее особенностями», — говорит Лео Зу, один из авторов проекта.

Создатели алгоритма пояснили, что проект Deep Voice вдохновлён аналогичными разработками, вот только все его компоненты работают под управлением нейронной сети, при этом используя в работе довольно простые функции, что делает их алгоритм весьма адаптивным — голоса можно подстроить «под себя», наделив систему новыми акцентами и другими особенностями.

«Глубокое обучение привело к революции в различных областях, таких как компьютерное зрение и распознавание речи, а сейчас настало время и голосового синтеза. Мы рады, что смогли добиться таких результатов, и будем работать дальше, чтобы сделать систему «текст-голос» ещё более реалистичной», — приводит Motherboard цитату разработчиков.

Настоящее и будущее Искусственного Интеллекта [Новости науки и технологий]

Теги

21.12.2018

0 Время чтения: 1 минута

Китайские разработчики научили ИИ говорить человеческим голосом

Настоящее и будущее Искусственного Интеллекта [Новости науки и технологий]

Добавить комментарий Отменить ответ

В Южной Корее создали заряжающийся за 30 секунд аккумулятор

Средний возраст: чего добилась Microsoft за 40 лет

Обзор обзоров: Nexus 5X

НАСА провело предварительный отбор четырех новых научных миссий для программы «Исследователи»

Все домашние лошади произошли от одной прикаспийской популяции

Обзор смарт-часов U Watch U8: бюджетный компаньон

Обзор смартфона Huawei Ascend G7: «середнячок» с экстерьером

Как найти дешёвые билеты на самолёт и сэкономить на путешествиях

Автоматизация мобильной торговли как способ повышения продаж и конкурентоспособности

Принципы работы и преимущества двухфакторной аутентификации с использованием одноразовых паролей

Обзор автомобиля Нива Шевроле — особенности и преимущества модели

Телефото. Обзор Android-камеры Samsung Galaxy S4 Zoom

Обзор смартфона Microsoft Lumia 640: яркий «обновленец»

Настоящее и будущее Искусственного Интеллекта [Новости науки и технологий]

Похожие статьи

Заложен фундамент самого большого оптического телескопа в мире

Зачем нужны четвероногие роботы? Пример ANYmal дает ответ на этот вопрос

В Южной Корее создали заряжающийся за 30 секунд аккумулятор

В Великобритании тестируют ИИ, который вычислит преступника до нарушения закона

Ученые ведут разработку ИИ для управления космической колонией

Ученые нашли способ, как обуздать энергию термоядерного синтеза

Добавить комментарий Отменить ответ

Как найти дешёвые билеты на самолёт и сэкономить на путешествиях

Автоматизация мобильной торговли как способ повышения продаж и конкурентоспособности

Принципы работы и преимущества двухфакторной аутентификации с использованием одноразовых паролей

Обзор автомобиля Нива Шевроле — особенности и преимущества модели

Телефото. Обзор Android-камеры Samsung Galaxy S4 Zoom

Обзор смартфона Microsoft Lumia 640: яркий «обновленец»