Инженеры научили ИИ говорить человеческим голосом
Инженеры и программисты из пекинской компании Baidu создали специальную систему, которая работает на искусственном интеллекте. Уникальна она тем, что может говорить человеческим голосом, копируя с точностью все его характеристики.
Новая технология называется Deep. Она способна самообучаться при помощи нейросетей. То есть программа изучает различные аудиозаписи с человеческой речью. Она настолько уникальна, что может даже обмануть систему распознавания голоса, изучив всего 10 пятисекундных записей с ним.
Deep Voice может имитировать тембр голоса и интонации. Это делает воспроизводимые звуки очень реалистичными. Применить данную технологию можно во всех видах современной электронной техники. Это и персональные цифровые помощники, и сервисы синхронного перевода, озвучка аудиокниг, фильмов, игр и так далее. Но самое важное, что Deep Voice сможет облегчить жизнь тем, кто потерял возможность говорить. Также одинокие люди могут пообщаться со своими родными, которых они когда-то потеряли или временно не могут с ними связаться.
Автор разработки Лео Зу заявил, что DeepVoice – это просто прорыв. Инженерам и программистам удалось сделать то, что ещё никому не удавалось, то есть синтезировать живую речь со всеми акцентами, интонациями и произношениями.
В мире уже несколько компаний предпринимали попытки сделать похожую на Deep Voice систему. Это и корпорация Google, и канадская компания Lyrebird. Последняя уже успешно применяется в озвучке мультимедиа, в работе помощников и в синтезе речи для немых людей.
