Добавить новость
123ru.net
D3.ru
Январь
2023

ИИ–программа Microsoft может клонировать ваш голос по 3–секундному аудиофрагменту

0
D3.ru 

https://www.pcmag.com/news/microsofts-ai-program-can-clone-your-voice-from-a-3-second-audio-clip

Новая разработка компании Microsoft в области искусственного интеллекта может клонировать ваш голос, услышав вашу речь всего за 3 секунды.

Программа под названием VALL–E была разработана для синтеза текста в речь. Команда исследователей из Microsoft создала ее, заставив систему прослушать 60 000 часов аудиокниг на английском языке от более чем 7 000 различных дикторов в попытке заставить ее воспроизвести человеческую речь. Эта выборка в сотни раз больше, чем те, на основе которых были созданы другие программы преобразования текста в речь.

Команда Microsoft опубликовала веб–сайт, на котором представлены несколько демонстрационных роликов VALL–E в действии. Как вы можете услышать, программа искусственного интеллекта может не только клонировать чей–то голос, используя 3–секундный аудиоклип, но и манипулировать голосом, чтобы он произнес все, что пожелает. Кроме того, программа может воспроизводить эмоции в голосе человека или настраиваться на различные стили речи.

В клонировании голоса нет ничего нового. Но подход Microsoft отличается тем, что позволяет легко воспроизвести голос любого человека, используя лишь короткий фрагмент аудиоданных. Следовательно, нетрудно представить, что эта же технология может послужить топливом для киберпреступности, которую команда Microsoft признает потенциальной угрозой.

"Поскольку VALL–E может синтезировать речь, сохраняя идентичность диктора, это может нести потенциальный риск неправильного использования модели, например, подмены идентификации голоса или выдачи себя за конкретного диктора", — пишут исследователи в своей статье. При этом команда отмечает, что возможно создание программ, способных "различать то, что был ли аудиоклип синтезирован в VALL–E".

VALL–E интерпретирует аудио речь как "дискретные лексемы", а затем воспроизводит лексему для произнесения различного текста. "VALL–E генерирует соответствующие акустические лексемы, обусловленные акустическими лексемами 3–секундной записи", — пишут исследователи. "Наконец, сгенерированные акустические маркеры используются для синтеза конечной формы волны с помощью соответствующего декодера нейронного кодека".

Однако технология далека от совершенства. В своей исследовательской работе команда Microsoft отмечает, что VALL–E иногда может с трудом или неудачно произносить некоторые слова. В других случаях слова могут звучать невнятно, искусственно синтезировано, роботизировано или просто не в той тональности.

"Даже если мы используем 60 тысяч часов данных для обучения, это все равно не может охватить голос каждого человека, особенно говорящего с акцентом", — добавила команда. "Более того, разнообразия стилей речи недостаточно, поскольку LibriLight (аудиозапись, на которой обучался VALL–E) — это набор данных аудиокниг, в которых большинство высказываний написано в стиле чтения".

Тем не менее, исследование предполагает, что создание еще более точной программы клонирования голоса достижимо, если ее обучить на еще большем количестве аудиоклипов. Тем временем, похоже, что Microsoft не выпустила VALL–E в открытый доступ, вероятно, для защиты от неправильного использования.

Написал zlax на windows.d3.ru / комментировать






Загрузка...


Губернаторы России
Москва

Собянин: Речные вокзалы Москвы стали центрами притяжения горожан и туристов


Спорт в России и мире
Москва

Организатор концертов Ратников: рэпер Уэст не выступит в «Лужниках» в Москве


Загрузка...

Все новости спорта сегодня


Новости тенниса
Уимблдон

Касаткина и Шнайдер блеснули на траве перед Уимблдоном. Идеальный день для российского тенниса


Загрузка...


123ru.net – это самые свежие новости из регионов и со всего мира в прямом эфире 24 часа в сутки 7 дней в неделю на всех языках мира без цензуры и предвзятости редактора. Не новости делают нас, а мы – делаем новости. Наши новости опубликованы живыми людьми в формате онлайн. Вы всегда можете добавить свои новости сиюминутно – здесь и прочитать их тут же и – сейчас в России, в Украине и в мире по темам в режиме 24/7 ежесекундно. А теперь ещё - регионы, Крым, Москва и Россия.


Загрузка...

Загрузка...

Экология в России и мире
Москва

Синоптик Леус: на Москву надвигается жара до +34 градусов





Путин в России и мире
Москва

Песков: подаренные Ким Чен Ыном Путину собаки проходят адаптацию в Москве


Лукашенко в Беларуси и мире
Минск

Лукашенко обратился к лидеру Туркменистана




123ru.netмеждународная интерактивная информационная сеть (ежеминутные новости с ежедневным интелектуальным архивом). Только у нас — все главные новости дня без политической цензуры. "123 Новости" — абсолютно все точки зрения, трезвая аналитика, цивилизованные споры и обсуждения без взаимных обвинений и оскорблений. Помните, что не у всех точка зрения совпадает с Вашей. Уважайте мнение других, даже если Вы отстаиваете свой взгляд и свою позицию. Smi24.net — облегчённая версия старейшего обозревателя новостей 123ru.net.

Мы не навязываем Вам своё видение, мы даём Вам объективный срез событий дня без цензуры и без купюр. Новости, какие они есть — онлайн (с поминутным архивом по всем городам и регионам России, Украины, Белоруссии и Абхазии).

123ru.net — живые новости в прямом эфире!

В любую минуту Вы можете добавить свою новость мгновенно — здесь.





Зеленский в Украине и мире
Киев

Нариман Джелял переехал из сибирской тюрьмы в Киев


Навальный в России и мире


Здоровье в России и мире


Частные объявления в Вашем городе, в Вашем регионе и в России






Загрузка...

Загрузка...



Певец

Певец Алекс Анохин стал участником III Всероссийской музыкальной ассамблеи



Москва

Super.ru: Канье Уэста заметили рядом с отелем «Националь» в центре Москвы

Друзья 123ru.net


Информационные партнёры 123ru.net



Спонсоры 123ru.net