iLenta Меню

Microsoft навчила нейромережі підробляти голос за 3 секунди

10 січня 2023, 20:08 | Roter [577]
Група дослідників із Microsoft презентувала нову модель для синтезу мови на основі нейромережевих алгоритмів. Вона отримала назву VALL-E.
Microsoft навчила нейромережі підробляти голос за 3 секунди

Головна фішка VALL-E — копіювання голосу людини. Щоб навчитися копіювати голос, нейромережі потрібно його запис тривалістю всього три секунди.

Крім збереження вокального тембру та емоцій, VALL-E може імітувати «акустичне оточення» — наприклад, ніби мова звучить як при телефонному дзвінку.

Технологія заснована на алгоритмі EnCodec і навчена на 60 000 годинах англомовної мови від більш ніж 7000 носіїв.

На спеціальному сайті Microsoft надає кілька десятків прикладів роботи VALL-E. У колонці Speaker Prompt представлено оригінальний трисекундний запис голосу, у колонці Ground Truth — повне прочитання заданої фрази для порівняння. Колонка Baseline показує результат роботи стандартної технології синтезу промови. Зрештою, у колонці VALL-E представлено результат роботи нової технології Microsoft.

Дослідники уточнюють, що розуміють ризики технології — зловмисники можуть скористатися нею, щоб видати себе за іншу людину. Тому фахівці пропонують створити алгоритм, який визначає, що аудіозапис створено за допомогою VALL-E.

Проте цю нейромережу можна використовувати в кіно, наприклад, для озвучення акторів, яких немає в живих. Також можна «воскресати» голоси виконавців, щоби випускати нові пісні за їх участю. Ще VALL-E став би чудовим інструментом для дикторів та тих, хто озвучує аудіокниги.

Microsoft не випустила нейромережу у відкритий доступ. Зараз це напрацювання залишається всередині компанії. Компанія не уточнила, як її використовуватимуть надалі. Також неясно, навіщо взагалі було створювати цей AI-алгоритм. Поки що VALL-E працює тільки з англійською мовою.

Джерело: Microsoft

© 2012-2025 iLenta. Всі права захищені.
Повна версія

Компанії

TSMC пояснила інвестиції в США тиском влади
TSMC пояснила інвестиції в США тиском влади
18 листопада 2025, 17:07 | Roter
Компанія побоювалася підтримки Intel американським урядом.
Докладніше...
 
Засновник Amazon Джефф Безос став співголовою ШІ-стартапу
Засновник Amazon Джефф Безос став співголовою ШІ-стартапу
18 листопада 2025, 12:08 | Bazelas
Засновник Amazon Джефф Безос знову активно повертається у бізнес, ставши співголовою нового стартапу у сфері штучного інтелекту під назвою Project Prometheus.
Докладніше...
 
Ще один дизайнер покидає Apple
Ще один дизайнер покидає Apple
18 листопада 2025, 11:07 | Bazelas
Дизайнер, який представив iPhone Air на вересневому заході Apple, покинув компанію, повідомляє Bloomberg.
Докладніше...
 
Джефф Вільямс завершив роботу в Apple після більш ніж 25 років служби
Джефф Вільямс завершив роботу в Apple після більш ніж 25 років служби
16 листопада 2025, 23:08 | Bazelas
Як зазначає Марк Гурман із Bloomberg, у п'ятницю Apple прибрала Вільямса зі сторінки керівництва — цей день став для нього останнім у компанії.
Докладніше...
 
Суд ухвалив, що Apple порушує патенти Masimo і має сплатити штраф
Суд ухвалив, що Apple порушує патенти Masimo і має сплатити штраф
16 листопада 2025, 20:07 | Roter
Багаторічний позов ще не завершився — Apple планує подавати апеляцію.
Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2025 iLenta. All rights reserved.