iLenta Меню

Microsoft навчила нейромережі підробляти голос за 3 секунди

10 січня 2023, 20:08 | Roter [571]
Група дослідників із Microsoft презентувала нову модель для синтезу мови на основі нейромережевих алгоритмів. Вона отримала назву VALL-E.
Microsoft навчила нейромережі підробляти голос за 3 секунди

Головна фішка VALL-E — копіювання голосу людини. Щоб навчитися копіювати голос, нейромережі потрібно його запис тривалістю всього три секунди.

Крім збереження вокального тембру та емоцій, VALL-E може імітувати «акустичне оточення» — наприклад, ніби мова звучить як при телефонному дзвінку.

Технологія заснована на алгоритмі EnCodec і навчена на 60 000 годинах англомовної мови від більш ніж 7000 носіїв.

На спеціальному сайті Microsoft надає кілька десятків прикладів роботи VALL-E. У колонці Speaker Prompt представлено оригінальний трисекундний запис голосу, у колонці Ground Truth — повне прочитання заданої фрази для порівняння. Колонка Baseline показує результат роботи стандартної технології синтезу промови. Зрештою, у колонці VALL-E представлено результат роботи нової технології Microsoft.

Дослідники уточнюють, що розуміють ризики технології — зловмисники можуть скористатися нею, щоб видати себе за іншу людину. Тому фахівці пропонують створити алгоритм, який визначає, що аудіозапис створено за допомогою VALL-E.

Проте цю нейромережу можна використовувати в кіно, наприклад, для озвучення акторів, яких немає в живих. Також можна «воскресати» голоси виконавців, щоби випускати нові пісні за їх участю. Ще VALL-E став би чудовим інструментом для дикторів та тих, хто озвучує аудіокниги.

Microsoft не випустила нейромережу у відкритий доступ. Зараз це напрацювання залишається всередині компанії. Компанія не уточнила, як її використовуватимуть надалі. Також неясно, навіщо взагалі було створювати цей AI-алгоритм. Поки що VALL-E працює тільки з англійською мовою.

Джерело: Microsoft

© 2012-2025 iLenta. Всі права захищені.
Повна версія

Компанії

Samsung допоможе OpenAI формувати майбутнє штучного інтелекту
Samsung допоможе OpenAI формувати майбутнє штучного інтелекту
03 жовтня 2025, 19:07 | Roter
Samsung збирається зіграти ключову роль у тому, як OpenAI формуватиме майбутнє штучного інтелекту.
Докладніше...
 
Samsung захистить смартфони від підглядання
Samsung захистить смартфони від підглядання
03 жовтня 2025, 16:07 | Roter
Ви, мабуть, зустрічали захисні плівки для екранів, які обмежують кути огляду: зображення добре видно лише власнику пристрою, а люди збоку не можуть підглянути.
Докладніше...
 
Великобританія знову вимагає від Apple доступу до зашифрованих даних iCloud
Великобританія знову вимагає від Apple доступу до зашифрованих даних iCloud
02 жовтня 2025, 21:07 | Roter
Про це повідомляє Financial Times із посиланням на новий секретний наказ Home Office.
Докладніше...
 
Samsung запустила виробництво екранів для смартфона iPhone Fold
Samsung запустила виробництво екранів для смартфона iPhone Fold
01 жовтня 2025, 18:08 | Roter
Якщо чутки підтвердяться, наступного року Apple може представити свій перший складаний смартфон — iPhone Fold.
Докладніше...
 
Sony святкує 30-річчя випуском колекційного артбуку
Sony святкує 30-річчя випуском колекційного артбуку
30 вересня 2025, 23:07 | Bazelas
До 30-річчя бренду Sony випускає колекційний артбук PlayStation The First 30 Years.
Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2025 iLenta. All rights reserved.