O проекте Мобильная версия Реклама Статьи партнеров PR Crypto E-bike
Xiaomi Apple Samsung Google Huawei Oppo Vivo Realme Microsoft AnTuTu
iLenta

Meta создала генеративную модель Voicebox для преобразования текста в речь

17 июня 2023, 12:08 | Roter [743]
Компания Meta представила генеративную модель под названием Voicebox, которая преобразует текст в речь.
Meta создала генеративную модель Voicebox для преобразования текста в речь

Разработчики утверждают, что эта модель сделает для устной речи то же самое, что ChatGPT и DALL-E сделали для текста и изображений.

Аналогично генеративным системам для текста и изображений, Voicebox способен создавать новые данные, изменять стили и модифицировать предоставленные образцы. Для тренировки системы было использовано 50 000 часов записей речи и стенограмм аудиокниг на английском, французском, испанском, немецком, польском и португальском языках. Эти материалы находятся в общественном достоянии.

Благодаря Voicebox можно редактировать аудиоклипы, удалять шумы и исправлять неправильно произнесенные слова. Кроме того, модель может воспроизводить речь, основываясь на двухсекундном фрагменте, переносить стиль речи между различными языками и создавать разнообразные синтетические наборы данных.

Meta не публикует исходный код модели, ссылаясь на потенциальные риски неправильного использования. В то же время разработчики отмечают множество интересных вариантов применения генеративных речевых моделей.

Теги: Meta

Источник: facebook

YouTube Telegram
Комментарии

ОБЗОРЫ

НОВОСТИ И СОБЫТИЯ

УСТРОЙСТВА И АКСЕССУАРЫ

ИНСТРУКЦИИ, СОВЕТЫ И СЕКРЕТЫ

КРИПТОВАЛЮТЫ

Ads
Safe Life
Ads
Ads
https://ilenta.com/ps/products/chokhli-dlya-iphone-optom-vid-nadiinogo-postachalnika.html https://ilenta.com/ps/products/products_7008.html https://ilenta.com/ps/programs/programs_7399.html