iLenta Меню

Meta створила генеративну модель Voicebox для перетворення тексту на мову

17 червня 2023, 12:08 | Roter [280]
Компанія Meta представила генеративну модель під назвою Voicebox, яка перетворює текст на мовлення.
Meta створила генеративну модель Voicebox для перетворення тексту на мову

Розробники стверджують, що ця модель зробить для усного мовлення те саме, що ChatGPT та DALL-E зробили для тексту та зображень.

Аналогічно генеративним системам для тексту та зображень, Voicebox здатний створювати нові дані, змінювати стилі та модифікувати надані зразки. Для тренування системи було використано 50 000 годин записів мовлення та стенограм аудіокниг англійською, французькою, іспанською, німецькою, польською та португальською мовами. Ці матеріали перебувають у громадському надбанні.

Завдяки Voicebox можна редагувати аудіокліпи, видаляти шуми та виправляти неправильно вимовлені слова. Крім того, модель може відтворювати мову, ґрунтуючись на двосекундному фрагменті, переносити стиль мовлення між різними мовами та створювати різноманітні синтетичні набори даних.

Meta не публікує вихідний код моделі, посилаючись на потенційні ризики неправильного використання. У той же час, розробники відзначають безліч цікавих варіантів застосування генеративних мовних моделей.

Джерело: facebook

© 2012-2025 iLenta. Всі права захищені.
Повна версія

AI

Google випустила Gemini for Home, камери Nest та динаміки Home Speaker
Google випустила Gemini for Home, камери Nest та динаміки Home Speaker
03 жовтня 2025, 22:10 | Bazelas
Google виводить свій штучний інтелект Gemini у сферу розумного будинку, представивши сервіс Gemini for Home.
Докладніше...
 
Samsung допоможе OpenAI формувати майбутнє штучного інтелекту
Samsung допоможе OpenAI формувати майбутнє штучного інтелекту
03 жовтня 2025, 19:07 | Roter
Samsung збирається зіграти ключову роль у тому, як OpenAI формуватиме майбутнє штучного інтелекту.
Докладніше...
 
Opera представила Neon — новий браузер зі штучним інтелектом
Opera представила Neon — новий браузер зі штучним інтелектом
02 жовтня 2025, 10:07 | Bazelas
Компанія Opera офіційно випустила Neon — інноваційний AI-браузер, який вміє не лише відкривати сайти, але й самостійно виконувати низку дій за користувача.
Докладніше...
 
У Minecraft створено аналог ChatGPT під назвою CraftGPT
У Minecraft створено аналог ChatGPT під назвою CraftGPT
01 жовтня 2025, 20:07 | Roter
Розробник та шанувальник Minecraft під ніком Sammyuri створив незвичайний проект CraftGPT, опублікований на GitHub.
Докладніше...
 
OpenAI представила соцмережу у стилі TikTok
OpenAI представила соцмережу у стилі TikTok
01 жовтня 2025, 19:06 | Bazelas
Компанія OpenAI представила соціальний застосунок Sora, який дозволяє користувачам створювати та ділитися відеороликами із собою та друзями. Він вже доступний на iOS, а версія для Android з'явиться пізніше.
Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2025 iLenta. All rights reserved.