iLenta Меню

Google розробила AI, який перетворює фото на анімований аватар

16 березня 2024, 21:09 | Roter [547]
Команда дослідників Google розповіла про нову нейромережу VLOGGER. Метод дозволяє генерувати анімацію людини, що говорить, по одній статичній фотографії.
Google розробила AI, який перетворює фото на анімований аватар

Мета алгоритму — створити реалістичне відео змінної довжини із зображенням людини, що розмовляє. Технологія здатна синхронізувати рух губ, додати моргання очей та жестикуляцію. Ще VLOGGER здатний відредагувати вираз обличчя на готовому відео: наприклад, закрити очі або рот.

Нарешті, технологію можна використовувати для перекладу промови з синхронізацією руху губ з вимовою на іншій мові. Схожу функцію пропонує, наприклад, сервіс HeyGen.

Більше прикладів роботи на сайті проєкту.

«Технологію можна використовувати не тільки для спрощення творчих процесів, але і для нових можливостей, таких як онлайн-комунікації, освіта або персоналізовані віртуальні помічники», — дослідники Google.

VLOGGER не вимагає навчання для конкретної персони: на вхід подається лише одна фотографія та аудіодоріжка з промовою, яку має «вимовити» анімований аватар. Автори розробки стверджують, що VLOGGER перевершує інші подібні нейромережі за якістю роботи.

Джерело: Google

© 2012-2026 iLenta. Всі права захищені.
Повна версія

AI

OpenAI готує великий прорив: GPT-5.6 може вийти вже найближчими тижнями
OpenAI готує великий прорив: GPT-5.6 може вийти вже найближчими тижнями
14 червня 2026, 23:07 | Bazelas

Компанія OpenAI готується представити нову версію своєї флагманської мовної моделі. За інформацією видання The Information, яке посилається на власні джерела всередині компанії, реліз GPT-5.6 може відбутися вже цього місяця.

Докладніше...
 
Gemini у Chrome став доступним ще в десятках країн, але Європа досі без доступу
Gemini у Chrome став доступним ще в десятках країн, але Європа досі без доступу
11 червня 2026, 22:12 | Anton Petrov
Google суттєво розширила географію доступності Gemini у браузері Chrome. Вбудований ШІ-асистент тепер з’явився на настільних комп’ютерах і пристроях на базі iOS у багатьох країнах Латинської Америки, Африки та Близького Сходу.
Докладніше...
 
Samsung запускає масштабну трансформацію на основі ШІ: ChatGPT, Gemini та Claude стануть робочими інструментами для сотень тисяч співробітників
Samsung запускає масштабну трансформацію на основі ШІ: ChatGPT, Gemini та Claude стануть робочими інструментами для сотень тисяч співробітників
11 червня 2026, 16:06 | Roter
Samsung оголосила про старт масштабної програми впровадження штучного інтелекту в усі напрями свого бізнесу. Ініціатива отримала назву AI Transformation (AX) і має на меті зробити ШІ невід’ємною частиною щоденної роботи співробітників компанії в усьому світі.
Докладніше...
 
«Google Перекладач» навчився перекладати живі розмови без затримок
«Google Перекладач» навчився перекладати живі розмови без затримок
10 червня 2026, 21:06 | Bazelas

Компанія Google представила нове покоління системи машинного перекладу — Gemini 3.5 Live Translate, яка вже почала інтеграцію в «Google Перекладач» і згодом з’явиться в Google Meet. Це не просто оновлення функцій, а спроба переосмислити саму ідею живого спілкування між людьми різними мовами.

Докладніше...
 
Apple Intelligence в iOS 27 стає «умовно безкоштовним»: що зміниться для всіх користувачів
Apple Intelligence в iOS 27 стає «умовно безкоштовним»: що зміниться для всіх користувачів
10 червня 2026, 15:07 | Bazelas

З виходом нових версій систем — iOS 27 та macOS 27 — компанія Apple поступово змінює підхід до використання своїх ШІ-функцій. Формально всі можливості Apple Intelligence залишаються безкоштовними, однак тепер з’являється важливий нюанс: обмеження на щоденне використання.

Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2026 iLenta. All rights reserved.