Google розробила AI, який перетворює фото на анімований аватар

16 березня 2024, 21:09 | Roter [547]

Команда дослідників Google розповіла про нову нейромережу VLOGGER. Метод дозволяє генерувати анімацію людини, що говорить, по одній статичній фотографії.

Google розробила AI, який перетворює фото на анімований аватар

Мета алгоритму — створити реалістичне відео змінної довжини із зображенням людини, що розмовляє. Технологія здатна синхронізувати рух губ, додати моргання очей та жестикуляцію. Ще VLOGGER здатний відредагувати вираз обличчя на готовому відео: наприклад, закрити очі або рот.

Нарешті, технологію можна використовувати для перекладу промови з синхронізацією руху губ з вимовою на іншій мові. Схожу функцію пропонує, наприклад, сервіс HeyGen.

Більше прикладів роботи на сайті проєкту.

«Технологію можна використовувати не тільки для спрощення творчих процесів, але і для нових можливостей, таких як онлайн-комунікації, освіта або персоналізовані віртуальні помічники», — дослідники Google.

VLOGGER не вимагає навчання для конкретної персони: на вхід подається лише одна фотографія та аудіодоріжка з промовою, яку має «вимовити» анімований аватар. Автори розробки стверджують, що VLOGGER перевершує інші подібні нейромережі за якістю роботи.

Джерело: Google

Повна версія

AI

OpenAI готує великий прорив: GPT-5.6 може вийти вже найближчими тижнями

14 червня 2026, 23:07 | Bazelas

Компанія OpenAI готується представити нову версію своєї флагманської мовної моделі. За інформацією видання The Information, яке посилається на власні джерела всередині компанії, реліз GPT-5.6 може відбутися вже цього місяця.

Докладніше...

Gemini у Chrome став доступним ще в десятках країн, але Європа досі без доступу

11 червня 2026, 22:12 | Anton Petrov

Google суттєво розширила географію доступності Gemini у браузері Chrome. Вбудований ШІ-асистент тепер з’явився на настільних комп’ютерах і пристроях на базі iOS у багатьох країнах Латинської Америки, Африки та Близького Сходу.

Докладніше...

Samsung запускає масштабну трансформацію на основі ШІ: ChatGPT, Gemini та Claude стануть робочими інструментами для сотень тисяч співробітників

11 червня 2026, 16:06 | Roter

Samsung оголосила про старт масштабної програми впровадження штучного інтелекту в усі напрями свого бізнесу. Ініціатива отримала назву AI Transformation (AX) і має на меті зробити ШІ невід’ємною частиною щоденної роботи співробітників компанії в усьому світі.

Докладніше...

«Google Перекладач» навчився перекладати живі розмови без затримок

10 червня 2026, 21:06 | Bazelas

Компанія Google представила нове покоління системи машинного перекладу — Gemini 3.5 Live Translate, яка вже почала інтеграцію в «Google Перекладач» і згодом з’явиться в Google Meet. Це не просто оновлення функцій, а спроба переосмислити саму ідею живого спілкування між людьми різними мовами.

Докладніше...

Apple Intelligence в iOS 27 стає «умовно безкоштовним»: що зміниться для всіх користувачів

10 червня 2026, 15:07 | Bazelas

З виходом нових версій систем — iOS 27 та macOS 27 — компанія Apple поступово змінює підхід до використання своїх ШІ-функцій. Формально всі можливості Apple Intelligence залишаються безкоштовними, однак тепер з’являється важливий нюанс: обмеження на щоденне використання.

Докладніше...

Сторінки: 1 2 3 4 5 6

Повна версія