Нове сімейство моделей під назвою Google TranslateGemma підтримує 55 мов, зокрема українську, і пропонується у трьох варіантах: 4B — оптимізованих для смартфонів, 12B — для ноутбуків, 27B — для хмарних серверів.
В основі моделей лежить Gemma 3, до якої застосували контрольоване точне донавчання (SFT) на різноманітних даних — поєднанні людських перекладів і синтетичних перекладів від Gemini. За словами Google, такий підхід забезпечив широке мовне охоплення, зокрема для рідкісних мов і мов із низьким рівнем ресурсного забезпечення. Додатково моделі було вдосконалено за допомогою навчання з підкріпленням (RL), що підвищило точність перекладів.

Якість роботи оцінювали за допомогою метрики MetricX, яка фіксує помилки перекладу: менші значення означають вищу якість. Так, модель TranslateGemma з 12 млрд параметрів отримала показник 3.60, випередивши базову 27-мільярдну модель із результатом 4.04 (приблизно на 26% менше помилок).
Окрім цього, нові моделі були навчені на 55 основних мовних парах, серед яких іспанська, французька, китайська, гінді та інші, а також майже на 500 додаткових парах. Примітно, що ШІ здатен не лише перекладати текст, а й працювати з зображеннями — розпізнавати текст на сканах, скриншотах і фотографіях та виконувати переклад безпосередньо з цих джерел.
Джерело: blog.google
.png)

