Google представила ИИ-модель Gemini 2.5 Computer Use

09 октября 2025, 14:08 | Roter [754]

Google представила новую ИИ-модель под названием Gemini 2.5 Computer Use, которая позволяет агентам взаимодействовать с веб-сайтами и пользовательскими интерфейсами так же, как это делает человек.

Google представила ИИ-модель Gemini 2.5 Computer Use

Модель уже доступна в публичной предварительной версии через Gemini API в Google AI Studio и Vertex AI. Gemini 2.5 Computer Use основана на возможностях визуального восприятия и логического анализа модели Gemini 2.5 Pro. Она способна выполнять широкий спектр действий в браузере — нажимать кнопки, вводить текст, прокручивать страницы, наводить курсор, открывать выпадающие меню и переходить по ссылкам.

По словам Google, новая модель превосходит конкурирующие решения в тестах Online-Mind2Web, WebVoyager и AndroidWorld, при этом обеспечивая меньшую задержку отклика.

В отличие от традиционных ИИ-моделей, которые работают через API, Gemini 2.5 Computer Use анализирует скриншоты веб-интерфейсов и на их основе генерирует конкретные действия в пользовательском интерфейсе. Агент получает задачу в виде текстового запроса, снимок экрана и историю последних действий. После анализа интерфейса он выбирает подходящее действие — например, клик по кнопке или ввод текста в поле. Действие выполняется на стороне клиента, затем создаётся новый скриншот, и процесс продолжается циклически.

На демонстрации Google показала, как агент сортирует стикеры на цифровой доске и переносит данные о питомцах с одного сайта в CRM-систему. Видеопримеры были ускорены, чтобы показать процесс в реальном времени.

На данный момент модель поддерживает 13 типов действий и оптимизирована для работы в браузере. Поддержка задач на уровне настольных операционных систем пока не реализована, однако модель уже показывает хорошие результаты на мобильных тестах.

Для предотвращения злоупотреблений Google внедрила многоуровневую систему безопасности: каждое действие, предложенное моделью, проходит проверку службой безопасности перед выполнением. Разработчики могут ограничивать определённые действия или запрашивать подтверждение пользователя для операций повышенного риска, например финансовых транзакций.

Несколько внутренних команд Google уже используют модель в реальных проектах — для тестирования интерфейсов и автоматизации рабочих процессов в таких продуктах, как Search и Firebase. Внешние разработчики, получившие ранний доступ, применяют Gemini 2.5 Computer Use для создания инструментов автоматизации рабочих процессов и интеллектуальных помощников.

Теги:

Источник: gizmochina

Комментарии

Google представила ИИ-модель Gemini 2.5 Computer Use

ОБЗОРЫ

Обзор магнитного повербанка UGREEN Uno Qi2 10000mAh

Обзор Ugreen Uno 2-в-1 Magnetic Wireless Charger 15W — компактная магнитная зарядка нового поколения

Обзор беспроводных наушников Ugreen EchoBuds Magic с цветным сенсорным экраном на кейсе

Обзор универсального USB-хаба UGREEN Revodok Pro 210 10-in-1

НОВОСТИ И СОБЫТИЯ

Samsung выпустила обновленный портативный проектор The Freestyle+: он получил One UI, HDR10+ и функции на базе ИИ

Samsung прекратила поддержку сразу четырех популярных смартфонов Galaxy: владельцам стоит задуматься об обновлении

Samsung Galaxy Z Fold 8 Ultra показали на официальных рендерах до анонса: раскрыты дизайн, камеры и увеличенная батарея

HMD готовит сразу несколько новых смартфонов: подтверждены Fusion 2 и XR22, а часть громких утечек оказалась фейком

Новая утечка раскрыла Nokia 300 4G Power Bank: кнопочный телефон сможет работать до 44 дней и заряжать другие устройства

Cоздана одежда, которая надевается сама за 10 секунд: необычная разработка уже успешно прошла испытания

УСТРОЙСТВА И АКСЕССУАРЫ

Belkin представила необычный повербанк с фонарем, датчиком движения и быстрой зарядкой до 45 Вт

Edifier представила новые колонки R1000TC II с Bluetooth 6.0 и управлением со смартфона

Baseus выпустила ультратонкий магнитный повербанк Picogo Air AM71: толщина всего 7 мм

Bang & Olufsen выпустила свой первый повербанк: премиальный дизайн, Qi2 и цена 145 евро

ИНСТРУКЦИИ, СОВЕТЫ И СЕКРЕТЫ

Несколько советов для очистки загрязненного порта USB-C смартфона или планшета

Как выбрать идеальный ноутбук для работы и учебы: полезные советы и рекомендации

Как бороться с навязчивой рекламой в Facebook

Как безопасно пользоваться общественными бесплатными сетями Wi-Fi?

Какие риски скрывает включенная геолокация на смартфоне?

Как защититься от надоедливого спама?

КРИПТОВАЛЮТЫ

Microsoft предупредила о новом вирусе для флешек, который незаметно крадет криптовалюту

Женщину обвиняют в краже у мужа 2323 биткоинов

Акционеры компании Трампа в феврале получат новые токены

Аналитики Chainalysis изучили угрозы для крипторынка в 2025 году