iLenta Меню

Google представила ИИ-модель Gemini 2.5 Computer Use

09 октября 2025, 14:08 | Roter [317]
Google представила новую ИИ-модель под названием Gemini 2.5 Computer Use, которая позволяет агентам взаимодействовать с веб-сайтами и пользовательскими интерфейсами так же, как это делает человек.
Google представила ИИ-модель Gemini 2.5 Computer Use

Модель уже доступна в публичной предварительной версии через Gemini API в Google AI Studio и Vertex AI. Gemini 2.5 Computer Use основана на возможностях визуального восприятия и логического анализа модели Gemini 2.5 Pro. Она способна выполнять широкий спектр действий в браузере — нажимать кнопки, вводить текст, прокручивать страницы, наводить курсор, открывать выпадающие меню и переходить по ссылкам.

По словам Google, новая модель превосходит конкурирующие решения в тестах Online-Mind2Web, WebVoyager и AndroidWorld, при этом обеспечивая меньшую задержку отклика.

В отличие от традиционных ИИ-моделей, которые работают через API, Gemini 2.5 Computer Use анализирует скриншоты веб-интерфейсов и на их основе генерирует конкретные действия в пользовательском интерфейсе. Агент получает задачу в виде текстового запроса, снимок экрана и историю последних действий. После анализа интерфейса он выбирает подходящее действие — например, клик по кнопке или ввод текста в поле. Действие выполняется на стороне клиента, затем создаётся новый скриншот, и процесс продолжается циклически.

На демонстрации Google показала, как агент сортирует стикеры на цифровой доске и переносит данные о питомцах с одного сайта в CRM-систему. Видеопримеры были ускорены, чтобы показать процесс в реальном времени.

На данный момент модель поддерживает 13 типов действий и оптимизирована для работы в браузере. Поддержка задач на уровне настольных операционных систем пока не реализована, однако модель уже показывает хорошие результаты на мобильных тестах.

Для предотвращения злоупотреблений Google внедрила многоуровневую систему безопасности: каждое действие, предложенное моделью, проходит проверку службой безопасности перед выполнением. Разработчики могут ограничивать определённые действия или запрашивать подтверждение пользователя для операций повышенного риска, например финансовых транзакций.

Несколько внутренних команд Google уже используют модель в реальных проектах — для тестирования интерфейсов и автоматизации рабочих процессов в таких продуктах, как Search и Firebase. Внешние разработчики, получившие ранний доступ, применяют Gemini 2.5 Computer Use для создания инструментов автоматизации рабочих процессов и интеллектуальных помощников.

Источник: gizmochina

© 2012-2025 iLenta. Все права защищены.
Полная версия

AI

OpenAI выпустила браузер Atlas, интегрированный с ChatGPT
OpenAI выпустила браузер Atlas, интегрированный с ChatGPT
22 октября 2025, 23:09 | Roter
Слухи подтвердились — у OpenAI появился собственный веб-браузер под названием Atlas. Как и следовало ожидать, он тесно интегрирован с ChatGPT.
Подробнее...
 
OpenAI может превратить ChatGPT в полноценный мессенджер
OpenAI может превратить ChatGPT в полноценный мессенджер
21 октября 2025, 16:06 | Roter
Похоже, OpenAI готовит радикальное расширение возможностей ChatGPT — популярный чатбот может получить функции обмена сообщениями между пользователями.
Подробнее...
 
Goldman Sachs опровергает появление пузыря на рынке из-за развития ИИ
Goldman Sachs опровергает появление пузыря на рынке из-за развития ИИ
21 октября 2025, 14:06 | Bazelas
Goldman Sachs отверг опасения по поводу возможного пузыря на рынке, вызванного стремительным ростом интереса к искусственному интеллекту, заявив, что бум ИИ находится лишь на раннем этапе развития.
Подробнее...
 
Люди начали выигрывать суды, заменяя адвокатов искусственным интеллектом ChatGPT
Люди начали выигрывать суды, заменяя адвокатов искусственным интеллектом ChatGPT
20 октября 2025, 22:07 | Roter
В Калифорнии женщина по имени Линн Уайт сумела добиться отмены решения о выселении и крупных штрафов, обратившись не к юристу, а к искусственному интеллекту.
Подробнее...
 
Интерес к Wikipedia падает из-за роста популярности ИИ и соцсетей
Интерес к Wikipedia падает из-за роста популярности ИИ и соцсетей
19 октября 2025, 19:07 | Roter
Фонд Wikimedia опубликовал свежий отчет, в котором проанализировал текущие пользовательские тенденции на платформе Wikipedia.
Подробнее...
 
Страницы: 1 2 3 4 5 6
Полная версия
 
© 2012-2025 iLenta. All rights reserved.