iLenta Меню

Google представила ШІ-модель Gemini 2.5 Computer Use

09 жовтня 2025, 14:08 | Roter [232]
Google представила нову ШІ-модель під назвою Gemini 2.5 Computer Use, яка дозволяє агентам взаємодіяти з веб-сайтами та інтерфейсами користувача так само, як це робить людина.
Google представила ШІ-модель Gemini 2.5 Computer Use

Модель вже доступна у публічній попередній версії через Gemini API у Google AI Studio та Vertex AI. Gemini 2.5 Computer Use заснована на можливостях візуального сприйняття та логічного аналізу моделі Gemini 2.5 Pro. Вона здатна виконувати широкий спектр дій у браузері — натискати кнопки, вводити текст, прокручувати сторінки, наводити курсор, відкривати меню, що випадають, і переходити за посиланнями.

За словами Google, нова модель перевершує конкуруючі рішення в тестах Online-Mind2Web, WebVoyager та AndroidWorld, забезпечуючи меншу затримку відгуку.

На відміну від традиційних ШІ-моделей, які працюють через API, Gemini 2.5 Computer Use аналізує скріншоти веб-інтерфейсів і на їх основі генерує конкретні дії в інтерфейсі користувача. Агент отримує завдання у вигляді текстового запиту, знімок екрану та історію останніх дій. Після аналізу інтерфейсу він вибирає відповідну дію — наприклад, клік по кнопці або введення тексту в поле. Дія виконується за клієнта, потім створюється новий скріншот, і процес триває циклічно.

На демонстрації Google показала, як агент сортує стікери на цифровій дошці та переносить дані про вихованців з одного сайту до CRM-системи. Відеоприклади були прискорені, щоб показати процес у реальному часі.

На даний момент модель підтримує 13 типів дій та оптимізована для роботи в браузері. Підтримка завдань на рівні настільних операційних систем поки що не реалізована, проте модель вже показує хороші результати на мобільних тестах.

Для запобігання зловживанням Google запровадила багаторівневу систему безпеки: кожна дія, запропонована моделлю, проходить перевірку службою безпеки перед виконанням. Розробники можуть обмежувати певні дії або вимагати підтвердження користувача для операцій підвищеного ризику, наприклад, фінансових транзакцій.

Декілька внутрішніх команд Google вже використовують модель у реальних проєктах — для тестування інтерфейсів та автоматизації робочих процесів у таких продуктах, як Search та Firebase. Зовнішні розробники, які отримали ранній доступ, використовують Gemini 2.5 Computer Use для створення інструментів автоматизації робочих процесів та інтелектуальних помічників.

Джерело: gizmochina

© 2012-2025 iLenta. Всі права захищені.
Повна версія

AI

OpenAI придбала команду, яка стояла за створенням Apple Shortcuts
OpenAI придбала команду, яка стояла за створенням Apple Shortcuts
24 жовтня 2025, 16:07 | Bazelas
Розробники програми Sky приєднаються до компанії для розвитку інтеграції ChatGPT до macOS.
Докладніше...
 
OpenAI випустила браузер Atlas, інтегрований із ChatGPT
OpenAI випустила браузер Atlas, інтегрований із ChatGPT
22 жовтня 2025, 23:09 | Roter
Чутки підтвердилися — у OpenAI з'явився власний веб-браузер під назвою Atlas. Як і слід очікувати, він тісно інтегрований з ChatGPT.
Докладніше...
 
OpenAI може перетворити ChatGPT на повноцінний месенджер
OpenAI може перетворити ChatGPT на повноцінний месенджер
21 жовтня 2025, 16:06 | Roter
Схоже, OpenAI готує радикальне розширення можливостей ChatGPT — популярний чат-бот може отримати функції обміну повідомленнями між користувачами.
Докладніше...
 
Goldman Sachs спростовує появу бульбашки на ринку через розвиток ШI
Goldman Sachs спростовує появу бульбашки на ринку через розвиток ШI
21 жовтня 2025, 14:06 | Bazelas
Goldman Sachs відкинув побоювання щодо можливого міхура на ринку, викликаного стрімким зростанням інтересу до штучного інтелекту, заявивши, що бум ШІ знаходиться лише на ранньому етапі розвитку.
Докладніше...
 
Люди почали вигравати суди, замінюючи адвокатів на штучний інтелект ChatGPT
Люди почали вигравати суди, замінюючи адвокатів на штучний інтелект ChatGPT
20 жовтня 2025, 22:07 | Roter
У Каліфорнії жінка на ім'я Лінн Уайт зуміла домогтися скасування рішення про виселення та великих штрафів, звернувшись не до юриста, а до штучного інтелекту.
Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2025 iLenta. All rights reserved.