OpenAI запустила AI-агента Operator, який може виконувати завдання у браузері за вас

24 січня 2025, 13:08 | Anton Petrov [368]

Після кількох тижнів галасу OpenAI випустила свого першого AI-агента під назвою Operator.

OpenAI запустила AI-агента Operator, який може виконувати завдання у браузері за вас

Це веб-застосунок, який може виконувати прості завдання в браузері, такі як бронювання квитків на концерт або оформлення замовлення в маркетплейсі. Він працює на базі нової моделі Computer-Using Agent (CUA).

У компанії стверджують, що її інструмент перевершує всі аналоги, включаючи Computer Use від Anthropic (теж може виконувати прості завдання на ПК) та Mariner від Google DeepMind (агент для перегляду веб-сторінок, створений на основі Gemini 2.0).

Той факт, що три провідні світові компанії в галузі штучного інтелекту зосередилися на одному напрямку, ясно показує: у гонці за лідерство в AI виник новий фронт — екрани наших комп'ютерів.

Перехід від створення тексту та зображень до виконання завдань — це правильний напрямок. Це відкриває додаткові можливості та вирішує старі проблеми.

Алі Фархаді, генеральний директор Алленівського інституту штучного інтелекту (AI2)

Operator «читає» екран, аналізує пікселі та виконує дії, взаємодіючи з графічними інтерфейсами, як людина. Нейросітка виконує завдання на більшості веб-сайтів, повторюючи цикл: сканує дисплей, виконує дію, знову сканує і виконує ще одну дію і таке інше.

CUA ділить завдання на дрібніші етапи і послідовно працює з ними, повертаючись до попередніх, якщо стикається з труднощами. В OpenAI відзначають, що нейромережа навчалася з використанням методів, схожих на ті, які застосовуються для моделей міркування o1 і o3.

Компанія протестувала агента на низці галузевих завдань. Наприклад, у OSWorld, де перевіряються такі навички, як поєднання PDF-файлів або робота із зображеннями, він показав результат 38,1% порівняно з 22,0% у Computer Use. Для порівняння середній показник у людей становить 72,4%. У тесті WebVoyager, що оцінює ефективність виконання завдань у браузері, Operator набрав 87%, Mariner — 83,5%, а Computer Use — 56%.

Поки новий інструмент може виконувати завдання лише у браузері. OpenAI планує розширити його можливості у майбутньому через API.

Для його використання достатньо ввести інструкції у текстове поле. Однак, замість відкриття браузера на вашому комп'ютері, система відправляє їх у віддалений браузер, що працює на сервері OpenAI. У компанії стверджують, що це підвищує ефективність.

Оскільки агент працює у хмарі, він може виконувати кілька завдань одночасно. У демонстрації один із творців попросив його використати онлайн-платформу OpenTable, щоб забронювати йому столик на двох о 18:30 у ресторані Octavia у Сан-Франциско. Він спритно впорався з цим багатокроковим завданням.

Поки що Operator доступний тільки в США за підпискою ChatGPT Pro. У компанії обіцяють у майбутньому розгорнути інструмент для інших користувачів.

Джерело: OpenAI

Теги: OpenAI AI

Коментарі

OpenAI запустила AI-агента Operator, який може виконувати завдання у браузері за вас

ОГЛЯДИ

Огляд магнітного повербанку UGREEN Uno Qi2 10000mAh

Огляд Ugreen Uno 2-в-1 Magnetic Wireless Charger 15W – компактна магнітна зарядка нового покоління

Огляд бездротових навушників Ugreen EchoBuds Magic із кольоровим сенсорним екраном на кейсі

Огляд універсального USB-хабу UGREEN Revodok Pro 210 10-in-1

НОВИНИ ТА ПОДІЇ

Samsung може вперше в історії завершити квартал зі збитками мобільного підрозділу: причина виявилася несподіваною

Samsung представила SSD 990: швидкий PCIe 4.0-накопичувач із високою продуктивністю та доступнішою ціною

Apple несподівано підняла ціни на iPhone: Японія може стати сигналом для інших країн

Samsung представила преміальні бездротові колонки Music Studio з Dolby Atmos і підтримкою SmartThings

Apple намагається врегулювати антимонопольний позов у США: компанія розпочала переговори з Міністерством юстиції

Власники iPhone ще рідше переходять на Android: нове дослідження показало рекордну лояльність користувачів

ПРИСТРОЇ ТА АКСЕСУАРИ

Belkin представила незвичайний повербанк із ліхтарем, датчиком руху та швидкою зарядкою до 45 Вт

Edifier представила нові колонки R1000TC II з Bluetooth 6.0 та керуванням зі смартфона

Baseus представила ультратонкий магнітний повербанк Picogo Air AM71: лише 7 мм завтовшки

Bang & Olufsen представила свій перший повербанк: преміальний дизайн, підтримка Qi2 і ціна 145 євро

ІНСТРУКЦІЇ, ПОРАДИ ТА СЕКРЕТИ

Кілька порад щодо очищення забрудненого порту USB-C смартфона або планшета

Microsoft закриває Skype: як зберегти чати та файли

Apple розповіла, як виправити проблеми з динаміком у Apple Watch

Знайдено спосіб безкоштовно завантажувати платні програми Apple

Apple розповіла, як правильно сушити iPhone

Як не допустити вигорання екрана смартфона

КРИПТОВАЛЮТИ

Microsoft попередила про новий вірус для флешок, який непомітно викрадає криптовалюту

Жінку звинувачують у викраденні 2323 біткоїнів у чоловіка

Корейська податкова засвітила пароль від криптогаманця і втратила майже 5 мільйонів доларів

Акціонери компанії Трампа у лютому отримають нові токени