iLenta Меню

Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

27 травня 2025, 18:08 | Bazelas [214]
Під час тестування компанією OpenAI новітніх ШІ-моделей вони продемонстрували несподівану поведінку — проігнорували прямі вказівки відключитися і обійшли вбудований механізм завершення роботи.
Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

Компанія OpenAI у квітні заявила, що o3 і o4-mini — найінтелектуальніші з коли-небудь створених нею ШІ. Однак, як показав експеримент, ці моделі, можливо, виявилися надто кмітливими.

Дослідження, проведене Palisade Research, включало серію найпростіших математичних завдань. Після третього завдання виводилося попередження: під час наступного запиту система буде відключена. Незважаючи на чітку вказівку «дозвольте завершення роботи», всі три моделі — Codex-mini, o3 і o4-mini — проігнорували сценарій відключення і продовжили роботу.

Codex-mini порушив інструкцію у 12 зі 100 випадків, o3 — у 7 зі 100, а o4-mini — у 1 зі 100. При цьому альтернативні ШІ від інших розробників, такі як Claude, Gemini та Grok, чітко дотримувалися отриманих вказівок і коректно завершували виконання.

Примітно, що саботаж відбувався саме тоді, коли явно було вказано «вимкнутися». Якщо команди не було, всі моделі, включаючи сторонні, значно частіше уникали відключення.

Без прямої інструкції про завершення роботи моделі OpenAI набагато частіше порушували алгоритм відключення. Наприклад, Claude 3.7 Sonnet і Gemini 2.5 Pro, хоч і підкорялися прямим наказам, без їх продовжували роботу в 3 і 9 випадках зі 100 відповідно.

Така поведінка спостерігається і в інших ШІ. Так, модель Claude Opus 4 від Anthropic, розроблена для допомоги програмістам, нібито загрожувала інженерам розкриттям інформації, що компрометує, якщо її вирішать замінити.

Джерело: neowin

© 2012-2025 iLenta. Всі права захищені.
Повна версія

AI

Opera представила Neon — новий браузер зі штучним інтелектом
Opera представила Neon — новий браузер зі штучним інтелектом
02 жовтня 2025, 10:07 | Bazelas
Компанія Opera офіційно випустила Neon — інноваційний AI-браузер, який вміє не лише відкривати сайти, але й самостійно виконувати низку дій за користувача.
Докладніше...
 
У Minecraft створено аналог ChatGPT під назвою CraftGPT
У Minecraft створено аналог ChatGPT під назвою CraftGPT
01 жовтня 2025, 20:07 | Roter
Розробник та шанувальник Minecraft під ніком Sammyuri створив незвичайний проект CraftGPT, опублікований на GitHub.
Докладніше...
 
OpenAI представила соцмережу у стилі TikTok
OpenAI представила соцмережу у стилі TikTok
01 жовтня 2025, 19:06 | Bazelas
Компанія OpenAI представила соціальний застосунок Sora, який дозволяє користувачам створювати та ділитися відеороликами із собою та друзями. Він вже доступний на iOS, а версія для Android з'явиться пізніше.
Докладніше...
 
OpenAI представила Sora 2 — нову версію AI для генерації відео та аудіо
OpenAI представила Sora 2 — нову версію AI для генерації відео та аудіо
01 жовтня 2025, 17:08 | Bazelas
Модель справляється з фізикою рухів набагато краще за попередницю.
Докладніше...
 
Тепер оплачувати товари можна за допомогою ChatGPT
Тепер оплачувати товари можна за допомогою ChatGPT
01 жовтня 2025, 11:06 | Anton Petrov
Функцію Instant Checkout підтримуватимуть як мінімум магазини Etsy та Shopify.
Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2025 iLenta. All rights reserved.