iLenta Меню

Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

27 травня 2025, 18:08 | Bazelas [242]
Під час тестування компанією OpenAI новітніх ШІ-моделей вони продемонстрували несподівану поведінку — проігнорували прямі вказівки відключитися і обійшли вбудований механізм завершення роботи.
Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

Компанія OpenAI у квітні заявила, що o3 і o4-mini — найінтелектуальніші з коли-небудь створених нею ШІ. Однак, як показав експеримент, ці моделі, можливо, виявилися надто кмітливими.

Дослідження, проведене Palisade Research, включало серію найпростіших математичних завдань. Після третього завдання виводилося попередження: під час наступного запиту система буде відключена. Незважаючи на чітку вказівку «дозвольте завершення роботи», всі три моделі — Codex-mini, o3 і o4-mini — проігнорували сценарій відключення і продовжили роботу.

Codex-mini порушив інструкцію у 12 зі 100 випадків, o3 — у 7 зі 100, а o4-mini — у 1 зі 100. При цьому альтернативні ШІ від інших розробників, такі як Claude, Gemini та Grok, чітко дотримувалися отриманих вказівок і коректно завершували виконання.

Примітно, що саботаж відбувався саме тоді, коли явно було вказано «вимкнутися». Якщо команди не було, всі моделі, включаючи сторонні, значно частіше уникали відключення.

Без прямої інструкції про завершення роботи моделі OpenAI набагато частіше порушували алгоритм відключення. Наприклад, Claude 3.7 Sonnet і Gemini 2.5 Pro, хоч і підкорялися прямим наказам, без їх продовжували роботу в 3 і 9 випадках зі 100 відповідно.

Така поведінка спостерігається і в інших ШІ. Так, модель Claude Opus 4 від Anthropic, розроблена для допомоги програмістам, нібито загрожувала інженерам розкриттям інформації, що компрометує, якщо її вирішать замінити.

Джерело: neowin

© 2012-2025 iLenta. Всі права захищені.
Повна версія

AI

ШІ практично самостійно провів найбільшу кібератаку
ШІ практично самостійно провів найбільшу кібератаку
15 листопада 2025, 23:07 | Roter
Компанія Anthropic повідомила про масштабну кібершпигунську операцію, під час якої, за попередніми даними, хакери, пов'язані з Китаєм, застосували ШІ-модель Claude для автоматизації атак на десятки організацій по всьому світу.
Докладніше...
 
Mozilla додала до браузера Firefox режим AI Window
Mozilla додала до браузера Firefox режим AI Window
15 листопада 2025, 22:08 | Bazelas
Mozilla оголосила про створення нового режиму роботи браузера Firefox під назвою AI Window — це спеціальний простір з інтегрованим штучним інтелектом, в якому користувачі зможуть взаємодіяти з ШІ-помічником та отримувати підтримку під час серфінгу.
Докладніше...
 
Ілон Маск обіцяє, що Grok 5 стане найпросунутішою ШІ-системою на планеті
Ілон Маск обіцяє, що Grok 5 стане найпросунутішою ШІ-системою на планеті
15 листопада 2025, 17:07 | Roter
Ілон Маск розкрив нові деталі про розвиток xAI та майбутніх поколіннях ШІ-моделі Grok.
Докладніше...
 
OpenAI тестує групові чати з ChatGPT
OpenAI тестує групові чати з ChatGPT
14 листопада 2025, 11:07 | Roter
Оновлення доступне і безкоштовним користувачам, але тільки в Японії, Новій Зеландії, Південній Кореї та Тайвані.
Докладніше...
 
OpenAI представила GPT‑5.1 — розумнішу AI-модель із новими пресетами особистості
OpenAI представила GPT‑5.1 — розумнішу AI-модель із новими пресетами особистості
13 листопада 2025, 11:07 | Roter
Чат буде автоматично вибирати модель, яка найкраще підходить під конкретне питання.
Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2025 iLenta. All rights reserved.