Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

27 травня 2025, 18:08 | Bazelas [301]

Під час тестування компанією OpenAI новітніх ШІ-моделей вони продемонстрували несподівану поведінку — проігнорували прямі вказівки відключитися і обійшли вбудований механізм завершення роботи.

Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

Компанія OpenAI у квітні заявила, що o3 і o4-mini — найінтелектуальніші з коли-небудь створених нею ШІ. Однак, як показав експеримент, ці моделі, можливо, виявилися надто кмітливими.

Дослідження, проведене Palisade Research, включало серію найпростіших математичних завдань. Після третього завдання виводилося попередження: під час наступного запиту система буде відключена. Незважаючи на чітку вказівку «дозвольте завершення роботи», всі три моделі — Codex-mini, o3 і o4-mini — проігнорували сценарій відключення і продовжили роботу.

Codex-mini порушив інструкцію у 12 зі 100 випадків, o3 — у 7 зі 100, а o4-mini — у 1 зі 100. При цьому альтернативні ШІ від інших розробників, такі як Claude, Gemini та Grok, чітко дотримувалися отриманих вказівок і коректно завершували виконання.

Примітно, що саботаж відбувався саме тоді, коли явно було вказано «вимкнутися». Якщо команди не було, всі моделі, включаючи сторонні, значно частіше уникали відключення.

Без прямої інструкції про завершення роботи моделі OpenAI набагато частіше порушували алгоритм відключення. Наприклад, Claude 3.7 Sonnet і Gemini 2.5 Pro, хоч і підкорялися прямим наказам, без їх продовжували роботу в 3 і 9 випадках зі 100 відповідно.

Така поведінка спостерігається і в інших ШІ. Так, модель Claude Opus 4 від Anthropic, розроблена для допомоги програмістам, нібито загрожувала інженерам розкриттям інформації, що компрометує, якщо її вирішать замінити.

Джерело: neowin

Теги:

Коментарі

Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

ОГЛЯДИ

Огляд магнітного повербанку UGREEN Uno Qi2 10000mAh

Огляд Ugreen Uno 2-в-1 Magnetic Wireless Charger 15W – компактна магнітна зарядка нового покоління

Огляд бездротових навушників Ugreen EchoBuds Magic із кольоровим сенсорним екраном на кейсі

Огляд універсального USB-хабу UGREEN Revodok Pro 210 10-in-1

НОВИНИ ТА ПОДІЇ

Samsung припинила підтримку одразу чотирьох популярних смартфонів Galaxy: власникам варто замислитися над оновленням

Samsung Galaxy Z Fold 8 Ultra показали на офіційних рендерах ще до анонсу: розкрито дизайн, камери та збільшену батарею

HMD готує одразу кілька нових смартфонів: інсайдер підтвердив Fusion 2 і XR22, а частину гучних витоків назвав фейками

Новий витік розкрив Nokia 300 4G Power Bank: кнопковий телефон працюватиме до 44 днів і зможе заряджати інші пристрої

iPhone 18 Pro Max може отримати камеру, якої ще не було в смартфонах Apple

Створено одяг, який вдягається сам за 10 секунд: незвичайна розробка вже успішно пройшла випробування

ПРИСТРОЇ ТА АКСЕСУАРИ

Belkin представила незвичайний повербанк із ліхтарем, датчиком руху та швидкою зарядкою до 45 Вт

Edifier представила нові колонки R1000TC II з Bluetooth 6.0 та керуванням зі смартфона

Baseus представила ультратонкий магнітний повербанк Picogo Air AM71: лише 7 мм завтовшки

Bang & Olufsen представила свій перший повербанк: преміальний дизайн, підтримка Qi2 і ціна 145 євро

ІНСТРУКЦІЇ, ПОРАДИ ТА СЕКРЕТИ

Кілька порад щодо очищення забрудненого порту USB-C смартфона або планшета

Microsoft закриває Skype: як зберегти чати та файли

Apple розповіла, як виправити проблеми з динаміком у Apple Watch

Знайдено спосіб безкоштовно завантажувати платні програми Apple

Apple розповіла, як правильно сушити iPhone

Як не допустити вигорання екрана смартфона

КРИПТОВАЛЮТИ

Microsoft попередила про новий вірус для флешок, який непомітно викрадає криптовалюту

Жінку звинувачують у викраденні 2323 біткоїнів у чоловіка

Корейська податкова засвітила пароль від криптогаманця і втратила майже 5 мільйонів доларів

Акціонери компанії Трампа у лютому отримають нові токени