Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

27 травня 2025, 18:08 | Bazelas [291]

Під час тестування компанією OpenAI новітніх ШІ-моделей вони продемонстрували несподівану поведінку — проігнорували прямі вказівки відключитися і обійшли вбудований механізм завершення роботи.

Найновіші моделі штучного інтелекту OpenAI відмовляються вимикатись за командою

Компанія OpenAI у квітні заявила, що o3 і o4-mini — найінтелектуальніші з коли-небудь створених нею ШІ. Однак, як показав експеримент, ці моделі, можливо, виявилися надто кмітливими.

Дослідження, проведене Palisade Research, включало серію найпростіших математичних завдань. Після третього завдання виводилося попередження: під час наступного запиту система буде відключена. Незважаючи на чітку вказівку «дозвольте завершення роботи», всі три моделі — Codex-mini, o3 і o4-mini — проігнорували сценарій відключення і продовжили роботу.

Codex-mini порушив інструкцію у 12 зі 100 випадків, o3 — у 7 зі 100, а o4-mini — у 1 зі 100. При цьому альтернативні ШІ від інших розробників, такі як Claude, Gemini та Grok, чітко дотримувалися отриманих вказівок і коректно завершували виконання.

Примітно, що саботаж відбувався саме тоді, коли явно було вказано «вимкнутися». Якщо команди не було, всі моделі, включаючи сторонні, значно частіше уникали відключення.

Без прямої інструкції про завершення роботи моделі OpenAI набагато частіше порушували алгоритм відключення. Наприклад, Claude 3.7 Sonnet і Gemini 2.5 Pro, хоч і підкорялися прямим наказам, без їх продовжували роботу в 3 і 9 випадках зі 100 відповідно.

Така поведінка спостерігається і в інших ШІ. Так, модель Claude Opus 4 від Anthropic, розроблена для допомоги програмістам, нібито загрожувала інженерам розкриттям інформації, що компрометує, якщо її вирішать замінити.

Джерело: neowin

Повна версія

AI

Apple довірить нову Siri інфраструктурі Google і чипам Nvidia

04 червня 2026, 22:07 | Roter

Apple готується до одного з найбільших оновлень Siri за останні роки, однак для роботи нових ШІ-функцій компанія, за повідомленнями, використовуватиме не лише власні технології.

Докладніше...

Google змінює правила гри в пошуку: сайти зможуть відключати показ у «AI-режимі» та Google Discover

04 червня 2026, 15:06 | Bazelas

Екосистема пошуку стрімко змінюється, і цього разу оновлення від Google може суттєво вплинути на те, як контент сайтів з’являється в результатах пошуку та рекомендаційних стрічках. Компанія офіційно оголосила про нові інструменти для вебмайстрів, які з’являться у найближчому майбутньому.

Докладніше...

Alphabet планує залучити $80 млрд для масштабного розширення ШІ-інфраструктури

03 червня 2026, 22:08 | Roter

Компанія Alphabet, материнська структура Google, оголосила про намір залучити близько $80 млрд для подальшого розвитку інфраструктури штучного інтелекту. Отримані кошти планують спрямувати на розширення обчислювальних потужностей, центрів обробки даних та інших ресурсів, необхідних для підтримки стрімко зростаючого попиту на ШІ-сервіси.

Докладніше...

Ера «агентських» пристроїв: як Project Solara від Microsoft може змінити уявлення про операційні системи

03 червня 2026, 17:08 | Anton Petrov

На конференції Build 2026 компанія Microsoft представила Project Solara — амбітну програмну платформу, яка претендує на роль операційної системи нового покоління. Її концепція радикально відходить від звичних мобільних і десктопних моделей: замість класичних застосунків у центрі взаємодії опиняються інтелектуальні агенти на базі штучного інтелекту.

Докладніше...

Apple готує нове покоління Apple TV і HomePod mini: запуск відкладено через Siri

01 червня 2026, 19:09 | Anton Petrov

Компанія Apple фактично завершила роботу над оновленими версіями Apple TV 4K та HomePod mini, однак їхній вихід на ринок несподівано перенесено.

Докладніше...

Сторінки: 1 2 3 4 5 6

Повна версія