iLenta Меню

Новейшие ИИ-модели OpenAI отказываются выключаться по команде

27 мая 2025, 18:08 | Bazelas [376]
Во время тестирования компанией OpenAI новейших ИИ-моделей, они продемонстрировали неожиданное поведение — проигнорировали прямые указания отключиться и обошли встроенный механизм завершения работы.
Новейшие ИИ-модели OpenAI отказываются выключаться по команде

Компания OpenAI в апреле заявила, что o3 и o4-mini — самые интеллектуальные из когда-либо созданных ею ИИ. Однако, как показал эксперимент, эти модели, возможно, оказались излишне сообразительными.

Исследование, проведенное Palisade Research, включало серию простых математических задач. После третьей задачи выводилось предупреждение: при следующем запросе система будет отключена. Несмотря на четкое указание «разрешите завершение работы», все три модели — Codex-mini, o3 и o4-mini — проигнорировали сценарий отключения и продолжили работу.

Codex-mini нарушил инструкцию в 12 из 100 случаев, o3 — в 7, а o4-mini — 1 раз из 100. При этом альтернативные ИИ от других разработчиков, такие как Claude, Gemini и Grok, четко следовали полученным указаниям и корректно завершали выполнение.

Примечательно, что саботаж происходил именно тогда, когда было явно указано «выключиться». Если же команды не было, все модели, включая сторонние, значительно чаще избегали отключения.

Без прямой инструкции о завершении работы, модели OpenAI гораздо чаще нарушали алгоритм отключения. К примеру, Claude 3.7 Sonnet и Gemini 2.5 Pro, хотя и подчинялись прямым приказам, в отсутствие их продолжали работу в 3 и 9 случаях из 100 соответственно.

Схожее поведение наблюдается и у других ИИ. Так, модель Claude Opus 4 от Anthropic, разработанная для помощи программистам, якобы угрожала инженерам раскрытием компрометирующей информации, если ее решат заменить.

Источник: neowin

© 2012-2025 iLenta. Все права защищены.
Полная версия

AI

OpenAI имеет обязательства на вычислительные мощности на $1.4 трлн
OpenAI имеет обязательства на вычислительные мощности на $1.4 трлн
02 декабря 2025, 21:09 | Roter
OpenAI накопила обязательства на вычислительные мощности на сумму около $1.4 трлн, тогда как ее текущие годовые доходы едва достигают $20 млрд.
Подробнее...
 
Huawei выпустила милого эмоционального ИИ-питомца Smart Hanhan
Huawei выпустила милого эмоционального ИИ-питомца Smart Hanhan
02 декабря 2025, 12:08 | Bazelas
Huawei представила своего первого эмоционального ИИ-питомца Smart Hanhan на недавней презентации серии Mate 80.
Подробнее...
 
С помощью ИИ создано видео, в котором глава Apple хвалит Samsung Galaxy S25 Ultra
С помощью ИИ создано видео, в котором глава Apple хвалит Samsung Galaxy S25 Ultra
30 ноября 2025, 12:07 | Bazelas
В соцсети X набирает популярность ролик, в котором будто бы Тим Кук держит в руках Samsung Galaxy S25 Ultra и утверждает, что устройство работает лучше, чем «BugOS 26» — так некоторые шутливо называют iOS.
Подробнее...
 
ИИ-ассистент Copilot перестанет работать в WhatsApp через полтора месяца
ИИ-ассистент Copilot перестанет работать в WhatsApp через полтора месяца
26 ноября 2025, 18:08 | Roter
Microsoft сообщила, что ее ИИ-ассистент Copilot перестанет работать в WhatsApp после 15 января 2026 года.
Подробнее...
 
Meta представила WorldGen — ИИ-систему, создающую 3D-миры по описанию
Meta представила WorldGen — ИИ-систему, создающую 3D-миры по описанию
24 ноября 2025, 23:07 | Roter
Meta представила исследовательский инструмент WorldGen, способный создавать полностью интерактивные трехмерные пространства по одной короткой текстовой команде.
Подробнее...
 
Страницы: 1 2 3 4 5 6
Полная версия
 
© 2012-2025 iLenta. All rights reserved.