iLenta Меню

У ChatGPT та аналогах виявлено серйозні вразливості

09 листопада 2023, 12:06 | Bazelas [376]
Китайські дослідники виявили серйозну вразливість у широко використовуваних багатомодальних комерційних великих мовних моделях (MLLM), типу ChatGPT, Bard і Bing Chat.
У ChatGPT та аналогах виявлено серйозні вразливості

Ці моделі, розроблені великими технологічними гігантами, є фундаментальними компонентами різних програм, від віртуальних помічників до систем модерації контенту.

Дослідники виявили, що вразливості у цих MLLM можуть бути використані у маніпульованих зображеннях, які нагадують оригінали. Шляхом внесення дрібних змін, практично невидимих для людського ока, дослідники успішно оминали вбудовані фільтри моделей, призначені для виявлення токсичного або невідповідного контенту.

Наприклад, дослідники в Пекіні виявили серйозну вразливість у моделях ШІ, таких як ChatGPT. В умовах атаки ці моделі могли помилково приймати гігантських панд за людей або не виявляти шкідливого контенту, що підкреслює критичну вразливість у комерційних системах штучного інтелекту.

Серед порушених моделей Bard, обладнаних механізмами розпізнавання облич та токсичності, могли генерувати невідповідні описи шкідливого контенту під час компрометації. Китайська дослідницька група навіть надала код, який демонструє, як ці атаки можуть вводити в оману моделі ШІ. Їхні експерименти продемонстрували успішність на рівні 22% проти Bard, 26% проти Bing Chat та значні 86% проти Ernie Bot.

Вчений-технолог з Китаю Чжаохуей висловив стурбованість цими тривожними результатами на Глобальному Саміті з безпеки ШІ у Великій Британії. Він наголосив на нагальній необхідності сильніших технічних заходів безпеки в управлінні штучним інтелектом і закликав глобальну спільноту розглянути виявлені вразливості в мовних моделях, що широко використовуються.

Для боротьби з цими вразливостями дослідники запропонували використання методів попередньої обробки як потенційного рішення, особливо для масштабних основних моделей. Ці методи спрямовані на забезпечення надійності MLLM проти атак та створюють шлях для майбутніх досліджень та розробок у галузі безпеки ШІ.

Джерело: gizmochina

© 2012-2025 iLenta. Всі права захищені.
Повна версія

AI

Компанія xAI Ілона Маска випустила штучний інтелект Grok 4.1
Компанія xAI Ілона Маска випустила штучний інтелект Grok 4.1
19 листопада 2025, 12:12 | Bazelas
xAI випустила Grok 4.1 — велике оновлення, яке привнесло не тільки більш високу швидкість та точність.
Докладніше...
 
Microsoft та Nvidia уклали партнерство з Anthropic
Microsoft та Nvidia уклали партнерство з Anthropic
19 листопада 2025, 11:07 | Roter
Сума зобов'язань за підрахунками склала 30 млрд доларів.
Докладніше...
 
Засновник Amazon Джефф Безос став співголовою ШІ-стартапу
Засновник Amazon Джефф Безос став співголовою ШІ-стартапу
18 листопада 2025, 12:08 | Bazelas
Засновник Amazon Джефф Безос знову активно повертається у бізнес, ставши співголовою нового стартапу у сфері штучного інтелекту під назвою Project Prometheus.
Докладніше...
 
ШІ практично самостійно провів найбільшу кібератаку
ШІ практично самостійно провів найбільшу кібератаку
15 листопада 2025, 23:07 | Roter
Компанія Anthropic повідомила про масштабну кібершпигунську операцію, під час якої, за попередніми даними, хакери, пов'язані з Китаєм, застосували ШІ-модель Claude для автоматизації атак на десятки організацій по всьому світу.
Докладніше...
 
Mozilla додала до браузера Firefox режим AI Window
Mozilla додала до браузера Firefox режим AI Window
15 листопада 2025, 22:08 | Bazelas
Mozilla оголосила про створення нового режиму роботи браузера Firefox під назвою AI Window — це спеціальний простір з інтегрованим штучним інтелектом, в якому користувачі зможуть взаємодіяти з ШІ-помічником та отримувати підтримку під час серфінгу.
Докладніше...
 
Сторінки: 1 2 3 4 5 6
Повна версія
 
© 2012-2025 iLenta. All rights reserved.