У ChatGPT та аналогах виявлено серйозні вразливості

09 листопада 2023, 12:06 | Bazelas [400]

Китайські дослідники виявили серйозну вразливість у широко використовуваних багатомодальних комерційних великих мовних моделях (MLLM), типу ChatGPT, Bard і Bing Chat.

У ChatGPT та аналогах виявлено серйозні вразливості

Ці моделі, розроблені великими технологічними гігантами, є фундаментальними компонентами різних програм, від віртуальних помічників до систем модерації контенту.

Дослідники виявили, що вразливості у цих MLLM можуть бути використані у маніпульованих зображеннях, які нагадують оригінали. Шляхом внесення дрібних змін, практично невидимих для людського ока, дослідники успішно оминали вбудовані фільтри моделей, призначені для виявлення токсичного або невідповідного контенту.

Наприклад, дослідники в Пекіні виявили серйозну вразливість у моделях ШІ, таких як ChatGPT. В умовах атаки ці моделі могли помилково приймати гігантських панд за людей або не виявляти шкідливого контенту, що підкреслює критичну вразливість у комерційних системах штучного інтелекту.

Серед порушених моделей Bard, обладнаних механізмами розпізнавання облич та токсичності, могли генерувати невідповідні описи шкідливого контенту під час компрометації. Китайська дослідницька група навіть надала код, який демонструє, як ці атаки можуть вводити в оману моделі ШІ. Їхні експерименти продемонстрували успішність на рівні 22% проти Bard, 26% проти Bing Chat та значні 86% проти Ernie Bot.

Вчений-технолог з Китаю Чжаохуей висловив стурбованість цими тривожними результатами на Глобальному Саміті з безпеки ШІ у Великій Британії. Він наголосив на нагальній необхідності сильніших технічних заходів безпеки в управлінні штучним інтелектом і закликав глобальну спільноту розглянути виявлені вразливості в мовних моделях, що широко використовуються.

Для боротьби з цими вразливостями дослідники запропонували використання методів попередньої обробки як потенційного рішення, особливо для масштабних основних моделей. Ці методи спрямовані на забезпечення надійності MLLM проти атак та створюють шлях для майбутніх досліджень та розробок у галузі безпеки ШІ.

Джерело: gizmochina

Повна версія

AI

OpenAI готує великий прорив: GPT-5.6 може вийти вже найближчими тижнями

14 червня 2026, 23:07 | Bazelas

Компанія OpenAI готується представити нову версію своєї флагманської мовної моделі. За інформацією видання The Information, яке посилається на власні джерела всередині компанії, реліз GPT-5.6 може відбутися вже цього місяця.

Докладніше...

Gemini у Chrome став доступним ще в десятках країн, але Європа досі без доступу

11 червня 2026, 22:12 | Anton Petrov

Google суттєво розширила географію доступності Gemini у браузері Chrome. Вбудований ШІ-асистент тепер з’явився на настільних комп’ютерах і пристроях на базі iOS у багатьох країнах Латинської Америки, Африки та Близького Сходу.

Докладніше...

Samsung запускає масштабну трансформацію на основі ШІ: ChatGPT, Gemini та Claude стануть робочими інструментами для сотень тисяч співробітників

11 червня 2026, 16:06 | Roter

Samsung оголосила про старт масштабної програми впровадження штучного інтелекту в усі напрями свого бізнесу. Ініціатива отримала назву AI Transformation (AX) і має на меті зробити ШІ невід’ємною частиною щоденної роботи співробітників компанії в усьому світі.

Докладніше...

«Google Перекладач» навчився перекладати живі розмови без затримок

10 червня 2026, 21:06 | Bazelas

Компанія Google представила нове покоління системи машинного перекладу — Gemini 3.5 Live Translate, яка вже почала інтеграцію в «Google Перекладач» і згодом з’явиться в Google Meet. Це не просто оновлення функцій, а спроба переосмислити саму ідею живого спілкування між людьми різними мовами.

Докладніше...

Apple Intelligence в iOS 27 стає «умовно безкоштовним»: що зміниться для всіх користувачів

10 червня 2026, 15:07 | Bazelas

З виходом нових версій систем — iOS 27 та macOS 27 — компанія Apple поступово змінює підхід до використання своїх ШІ-функцій. Формально всі можливості Apple Intelligence залишаються безкоштовними, однак тепер з’являється важливий нюанс: обмеження на щоденне використання.

Докладніше...

Сторінки: 1 2 3 4 5 6

Повна версія