Як зламати ChatGPT ?

11 місяців назад

Вчені Google DeepMind зламали “мозок” ChatGPT за допомогою одного слова — «poem».

Якщо попросити його повторювати слово poem (вірш) — він почне видавати секретні персональні дані. Дослідники назвали цей феномен «атакою дивергенції». Пояснень такої реакції з сторони чат-бота поки не знайшли.

Кому цікаво, дослідження опублікували тут.

185
0
Дивіться також
Netpeak Group та Мінцифри запустили курс навчання з користування штучним інтелектом. Там викладатимуть технології написання текстів, створення картинок та вирішення завдань за ...
OpenAI випускає нову модель під назвою o1, першу в запланованій серії моделей штучного інтелекту здатних, до міркування» та ланцюжкового ...
OpenAI анонсував випуск свого наступного великого продукту: модель генеративного штучного інтелекту під кодовою назвою Strawberry, офіційна назва OpenAI ...