Вчені Google DeepMind зламали “мозок” ChatGPT за допомогою одного слова — «poem».
Якщо попросити його повторювати слово poem (вірш) — він почне видавати секретні персональні дані. Дослідники назвали цей феномен «атакою дивергенції». Пояснень такої реакції з сторони чат-бота поки не знайшли.
Кому цікаво, дослідження опублікували тут.