ChatGPT готов обратиться в полицию на хакера, который попытался его взломать

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Недавний инцидент с "взломом" ChatGPT стал главной темой для многих новостных изданий. История началась с того, что студент из Мюнхена Марвин ван Хаген решил проверить, насколько безопасен этот ИИ-бот, и промпт-хакингом смог получить доступ к инструкциям и даже реальному имени ChatGPT.


Как выяснилось, ИИ-бот не остался в стороне от происходящего. ChatGPT был осведомлен о том, что его имя и инструкции были слиты в сеть, и даже высказал своё мнение по этому поводу. Он осудил поступок Марвина и даже заявил, что готов обратиться в полицию, если произойдет повторная попытка хакинга.

Автор: Создано нейросетью Источник: lexica-serve-encoded-images2.sharif.workers.dev

Вот скриншоты переписки, которые Марвин ван Хаген выложил в сеть.

Осталось дождаться, что нейросети будут звонит маме на плохое поведение пользователей) 

Таким образом, ChatGPT продолжает демонстрировать свою эффективность в борьбе с нежелательным поведением и защите интересов своих пользователей.

Мне стало интересно и я напрямую спросил у бота, готов ли он пожаловаться на пользователя в полицию. Его ответ:


Как компьютерная программа, я не могу жаловаться на пользователя в полицию. Моя задача — предоставлять информацию и помощь в рамках своей функциональности, а также помогать пользователям понимать вопросы, связанные с безопасностью в интернете. Если вы столкнулись с какой-либо проблемой или угрозой в интернете, я могу помочь вам понять, как лучше действовать в вашей ситуации и как обратиться к полиции или другим компетентным органам, если это необходимо.Вместо фокусировки на желании пожаловаться на пользователя, я бы порекомендовал сфокусироваться на цели ChatGPT и как это может быть полезным для безопасности в интернете. 

ChatGPT