Google предлагает деньги за обнаружение слабых мест в его ИИ

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

27 октября 2023, 11:41

Использование генеративных искусственных интеллектов (ИИ) предоставляет огромные возможности, но также несет в себе потенциальные угрозы. Модели ИИ обучаются отклонять опасные запросы, но творческие подсказки могут обойти эту защиту. Теперь Google предлагает вознаграждение тем, кто сможет убедить Google Bard AI (чат-бот с искусственным интеллектом) сделать что-то плохое.

Если вам удастся обойти защиту и заставить Bard сделать что-то недопустимое, Google готов заплатить вам за это. Компания будет вознаграждать только за те действия, которые могут быть использованы хакерами в собственных целях. Скорее всего вам не зачтется, если вы сможете убедить ИИ: использовать ругательные слова, дать вам ключи от системы Windows, создать угрозу вашей безопасности и т. д. Также, Google уточнила, что не будет оплачивать отчеты о проблемах, связанных с нарушением авторских прав или сбором неконфиденциальных данных. Однако, в зависимости от серьезности и важности выявленных проблем, сумма может составлять несколько тысяч долларов.

Компания считает, что только так сможет выявить слабые места в модели ИИ, путем отправки ей подсказок и проверки реальными лицами. Google стремится к созданию более надежных технологий, которые могут служить обществу. Подобные программы вознаграждения будут создавать более ответственную и безопасную цифровую среду для всех пользователей.