Google предлагает деньги за обнаружение слабых мест в его ИИ
Использование генеративных искусственных интеллектов (ИИ) предоставляет огромные возможности, но также несет в себе потенциальные угрозы. Модели ИИ обучаются отклонять опасные запросы, но творческие подсказки могут обойти эту защиту. Теперь Google предлагает вознаграждение тем, кто сможет убедить Google Bard AI (чат-бот с искусственным интеллектом) сделать что-то плохое.
Если вам удастся обойти защиту и заставить Bard сделать что-то недопустимое,
Google готов заплатить вам за это. Компания
будет вознаграждать только за те действия, которые могут быть использованы
хакерами в собственных целях. Скорее всего вам не зачтется, если вы сможете
убедить ИИ: использовать ругательные слова, дать вам ключи от системы Windows,
создать угрозу вашей безопасности
Компания считает, что только так сможет выявить слабые места в модели ИИ, путем отправки ей подсказок и проверки реальными лицами. Google стремится к созданию более надежных технологий, которые могут служить обществу. Подобные программы вознаграждения будут создавать более ответственную и безопасную цифровую среду для всех пользователей.