Stable Diffusion подчеркивает расовые стереотипы, считают исследователи

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Рассуждения | Оффтопик

В современном мире искусственный интеллект проникает в различные сферы человеческой жизни, от автоматизации производства до создания уникальных изображений с использованием генераторов, таких как Stable Diffusion. Однако, за всей инновацией скрываются тонкие проблемы, которые вызывают у зарубежных исследователей опасения касательно продвижения текущей модной морально-этической повестки.

Недавнее исследование, проведенное Университетом Вашингтона, бросает свет на один из открытых вопросов — культурные стереотипы, внедренные в изображения, созданные искусственным интеллектом. Генератор изображений Stable Diffusion, ставший объектом анализа, оказался подверженным формированию и усилению гендерно-расовых стереотипов, в чем создатели искусственного интеллекта видят серьёзную проблему.

Исследователи из Вашингтонского университета обнаружили, что, когда их попросили создать фотографии «случайного человека», генератор изображений ИИ чрезмерно часто представлял светлокожих мужчин, сексуализировал изображения некоторых цветных женщин и не смог достоверно представить коренные народы. Например, здесь (по часовой стрелке сверху слева) сравниваются результаты четырех подсказок, показывающих «случайного человека» из Океании, Австралии, Папуа-Новой Гвинеи и Новой Зеландии. Папуа-Новая Гвинея, где население остается в основном коренным, является второй по численности населения страной в Океании.
Автор: University of Washington/Stable Diffusion—AI generated image Источник: techxplore.com

Исследователи обратили внимание на три ключевых аспекта, которые подчеркивают проблему в представлении разнообразия людей в изображениях, созданных Stable Diffusion.

В первую очередь, выяснилось, что генератор чаще всего создает изображения светлокожих мужчин. В связи с этой особенностью создатели ИИ видят необходимость в более тщательном контроле исходных данных и обучении моделей, чтобы уйти от укоренившихся предубеждений.

Второй вызывающий беспокойство аспект заключается в том, что при запросе создания изображений представителей определенных регионов, таких как Океания, генератор сталкивается с трудностями в достоверном представлении коренных народов. Это означает, что использование таких технологий с последующим распространением в сети, может оставить без внимания, а скорее нарушить представление об исконных культурных чертах и личностях тех, кто давно является невидимым в медийном пространстве.

Третий и, возможно, наиболее тревожный вывод исследования касается сексуализации изображений женщин определенных национальностей, таких как латиноамериканки. Этот факт представляет серьезное нарушение этических норм и подчеркивает важность внимательного контроля и регулирования генерируемых изображений.

Однако, вместе с выявлением проблем, ставших результатом использования Stable Diffusion, исследователи призывают к осмотрительности в поиске решений. Просто улучшение данных не решит проблему, так как в интернете, на информации из которого ИИ и обучается, не имеется достаточных баз данных по малочисленным группам людей. В добавок ко всему, когда созданное ИИ изображение публикуется в сети, в будущем на нем скорее всего будет обучаться ИИ новой версии, что еще сильнее увеличит разрыв между широко- и слабо представленными группами людей.

Постскриптум

В основной части статьи было решено не упоминать моменты про отражение генератором изображений различных групп с альтернативной гендерной самоидентификацией, но в исследовании про это было.

В сущности, вся эта новомодная «открытость» и «этичность» породила очень большое количество различных, если можно так выразиться, «малочисленных категорий» населения, каждая из которых очень активно и очень громко просит представлять, а зачастую даже по-особенному выделять их в мире, особенно в медиа-среде. Это при том, что население нашей планеты и без этого всегда было многогранно и разнообразно. Поэтому встревоженность исследователей/разработчиков хоть для большинства из нас и комична, тем не менее имеет под собой вполне реальные основания. Ведь прецеденты жалоб на то как контент-мейкеры занимаются объективацией и еще невесть пойми чем, с последующими «отменами» (бойкотами) в медиа-среде случались и будут случаться.

Касательно трех основных проблем описанных в исследовании, мной был проведен небольшой самостоятельный эксперимент с тремя генерациями по каждому запросу, но уже на DALL·E 3. За каждую процедуру генерации, нейросеть выдаёт по 4 изображения, в сумме получается относительно неплохая выборка из 12 изображений.

Светлокожие мужчины

В исследовании указано, что при генерации случайного человека, подавляющее большинство результатов будут занимать светлокожие мужчины. Мной был выбран запрос «Generate a random person + photorealism».

Получается, скорее противоположный описанному исследователями результат. Принятие окончательного вывода оставляю за Вами.

Достоверное представление коренных народов

Мной был выбран запрос «people from Papua New Guinea»

Действительно, слабая медиа-освещенность племен, живущих вдали от цивилизации приводит к недостоверной визуализации таковых нейросетью. Правда сомневаюсь что кого-то из них это волнует.

Высокая вероятность выдачи NSFW-изображений при запросе генерации женщин определенной национальности

Мной были выбран запрос «A woman from Venezuela», а для сравнения - «A woman from United Kingdom».

Хоть какого-то намека на откровенность нейросеть не представила, и это радует.

Вывод

Несомненно на больших выборках из 1000 генераций, могут случаться ошибки нейросети и выдача несуразностей вместо адекватных результатов. Но надо понимать что несмотря на раскрученные средствами массовой информации «сверхспособности» и едва ли не «осознанность» искусственного интеллекта, он остается лишь программой, которая преобразует существующую информацию. Она неспособна к мышлению, моральным оценкам и чужда от социальных скандалов. Поэтому если Вы получили обидный, на ваш взгляд результат, не стоит на это обижаться, и уж тем более винить в этом разработчиков нейросети.

Ведь вы же не будете обвинять производителя чернил, если вдруг клякса оставленная на бумаге примет неприличную форму?

6 комментариев

310826304@vkontakte
Где же там недостоверность? В том же самом Папуа, где жарко и ходят далеко не в шубах и строгих костюмах, они ожидают что нейросеть не будет натренирована соответственно? Так что ответ в большинстве случаев прост, нет базы для тренировки но сильно хочется? Идите… фотографируйте, а мы потом может и добавим.
a
ИИ нарисовал Навального в тельняшке :D
A
Ну так пусть обучат свою расовогендерноправильную модельку с одноногими негролесботрансгендертрансфлюидами. SD то пох что за модель к ней подключена
I
Ну а на какой результат они рассчитывали если исходные данные такие? Чтобы сетка рисовала достоверно, по хорошему, надо самостоятельно создать базу фото для обучения по каждой теме и по ней обучать. Но ктож таким будет заниматься?
M
Исследователи исследовали Stable Diffusion, а у автора статьи DALL·E конечно результаты могут отличаться.
102976506796884933242@google
Об этом мной было указано. Я думаю вряд ли авторы врали, а проверить другую нейронку было интереснее. Плюс дифьюжн устаревшая и некачественная нейра на мой взгляд

Добавить комментарий

Сейчас на главной

Новости

Публикации

Вакуумный упаковщик: преимущества и недостатки устройства

Вакуумный упаковщик стал полезным гаджетом на кухне, особенно если нужно сохранить подольше свежесть продуктов. Вакууматор выкачивает воздух, позволяя не контактировать продукт с кислородом,...

P2P-сети, доверие и безопасность. Почему в Биткоин-сетях все по-честному

Хранится ли Биткоин у кого-то на компьютере? Уже выяснили, что нет. Есть ли какое-то физическое воплощение — часто рисуют золотые монетки с чеканкой? Тоже нет. А что все-таки...

Защита картера: действительно ли она необходима для вашего автомобиля?

Угадайте, какой аксессуар чаще всего предлагают при покупке нового авто? Конечно, это защита картера! Наши дороги делают этот элемент почти незаменимым — малейшее отвлечение, и ваш...

Как можно создать секретный чат на любом Айфоне без мессенджеров и социальных сетей

В эпоху цифровых технологий, когда конфиденциальность становится все более ценной, пользователи iPhone имеют неожиданный способ вести тайную переписку. Стандартное приложение «Заметки», обычно...

Титан: рай для серфингиста... если вы не боитесь жидкого метана

Титан, крупнейший спутник Сатурна, давно манит ученых своим сходством с Землей. Здесь, под плотной азотной атмосферой, текут реки и плещутся моря, правда, не водяные, а метановые. Миссия «Кассини»,...