Эксперимент: как нейросеть справится с визуализацией известных русских пословиц и поговорок
Сегодня нейросети на слуху у каждого человека, даже если он никак не связан с IT, не ведет свой блог, не публикует посты в соц.сетях и не является авторам текстов для интернет изданий.
Нейросети могут все! Написать программный код, статью или даже ВУЗовский диплом. Ну а сгенерировать иллюстрацию – вообще без проблем. Главное сделать запрос, который наиболее точно, четко и конкретно отражает желаемую иллюстрацию. Но это будет, так сказать, «прямой запрос». А если запрос с аллегорией, «вторым смыслом», юмором или закавыкой? Насколько «качественно» и адекватно нейронная сеть справится с такой задачей? Решил проверить это на примере создания нейросетью иллюстраций на тему известных русских пословиц и поговорок.
Заморачиваться с «англоязычными» нейросетями не стал, так как запрос сначала надо будет перевести на английский. Ага, попробуйте получить «адекватный» перевод пословицы с русского на английский. Слова будут те же, а вот скрытый смысл, подтекст и изюминка пропадут. Поэтому решил провести эксперимент с «русскоязычной» нейросетью от Сбера для генерации картинок из текста. ruDALL-E, хоть и является мульти язычной, но "заточена" под русский язык. Что нам и надо. Еще пара плюсов – не требует регистрации, бесплатная (по крайней мере пока). Да и сам процесс составления запроса и выбор настроек для генерации изображения прост до безобразия. Есть как десктопная, так мобильная версии нейросети (называется «Салют»).
Заходим на сайт https://rudalle.ru. Вводим текстовый запрос для генерации картинки (для примера я сделал запрос «Кошка на окне ест сметану»).
Выбираем из предлагаемого списка предпочтительное разрешение для будущей картинки (можно запросить как вертикальное или горизонтальное расположение изображения, так и квадратное).
Выбираем опять же из предлагаемого списка стиль, в котором будет выполнена картинка. Всего стилей двадцать. Я посчитал, что для генерации иллюстраций пословиц и поговорок наиболее уместен будет стиль «Мультфильм».
После этого кликаем на «Отправить» и для того, чтобы нейросеть убедилась, что вы человек, а не робот, с помощью ползунка выравниваем предлагаемую картинку.
Всё. Начинается генерация. Процесс занимает приблизительно от тридцати секунд до одной минуты.
Получаем результат! Не шедевр, конечно, но довольно прилично, на мой взгляд. Картинкой сразу со страницы результата можно поделиться в соц.сетях или скачать её.
Ну а теперь перейдем непосредственно к эксперименту. Было сгенерировано десять картинок, текстовыми запросами для которых являлись известные русские пословицы и поговорки. Чтобы при просмотре читателями результатов эксперимента создать небольшую интригу, сами пословицы и поговорки, на которые были нейросетью созданы картинки, я спрятал под спойлером после каждой картинки. А теперь попробуйте угадать по какой пословице или поговорке ИИ сгенерировал иллюстрацию.
Как кажется лично мне, нейросеть справилась с задачей суммарно на твердую троечку с плюсом. Пара картинок, на мой взгляд, вообще «очень далека» не только от смысла «второго дна», присущего данному словесному жанру, но и даже от ключевых слов запроса. Правда необходимо учесть, что текстами запросов были не четкие и однозначные описания требуемого изображения, а народная фольклорная мудрость. А работу же выполнял хоть и интеллект, но все же искусственный.
13 комментариев
Добавить комментарий
https://rudalle.ru/check_kandinsky2/dd37a3916d594ec2ba5f00a172049766#
правообладатель ПАО СберБанк©, 2023 год, все права защищены
По мне лучше использовать fusionbrain, там ты хотя бы можешь попробовать стереть кусок и сгенерировать заново.
Бот в телеграмме, позволяет например смешивать картинки.
Вообще блин, сетка иногда даже в запрос не попадает, генерирует фигню какую-то. Очень часто какие-то проблемы с лицами, в частности с глазами. Но порой справляется не плохо. Короче им бы сети больше качественных материалов скормить и до обучить.
А вот с парнями чаще дефекты вылезают.
.
Это по мимо того, что он банально порой рисует каких то чудовищ, в плане какие-то элементы врастают в лицо.
.
Я бы сказал, что нынче нейросеть на уровне беты. Работает, что уже хорошо, но есть очевидные проблемы.
Добавить комментарий