Эксперимент: как нейросеть справится с визуализацией известных русских пословиц и поговорок

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Рассуждения | Оффтопик

Сегодня нейросети на слуху у каждого человека, даже если он никак не связан с IT, не ведет свой блог, не публикует посты в соц.сетях и не является авторам текстов для интернет изданий.

Нейросети могут все! Написать программный код, статью или даже ВУЗовский диплом. Ну а сгенерировать иллюстрацию – вообще без проблем. Главное сделать запрос, который наиболее точно, четко и конкретно отражает желаемую иллюстрацию. Но это будет, так сказать, «прямой запрос». А если запрос с аллегорией, «вторым смыслом», юмором или закавыкой? Насколько «качественно» и адекватно нейронная сеть справится с такой задачей? Решил проверить это на примере создания нейросетью иллюстраций на тему известных русских пословиц и поговорок.

Автор: pixabay

Заморачиваться с «англоязычными» нейросетями не стал, так как запрос сначала надо будет перевести на английский. Ага, попробуйте получить «адекватный» перевод пословицы с русского на английский. Слова будут те же, а вот скрытый смысл, подтекст и изюминка пропадут. Поэтому решил провести эксперимент с «русскоязычной» нейросетью от Сбера для генерации картинок из текста. ruDALL-E, хоть и является мульти язычной,  но "заточена" под русский язык. Что нам и надо. Еще пара плюсов – не требует регистрации, бесплатная (по крайней мере пока). Да и сам процесс составления запроса и выбор настроек для генерации изображения прост до безобразия. Есть как десктопная, так мобильная версии нейросети (называется «Салют»).

Заходим на сайт https://rudalle.ru. Вводим текстовый запрос для генерации картинки (для примера я сделал запрос «Кошка на окне ест сметану»).

Выбираем из предлагаемого списка предпочтительное разрешение для будущей картинки (можно запросить как вертикальное или горизонтальное расположение изображения, так и квадратное).

Выбираем опять же из предлагаемого списка стиль, в котором будет выполнена картинка. Всего стилей двадцать. Я посчитал, что для генерации иллюстраций пословиц и поговорок наиболее уместен будет стиль «Мультфильм».

После этого кликаем на «Отправить» и для того, чтобы нейросеть убедилась, что вы человек, а не робот, с помощью ползунка выравниваем предлагаемую картинку.

Всё. Начинается генерация. Процесс занимает приблизительно от тридцати секунд до одной минуты.

Получаем результат! Не шедевр, конечно, но довольно прилично, на мой взгляд. Картинкой сразу со страницы результата можно поделиться в соц.сетях или скачать её.

Ну а теперь перейдем непосредственно к эксперименту. Было сгенерировано десять картинок, текстовыми запросами для которых являлись известные русские пословицы и поговорки. Чтобы при просмотре читателями результатов эксперимента создать небольшую интригу, сами пословицы и поговорки, на которые были нейросетью созданы картинки, я спрятал под спойлером после каждой картинки. А теперь попробуйте угадать по какой пословице или поговорке ИИ сгенерировал иллюстрацию.

Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Не место человека красит, а человек место.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - хорошо)
Заставь дурака Богу молиться, он и лоб расшибёт.
Пословица или поговорка, на основе которой создана иллюстрация (результат - неудовлетворительно)
Всяк кулик своё болото хвалит.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Без труда не вытянешь (вытащишь) и рыбку из пруда.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - отлично)
Не буди лихо, пока оно тихо.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - хорошо)
В тихом омуте черти водятся.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Лучше синица в руках, чем журавль в небе.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - хорошо)
Работа не волк, в лес не убежит.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Бог не выдаст — свинья не съест.
Автор: rudalle
Пословица или поговорка, на основе которой создана иллюстрация (результат - удовлетворительно)
Дареному коню в зубы не смотрят.

Как кажется лично мне, нейросеть справилась с задачей суммарно на твердую троечку с плюсом. Пара картинок, на мой взгляд, вообще «очень далека» не только от смысла «второго дна», присущего данному словесному жанру, но и даже от ключевых слов запроса. Правда необходимо учесть, что текстами запросов были не четкие и однозначные описания требуемого изображения, а народная фольклорная мудрость. А работу же выполнял хоть и интеллект, но все же искусственный.

13 комментариев

А
да так и есть
https://rudalle.ru/check_kandinsky2/dd37a3916d594ec2ba5f00a172049766#
правообладатель ПАО СберБанк©, 2023 год, все права защищены
mixtrum
В том и была «цель» эксперимента. Вывод: на данный момент времени нейросеть (по крайней мере от Сбера) не может выдать адекватную картинку по запросу, имеющему «скрытый» смысловой подтекст. Оно и понятно. Эксперимент, правда, в данном случае, звучит слишком громко. Скорее проверка идеи и удовлетворение любопытства :-)
Nic9
Наверно хорошее развлечение для умственно отсталых…
Ploh
Ой, не стал бы я так огульно ярлыки вешать, тем более в такой светлый день добра и радости. Скорее хорошее развлечение для таких людей, о которых Вы пишите, это самому не написав ни одной статьи оставлять под статьями других авторов такие комментарии для поднятия своего эго исключительно в своих же глазах.
H
Для того, чтобы быть критиком не обязательно самому написать «Войну и мир».
mixtrum
Для того, чтобы быть настоящим профессиональным критиком надо знать и уметь больше автора. Для того, чтобы быть критиком-троллем не надо ничего — хайп и злобность превыше всего.
Sawaru
Честно говоря, кадинский, хреновастенькая нейросеть. Явно проблемы с материалами обучения. Оптимальным выглядит разрешение 768х768, пробовал генерировать, при разрешении выше, но артефактов, субъективно, становится больше.
По мне лучше использовать fusionbrain, там ты хотя бы можешь попробовать стереть кусок и сгенерировать заново.
Бот в телеграмме, позволяет например смешивать картинки.

Вообще блин, сетка иногда даже в запрос не попадает, генерирует фигню какую-то. Очень часто какие-то проблемы с лицами, в частности с глазами. Но порой справляется не плохо. Короче им бы сети больше качественных материалов скормить и до обучить.

mixtrum
Однозначно, что нейросеть Сбера не может похвастаться корректной обработкой запросов, содержащих устойчивые выражения. По крайней мере… пока.
Sawaru
Да там даже с обычным запросами бывает беда. Он мне как то в место котика, выдал хорька или нечто похожее. Или в место мужчины подсунул женщину. Был ещё момент, когда в место киберпанка он выдал, просто картинку с буквами.
mixtrum
Дела запрос «красивая стройная девушка с цветами». Картинка получилась — класс. Девушка действительно вышла красивой, цветы — прелесть. Но вот на руке, которой девушка держала букет, шесть пальцев. Наверное жила в районе Чернобыля…
Sawaru
Да с пальцами, у большинства проблемы. Кстати девушки у данной сети получаются по лучше.
А вот с парнями чаще дефекты вылезают.
.
Это по мимо того, что он банально порой рисует каких то чудовищ, в плане какие-то элементы врастают в лицо.
.
Я бы сказал, что нынче нейросеть на уровне беты. Работает, что уже хорошо, но есть очевидные проблемы.
M
С трудом догадался про разбитый лоб, остальное мимо…

Добавить комментарий

Сейчас на главной

Новости

Публикации

Как можно создать секретный чат на любом Айфоне без мессенджеров и социальных сетей

В эпоху цифровых технологий, когда конфиденциальность становится все более ценной, пользователи iPhone имеют неожиданный способ вести тайную переписку. Стандартное приложение «Заметки», обычно...

Титан: рай для серфингиста... если вы не боитесь жидкого метана

Титан, крупнейший спутник Сатурна, давно манит ученых своим сходством с Землей. Здесь, под плотной азотной атмосферой, текут реки и плещутся моря, правда, не водяные, а метановые. Миссия «Кассини»,...

Обзор накопителя 2.5" Orico Y-20 512 ГБ

Сегодня вспомним, что помимо распространенных накопителей NVMe SSD M2, существуют и даже используются еще другие стандарты. Стандарт 2,5″ SSD пришел на смену медленным HDD, и еще используется...

Не просто камни из космоса: неочевидные факты о Земле, открытые благодаря метеоритам

Они прибывают на Землю, словно письма из прошлого, запечатанные в огненных конвертах, — безмолвные вестники, несущие на своих оплавленных боках отпечатки эпох. Метеориты, а также их...

Докатка: как избежать опасностей на временном колесе

На дорогах часто случаются непредвиденные ситуации, и одна из самых распространённых — это поломка или повреждение колеса. В такие моменты на помощь приходит докатка, маленькое и удобное...