«Яндекс» усовершенствовал технологию генерации изображений

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

26 апреля 2024, 18:53

Нейросеть для генерации изображений от Яндекса YandexART получила очередное обновление. Так, стала известно, что версия YandexART 1.3 перешла на латентную диффузию.

Собственно, суть технологии заключается в том, что нейросеть осуществляет процесс преобразования изображения в более абстрактное представление, которое содержит в себе сжатую информацию о его структуре и содержании. Оно называется «латентный код».

Автор: @kandinsky21_bot

При генерации новых изображений выборочные данные латентного кода преобразуются в картинку высокого разрешения.

Этот процесс позволяет нейросети распознавать объекты, лица, текстуры и другие ключевые элементы изображения, даже если они не очевидны на первый взгляд. Латентная диффузия также позволяет улучшить его качество в целом.

Автор: YandexART Источник: yandex.ru

Новая технология пришла на смену методу каскадной диффузии, который предполагает многоэтапное уточнение картинки. Благодаря использованию же использования метода латентной диффузии изображения станут еще более четкими и реалистичными.

Также в версии YandexART 1.3 у пользователей появилась возможность создания картинок в различных разрешениях: 16:9, 4:3 или 3:4.

Автор: YandexART Источник: yandex.ru

Опробовать обновление можно уже сейчас на «Шедевруме». Позже, по словам представителей компании, улучшенная генерация изображений станет доступна и в других сервисах «Яндекса».