«Яндекс» усовершенствовал технологию генерации изображений
Нейросеть для генерации изображений от Яндекса YandexART получила очередное обновление. Так, стала известно, что версия YandexART 1.3 перешла на латентную диффузию.
Собственно, суть технологии заключается в том, что нейросеть осуществляет процесс преобразования изображения в более абстрактное представление, которое содержит в себе сжатую информацию о его структуре и содержании. Оно называется «латентный код».
![](https://img.ixbt.site/live/images/original/33/84/42/2024/04/26/b2d9212042.jpg?w=877)
При генерации новых изображений выборочные данные латентного кода преобразуются в картинку высокого разрешения.
Этот процесс позволяет нейросети распознавать объекты, лица, текстуры и другие ключевые элементы изображения, даже если они не очевидны на первый взгляд. Латентная диффузия также позволяет улучшить его качество в целом.
![](https://img.ixbt.site/live/images/original/33/84/42/2024/04/26/0b141af96d.png?w=877)
Новая технология пришла на смену методу каскадной диффузии, который предполагает многоэтапное уточнение картинки. Благодаря использованию же использования метода латентной диффузии изображения станут еще более четкими и реалистичными.
Также в версии YandexART 1.3 у пользователей появилась возможность создания картинок в различных разрешениях: 16:9, 4:3 или 3:4.
![](https://img.ixbt.site/live/images/original/33/84/42/2024/04/26/e78842e41d.png?w=877)
Опробовать обновление можно уже сейчас на «Шедевруме». Позже, по словам представителей компании, улучшенная генерация изображений станет доступна и в других сервисах «Яндекса».
Источник: Яндекс
0 комментариев
Добавить комментарий
Добавить комментарий