Яндекс обновил генеративную модель YandexART в Шедевруме: она создаёт картинки быстрее и качественнее предыдущей версии

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

В свежем обновлении платформы Шедеврум от компании Яндекс была апгрейднута генеративная модель YandexART, что привело к существенному улучшению как скорости, так и качества сгенерированных изображений по сравнению с предыдущей версией. Основное изменение затронуло метод генерации, переходящий от каскадной диффузии к латентной.


Автор: Bekzhan Talgat Источник: unsplash.com

Прежде для создания изображения с использованием каскадной диффузии нейросеть начинала с генерации небольшого изображения из визуального шума, затем постепенно повышала его разрешение, добавляя детали на каждом этапе. В свою очередь, латентная диффузия предполагает преобразование текстового запроса в латентный код, содержащий сжатую информацию о яркости, цвете и структуре изображения. Далее, применяя метод диффузии с многостадийным улучшением, система формирует финальное изображение высокого разрешения за один шаг.

Автор: t.me/techno_yandex Источник: t.me

Этот подход позволил YandexART существенно повысить как качество, так и скорость генерации изображений. Благодаря тому, что процесс создания картинки осуществляется за один шаг, время на обработку сократилось, что, в свою очередь, повышает эффективность сервиса.