Обзор UI для графических нейросетей WebUI Forge: AUTOMATIC1111 «на стероидах» с поддержкой моделей Flux и нестандартных AI

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Обзор | Программы, сервисы и сайты

В мире генеративного ИИ для создания изображений WebUI от AUTOMATIC1111 давно стал своеобразным золотым стандартом. Мощный интерфейс предлагает глубокую настройку параметров генерации, полную модульность и интуитивно понятное управление, позволяя создавать изображения любой сложности. Неудивительно, что большинство художников и дизайнеров выбирают именно его для работы со Stable Diffusion.

Однако время не стоит на месте. Появление новых моделей, таких как Flux Dev, поставило AUTOMATIC1111 в неудобное положение — интерфейс попросту не поддерживает современные разработки, оставаясь привязанным к классическому Stable Diffusion. К тому же, установка WebUI требует определённых технических знаний, а разработка проекта в последнее время заметно замедлилась.

В такой ситуации появление форков и альтернативных решений было лишь вопросом времени. Среди них особенно выделяется проект Forge — амбициозная попытка создать более современный и функциональный интерфейс на базе проверенного временем AUTOMATIC1111. Давайте разберёмся в особенностях нового решения и определим, действительно ли оно способно стать достойной заменой признанному стандарту.

Автор: LeVK

Амбициозные планы разработчиков Forge

WebUI Forge представляет собой гибрид форка и надстройки над классическим AUTOMATIC1111. Разработчики поставили перед собой задачу решить основные проблемы оригинала, сохранив при этом его сильные стороны.

Ключевой особенностью проекта стала максимальная автоматизация. Установка выполняется буквально «в один клик», а встроенный менеджер памяти самостоятельно оптимизирует использование ресурсов видеокарты. Добавление официальной поддержки моделей семейства Flux существенно расширяет возможности платформы по сравнению с оригиналом.

Разработчики также серьёзно доработали систему расширений. В отличие от оригинального WebUI, где Extensions имели довольно ограниченный функционал, Forge предлагает значительно больше возможностей для интеграции дополнительных инструментов и моделей.

Быстрый старт с WebUI Forge

Установка WebUI Forge радует своей простотой — достаточно скачать архив с официального GitHub-репозитория проекта и распаковать его в удобное место на диске. Дальнейшая настройка сводится к последовательному запуску двух файлов: сначала update. bat, затем run.bat. Скрипты автоматически загрузят все необходимые компоненты и развернут рабочее окружение.

Автор: Microsoft

После установки структура папок окажется знакомой всем пользователям AUTOMATIC1111. Модели Stable Diffusion размещаются в каталоге models/Stable-diffusion, для LoRA-субмоделей нужно создать папку models/lora, апскейлеры отправляются в ESRGAN. Привычная организация файлов позволяет быстро перенести наработки из классического WebUI.

Собственно, это и есть структура папок оригинального WebUI, поэтому папки models и embeddings можно тупо пробросить симлинком.
Автор: Microsoft

Автоматизация установки существенно снижает входной порог для новичков. Больше не нужно разбираться в Git, настраивать Python-окружение и вписывать в «батник» аргументы запуска — Forge берёт эту работу на себя.

Стоит отметить, что автоматизация установки не означает полного отсутствия проблем. Иногда могут возникать проблемы с определением GPU или специфические ошибки, связанные с особенностями конкретной системы; xformers тоже надо устанавливать ручками, если есть такая потребность. Однако в большинстве случаев OOBE проходит гладко и не требует дополнительных настроек.

Знакомый и новый интерфейс

Пользовательский интерфейс Forge унаследовал узнаваемый стиль AUTOMATIC1111, но значительно расширил его функциональность. Главное нововведение — умный селектор моделей, автоматически адаптирующий раскладку под специфику выбранного алгоритма генерации, будь то SD 1. x, SDXL или Flux.

Новые элементы UI отмечены красным
Автор: Forge/AUTOMATIC1111

Для начинающих пользователей добавлена обширная коллекция предустановленных стилей, позволяющая создавать качественные изображения без глубокого понимания промптинга. Встроенная поддержка ControlNet и расширенные настройки в дополнительных вкладках предоставляют профессионалам полный контроль над процессом генерации.

Нативная поддержка ControlNet и множество продвинутых функций в дополнительных вкладках превращают Forge в мощный комплексный инструмент для работы с генеративным ИИ.

Дополнительные «плюшки» для профи. Совместимость ControlNet с Flux обещают в конце ноября, пока только для SD.
Автор: Forge/AUTOMATIC1111

Ключевые фичи: динамический менеджер памяти

Пользователи видеокарт среднего класса прекрасно знают главную боль работы с нейросетями — постоянную нехватку видеопамяти. Ситуация особенно обостряется при частой смене моделей, использовании LoRA и дополнительных расширений. Штатный, весьма рудиментарный менеджер памяти AUTOMATIC1111 справляется с такими сценариями откровенно плохо.

В классическом WebUI приходилось создавать десятки скриптов запуска с разными параметрами оптимизации, постоянно переключаться между обычным режимом и --medvram, терять время на перезапуск интерфейса. К тому же, порой после выгрузки предыдущей модели её «хвосты» оставались в видеопамяти. Несколько «перекидок», и вместо очередной генерации у тебя модель в память не влезла, изволь перезапускать WebUI и снова терять пару минут.

Forge кардинально решает проблему управления памятью. Встроенный менеджер автоматически подбирает оптимальные параметры оптимизации, исходя из объёма доступной VRAM и параметров конкретной модели, грамотно распределяет ресурсы и максимально эффективно использует доступную видеопамять. Работа с интерфейсом становится значительно комфортнее, особенно на системах с ограниченными ресурсами. Более того, переписанный менеджер позволяет хранить «не влезающую» часть модели в ОЗУ, пусть и ценой потери производительности, а не «вылетать» по превышению предела.

Автор: Forge/AUTOMATIC1111

Ах да, всё это — без перезапуска UI, а равно без потери производительности там, где модель влезла бы в память целиком.

Ключевые фичи: поддержка моделей Flux

Одно из главных преимуществ Forge — полноценная поддержка моделей семейства Flux, принципиально несовместимых с архитектурой Stable Diffusion. Разработчики проделали серьёзную работу по интеграции нового формата, открыв пользователям доступ к передовым алгоритмам генерации изображений в рамках единого интерфейса.

Автор: LeVK

Процесс настройки максимально упрощён — Forge автоматически определяет тип модели и применяет соответствующие параметры работы. По сути, в Forge с моделями семейства Flux можно работать почти как со Stable Diffusion — только семплеры другие, заблокирован negative prompt и две «крутилки» CFG. Более подробно о том, как «подружить» Flux и Forge я рассказывал в статье:

Как установить локально генератор изображений Flux AI с интерфейсом AUTOMATIC1111

Ключевые фичи: Forge Spaces

Система Spaces представляет собой одну из самых инновационных разработок команды Forge. По сути, перед нами набор специализированных микро-серверов Gradio, каждый из которых оптимизирован под конкретную задачу. Такой подход позволяет обойти фундаментальные ограничения AUTOMATIC1111 и реализовать принципиально новый функционал.

Работа со Spaces максимально упрощена благодаря автоматизации. Пользователю достаточно нажать Install, затем Launch — и система самостоятельно развернёт необходимый инстанс в отдельной вкладке браузера. Все процессы загрузки и настройки, как и с самим Forge, происходят автоматически, а завершить работу инстанса можно одним нажатием кнопки Terminate в основном интерфейсе.

На текущий момент доступно девять специализированных инстансов, охватывающих задачи от компьютерного зрения до 3D-моделирования. Список и функционал будут пополняться. При этом, поскольку инстансы также основаны на Gradio, они предоставляют полноценный API — так что ничто не мешает, например, «натравить» на распознавалку изображений из Spaces самописный скрипт, чтобы промаркировать 500 картинок из корпуса обучения для тренировки своей LoRA. Или, например, идентифицировать объекты на изображении для каких-то личных нужд.

Недостатки Forge UI

Несмотря на впечатляющий набор преимуществ, WebUI Forge не лишён недостатков. Часть проблем унаследована от AUTOMATIC1111, другие связаны с особенностями новой реализации.

К первой категории относится высокий порог входа. Несмотря на усилия разработчиков по упрощению интерфейса, Forge остаётся профессиональным инструментом, требующим серьёзного погружения — это, все же, профессиональное решение, хоть разработчики и приложили все силы, чтобы сделать «панель управления космолетом» логичной и человекочитаемой.

Автор: LeVK

Также, если у вас всё не запустится «из коробки» — курить мануалы предстоит долго и весело. Это как с Linux на домашнем ПК: или всё работает сразу, из коробки… Или вы возлюбите свой компьютер во всех позах, с мануалами и гайдами «от васянов» вместо личной камасутры.

Из приобретенных недостатков — главным, пожалуй, стала потеря совместимости с расширениями AUTOMATIC1111. Для работы со сложным ИИ-монтажом, постпроцессингом и специфическими задачами приходится сохранять параллельную установку оригинального WebUI. Впрочем, новые возможности самого WebUI и функционал Spaces частично компенсируют этот недостаток.

К тому же, функционал расширений «вообще» остался — просто для Forge их нужно писать заново. Уже есть несколько десятков «портированных» экстеншенов, но на фоне «оригинала» это всё так же капля в море.

Заключение. 70% хорошего, 30% плохого

В целом, я считаю WebUI Forge интересной, многообещающей альтернативой классическому AUTOMATIC1111 — но не без своих недостатков.

С одной стороны, это «однокликовое» профессиональное решение, не требующее для установки ковырялова в консоли, освоения основ Git и прописывания ключей запуска. К тому же, поддержка Flux, уникальный менеджер памяти и не имеющая аналогов «однокликовая» поддержка редких моделей через функционал Spaces также подкупают. Это, как говорил один советский деятель, «70% хорошего». А «30% плохого» тут — в отсутствии поддержки экстеншенов для оригинального AUTOMATIC1111 WebUI, разработанных сообществом, что принуждает держать в соседней папке «оригинальную версию», пробросив модели симлинком, ибо расширения «автоматика», бесспорно, так же незаменимы.

К тому же, ранняя стадия разработки накладывает свой отпечаток — часть заявленного функционала либо не реализована, либо работает нестабильно.

Несмотря на имеющиеся ограничения, Forge определённо заслуживает внимания. Особенно привлекательным решение окажется для пользователей, не зависящих от специфических расширений оригинального WebUI. Проект активно развивается, и многие текущие недостатки наверняка будут устранены в будущих версиях.

В конечном счёте, выбор между Forge и классическим AUTOMATIC1111 зависит от конкретных задач и приоритетов пользователя. Forge как единственный WebUi на компьютере подойдёт тем, кому не нужны расширения как таковые, и «штатных» возможностей окажется достаточно. Для остальных оптимальным решением станет параллельное использование обоих интерфейсов, позволяющее получить лучшее из обоих миров.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Наношу добро, причиняю пользу, благодарен за лайки и содержательные (дополняющие статьи) комментарии.

Сейчас на главной

Новости

Публикации

Модернизация аудио в классике: слушаем свою музыку в ВАЗ-2101 и ГАЗ-24 без замены радио

В этой статье я расскажу, как не меняя родной радиоприемник на классических ретро-автомобилях, слушать свою музыку, а не только радиостанции. Поделюсь своим опытом, как я решил эту задачу на своем...

11000 рублей, но не больше: обзор HUAWEI nova Y91

Как-то на очередной распродаже проскочил мимо меня смартфон, цена которого была в районе 10000 рублей. Мне как раз нужен был смартфон для знакомого, который должен был укладываться в этот бюджет....

Обзор аккумуляторной воздуходувки BoxBot CB203: без шансов для пыли у компьютера

Сегодня расскажу о воздуходувке Boxbot, модель СB 203. Эта компактная и достаточно мощная воздуходувка. Хотя она не является самой мощной в своем классе, по соотношению «цена, мощность и...

Спутники против пластика: как BPDI уберет мусор с пляжей

Пластик на пляжах — это прям беда! Он вредит всему живому: животные могут его проглотить, а потом этот пластик разлагается на мельчайшие частички и попадает в моря да океаны. Да и...

Как обжаривают кофе?

Когда мы наслаждаемся ароматной чашкой кофе, мы редко задумываемся о том, сколько мастерства вложено в создание этого вкуса. Но за каждым зерном стоит процесс, который придаёт напитку его...

Почему всегда буксует одно колесо и как с этим бороться

Ситуация знакома каждому водителю: попал на снег, грязь или скользкий асфальт — и вот уже одно колесо крутится вхолостую, как будто издевается. Остальные колеса безучастно смотрят, пока...