Как установить локально генератор изображений Flux AI с интерфейсом AUTOMATIC1111: без технических знаний

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Гайд | Программы, сервисы и сайты

Мир генеративных нейросетей стремительно развивается, и на сегодняшний день золотым стандартом в сфере полупрофессиональной и профессиональной генерации изображений заслуженно считается пользовательский интерфейс WebUI AUTOMATIC1111. Он предлагает максимальную глубину настройки параметров, полную модульность через систему расширений и при этом сохраняет относительно понятный пользовательский интерфейс. Однако у классического решения есть два существенных ограничения: сложность в начальной установке и полная несовместимость с моделями нового поколения Flux Dev.

На помощь приходит специальная версия знакомого интерфейса — Forge UI, способная работать как с классическими моделями Stable Diffusion, так и с новейшими разработками от Flux (и многое другое, но это тема отдельной статьи). Сегодня я расскажу, как быстро развернуть локальную версию генератора изображений на базе Flux AI, используя модифицированный интерфейс AUTOMATIC1111, и настроить его для максимально эффективной работы.

Автор: LeVK

Системные требования: что нужно для комфортной работы

Для полноценной работы с моделью Flux Dev методом локальной установки потребуется серьёзная аппаратная база. Главное требование — наличие видеокарты с объёмом видеопамяти от 12 гигабайт и достаточного количества оперативной памяти. При 14 и более гигабайтах VRAM хватит 16 гигабайт ОЗУ, но в противном случае понадобится 32 гигабайта — модель будет частично дублироваться в оперативную память.

На практике минимальные требования означают использование видеокарт уровня десктопной GeForce RTX 4070, мобильной RTX 4080 или их аналогов от AMD либо предыдущих поколений NVIDIA. К процессору особых требований нет — генерация изображений преимущественно нагружает GPU, но крайне рекомендуется наличие быстрого SSD. Для установки базового набора потребуется около 30 гигабайт на накопителе, но финальный размер будет зависеть от количества установленных моделей и дополнений.

Разработчики позаботились и о пользователях менее производительных систем, выпустив облегчённые версии модели — Flux Schnell и Flux Dev nf4-v2. Они способны работать на видеокартах с 8, 6 и даже 4 гигабайтами видеопамяти, хотя в последнем случае производительность будет находиться на грани приемлемой.

Облегчённые версии демонстрируют качество на уровне SDXL при несколько сниженной скорости работы, но лучше понимают текстовые описания и позволяют формулировать запросы естественным языком. Единственное существенное ограничение — невозможность использования LoRA-субмоделей, созданных сообществом, поскольку они разрабатываются исключительно для «полноценной» версии Flux Dev.

Устанавливаем Forge UI

Forge UI — гибридное решение: наполовину форк, а наполовину надстройка над классическим интерфейсом AUTOMATIC1111. Основная цель разработчиков заключалась в создании максимально простого процесса установки по принципу «в один клик» для любой системы на базе Windows 10 версии 21H2 и новее.

Поэтому процесс установки предельно прост: достаточно скачать архив «всё-в-одном» с официальной страницы проекта на GitHub, распаковать его в удобное место на диске и последовательно запустить два файла: сначала update. bat, а затем run.bat. Установочный скрипт автоматически загрузит все необходимые компоненты из интернета и настроит окружение. При успешном завершении процесса (а он практически всегда проходит без сбоев) в браузере автоматически откроется слегка модифицированная версия знакомого интерфейса AUTOMATIC1111.

После появления веб-интерфейса рекомендуется закрыть и браузерное окно, и консоль, в которой работает серверная часть UI — пришло время установить саму модель генерации изображений.

Устанавливаем модель Flux: готовимся к работе

Следующий шаг — загрузка непосредственно модели Flux. Официальные версии Flux Dev и Schnell доступны на платформе CivitAI — крупнейшем сообществе энтузиастов генеративного ИИ в интернете. Если вы раньше не слышали об этой площадке, настоятельно рекомендую присмотреться внимательнее: там можно найти тысячи моделей, сотни тысяч субмоделей, а также невероятно активное сообщество разработчиков и художников.

Автор: СivitAI Источник: civitai.com

Облегчённую версию Dev nf4-v2 придётся скачивать отдельно — она размещена на платформе Huggingface. После загрузки файла модели необходимо поместить его в правильную директорию: откройте папку, куда был распакован Forge UI, найдите в ней подпапку webui, затем models, и внутри неё — stable-diffusion. Именно сюда следует поместить скачанный файл модели. Важное замечание: в отличие от моделей Stable Diffusion, для Flux не требуется отдельный VAE-файл.

Автор: Microsoft

Если вы также планируете использовать дополнительные субмодели (LoRA), создайте новую папку с названием lora внутри директории models и скопируйте туда скачанные файлы. После завершения копирования можно снова запустить run. bat — теперь UI увидит установленную модель и позволит приступить к настройке рабочего окружения.

Первичная настройка: оптимизируем производительность

Благодаря гибкости базового интерфейса AUTOMATIC1111 и дополнительным возможностям Forge UI, пользователь получает широкие возможности по настройке рабочего окружения под свои потребности. Начнём с оптимизации производительности и настройки пользовательского интерфейса.

Первым делом необходимо отключить функцию предварительного просмотра: переходим в раздел Settings, выбираем вкладку Live previews и деактивируем соответствующую опцию. Функция предпросмотра практически бесполезна в реальной работе, но существенно снижает скорость генерации — на треть при достаточном объёме видеопамяти и вдвое при её дефиците.

Автор: Forge/AUTOMATIC1111

На следующем этапе настраиваем базовый пресет генерации: во вкладке «UI defaults 'flux'» корректируем параметры в соответствии с рекомендованными значениями.

То, что трогать НЕ надо — замазано. Если хотите генерацию в 16:9 — выставьте вместо этого 1311x737
Автор: Forge/AUTOMATIC1111

Не бойтесь экспериментировать с настройками — я считаю предложенный пресет оптимальным для большинства задач, но ваши потребности могут отличаться.

Например, для txt2img также очень хорошо работает семплер Flux Realistiic+Simple, но ему обязателен апскейлер — лично я пользуюсь 4x NMKD с того же CivitAI.

После внесения изменений последовательно нажимаем «Apply settings» и «Restart UI». Завершающий штрих — по желанию можно отключить неиспользуемые расширения во вкладке Extensions для разгрузки интерфейса, после чего снова требуется перезапуск через «Apply and restart UI».

Как пользоваться Forge UI и Flux: особенности работы

После завершения настройки можно приступать к генерации изображений. Пользовательский интерфейс во многом похож на классический AUTOMATIC1111, но имеет ряд важных особенностей и дополнительных элементов управления.

В панели настроек теперь присутствуют два ползунка CFG Scale — рекомендуется использовать левый, а правый лучше не трогать без чёткого понимания его назначения. Блок negative prompt неактивен, поскольку модели семейства Flux не поддерживают данный функционал.

Главное отличие в работе заключается в формулировке запросов: промты необходимо писать естественным языком, максимально подробно описывая желаемый результат. Полезный совет: для составления детальных описаний можно использовать языковые модели вроде Claude — они отлично справляются с формулировкой развёрнутых промтов.

Проверяем себя

Если вы все сделали правильно, попробуйте ввести следующие параметры. Промт:

A weathered wooden house with peeling paint and exposed timber, dark brown and gray tones dominate the facade, wooden shutters hang slightly crooked on hinged windows. A wild overgrown garden surrounds the house, tall grass and wildflowers push through old stepping stones, climbing vines creep up the walls and wrap around porch pillars. A simple hand-painted sign reading «FLUX» in bold white letters hangs beside the worn wooden front door, the sign appears slightly faded and tilted. Captured on vintage 1980s film stock, with characteristic grain texture, slightly muted colors, and warm color shifts typical of aged photographs, light leaks visible in the corners add authenticity. The composition has subtle blur and soft focus areas, typical of cameras from that era, natural lighting suggests late afternoon with long shadows and golden undertones.

Seed — 4066441670. Если у вас модель Flux Dev, и все устаовилось правильно — вы увидите вот такую картинку:

Автор: LeVK

Заключение

На мой взгляд, Forge UI — действительно лучшее решение для локального запуска Flux. ComfyUI при всех достоинствах, на мой взгляд, совершенно контринтуитивен, а другие альтернативы страдают либо от сложности установки, либо от неудобного интерфейса, либо от недостатка функционала. Хотя и у этого решения, бесспорно, есть свои недоостатки.

В любом случае, установив Forge UI с Flux, вы получаете мощный инструмент для создания изображений, сочетающий простоту использования с широкими возможностями настройки. А пока рекомендую ознакомиться с полным обзором Flux UI — функционал интерфейса выходит далеко за рамки работы с Flux.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Наношу добро, причиняю пользу, благодарен за лайки и содержательные (дополняющие статьи) комментарии.

Сейчас на главной

Новости

Публикации

Kinera Celest CD-20 — обзор мощного портативного ЦАПа на чипе ES9039Q2M

Kinera, известный производитель портативного аудио, представил новый ЦАП от своего суббренда Celest. Новинка получила новый производительный чип ES9039Q2M, а также хорошее усиление. Максимальная...

Модернизация аудио в классике: слушаем свою музыку в ВАЗ-2101 и ГАЗ-24 без замены радио

В этой статье я расскажу, как не меняя родной радиоприемник на классических ретро-автомобилях, слушать свою музыку, а не только радиостанции. Поделюсь своим опытом, как я решил эту задачу на своем...

11000 рублей, но не больше: обзор HUAWEI nova Y91

Как-то на очередной распродаже проскочил мимо меня смартфон, цена которого была в районе 10000 рублей. Мне как раз нужен был смартфон для знакомого, который должен был укладываться в этот бюджет....

Обзор аккумуляторной воздуходувки BoxBot CB203: без шансов для пыли у компьютера

Сегодня расскажу о воздуходувке Boxbot, модель СB 203. Эта компактная и достаточно мощная воздуходувка. Хотя она не является самой мощной в своем классе, по соотношению «цена, мощность и...

Спутники против пластика: как BPDI уберет мусор с пляжей

Пластик на пляжах — это прям беда! Он вредит всему живому: животные могут его проглотить, а потом этот пластик разлагается на мельчайшие частички и попадает в моря да океаны. Да и...

Как обжаривают кофе?

Когда мы наслаждаемся ароматной чашкой кофе, мы редко задумываемся о том, сколько мастерства вложено в создание этого вкуса. Но за каждым зерном стоит процесс, который придаёт напитку его...