Как поиграть с нейросетью Midjourney и создать произведения искусства за секунды

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Недавно «Пражская медиашкола» сделала гид по нейросети Midjourney и разобралась, как формулировать запросы и какие нужны параметры, чтобы создать произведение искусства. Но о них попозже, давайте сначала разберёмся, откуда вообще появилась эта нейросеть и почему о ней сегодня говорит весь интернет.


Дело в том, что эта нейросетка генерирует картинки, которые легко можно принять за произведения профессиональных иллюстраторов и художников. Но разумеется, стоит это гораздо дешевле, а на создание изображения требуются буквально секунды.

Midjourney разработала одноименная компания, созданная в феврале 2022 года. Этот проект принадлежит учёному Дэвиду Хольцу. Ему всего 33 года, и он выпускник факультета прикладной математики Университета Северной Каролины в Чапел-Хилл. Хольц в студенчестве изучал алгоритмы нейровизуализации, поработал в R&D центре NASA, где работал с технологией LiDAR. В общем, за плечами у Дэвида впечатляющие проекты, в 2011 году он сделал компанию Leap Motion, которая делает датчики движения и системы распознавания жестов. Но в 2021 году он вышел из бизнеса и занялся нейросетями. У компании Midjourney не более 10 человек в штате, нет инвесторов, а деньги вообще не очень интересуют Хольца.

Главное, чего я хочу, — чтобы на ближайшие 10 лет у нас был дом, в котором мы могли бы экспериментировать с технологиями и создавать продукты, которые будут иметь значение не только для меня, но и для всего мира. Ну и получать удовольствие в процессе.

Дэвид Хольц, основатель Midjourney 

Реальное фото Дэвида Кольца

Отмечу, что Midjourney — это далеко не первая и не единственная нейросеть, способная генерировать изображения на основе текстовых запросов. Мир уже потрясали нейросетки OpenAI DALL-E и Google Imagen. Но доступ к ним был ограничен, а здесь вам потребуется лишь бесплатный аккаунт в Discord, чтобы начать.


А вот так Дэвида Хольца видит его же нейросеть. Да, я просто попросил её нарисовать "David Holz"

Примеры изображений Midjourney

Примеры красивых изображений уже публиковались в iXBT.Live, поэтому сильно углубляться в это не буду. Но вот пара примеров, которые я сгенерировал буквально за несколько минут.

Вот, например, запрос: "young 25 years girl, blonde haired, beautiful, pretty, abundant details, insanely detailed, cute girl, photorealistic, ambient light, 4k --ar 16:9"

Правда, похоже на настоящего человека?

А здесь я решил поиграться с нашим основным сайтом, но результат, конечно, далёк от идеала. Запрос был такой: "tech website, technology, future, logo name ixbt.com, address, violet, blogs, 4k --ar 16:9"

Нейросеть Midjourney видит iXBT.com как-то так

Ну и напоследок вот такое изображение. Как видите, можно создавать практически что угодно. Запрос вот такой: "russian modern city with skyscrapers, da vinci style, 8K --ar 16:9"

Как попробовать Midjourney самому

  1. Для начала вам нужно завести аккаунт в Discord. Это делается за пару минут. Да, это популярный сервис для общения в среде геймеров. Но создатель Midjourney выбрал этот инструмент, чтобы люди видели, что делают другие, и таким образом хочет стимулировать креативность.
  2. Зайти на сайт Midjourney и нажать Join the beta. Вас сразу же перекинет в Discord, где нужно будет присоединиться к каналу.
  3. Выбирайте в меню слева комнату newbies, пишите в чате /imagine, а после вбивайте свой запрос на английском языке. Можно написать всё, что угодно, кроме явно запрещенных вещей. Впрочем, нейросеть предупредит вас, если обнаружит, что вы пытаетесь обойти её правила.
  4. В чат одновременно поступают десятки, а то и сотни запросов, поэтому уследить будет сложно. Хотя если вы успеете найти свой запрос, то сможете наблюдать, как создаётся искусство. Если же не успели, Midjourney пришлёт в чат готовое изображение через несколько секунд. Найти его можно будет в папке уведомлений, она находится справа сверху (см. скриншот ниже).
  5. Вот и всё. Можно развлекаться.

Кстати, после того как вы генерировали 4 изображения по запросу, их можно увеличить или изменить. Для этого нужно просто из уведомлений перейти к ответу нейросети в чат и вам будут доступны кнопки. Кнопки с буквой U сделают Upscale нужной картинки, то есть, увеличат разрешение. А кнопки с буквой V предложат другие варианты выбранного изображения. Все созданные изображения будут доступны на этой странице.

Одно из этих изображений как раз стоит в шапке статьи. Сможете найти, какое? 

Какие можно добавить параметры в запрос Midjourney

Несмотря на то, что нейросеть поймёт любой текстовый запрос, есть некоторые параметры, с помощью которых вы сможете настроить то, что выдаст вам Midjourney. Это полезно, если вы хотите не просто поиграться, но создать какое-то произведение искусства, которое затем как-то использовать. Ниже лишь небольшой список параметров, которые я потестировал и считаю их полезными.

  • По умолчанию Midjourney создаёт 4 изображения в формате 1:1. Если вам нужен другой формат, просто добавьте к концу вашего запроса два дефиса без пробела и отношение сторон. Например: --ar 3:4 или --ar 16:9, чтобы получить горизонтальные изображения. Или --ar 9:16, чтобы вышла картинка для сториз.
  • Параметры, обозначающие позицию камеры. Используйте extreme close up / close up / medium shot / long shot / extreme long shot / bird view. Суть должна быть понятна из названий.
  • Можно использовать и фокусное расстояние, фотографы поймут. Пишется вот так: focal length --14mm (wide angle), --500 mm (narrow angle). Лучшие кадры получаются на -- 35mm.
  • Доступен даже зум и выбор зернистости. Для зума используйте параметр --q и цифру. Если нужно подальше, то --q 0.25, а поближе --q 1.25. Это уменьшение в 4 раза или увеличение в 1.25 раз. За зернистость отвечает параметр --ISO, если хотите, чтобы всё было чёткое, то не нужно ставить более --ISO200
  • Есть в Midjourney и вес у слов. Его можно указывать с помощью двойного двоеточия. Например: red::10 ball::1. Это значит, что изображение должно быть скорее красным, чем на нём должен быть изображён мяч. Если вес не добавлять, то нейросеть считает все слова в запросе равноценными.
  • Помимо формата изображения (--ar) можно использовать параметры ширины --w и высоты --h. Причём можно указывать только один. Например, --w 1000, получим изображение с шириной 1000 пикселей, ну а высота будет зависеть от формата.
  • Стилизация и качество. --s  используется для стилизации, а --q -для качества. По умолчанию --s2000, предельное значение — 60 000 , а качество --q1 и до 5.

Кстати, в сети есть два интересных инструмента, в которых не нужно придумывать запросы самому, а просто выбрать из доступных вариантов. Возможно, они помогут вам развить креативность. Это Midjourney Promt Helper и Promptomania. Разумеется, оба они только на английском языке.


В общем, я сторонник того, что лучше один раз самому попробовать, чем сто раз прочитать. Поэтому бегите уже и делайте свои изображения. Благо, 25 штук в день можно делать бесплатно. А вот если хочется больше или есть желание заниматься искусством в личном чате с нейросетью, то тут уже придётся заплатить.