ИИ Suno создает и исполняет музыку

Вступление

Первое (вместо дисклеймера): автору настоящего материала угодно нарушить многовековую традицию подачи текста не от первого, а от третьего лица. Что-то в ней (традиции) представляется слишком архаичным, бюрократичным и выхолощенным и вдобавок навевает сравнение с Азией (дикость, господа: «не угодно ли будет великому эмиру...»). Скрываться за третьим лицом не хочется, тем более что авторский подход — основа доверительного отношения к содержанию и примета новейшего времени с его блогами, твитами и прочей писаниной-отсебятиной. Поэтому пишу от себя.

Второе, о чем я хотел бы сказать, — о мотивах, сфокусировавших мои интересы на генерации треков средствами нейросети. Всё началось с автомобильной музыки, точнее с ее запаса на смартфоне и разных других носителях. Музыка в машине звучит постоянно, но старые треки (хотя и присутствуют в изобилии), как говорится, затерты до дыр, их повторение уже давно тяготит, а репертуар обновляется довольно редко. Из новинок хочется переслушать лишь немногое. Я решил обратиться за помощью к нейросети — в том смысле, что с ее помощью можно «нагенерить» много новой музыки, которая будет соответствовать моим вкусам и предпочтениям. После нескольких недель знакомства с разными решениями я выяснил, что самый приемлемый для меня вариант (по состоянию на июнь 2024 г.) — это Suno.ai. То есть да, конечно, это не единственный аванпост ИИ в музыкальной индустрии, но сколько-нибудь достойную альтернативу найти просто не удалось.

В этом месте следует упомянуть про третий инициальный момент: никаких отношений с Suno у меня и нашей редакции нет. То есть платим мы за подписку на этот сервис (точнее, подписки, их на сегодня три) из собственного кармана; никаких выплат, скидок и преференций от тамошнего юрлица, его представителей и сотрудников не получаем. Ни этот текст, ни другие возможные следы Suno в наших публикациях не носят рекламного характера, а комментарии отражают личную позицию автора как физического лица, а не редакции как лица юридического.

Вернусь к альтернативе. Интересующиеся могут сходу назвать с полдесятка других ИИ-генераторов музыки, но по сравнению с Suno достоинств у них намного меньше, а ограничений и сложностей при использовании значительно больше. Некоторые из таковых вообще делают конкурентов малоупотребимыми, особенно в реалиях нашего отечества.

Например, Udio считается не в пример более профессиональным инструментом, создающим аудиоконтент более высокого качества, но при этом не умеет работать с русским языком, создает композиции максимальной длительностью шестьдесят секунд, а процедура подготовки задания (промта) для генерации довольно сложна. У Suno максимальная длительность композиции — четыре минуты (!), есть возможность добавлять к уже созданному треку расширения (дополнения) и затем объединить всё это в общее произведение большой длительности (не проверял лично, но говорят, что она может достигать десяти минут). Suno работает с минимальными инструкциями и даже вообще безо всяких инструкций, обладает большой гибкостью в плане формулировок промта (даже прощает явные грамматические ошибки), понимает множество распространенных языков. Я не в курсе насчет, скажем, суахили, но с тайским, китайским, арабским и ивритом она управляется неплохо. Ошибки, конечно, случаются, причем даже с родными английскими текстами (хотя и значительно реже, чем с другими языками), но с этим, как говорится, жить можно.

Прибавлю к списку достоинств еще несколько черт: одновременная генерация сразу двух композиций, создание картинок-обложек для треков (они довольно примитивны по идеям и исполнению), генерация видео к треку с показом текста для караоке, некоторые удобные функции редактирования готовой композиции (замена напеваемого текста, обрезка и, как сказано выше, удлинение песни за счет последовательных расширений). У Suno есть специально созданное приложение для смартфонов и планшетов на Android и iOS (доступны в соответствующих магазинах). Правда, после краткого знакомства я утратил к ним всякий интерес: по функциональности это всего лишь огрызки полноценного веб-варианта, и даже на смартфоне много полезнее открыть браузер, чем мириться с куцей адаптацией под маленький экран. Тем не менее, эти приложения есть, а конкурентам в этом плане хвастать вовсе нечем.

Важно, что Suno непрерывно развивается, и плоды этого развития я вижу за полгода работы едва ли не ежемесячно: в сентябре 2024 г. появилась возможность создавать видео для караоке, затем каверы песен, потом новая версия генеративной модели, возможность сохранять голоса полюбившихся вокалистов для последующего использования в новых генерациях, функции ремастеринга трека, упомянутые выше приложения для Android и iOS, а последняя (январская) прибавка — опция создания дополнительных рабочих пространств (условно говоря, папок) для каталогизации треков по темам.

Знакомство

Как это принято у нейросетей, фронт-эндом для генерации и управления созданным служит веб-интерфейс, доступный в любом браузере.

На домашней странице выложен регулярно обновляемый контент с примерами треков, созданных Suno по заявкам пользователей. Слушать их можно безо всякой подписки, чем я и воспользуюсь ниже для предоставления ссылок на созданные композиции.

Если активировать в левом меню позицию Create (создание композиции), то в окне появляются четыре вертикальных поля. Крайнее слева, как и ранее, содержит позиции меню, следующее служит для управления процессом генерации, далее следует рабочее пространство, в котором накапливаются созданные композиции и есть возможность дальнейшей работы с ними. В правой колонке выводятся новости и сообщения системы, а при выборе любого из элементов упомянутого списка — параметры и контент трека (наименование, промт, дата и время создания, текст).

Третья позиция меню слева — библиотека (Library). Здесь хранится всё созданное пользователем в нейросети. Поскольку у нас новый аккаунт, здесь нет ни одного трека.

Библиотека заполняется довольно быстро. С моей точки зрения, для правильной организации работы следует дополнять имена свежеиспеченных композиций. Suno самостоятельно не нумерует их даже для того, чтобы отличить первый вариант от второго при одновременной генерации. Поэтому целесообразно, как минимум, дополнять названия числами.

Финальные версии я маркирую окончанием FINAL или плюсом перед названием трека — так удобнее искать сразу самое лучшее, когда треков станет много.

В верхнем правом углу списка композиций в окне Library расположена кнопка с иконкой для доступа к мусорной корзине. Она появилась недавно; раньше приходилось набирать в адресной строке браузера https://suno.com/me/trash

Моя корзина по количеству выброшенных в нее треков во много раз превышает объем полезного контента в библиотеке. Возможно, я просто слишком требователен к результатам генерации. Впрочем, есть ситуации, когда брак идет потоком. Больше всего приходится выкидывать при ремастеринге и при создании расширений и каверов (на один из проектов я в октябре 2024 г. за два дня израсходовал половину месячного запаса кредитов, но это произошло из-за нехватки опыта).

Активация четвертой позиции меню (исследовать, Explore) выводит в окно медленно вращающийся по часовой стрелке список музыкальных жанров и стилей.

Все элементы списка «кликабельны», и нажатие на выбранную позицию активирует проигрывание примера стиля. Ниже есть кнопка, позволяющая выбрать этот стиль для последующей генерации аудиоконтента.

Еще одна опция поиска — пятая позиция меню (Search). Ввод нужной строки в окне с лупой дает возможность выбирать примеры из списка.

Теперь о деньгах.

Наш аккаунт только что создан, подписка не оплачена. В бесплатном варианте (Basic Plan) доступно 50 кредитов, это количество возобновляется спустя сутки. На одну композицию расходуется 5 кредитов, но одновременно создаются два трека, генерация каждой пары обходится в 10 кредитов, и уменьшить этот расход специально нельзя. Только в том случае, если по каким-то причинам композиция не создана или имеет длительность менее шестнадцати секунд, система возвращает пользователю соответствующее количество кредитов (чаще всего дефектным признается лишь один вариант из пары, поэтому возврат составляет 5 кредитов).

На скриншоте виден возврат кредитов за трек длительностью всего шесть секунд (Credits Refunded).

Таким образом, при бесплатном Basic Plan можно активировать генерацию только пять раз в день. Конечно, этого не хватит даже для того, чтобы оценить самые базовые возможности. Помимо этого, у бесплатного плана есть и другие ограничения:

  • Доступна генеративная модель только предыдущей версии — 3.5, а не 4.0. Точка в английском языке является разделителем целой и дробной части, поэтому эквивалентом в первом случае является число 3,5, во втором — просто 4. Это не что иное, как максимальная длительность генерируемого трека — три минуты тридцать секунд против четырех минут. Модель 3.5 существенно слабее по возможностям анализа текста, распознавания смысла, внятности и правильности произношения слов, корректности расстановки ударений и логических акцентов. Качество звучания у нее беднее, а удельный вес артефактов выше, чем у 4.0.
  • Кредиты докупать нельзя; их всегда 50 на одни сутки. Если нужно получить более существенный запас кредитов, нужно перейти на платную подписку.
  • Созданные треки являются собственностью Suno, авторское право остается за владельцем этой торговой марки, композиции нельзя использовать в коммерческих целях, а при использовании в некоммерческих нужно указывать, что композиция создана Suno.ai. Созданный контент доступен другим пользователям сайта и его посетителям, сделать контент приватным нельзя. При платной подписке копирайт принадлежит пользователю, упоминать про Suno не нужно.
  • Одновременно можно генерировать только два трека, то есть лишь одну пару, которую нейросеть создает по умолчанию (при платной подписке — до пяти пар параллельно).
  • Любая задача на генерацию ставится в очередь, ждать приходится по несколько минут, а в периоды пиковой нагрузки (закономерности их наступления я не изучал) — десятки минут.
  • Трек можно скачать только в формате MP3, в то время как при платной подписке доступна опция скачивания в WAV.
  • Нельзя скачать разделенные партии вокала и инструментального аккомпанемента (Stems).
  • Нет доступа к ремастерингу (Remaster) и созданию каверов (Cover Song) треков.
  • Вокалистов нельзя «запоминать» (Make Persona) и повторно использовать при генерации.

Первые шаги

Я не сторонник решительных мер вроде обучения человека плаванию путем выпихивания его из лодки на середине реки, но полагаю, что начинающим пользователям интереснее сразу попробовать, что умеет Suno, нежели заниматься теоретической подготовкой. Поэтому перейду к делу. Специальных знаний и навыков не потребуется, а про хитрости я расскажу позже.

Примечание: язык промта

Я использую английскую нотацию, и причин тому две: во-первых, нейросеть должна понять, что мы имели в виду по-русски, а для нее это задача сложная, а во-вторых, отечественная терминология в музыкальной индустрии — это калька с английской (аудио, блюз, бэк-вокал, вайб, вау-вау, лидсингер, рифф, соул, хорус, эмбиент и проч.), поэтому проще использовать оригинальные термины, а не их русскую транскрипцию, в которой господствует хаос (например, Ambient транскрибируется как эмбиент, амбиент, амбьент и т. д.).

Создадим инструментальный трек. Открываем suno.ai.

Инструментальные треки

Я включаю кастомную генерацию (Custom в верхнем левом углу), режим создания инструментального трека (Instrumental Mode), в окно Style of Music ввожу задание, то есть промт: «Космическое эмбиентное, интродукция мюзикла, оркестровая поэма, звуковые картины космоса с ощущениями тайны и захватывающих исследований». Вот он:

Space ambient introduction to musical, orchestral poem, cosmic soundscapes, and a sense of mystery and breathtaking exploration

Можно ввести в поле ниже (Title) название трека; я ввел Granny Metagalaxy, «Бабушка Метагалактика».

За один заход Suno создает два трека, их можно прослушать уже через 15-20 секунд, когда будут созданы обложки и слева от них появятся красные точки, означающие, что новый трек еще не проигран. Полная генерация занимает около 3,5 минут. Когда она закончится, внизу справа поверх обложки появится длительность звучания трека и станут доступны кнопка Extend (расширить) и прочие опции в ниспадающем меню при нажатии на традиционную иконку меню в виде трех вертикальных точек.

Результаты представляю ниже:

Granny Metagalaxy 1 — вариант приемлемый, хотя можно ожидать чего-нибудь более значительного. Это я обычно говорю себе в подавляющем большинстве случаев. Больше того: я еще ни разу не получил того, что ожидал, с первого захода; всегда приходится повторять генерацию.

Granny Metagalaxy 2 — вариант мне не нравится совершенно.

В обоих случаях нейросеть промахнулась с длительностью треков, поэтому обе композиции оборваны истечением времени (3 минуты 59 секунд) и будут нуждаться в последующем редактировании, поскольку для инструментальных композиций нельзя указать момент завершения.

Замечу, что с самого начала использования Suno мне стало ясно, что второй вариант сильнее отличается от того, что ожидает пользователь при составлении промта, чем первый. Забегая вперед, скажу, что то же самое наблюдается при всякой генерации, будь то ремастеринг, создание каверов или расширений композиции («правило пары» справедливо для всех случаев), то есть специфика ритмического рисунка, характера исполнения и даже мелодических вариаций у второго экземпляра всегда существеннее. Если мы хотим разнообразить композицию вставками такого рода, то это даже предпочтительно, но сейчас, в рамках первичного создания треков, №2, по моему мнению, звучит хуже (и его следует отбросить). Генерацию можно продолжать с прежним промтом или с последовательным внесением каких-либо изменений, но заниматься этим будем позже и с другим материалом.

Примечание: акценты в промте

Я почему-то привык писать каждый значащий дескриптор с прописной: Orchestral, Operatic, Theatrical. На самом деле иерархия проста. Вот ряд написаний одного и того же:

funk Funk FUNK

В нем первый вариант имеет самый низкий приоритет, последний — самый высокий, а средний — он и есть средний. Кстати, если Suno что-то проигнорировала, то это бесполезно повторять дважды, трижды и т. д.: раз в отказ и два в отказ — значит, много-много раз.

Попробуем создать что-нибудь полезное. Скажем, в поездках по стране или за рубежом мы наснимали фото и видео, можно сделать кино для семьи и друзей. А как подобрать музыку для озвучивания? Suno поможет, и главное достоинство получаемых треков в том, что они будут стараться соответствовать контенту изобразительного ряда. Поэтому в промте я буду держаться сюжетной конкретики.

Включаю кастомную генерацию (Custom), режим создания инструментального трека (Instrumental Mode), в поле Title ввожу «Полет к Мутновке», а в окно Style of Music — промт «Неземная атмосферная музыка для видео о Камчатке, живописный полет на вертолете R44 Raven над горами Камчатки к Мутновскому вулкану» (Ethereal atmospheric music for Kamchatka video, a scenic flight on board R44 Raven helicopter over Kamchatka mountains to Mutnovsky volcano). Результаты:

«Полет к Мутновке 1» и «Полет к Мутновке 2».

Варианты разные по стилю, но оба содержат ритмический рисунок работающего ротора вертолета. А на обеих обложках треков изображены горы и тот самый Robinson R44 Raven, который я упомянул в промте (выходит, старался не зря). Завершение треков нормальное, не оборвано. При желании можно повторять генерации далее, изменяя жанры и стили.

Вокализ

Теперь, пока мы не уперлись в проблемы, связанные с созданием стихов для песен, попробуем вокализ, то есть пение голосом по нотам (случается, что и «мимо» нот), но без слов.

Я создал несложный «рисунок» вокальной партии, содержащий только гласные. Можно использовать «и», «о», «у» и «э». «Ы» не поется, а «е е е» будет воспроизведено как «йе йе йе». Вообще лучше писать всё это не русскими, а английскими буквами или последовательностями: ooh для «у», aah или uuh для «а».

[Verse 1]
Ааааааааааааааааа
ааааааааааааааааааааааааааа
аааааааааааaаааааааааааааааа
ааааааааaaааааааа
Ааааааааааааааааа
ааааааааааааааааааааааааааа
ааааааааааaаааааа
аааааааааааааааааааааааааааа

Ааааааааааааааааааааааааааааа
ааааааааааааааааааааааааааааа
ааааааааааааааааааааааааааааа
ааааааааааааааааааааааааааааа

[Melodic Interlude]

Ааааааааааааааааааааааааааааа
ааааааааааааааааааааааааааааа
ааааааааааааааааааааааааааааа
ааааааааааааааааааааааааааааа
Ааааааааааааааа
аааааaaаааааааааааааааааааааа
ааааааааааааааааааааааааааааа
ааааааааааааааа

[Choir]
Ааааааааааааааааааа
ааааааааааааааааааааааааааа
аааааааааааааааааа
аааааааааааааааааааааааааааа

[End]

В качестве заданий Suno давались несложные промты:

  1. Italian Ambient Vocalese, Operatic
  2. Afro House Vocalese, moderate tempo, African rhythms, deep basslines, and soulful vocals
  3. Russian Folk Vocalese, Ethereal, Operatic

Вот ссылки на треки: 1 Италия, 2 Кения, 3 Россия. На мой взгляд, достаточно убедительно и демонстрирует разнообразие.

Принципы генерации

В отличие от площадок для графики и текстов, где чем подробнее запрос, тем в большей мере результат соответствует ожиданиям, у Suno чаще бывает наоборот: чем проще промт, тем лучше результат. Ниже мы увидим, что даже без указаний музыкального стиля, особенностей исполнения и аранжировки нейросеть способна создать приемлемую по меркам заказчика композицию (романс не будет похож на сиротские куплеты).

Чем сложнее запрос, тем больше упомянутых в нем указаний будут игнорироваться. Причина этого проста и в общем понятна: основным промтом служит сам текст песни. Suno в обязательном порядке вникает в его смысл и соответствующим образом расставляет интонационные и музыкальные акценты. Так, в ряду «куплет — предприпев — припев» в наиболее типичном случае происходит повышение эмоциональной напряженности исполнения. Кстати, хозяева ресурса честно предупреждают о безусловном приоритете стилевых концепций самой нейросети, подчеркивая, что если уж вы доверяете ей сочинение композиций, то не нужно пытаться что-то решать самостоятельно, так как это «что-то» только мешает работать ИИ.

Вторая особенность — безусловное преобладание в готовой композиции специфики указанного пользователем музыкального стиля (если он вознамерился это сделать). Например, при выборе Blues (даже в сочетаниях Blues Rock, Blues Funk, Blues Doo-Wop) приоритет ведущих инструментов отдается гитаре (гитарам). Заставить нейросеть включить в подобную композицию, саксофон, трубу, флейту (не говоря уже о фанфарах) даже со специальными тегами [Smooth Saxophone Solos], [Trumpet Solo], [Flute]) обычно не удается. А вот тег [Upright Bass] — бас-гитара — напротив, приветствуется, и нейросеть часто задействует этот инструмент (или даже контрабас) без специальных указаний.

Третья особенность — исключение повторяемости мелодии. Иными словами, каждый создаваемый трек уникален и не имеет аналогов. Конечно, теоретически повторяемость возможна, но, во-первых, она все же позволяет говорить о каждом треке как об отдельном произведении, а не «перепевке» чего-то уже известного, а во-вторых, даже с такой ситуацией обычный пользователь вряд ли столкнется. У меня за 8 месяцев работы с Suno в довольно напряженном режиме лишь одна из мелодий чуть напоминала уже созданную ранее. Кстати, она была мною отвергнута, но не по этой причине, а потому что плохо подходила к теме и стихам.

Тэги структуры

Если планируется создать не инструментальную композицию, а песню, то ее текст следует структурировать. Базовые тэги, предназначенные для этой цели, привожу ниже в таблице.

Вступление [Intro] — без уточнения
[Instrumental Intro] — инструментальное
Куплет
основной текст (стих, строфа)
[Verse]
Пауза [Break] — краткая остановка исполнения
[Percussion Break] — остановка и ударные
Предприпев (прехорус) [Pre-Chorus]
Припев (хорус) [Chorus]
Постприпев (постхорус) [Post-Chorus]
Проигрыш (инструментальный фрагмент) [Melodic Interlude]
Связка [Bridge]
Текст завершения песни [Outro]
Конец композиции [End]
[Big Finish]

В большинстве случаев Suno самостоятельно добавляет музыкальное вступление в начале композиции, поэтому тэг [Intro] без уточнения ценности не имеет. [Instrumental Intro] точнее соответствует алгоритму нейросети, поэтому (если это не противоречит планам) его следует включать в композицию первым.

Если текст не структурирован, то тэги можно вообще не ставить, но композиция получится скучноватой, поскольку для разных элементов структуры нейросеть может использовать разные темп, ритм, музыкальные фразы, что ощутимо повышает разнообразие трека и делает результат более привлекательным. В общем случае следует хотя бы разбить текст на строфы. Если они не повторяются, то тэги полезно сделать уникальными, иначе Suno с высокой степенью вероятности будет считать их взаимозаменяемыми и использовать любой блок [Verse] по своему выбору вместо любого другого с таким же тэгом (то же справедливо и для Pre-Chorus, Chorus, Post-Chorus). Тэг [Bridge] правильнее ставить предпоследним (перед [Outro]), а окончательным помещать [End]. Кстати, [Bridge] помимо основного назначения используется еще и как резерв текста — при нехватке песенного материала именно этот блок будет выбран для повторения.

Обратимся за примером форматирования к Александру Сергеевичу, к его стихотворению «Зимний вечер» (1825 г.), хорошо знакомому с детства. Расставим вышеперечисленные тэги для определения структуры.

[Instrumental Intro]

[Verse 1]

Буря мглою небо кроет,
Вихри снежные крутя,
То, как зверь, она завоет,
То заплачет, как дитя.

[Pre-Chorus 1]

То по кровле обветшалой
Вдруг соломой зашумит,
То, как путник запоздалый,
К нам в окошко застучит.

[Chorus 1]

Наша ветхая лачужка
И печальна и темна.
Что же ты, моя старушка,
Приумолкла у окна?

[Melodic Interlude]

[Verse 3]

Или бури завываньем
Ты, мой друг, утомлена,
Или дремлешь под жужжаньем
Своего веретена?

[Pre-Chorus 2]

Выпьем, добрая подружка
Бедной юности моей,
Выпьем с горя; где же кружка?
Сердцу будет веселей.

[Chorus 2]

Спой мне песню, как синица
Тихо за морем жила;
Спой мне песню, как девица
За водой поутру шла.

[Bridge]

Буря мглою небо кроет,
Вихри снежные крутя;
То, как зверь, она завоет,
То заплачет, как дитя.

[Outro]

Выпьем, добрая подружка
Бедной юности моей,
Выпьем с горя: где же кружка?
Сердцу будет веселей.

[End]

Запускаем генерацию

Получаем: Зимний вечер (1) и Зимний вечер (2).

Пожалуй, приемлемо, особенно при учете того обстоятельства, что текст специально не подготовили, ударения не расставляли, со стилями и жанрами почти ничего не делали, инструменты не указывали.

Немного о том, что делает нейросеть с предложенным ей текстом.

  • Язык
    Определяются не только русский, немецкий, испанский, французский, но и арабский, хинди, иврит, китайский, тайский и т. д. Причем в тексте можно использовать несколько языков. Правда, не стоит устраивать нейросети экзамен и перемешивать в одной строке по 3-4 языка (с этим не справится даже профессиональный исполнитель). Если возникнут трудности с «переключением», можно использовать специальные тэги [Russian Language], [UK English], [French Language] и т. д. (впрочем, без гарантии).
  • Контент
    Благодаря анализу содержания текста Suno выбирает стиль, темп, характер исполнения и создает обложку для трека. Здесь, кстати, отлично выручает структурирование текста тэгами.
  • Структура
    Выявление тех мест, где требуется нарастание динамики, эмоциональности и громкости звучания, и тех, где происходит снижение акцентов.

Исполнители

Далее я собрал в таблице разные варианты вокала с учетом пола и возраста исполнителя, а также эмоциональной окраски.

Акапелла (пение без аккомпанемента) [A Capella]
Вокализ (пение голосом без слов) [Vocalese]
Девочка [Girl]
Дерзкое пение [Gittery Vocals]
Диктор (объявления) [Announcer]
Женщина [Woman]
Женский вокал [Female Vocals]
Женщина-рассказчик [Female Narrator]
«Жутковатое» пение [Eerie Vocals]
Оперное пение [Operatic]
«Освежающее» пение [Breezy Vocals]
Реверберация [Reverb-Heavy Vocals]
Тревожное пение [Unsettling]
Мальчик [Boy]
Мужской вокал [Male Vocals]
Мужчина [Man]
Мужчина-рассказчик [Male Narrator]
«Неземной» («эфирный») вокал [Ethereal Vocals]
Соблазнительное пение [Seductive Vocals]
Страстное пение [Sultry Vocals]
Хор [Choir]
Хорал [Chorale]
Церковное пение [Gregorian Chant] — канон латинской литургии

Для Suno перечисленные тэги имеют разный приоритет. Указание на пол при смене исполнителя игнорируется чаще других, а если и выполняется, то часто с точностью до наоборот: ставишь [Female Vocals] — поет мужчина, [Male Vocals] — женщина (подчеркну, что это происходит в тех случаях, когда в одном тексте есть оба тэга; если же тэг лишь один, то ему Suno скорее всего последует). Это происходит даже в том случае, когда родовые окончания и без тэгов подразумевают, где должен быть мужской, а где женский вокал («я ходил, и я ходила, // я так ждал, и я ждала, // я был зол, и я сердилась // я ушел, и я ушла»). Вот и получается, что парень поет: «и я ходила», а девушка — «я так ждал». Возникает ощущение, что нейросеть демонстрирует упрямое своеволие, в котором нет ничего логически оправданного. Продолжая повторять генерации раз за разом, в конце концов можно добиться успеха, но сколько это потребует повторов, не угадаешь: может быть, пять (10 композиций), а может, и пятьдесят (100 композиций). В общем случае после двадцати генераций стоит отложить текущую работу и переключиться на другие задания, а потом вернуться, потому что непрерывные повторы выводят из себя не только человека, но и нейросеть, причем в прямом смысле: Suno начинает по-настоящему «глючить», собирая строки из разных строф ни к селу ни к городу и выдавая на-гора совершенную чепуху.

«Эмоциональные» тэги воспринимаются получше, но и тут возможны отказы или неожиданные решения.

Специальные звуки

Этот список, пожалуй, наименее полезен, поскольку составляющие его тэги очень часто игнорируются.

Аплодисменты [Applause]
Вздохи [Sighs]
Визг [Squawking]
Гавканье собаки [Barking]
Дождь [Rainfall]
Драка [Fighting]
Звонок [Bell Dings] — колокольчик
[Ring] — звонок без уточнения характера
[Phone Ringing] — телефон
Индустриальные шумы [Industrial]
Кашель исполнителя [Cough]
Крики [Screams]
Пип (цензура) [Bleep]
Подцензурный контент [Censored]
Посмеивание (исполнителя) [Chuckles]
Приветствия аудитории [cheering] — приветственный шум
[cheers and applause] — приветствия и аплодисменты
Свист как элемент композиции [Whistling]
Стоны [Groaning]
Тишина (пауза) [Silence]
Хихиканье [Giggling]
Хлопанье в ладоши [Clapping]
Шепот [Whispers]
Щебет птиц [Birds Chirping]
Эхо [Echoes]

Наиболее употребимыми следует считать [Whistling] и [Echoes].

Стили и жанры

Их очень много, и перечисление лишь внесет сумбур, но вряд ли поможет, особенно на первых порах, когда предстоит осваивать базовые функции нейросети. Посмотреть (далеко не полный) список стилей, которые она «узнаёт», можно с помощью фронт-энда (описано в начале материала) или на Aicando.xyz. Разобраться поможет, во-первых, изучение самих стилей/жанров, а во-вторых, эксперименты с ними в ходе генерации контента. Впрочем, следует учитывать, что только что сделанный трек с тэгом [Rock, Progressive, Atmospheric] вряд ли будет похож на следующий, второй — на третий, и т. д.; вариабельность отдельных треков в пределах выбранных стиля и жанра очень велика. Это заметно осложняет составление промта, поскольку ожидать можно чего угодно. Это еще один фактор, заставляющий постоянно повторять генерацию.

Примечание: комбинации стилей

Стилевое разнообразие можно расширить еще существеннее, используя разные комбинации. Перед и после них можно дополнительно указать характер звучания, окраску, эмоциональность и прочее. Вот небольшой список определений, которые можно использовать для уточнения стиля, жанра, вокала, общего настроения.

Акустический [Acoustic]
Альтернативный [Alternate]
Атмосферный [Atmospheric]
Баллада [Ballad]
Барокко [Baroque]
Душевный [Soulful]
Меланхолический [Melancholic]
«Неземной» [Ethereal]
Оптимистичный [Upbeat]
Оркестровый (исполнение оркестром) [Orchestral]
«Прохладный» [Chill]
Психоделический [Psychedelic]
Радостная [Joyful]
Танцевальная электронная музыка [Dance & Electronic]
[EDM] — Electronic Dance Music
Театральный [Theatrical]
Экспериментальный [Experimental]
Эмбиентный [Ambient]

Итоговая фьюжн-комбинация может выглядеть, например, так:

Alternative Funk Blues Rock, Experimental, Atmospheric, Ambient, Ethereal, Operatic, Theatrical

Инструменты

Тэгов описания инструментов тоже много; угадать, на какие Suno «отзовется», а на какие нет, очень сложно. Ниже приведу только те тэги, которые я опробовал сам.

Аккордеон [Accordion]
Арфа [Harp]
Бас-гитара [Bass], [Bass Guitar] — классическая
Валторна [French Horn]
Виолончель [Cello]
Гитара [Guitar] — без уточнения вида
[Hawaian Guitar] — гавайская
[Spanish] — испанская
[Wah Wah] — «вау-вау» (эффект)
Гобой [Oboe]
Губная гармошка [Harmonica]
Дудук [Duduk]
Духовые инструменты [Brass]
Клавесин [Harpsichord]
Кларнет [Clarinet] — традиционный
[Duduk] — армянский («абрикосовый»)
Концертина [Concertina]
Контрабас [Upright Bass] — классический «вертикальный бас»
Литавры [Timpani]
Лютня [Lute]
Мандолина [Mandoline]
Орган [Church Organ] — церковный (характерная акустика)
[Electric Organ] — электроорган
[Organ] — без уточнения вида
[Pipe Organ] — классический
Оркестр [Orchestra] — без уточнения вида[Big Band] — большой джазовый (эстрадный)
[Brass Band] — духовой
[Symphonic Orchestra] — симфонический
Перкуссия [Percussion] — собирательное название
Саксофон [Saxophone] — без уточнения
[Alto Saxophone] — альт
[Bariton Saxophone] — баритон
[Bass Saxophone] — бас
[Contrabass Saxophone] — контрабас
[Tenor Saxophone] — тенор
Синтезатор [Synth]
Скрипка [Violin]
Струнные [Strings] — без уточнения
Труба [Trumpet]
Туба [Tuba]
Фагот [Bassoon]
Флейта [Flute] — традиционная поперечная
[Bamboo Flute] — бамбуковая
[Ney] — персидская (арабская, турецкая)
[Ocarina] — окарина («картофельная»)
[Pan Flute] — многоствольная (флейта Пана)
[Piccolo] — пикколо
[Wooden Flute], [Wood Flute] — деревянная продольная
Фортепиано [Electric Piano] — электропиано
[Piano] — фортепиано (рояль)
Челеста [Celesta]

Стихосложение

Ниже речь пойдет о том, что́ удается нейросетям хуже всего (точнее, до настоящего времени не удавалось) — о генерации слов (стихов) для песен. Я имею в виду русский язык, ввиду широкоизвестного богатства и лингвистической сложности которого ИИ пока не в состоянии предложить ничего путного.

Генерация на русском

Разберемся на примерах. Введем простой запрос: «Песня о долгом, унылом дожде в Кронштадте».

Suno по умолчанию предлагает использовать наиболее современную модель генерации — ReMi. Вот что получаем в ответ.

Вариант 1.
Кронштадтский унылый и долгий дождь

[Verse 1]
Кронштадтский унылый и долгий дождь
Уж третий день без перерыва
Ты одним сомневающимся словом стерла
Едва высвечивавшуюся перспективу

[Verse 2]
Кронштадтский унылый и долгий дождь
Спасибо вам за тяжелый траффик
Радостная новость: у моей бывшей жены новый сын
Но получила ли она
Что хотела

[Chorus]
Объясни мне честно
Ты действительно меня не любит?
Ты действительно меня не любит?
Объясни мне честно
Ты действительно меня не любит?
Ты действительно меня не любит?

[Verse 3]
Кронштадтский унылый и долгий дождь
Ленивые коллеги
Расползающиеся как тараканы
Не впечатлило даже чувство срочности
Запоминающиеся воспоминания о том
Что я бы там ни делал

[Verse 4]
Кронштадтский унылый и долгий дождь
Английская профсоюзная конференция
Жду тепла не от русских послов

[Chorus]
Объясни мне честно
Ты действительно меня не любит?
Ты действительно меня не любит?
Объясни мне честно
Ты действительно меня не любит?
Ты действительно меня не любит?

Вариант 2.
Долгий тоскующий дождь в Кронштадте

[Verse]
Шёл долгий заставляющий дождь опять
В Кронштадте
И поняла в Кронштадте
Дождь отлива
Шёл долгий дождь
В Кронштадте
Опять
Дождь отлива

[Verse]
И ни один
Из наших друзей
Не верят мне
Вы знаете ливень?
И шёл долгий
Долгий
Дождь в Кронштадте
Опять

[Verse]
Ты прошла
Долгим дождём
И шёл дождь
В Кронштадте
Кто знал

[Bridge]
Шёл долгий
Долгий дождь
Forsake him
Шёл долгий
Долгий дождь
В Кронштадте

[Chorus]
И шёл долгий
Долгий дождь
Its an escape to yourself
It’s a long
Long rain
In Kronstadt
It’s an escape

[Chorus]
Долгий
Долгий дождь
Постоянно ливень
Шёл долгий
Долгий дождь
В Кронштадте

Совершенная чепуха, да еще и смешение русского с английским. Неудача.

В память об Илье Калинникове, лидере группы «Високосный год», изменим запрос на «лучшая песня о любви». Вот результаты стихосложения Suno.

Ответы нейросети.

Вариант 1

[Куплет 1]
Чайник свищет на вокзале
Объявляют уходящий поезд
В этот день с тобой прощались мы
И ты в вагон шагнула свой

[Переход]
И вслед
Смотря
Я мечтал
Как по ветру в даль неслись мои слова

[Припев]
От меня тебе вдогонку песня неслась
Лучшая из всех
Что ты слышала
Песня про любовь

[Куплет 2]
Я спешил опять увидеть
Ваши нежные глаза
Ты встречала при дороге
Мне шепча едва слова
Как волна

[Переход]
Бросая в них свои слова
Я чувствовал
Что плачу после долгой высоты

[Припев]
О тебе моя песня
Так похож ты на неё
Лучше всех
Что слышали
Песен про любовь

Вариант 2

[Вступление]
Это лучшая песня
Послушай сейчас
Это лучшая песня
Это для вас

[Куплет]
Кевин сидит в песочнице
Продавил задом весь песок
Забирает девчонок из казино
На серебристой электро-бугатти

[Припев]
Это лучшая песня о любви
Это лучшая песня о любви
Лучше я не могу придумать
Это лучшая песня
Это для вас

[Куплет 2]
А если всё это правда
Если вся атмосфера реальная
Если каждый хочет жить благодатно
Надо просто верить в любовь

[Припев]
Это лучшая песня о любви
Это лучшая песня о любви
Лучше я не могу придумать
Это лучшая песня
Это для вас

[Переход]
Ля-ля-ля-ля

Что-то совсем неподобающее...

Попробуем еще раз, на этот раз используя прежний (второй), более старый вариант генеративной модели (Classic). Промт тот же: «Лучшая песня о любви». Получаем два очередных «шедевра»:

Вариант 1

[Verse]
Ты мое сердце в красках лови
Танцуй в лучах любви с тобой
Смело дышу спокойствием сильным
Ты мой один
Мой непокорный герой

[Verse 2]
Слова как звезды в ночи для нас
Вдвоем летим на крыльях мечты
Я тобою дышу
Просто рядом будь
Мой мир теперь в твоей орбите

[Chorus]
Ты луч
Что дарит свет мой
Знаю это не сон любви
С тобой мир становится простым
В ритме бьются два сердца

[Bridge]
Дождь смывает печаль из глаз
Тепло держи
Не отпусти
Пусть ветер вместе нас несет
В сказку наших дней пустив

[Verse 3]
Смело в сердце тревогу возьму
Уверен в силах вечной любви
Мир за окном спит
Но не уснет
Страсть рисует мгновение нас

[Chorus]
Ты луч
Что дарит свет мой
Знаю это не сон любви
С тобой мир становится простым
В ритме бьются два сердца

Вариант 2

[Verse]
Взгляд твой словно солнечный луч
Ты мой день превращаешь в светлый
Каждый миг с тобой как сладкий пломбир
Ты моя весна в лучах рассвета

[Verse 2]
Твоя улыбка мир мой красит
Наши мечты цветом небес
Ты моя вера в чудеса
Ты мой отдых среди всех бед

[Chorus]
Лучшая песня о любви
Это мы с тобой вдвоем
Наши сердца в одном ритме
Мы танцуем под звездным дождем

[Verse 3]
Каждое слово словно песня
Что поет лишь для нас двоих
Ты моя нежность и воскресенье
Самый нежный свет моих стихов

[Verse 4]
Обними меня
Не отпускай
Мы как два крыла способны летать
В этом мире вечных старых сказок
Ты моя правда и мой рай

[Chorus]
Лучшая песня о любви
Это мы с тобой вдвоем
Наши сердца в одном ритме
Мы танцуем под звездным дождем

Опять ерунда. Попробуем обратиться к более специализированным средствам ИИ-генерации, например AI Song Lyrics Generator в составе комплекта yeschat.ai. В ответ на задание «Напиши стихи для лучшей песни о любви» получаем такой результат:

Куплет 1
Ты — свет, что греет ночью в холод,

Ты — воздух, что я не могу не вдохнуть.
Среди шумных дней, в этих тысячах голосов,
Я нашёл тебя — и уже не вернуть.

Припев
Ты моё сердце, ты мой сон,
С тобой весь мир — как сладкий фон.
Не нужно больше звёзд и луны,
Всё, что мне нужно — это ты.

Куплет 2
Твои глаза, как бескрайний океан,
В них отражается наш вечный роман.
В каждой улыбке — тысячи чудес,
Ты мой мир, мой смысл, мой небесный лес.

Бридж
Пусть время летит, как пламя свечи,
Я обещаю быть рядом в ночи.
Ничего нет сильнее, чем наша любовь,
Ты — моя душа, я — твоя кровь.

Припев
Ты моё сердце, ты мой сон,
С тобой весь мир — как сладкий фон.
Не нужно больше звёзд и луны,
Всё, что мне нужно — это ты.

Финал
В каждом дыхании, в каждом дне
Ты — моя песня, звучишь во мне.
Любовь к тебе — мой вечный крик,
Ты — мой огонь, мой вечный миг.

Галиматья, да и только. Спросим нейросеть, по какой причине ИИ пишет плохие стихи. Вот что она отвечает в свое оправдание.

Искусственный интеллект сочиняет скверные стихи по нескольким причинам. Во-первых, у него нет личного опыта или эмоций, которые часто лежат в основе хорошей поэзии. Он может лишь имитировать чувства, а не проживать их, что делает строки механическими и лишенными глубины. Во-вторых, AI часто опирается на шаблоны и статистику, а поэзия требует интуиции, игры слов и неожиданной образности, которые трудно запрограммировать. Наконец, у ИИ пока нет той искры творческого безумия, которая делает стихи человечными — способными ранить, вдохновлять или трогать до слёз.

ChatGPT

На неискушенный взгляд автора, бесконечно далекого от создания и обучения нейросетей, ответ несколько не по теме. Точнее, он слишком сосредоточен на представлениях, так сказать, высокого порядка. На самом деле, в стихотворениях, созданных ИИ, бросается в глаза бессмысленное нанизывание слов, часто сочетающихся друг с другом лишь по формальным признакам, а часто и вовсе никак не сочетающихся. Налицо частое отсутствие согласований по падежам, родам, числам и т. д. Во многих случаях отсутствует элементарная логика построения фраз.

Генерация на английском

Генерация текстов на английском языке обеспечивает значительно более высокое качество лирики, и несмотря на ощутимый «привкус дебильности», такие слова вполне можно использовать. В конце концов, английский нам не родной, за Шекспиром мы не гонимся. Для оценки нужно вслушиваться в искаженное пением произношение, а так поступают разве что на концертах; поэтому, как говорится, сойдет.

Зададим работу Suno. Для задания я использовал лишь описание стиля песни без указания темы стихов: «Нео-соул джаз, умеренный темп, соул джаз, джазовая гармония, современное звучание, джаз, душевный вокал, душевная (композиция)». Промт сочинял не я — взял где-то готовый. Отсюда повторы, смысла в которых, как я упоминал, нет ни малейшего (если сто раз повторить слово «халва», то во рту слаще не станет). Вот он по-английски:

neo-soul jazz, moderate tempo, soul jazz, jazz harmonies, modern production, jazz, soulful vocals, soulful

Результат — «Мечтанья под луной», или Moonlit Reverie (вариант 1), (вариант 2).

[Verse]
Under the glow of the moonlight’s embrace,
We danced through the night, finding our pace,
Soft whispers of secrets, tender and true,
In this world of dreams, just me and you.

[Verse 2]
A melody lingers, sweet in the air,
Fingers trace patterns, gentle and fair,
Heartbeats in rhythm, a soulful decree,
In this moonlit reverie, it’s just you and me.

[Chorus]
Oh, in the still of the night, our love we find,
Two kindred spirits, perfectly aligned,
Swaying to the music, time falls away,
In this enchanted moonlit sway.

[Verse 3]
We’ve painted our canvas in shades of grace,
Each brushstroke a memory, love we embrace,
Gentle notes echo, from heart to heart,
In this moonlit serenade, we’re never apart.

[Bridge]
Beneath the stars, our souls interlace,
Every moment, a tender embrace,
Through songs of love and whispers so fine,
In the moon’s glow, our hearts combine.

[Chorus]
Oh, in the still of the night, our love we find,
Two kindred spirits, perfectly aligned,
Swaying to the music, time falls away,
In this enchanted moonlit sway.

Я выделил п/ж неудачные обороты и излюбленные словечки генератора: embrace, whisper, secrets, dreams, shades, linger, heartbeat, spirit. С повторами дело обстоит не очень хорошо; по идее их нужно выковыривать и, возможно, даже переписывать строки. Но делать этого мы не станем — и так сойдет.

Другой пример с промтом, содержащим описание темы стихов и стиля музыки: «Мелодичная песня о большой семье, отдыхающей на берегу океана, ду-воп, радостная, театральное исполнение».

A melodic song about a big family resting at oceanfront, doo-wop, joyful, theatrical

Результат — «Семейство у моря», или Family by the Sea (вариант 1), (вариант 2).

[Verse]
We’re laughing in the sun light bright
Kids are digging castles high
Waves are crashing left and right
Fish are jumping saying hi

[Verse 2]
Auntie’s got her grill ablaze
Uncle’s dancing in his shades
Grandma’s knitting in the shade
Family’s love will never fade

[Chorus]
We got one big wavy family
Splashing joy down by the sea
Melodies in harmony
Living wild and fancy free

[Verse 3]
Brother’s building bonfire tall
Sister’s throwing beachball high
Cousins running chase-and-call
Underneath the azure sky

[Bridge]
Dad’s guitar is strumming tunes
Mom’s voice floating to the moon
Here the world is all in tune
With our hearts that swoon and croon

[Verse 4]
Evening glow on water’s edge
Family saga never ends
Sandy toes and laughter blend
In waves of love we all depend

Словеса здесь еще более примитивные. Хотя жанр, в принципе, до некоторой степени это извиняет, за них все равно немного стыдно. Но опять-таки мы не станем тратить время на переделки.

Всё же если подходить к делу с должной серьезностью, следует признать, что лучше писать стихи самому, в крайнем случае воспользоваться классикой (благо она существует и на других языках народов мира).

Авторские стихи

Если стихи пишешь сам, то можешь не только похвалиться оригинальным контентом, но и до известной степени управлять созданием композиции, поскольку выбираешь размер, ритм, рифмы, аллитерации, метафоры и проч. Я написал этакую «песенку-дебилку» без претензий даже на средний школьный уровень, но она хорошо демонстрирует возможности управления процессом композиции.

Шутовство

[Instrumental Intro]

[Verse 1]
Пока в быту аднообразном
еще не вышел жизни счёт,
а в ажидании напрасном
бывает нечет или чёт,

[Pre-Chorus 1]
пока тебе никто не верит,
попробуй верить сам себе;
уговоРИ себя: теперь я
поупражняюсь в ворожбе.

[Chorus 1]
Набивай дипломат,
собирай плагиат -
ненаучный формат,
удальстВО.
Каждый миг покори,
каждый час одари,
каждый день преврати
в волшебстВО

[Post-Chorus 1]
волшебство
оооооооооо
колдовство
оооооооооо
ведовство

[Melodic Interlude]

[Verse 2]
Пока попоны - не препоны,
покуда вдоль - не поперёк,
пока работают нейроны,
и с ними варит котелок

[Pre-Chorus 2]
познай события и числа,
освободи напор и прыть,
тогда ни силами, а смыслом
любого сможешь удивить.

[Chorus 2]
Компромат нарасхват:
гос- и партаппарАт,
экспонат-демократ,
существо;
каждый миг покори,
каждый час одари,
каждый день преврати
в шутовство.

[Post-Chorus]
баловствО
оооооооооо
хвастовство
оооооооооо
естество

[End]

П/ж выделены измененные для адекватного произношения безударные гласные, принудительно поставленные «ё», выделенные ударные гласные и ударные слоги.

Мы подошли к главной задаче оформления структуры текста с точки зрения избавления от нежелательных ошибок. Правда, как я упоминал выше, модель 4.0 существенно лучше разбирается в специфике неанглийских языков, чем предыдущая, 3.5, но периодически и у нее случаются «заскоки» — и на естественную старуху бывает проруха, что же говорить об искусственной!

Везде, где должна стоять «ё», следует вписать именно ее, а не «е». По убеждению профессионального редактора, в текстах «буква Карамзина» ставится лишь в тех случаях, когда по контексту нельзя сказать, какой звук подразумевается: «все узнали» или «всё узнали». А для Suno никакой очевидности нет и в помине: даже если в слове «все» нужен звук «е», и не стоит «ё», нейросеть с тупым упрямством поет «ё». Например, «березняк» превращается в «берёзняк» (потому что берёза, и всё тут).

Поставить ударение в нужном месте можно тремя способами:

  1. Сделать букву прописной (аппарАт),
  2. Выделить прописными весь ударный слог (аппаРАТ)
  3. Поставить перед ударным слогом апостроф (аппарат)

Ни один из перечисленных вариантов не дает стопроцентной гарантии от ошибки, но использовать их вместе нельзя, причем не только три, но даже два сразу. И еще довесок: действующий алгоритм диктует Suno, что в любом случае нужно петь «далеко́», а не «далёко», «высоко́», а не «высо́ко», даже если упомянутые нормы не втискиваются ни в размер, ни в рифму.

Однако вернемся к генерации треков. Я провел более серьезную работу, чем ранее, отбросил неудачные варианты и предлагаю для сравнения семь разных композиций в разных стилях и жанрах:

  1. Психоделический фанк:
    Psychedelic funk, groovy bass lines, wah-wah guitars, trippy effects, and energetic brass sections
  2. Гиперпоп:
    Hyperpop, fast tempo, exaggerated synths, auto-tuned vocals, and maximalist production
  3. Ду-воп:
    Doo Wop, joyful
  4. Мат-рок, джей-поп:
    math rock, J-pop, mutation funk, bounce drop, dubstep, edm, 160bpm
  5. Свинг-метал:
    Swing metal, fast tempo, swing rhythms, metal instrumentation, and energetic fusion
  6. Эмбиент фанк:
    Melodic Harmonious Ambient Funk, Atmospheric, Ethereal, Operatic, Theatrical
  7. Эмбиент метал:
    Melodic Harmonious Ambient Ethereal Metal, Pipe Organ, Distorted Guitars, Operatic,  Theatrical

Иногда мне приходится сочинять на английском. Признаться, я не очень далеко ушел от Suno в английской поэзии, но все же тщу себя надеждой, что мои варианты немного лучше того, на что способна нейросеть. Вот пример.

«Словно потерявшийся ребенок» — Like a Lost Child

[Instrumental Intro]

[Verse 1]
Walking down beneath the Moon,
I forget the route and clue.
In the air, I hear a tune,
Playing music old for new.

[Pre-Chorus 1]
Every corner calls my name,
Shadows play a nasty game.

[Chorus]
Oh, my heart, it’s losing ground,
In the dark, no solace found.
Heavy mind, it’s runnin’ wild,
In my soul, I’m a lost child.

[Melodic Interlude]

[Verse 2]
Every corner calls my name,
Shadows play a nasty game.
Lonely heart makes me insane,
Thoughts are damaging the brain.

[Pre-Chorus 2]
Every breath takes me away,
Every shadow tries to play.

[Chorus]
Oh, my heart, it’s losing ground,
In the dark, no solace found.
Heavy mind, it’s runnin’ wild,
In my soul, I’m a lost child.

[Bridge]
Maybe I’m just lost tonight,
Or maybe I’m just outta sight.
Moonlight fades and so do dreams,
Chasin’ nothings in the streams.

[End]

Семь треков, созданных с разными стилями/жанрами:

  1. Блюз западного побережья:
    Haunting West Coast Blues, Sultry Female Vocals, Operatic, Theatrical
  2. Блюз-фанк:
    Alternative West Coast Blues Funk, Experimental, Upright Bass, Choir, Operatic, Theatrical
  3. Блюз:
    Slow Blues, Upright Bass, Choir, Sultry Female Vocals, Operatic, Theatrical
  4. Космический джаз:
    Cosmic jazz, moderate tempo, space-themed improvisations, electronic elements, and expansive soundscapes
  5. Дес-метал:
    Ethereal Ambient Death Metal, Experimental, moderate tempo
  6. Арт-рок:
    Ethereal Progressive Atmospheric Art Rock, Experimental, moderate tempo
  7. Классический джаз:
    Vintage jazz lounge, classic standards, smooth trumpet solos, upright bass, and sultry female vocals

Заключение

Мы познакомились с возможностями создания инструментальных и песенных треков, которые предоставляет нейросеть Suno — без сомнения, одна из самых популярных и развитых систем ИИ-генерации. Попутно удалось выяснить, что написание слов (стихов) — это слабое звено сети и, вероятно, других ИИ-систем тоже. Тем не менее, Suno, хотя и с серьезными оговорками, можно с успехом использовать для собственных нужд и — что более важно — даже в коммерческих целях, например создавая треки по заказу сторонних лиц и организаций. Достоинства сервиса явно перевешивают его недостатки, какими бы неприятными они ни казались пользователю. Мне не удалось поместить всё, что хотелось, в один обзор, поэтому продолжение воспоследует. Во второй части я подробно остановлюсь на разнообразных проблемах, связанных с генерацией музыки при помощи Suno, способах их преодоления, а также на приемах, способных улучшить качество звука в созданных композициях.

6 марта 2025 Г.