7 сервисов-плодов «нейросетевой революции», которые можно использовать прямо сейчас

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Подборка сервисов | Программы, сервисы и сайты

Многим кажется, что плоды «нейросетевой революции» доступны лишь избранным технарям или крупным корпорациям. Но это не так! Если знать, где искать, то нейросети способны изменить вашу жизнь уже буквально сейчас, упростив и облегчив её во многих аспектах.

Я подобрал для вас 7 ИИ-сервисов, которые вы можете начать использовать прямо сегодня — и которые я уже использую в повседневной работе. Давайте вместе оценим, до чего дошёл прогресс, и как эти технологии могут сделать конкретно вашу жизнь проще и интереснее.

Claude AI — лучшая бесплатная нейросеть на русском

Пример текста без полного техзадания. Составление ТЗ — моя небольшая коммерческая тайна.
Автор: Anthropic Источник: claude.ai

Пока гиганты вроде Google и OpenAI намеренно исключали русскоязычный контент из обучения своих моделей (что ж, политика — дело такое), а отечественные разработки не дотягивают даже до этого архинизкого уровня, компания Anthropic совершила прорыв. Их детище — нейросеть Claude AI, которую за дружелюбность, естественность и некоторую «соевую» наивность унас уже окрестили «Кладей» — стала настоящим подарком для русскоязычного сообщества.

Представьте себе десятиклассника-хорошиста, который может делать практически всё: от написания несложного кода до систематизации стенограмм, от анализа старых документов до обсуждения сложных философских концепций. Вот такая она, наша Кладя. Она делает почти всё: от написания несложного кода до систематизации стенограмм, от общения на сложные темы до анализа старых документов. И делает это почти всегда на твёрдую четвёрку. Конечно, как и любой ученик, она не идеальна. Если вы попросите её написать статью без чёткого ТЗ, результат может оказаться… скажем так, своеобразным. Но если вы умеете составлять подробные задания и готовы предоставить справочные материалы — о, тут Кладя раскрывается во всей красе!

Но вот если вы имеете опыт работы редактором и умеете составлять грамотное техническое задание, да ещё и приложите справочный материал — о, тогда Claude превратится в настоящего волшебника! Нейросеть напишет отменный коммерческий текст, требующий лишь тех самых редакторских правок, фактически пересадив вас в редакторское кресло, при этом избавляя от необходимости тратить деньги и «долбить лопатой по голове» райтеров-биржевиков. С некоммерческими текстами (например, постами на iXBT) всё пока ещё сложнее, но, такими темпами развития, с выходом 3.5 Opus, полагаю, и это станет условно-возможным.

К сожалению, из-за санкций Claude ограничена для российских IP-адресов. Но не спешите расстраиваться! Можно воспользоваться вполне законным на территории РФ «параллельным импортом». Достаточно приобрести логин у российских реселлеров и зайти на ресурс через одобренный Роскомнадзором VPN (напомню, что использование и пропаганда запрещённых РКН VPN может наказываться по закону).

Silero — конец эпохи голосовых сообщений

Автор: Silero Источник: silero.ai

Признайтесь, вы тоже ненавидите голосовые сообщения в мессенджерах? Эти минуты ожидания, пока собеседник наговорит свою простыню, невозможность быстро пробежаться глазами по тексту, чтобы найти нужную информацию… Момент, когда нужно найти тихое место, чтобы прослушать многоминутный монолог, который можно было уместить в пару строк текста? Но теперь с этим покончено! Встречайте Silero — сервис, который позволяет бесплатно извлечь стенограмму практически из любого голосового файла.

Неважно, что у вас на руках — подкаст, лекция или то самое ненавистное голосовое сообщение в Telegram. Silero справится со всем! Просто загрузите аудиофайл, и через считанные минуты вы получите текстовую версию. Да, стенограмма будет, мягко говоря, не идеальной — но это лишь полдела.

Вот где начинается настоящая магия: возьмите эту «сырую» стенограмму и отправьте её Claude. Дайте «Кладе» задание примерно такого плана: «Пожалуйста, преврати эту стенограмму машинной транскрипции в человекочитаемый текст, исправив возможные ошибки распознавания. Затем выведи саммари и ключевые тезисы стенограммы. Разбей текст на подзаголовки, если он будет длиннее 5 тысяч знаков».

И вуаля! Вместо путаной машинной стенограммы голосового сообщения, подкаста или видеоролика вы получите структурированный, легко читаемый текст с основными идеями и тезисами. Больше никаких мучений с прослушиванием — вся важная информация теперь у вас перед глазами, готовая к быстрому просмотру и анализу.

Riverside AI — то же самое для английского

Автор: Riverside Источник: riverside.fm

Даже после… Событий 2022 года и последовавшей суверенизации России всё ещё часто возникает необходимость работать с англоязычным контентом. Будь то голосовое сообщение от коллеги из-за рубежа или популярный YouTube-ролик — иногда так хочется иметь под рукой текстовую версию. И тут на помощь приходит Riverside AI — сервис, который делает для английского языка то же, что Silero для русского.

Принцип работы Riverside AI прост и эффективен: загружаете аудиофайл на английском, и через короткое время получаете подробную стенограмму с метками времени. Это особенно удобно, когда вам нужно найти конкретный момент в длинном аудио — просто пробегитесь глазами по тексту и перейдите к нужной временной метке.

Но и это ещё не всё! Помните, как использовать Claude для улучшения русских стенограмм? Тот же трюк работает и здесь, но с дополнительным бонусом. Загрузите полученную стенограмму в «кладю» с промтом: «Пожалуйста, преврати эту англоязычную стенограмму машинной транскрипции в человекочитаемый текст на русском, исправив возможные ошибки. Затем выведи саммари и ключевые тезисы стенограммы. Разбей текст на подзаголовки, если он будет длиннее 5 тысяч знаков. Перевод на русский должен быть максимально нативным». Разница выделена жирным.

Таким образом, вы не только получаете чистую и структурированную версию английской речи, но и её перевод на русский язык. Удобно!

Stable Diffusion / AUTOMATIC1111 — нейрокартинки, которые вам принадлежат

Автор: AUTOMATIC1111

Если вы следите за миром ИИ, то наверняка слышали о нейросетях, генерирующих изображения. Но одно дело — использовать готовые онлайн-сервисы, и совсем другое — погрузиться в мир Stable Diffusion с помощью фреймворка AUTOMATIC1111 WebUI. Это как пересесть с самоката на космический корабль — возможностей столько, что голова идёт кругом!

С AUTOMATIC1111 вы можете создать практически что угодно. Но будьте готовы — освоение всех «крутилок» и тонкостей промптинга может занять немало времени. Кроме того, вам предстоит погрузиться в мир дополнений, постичь дзен Controlnet, научиться выбирать модели и работать с масками (как ручными, так и по картам глубины).

А если вы готовы нырнуть ещё глубже, вас ждёт кроличья нора имени Kohya_SS, десятка видов LoRA, разметки данных и обучения своих субмоделей. Звучит сложно? Не буду лукавить — так оно и есть. Но результат стоит усилий: вы сможете создавать изображения, которые полностью соответствуют вашему видению или «хотелкам» заказчика.

Конечно, за такую мощь приходится платить. Вам понадобится достойное «железо»: видеокарта Nvidia с минимум 8 Гбайт ОЗУ (хотя для комфортной работы лучше иметь 12-16 Гбайт) и пара сотен гигабайт свободного места на диске под все модели. Есть альтернатива для владельцев ультрабуков: CPU с нейросопроцессором от Intel и специальный билд AUTOMATIC. Кроме того, нужны будут каких-то пара месяцев вашего времени и десятко спасбросков на рассудок, которого легко лишиться при попытке разобраться в этом адском механизме, особенно если до того вы не имели к IT никакого отношения. Но результат того стоит.

Отдельный бонус для творческих людей: при правильном выборе моделей, все созданные вами изображения будут принадлежать только вам. Никаких проблем с авторскими правами, никаких претензий со стороны компаний. Более того, если кто-то украдёт вашу работу, вы сможете отстаивать свои права даже в суде РФ (который, как минимум пока, не отрицает защиту копирайтом нейросетевых изображений, в отличие от, например, судов США).

AI Horde / Stable Horde — то же, но в облаке и проще

Автор: ArtBot Источник: tinybots.net

Если вся эта сложность с настройкой AUTOMATIC1111 вас немного напугала, не волнуйтесь — есть более простой путь в мир ИИ-генерации изображений. Знакомьтесь с AI Horde, также известным как Stable Horde. Этот сервис предлагает похожие возможности, но работает в облаке, избавляя вас от необходимости иметь мощный компьютер.

AI Horde — это своего рода распределённая система, где энтузиасты со всего мира предоставляют мощности своих компьютеров для генерации изображений. Это означает, что вам не нужно беспокоиться о «железе» — всё, что требуется, это доступ в интернет и немного терпения.

Конечно, у этой простоты есть своя цена. Крутилок и настроек тут значительно меньше, чем в AUTOMATIC1111, да и возможностей поменьше. Но для новичка или тех, кто не хочет глубоко погружаться в технические детали, это может быть даже плюсом. Интерфейс проще, порог входа ниже — вы можете начать создавать интересные изображения практически сразу. Ну, как — сразу, выходные под это дело выделить всё равно придётся, но всё же.

Ещё один важный момент — все созданные изображения по-прежнему принадлежат вам как автору (если этому не противоречат условия конкретной модели). Так что вы можете спокойно использовать полученные картинки в своих проектах, не опасаясь проблем с авторскими правами.

Правда, есть и небольшой минус — генерация занимает больше времени, чем на локальном компьютере. Будьте готовы подождать пару минут, чтобы получить веер из 6 картинок.

Topaz Gigapixel — мгновенный нейроапскейл

Автор: Topaz, Кот Веселый

Вы когда-нибудь сталкивались с ситуацией, когда нашли идеальную картинку, но её разрешение оставляет желать лучшего? Или, может быть, вы пытались посмотреть фото, сделанное на старенькую «мыльницу» два десятка лет назад, и результат вас разочаровал? Встречайте волшебную палочку мира изображений — Topaz Gigapixel!

Этот удивительный инструмент решает проблему низкого разрешения, с которой сталкиваются пользователи как AI Horde, так и AUTOMATIC1111. Дело в том, что обе эти системы обычно генерируют картинки в довольно скромном формате, чаще всего не превышающем 1024x1024 пикселей — а про старые фото вообще молчу, там можно встретить и 640x480, и 320x200. И вот тут-то на сцену выходит Topaz Gigapixel.

Работает эта утилита просто волшебно: загружаете изображение любого размера, и буквально через несколько секунд получаете его версию в гораздо более высоком разрешении. Локально и на почти любом «железе».

Эта удивительная программа творит настоящие чудеса. Она не просто растягивает изображение, а фактически «додумывает» детали, которых не было в оригинале. И делает это настолько хорошо, что результат часто выглядит лучше исходника! Причём работает Gigapixel не только с современными фото или продуктами нейросетевой генерации — он способен «оживить» даже старые снимки с «мыльниц» начала 2000-х, и, пусть уже не без проблем, подтянуть качество фото с сотовых тех же лет.

Вы находите на жёстком диске фотографии из своей первой (и, скорее всего, последней, с нашей-то экономикой) поездки в Турцию двадцатилетней давности. Мутные, нечёткие кадры, которые и рассматривать-то неприятно. Прогоняете их через Topaz Gigapixel — и вуаля! Перед вами яркие, чёткие снимки, словно сделанные на современную камеру. Программа не только увеличивает разрешение, но и убирает шумы, размытие и даже артефакты JPEG-сжатия.

Конечно, за такое волшебство приходится платить — Topaz Gigapixel стоит $99… Но я, согласно правилам сайта, категорически осуждаю пиратство программ даже из недружественных стран, и уж точно не советую искать кряк на первой же странице гугла.

Suno AI (и другие музыкальные сервисы) — музыка-на-заказ

Автор: Suno AI Источник: suno.com

Когда разговор заходит о влиянии ИИ на творческие профессии, многие сразу вспоминают о художниках и копирайтерах. Мол, вот-вот нейросети оставят их без работы. Но реальность оказалась несколько иной. Нейроарт, при всей своей впечатляющести, часто требует доработки для коммерческого применения. А чтобы получать действительно стоящие результаты от кастомизируемых нейросетей для генерации картинок, нужно потратить месяцы на их освоение.

Что касается копирайтеров, то тут и вовсе всё обернулось неожиданным образом. Нейросетевая революция не убила эту профессию, а трансформировала её. Опытные специалисты превратились в своего рода «пишущих редакторов», причём их зарплаты заметно выросли. Оказалось, что умение грамотно поставить задачу ИИ и отредактировать полученный текст — это ценный навык.

А вот кому действительно стоит начать волноваться, так это музыкантам. И дело тут в Suno — самой продвинутой на сегодняшний день нейросети для создания музыки. Представьте себе: вы можете сгенерировать полноценную песню с вокалом буквально за пару минут. Причём качество уже сейчас на уровне «сельского радио», а ведь технология продолжает стремительно развиваться.

Самое удивительное, что Suno способна создавать треки и на русском языке. А теперь задумайтесь: что будет через полгода? Через год? Не исключено, что мы стоим на пороге настоящей революции в музыкальной индустрии.

Конечно, профессиональным музыкантам такая перспектива может не понравиться. Но для обычного пользователя это открывает совершенно новые горизонты. Теперь вы можете заказать именно ту музыку, которая нравится лично вам, в том стиле, который вам по душе. Более того, вы можете использовать свои собственные слова для песни (кстати, их вполне можно попросить написать нашу старую знакомую «Кладю»).

Стоит отметить, что Suno — не единственный сервис такого рода. На рынке уже есть несколько подобных инструментов, и каждый из них имеет свои сильные стороны. Кто-то лучше справляется с определённым жанром, кто-то предлагает более широкие возможности для кастомизации. Подробное сравнение этих сервисов с примерами звучания — тема для отдельного большого обзора. Который уже был написан.

Проверил 5 нейросетей для генерации музыки: как звучит нейрогитара и сколько стоит в коммерческих целях?

Вместо итога

Мы живём в удивительное время. Нейросетевая революция разворачивается вокруг нас такими темпами, что эта статья, скорее всего, устареет уже через пару месяцев. Невольно ловишь себя на мысли, что, возможно, мы чувствуем себя так же, как жители Викторианской эпохи во время промышленной революции. Мир меняется на глазах, и мы — в самом центре этих изменений. Захватывающе? Безусловно. Пугающе? Немного. Но главное — невероятно интересно.

Но пока что мой личный список самых полезных и доступных плодов этой революции выглядит именно так. Впрочем, учитывая невероятную скорость развития технологий ИИ, вполне возможно, что я упустил из виду какие-то не менее полезные программы или сервисы.

Поэтому я прошу вас, коллеги, дополнить эту статью в комментариях. А этот список — то, чем пользуюсь лично я.

Полезные статьи:

Выбираем ноутбук на RTX 4080: 5 моделей с экраном 16 дюймов и нативной русской раскладкой

Выбираем легкий ультрабук для походной работы: 10 моделей весом до 1.8 кг с русской раскладкой

Как ИИ изменит игровую индустрию через 10 лет: уникальная игра для каждого?

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Коммерческий автор с фабрики тюменско-китайских унитазов имени Ц. Г. Поца, отдыхающий от работы здесь. Пишу о том, в чём разбираюсь (или в чём считаю, что разбираюсь), потому что писать бред для коммерсантов стало откровенно надоедать.

Несколько лет проработал компьютерным мастером, так что, порой, и о «железе» могу написать, если вдруг что в руки попадёт. Всегда мечтал быть игровым журналистом — и, как знать, может быть однажды эта мечта сбудется? К критике отношусь положительно, пока не обкладывают резиновыми органами.

5 комментариев

к
Активно пользую Suno и прям есть четкое ощущение что эта хреновина ПОНИМАЕТ о чём поёт!
ЗЫ Я в курсе про udio вот когда дадут песню на 4 минуты без гемора склепать и когда ИИ не будет забивать каждый первый раз на текст песни и жанр тогда и буду пользовать)
U
Для большинства для Stable diffusion хватит Fooocus, крутилок минимум, результат отличный.
k
Иронично, что пост о нейросетях, писался нейросетью. Как тебе не стыдно, автор?!
к
А шо не так? Вот если бы пост о вреде нейросетей писался нейросетью то да)
Veselyi_kot
Пост писался руками. Даже кладя пока не может в хорошие инфотексты без разжевывания каждого шага, ждем Opus скрестив клешни.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Ничего лучше в путешествие не найти! Обзор складного фена Dreame Pocket AHD51

Сегодня я расскажу о легком и компактном складном фене Dreame Pocket (AHD51), который станет незаменимым помощником в любой поездке благодаря быстрой и комфортной сушке. Этот фен оснащён двумя...

Новое поколение: обзор магнито-планарных наушников TinHiFi P1 Max II

В это сложно поверить, но планарные наушники P1 от компании TinHiFi получили ещё одно продолжение в лице уже немного нашумевших P1 Max II. Модель и правда получилась отличная, однако к чему...

Почему не стоит собирать игровой ПК на процессоре Xeon

Сборка персонального компьютера — это дело не простое, особенно в наше неспокойное время, когда цены на компьютерные комплектующие сильно зависят от геополитической обстановки в мире....

Зачем в местах ядерных катастроф высаживают подсолнухи

Высаживание подсолнухов на местах ядерных катастроф кажется на первый взгляд странной практикой, но на самом деле эта идея имеет глубокие научные и экологические обоснования. Подсолнухи, известные...

NASA уверяет: экипаж Starliner «не застрял». Но когда ждать возвращения на Землю?

Миссия Starliner, амбициозный проект компании Boeing по созданию пилотируемого космического корабля для NASA, вновь столкнулся с трудностями. Несмотря на успешный запуск 5 июня и стыковку с...

Почему выключатели и розетки в квартирах раньше ставили так высоко

Многие еще помнят, что высота выключателей света в квартирах в советское время была не такой, как делают при ремонтах теперь. Тогда считалось нормой положение выключателя в 150-160 см от пола,...