ChatGPT и его конкуренты: обзор пяти текстовых нейросетей

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Рассуждения | ИИ, сервисы и приложения

Технологии сделали для нас доступным использование искусственного интеллекта в повседневной жизни. Почти каждый пользователь Интернета, который хоть немного интересуется современными технологиями, уже попробовал ChatGPT. Это один из самых популярных чат-ботов. Но какие у него есть конкуренты?

В этой статье рассмотрим популярные аналоги уже ставшего базовым ChatGPT и проведем небольшой анализ: какую модель и в каких случаях каждую из них стоит использовать.

Как работают текстовые генеративные модели

Основанные на тексте генеративные модели искусственного интеллекта, такие как Large Language Models (LLM), функционируют путем анализа большого количества наборов текстовых данных для понимания и генерации текста, который похож на человеческий. Эти модели используют передовые алгоритмы для прогнозирования следующего слова или последовательности слов в предложении.

Одним из основных преимуществ текстового генеративного ИИ является его способность создавать связный, соответствующий контексту и часто очень креативный контент. Однако эти модели также сталкиваются с рядом проблем. Иногда они могут выдавать фактически неверную или вводящую в заблуждение информацию — проблема, известная как «галлюцинации». Процесс обучения таких моделей является ресурсоемким, требует значительных вычислительных мощностей и больших наборов данных.

Несмотря на недостатки, генеративный ИИ на основе текста продолжает развиваться, предлагая мощные инструменты для обработки языка и создания контента. Перейдем к аналогам ChatGPT.

Claude

Claude — это модель искусственного интеллекта, разработанная компанией Anthropic. Она известна своей универсальностью и безопасностью и предлагает ряд моделей, адаптированных для различных задач: от быстрых ответов до сложных рассуждений. Модель предназначена для минимизации галлюцинаций и поддержания высокой точности при работе с объемными документами.

Для работы с этой нейросетью без VPN воспользуемся сайтом lmarena. Он предназначен для сравнения результатов выдачи нескольких нейросетей. Также можно и просто использовать большое количество ИИ-моделей.

Переходим на сайт и нажимаем на «Direct Chat», так как сейчас нам нужен диалог только с одним чат ботом.

Выбираем нужную нам модель. Я выбрал claude-3-5-sonnet-20241022.

После выбора модели спуститесь чуть ниже и вставьте свой вопрос или задачу.

YandexGPT

YandexGPT — это российская модель искусственного интеллекта, разработанная Яндексом и предназначенная для различных приложений, таких как создание контента, техническая поддержка и виртуальные помощники. Она доступна в двух режимах — асинхронном для сложных задач и в режиме реального времени для быстрых ответов.

Перейдите на страницу Yandex Cloud и войдите с помощью Яндекс ID.

После этого вам доступна последняя модель YaGPT 4.

Gemini

Gemini — это мультимодальная модель искусственного интеллекта, разработанная Google DeepMind и предназначенная для обработки текста, изображений, аудио, видео и кода. Он выпускается в различных размерах — Ultra, Pro и Nano, каждый из которых оптимизирован для различных вариантов использования, от сложных задач до приложений на устройстве.

Бесплатно и без жестких ограничений тестировать Gemini можно также на сайте lmarena. Переходим на него, выбираем «Direct Chat» и нужную модель. Я выбрал gemini-2.0-flash-exp.

По аналогии с Claud спуститесь чуть ниже и вставьте свой запрос.

Mistral AI

Компания Mistral AI, базирующаяся в Париже, специализируется на моделях больших языков с открытым исходным кодом (LLM). Их модели известны своей эффективностью и возможностью настройки, а такие опции, как Mistral Nemo и Mistral Large, доступны для различных применений. Компания сосредоточена на том, чтобы сделать искусственный интеллект доступным и настраиваемым для различных нужд.

Перейдите на страницу регистрации Mistral AI и выберите удобный для себя способ.

Затем перейдите в Le Chat, где уже можно работать: писать свои запросы, включать веб-поиск, генерировать изображения.

GigaChat

GigaChat — это модель искусственного интеллекта, разработанная Сбербанком и призванная стать российской альтернативой ChatGPT. Она отлично справляется с русским языком и предлагает мультимодальные возможности, включая генерацию текста и изображений. Модель основана на совокупности нейронных сетей NeONKA и адаптирована для русскоязычных пользователей.

Переходим на сайт Giga Chat, где можно войти с помощью Сбер ID. Сейчас доступна модель GigaChat MAX. Можно отправлять запросы не только текстом, но и голосом.

Сравнительный анализ нейросетей

Для сравнения работы всех представленных в этой статье нейросетей протестируем их в разных условиях. Дадим моделям для решения легкие, средние и тяжелые по уровню сложности задачки в пяти сферах:

  • Образование.
  • Медицина.
  • Финансы.
  • Программирование.
  • Маркетинг.

Легкой задачей по программированию будет, к примеру, объяснение переменных в Python с примером кода, а сложной в маркетинге — составление маркетинговой стратегии для продажи нового продукта.

После получения результата сравним все модели в рамках отдельной задачи по пятибалльной шкале, где 5 — лучший ответ, 1 — худший. Оценивать буду по полноте ответа, структуре ответа и понятности информации. Оценки субъективные с точки зрения пользователя различных генеративных моделей.

Средние баллы в каждой сфере по отдельным моделям представил на графике снизу. Можно сделать несколько выводов:

  • На мой взгляд, Claude и Mistral AI являются лучшими моделями в проведенном эксперименте. Стоит отметить, что Claude более стабилен во всех изученных областях.
  • GigaChat и YandexGPT получили, по моему мнению, самые низкие оценки в среднем, но у модели Яндекса хорошие результаты в сфере образования, а у GigaChat — в программировании.

В целом сравнение показало, что все нейросети имеют сильные и слабые стороны. Другие модели, кроме ChatGPT существуют и развиваются также стремительно, так что не стоит зацикливаться только на модели от OpenAI. В качестве его аналогов я лично использую Mistral AI, так как он не имеет ограничений и работает без VPN.

Новый Год совсем близко, но всё же может быть кто-то из вас ещё не нашел подходящий подарок. Для вас подборки:

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Cooperation for product reviews:
Почта: articlesinfohub@gmail.com
Телеграм: https://t.me/ImMaksims

Для предложений по сотрудничеству пишите на почту или в Telegram.

12 комментариев

n
Не хватает Qwen 2.5 и Deepseek v3.
111712135335367606835@google
Тут многих не хватает особено которые раньше вышли…
104539747560160529877@google
По хорошему было правильно убрать из статьи все упоминания про ИИ. Постоянное отождествление LLM и ИИ, это чисто человеческий кретинизм. Он обусловлен тем, что к сожалению большинство людей в следствии умственной отсталости сами обладают весьма слабым интеллектом, и не способны к пониманию и адекватному восприятия подобных сущностей.
5
Обязательно учтём ваше мнение и исправимся. Продолжайте оставлять полезную (нет) обратную связь
102008995170272980489@google
Ты бы язык родной выучил, потом других кретинами называл.
106529328586298275120@google
Клода с мистралем на одном месте нарисовать, ну ну…
104281831733630504582@google
По моему когда была просто Алиса без gpt, лучше было. Та хоть как-то отвечала, и хоть какую-то имитацию диалога вела — а сецчас решил затестить пару мес назад — что не задашь «ищите в яндекс браузере» хоть что по техническоц части блендера, что не какая погтда, иди ищи в браузере вот ссылка. Как то так. Пока она кажется максимально сырой
n
А где спрашивал у Алисы? В браузере на ПК?
104281831733630504582@google
На пк в браузере и потом на телефонесравнивал с алисой с gpt
D
Подскажите, есть какие-то решения интеграции ИИ с умными колонками для практики иностранного языка без особых танцев с бубнами?
Нужно болтать голосом и чтобы ИИ мог поправялять и предлагать более красивые / нативные варианты изречения? Пользуюсь таким ботом в тг, но для этого приходится втыкать в телефон
Azy_421
Как-то решил попользоваться Гигачатом… На запрос «Назови синонимы слова империя» он ответил «Как у нейросетевой языковой модели у меня не может быть настроения, но почему-то я совсем не хочу говорить на эту тему». В общем-то на этом моё «тестирование» это модели закончилось))

Добавить комментарий

Сейчас на главной

Новости

Публикации

Мог ли человек победить тираннозавра в армрестлинге? Палеонтологический разбор

Представьте себе: арена, рев толпы, напряжение висит в воздухе. Но вместо привычных атлетов на помост выходит… человек и тиранозавр. Нет, это не начало научно-фантастического фильма, а...

Обзор обновленной электронной книги ОНИКС БУКС Беринг 5

Чтобы выделить локальную линейку своих электронных книг, компания ONYX International Inc провела небольшой ребрендинг и теперь все произведенные для российского рынка устройства будут продаваться...

«Экономика намерений»: Как ИИ продает ваши намерения, пока вы еще не приняли решение?

Будущее, о котором мы читали в научно-фантастических романах, кажется, уже на пороге. И речь не о летающих автомобилях, а о чем-то гораздо более интимном: искусственном интеллекте, способном...

Сможем ли мы когда-нибудь «пощупать» гравитацию? Почему физики не отступают от теории струн?

А вы когда-нибудь, глядя на звездное небо, задумывались о том, что управляет всем этим великолепием? Как самые фундаментальные законы физики взаимодействуют, создавая галактики, звезды и даже нас...

Это не рассказывают в автошколе: зачем нужен рычажок на зеркале заднего вида

Многие автомобилисты, даже опытные, не подозревают о скрытых возможностях своих железных коней. Автошколы, сосредотачиваясь на базовых навыках вождения и правилах дорожного движения, часто упускают...

Почему ананас щиплет язык

Ананас часто покупают в качестве украшения новогоднего стола. Многие верят, что он способствует сжиганию жира — крайне актуальная задача во время праздничного застолья. Но много этого...