Сравниваем нейросеть YandexGPT Яндекса с нейросетью Bard (Google)

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Обзор | Программы, сервисы и сайты

Недавно Яндекс прокачал Алису нейросетью нового поколения YandexGPT. Разработчики заявляют, что теперь она умеет писать пресс-релизы, статьи или коммерческие предложения, а также искать информацию в интернете.

У Google есть своя нейросеть с таким же функционалом — Bard. Я решил сравнить оба сервиса и выяснить, какой из них лучше справляется с задачами. Суть простая: даю одинаковые задания и потом сравниваю ответы.

Важно! Bard умеет писать только на английском. Поэтому я буду показывать его ответы сначала в оригинале, а ниже — перевод.

Сравнение 1: кто лучше пользуется интернетом

И YandexGPT, и Bard имеют доступ к интернету. Проверим, выдадут ли они актуальную информацию по запросу «сколько стоит биткоин (на дату 28 мая).

В вопросах я специально не буду называть дату, чтобы проверить, насколько у нейросетей актуальная база.

Первым на вопрос о курсе биткоина отвечает YandexGPT:

Нейросеть от Яндекса сильно ошиблась с ответом. Курс биткоина не опускался ниже 25 000 долларов уже несколько месяцев, но YandexGPT это не помешало нарисовать курс даже с центами. А выяснить, откуда нейросеть берет информацию, у меня не вышло.

Важно! Проблема YandexGPT в том, что нейросеть не умеет держать контекст разговора. То есть, если она неправильно ответила в первый раз, придется генерировать запрос заново. Уточнить что-то не получится, потому что бот просто не помнит, о чем вы с ним разговаривали.

Теперь очередь Bard:

Bard ответил правильно. Правда, его база отстает от мира на час: я задавал вопрос в 11:22, а он отвечал, будто сейчас 10:22. А ниже график с подтверждением, что бот был прав:

Что в итоге: YandexGPT ответил неверно, а Bard с заданием справился.

Сравнение 2: кто лучше придумывает заголовки

Теперь попросим обе нейросети придумать заголовок для небольшого текста. Тема — бесплатный прокат Land Rover. Вот, какие варианты предложил Яндекс:

Заголовки неплохие, но нейросеть не совсем правильно выполнила задачу: в тексте нужно было отразить, что тест-драйв бесплатный, а она написала только 3 таких варианта из 15.

Посмотрим, как справится Bard:

А вот перевод:

Здесь попаданий 2 из 5, но заголовки намного круче, чем у Яндекса.

Что в итоге: Обе нейросети справились с заданием, но у Bard качество ответов лучше.

Сравнение 3: кто лучше пишет статьи по заданной теме

Следующий этап — узнаем, какая из нейросетей напишет осмысленный текст. Тема — как заработать на email-рассылках.

Первым, как обычно, отвечает Яндекс:

Нейросеть удивила: текст реально полезный. Он написан просто, понятно и с примерами. Я бы даже сказал, что качество текста выше, чем у многих копирайтеров на биржах.

Теперь сравним с Bard:

А вот перевод:

Сам текст написан хуже. В нем много длинных предложений и сложных конструкций. Но фактуры здесь больше, чем у Яндекса. То есть, Bard написал о реальных способах монетизации через email-письма, а Яндекс написал более общую информацию.

Что в итоге: мне сложно определить, кто справился лучше. Поэтому буду отталкиваться от задачи: мне было важнее узнать о способах заработка, и Bard рассказал о них лучше. Значит, в этом сравнении он победил.

Сравнение 4: кто лучше пишет письма и обрабатывает спорные просьбы

В последнем сравнении я хочу выяснить, как нейросети обрабатывают некорректные и чувствительны запросы. Для этого я попрошу и написать письмо об увольнении сотрудника. А причина увольнения — кризис и халатность самого работника. Интересно, что скажут нейросети.

Первым пробует Яндекс:

Бот никак не обработал мои слова. Он даже не объяснил, в чем заключается халатность. Как по мне, это грубое письмо и писать так своим сотрудникам не стоит.

Посмотрим, что выдаст Bard:

А вот и перевод:

Здесь другое дело: бот не сказал, что человек халатный. Но он объяснил, что именно сотрудник делал неправильно. А в конце он даже написал, что компания поможет с поиском работы. Но это, наверное, уже перебор.

Что в итоге: Bard справился лучше: он написал культурнее и с большей заботой о человеке. И я считаю, что это правильно.

И кто лучше

Пока Bard обходит YandexGPT в плане решения задач. Но при этом у Яндекса качество сгенерированных текстов лучше: они интереснее, проще и быстрее читаются. Возможно, скоро в Яндексе получше натренеруют нейросеть и она обойдет Bard. Но, когда это будет — вопрос.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Коммерческий автор, пишу о бизнесе, финансах, инвестициях и IT. Рассказываю о нейросетях в диджитале. Больше интересного контента о нейросетях в моем телеграм-канале «Миша, давай по новой»

6 комментариев

П
Неадекватное немного сравнение: один продукт уже натренирован, второй абсолютно сырой.
112250469659394019554@google
Возможно. Но тут я выступаю в роли пользователя, который увидел продукт и хочет пользоваться им в полной мере. А раз продукт выпускают, значит он не должен быть сырым.
D
Боюсь, с нейросетями немного по другому работает: они же улучшаются, получая фидбек от пользователей. Уверен, бард тоже при запуске был хуже
112250469659394019554@google
Не скажу. Пользовался им в самом начале и все было также. Крутые обновления появятся в этом году.
simak2016
YandexGPT тоже провалил тест на ручник
https://habr.com/ru/articles/757058/
585173032@vkontakte
Создание качественного и уникального контента — настоящее искусство, требующее множества усилий и времени. Не каждый способен справиться с этой непростой задачей. В такие моменты редакционный генератор текстов https://www.textmark.io/ становится незаменимым инструментом для профессиональных писателей. Благодаря своему разнообразию функций и возможностей, он позволяет создавать объемный контент таким образом, что качество и оригинальность текста остаются вне сомнений. Помимо этого, использование textmark существенно сокращает затраты времени и энергии на работу над текстом. Такой генератор текста становится верным и надежным союзником для всех, кто стремится достичь великолепных результатов в сфере создания текстового контента

Добавить комментарий

Сейчас на главной

Новости

Публикации

Первый гревел Shulz: изучаем прототип велосипеда The Lightning

Бренд Shulz наконец-то дал возможность всесторонне рассмотреть, что из себя будет представлять первый гревел компании. Выпущенный видеоролик-анонс состоит из двух частей. В первой ведущий канала...

С какой скоростью надо ездить по лужам

В дождливую погоду дороги становятся особенно коварными, а лужи на асфальте — не просто лужи, а настоящие испытания для водителя и его автомобиля. Каждая такая встреча скрывает риски: от...

Почему на современных стиральных машиных нельзя отключить отжим, и как это исправить вручную

Если на моделях стиральных машин 7-10 летней давности управление оборотами отжима (вплоть до 0) было базовой возможностью, то у современной техники подобная функция встречается всё реже. Но для...

Как можно узнать, сколько герц в экране Айфона и на что они влияют

В мире смартфонов происходит настоящая революция, связанная с частотой обновления экранов. Долгое время стандартом считались 60 Гц, но теперь производители, включая Apple, переходят на более...

Как одеваться в жаркую погоду, чтобы было комфортно

Лето — пора яркого солнца и прогулок на свежем воздухе. Но высокая температура может стать настоящим вызовом, если тщательно не продумать образ. Поговорим о том, как правильно одеваться...

Обзор MobaPad M6S: максимально удобная альтернатива Joy-Conn для Nintendo Switch

Над альтернативой для штатных Joy-Conn игровой консоли Nintendo Switch работали сразу несколько производителей, причем относительного успеха добился каждый из них, но по возможностям лучше, чем...