Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

ИИ в очередной раз провалил тест на «человечность», но уже совсем скоро ChatGPT может заменить живого собеседника

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

5 декабря 2023, 11:23 | Новость | Оффтопик

В Калифорнийском университете города Сан-Диего провели тестирование нескольких популярных чат-ботов на способности выдавать ИИ за живого человека. А для тестирования использовался уже проверенный годами эмпирический тест Тьюринга, показывающий способность чат-бота выдавать себя за человека, поддержать любой разговор. Суть теста заключается в определении искусственного интеллекта мыслить как живой человек. По правилам теста живой человек общается с живым человеком и «компьютером», который должен выдавать себя за человека.

Новый эксперимент охватил более 650 добровольцев, с которыми провели более 1800 опросов. При опросах использовались три виртуальных чата выдающих себя за реального собеседника. Но, чтобы действительно показать разницу в способностях мыслить и давать правильные ответы использовались различные языковые модели. Так, ChatGPT использовал бесплатную версию GPT-3.5 и GPT-4 с доступом по подписке, а также устаревшую версию виртуального собеседника ELIZA, которая появилась еще в 1966 году.

Для правдоподобности работы ИИ стоял запрет на работу бота, что он является человеком. Это усложняло задачу ChatGPT и собеседникам. Во время опроса задавались вопросы, согласно которым, отвечающему следовало доказать, что он живой человек, а не бот. В таком разговоре бот всегда являлся ответчиком.

По полученным результатам опроса устаревший виртуальный собеседник ELIZA смогла убедить менее 30% опрошенных, что она человек. ChatGPT с бесплатной языковой моделью GPT-3.5 показал плохие результаты и смог убедить менее 15% опрошенных, что он человек. А вот бот с GPT-4 смог «обмануть» более 40% опрошенных, что он человек. Но для успешного прохождения теста требуется не менее 50%, поэтому все чат-боты провалили тест считаться живым собеседником.

Во время теста исследователи заметили, что среди опрошенных менее 65% смогли правильно идентифицировать живого собеседника, поэтому результат ChatGPT GPT-4 на довольно неплохом уровне.

Источник: https://twitter.com

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Госдума приняла в первом чтении законопроект о штрафах для водителей электросамокатов. 30 тысяч рублей теперь не предел

От 10090 рублей до батареи на 10300 мАч: представлены смартфоны серии Doogee Blade 10

Аналитики предсказывают рекордный рост Solana до $2800

Биткоин позволит спасти экономику США, уверен глава Shapeshift

Новый виток в деле Tether: инвесторы обвиняют компанию в манипуляции крипторынком

Публикации

P2P-сети, доверие и безопасность. Почему в Биткоин-сетях все по-честному

Рассуждения
14 минут назад
Криптовалюты, NFT и финансы

Хранится ли Биткоин у кого-то на компьютере? Уже выяснили, что нет. Есть ли какое-то физическое воплощение — часто рисуют золотые монетки с чеканкой? Тоже нет. А что все-таки...

Защита картера: действительно ли она необходима для вашего автомобиля?

Рассуждения
33 минуты назад
Автомобили, транспорт и аксессуары

Угадайте, какой аксессуар чаще всего предлагают при покупке нового авто? Конечно, это защита картера! Наши дороги делают этот элемент почти незаменимым — малейшее отвлечение, и ваш...

Как можно создать секретный чат на любом Айфоне без мессенджеров и социальных сетей

Гайд
2 часа назад
Оффтопик

В эпоху цифровых технологий, когда конфиденциальность становится все более ценной, пользователи iPhone имеют неожиданный способ вести тайную переписку. Стандартное приложение «Заметки», обычно...

Обзор портативной колонки Soundmax SM-PS5027B

Обзор
2 часа назад
Hi-Fi и цифровой звук

В этом обзоре рассмотрим портативную колонку Soundmax SM-PS5027B. Это отличный выбор для тех, кто ищет бюджетное устройство с большим количеством режимов работы. Она подойдёт как для использования...

Титан: рай для серфингиста... если вы не боитесь жидкого метана

Рассуждения
2 часа назад
Наука и космос

Титан, крупнейший спутник Сатурна, давно манит ученых своим сходством с Землей. Здесь, под плотной азотной атмосферой, текут реки и плещутся моря, правда, не водяные, а метановые. Миссия «Кассини»,...

Обзор накопителя 2.5" Orico Y-20 512 ГБ

Обзор
4 часа назад
HDD, SSD, флешки, прочие носители информации

Сегодня вспомним, что помимо распространенных накопителей NVMe SSD M2, существуют и даже используются еще другие стандарты. Стандарт 2,5″ SSD пришел на смену медленным HDD, и еще используется...