Исследование показывает, что ChatGPT допускает ошибки при создании планов лечения рака

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | Программы, сервисы и сайты

ChatGPT активно внедряется во многие сферы нашей жизни, однако новое исследование предполагает, что есть одна ключевая область, где его использование вряд ли будет актуальным в ближайшее время. Исследователи из «Brigham and Women's Hospital» — учебной больницы Медицинской школы Гарварда в Бостоне, обнаружили, что планы лечения рака, созданные революционным чат-ботом от OpenAI, содержали множество ошибок.

Источник: www.businessinsider.com

Согласно исследованию, опубликованному в журнале JAMA Oncology, при запросе на создание планов лечения для различных случаев рака, треть ответов большой языковой модели содержали неверную информацию. Исследование также отметило, что чат-бот имел тенденцию смешивать правильную и неправильную информацию так, что становилось сложно определить, что является точным. Из общего числа 104 запросов около 98% ответов ChatGPT содержали хотя бы одно рекомендованное лечение, соответствующее рекомендациям Национальной комплексной сети по борьбе с раком (National Comprehensive Cancer Network), говорится в отчете.

Ответы чат-бота часто звучат уверенно и имеют логику, и то, как он может смешивать неправильную и правильную информацию, потенциально опасно. Даже эксперту трудно определить, какая рекомендация неверна"

соавтор исследования Даниэль Биттерман

ChatGPT получил ошеломительный успех с момента своего старта в ноябре 2022 года, достигнув 100 миллионов активных пользователей через два месяца после дебюта. Чат-бот вызвал бурный приток инвестиций в компании по искусственному интеллекту и ожесточенные дебаты о долгосрочном влиянии искусственного интеллекта.

Несмотря на успех ChatGPT, генеративные модели искусственного интеллекта все еще подвержены «галлюцинациям», когда они уверенно представляют информацию, которая вводит в заблуждение или крайне неверна. Хотя попытки интегрировать искусственный интеллект в здравоохранение, прежде всего для оптимизации административных задач, уже идут полным ходом. Ранее в этом месяце большое исследование показало, что использование искусственного интеллекта для скрининга рака груди является безопасным и может почти наполовину уменьшить нагрузку на радиологов.

Специалист по информатике из Гарварда недавно обнаружил, что GPT-4, последняя версия модели, может успешно сдать экзамен на медицинское лицензирование в США — и предположил, что у нее лучшие клинические оценки, чем у некоторых врачей. Тем не менее, проблемы с точностью генеративных моделей, таких как ChatGPT, означают, что они вряд ли в ближайшее время займут место врачей.

Источник: https://www.businessinsider.com/

3 комментария

110099057848603336766@google
Безусловно, AI и подобные чат-боты имеют потенциал, но как и любое новое технологическое решение, они требуют тщательной проверки и валидации. На данном этапе я бы рассматривала их не как замену профессиональному мнению специалистов, а как инструмент дополнительной помощи. Важно помнить, что в медицинских вопросах каждая деталь имеет значение, и мы не должны полагаться исключительно на машины.
s
Все любят халяву, если машина может выполнять чужую работу почти бесплатно все сразу же на неё пересаживаютмя, сколько уже случаев где и адвокаты и известные художники пользовались и поменяли свою работу. Как доп помощник никто не будет использовать халяву даже если он на треть ошибается. Бональная лень людей одержит верх
db10993f565702129b84931fcfd0a778@livejournal
Кто вообще додумался… это же безмозглый попугай :> «Китайская комната»…

Добавить комментарий

Сейчас на главной

Новости

Публикации

Первый гревел Shulz: изучаем прототип велосипеда The Lightning

Бренд Shulz наконец-то дал возможность всесторонне рассмотреть, что из себя будет представлять первый гревел компании. Выпущенный видеоролик-анонс состоит из двух частей. В первой ведущий канала...

С какой скоростью надо ездить по лужам

В дождливую погоду дороги становятся особенно коварными, а лужи на асфальте — не просто лужи, а настоящие испытания для водителя и его автомобиля. Каждая такая встреча скрывает риски: от...

Почему на современных стиральных машиных нельзя отключить отжим, и как это исправить вручную

Если на моделях стиральных машин 7-10 летней давности управление оборотами отжима (вплоть до 0) было базовой возможностью, то у современной техники подобная функция встречается всё реже. Но для...

Как можно узнать, сколько герц в экране Айфона и на что они влияют

В мире смартфонов происходит настоящая революция, связанная с частотой обновления экранов. Долгое время стандартом считались 60 Гц, но теперь производители, включая Apple, переходят на более...

Как одеваться в жаркую погоду, чтобы было комфортно

Лето — пора яркого солнца и прогулок на свежем воздухе. Но высокая температура может стать настоящим вызовом, если тщательно не продумать образ. Поговорим о том, как правильно одеваться...

Обзор MobaPad M6S: максимально удобная альтернатива Joy-Conn для Nintendo Switch

Над альтернативой для штатных Joy-Conn игровой консоли Nintendo Switch работали сразу несколько производителей, причем относительного успеха добился каждый из них, но по возможностям лучше, чем...