Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

MathGPT установил рекорд, побив ChatGPT и модели ИИ от Microsoft

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

9 января 2024, 15:08 | Новость | ИИ, сервисы и приложения

Компания Mathpresso объявила о том, что ее крупная языковая модель под названием MathGPT установила новый мировой рекорд в области математики, обойдя модели OpenAI и Microsoft. Компания является разработчиком самой обширной в Азии обучающей платформы на основе искусственного интеллекта.

Как сообщается, MathGPT заняла первое место в тестах, оценивающих математические способности, таких как MATH (12,5 тыс. сложных математических задач) и GSM8K (8,5 тыс. задач по математике для начальной школы), побив модель ToRA 13B от Microsoft, которой принадлежал предыдущий рекорд.

В бенчмарке MATH MathGPT превзошел производительность GPT-4 от OpenAI. Совместная разработка Qanda и Upstage начала создавать MathGPT в рамках стратегического партнерства с KT в ноябре 2023 года. Qanda предоставила Upstage данные об обучении, такие как уровень обучения, контекст и взаимодействие, накопленные в результате ежедневного поиска 10 млн задач.

В сентябре 2023 года Mathpresso также получила от KT инвестиции в размере $8 млн на развитие LLM. Upstage обучила его на собственном специализированном решении для предотвращения галлюцинаций и доработала языковую модель на основе естественного языка, чтобы обеспечить логические выводы.

ChatGPT обучается на основе обширных текстовых данных, а не на основе данных, специфичных для конкретной области, таких как знания экспертов. Следовательно, в нем проявляется феномен галлюцинации, когда нейронная сеть генерирует ответы, которые могут убедительно передавать неверную информацию. Это создает серьезную проблему. Особенно в образовательных контекстах, где распространение точной и достоверной информации имеет первостепенное значение. Примечательно, что ChatGPT продемонстрировал низкую точность, особенно в математических областях.

В заявлении Qanda говорится, что они продолжат улучшать точность и производительность MathGPT, и в конечном итоге объединят его со своим обучающим интерфейсом для реализации AI Tutor, помощника в виде ИИ-репетитора.

Qanda поддерживается такими крупными организациями, как Google, TikTok и Softbank Ventures Asia. Приложение распознает текст и математические уравнения с фотографий. Ежедневно в Qanda загружается около 10 млн фотографий по всему миру.

Источник: Mt

6 комментариев

Перевод новости от нейронки? Где пруфы? Если погуглить эту модель там один скам и реклама приложений скорее всего на основе ворованых моделей chatgpt.

Ответить

Плохо гуглишь.

Ответить

Подскажите, пожалуйста, а по каким ключевым словам правильно гуглить в данной ситуации? Я решил попробовать, где этот бенчмарк MATH расположен и кто там на каких местах. Погуглил по словам «benchmark MATH problem solving». Пришёл на страницу https://paperswithcode.com/sota/math-word-problem-solving-on-math
Но там на первом месте… GPT-4-code model (CSV, w/ code, SC, k=16).
Что я делаю не так?

Ответить

Все не так. У Qanda есть свой Github.
Допустим, вас же не смутило, что это уже давно не первое место https://github.com/iiis-ai/cumulative-reasoning, если вы с этим ознакамливались вообще.

Ответить

Я как раз попался на этот скам. Потратил 1200 руб и получил нейронку, которая не может даже простейший интеграл найти с помощью интегрирования по частям…

Ответить

Молоток обогнал микроскоп в удобстве забивания гвоздей

Ответить

Добавить комментарий

Сейчас на главной

Новости

Энтузиаст создал самодельный аналог камеры Polaroid на базе термопринтера и Raspberry Pi

Фото и аксессуары
13 минут назад
0

Компания Lucid Motors вышла с концептуальным роботакси Lunar, которому не нужен ни руль, ни педали

Компания Emotiva представила стереоусилитель BasX TA2+ для Hi-Fi систем начального уровня

Аудио и звук
4 часа назад
0

Оператор JR Tokai открыл строительство станции для поезда на магнитной подвеске в провинции Яманаси. Станция станет частью линии Тюо Синкансэн из Токио в Нагою

Авто и транспорт
5 часов назад
0

За два года 33 000 водителей нарушили ПДД на железнодорожных переездах в Нидерландах

Авто и транспорт
5 часов назад
0

Публикации

Семь в одном. Обзор USB-C док-станции Rapoo XD71

Обзор
2 часа назад
Клавиатуры, мыши и периферия

Нынешние ноутбуки все больше становятся похожими на планшеты, лишаясь зачастую самых нужных портов. Вернуть привычные возможности позволяет док-станция Rapoo XD71 с двумя портами USB-A, картридером...

Мал, да удал. Обзор компактного аккумуляторного инструмента: 3-дюймовая УШМ под 18V батареи

Обзор
2 часа назад
Инструменты и запчасти

Аккумуляторная угловая шлифовальная машина ONEKFYFD, на которую можно установить диски/насадки 75 мм (3″). Выручает в мелких работах, например, по сантехнике и электрике, удобная для работы...

Как выглядела Вселенная в первые микросекунды: на Большом адронном коллайдере доказали жидкую природу первичной материи

Статья
4 часа назад
Наука и космос

Как изучать свойства материи, которая существовала лишь в первые микросекунды после Большого взрыва? Это состояние называется кварк-глюонной плазмой. В обычных условиях нашего мира кварки и...

Возможна ли жизнь без воды: как экзотические растворители расширяют границы обитаемой Вселенной

Статья
5 часов назад
Наука и космос

Вся современная астробиология построена на одном правиле: для возникновения и поддержания жизни необходима жидкая вода. Этот принцип определяет цели всех космических миссий, архитектуру...

Парадокс стакана воды: почему мы боимся таяния не тех ледников и откуда реально придет потоп

Статья
7 часов назад
Наука и космос

Белые медведи ни при чем. Разбираем сухие физические факты: почему тающий Северный Ледовитый океан не затопит города, куда делись 9 триллионов тонн горного льда и что происходит с Гренландией.

Ловушка «чемодана без ручки»: почему нам так страшно бросить то, что давно пора бросить

Статья
7 часов назад
Наука и космос

Продолжаем изучать ментальные приемы, которые помогают нам принимать верные решения и делают нас более эффективными. Сегодня поговорим про ловушку невозвратных затрат. Рассмотрим примеры и решения.