Лучше, чем DeepSeek и OpenAI: рассуждающая модель Alibaba QwQ-32B превосходит конкурентов в программировании и решении задач малыми силами
Alibaba рассказала о новейшей «думающей» ИИ-модели open source. По данным самого китайского IT-гиганта, модель QwQ-32B превосходит по производительности нашумевшую DeepSeek-R1 и o1-mini компании OpenAI.
Акции Alibaba уже подорожали на фоне новостей на несколько процентов. Несмотря на относительно скромные 32 млрд параметров модели, она, предположительно, превосходит R1 с 671 млрд параметров в математике, программировании и решении задач в целом. Во всяком случае, так заявляет команда, отвечающая за модели компании семейства Qwen.
В Alibaba заявляют, что меньшее количество параметров позволяет работать с меньшими требвоаниями к вычислительным ресурсам, поэтому её можно будет широко внедрять в самых разных сферах.
Появление новой рассуждающей модели состоялось менее чем через два месяца после того, как DeepSeek встряхнула рынок ИИ, предложив миру R1.
События происходят на фоне бума внедрения искусственного интеллекта в КНР — в феврале месяце Alibaba пообещала инвестировать $52 млрд в ИИ и облачные вычисления в следующие три года. Это стало крупнейшим в истории вычислительным проектом, финансируемым в Китае за счёт единственной компании.
Alibaba уделила внимание не только DeepSeek и уже заявила, что её новинка превзошла o1-mini от OpenAI со 100 млрд параметров. Ознакомиться с ней можно на платформе Hugging Face — это самое большое в мире сообщество ИИ-моделей open source.
Сообщается, что методика обучения новой модели сходна с методикой, применявшейся для R1, применяется «обучение с подкреплением».
Не так давно представитель Alibaba уже объявил, что основной задачей бизнеса является создание ИИ-модели с «общим искусственным интеллектом» — такая равна человеку по «качеству» мышления или даже превосходит его. По оценкам Alibaba, речь идёт о точке, в которой ИИ сможет добиться уровня в 80 % возможностей человеческого сознания.
С превью модели можно ознакомиться на сайте самой компании без смены IP и прочих ухищрений — доступные модели уже превосходят R1 по ряду параметров. Например, они способны неплохо рисовать.
Источник: SCMP





2 комментария
Добавить комментарий
Добавить комментарий