ИИ-технологии Сбера выложили в открытый доступ

Новые модели публикуются с лицензией MIT, что допускает их коммерческое использование

Команда Сбербанка сообщила, что в открытом доступе появились базовая и инструктивная версии самой быстрой модели GigaChat Lite и самая сильная, согласно бенчмарку ruMTEB, модель на русском языке GigaEmbeddings-instruct. 

ИИ-технологии Сбера выложили в открытый доступ
Сгенерировано нейросетью Dall-E

Также большое обновление получило семейство open-source моделей машинного обучения для распознавания речи и эмоций GigaAM (Giga Acoustic Model). Об этом рассказал технический директор GigaChat Федор Минькин на международной конференции AI Journey («Путешествие в мир искусственного интеллекта»).

В новой версии акустических моделей GigaAM улучшены подготовка данных и технология предобучения базовой модели. За счёт этого удалось значительно снизить количество ошибок в словах (Word Error Rate) при распознавании русскоязычных запросов.  Для самой сильной модели семейства GigaAM-RNNT этот показатель улучшен на 25% относительно предыдущей версии и на 56% превосходит OpenAI-Whisper-large-v3.

Обновлённая линейка моделей GigaAM поддерживает дообучение и инференс с Flash Attention, что дает существенное ускорение на современных видеокартах. Для повышения доступности использования моделей команда упростила код, снизила число зависимостей и подготовила конвертацию в формат ONNX (открытая библиотека программного обеспечения). Новые модели публикуются с лицензией MIT, что допускает их коммерческое использование.

13 декабря 2024 в 11:52

Автор:

| Источник: Сбер, Сбер, Сбер

Все новости за сегодня

Календарь

декабрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31