«Сбер» открыл доступ к сервису генерации текста на русском языке

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

«Сбер» выложил нейросетевые языковые модели генерации текста под названием ruGPT-3.5 13B.


В обучении нейросетевых языковых моделей генерации текста приняли участие сотрудники «Сбер» из отделов Ai и Devices, им помогали ученые из института AIRI. Модель расположена на ресурсе ML Space в разделе предварительно обученных моделей и наборов данных DataHub. ruGPT-3.5 13B доступна для всех российских разработчиков и является абсолютно бесплатной, она имеет возможность вести свою работу на двух языках — английский и русский.

Датасет первого этапа обучения
Источник: cdn.cloud.ru

«Сбер» стоит на том, что открыть свои технологий для обмена опытом с ИТ сообществом. Руководство компании считает, что открыв доступ к уже обученным моделям, они подтолкнут отечественных программистов к ведению разработки собственных технологических продуктов.

Вице-президент по технологиям «Сбер» Андрей Белевцев.

Модель ruGPT-3.5 13B разработана в 2023 году на основе GPT-3 от OpenAI. Сотрудники «Сбер» вели обучение своей модели на текстовых сборках, которые включают в себя 13 млрд различных параметров, а общий размер их более 1 Тб.