Как пишет издание «Коммерсантъ», структура Роскомнадзора выделила 57,7 млн руб. на разработку системы «Окулус», которая на основе нейросетей будет анализировать фото, видео и тексты на сайтах, в соцсетях и мессенджерах на предмет запрещённой информации. Система должна появиться уже к декабрю.
Разработкой «Окулус» для «Главного радиочастотного центра» (ФГУП ГРЧЦ, структура Роскомнадзора) займется ООО «Эксикьюшн Эр Ди Си». Информация об этом опубликована на сайте госзакупок 15 августа. Сделать систему нужно к 12 декабря.
По технической документации, «Окулус» будет в реальном времени анализировать изображения и видео, переписки в чатах и материалы каналов мессенджеров, URL-адреса и другие данные на предмет запрещённой информации. Система должна находить запрещённый контент не только в текстовом виде, но и в «сценах, сочетаниях предметов, композициях образов, лицах, статике и динамике движений».
По условиям тендера подрядчик обязан не только создать систему, но и предоставить ГРЧЦ дата-сеты, которые позволят определять запрещённую информацию. Исполнитель также поставит ГРЧЦ размеченные наборы данных для обучения модели распознавания лиц «в объёме не менее 100», так как в «Окулус» должна быть реализована «функциональность каталогов определяемой символики, сцен и действий, персоналий».
Мощность системы должна составить 200 тыс. изображений в сутки.
По словам директора по цифровым технологиям ГРЧЦ Константина Буланова, для стабильной работы системы понадобится не менее 48 серверов, оснащённых графическими ускорителями, а поиск запрещённого контента будет осуществляться благодаря нейронным сетям, работающим на основе глубокого машинного обучения.
В список запрещённого контента, который призвана анализировать система (содержится в приложении к техдокументации), помимо материалов с признаками экстремизма и терроризма, призывов к массовым незаконным мероприятиям, выражения явного неуважения к обществу, государству и официальным символам РФ, информации о способах совершения суицида и методах изготовления наркотиков, вошла также пропаганда нетрадиционных сексуальных отношений и демонстрация употребления табачной продукции.
Собеседник «Коммерсанта» в крупной IT-компании рассказал, что на деле реализовать такую систему практически невозможно не только в рамках заданных сроков и 57 млн руб., но и вообще: «Исполнителю ставят не конкретные цели, задачи и требования, которые можно выполнить при доработке уже существующей и работающей системы, а просят спроектировать принципиально новое решение, что невозможно сделать в обозначенный срок».
В то же время гендиректор Smart Engines Владимир Арлазаров полагает, что «на текущем уровне развития IT» заявленные задачи можно решать с качеством порядка 90%, то есть с 10% ошибок. «Удивление вызывают сроки: только сбор репрезентативных обучающих дата-сетов может занять гораздо больше времени». Современные модели искусственного интеллекта, говорит эксперт, классифицирующие поведение человека в видеоряде, обычно обучаются на данных объёмом около 1 млн роликов.
Примечательно, что ничем подобным, судя по описанию на официальном сайте, ООО «Эксикьюшн Эр Ди Си» не занималось. Компания никогда не была исполнителем по госконтрактам — она реализовывала проекты по внедрению в российских компаниях решений на базе ПО немецкой SAP. По данным «СПАРК-Интерфакс», ООО «Эксикьюшн Эр Ди Си» (Execution RDS) учреждено в 2014 году с уставным капиталом 10 тыс. руб. По итогам 2021 года компания получила 229 млн руб. выручки при 23 млн руб. чистой прибыли. Возглавляет ООО Анастасия Юрикова, 95% принадлежит Артёму Пономарёву, а 5% — Сергею Браилко.