Российские учёные создали систему компьютерного зрения, способную распознавать любые объекты на изображении с видеокамер
Разработку планируют установить на платформу шагающих роботов
Инженеры МФТИ работают над внедрением в практику созданной ими системы технического зрения — она может автоматически выявлять различные объекты на видео. Комплекс состоит из камер видимого инфракрасного диапазона и электроники для обработки данных. Алгоритм анализирует полученное изображение в режиме реального времени, чтобы найти на нем нужные предметы или людей.
«Количество и тип камер в конкретном устройстве значения не имеют. Их число может варьироваться от одной до нескольких сотен. Конструкция конкретной системы зависит от ее вычислительной мощности, платформы, на которую она установлена, и необходимой скорости работы. Вес оборудования может меняться от 200 г до десятков килограммов», — рассказал директор Физтех-школы радиотехники и компьютерных технологий МФТИ Дмитрий Гаврилов.
Система полностью универсальна. Ее алгоритм можно натренировать на обнаружение любых предметов или людей. Чтобы обучить программу, нужна только подборка желаемых объектов. Причем для тренировок можно использовать как реальные предметы, так и их изображения. Важную роль в работе алгоритма играют встроенная в него нейросеть, ее аппаратная реализация, используемые в комплексе драйверы, протоколы и другие нюансы. При этом программное решение по распознаванию объектов — комплексное. А нейронная сеть — только его часть.
Созданная учёными технология модульная, она может стать «глазами» самых разных аппаратов — беспилотников, автомобилей, домашних роботов-помощников и т.д. В зависимости от того, на какую платформу ее устанавливают, система может отвечать различным требованиями по производительности и энергоемкости.
Точность работы комплекса определяется вероятностью обнаружения нужных объектов и ошибок при поиске. Она сопоставима с качеством работы оператора. У человека этот показатель составляет в среднем 89–92%, а у алгоритма — 92–94%. Сейчас специалисты МФТИ занимаются переносом своих программных разработок полностью на российское оборудование. В их планах установить свой комплекс на платформу шагающих роботов.
Системы компьютерного зрения, разработанные в МФТИ, найдут свое применение в промышленности, медицине, автопроме, охранных системах или в специальной военной технике. Уже сейчас они используются в проекте Минприроды для идентификации определенных видов животных в заповедниках, анализа их популяции.
Представители вуза одновременно сотрудничают с несколькими заказчиками. Некоторые разработки им уже переданы и проходят опытную эксплуатацию.
«По некоторым разработкам систем с искусственным интеллектом наши подразделения уже успешно завершили научно-исследовательские и опытно-конструкторские работы для различных заказчиков», — сообщил Дмитрий Гаврилов.
При подготовке комплекса к работе специалисты университета отвечают за техническую сторону вопроса. Система выстроена таким образом, что конкретные цели заказчиков могут быть неизвестны разработчикам. Предприятие получают в свое распоряжение оборудование для обучения алгоритма и само решает, на распознавание каких объектов его натренировать. Например, систему можно настроить на обнаружение конкретных ориентиров и движения по ним.
Компьютерное зрение — крайне перспективное научное направление, его нужно развивать и стараться делать это на отечественном оборудовании, считает инженер Центра технологических проектов СПбПУ Павел Булдаков. По его словам, сейчас в стране остаются проблемы с вычислительными устройствами, но с точки зрения программного кода специалисты МФТИ вполне могли обучить программу узнавать объекты с необходимой точностью.
«Пока такие системы не показали годы уверенной работы, они должны использоваться в качестве ассистента. Человеческий глаз не может воспринять всё. Допустим, система высвечивает на экране изображение поля боя, а алгоритм подсвечивает на нем нужный объект. Но решение о действии принимает человек. Сейчас это должно работать как подсказка», — сказал Павел Булдаков.
Решение задачи автоматического выявления объектов важно для различных областей: поиска пропавших людей, идентификации и оценки численности диких животных или рогатого скота и др. Но если машина — например робот, оснащенный подобной технологией, — находится с человеком в бытовой ситуации, то требования к системе технического зрения отличаются, пояснил научный сотрудник РГГУ Артемий Котов.
«Робот должен уметь распознавать нашу мимику и указательные жесты — например, если мы говорим: «Иди туда», «Принеси мне вон ту штуку». На кухне робот должен не только обнаружить чашки, но и разделить их на чистые и грязные, а у грязных — найти ту часть, за которую чашку можно взять и поставить в посудомоечную машину», — сказал Артемий Котов.
Если робота применяют не в помещении, а на природе, он должен правильно интерпретировать пространственные отношения между объектами, например выбрать нужный камень, если человек говорит ему: «Возьми камень из-под того дерева». Все эти примеры показывают, что в разработке систем технического зрения есть еще много интереснейших проблем, резюмировал учёный.