Власов Сергей Олегович
Федеральный исследовательский центр Институт прикладной математики имени М.В. Келдыша Российской академии наук (ИПМ им. М.В. Келдыша РАН), аспирант, 125047, Москва, Миусская пл., д. 4, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра., ORCID: 0009-0003-3144-0973
Богуславский Андрей Александрович
д.ф.-м.н., доцент, ИПМ им. М.В. Келдыша РАН, в.н.с., 125047, Москва, Миусская пл., д. 4, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра., ORCID: 0000-0001-7560-339X
Соколов Cергей Михайлович
д.ф.-м.н., профессор, ИПМ им. М.В. Келдыша РАН, г.н.с., 125047, Москва, Миусская пл., д. 4, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра., ORCID: 0000-0001-6923-2510
Материал поступил в редакцию 11 января 2025 года.
Аннотация
В работе рассматривается задача распознавания антропогенного объекта на видеопоследовательностях с использованием комбинированного (гибридного) алгоритма, объединяющего метод традиционного компьютерного зрения поиска особых точек и нейросетевой подход. Совместное использование различных подходов обнаружения и классификации объекта интереса на изображении является одним из направлений повышения качества работы систем компьютерного зрения в части уменьшения числа ошибок распознавания при сохранении скорости обработки данных. Представлена схема работы предложенного алгоритма. Описывается выбор архитектур сверточных нейронных сетей и типа детектора особых точек, предполагающих возможность решения поставленной задачи в реальном масштабе времени. В реализованном алгоритме выполняется поиск особых точек в областях исходного изображения, предположительно содержащих объект интереса и определенных предварительно обученной на наборе данных сверточной нейронной сетью. На следующем этапе работы алгоритма осуществляется сопоставление обнаруженных особых точек в рассматриваемых областях с эталонными фрагментами. На основе проведенного сопоставления делается вывод о наличии объекта интереса в рассматриваемой области исходного изображения. Проведена серия вычислительных экспериментов с оценкой эффективности предложенного алгоритма по точности и времени исполнения. Оценено влияние настраиваемых параметров и типа архитектуры сверточной нейронной сети на качество работы рассматриваемого метода.
Ключевые слова
Системы компьютерного зрения, обнаружение объектов на изображении, гибридный алгоритм.
EDN
GEBKJB
Индекс УДК
004.93'1
Библиографическое описание
Власов С.О. Гибридный алгоритм распознавания объекта в системе компьютерного зрения / С.О. Власов, А.А. Богуславский, С.М. Соколов // Робототехника и техническая кибернетика. – Т. 13. - № 2. – Санкт-Петербург : ЦНИИ РТК. – 2025. – С. 121-128. – EDN: GEBKJB.
Литература
- Ardalani N. DeepFlow: A cross-stack pathfinding framework for distributed ai systems / Ardalani N., Pal S., Gupta P. // arXiv arXiv: 2211.03309. – 2022. DOI: 10.48550/arXiv.2211.03309. – Text: electronic.
- Taspinar Y. Object recognition with hybrid deep learning methods and testing on embedded systems / Taspinar Y., Murat S. // International Journal of Intelligent Systems and Applications in Engineering. – 2020. – T. 8. – Pp. 71-77. – DOI: 10.18201/ijisae.2020261587. – Text: electronic.
- Varga L.A. Tackling the background bias in sparse object detection via cropped windows / Varga L.A., Zell A. // Proceedings of the IEEE/CVF International Conference on Computer Vision Workshops (ICCVW). – 2021. – Pp. 2768-2777. – Text: unmediated.
- Стротов В.В. Комбинирование нескольких алгоритмов для увеличения точности обнаружения и локализации пешеходов / В.В. Стротов, П.Е. Жгутов // Межд. конф. по компьютерной графике и зрению "Графикон": труды. – 2022. – № 32. – С. 628-635. – DOI: 10.20948/graphicon-2022-628-635. – Текст: электронный.
- Волкова М.А. Алгоритмическое обеспечение обработки сегментированной сенсорной информации для слежения за подвижными объектами в режиме реального времени: специальность 2.3.1 "Системный анализ, управление и обработка информации, статистика»: диссертация на соискание ученой степени кандидата технических наук / Волкова Мария Александровна; ФГБОУ ВО «МИРЭА - Российский технологический университет». – Москва, 2024. – 141 с. – Библиогр.: С. 118-134 – Текст: непосредственный.
- Авраменко В.С. Распознавание объектов беспилотными летательными аппаратами на основе нейронной сети MOBILENET / В.С. Авраменко, Е.С. Чичков // Экстремальная робототехника. – 2024. – № 1(34). – С. 261-266. – Текст: непосредственный.
- Xu Z. CenterNet heatmap propagation for real-time video object detection / Xu Z., Hrustic E., Vivet D. // Proceedings of the computer vision (ECCV). – Springer, Cham, 2020. – Pp. 220-234. – DOI:10.1007/978-3-030-58595-2_14. – Text: electronic.
- Береснев А.П. Исследование свёрточных нейронных сетей класса YOLO для мобильных систем детектирования объектов на изображениях / А.П. Береснев, И.В. Зоев, Н.Г. Марков // Межд. конф. по компьютерной графике и зрению "Графикон": труды. – 2018. – № 28. – С. 196-199. – Текст: непосредственный.
- Кэл10. TensorFlow 2 Detection Model Zoo // GitHub: [site]. – URL: https://github.com/tensorflow/models/
- blob/master/research/object_detection/g3doc/tf2_detection_zoo.md (дата обращения: 20.05.2024). – Text: electronic.
- Tan M.X. EfficientDet: Scalable and efficient object detection / Tan M.X., Pang R.M., Le Q.V. // Proceedings of IEEE/CVF Conference on Computer Vision and Pattern Recognition. − 2020. – Pp. 10778−10787. – DOI: 10.1109/CVPR42600.2020.01079. – Text: electronic.
- Хрящев В.В., Приоров А.Л. Использование нейронной сети EfficientDet в задаче обнаружения патологий желудка на видеоизображениях эндоскопического исследования / В.В. Хрящев, А.Л. Приоров // Модели, системы, сети в экономике, технике, природе и обществе. – 2023. – № 2. – С. 185-192. DOI: 10.21685/2227-8486-2023-2-12 – Текст: электронный.
- EfficientDet for fabric defect detection based on edge computing / Song S. [et al.] // Journal of engineered fibers and fabrics. – 2021. – Т. 16 – №. 1. – P. 155892502110083. – DOI: 10.1177/1558925021100834. – Text: electronic.
- A real-time automated system for object detection and facial recognition / Reddy K.S.S. [et al.] // E3S Web of Conferences. – 2023. – № 430. – DOI: 10.1051/e3sconf/202343001076. – Text: electronic.
- Centernet++ for object detection / Duan K. [et al.] // arXiv arXiv: 2204.08394. – 2022. – DOI: 10.48550/arXiv.2204.08394. – Text: electronic.
- CETR: CenterNet-Vision transformer model for wheat head detection / Suma K.G. [et al.] // Journal of Autonomous Intelligence. – 2024. – Т. 7. – №. 3. – Pp. 1-12. – DOI: 10.32629/jai.v7i3.1189. – Text: electronic.
- Intelligent detection of foreign matter in coal mine transportation belt based on convolution neural network / Ma G. [et al.] // Scientific Programming. – 2022. – T. 3. – DOI: 10.1155/2022/9740622 – Text: electronic.
- Lim J. Small object detection using context and attention / Lim J., Astrid M. // arXiv arXiv: 1912.06319. – 2019. DOI: 10.48550/arXiv.1912.06319. – Text: electronic.
- Бурдуковский С.О. Эффективность моделей Tensorflow в приложении к задаче обнаружения глаз на фотографии / С.О. Бурдуковский // Вестник НГУЭУ. – 2022. – № 2. – С. 228-238. – DOI: 10.34020/2073-6495-2022-2-228-238. – Текст: электронный.
- Drone-tracking-datasets // GitHub: [site]. – URL: https://github.com/CenekAlbl/drone-tracking-datasets (дата обращения: 27.05.2024). – Text: electronic.
- LabelImg // GitHub: [site]. – URL: https://github.com/heartexlabs/labelImg (дата обращения: 21.05.2024). – Text: electronic.