С.Р. Орлова
Центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики (ЦНИИ РТК), техник, 194064, Санкт-Петербург, Тихорецкий пр., д. 21, тел.: +7(911)005-31-30, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
А. Комаров
Санкт-Петербургский Политехнический университет Петра Великого (СПбПУ), студент, 195251, Санкт-Петербург, ул. Политехническая, д. 29, тел.: +7(981)113-26-35, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.
Материал поступил в редакцию 22 февраля 2018 года.
Аннотация
Рассмотрены структура и принцип работы глубокой сверточной нейронной сети SSD (Single Shot MultiBox Detector) и результаты экспериментального исследования возможности применения этой сети в задачах обнаружения людей и автомобилей для системы технического зрения мобильного робота. Исследование показало, что сеть SSD может быть применена для поставленной задачи, однако имеет не очень высокие точность и скорость работы. Повысить точность сети удалось с помощью модификации (эквализации гистограмм) входных изображений и обучения сети. Сделан вывод о необходимости создания собственной обучающей базы данных и доработки архитектуры сети для ещё большего повышения эффективности метода.
Ключевые слова
Нейронная сеть, сверточная нейронная сеть, глубинное обучение, обнаружение объектов, система технического зрения.
Индекс УДК
004.896:004.832
Библиографическое описание
Орлова С.Р. Исследование глубокой сверточной сети SSD в задаче обнаружения людей и автомобилей для системы технического зрения мобильного робота / С.Р. Орлова, А. Комаров // Робототехника и техническая кибернетика. – №2(19). – Санкт-Петербург : ЦНИИ РТК. – 2018. – С. 21-25.
Литература
- Фомин И. Обнаружение визуальных ориентиров на основе сети глубокого обучения в задачах автономного вождения / Иван Фомин, Дмитрий Громошинский, Дмитрий Степанов // Труды 26-й Международной конференции «GraphiCon2016». – Нижний Новгород. – 2016. – С. 430-434.
- Faster R-CNN: Towards real-time object detection with region proposal networks / Shaoqing Ren [et al] // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2017. – Vol. 39, № 6. – Pp.1137-1149.
- You Only Look Once: Unified, Real-Time Object Detection / Joseph Redmon [et al] // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2016.
- SSD: Single Shot MultiBox Detector / Wei Liu [et al] // The 14th European Conference on Computer Vision (ECCV). – 2016.
- Fomin I. Object Detection on Images in Docking Tasks Using Deep Neural Networks / I. Fomin, D. Gro-moshinskii, A. Bakhshiev // Advances in Neural Computation, Machine Learning, and Cognitive Research / B. Kryzhanovsky, W. Dunin-Barkowski, V. Redko // NEUROINFOR-MATICS 2017. – Springer. – Vol 736. – Pp. 79-84.
- Fomin I.S. Study of Using Deep Learning Nets for Mark Detection in Space Docking Con-trol Images / I.S. Fomin, A.V. Bakhshiev, D.A. Gromoshinskii // Procedia Computer Science. – 2017. – Pp. 59-66.
- Viola P. Rapid object detection using a boosted cascade of simple features / P. Viola, M. Jones // Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2001.
- Simonyan K. Very Deep Convolutional Networks for Large-Scale Visual Recognition [Electronic resource] / Karen Simonyan, Andrew Zisserman // Visual Geometry Group. Depart-ment of Engineering Science. University of Oxford: [site]. – URL: http://www.robots.ox.ac.uk/~vgg/research/very_deep (дата обращения: 12.09.2017).
- A port of SSD: Single Shot MultiBox Detector to Keras framework [Electronic resource] // GitHub: [site]. – URL: https://github.com/rykov8/ssd_keras (дата обращения: 12.09.2017).
- TensorFlow: An open-source software library for Machine Intelligence [Electronic re-source] // TensorFlow: [site]. – URL: https://www.tensorflow.org/ (дата обращения: 12.09.2017).
- Keras: The Python Deep Learning library [Electronic resource] // Keras documentation: [site]. – URL: https://keras.io/ (дата обращения: 12.09.2017).
- PASCAL VOC Database [Electronic resource] // The PASCAL Visual Object Classes Homepage: [site]. – URL: http://host.robots.ox.ac.uk/pascal/VOC/ (дата обращения: 12.09.2017).
- Histograms - 2: Histogram Equalization [Electronics resource] // OpenCV-Python Tutori-als: [site]. – URL: http://docs.opencv.org/3.1.0/d5/daf/tutorial_py_histogram _equalization.htm l (дата обращения: 12.09.2017).
Полный текст статьи (pdf)