ИССЛЕДОВАНИЕ ГЛУБОКОЙ СВЕРТОЧНОЙ СЕТИ SSD В ЗАДАЧЕ ОБНАРУЖЕНИЯ ЛЮДЕЙ И АВТОМОБИЛЕЙ ДЛЯ СИСТЕМЫ ТЕХНИЧЕСКОГО ЗРЕНИЯ МОБИЛЬНОГО РОБОТА

ИССЛЕДОВАНИЕ ГЛУБОКОЙ СВЕРТОЧНОЙ СЕТИ SSD В ЗАДАЧЕ ОБНАРУЖЕНИЯ ЛЮДЕЙ И АВТОМОБИЛЕЙ ДЛЯ СИСТЕМЫ ТЕХНИЧЕСКОГО ЗРЕНИЯ МОБИЛЬНОГО РОБОТА

С.Р. Орлова
Центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики (ЦНИИ РТК), техник, 194064, Санкт-Петербург, Тихорецкий пр., д. 21, тел.: +7(911)005-31-30, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.

А. Комаров
Санкт-Петербургский Политехнический университет Петра Великого (СПбПУ), студент, 195251, Санкт-Петербург, ул. Политехническая, д. 29, тел.: +7(981)113-26-35, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра.


Материал поступил в редакцию 22 февраля 2018 года.

Аннотация
Рассмотрены структура и принцип работы глубокой сверточной нейронной сети SSD (Single Shot MultiBox Detector) и результаты экспериментального исследования возможности применения этой сети в задачах обнаружения людей и автомобилей для системы технического зрения мобильного робота. Исследование показало, что сеть SSD может быть применена для поставленной задачи, однако имеет не очень высокие точность и скорость работы. Повысить точность сети удалось с помощью модификации (эквализации гистограмм) входных изображений и обучения сети. Сделан вывод о необходимости создания собственной обучающей базы данных и доработки архитектуры сети для ещё большего повышения эффективности метода.

Ключевые слова
Нейронная сеть, сверточная нейронная сеть, глубинное обучение, обнаружение объектов, система технического зрения.

Индекс УДК 
004.896:004.832

Библиографическое описание 
Орлова С.Р. Исследование глубокой сверточной сети SSD в задаче обнаружения людей и автомобилей для системы технического зрения мобильного робота / С.Р. Орлова, А. Комаров // Робототехника и техническая кибернетика. – №2(19). – Санкт-Петербург : ЦНИИ РТК. – 2018. – С. 21-25.

Литература

  1. Фомин И. Обнаружение визуальных ориентиров на основе сети глубокого обучения в задачах автономного вождения / Иван Фомин, Дмитрий Громошинский, Дмитрий Степанов // Труды 26-й Международной конференции «GraphiCon2016». – Нижний Новгород. – 2016. – С. 430-434.
  2. Faster R-CNN: Towards real-time object detection with region proposal networks / Shaoqing Ren [et al] // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2017. – Vol. 39, № 6. – Pp.1137-1149.
  3. You Only Look Once: Unified, Real-Time Object Detection / Joseph Redmon [et al] // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). – 2016.
  4. SSD: Single Shot MultiBox Detector / Wei Liu [et al] // The 14th European Conference on Computer Vision (ECCV). – 2016.
  5. Fomin I. Object Detection on Images in Docking Tasks Using Deep Neural Networks / I. Fomin, D. Gro-moshinskii, A. Bakhshiev // Advances in Neural Computation, Machine Learning, and Cognitive Research / B. Kryzhanovsky, W. Dunin-Barkowski, V. Redko // NEUROINFOR-MATICS 2017. – Springer. – Vol 736. – Pp. 79-84.
  6. Fomin I.S. Study of Using Deep Learning Nets for Mark Detection in Space Docking Con-trol Images / I.S. Fomin, A.V. Bakhshiev, D.A. Gromoshinskii // Procedia Computer Science. – 2017. – Pp. 59-66.
  7. Viola P. Rapid object detection using a boosted cascade of simple features / P. Viola, M. Jones // Proceedings of the 2001 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR), 2001.
  8. Simonyan K. Very Deep Convolutional Networks for Large-Scale Visual Recognition [Electronic resource] / Karen Simonyan, Andrew Zisserman // Visual Geometry Group. Depart-ment of Engineering Science. University of Oxford: [site]. – URL: http://www.robots.ox.ac.uk/~vgg/research/very_deep (дата обращения: 12.09.2017).
  9. A port of SSD: Single Shot MultiBox Detector to Keras framework [Electronic resource] // GitHub: [site]. – URL: https://github.com/rykov8/ssd_keras (дата обращения: 12.09.2017).
  10. TensorFlow: An open-source software library for Machine Intelligence [Electronic re-source] // TensorFlow: [site]. – URL: https://www.tensorflow.org/ (дата обращения: 12.09.2017).
  11. Keras: The Python Deep Learning library [Electronic resource] // Keras documentation: [site]. – URL: https://keras.io/ (дата обращения: 12.09.2017).
  12. PASCAL VOC Database [Electronic resource] // The PASCAL Visual Object Classes Homepage: [site]. – URL: http://host.robots.ox.ac.uk/pascal/VOC/ (дата обращения: 12.09.2017).
  13. Histograms - 2: Histogram Equalization [Electronics resource] // OpenCV-Python Tutori-als: [site]. – URL: http://docs.opencv.org/3.1.0/d5/daf/tutorial_py_histogram _equalization.htm l (дата обращения: 12.09.2017).

Полный текст статьи (pdf)

Адрес редакции:  Россия, 194064, Санкт-Петербург, Тихорецкий пр., 21   Тел.: +7(812) 552-13-25 e-mail: zheleznyakov@rtc.ru 
 
 
vk2    tg2