Декомпозиция спайковых нейронных сетей при аппаратной реализации системы навигации мобильного робота в среде с препятствиями

Декомпозиция спайковых нейронных сетей при аппаратной реализации системы навигации мобильного робота в среде с препятствиями

Исаков Тим Тимурович
математик, Центральный научно-исследовательский и опытно-конструкторский институт робототехники и технической кибернетики (ЦНИИ РТК), 194064, Санкт-Петербург, Тихорецкий пр., д. 21, Этот адрес электронной почты защищён от спам-ботов. У вас должен быть включен JavaScript для просмотра., ORCID: 0000-0003-4437-5018


Индекс УДК: 004.896

EDN: RXFZCA

Аннотация. В последнее время для управления мобильными роботами начинают использоваться спайковые нейронные сети в том числе в аппаратном энергоэффективном исполнении. Для их аппаратной реализации необходимы специализированные нейроморфные вычислители с высоким уровнем параллелизма. Одной из ключевых задач является перенос обученных моделей спайковых нейронных сетей на эти вычислители, эффективность которого напрямую влияет на использование вычислительных ресурсов. Перенос модели включает её распределение между ядрами вычислителя, и предполагается, что разбиение модели на несколько подсетей, каждая из которых выполняет отдельную задачу, может упростить этот процесс. В данной работе проведён анализ зависимости между размером сети и качеством решения задачи объезда динамического препятствия мобильным колесным роботом в сценариях различной сложности. Спайковая нейронная сеть, обученная с использованием алгоритмов обучения с подкреплением, управляет приводами колесного робота, используя априорные данные о состоянии среды из симулятора (включая скорость и координаты препятствия и робота и т.д.). На основе полученных результатов сделан вывод о возможности разбиения сети на более мелкие подсети, каждая из которых успешно решает отдельную простую задачу. Кроме того, предложен вариант нейроморфной системы управления, использующий такую комбинацию сетей.

Ключевые слова: спайковые нейронные сети, обучение с подкреплением, объезд динамических препятствий, мобильный робот, колесный робот, архитектура нейронной сети

Для цитирования: Исаков Т.Т. Декомпозиция спайковых нейронных сетей при аппаратной реализации системы навигации мобильного робота в среде с препятствиями / Т.Т. Исаков // Робототехника и техническая кибернетика. – Т. 13. – № 4. – Санкт-Петербург : ЦНИИ РТК. – 2025. – С. 293-300. – EDN: RXFZCA.

Благодарности
Результаты получены в рамках выполнения государственного задания Минобрнауки России №075-00553-25-00 от 25.12.2024 «Исследование методов организации навигации роботов в сложных недетерминированных средах на базе теории когнитивного представления пространства» (FNRG-2025-0007 1024050200005-9-1.2.1;2.2.2).

Список источников

  1. Choi J. Reinforcement learning-based dynamic obstacle avoidance and integration of path planning / Choi J., Lee G., Lee C. // Intelligent Service Robotics. – 2021. – Т. 14. – Pp. 663-677. DOI: 10.1007/s11370-021-00387-2.
  2. Improved deep deterministic policy gradient for dynamic obstacle avoidance of mobile robot / Gao X. [et al.] // IEEE Transactions on Systems, Man, and Cybernetics: Systems. – 2023. – Т. 53. – № 6. – Pp. 3675-3682. DOI: 10.1109/TSMC.2022.3230666.
  3. Tang G. Reinforcement co-learning of deep and spiking neural networks for energy-efficient mapless navigation with neuromorphic hardware / Tang G., Kumar N., Michmizos K.P. // 2020 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). – IEEE, 2020. – Pp. 6090-6097. DOI: 10.1109/IROS45743.2020.9340948.
  4. Lillicrap T.P. Continuous control with deep reinforcement learning. – 2015. DOI:10.48550/arXiv.1509.02971.
  5. Event-Enhanced Multi-Modal Spiking Neural Network for Dynamic Obstacle Avoidance / Wang Y. [et al.] // Proceedings of the 31st ACM International Conference on Multimedia. – 2023. – Pp. 3138-3148. DOI: 10.1145/3581783.3612147.
  6. Loihi: A neuromorphic manycore processor with on-chip learning / Davies M. [et al.] // Ieee Micro. – 2018. – Т. 38. – № 1. – Pp. 82-99. DOI: 10.1109/MM.2018.112130359.
  7. Truenorth: Design and tool flow of a 65 mw 1 million neuron programmable neurosynaptic chip / Akopyan F. [et al.] // IEEE transactions on computer-aided design of integrated circuits and systems. – 2015. – Т. 34. – № 10. – Pp. 1537-1557. DOI: 10.1109/TCAD.2015.2474396.
  8. Мотив Нейроморфные технологии. Нейрочип «Алтай» // Платформа для тестирования микропроцессоров в РФ: [сайт]. – URL: https://motivnt.ru/neurochip-altai/ (дата обращения: 22.11.2024). – Текст: электронный.
  9. Proximal policy optimization algorithms / Schulman J. [et al.]. – 2017. DOI: 10.48550/arXiv.1707.06347.
  10. An Easy to Use Deep Reinforcement Learning Library for AI Mobile Robots in Isaac Sim / Rojas M. [et al.] // Applied Sciences. – 2022. – Т. 12. – № 17. – P. 8429. DOI: 10.3390/app12178429.

Поступила в редакцию 17.07.2025
Поступила после рецензирования 20.07.2025
Принята к публикации 04.08.2025