一种基于SSD与FRN相结合的密集连接行人检测算法-AET-电子技术应用

一种基于SSD与FRN相结合的密集连接行人检测算法

2020年信息技术与网络安全第12期

冯婷婷，葛华勇，孙家慧

东华大学信息科学与技术学院，上海201620

摘要： 现实场景行人的复杂性和多样性使得行人检测成为计算机视觉领域中一个既具有研究价值又极具挑战性的热门课题,为提高其准确性，提出一种基于SSD(Single Shot Multibox Detector)与FRN(Filter Response Normalization)相结合的密集连接行人检测算法，将串联式的SSD基础网络修改为引入上下文语义信息的多层融合的密集连接的FRN网络结构,运用聚类思想设置适宜行人尺度的候选框，并且根据行人尺寸的统计分布规律调整不同检测层的缩放因子，从而实现端到端训练。在融合数据集和VOC2007TEST数据集上验证该模型的性能，相比于SSD方法，该方法准确率AP(Average Precision)分别提高5.8%、2.9%，具有更高的准确性和鲁棒性。

关键词： 行人检测密集连接聚类算法 SSD FRN

中图分类号： TP301.6
文献标识码： A
DOI： 10.19358/j.issn.2096-5133.2020.12.010
引用格式：冯婷婷，葛华勇，孙家慧. 一种基于SSD与FRN相结合的密集连接行人检测算法[J].信息技术与网络安全，2020，39(12)：56-60，66.

A densely connected pedestrian detection algorithm based on the combination of SSD and FRN

Feng Tingting，Ge Huayong，Sun Jiahui

School of Information Science and Technology，Donghua University，Shanghai 201620，China

Abstract： The complexity and diversity of pedestrians in real scenes make pedestrian detection a hot topic with both research value and challenge in the field of computer vision. In order to improve its accuracy, this paper proposes a densely connected pedestrian detection algorithm based on the combination of SSD and FRN, modifies the serial SSD basic network into a multi-layered densely-connected FRN network structure that introduces contextual semantic information, and uses clustering ideas to set candidate boxes suitable for pedestrian scale, and adjusts the scaling factors of different detection layers according to the statistical distribution law of pedestrian size, so as to achieve end-to-end training. The performance of the model is verified on the fusion dataset and the VOC2007TEST dataset. Compared with the SSD method, the accuracy of the method AP is improved by 5.8% and 2.9% respectively, with higher accuracy and robustness.

Key words : pedestrian detection；dense connection；clustering algorithm；SSD；FRN

0 引言

行人检测作为计算机视觉技术的重要分支和智能化产品的核心技术，受到了学术界和工业界的广泛关注，其能够从图像或视频中识别出行人，并给出其具体的位置，在车辆辅助驾驶和行人重识别技术等方面有巨大的研究价值和应用前景。行人检测作为车辆辅助驾驶技术中不可或缺的一部分，可以及时检测出车辆前方的行人并针对实际状况及时提醒司机或者紧急制动，从而避免交通事故的发生；在刑侦工作中，刑侦人员经常要浏览多个摄像头中的视频，此时先进行行人检测判断视频中是否存在行人，把视频中的行人筛选出来，再利用行人重识别技术查找某个特定的行人在哪些摄像头曾经出现过，可为刑侦工作带来便利。

近十几年间，基于深度学习的行人检测技术取得了巨大进步，能够自动学习从图像像素中提取的基于边缘的低级特征和基于语义信息的高级特征。其分为两阶段检测算法和单阶段检测算法。在两阶段检测算法中，文献[1]提出了基于区域的卷积神经网络(Region based Convolutional Neural Network，R-CNN)，文献[2]提出了空间金字塔池化(Spatial Pyramid Pooling，SPP)网络，文献[3]提出了快速基于区域的卷积网络方法(Fast-RCNN)，文献[4-5]提出了Faster-RCNN。这些目标检测算法的训练过程步骤繁琐，检测速度慢，没有达到实时的检测标准。基于此，以REDMON J^[6]提出的统一实时目标检测框架(You only look once，Yolo)和以Liu Wei^[7]提出的单阶段多尺度检测器(Single Shot MultiBox Detector，SSD)框架为代表的单阶段检测算法由此产生。Yolo存在定位精度、召回率等较低的问题，泛化能力相对较弱，为了解决该算法的缺陷，2016年Liu Wei等提出SSD算法进行多尺度检测，在保证速度的同时提高了检测精度，但是其对于小目标检测不精准，加之在实际生活中，由于行人穿着、姿态、尺度、视角、光照和复杂背景等多方面原因，在检测精度及速度方面的提高仍是研究重点。由此针对行人多尺度问题，本文提出一种FRN提升模型性能的密集连接的SSD行人检测算法，尝试引入不依赖批尺寸大小的上下文语义信息的多层特征融合的密集连接网络结构，结合行人检测任务特点进行优化与改进。

本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003230

作者信息:

冯婷婷，葛华勇，孙家慧

(东华大学信息科学与技术学院，上海201620)

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容