文献标识码: A
DOI: 10.19358/j.issn.2096-5133.2020.12.010
引用格式: 冯婷婷,葛华勇,孙家慧. 一种基于SSD与FRN相结合的密集连接行人检测算法[J].信息技术与网络安全,2020,39(12):56-60,66.
0 引言
行人检测作为计算机视觉技术的重要分支和智能化产品的核心技术,受到了学术界和工业界的广泛关注,其能够从图像或视频中识别出行人,并给出其具体的位置,在车辆辅助驾驶和行人重识别技术等方面有巨大的研究价值和应用前景。行人检测作为车辆辅助驾驶技术中不可或缺的一部分,可以及时检测出车辆前方的行人并针对实际状况及时提醒司机或者紧急制动,从而避免交通事故的发生;在刑侦工作中,刑侦人员经常要浏览多个摄像头中的视频,此时先进行行人检测判断视频中是否存在行人,把视频中的行人筛选出来,再利用行人重识别技术查找某个特定的行人在哪些摄像头曾经出现过,可为刑侦工作带来便利。
近十几年间,基于深度学习的行人检测技术取得了巨大进步,能够自动学习从图像像素中提取的基于边缘的低级特征和基于语义信息的高级特征。其分为两阶段检测算法和单阶段检测算法。在两阶段检测算法中,文献[1]提出了基于区域的卷积神经网络(Region based Convolutional Neural Network,R-CNN),文献[2]提出了空间金字塔池化(Spatial Pyramid Pooling,SPP)网络,文献[3]提出了快速基于区域的卷积网络方法(Fast-RCNN),文献[4-5]提出了Faster-RCNN。这些目标检测算法的训练过程步骤繁琐,检测速度慢,没有达到实时的检测标准。基于此,以REDMON J[6]提出的统一实时目标检测框架(You only look once,Yolo)和以Liu Wei[7]提出的单阶段多尺度检测器(Single Shot MultiBox Detector,SSD)框架为代表的单阶段检测算法由此产生。Yolo存在定位精度、召回率等较低的问题,泛化能力相对较弱,为了解决该算法的缺陷,2016年Liu Wei等提出SSD算法进行多尺度检测,在保证速度的同时提高了检测精度,但是其对于小目标检测不精准,加之在实际生活中,由于行人穿着、姿态、尺度、视角、光照和复杂背景等多方面原因,在检测精度及速度方面的提高仍是研究重点。由此针对行人多尺度问题,本文提出一种FRN提升模型性能的密集连接的SSD行人检测算法,尝试引入不依赖批尺寸大小的上下文语义信息的多层特征融合的密集连接网络结构,结合行人检测任务特点进行优化与改进。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003230
作者信息:
冯婷婷,葛华勇,孙家慧
(东华大学 信息科学与技术学院,上海201620)