基于YOLOv3-tiny的视频监控目标检测算法
2022年电子技术应用第7期
王均成1,2,3,贺 超1,2,3,赵志源1,2,3,邹建纹1,2,3
1.重庆邮电大学 通信与信息工程学院,重庆400065; 2.先进网络与智能互联技术重庆市高校重点实验室,重庆400065;3.泛在感知与互联重庆市重点实验室,重庆400065
摘要: 目标检测算法在视频监控领域有着较大的实用价值。针对当前在资源受限的视频监控系统中实现实时目标检测较为困难的情况,提出了一种基于YOLOv3-tiny改进的目标检测算法。该算法在YOLOv3-tiny架构的基础之上,通过添加特征重用来优化骨干网络结构,并提出全连接注意力混合模块来学习到更丰富的空间信息,更适合资源约束条件下的目标检测。实验数据表明,该算法相比于YOLOv3-tiny在模型体积降低39.2%,参数量降低39.8%,且在VOC数据集上提高了2.7%的mAP,在提高检测精度的同时显著降低了模型资源占用。
中图分类号: TP391.4
文献标识码: A
DOI:10.16157/j.issn.0258-7998.212121
中文引用格式: 王均成,贺超,赵志源,等. 基于YOLOv3-tiny的视频监控目标检测算法[J].电子技术应用,2022,48(7):30-33,39.
英文引用格式: Wang Juncheng,He Chao,Zhao Zhiyuan,et al. Video surveillance object detection method based on YOLOv3-tiny[J]. Application of Electronic Technique,2022,48(7):30-33,39.
文献标识码: A
DOI:10.16157/j.issn.0258-7998.212121
中文引用格式: 王均成,贺超,赵志源,等. 基于YOLOv3-tiny的视频监控目标检测算法[J].电子技术应用,2022,48(7):30-33,39.
英文引用格式: Wang Juncheng,He Chao,Zhao Zhiyuan,et al. Video surveillance object detection method based on YOLOv3-tiny[J]. Application of Electronic Technique,2022,48(7):30-33,39.
Video surveillance object detection method based on YOLOv3-tiny
Wang Juncheng1,2,3,He Chao1,2,3,Zhao Zhiyuan1,2,3,Zou Jianwen1,2,3
1.School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications, Chongqing 400065,China; 2.Advanced Network and Intelligent Connection Technology Key Laboratory of Chongqing Education Commission of China, Chongqing 400065,China; 3.Chongqing Key Laboratory of Ubiquitous Sensing and Networking,Chongqing 400065,China
Abstract: Object detection methods have great value in the application field of video surveillance. At present, it is difficult to realize real-time object detection in resource constrained video surveillance system. A object detection method based on improved YOLOv3-tiny is proposed. Based on the YOLOv3-tiny architecture, the algorithm optimizes the backbone network by adding feature reuse, and a fully-connected attention mix module is proposed to enable the network to learn more abundant spatial information, which is more suitable for object detection under resource constraints. The experimental data shows that compared with YOLOv3-tiny, the algorithm reduces the model volume by 39.2%, the amount of parameters by 39.8%, and improves the mAP of 2.7% on the VOC data set, which significantly reduces the occupation of model resources while improving the detection accuracy.
Key words : object detection;video surveillance;YOLOv3;feature reuse;attention mechanism
0 引言
近年来,目标检测算法已经广泛应用于各个视频监控场景,包括车辆检测[1]、行人检测[2]、农业检测[3]、人类异常行为检测[4]等,越来越复杂的目标检测网络展示了最先进的目标检测性能。但在实际应用中,往往需要在视频监控中一些计算能力及内存有限的设备上进行实时目标检测。例如,嵌入式平台视频监控,其可用计算资源一般仅限于低功耗嵌入式图形处理单元(Graphic Processing Unit,GPU)。这极大地限制了此类网络在相关领域的广泛应用,使得在资源受限设备上实现实时目标检测非常具有挑战。
为了实现资源有限设备上目标检测这一挑战,人们对研究和设计低复杂度的高效神经网络体系架构越来越感兴趣。而著名的YOLO[5](You Only Look Once,YOLO)则是围绕效率设计的一阶段目标检测算法,它可以在高端图形处理器上实现视频监控目标高效检测。然而对于许多资源受限监控设备来说,这些网络架构参数量大且计算复杂度较高,使得在嵌入式等监控设备上运行时推理速度大幅下降。YOLOv3[6]是YOLO系列应用在各领域最普遍的算法,YOLOv3-tiny则是在该算法的基础上简化的,虽然精度显著下降但具有了更少计算成本,这大大增加了在资源受限监控设备上部署目标检测算法的可行性。
本文详细内容请下载:http://www.chinaaet.com/resource/share/2000004582。
作者信息:
王均成1,2,3,贺 超1,2,3,赵志源1,2,3,邹建纹1,2,3
(1.重庆邮电大学 通信与信息工程学院,重庆400065;
2.先进网络与智能互联技术重庆市高校重点实验室,重庆400065;3.泛在感知与互联重庆市重点实验室,重庆400065)
此内容为AET网站原创,未经授权禁止转载。