复杂背景下小尺寸多角度人脸检测方法研究
网络安全与数据治理
黄杰,刘芬
天津职业技术师范大学电子工程学院
摘要: 为了提升复杂背景下小尺寸人脸检测精度,提出了一种人脸检测方法GhostNet-MTCNN。在多任务级联卷积神经网络(MTCNN)主干网络上,将占用计算资源的普通卷积进行舍弃,利用GhostNet网络中计算量更低的Ghost bottleneck模组替代卷积的作用,重新构建网络特征提取功能,从而搭建一个新的模型。实验结果表明,该方法可以有效平衡参数量和精度。在Easy、Medium、Hard三种验证集上,与MTCNN相比在参数量仅增加0.62M的前提下精度分别提升了 5.6%、6.6%、7.8%,与MobileNetV3-MTCNN相比在参数量减少1.27M的同时精度又分别提升了1.6%、0.8%、0.5%。该研究能够在复杂场景下提高模型对小尺寸、多角度人脸检测精度,同时也能够有效平衡参数量和检测精度使其成为在边缘设备部署中更优的选择。
中图分类号:TP18文献标识码:ADOI:10.19358/j.issn.2097-1788.2024.04.008
引用格式:黄杰,刘芬.复杂背景下小尺寸多角度人脸检测方法研究[J].网络安全与数据治理,2024,43(4):46-52.
引用格式:黄杰,刘芬.复杂背景下小尺寸多角度人脸检测方法研究[J].网络安全与数据治理,2024,43(4):46-52.
Research on small.scale, multi.angle face detection methods in complex backgrounds
Huang Jie,Liu Fen
School of Electronic Engineering, Tianjin University of Technology and Education
Abstract: A face detection approach which is named GhostNet.MTCNN was proposed to enhance the precision of small sized face detection in complex backgrounds. On the backbone of MTCNN, this approach uses the lower computational Ghost bottleneck module which is in the GhostNet to replace the convolutional function, and discards the common convolution which occupies computer resources to configure the network′s feature extraction function. Through the process, a new module will be set up. The experimental results showed that the approach can effectively balance parameter quantity and precision. Across three validation sets categorized as Easy, Medium and Hard, compared to the original MTCNN, the proposed GhostNet-MTCNN achieves notable improvements in accuracy respectively 5.6%, 6.6% and 7.8%, while the parameter quantity only with a minimal increase of 0.62M. Furthermore, compared to MobileNetV3-MTCNN, GhostNet-MTCNN outperforms by enhancing accuracy by 1.6%, 0.8% and 0.5%, meanwhile a reduction in parameter quantity by 1.27M. The study can not only enhance the precision of the module to detect the small-sized and multi-angle faces in complex backgrounds but also can effectively balance parameter quantity and detection precision, which will make it a superior choice for edge deployment devices.
Key words : face detection; multi-task cascaded convolutional networks; lightweight network; edge devices
引言
人脸检测技术广泛应用于考勤、解锁设备、身份验证、监控场所、自动驾驶等场合[1-3]。在当前的人脸检测领域,通常采用深度神经网络架构。2014年Girshick等人提出的R-CNN[4]目标检测算法模型成功地将深度学习应用到目标检测领域,这种目标检测算法使用的是基于候选区域的检测方法。Ren等人在FastR-CNN基础上进行改进,提出了FasterR-CNN[5],该模型提出了专门的候选区域生成网络。除了以上两种目标检测网络模型外,还有基于单次目标检测的网络模型,如YOLO[6-8]和SSD[9]。这类方法优势在于检测速度快,但对小目标的检测效果不佳。这些深度神经网络在边缘设备部署十分消耗资源,对于硬件的计算能力和能耗的要求很高,很难应用到实际场景中。多任务级联卷积神经网络(Multi-task Cascaded Convolutional Networks,MTCNN)[10]作为一种经典的人脸检测方法,以其高效的性能、模型复杂度低而闻名,更适合边缘设备的应用。但随着人脸检测任务的不断复杂化,MTCNN也面临一系列挑战,例如在小尺寸、遮挡、多角度和光照变化等情况下的检测效果下降。文献[11]中将MTCNN与VGGNet相结合,提升了模型检测精度,但是相对应的模型计算量也变多了。
本文详细内容请下载:
https://www.chinaaet.com/resource/share/2000005968
作者信息:
黄杰,刘芬
(天津职业技术师范大学电子工程学院 ,天津300222)
此内容为AET网站原创,未经授权禁止转载。