《电子技术应用》
您所在的位置:首页 > 测试测量 > 设计应用 > 基于边窗滤波和扩张卷积的矿井行人检测
基于边窗滤波和扩张卷积的矿井行人检测
2020年电子技术应用第10期
刘 欣,李卫龙,张灿明
安徽省煤炭科学研究院,安徽 合肥230001
摘要: 在数字化矿山中,行人检测系统能够大幅减少事故伤亡,是保护工人安全的重要手段。为了构建高性能的行人检测系统,提出了一种基于边窗滤波和扩张卷积的矿井行人检测模型。具体来说,针对复杂恶劣的矿井环境,采用边窗滤波抑制视频图像中的干扰信号,提升图像质量。此外,考虑到行人目标的多尺度特性,在模型中引入扩张卷积增加特征的感受野,进而提升检测性能。大量的对比实验证明了边窗滤波和扩张卷积的有效性,模型在矿井数据集上获得94.3 mAP和99.1%检测率的优异性能。
中图分类号: TN919.8;TP919.8;TP391.41
文献标识码: A
DOI:10.16157/j.issn.0258-7998.200363
中文引用格式: 刘欣,李卫龙,张灿明. 基于边窗滤波和扩张卷积的矿井行人检测[J].电子技术应用,2020,46(10):42-46,50.
英文引用格式: Liu Xin,Li Weilong,Zhang Canming. Mine pedestrian detection based on side-window filter and dilated convolution[J]. Application of Electronic Technique,2020,46(10):42-46,50.
Mine pedestrian detection based on side-window filter and dilated convolution
Liu Xin,Li Weilong,Zhang Canming
Anhui Academy of Coal Science,Hefei 230001,China
Abstract: In digitalized mines, pedestrian detection system is able to greatly reduce accident casualties, which is an essential strategy for guaranteeing workers′ well-being. In order to establish mine pedestrian detection system with high performance, a mine pedestrian detection based on side-window filter and dilated convolution is proposed. Specifically, in terms of mines environment with complicated and hostile conditions, side-window filter is adopted to suppress disturbing signals in surveillance pictures, improving image quality. In addition, considering the multi-scale characteristic of pedestrian objects, dilated convolution is introduced into model to increase receptive field of features, thus enhancing detection performance. A number of comparison experiments are conducted to illustrate the effectiveness of side-window filter and dilated convolution, and the model achieves excellent performance of 94.3 mAP and 99.1% of detection accuracy on the mine dataset.
Key words : pedestrian detection;side-window filter;dilated convolution;deep learning

0 引言

    数字化矿山是实现智能化、现代化煤炭生产的重要基础,对于煤炭产业的可持续发展有着极为重要的意义。采矿自动化、运输智能化、管理信息化是实现数字化矿山的三项关键技术[1]。实现这些技术的前提是构建智能感知系统,而矿井行人检测系统是实现井下智能调度、安全监测等技术的先决条件[2]

    近些年来,深度学习技术在多个计算机视觉领域迅猛发展[3],并在多个任务上获得了优异的性能,例如人脸检测[4]、物体分拣[5]、缺陷检测[6]。具体到行人检测任务上,R-CNN[7]率先将深度学习技术应用在目标检测任务。在此基础上,Faster R-CNN[8]改进候选框选择机制,完备端对端检测框架。2019年,来自Google Brain的TAN M等研究人员[9]提出了基于自动网络寻优技术的EfficientNet,该模型通过动态调整网络的深度、宽度和分辨率,寻找最优的模型设计,在图像分类、目标检测等多个领域获得先进表现。

    图像在构建和传输过程中,常因为外界干扰而导致质量退化。常见的解决方案是采用滤波方法对图像做去噪处理[10]。滤波算法可分成两类:线性滤波和非线性滤波。常见的线性滤波包括盒子滤波、高斯滤波;非线性滤波包括中值滤波、双边滤波等。在深度学习算法中,滤波算法常用于图像预处理、特征提取、边缘获取等。尤其是对于边缘检测,滤波算法基于研究人员对于图像的先验知识,充分地提取图像的边缘信息,实现对兴趣区域的精准定位分割[11]。传统滤波算法受限于滤波核结构和运算机理,虽然可以抑制噪声,但同时会造成边缘信息丢失,对检测模型产生负面影响。近些年来,大量的保边滤波算法被提出,用于保留的更多的边缘信息,例如全变分滤波算法[12]、加权最小二乘滤波[13]和导向滤波[14]等。

    对于矿井环境,构建行人检测模型需要考虑多个特定的环境因素,包括监控设备所处环境光线不足、粉尘点多,且捕获图像存在较多干扰信号等硬件设备上的不利因素,又要考虑对多目标、不同尺度的行人目标实现准确检测的要求。针对这些难点,本文从视频图像的处理和检测模型的改进两个角度出发,采用边窗滤波抑制视频图像的干扰信号,在模型网络中引入扩张卷积处理多尺度目标。实验证明模型在矿井数据集上取得了优异的检测性能。本文的主要贡献如下:针对矿井环境存在的多样不利因素,采用边窗滤波抑制视频图像的干扰信号,为行人检测模型提供优质的输入图像;采用先进的EfficientNet作为网络主干,用于提取输入图像的特征,并在网络主干中引入扩张卷积,增大特征的感受野,促使网络在多尺度目标上获得更为优异的检测性能。




本文详细内容请下载:http://www.chinaaet.com/resource/share/2000003018




作者信息:

刘  欣,李卫龙,张灿明

(安徽省煤炭科学研究院,安徽 合肥230001)

此内容为AET网站原创,未经授权禁止转载。