摘 要: 针对传统梯度方向直方图(HOG)行人检测系统中检测窗扫描区域过大、HOG特征维度大而引起的检测速度慢问题,提出了改进的视频行人检测算法。通过运动信息提取感兴趣(ROI)目标区域,利用Fisher准则和多尺度特性选取具有强分辨力的行人HOG特征从而降低特征维数,结合支持向量机(SVM)检测行人。实验结果表明,本文方法在保证视频行人检测的准确率的同时,有效地提高了行人检测的速率。
关键词: 行人检测;感兴趣区域;梯度方向直方图;Fisher准则
行人检测是计算机视觉和模式识别领域中的研究热点,在视频监控中有广泛的应用。目前,用于行人检测的方法主要分为3类:(1)基于运动信息的方法[1-2],根据行人运动信息(如步态)实现行人检测,实时性好但只限于运动行人;(2)基于先验知识建模的方法[3],利用已知先验知识构建人体模板和待测目标进行匹配,但模板的初始参数难以获取;(3)基于特征统计分类的方法[4-9],根据训练数据获取有效分类器对输入检测窗口进行检测,实现简单且检测效果较好,是目前静态图像行人检测的主流方法,但对视频行人检测速度较慢。因此,如何保证视频行人检测的准确率,并提高检测速度是一个急需解决的问题。
1 本文行人检测方法
视频录像中行人的不同姿势、复杂的背景变化对算法的检测准确率和检测速度都提出了严格要求。本文提出利用视频中的运动信息获取ROI区域,结合Fisher准则挑选强分辨力行人HOG特征,并结合SVM分类器检测行人。其中,训练部分采用正负样本库提取强分辨力HOG行人特征,并通过SVM训练得到强分辨力HOG特征的行人分类器。检测时利用帧间信息获得ROI区域,通过多层次缩放ROI区域获取所有检测窗,并利用强分辨力行人HOG特征来表征检测窗中行人,通过训练好的分类器实现对视频中行人的检测。该算法框架如图1所示。
1.1 视频图像ROI目标区域提取
视频帧图像中存在大量的非人区域,全局扫描需要很多冗余计算。本文采用三帧差分法获取运动目标前景,进行二值化处理、形态学处理和前景块扩展,获取ROI目标区域。具体实现步骤如下。
其中,u是0~1的一个值,w、h分别表示前景块的宽、高。
(5)标记扩展后的行人目标前景块集合,构建ROI区域以进行后续的特征提取和检测。ROI目标区域提取如图2所示。
1.2 强分辨力行人特征提取
1.2.1 多尺度HOG特征
HOG特征是通过计算局部区域的梯度方向直方图描述目标形状特征,对光照变化和小量的偏移不敏感。DALAL N提出的基本HOG是在64×128的检测窗内提取105个16×16等大小的Block特征块,利用这些特征块构成描述符来训练和检测行人。
等大小的基本HOG特征块对描述行人较大的部位(如头部、身体等)的整体信息能力有限,因此本文构建HOG特征时采用了多尺度[6]方法,对于64×128检测窗,Block块的大小选取依次从16×16到64×128,宽高比(w∶h)分别取1∶1、1∶2和2∶1,共获得452个不同尺度的Block块。
在特征块提取过程中,为避免特征块交叠而引起的重复计算,引入“积分图[6]”思想,每个像素点的特征由9维向量表示,即:
2 实验及结果分析
本文实验在MATLAB2008a上实现,计算机环境配置为3 GHz CPU和2 GB内存。采用的数据来源于INRIA行人数据库和PETS2006视频库。在提取强分辨力行人特征时,分别将INRIA样本库中的1 000个正、负样本用于训练和检测,并利用强分辨力HOG行人特征分类器对PETS2006视频库的视频行人进行检测。实验采用libsvm工具包,选用线性SVM训练分类器。
文中通过对单尺度基本HOG扩展,得到Block数为452的多尺度HOG,并利用Fisher准则分别对不同尺度HOG进行降维处理,获得不同维数的强分辨力特征,结合SVM分类器验证不同尺度、不同维度的特征检测效果。实验结果如表1所示。
实验表明,扩展后的多尺度HOG特征,SVM分类准确率显著提高;相同特征维数下(表中只列出Block数为105、30、10的特征),多尺度特征比单尺度特征具有更高的检测准确率且降维幅度越大,多尺度特征优势越明显。
文中采用设定最低检测率来提高检测速率,利用SVM分类的效果来选择最佳分辨力特征。如表1所示,在多尺度下,当选取特征块数为10时,保证了行人检测的准确率,提取、检测的速率比基本HOG都有所提高,检测速率提高了9.7倍。本文取多尺度下Block数为10的特征集作为f′select,训练分类器进行行人检测和分类。
实验通过ROI目标区域提取,大大降低了检测窗口数量,并与传统HOG全局扫描算法、Adaboost[3,8]算法作比较。由于本文算法ROI目标区域大小直接受行人数量、大小影响,实验选取统一的单行人视频序列进行测试,帧像素大小为720×480。实验结果如表2所示。
参考文献[3,8]提到的Adaboost算法是利用一系列弱分类器组合强分类器,根据每个样本分类结果修改权值进行下一层分类训练,训练分类器时依次对每个特征集单独训练,耗费时间很长。本文算法采用Fisher准则提取的强分辨力行人特征训练分类器,特征整体一次投影实现一次分类,具有优势。
实验证明,本文算法比全局扫描减少了检测窗数量,显著提高了检测的速率;在保证准确率的前提下改进单尺度HOG,利用多尺度降维HOG进一步提高行人的检测速率。本文算法不仅大幅度提高了行人检测的速率,而且保证了视频行人检测准确率在90%以上。
本文针对传统HOG特征在行人检测中存在高维度计算的问题,提出一种利用视频运动信息和强分辨力行人HOG特征相结合的视频行人检测算法。利用INRIA行人库和PETS2006视频库验证了算法的有效性。后续将针对夜间、雨天等复杂背景,进一步验证和改进算法。
参考文献
[1] 刘鑫,刘辉,强振平,等.混合高斯模型和帧间差分相融合的自适应背景模型[J].中国图象图形学报,2008,4:729-734.
[2] 王成亮,周佳,黄晟.基于高斯混合模型与PCA_HOG的快速运动人体检测[J].计算机应用研究,2012,29(6):2156-2160.
[3] 周晨卉,王生进,丁晓青.基于局部特征级联分类器和模板匹配的行人检测[J].中国图象图形学报,2010,15(5):824-829.
[4] DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]. IEEE Computer Society Conference on Computer Vision and Pattern Recognition, CVPR2005, 2005,1:886-893.
[5] 孙昀,刘富强,李志鹏.基于稳定区域梯度直方图的行人检测方法[J].计算机辅助设计图形学报,2012,24(3):372-377.
[6] 黄茜,顾杰锋,杨文亮.基于梯度向量直方图的行人检测[J].科学技术与工程,2009(13):3646-3651.
[7] 姚雪琴,李晓华,周激流.基于边缘对称行和HOG的行人检测方法[J].人工智能及识别技术,2012,38(5):179-182.
[8] 种衍文,匡湖林,李清泉.一种基于多特征和机器学习的分级行人检测方法[J].自动化学报.2012,38(3):375-381.