文献标识码: A
DOI:10.16157/j.issn.0258-7998.2017.02.032
中文引用格式: 王剑,张伟华,李跃新. 结合图模型的优化多类SVM及智能交通应用[J].电子技术应用,2017,43(2):132-136.
英文引用格式: Wang Jian,Zhang Weihua,Li Yuexin. An optimal multi-class SVM combined with graph model and its application on intelligent transportation[J].Application of Electronic Technique,2017,43(2):132-136.
0 引言
随着监控技术的发展,智能交通中基于计算机视觉的研究受到广泛关注,其典型应用是利用视频或图像数据智能检测交通场景中是否存在行人和车辆[1]。对于目标检测而言,特征提取和分类是目标检测的两个关键环节[2]。按照所使用的特征和分类器的不同,行人和车辆检测领域的主要方法可分为:结合Haar特征和Adaboost分类器的方法[3,4]、结合方向梯度直方图(Histogram of Oriented Gradient,HOG)特征和支持向量机(Support Vector Machine,SVM)分类器的方法[5-11]、结合HOG特征和深度网络分类器的方法[12-14]。其中,SVM分类器能有效处理小样本的学习问题,在实际应用过程中更受关注。为了分类多个目标,文献[15]对经典的SVM分类器进行扩展,提出一种多类SVM分类器,通过一次性训练多个分类超平面来解决多个目标的分类问题,这样可以同时检测行人和车辆目标。考虑到多类SVM分类器在分类多个目标时,不同目标数据之间的类间差异大而类内差异小,不宜同等对待。为此,本文提出一种结合无向图模型的多类SVM分类器,在训练多类SVM分类器时,首先计算目标数据之间的相似度,依据相似度构建无向图模型,进而求解一个目标的相似度约束矩阵,对分类器的求解进行约束,从而提高多目标的分类准确度。本文将HOG特征和优化后的多类SVM分类器相结合进行行人和车辆检测,降低了行人和车辆检测的错误率。
1 结合无向图模型的多类SVM分类器
经典SVM分类器是一个二值分类器,也即分类结果只有两类。为了便于区分多类目标,文献[15]对SVM分类器进行扩展,提出一种多类SVM分类器。这种分类器仍然可以看作是一个最优化问题,目标是寻找K个最优的分类超平面,目标函数可以表示为:
这样,多类SVM分类器的构建可以转换为式(3)的最优求解问题。
为了在训练过程中增强特征的鉴别能力,本文考虑在训练过程中引入训练数据之间的相似度信息,具体是将包含相似度信息的无向图模型引入到多类SVM分类器的训练过程。详细描述如下。
训练数据可以用一个无向图模型表示,为:
其中,X=[x1,…,xN],V是一个相似度矩阵,用于描述各个特征向量之间的相似度。本文采用余弦测度来描述两个训练特征向量之间的相似度,表示为:
其中,vij为矩阵V的第i行、第j列的元素。
本文用相似度矩阵V构建一个图拉普拉斯矩阵,表示为:
其中,D是由相似度矩阵V生成的对角矩阵,表示为:
于是,可以由图拉普拉斯矩阵L和训练数据构建一个相似度约束矩阵S,用于约束训练数据的相似度,表示为:
本文将相似度约束矩阵S引入到式(1)中,目的是在训练多类SVM分类器时能综合考虑训练特征之间的相似度,提高多目标分类精度。引入相似度约束矩阵S的目标函数为:
式(12)的优化问题可以等价为:
对比式(19)和式(3),可以发现两个优化问题是相似的。为了解决多类SVM的优化问题,本文首先进行特征值分解,表示为:
其中,v是由特征值组成的一个对角矩阵,且特征值采用降序排列。U是一个正交矩阵,由特征值对应的特征向量组成。这里再定义一个转置矩阵P,满足如下条件:
2 智能交通中的行人和车辆检测方法
行人和车辆是智能交通领域最为关注的两类感兴趣目标。本文结合梯度方向直方图特征和图模型优化的多类SVM分类器自动检测图像中的行人和车辆目标,基本流程如图1所示。
2.1 颜色空间变换
输入图像一般为彩色图像,对于行人和车辆目标而言,由于对象的颜色分布无序,图像的颜色信息并不能有效提升特征的分辨能力,却能大幅降低算法的运算效率。在综合考虑运算效率和检测性能后,本文选择利用图像的灰度信息检测人体和车辆目标。因此,首先需要将彩色图像转换为灰度图像。
2.2 光照归一化
为了避免环境光照差异造成的图像对比度不均匀问题,需对图像进行光照归一化处理。对于行人和车辆目标而言,常采用平方根的Gamma校正方法。
2.3 梯度模值与方向计算
图像梯度的计算常采用图像与模板图像卷积的方式进行,本文采用模板(-1,0,1)计算图像中各个像素点(x,y)的水平和垂直梯度分量,表示为:
其中,梯度的方向采用绝对值形式,主要是考虑到行人和车辆的灰度分布受装饰和背景的干扰大,方向的符号影响特征的稳健性。
2.4 特征提取
对于图像中的每一个像素点,提取梯度方向直方图特征,具体地,先对0°~180°的方向进行采样,本文将方向等分为10个方向块;然后在每一个像素点所处的单元格(6×6)内,求不同方向块上梯度模值的累加和,形成一组直方图特征向量;最后再对特征向量v(x,y)进行归一化,表示为:
2.5 特征训练与分类
采用本文提出的图模型优化的多类SVM分类器进行训练和分类。在训练阶段,将行人样本集、车辆样本集和负样本集送入分类器,求解分类器的最优参数。这里,分类类别数K=3。在测试阶段,将待验证的图像块送入分类器,输出该图像块的类别。
3 仿真与分析
本节设计了行人和车辆检测的仿真实验,用于验证本文方法的性能。首先,介绍实验数据集合评价指标;然后,对比本文提出的图模型优化多类SVM分类器(简记为GMSVM)和文献[15]提出的经典多类SVM分类器(简记为MSVM)的性能差异;最后,对比本文提出的行人和车辆检测方法(记为HOG+GMSVM)与目前主流的目标检测方法的性能在行人和车辆检测实验中的性能差异。
3.1 数据集与评价指标
目前,国际上流行的行人数据集很多,但车辆数据集较少。为了在通用数据集下客观评价算法性能。本文选用Caltech行人数据集[16],该数据集中不仅还有行人,也包含车辆。但行人目标已标记,而车辆目标未标记。对图像中的车辆目标进行标记,共标记出9 312个车辆目标矩形框。该数据库分为11个子集,一般选用Set00~Set05子集进行训练,Set06~Set10子集进行测试。
行人和车辆目标的检测性能用错误率指标进行评价,定义行人检测错误率(ErrP)、车辆检测错误率(ErrC)和平均检测错误率(ErrA)如下:
其中,当检测到的矩形框与标记的矩形框位置重合度超过50%且类别一致时才认为检测正确。
3.2 GMSVM与MSVM性能对比分析
GMSVM是对经典的MSVM的改进,因此,本节先对比GMSVM与MSVM在行人和车辆检测实验中的性能差异,其中,特征提取都采用本文所述的HOG特征提取方法。图2给出了分类器不同时行人和车辆检测的ErrP、ErrC和ErrA 3项指标。很明显,GMSVM对应的3项错误率指标都低于MSVM,尤其是ErrC指标。究其原因,主要是GMSVM增加了训练特征相似度的约束,进一步增强了行人和车辆两类目标特征之间的区分能力,降低了误检现象。
3.3 本文方法与主流目标检测方法的性能对比分析
为进一步评价本文方法性能,将本文方法与目前主流的目标检测方法(尤其是行人检测方法)进行对比。图3展示了不同方法在本文所述的人车实验数据集上的检测错误率指标。其中,训练和测试样本都是相同的,实验中参与对比的方法选择其来源文献中所述的最优参数,同一方法在检测行人和车辆时所用的特征以及参数都是相同的。文献[3]和文献[14]的行人和车辆检测分两步进行,先单独检测行人目标,再检测车辆目标。文献[11]和本文方法一次检测行人和车辆两类目标。
由图3可见,本文方法在行人和车辆检测过程中的3个错误率指标都是最低的。参与对比的3种方法其行人检测错误率指标差异不明显,而车辆检测错误率指标差异较大,文献[11]的车辆检测错误率相对而言低于文献[3]和文献[14]所述方法,但仍然高于本文方法。而且,本文方法的行人和车辆错误检测率指标差异相对较小。总的来说,本文方法检测行人和车辆的效果更好。
4 结束语
本文提出了一种结合无向图优化的多类支持向量机分类器,在训练多类支持向量机分类器时,利用夹角余弦测度计算各个训练数据之间的相似度,再结合训练数据本身构建无向图模型,并在图模型中利用图拉普拉斯矩阵和训练数据构建和求解相似度约束矩阵。然后将相似度约束矩阵引入多类支持向量机求解的目标函数,构建优化的多类支持向量机分类器。最后结合梯度方向直方图特征和图模型优化的多类支持向量机分类器检测行人和车辆目标。行人和车辆目标检测结果表明,相对于经典的多类支持向量机分类器和目前主流的目标检测方法,本文方法的检测错误率低。然而目前算法的运算效率不高,将在后续研究中解决。
参考文献
[1] QURESHI K N,ABDULLAH A H.A survey on intelligent transportation systems[J].Middle-East Journal of Scientific Research,2013,15(5):629-642.
[2] DOLLAR P,APPEL R,BELONGIE S,et al.Fast feature pyramids for object detection[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2014,36(8):1532-1545.
[3] ZHANG S,BAUCKHAGE C,CREMERS A.Informed haar-like features improve pedestrian detection[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2014:947-954.
[4] RAKATE G R,BORHADE S R,JADHAV P S,et al.Advanced pedestrian detection system using combination of Haar-like features,Adaboost algorithm and Edgelet-Shapelet[C].Computational Intelligence & Computing Research(ICCIC),2012 IEEE International Conference on.IEEE,2012:1-5.
[5] 徐渊,许晓亮,李才年,等.结合SVM分类器与HOG特征提取的行人检测[J].计算机工程,2016,42(1):56-60.
[6] PRIOLETTI A,MOGELMOSE A,GRISLERI P,et al.Part-based pedestrian detection and feature-based tracking for driver assistance:real-time,robust algorithms,and evaluation[J].Intelligent Transportation Systems,IEEE Transactions on,2013,14(3):1346-1359.
[7] 孙锐,侯能干,陈军.基于特征融合和交叉核SVM的快速行人检测方法[J].光电工程,2014(2):53-62.
[8] LI D,XU L,GOODMAN E D,et al.Integrating a statistical background-foreground extraction algorithm and SVM classifier for pedestrian detection and tracking[J].Integrated Computer-Aided Engineering,2013,20(3):201-216.
[9] 孙锐,陈军,高隽.基于显著性检测与HOG-NMF特征的快速行人检测方法[J].电子与信息学报,2013,35(8):1921-1926.
[10] XU F.Pedestrian detection based on motion compensation and HOG/SVM classifier[C].Intelligent Human-Machine Systems and Cybernetics(IHMSC),2013 5th International Conference on.IEEE,2013,2:334-337.
[11] SUN D,WATADA J.Detecting pedestrians and vehicles in traffic scene based on boosted HOG features and SVM[C].Intelligent Signal Processing(WISP),2015 IEEE 9th International Symposium on.IEEE,2015:1-4.
[12] OUYANG W,WANG X.A discriminative deep model for pedestrian detection with occlusion handling[C].Computer Vision and Pattern Recognition(CVPR),2012 IEEE Conference on.IEEE,2012:3258-3265.
[13] OUYANG W,ZENG X,WANG X.Modeling mutual visibility relationship in pedestrian detection[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2013:3222-3229.
[14] ZENG X,OUYANG W,WANG X.Multi-stage contextual deep learning for pedestrian detection[C].Proceedings of the IEEE International Conference on Computer Vision,2013:121-128.
[15] WANG Z,XUE X.Multi-class support vector machine[M].Support Vector Machines Applications.Springer International Publishing,2014:23-48.
[16] DOLLAR P,WOJEK C,SCHIELE B,et al.Pedestrian detection:An evaluation of the state of the art[J].Pattern Analysis and Machine Intelligence,IEEE Transactions on,2012,34(4):743-761.
作者信息:
王 剑1,张伟华2,李跃新3
(1.常熟理工学院 计算机科学与工程学院,江苏 常熟215500;
2.郑州成功财经学院 信息工程系,河南 郑州450000;3.湖北大学 计算机与信息工程学院,湖北 武汉430064)