摘 要: 鉴于室外自主移动机器人视觉导航的应用需求,提出一种提高非结构化道路跟踪准确性和鲁棒性的算法。首先,利用局部二值模式LBP的纹理特征和颜色特征建立道路区域的H-S-LBP特征模型,利用特征模型对视频序列图像进行反向投影,将图像分割为道路区域和背景区域。同时,采用卡尔曼滤波器更新道路特征模型。通过反向投影与特征模型更新的交替完成,实现非结构化道路跟踪。实际应用表明,提出的算法能够准确跟踪视频图像中道路区域,对复杂多变的室外环境适应性较强,道路边缘处区分度较高,满足实时性要求。
关键词: 非结构化道路;局部二值模式;HSV颜色空间;反向投影;道路跟踪
非结构化道路识别与跟踪是室外自主移动机器人视觉导航的研究热点之一,解决该问题有利于机器人实现自主导航。室外环境道路分为结构化道路和非结构化道路,非结构化道路一般不具备明显车道线、路面不均匀、道路边缘模糊且形状不规则,如校园道路和乡村小路,因此对非结构化道路的识别与跟踪比较困难,仍处于研究阶段。
非结构化道路识别与跟踪算法通常包括:基于道路特征的算法[1-2]、基于神经网络的算法[3]和基于道路模型的算法[4-5]等。基于道路特征的算法通过构建道路区域和非道路区域灰度、彩色、纹理等特征模型,利用相似性度量准则匹配这些特征,将视频序列图像分割为道路区域和背景区域。其优点是无需训练大量先验样本,假设道路模型,对道路形状不敏感等,但却极易受到室外多变的光照条件影响。室外环境中,道路区域和非道路区域最直观的区别在于颜色信息的不同,因此道路颜色特征常用于非结构化道路检测与跟踪。由于RGB颜色模型对光照变化较敏感,通常需要对RGB颜色信息进行转化,增强颜色特征模型对光照条件变化的鲁棒性,如叶伟龙等利用RGB颜色空间构建的c1c2c3颜色模型[6],TAN C等构建的均衡R-G颜色模型[7]。
纹理是一种反映图像中小块区域像素灰度级的空间分布属性,通常不依赖于颜色和亮度的变化,是一种较稳定的图像特征。与颜色模型一样,都属于点样本估计方式,能够相互融合。并且LBP纹理特征具有尺度不变性和旋转不变性,能够鲁棒地表征物体表面纹理特征,其计算复杂度低,易于实现。近年来,随着融合LBP纹理特征与颜色特征研究的深入,将多特征模型与MeanShift算法结合成功应用于人脸跟踪、视频目标跟踪等,克服了单一特征使跟踪结果鲁棒性和准确性差等现象[8-9]。
本文以视觉传感器获取的实时道路图像为研究对象,针对道路的纹理和彩色特征提出了一种基于特征模型的非结构化道路跟踪算法。首先对视频序列图像预处理,在第一帧图像中采集道路区域样本图像,提取LBP纹理特征和颜色特征,建立特征模型。通过特征模型与视频序列图像的一一映射,生成反向投影图,用于道路区域提取。利用道路历史特征模型与当前跟踪结果的观测特征模型进行卡尔曼滤波,更新道路特征模型,实现道路区域跟踪。
1 非结构化道路跟踪系统总体框架
图1为非结构化道路跟踪系统的总体框架,主要包括样本特征提取、特征模型建立、反向投影和模型更新四部分。通过提取视频序列第一帧图像中道路区域的特征,建立初始特征模型,为系统提供前向输入,并将实时跟踪结果反馈到历史特征模型中,交替地更新特征模型和提取视频流中道路区域。
2.4 道路特征模型更新
机器人运动过程中,前方道路必定与视频序列初始帧图像中的道路存在差异,再加上室外不确定因素的影响,基于初始帧图像建立的特征模型并不能实时、准确地反映道路特征,致使系统在长时间的跟踪过程中,跟踪结果的准确性不断下降。因此,必须实时更新道路特征模型。
卡尔曼滤波器采用反馈控制的方法估计过程状态,能够递归地解决离散数据线性滤波问题[13]。在实际应用中,卡尔曼滤波器对被建模系统提出了3个假设:(1)系统是线性的;(2)影响测量的噪声是白噪声;(3)噪声呈高斯分布。其基本思想是:利用历史估计值对当前状态变量和误差协方差进行预估计,在反馈校正阶段,通过当前测量值和最小均方误差准则对预估计值校正,得到最优化的后验估计值。其时间更新方程和测量更新方程如式(5)~式(9)所示。
时间更新方程:
由于特征模型中特征值间相互独立,基于卡尔曼滤波器的特征模型更新通常是对特征模型中的单个特征值更新,即为每个特征值赋予一个卡尔曼滤波器[14-15]。相比将特征模型看作一个整体的更新方法,对特征值单独更新的方法能够获得一个更准确、更合理的更新模型。但其运算量将受到特征模型中bin的影响迅速增加,势必影响更新速度。将三维特征模型转化为3个一维特征模型,给3个一维特征模型中每个特征值赋予一个卡尔曼滤波器,将得到的更新特征值对应相乘,即可获得三维特征模型中每个特征值的概率估计值,大大减少了计算量。本文建立的特征模型为16×16×9的三维模型,因此需要建立41个一维卡尔曼滤波器,滤波器的参数设定详见参考文献[14]。通常,前后两帧图像中道路区域的特征模型不会发生剧烈变化。因此,将每个滤波器的更新结果与上一帧比较,若小于预设阈值,则更新;否则,保留上一帧的特征值。
3 反向投影
反向投影是一种记录像素点或像素块如何适应直方图模型中分布的方式。用于在待处理图像(通常较大)中查找样本图像(通常较小或者仅1个像素)最匹配的点或者区域,也就是定位样本图像出现在待处理图像中的位置。在道路特征模型中,图像的H、S、LBP分量与道路概率特征值建立了一一对应关系,将图像某一位置的像素值用其对应的道路概率特征值代替,得到反向投影图。由于道路概率特征值被归一化为0~255,因此得到的反向投影图是单通的,即灰度图像。反向投影公式为:
本文道路跟踪算法详细步骤如下:
(1)对获取的视频序列图像预处理,减少噪声的影响;
(2)从视频序列第一帧图像中提取足够的道路区域样本图像;
(3)道路特征模型建立:将获取的RGB图像转换为HSV图像和灰度图像,利用灰度图像生成图像的LBP纹理特征,并提取HSV图像中的H、S分量,通过样本图像的三维直方图,构建道路特征模型;
(4)通过特征模型与视频序列图像的一一映射进行反向投影,得出道路概率分布图,即反向投影图;
(5)对道路概率分布图后处理,区分道路区域和背景区域,选取连通域面积最大的区域为道路;
(6)更新道路特征模型;
(7)重复步骤(4)、(5)、(6),实现对视频序列中非结构化道路跟踪。
4 实验结果与分析
实验选用的硬件平台为AMD Athlon64 3000+2 GHz处理器,1 GB内存,软件平台为VC2005。实验视频图像均在西南科技大学校园内和后山采集,平均时长10 min,包括多种非结构化道路环境,视频为AVI格式,分辨率为320×240,每帧视频图像平均处理时间为210 ms。实际应用时,等间隔地抽取视频帧图像进行处理,减少数据处理量,有利于系统的实时实现。
本文采用P=8,R=1的掩膜提取LBP纹理特征,构建16×16×9的道路特征模型。图5对基于不同特征模型的反向投影图进行了比较,图5(a)为采集的视频序列中部分帧原始图像,图5(b)为采用参考文献8提出的均衡R-G颜色模型生成的反向投影图,图5(c)为采用H-S颜色模型生成的反向投影图,图5(d)为采用H-S-LBP特征模型生成的反向投影图。图5(b)中,类道路区域误检测现象严重,道路边缘不连续,在第二类环境中,将道路左边大面积的非道路区域检测为道路区域。主要在于均衡R-G模型体现的是像素颜色信息的对比度,当颜色信息的对比度相似时,易产生误投影。相对图5(b)的实验结果,图5(c)中的道路边缘的误投影得到明显改善,但当道路边缘模糊时(如第二类和第三类环境),由于过度区域存在颜色信息的渐变过程或模糊不清时,系统对此类区域的辨识度较低,投影误差增大。比较图5(c)和图5(d)可以看出,融合纹理特征的实验结果中,道路区域内和非道路区域内的误检测均减少,尤其道路边缘误投影减少,连续性强。这是由于道路边缘处通常存在一些不规则的杂物,使得其纹理特征与道路区域不同,因此被判断为非道路区域,有效提高了道路边缘处跟踪结果的正确率。
针对室外自主移动机器人的作业需要,提出了一种基于特征模型的非结构化道路跟踪算法。通过建立道路的三维特征模型,对道路区域进行实时跟踪。实验表明,构建的三维特征模型能够准确表征道路特征,在HSV颜色空间下,H、S颜色特征对颜色信息的区分度较好,能够区分与目标颜色信息相近的区域,且其受亮度信息的影响较小,对复杂室外环境适应性较强。融入LBP纹理描述算子的特征模型使跟踪结果中类道路区域明显减少,尤其对于模糊性比较高、辨别难度较大的道路边缘处,其跟踪结果更准确,边缘连续性更强。此外,采用卡尔曼滤波器对道路特征模型更新,使系统跟踪结果的鲁棒性增强。
参考文献
[1] Huang Jingang, Kong Bin, Li Bichun, et al. A new method of unstructured road detection based on HSV color space and road features[C]. Proceedings of the 2007 International Conference on Information Acquisition, 2007: 596-601.
[2] 胡晓辉,孙苗强,苏晓许.伪彩色空间完全非结构化道路检测方法[J].中国图像图形学报,2012,17(2):203-208.
[3] 李青,郑南宁,马琳,等.基于主元神经网络的非结构化道路跟踪[J].机器人,2002,27(3):247-251.
[4] Tian Zheng, Xu Cheng, Wang Xiaodong, et al. Non-parametic model for robust road recognition[C]. 2010 IEEE 10th International Conference on Signal Processing, 2010: 869-872.
[5] 张玉颖,顾小东,汪源源.基于梯形模型和支持向量机的非结构化道路检测[J].计算机工程与应用,2010,46(15):138-141.
[6] 叶伟龙,刘华平,孙富春,等. 非结构化道路区域检测的协同学习方法[J]. 中国图像图形学报,2011,16(5) : 792-799.
[7] TAN C, HONG T, CHANG T, et al. Color model-based real-time learning for road following[C]. Proceedings of the IEEE Intelligent Transportation Systems Conference, 2006: 939-944.
[8] 张涛,蔡灿辉.基于多特征Mean Shift的人脸跟踪算法[J].电子与信息学报,2009,31(8):612-618.
[9] 宁纪锋,吴成科.一种基于纹理模型的目标跟踪算法[J].模式识别与人工智能,2007,20(5):612-618.
[10] OJALA T, PIETIKINEN M, et al. A comparative study of texture measures with classification based on feature distribution[J]. pattern recognition. 1996,29:51-59.
[11] M?覿enp?覿?覿 T, Pietik?覿inen M. Texture analysis with local binary patterns. In Chen CH & Wang PSP(eds) Handbook of Pattern Recognition and Computer Vision 3rd ed[M]. World Scientific, 2005.
[12] OJALA T, PIETIKINEN M. Multiresolution gray-scale and rotation invariant texture classification with local binary patterns[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(7): 971-987.
[13] KALMAN R E. A new approach to linear filtering and prediction problems[J]. Journal of Basic Engineering, 1960, 82(1): 35-45.
[14] 朱胜利,朱善安.基于卡尔曼滤波器组的Mean Shift 模板更新算法[J].中国图像图形学报,2007,12(3): 460-465.
[15] 郭森,柳伟,王建华.一种自适应权值更新的mean shift 跟踪算法[J].科学技术与工程,2009,8(16):4540-4544.