摘 要: 提出了一种简单有效的自适应阈值选择机制,并将背景信息嵌入到阈值选择中,提高了阈值选择的准确性。实验结果表明,该算法能在各种环境变化情况下自动得到合适的阈值,提高了运动区域检测的准确性。
关键词: 运动目标;背景更新;阈值自适应;二值化
随着平安城市的建设、智能相机在交通监控的推广和普及以及数字图像分析技术不断地提高,关于智能交通系统的需求越来越丰富和多样。在智能交通系统视频分析中,运动物体的检测是很多图像处理的第一步,运动物体检测的好坏对于后续图像处理起着至关重要的作用。运动物体的检测需要二值化处理,这涉及阈值的选择。大多数运动区域检测文献对阈值的选择没有深入的分析。常用的背景建模算法(例如混合高斯模型、贝叶斯模型、码本方法)虽然效果不错,但是计算量较大,在某一些应用场合并不实用,例如嵌入式一体机。本文提出了一个简单有效的阈值自适应选择方法,通过实验数据可以看出,本文算法计算量很小,而且可以得到较好的运动区域检测结果。
本文主要介绍了背景图像的初始化和背景图像的更新策略,提出了一种简单有效的阈值选择方法,并进一步分析其缺陷,对此提出了改进策略,提高了阈值选择的鲁棒性。最后从实际视频分析中验证了算法的有效性。
1 背景图像的初始化及更新
1.1 背景图像初始化
基于背景差分可以得到较完整的运动区域,因此需要首先获得背景图像。这里采用参考文献[6]的方法来完成背景图像的初始化及背景更新。通过相邻帧差分的二值图像找到运动的像素,将这些运动区域的像素值丢弃,只对非运动区域的像素值进行累加,最后求平均。该算法可以很好地消除运动目标的影响,得到较完整的背景图像。
像素级更新方法结合了时间帧差法和背景差法,可以很好地适应场景中的微小变化,特别是光线的缓慢变化,基本消除了累积性误差,且在场景内存在物体移入与移出时能够及时有效地对背景进行更新。如果场景光线发生大范围突变、背景全局变化等问题,像素级更新就难以反映出这种全局变化,这时需要帧级图像更新。
帧级更新的步骤如下:
(1)若在当前帧与背景图像差分后二值图运动区域个数大于整体图像的一定百分比,则背景发生了大范围的变化。
(2)若连续多帧中这一比值依然很大,则按本文背景提取算法重新提取背景。
2 运动区域检测及阈值选择
得到背景图像,将当前图像与背景图像作差分,然后对差分作二值化,得到前景图像。图像的二值化涉及阈值选择问题,显然自适应的阈值比固定阈值要好,这是因为图像场景光照变化,很难找到一个固定的阈值适用于各种时间段。可以发现,当前帧图像没有运动物体时,对差分图像作直方图的统计,直方图分布在-255~255之间,该直方图分布服从高斯分布。没有运动物体和有运动物体的帧差分及对应的直方图分别如图1、图2所示。这个现象是合理的,因为图像的噪声是服从高斯分布的。可以根据该直方图计算出均值μ和方差σ,根据高斯分布,横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.73%。均值μ的选择是寻找直方图中最大值的位置,然后对均值μ附近区域计算方差σ。其中,均值反映了图像的整体亮度信息,方差反映了图像的噪声信息。根据均值和方差确定二值化的阈值,即:
当图像亮度发生整体变化时,直方图中峰值的位置也发生了变化,如图3所示。二值化阈值能够自适应地得到合理的阈值,从而得到较好的运动区域。
该方法中隐含了一个假定,那就是背景像素占整幅图像的大多数,如果前景像素占整幅图像的大多数,如图4(a)、图4(b)所示,那么均值就不是背景的均值,而是前景个数最多的直方图位置,这样计算出的均值和方差就是不正确的,尤其是在对图像感兴趣区域(ROI)进行视频分析时,如图4(c)和图4(d)所示。因为需要计算的是背景区域的均值和方差,但是这里对整幅图像进行了直方图统计,如果只对背景区域进行直方图统计,那么得到的均值和方差就是合理的。
这里可以利用背景更新中的计数器sTime(x,y,t)中包含的信息,它描述了一个像素位置属于背景的持续帧数,如果该计数器的值很大,则表明该像素位置一直属于背景,那么判断该像素位置属于背景区域是比较可靠的。这里假定sTime(x,y,t)>t,则该像素属于真正的背景区域。这样就得到了的真正背景区域,然后用当前帧中真正的背景区域与背景图像对应的区域作差分,再对该差分进行直方图统计,如图4(e)所示,计算均值和方差,该均值和方差是属于背景区域的均值和方差,得到的阈值是正确的二值化阈值。最后再用该阈值对当前图像与背景差分作二值化,得到正确的运动区域,如图4(f)所示。
通过对差分图像直方图的分析发现,在没有运动物体的情况下,帧差直方图服从高斯分布,根据该高斯分布得到了自适应的二值化阈值。当运动区域占整幅图像的大部分面积时,通过只对背景区域进行差分直方图分析,得到了正确的阈值,进一步提高了阈值选择的鲁棒性。实验证明,本文提出的算法简单有效,很适合用于构建嵌入式实时视频分析系统。
参考文献
[1] HU W, TAN T, WANG L, et al. A survey on visual surveillance of object motion and behaviors[J]. Transactions on Systems, Man, and Cybernetics—Part C: Applications and Reviews,2004,34 (3):334–352.
[2] POPPE R. Vision-based human motion analysis: an overview [J]. Computer Vision and Image Understanding (CVIU),2007,108 (1-2) :4-18.
[3] STAUER C, GRIMSON W. Learning patterns of activity using real-time tracking[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(8):747-757.
[4] Li L, Huang W, Gu I, et al. Foreground object detection from videos containing complex background[C]. The Eleventh ACM International Conference on Multimedia, New York,USA: ACM, 2003:2-10.
[5] KIM K, CHALIDABHONGSE T H, HARWOOD D, et al. Real-time foreground-background segmentation using codebook model[J]. Real Time Imaging,2005,11(3):172-185.
[6] 樊晓亮,杨晋吉.基于帧间差分的背景提取与更新算法[J].计算机工程,2011,37(22):159-161.
[7] 祝东进,郭大伟,刘晓.概率论与数理统计[M].北京:国防工业出版社,2010.