摘要:针对图像中相似冗余背景造成的显著目标识别的干扰问题,提出了一种基于超像素的冗余信息抑制的显著目标检测方法。首先,引入超像素的概念,利用超像素优化的空间特征分割图像,获取图像的相似区域;其次,为消除像素间的相关性,计算超像素的香农熵来表示图像的像素信息,并据此建立图像的信息图,最后,为了更有效地去除图像中的相似信息,利用自相似性抑制方法克服冗余信息,建立高效的图像显著图。最后的仿真结果表明, 所提算法与传统方法相比,不仅可以准确识别显著目标,而且可以更有效地抑制背景中的冗余信息。
0引言
人类所获知的信息中,有80%来源于人类的视觉感知。面对如此多的信息,人类视觉系统(HVS)能够快速、准确地对其进行处理,主要是由于HVS在扫描外部场景时,可以引导人眼专注于细节信息丰富的区域,这种快速专注的过程则称为视觉注意机制。近些年,视觉注意机制在目标探测、图像压缩、图像搜索和机器视觉等方面广泛应用,使其受到了越来越多的关注[1]。
Itti模型是Itti和Koch提出的最早、最具代表性的显著模型之一,该模型先提取图像的基本特征,如强度、颜色、纹理,然后再通过计算加权中央周边差,将这些特征结合起来,得到最终的显著图像[2];高大山等人提出了一种新颖的从复杂背景中提取显著目标的算法,该算法通过训练学习,最优化多种图像特征[3];侯晓迪等人[4]使用图像的光谱残余(SR)构建了新的显著图像算法,该算法通过分析输入图像的log谱,在频域获取图像的光谱残留信息,再在空域构建相应的显著图;Gopalakrishnan等人提出了一个稳定性强的显著区域检测模型,该模型使用颜色和方向分布特征分别得到两幅显著图像,再用一种非线性叠加的方法组合两幅显著图像得到最终的显著图像[5]。另外,还有其他一些模型,比如Bruce提出的基于信息最大化原则的AIM模型[6],Koch提出的基于图论的GBVS模型[7],Achanta提出的基于频率调整的FT模型[8]等。以上这些注意模型的立足点都是基于细小特征的数据信息[9],但对视觉识别过程中的冗余信息大都缺乏有力的解决办法。事实上,视觉注意力主要集中于信息最丰富的区域,背景冗余由于携带了较少的信息,往往被大脑抑制,而获得较少的关注。因此,在图像视觉处理过程中,应尽可能地抑制冗余信息,这样的处理过程更加符合人类视觉感知的基本过程。
为了模拟这样的处理过程,本文提出一种基于超像素和局部空间视觉冗余信息抑制的显著目标检测方法。所提算法首先使用线性迭代聚类算法从图像中提取均匀的纹理和灰度的超像素;再通过超像素定义,对图像的空间特征进行优化;在此基础上,利用超像素的空间特征对图像结构的自相似性进行刻画,并计算超像素的香农熵来建立图像的信息图;最后,利用自相似性抑制图像的冗余结构,从而实现从复杂图像的信息中获取图像的显著图。将最后的仿真结果与4种典型显著算法相比,所提算法不仅有效地抑制了背景的冗余信息,而且所识别的显著目标也是较好的。
1基于NLmeans算法的显著估计
在自然图像中,冗余区域往往包含了很少的信息,这使得它们获得的关注度往往较小。因此,在识别过程中,这些冗余通常被大脑立即处理掉,从而提高识别的效率。与之相反,信息丰富的区域往往更加复杂,当然也会吸引大部分的注意,并得到进一步的处理。因此,本文尝试通过计算图像的冗余信息,并快速过滤掉这些冗余,来使显著目标凸显出来。
NLmeans算法是一种处理图像空间冗余的有效方法[10],从NLmeans的观点看,在非局部邻近区域中冗余区域与其他区域是高度相似的。因此,通过计算周边结构相似度,可以直接测量每个区域的冗余,采用NLmeans过滤公式来测量自相似性[11]。假设f(x)是一个标量图像,符号f(x)和f(y)分别表示局部区域Ω(x)和Ω(y)中连接所有列形成的向量。这两个区域之间的相似性由以下公式来衡量:
σx代表区域Ω(x)的相关参数,τ是规范化系数,用于在非局部区域规范化S(x,y)的总和使其成为1。
像素之间的自相似性依靠区域之间的相似性,利用区域的相似性可得到像素之间的自相似性。然后,用像素之间的自相似性修改正常熵,丢弃冗余信息。最后,结合颜色和尺度空间,创建了基于冗余减少的自然图像的显著估计模型。仿真结果如图1所示。
由图1可知,NLmeans算法显著模型对一些微小的变化反应不敏感,并且对象区域能够有效地突出。然而,该模型直接使用图像像素值计算图像的自相似性,并且因为使用欧氏距离函数,对灰度级比对结构和文本更敏感。因此,本文使用超像素优化的空间特征[12]测量图像结构的自相似性,以改进NLmeans算法[10]。
2基于超像素优化空间特征的图像分割
21超像素
由于图像空间的一致性特性,图像的像素表示通常是冗余的。为了减少这种冗余性,Ren and Malik[13]最早提出了超像素的概念。超像素处理是指利用像素之间特征的相似性,将像素分组,用少量的超像素代替大量的像素来表达图像特征的过程。
本文使用简单的线性迭代聚类算法,从图像中提取大致均匀的纹理和灰度的超像素。
22超像素的空间特征优化
一般来说,图像中的独特区域通常远少于超像素的数量,如图2所示。因此邻近区域内有影响的超像素和相似的超像素要被优化。通过对邻近和相似的超像素优化,可使图像中相似冗余的信息得到进一步聚类。因此利用超像素空间特征优化算法使得邻近和相似的超像素优化得到图像的相似冗余信息。
超像素空间特征优化算法的主要过程如下:
(1)对输入图像使用线性迭代聚类算法提取超像素。
(2)为每个超像素搜索邻近的超像素。在邻近的超像素之外找到SN个相似的超像素,SN=log(X×Y),X是图像的宽度,Y是图像的高度。
(3)根据公式(2)、(3)、(4),迭代每个超像素的集群中心和成员。如果max(U(k)-U(k+1)/U(k))≤ε,则进行第(4)步,否则,k←k+1,继续第(3)步。
(4)使用PSO方法优化影响率1、2。如果在连续五个迭代或进化一代达到最大时满足|J(U,V)t-J(U,V)(t+1)|/J(U,V)(t)≤δ,则迭代停止,得到超像素的空间特征α(x,y);否则,返回到步骤(3)。
其中,模糊级别m=2,初始化阈值ε=01%,δ=01%;设置初始矩阵U(t),t是迭代次数,uij是U的基础;影响率参数1、2,初始化1=2=0。
23基于超像素的优化空间特征的图像分割
在本文中,通过使用超像素的优化空间特征提高原来的NLmeans 算法来衡量图像结构的自相似性。
由22节得到空间特征优化后的超像素区域R,使用α(x1,y1)和α(x2,y2)分别表示超像素区域R(x1,y1)和R(x2,y2)的空间特征,像素(x1,y1)和(x2,y2)分别表示超像素区域R(x1,y1)和R(x2,y2)的中央像素。像素(x1,y1)和(x2,y2)之间的相似性依靠超像素区域之间的相似性。像素(x1,y1)和(x2,y2)的相似性SS(x1,y1;x2,y2)由公式(5)测量:
参数λ控制了指数函数的衰减并有一定程度的过滤。τ是归一化系数,它的作用是将非局部区域内的SS(x1,y1;x2,y2)的总和归1。
3基于局部空间冗余抑制的显著估计
31自相似性结构的刻画
图像结构的自相似性表明了图像结构的冗余。自相似性越大,冗余也就越大。因此需要对图像结构的自相似性进行刻画。根据人类视觉系统的研究,两个相近的区域之间的相似性远远高于较远的区域。为了估计像素(x1,y1)的冗余,定义一个周边区域Ω,为方便计算这里只考虑区域Ω内的像素的相似性,区域Ω外的像素忽略不计。此外,更加重视中心像素(x1,y1)附近的像素。像素(x1,y1)的自相似性如下定义:
32基于香农熵的信息度描述
在信息理论中信息测量香农熵是一种有效的测量,它基于事件的统计概率。根据香农信息理论,图像信息总是基于像素的强度分布测量的。对于一个像素x,信息是基于局部区域的香农熵测量的,这里使用优化的超像素的空间特征计算像素的信息。给定一个像素(x,y),图像信息图定义如下:
这里N(α(x,y))是超像素区域的特征总量,N(αi)是超像素区域中αi的特征量,pi是像素(x,y)基于特征αi在超像素区域的概率。
33显著图生成
根据视觉注意机制集中于最丰富区域的特性,可以认为显著图像是人的大脑冗余抑制的结果,因此关注对象被模拟成视觉信息的冗余抑制。所以需要考虑图像信息测量的结构冗余。为了模拟显著图像,有效地抑制冗余信息,利用结构的自相似性抑制图像信息图的图像结构冗余,并从复杂图像信息中提取出有用的信息。根据公式(6)和公式(7),冗余抑制的显著图像估计如下:
SM(x,y)=(1-φ(x,y))IM(x,y)(8)
由公式(11)可得到冗余抑制的显著图像估计,并且该显著图像的值的范围是0~1。
4实验结果与分析
为了验证本文算法的优越性,将其与多个显著目标检测方法进行比较。实验结果表明,本文的算法取得的效果比其他方法好。
41与NLmeans算法模型比较
本文算法与NLmeans算法的比较结果如图2所示。其中第一列是原始图像,第二列是NLmeans算法的显著图像,第三列是本算法的显著图像。
图2中的原始图像具有自相似纹理和背景,并且背景是非常多余的。NLmeans算法的显著图像,强调了对象的边界,但背景干扰了响应。本文模型有效地显著了整个对象区域,同时降低了背景纹理。
42与经典方法比较
与四个最经典的显著估计方法(FT、SR、Gvbs和Itti)进行比较。图3显示了与这些经典方法的主观比较。图3(a)介绍了原始图像,图3(b)是ground truth,图3(c~f)显示了四个最经典的显著估计方法的结果。本文算法的显著图像是图3(g)。比较结果表明,本文方法可以产生良好的显著评估结果。在测试图像中,第一幅图像和第二幅图像,显著对象很小,大多数方法都能够估计显著对象。但本文的算法能更好地检测整个对象。当图像是一个很大的显著对象和简单的背景时,如第三幅图,其他的方法突出了边界,但本文的算法几乎强调整个对象。此外,在复杂背景的图像场景中,如第五幅图,本文的算法比别的算法对背景纹理更不敏感。
5结论
本文在NLmeans算法基础上提出了一个新颖的显著检测方法。该方法基于超像素和冗余抑制对给定的图像自动估计显著图像。显著图像是除去结构冗余后的图像信息图。通过与NLmeans算法和四个其他经典算法的实验比较可见,本文的算法达到了更好的效果。
参考文献
[1] ALEXANDER T.Computational versus psychophysical bottomup image saliency: a comparative evaluation study[J]. IEEE Transactions on Pattern Analysis and Machine intelligence, 2011, 33(11):2131-2146.
[2] ITTI L, KOCH C, NIEBUR E. A model of saliencybased visual attention for rapid scene analysis[J]. IEEE Tranctions on Pattern Analysis and Machine Intelligency, 1998,20(11):1254-1259.
[3] GAO D, VASCONCELOS N. Integrated learning of saliency, complex features, and object scenes[C]. In Proceedings of the 2005 Conference on Computer Vision and Pattern Recognition (CVPR′05), CA, USA, 2005: 282-287.
[4] HOU X, ZHANG L. Saliency detection: a spectral residual approach[C].IEEE Conference on Computer Vision and Pattern Recognition (CVPR),2007:1-8.
[5] VISWANATH G, RQUN H, DEEPU R. Salient region detection by modeling distributions of color and orientation[C]. IEEE Trans. Multimedia, 2009, 11(5):892-905.
[6] BRUCE, N, TSOTSOS J. Saliency based on information maximization[C]. In Proc. Advances in Neural Information Processing Systems,2005:155-162.
[7] HAREL J, KOCH C, PERONA P. Graphbased visual saliency[C]. Advances in Neural Information Processing Systems, MIT Press, Cambridge, 2007:545-552.
[8] ACHANTA R, HEMAMI S, ESTRADA F, et al. Frequencytuned salient region detection[C]. In: IEEE Conference on Computer Vision and Pattern Recognition, 2009, CVPR 2009, IEEE, 2009: 1597-1604.
[9] 胡玉兰,赵子铭,片兆宇,等.高分辨雷达一维距离像的融合特征识别[J].微型机与应用,2015,34(4):52-54,57.
[10] WU J, QI F, SHI G, et al. Nonlocal spatial redundancy reduction for bottomup saliency estimation[C].Visual Communication and Image Representation, 2012:1158-1166.
[11] BUADES A, COLL B, MOREL J. A nonlocal algorithm for image denoisin[C]. In: Proc.IEEE Conf. Computer Vision and Pattern Recognition, 2005: 60-65.
[12] Tian Xiaolin, Jiao Licheng.The image segmentation based on optimized spatial feature of superpixel[J]. Visual Communication and Image Representation, 2015(26):146-160.
[13] REN X, MALIK J. Learning a classification model for segmentation[C], In: International Conference on Computer Vision, 2003:10-17.