文献标识码: A
文章编号: 0258-7998(2015)04-0159-04
0 引言
近年来,随着多媒体技术的快速发展,人们对图像压缩的要求越来越高,某些情况下,JPEG标准和JPEG2000标准已经无法满足要求,为此,必须采用一种新的压缩技术对图像进行有效压缩。感兴趣区域(Region of Interest,ROI)编码技术利用了人眼的视觉特性,已成为目前图像压缩研究的热点。所谓ROI编码,就是将图像中比较关注区域(亦称ROI)的位平面设置得比其余区域(亦称BG)的位平面高,就可优先传输ROI系数,相对提高图像质量。
对于ROI编码,一些学者根据JPEG2000标准提供的一般位移(General Shift,GShift)法和最大位移(Maximum Shift,MaxShift)法,提出了一些改进方法。Wang Zhou[1]等提出了逐个位平面位移(BbBShift)法,该方法先上移重要的ROI位平面,然后逐个交替上移剩余的ROI位平面和一些BG位平面,剩余的BG位平面不位移。Liu Lijie[2]等提出了部分重要位平面位移(PSBShift)法,该方法将ROI位平面分为两部分,上移其中重要的ROI位平面。梁燕[3]提出了通用的部分位平面位移(GPBShift)法,该方法上移重要的ROI位平面,同时下移非重要的BG位平面,其余的位平面保持不变。这些改进方法的实质都是先传输ROI系数,然后传输BG系数和剩余的ROI系数。
本文通过研究前人的方法,提出了部分背景位平面位移(Partial Background Bitplanes Shift,PBBShift)法,并将此方法嵌入到多级树集合分裂(Set Partitioning in Hierarchical Trees,SPIHT)算法中。该方法可使图像观察者先对图像情况大致了解,然后决定是否需要。这种改进的方法可用于带宽受限的网络中。
1 多级树集合分裂(SPIHT)算法
SPIHT算法是在嵌入式零树小波(EZW)算法[4]的基础上提出的一种新算法[5]。该算法采用空间方向树、全体子孙集合和非直系子孙集合的概念,提高了编码效率[6]。SPIHT算法还能生成一个嵌入码流,接收的码流在任意点被截断时都可重构图像。
SPIHT算法的编码过程由正向小波变换、量化编码等组成。在SPIHT算法的基础上嵌入ROI部分:确定ROI、生成ROI模板、下移BG位平面、ROI形状和位置信息编码,从而形成基于GShift法的ROI编码过程,如图1所示。解码是编码的逆过程。
图1 基于GShift法的ROI编码过程
2 ROI编码
2.1 ROI掩模
定义ROI掩模来标定小波系数中属于ROI的点。若将ROI定义为矩形,此时只需确定矩形的左上角坐标(x1,y1)和右下角坐标(x2,y2)。ROI掩模M(i,j)可由式(1)表示[7],其生成过程[7]如图2所示。
2.2 ROI编码方法
GShift法和MaxShift法是两种最基本、最常用的ROI编码方法[8],如图3所示。在GShift法中,选择一个位移因子S把BG位平面都下降S位,这样,ROI的最重要位平面就高于BG的所有位平面,ROI就可以优先编码。解码时,ROI就能获得较好的恢复。S越大,ROI相对BG的优先级越高,质量也就越高。当GShift法中的位移因子S增大到使得ROI位平面与BG位平面无重叠时,此时GShift法就变成了MaxShift法。
图3 两种ROI编码方法[8]
3 改进方法
3.1 部分背景位平面位移(PBBShift)法
某些情况下,观察者想在图像刚开始解码时了解一下图像的大概情况,这就需要一部分BG位平面置于与ROI位平面同等高的位平面上。根据GShift法,本文提出了PBBShift法,如图4所示,其中S1为BG的重要位平面,S2为BG剩余位平面的下移位数。PBBShift法将BG位平面分为两部分:重要位平面和剩余位平面。编码时,BG的重要位平面不位移,剩余位平面向下位移。解码时只需将BG的剩余位平面上移即可。由于该方法只需下移部分BG位平面,故称此方法为PBBShift法。
图4 PBBShift法
3.2 编码流程图
相比GShift法的ROI编码过程,PBBShift法的ROI编码部分相对复杂些,它要将BG位平面分为两部分分别进行位移,具体的编码过程如图5所示。解码是编码的逆过程。
4 实验分析与结论
图5 PBBShift法编码过程
图6 Lena原图
实验选取Lena图像(512×512,8 bit),如图6所示,ROI定义在脸部,为矩形。实验采用MATLAB编程,将ROI部分嵌入到SPIHT算法中,先进行6级9/7小波变换,然后用PBCBShift法对位平面进行位移,其中S1=2,S2=2,最后得到编码数据流。图像的客观评价用峰值信噪比(PSNR)表示,单位为分贝(dB),PSNR越大,质量越好。图7为PBBShift法下各区域的PSNR对比。图8为PBBShift法得到的主观视觉效果图。实验还将PBBShift法与No-Shift法、GShift法作比较,图9为3种方法得到的PSNR实验结果,其中,(a)为ROI的PSNR对比,(b)为BG的PSNR对比,(c)为全图的PSNR对比。由于选取的ROI的面积占整幅图像的比重小,所以全图的PSNR接近于BG的PSNR。
图7 PBBShift法各区域PSNR对比
从图7可知,低码率下,ROI和BG的PSNR都比较小,相差不大;随着码率的增大,ROI的PSNR先快速增大,然后平稳增大,而BG的PSNR先缓慢增大,然后平稳增大。从图8看出,低码率下,ROI和BG都比较模糊,但能看出轮廓;随着码率的增大,ROI比BG获得更好的视觉效果,当码率增大到一定时,ROI和BG都很清楚。
图8 PBBShift法得到的主观视觉效果图
图9 3种算法得到的PSNR对比
从图9(a)看出,对于ROI,低码率下,PBBShift法和No-Shift法得到的PSNR相差不大;随着码率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是两者的PSNR都低于GShift法的PSNR。从图9(b)看出,对于BG,低码率下,PBBShift法和No-Shift法得到的PSNR相差不大;随着码率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是两者的PSNR都高于GShift法的PSNR。
从上面几组实验,得出以下结论:
(1)本文提出的方法先解码ROI系数和重要的BG系数,后解码剩余的BG系数。运用该方法可先了解图像的大致内容,继续解码时,ROI将比BG获得更好的视觉效果。
(2)本文提出的方法介于GShift法和No-Shift法之间。要使BG在低码率下能较清楚地显示,只需增大S1的值,此时本文方法就接近No-Shift法。要使ROI与BG有更大的视觉对比度,只需增大S2的值,此时本文方法就接近GShift法。
5 总结
ROI编码技术是静态图像压缩标准支持的一种新技术,该技术为图像的高性能压缩提供了很好的解决方案。本文在分析GShift法的基础上,提出了一种改进的ROI编码方法,即PBBShift法。本文的创新点在于,该方法可以使观察者先了解图像的大致情况,如果是需要的图像就继续传输,ROI将比BG获得更好的视觉效果,如果不是需要的图像就停止传输,节省等待时间。实验证明,该方法是有效的。这种改进的ROI编码技术将在未来图像压缩领域发挥重大的作用。
参考文献
[1] Wang Zhou,BOVIK A C.Bitplane-by-Bitplane shift (BbBShift)-a suggestion for JPEG2000 region of interest image coding[J].IEEE Signal Processing Letters,2002,9(5):160-162.
[2] Liu Lijie,Fan Guoliang.A new JPEG2000 region of interest image coding method:partial significant bitplanes shift[J].IEEE Signal Processing Letters,2003,10(2):35-38.
[3] 梁燕.基于小波变换的序列图像感兴趣区域编码[D].天津:天津大学,2005.
[4] 牛德智,陈长兴,王曙钊,等.一种基于EZW改进算法的图像压缩方法研究[J].电子技术应用,2010,36(12):128-131.
[5] JAIN V,JAIN N,PARIKH A.Comparative analysis of image compression using image interpolation and SPIHT encoding[C].Engineering and Systems(SCES),2012:1-6.
[6] 陈秀梅,王伟,汤敏.基于Curvelet变换和SPIHT算法的医学图像感兴趣区域压缩[J].中国医学影像学杂志,2014,22(10):786-792.
[7] 小野定康,铃木纯司.JPEG2000技术[M].北京:科学出版社,2004.
[8] 袁建亮,朱远平.基于JPEG2000的感兴趣区域压缩编码算法[J].天津师范大学学报(自然科学版),2014,34(1):42-46.