《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 设计应用 > 基于PBBShift的ROI编码方法
基于PBBShift的ROI编码方法
陈 鑫1,2,陈 晓1,2,沈千里1,2,蔡婷婷1,2
1.南京信息工程大学 大气环境与装备技术协同创新中心,江苏 南京 210044; 2.南京信息工程大学 电子与信息工程学院,江苏 南京210044
摘要: 为使观察者提早了解图像的大致情况,提出了基于部分背景位平面位移(PBBShift)的感兴趣区域(ROI)编码方法。该方法将背景(BG)位平面分为两部分,编码时下移剩余的BG位平面,解码时可优先传输ROI系数和重要的BG系数,然后传输剩余的BG系数。实验证明,该方法在低码率下,ROI和BG质量相差无几;在高码率下,ROI获得比BG更好的质量。改进的方法在带宽受限的网络中有很大的实用价值。
中图分类号: TN919.81
文献标识码: A
文章编号: 0258-7998(2015)04-0159-04
ROI coding method based on PBBShift
Chen Xin1,2,Chen Xiao1,2,Shen Qianli1,2,Cai Tingting1,2
1.Collaborative Innovation Center of Atmospheric Environment and Equipment Technology, Nanjing University of Information Science and Technology,Nanjing 210044,China; 2.College of Electronic and Information Engineering,Nanjing University of Information Science and Technology, Nanjing 210044,China
Abstract: In order to make observer know a general idea of image in advance, this paper puts forward Region of Interest(ROI) coding method based on Partial Background Bitplanes Shift(PBBShift). This method divides background(BG) bitplanes into two parts, remaining BG bitplanes are shifted down during coding, ROI coefficients and significant BG coefficients will be transmitted firstly during decoding, then remaining BG coefficients can be transmitted. Experiments show that ROI and BG have the same quality under low bit rate, ROI gets a better quality than BG under high bit rate. This improved method has a great practical value in limited bandwidth of the network.
Key words : PBBShift;ROI coding;BG bitplanes


0 引言
    近年来,随着多媒体技术的快速发展,人们对图像压缩的要求越来越高,某些情况下,JPEG标准和JPEG2000标准已经无法满足要求,为此,必须采用一种新的压缩技术对图像进行有效压缩。感兴趣区域(Region of Interest,ROI)编码技术利用了人眼的视觉特性,已成为目前图像压缩研究的热点。所谓ROI编码,就是将图像中比较关注区域(亦称ROI)的位平面设置得比其余区域(亦称BG)的位平面高,就可优先传输ROI系数,相对提高图像质量。
    对于ROI编码,一些学者根据JPEG2000标准提供的一般位移(General Shift,GShift)法和最大位移(Maximum Shift,MaxShift)法,提出了一些改进方法。Wang Zhou[1]等提出了逐个位平面位移(BbBShift)法,该方法先上移重要的ROI位平面,然后逐个交替上移剩余的ROI位平面和一些BG位平面,剩余的BG位平面不位移。Liu Lijie[2]等提出了部分重要位平面位移(PSBShift)法,该方法将ROI位平面分为两部分,上移其中重要的ROI位平面。梁燕[3]提出了通用的部分位平面位移(GPBShift)法,该方法上移重要的ROI位平面,同时下移非重要的BG位平面,其余的位平面保持不变。这些改进方法的实质都是先传输ROI系数,然后传输BG系数和剩余的ROI系数。
    本文通过研究前人的方法,提出了部分背景位平面位移(Partial Background Bitplanes Shift,PBBShift)法,并将此方法嵌入到多级树集合分裂(Set Partitioning in Hierarchical Trees,SPIHT)算法中。该方法可使图像观察者先对图像情况大致了解,然后决定是否需要。这种改进的方法可用于带宽受限的网络中。
1 多级树集合分裂(SPIHT)算法
    SPIHT算法是在嵌入式零树小波(EZW)算法[4]的基础上提出的一种新算法[5]。该算法采用空间方向树、全体子孙集合和非直系子孙集合的概念,提高了编码效率[6]。SPIHT算法还能生成一个嵌入码流,接收的码流在任意点被截断时都可重构图像。
    SPIHT算法的编码过程由正向小波变换、量化编码等组成。在SPIHT算法的基础上嵌入ROI部分:确定ROI、生成ROI模板、下移BG位平面、ROI形状和位置信息编码,从而形成基于GShift法的ROI编码过程,如图1所示。解码是编码的逆过程。

201504wj-jsj2t1.jpg

图1  基于GShift法的ROI编码过程

2 ROI编码
2.1 ROI掩模

    定义ROI掩模来标定小波系数中属于ROI的点。若将ROI定义为矩形,此时只需确定矩形的左上角坐标(x1,y1)和右下角坐标(x2,y2)。ROI掩模M(i,j)可由式(1)表示[7],其生成过程[7]如图2所示。
MSNUASZRPSCEAA]7U%]7IJ3.png

W4MOS~8FD{5@1KRB{_EH%@C.png

2.2 ROI编码方法
    GShift法和MaxShift法是两种最基本、最常用的ROI编码方法[8],如图3所示。在GShift法中,选择一个位移因子S把BG位平面都下降S位,这样,ROI的最重要位平面就高于BG的所有位平面,ROI就可以优先编码。解码时,ROI就能获得较好的恢复。S越大,ROI相对BG的优先级越高,质量也就越高。当GShift法中的位移因子S增大到使得ROI位平面与BG位平面无重叠时,此时GShift法就变成了MaxShift法。

201504wj-jsj2t3.jpg

图3  两种ROI编码方法[8]

3 改进方法
3.1 部分背景位平面位移(PBBShift)法

    某些情况下,观察者想在图像刚开始解码时了解一下图像的大概情况,这就需要一部分BG位平面置于与ROI位平面同等高的位平面上。根据GShift法,本文提出了PBBShift法,如图4所示,其中S1为BG的重要位平面,S2为BG剩余位平面的下移位数。PBBShift法将BG位平面分为两部分:重要位平面和剩余位平面。编码时,BG的重要位平面不位移,剩余位平面向下位移。解码时只需将BG的剩余位平面上移即可。由于该方法只需下移部分BG位平面,故称此方法为PBBShift法。

201504wj-jsj2t4.jpg

图4  PBBShift法

3.2 编码流程图
    相比GShift法的ROI编码过程,PBBShift法的ROI编码部分相对复杂些,它要将BG位平面分为两部分分别进行位移,具体的编码过程如图5所示。解码是编码的逆过程。
4 实验分析与结论

201504wj-jsj2t5.jpg

图5  PBBShift法编码过程

201504wj-jsj2t6.jpg

图6  Lena原图

    实验选取Lena图像(512×512,8 bit),如图6所示,ROI定义在脸部,为矩形。实验采用MATLAB编程,将ROI部分嵌入到SPIHT算法中,先进行6级9/7小波变换,然后用PBCBShift法对位平面进行位移,其中S1=2,S2=2,最后得到编码数据流。图像的客观评价用峰值信噪比(PSNR)表示,单位为分贝(dB),PSNR越大,质量越好。图7为PBBShift法下各区域的PSNR对比。图8为PBBShift法得到的主观视觉效果图。实验还将PBBShift法与No-Shift法、GShift法作比较,图9为3种方法得到的PSNR实验结果,其中,(a)为ROI的PSNR对比,(b)为BG的PSNR对比,(c)为全图的PSNR对比。由于选取的ROI的面积占整幅图像的比重小,所以全图的PSNR接近于BG的PSNR。

201504wj-jsj2t7.jpg

图7  PBBShift法各区域PSNR对比

    从图7可知,低码率下,ROI和BG的PSNR都比较小,相差不大;随着码率的增大,ROI的PSNR先快速增大,然后平稳增大,而BG的PSNR先缓慢增大,然后平稳增大。从图8看出,低码率下,ROI和BG都比较模糊,但能看出轮廓;随着码率的增大,ROI比BG获得更好的视觉效果,当码率增大到一定时,ROI和BG都很清楚。

201504wj-jsj2t8.jpg

图8  PBBShift法得到的主观视觉效果图

201504wj-jsj2t9.jpg

图9  3种算法得到的PSNR对比

    从图9(a)看出,对于ROI,低码率下,PBBShift法和No-Shift法得到的PSNR相差不大;随着码率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是两者的PSNR都低于GShift法的PSNR。从图9(b)看出,对于BG,低码率下,PBBShift法和No-Shift法得到的PSNR相差不大;随着码率的增大,PBBShift法的PSNR大于No-Shift法的PSNR,但是两者的PSNR都高于GShift法的PSNR。
    从上面几组实验,得出以下结论:
    (1)本文提出的方法先解码ROI系数和重要的BG系数,后解码剩余的BG系数。运用该方法可先了解图像的大致内容,继续解码时,ROI将比BG获得更好的视觉效果。
    (2)本文提出的方法介于GShift法和No-Shift法之间。要使BG在低码率下能较清楚地显示,只需增大S1的值,此时本文方法就接近No-Shift法。要使ROI与BG有更大的视觉对比度,只需增大S2的值,此时本文方法就接近GShift法。
5 总结
    ROI编码技术是静态图像压缩标准支持的一种新技术,该技术为图像的高性能压缩提供了很好的解决方案。本文在分析GShift法的基础上,提出了一种改进的ROI编码方法,即PBBShift法。本文的创新点在于,该方法可以使观察者先了解图像的大致情况,如果是需要的图像就继续传输,ROI将比BG获得更好的视觉效果,如果不是需要的图像就停止传输,节省等待时间。实验证明,该方法是有效的。这种改进的ROI编码技术将在未来图像压缩领域发挥重大的作用。
参考文献
[1] Wang Zhou,BOVIK A C.Bitplane-by-Bitplane shift (BbBShift)-a suggestion for JPEG2000 region of interest image coding[J].IEEE Signal Processing Letters,2002,9(5):160-162.
[2] Liu Lijie,Fan Guoliang.A new JPEG2000 region of interest image coding method:partial significant bitplanes shift[J].IEEE Signal Processing Letters,2003,10(2):35-38.
[3] 梁燕.基于小波变换的序列图像感兴趣区域编码[D].天津:天津大学,2005.
[4] 牛德智,陈长兴,王曙钊,等.一种基于EZW改进算法的图像压缩方法研究[J].电子技术应用,2010,36(12):128-131.
[5] JAIN V,JAIN N,PARIKH A.Comparative analysis of image compression using image interpolation and SPIHT encoding[C].Engineering and Systems(SCES),2012:1-6.
[6] 陈秀梅,王伟,汤敏.基于Curvelet变换和SPIHT算法的医学图像感兴趣区域压缩[J].中国医学影像学杂志,2014,22(10):786-792.
[7] 小野定康,铃木纯司.JPEG2000技术[M].北京:科学出版社,2004.
[8] 袁建亮,朱远平.基于JPEG2000的感兴趣区域压缩编码算法[J].天津师范大学学报(自然科学版),2014,34(1):42-46.

此内容为AET网站原创,未经授权禁止转载。