0 引言
随着多媒体和网络技术的不断发展,在传输图像或视频信息时,如何有效地运用信道带宽已经成为现今讨论的主要话题之一。率控制是图像或视频编码中控制比特率必须采用的方法,其最终目标就是将目标比特率合理的分配到图像或视频中去,以求得到最小的失真。
JPEG2000是一种新的静止图像压缩编码国际标准。由于其采用了与其他图像压缩标准不同的全新结构,因此,JPEG2000拥有压缩比高,同时支持有损和无损压缩,码流可随机存取和处理等优点。JPEG2000的编码算法包括离散小波变换(DWT)和位平面熵编码。在JPEG2000中可通过尝试不同的量化步长来进行率控制:而通过位平面MQ编码器,JPEG2000则可以精确简单的控制比特率,以达到需要的比特率。JPEG2000的核心编码方式是嵌入式码块编码(EBCOT)。其最优截断是使图像失真最小化的一种率控制方法。这一过程是在小波系数经过熵编码(压缩)后,所以也称为压缩后的率失真优化(PCRD)。
根据所有压缩后数据的实际率失真信息,PCRD技术就能计算出目标码流的图像最小化失真。但是这还需要图像所有的码流数据,事实
上,很多数据是不会被输出的,这一过程还会占用很多内存和计算量。为此,本文提出了一种新的率控制方法,可以有效减少计算量和内存使用量,同时可以获得相似的效果。
1 JPEG2000简介
作为一种新的国际压缩标准,通常可以把JPEG2000看作小波变换(DWT)、标量量化、比特系数建模、算术编码、压缩后率失真优化和码流组织等六个部分。
小波变换可将图像分解为LL、HL、LH和HH四种子带,并可以进行多级分解。LL是图像低频信息所在,其他的三种子带包含的是图像高频信息。这些小波系数经过量化后,即可进入EBCOT编码过程。
1.1 熵编码
熵编码过程一般包括系数建模和算术编码。它本质上是一个位平面编码的过程。在这个过程中,每个编码块都被独立编码,并且都经过三个编码通道,这三个编码通道分别是重要性通道、幅值精炼通道和清零通道。这些编码通道将会根据比特系数模型寻找每个比特系数的上下文,然后对这个比特系数进行基于上下文的算术编码(MQ)。
1.2 码率控制
码率控制涉及量化、熵编码和码流组织三个部分。量化就是量化步长根据要求的压缩率反复调整以达到目标码率,这是一种交互式控制方式。另外一种采用压缩后处理的方法是在码流数据中对每个编码块设置一个截断点,这个截断点可决定每个码块的编码通道编码的数据量。这就是JPEG2000的压缩后率失真优化。其具体算法如下:
首先设编码块Bi的码率为、失真为,最终压缩数据的目标码率为Rmax,则每个编码块的截断点可以自由选择,它只需要最后的码率满足下式即可:
如果用每个编码块的失真之和来表示重建图像的失真,则重建图像的失真为:
这样,在截点ni,其率失真斜率为:
然后,利用拉格朗日乘子法,就可以求出最优截断点λ,从而实现最优截断编码。
2 新的率控制方法
最优截断点λ只能通过所有截断点实际的率失真斜率来求得,这就需要熵编码过程编码所有的位平面数据和所有编码过的码流都存储在存储器中,而且,即使是那些在码流控制后不需要传输的码流,也要编码和存储。然而,通过研究发现:如果将每个截断点的率失真斜率按递减的方式进行整理,这个排列顺序便与位平面层数有关。一般情况下,位平面高的率失真斜率大于位平面低的;其次,先编码的通道的率失真斜率大于后编码的通道。
基于以上两点,可先扫描图像的位平面信息,在编码那些率失真斜率大的。而后面不重要的比特就可以不进行编码。这个方法的过程首先是根据下式计算出每个码块Bi的最高位平面数Pi;
其中是码块Bi中的最大系数。之后,在求出最大的平面数:
扫描每一个码块的顺序图如图l所示。对于每一个扫描的码块,一般有如下三个条件:
(1)首先要判断Pi=Pmax是否成立,如果成立,编码这个编码块未编码的位平面通道,然后Pi减1,之后检查条件(2)。否则检查条件(3);
(2)如果累计的码率大于目标码率,则立即退出编码。否则,检查条件(3);
(3)如果这是最后一个编码块,那么Pmax减1,然后进入下一个层的编码。否则继续扫描下个编码块。
由于上述条件(2)满足的条件,故不会使码率超过压缩率的限制。而条件(1)、(3)则充分考虑了位平面和编码通道的重要性,因而可确保得到最佳的图像质量。
3 实验结果
这里,我们用512x512的lena图像进行测试,表1记录了PCRD与新方法在计算量和内存使用量上的对比。表2所列是两种方法在PSNR上的对比。两种方法的解压图像效果如图2所示。
4 结束语
通过对JPEG2000的分析,本文提出了一种通过估计率失真信息来控制码率的方法。该方法由于不需要对所有的数据进行编码,因此,可在保持图像质量的同时,还可以有效减少冗余计算量和内存占用量。