摘 要: 介绍了一种新的基于三维离散余弦变换的彩色图像压缩方法。该方法把彩色图像看作是一种三维信号,通过三维离散余弦变换,不仅去除了图像R、G、B分量内的相关性,同时能够去除R、G、B分量之间的相关性,因此,在保留图像质量的同时,能够达到更高的压缩率。另外,该方法还具有简单、速度快等优点。实验表明,这是一种好的压缩方法。
关键词: 离散余弦变换;图像压缩;彩色图像;图像处理
随着科技的发展以及人们对物质精神文化的追求,信息已经成为时代的重要特征,而图像是人们传递信息的主要途径之一。由于一幅没有压缩的图像的数据原始量太大,给图像的传输和存储带来很大的不便。因此,图像压缩算法成为图像处理领域重要的课题,各种新颖、高效率的图像压缩算法层出不穷。
和R、G、B所决定的,因此,可以把每一个灰度值表示为f(x,y,u),其中x、y表示像素点的位置坐标,u表示的是R分量、G分量还有B分量。可以约定,u=1时,表示的是R分量;u=2时,表示的是G分量;u=2时,表示的是B分量。这样,就可以把一幅彩色图像表示成为一个三维信号。
图像压缩是指在保证一定的图像质量的情况下,用尽可能少的数据来表示该图像。能够对图像进行压缩的原因是图像的原始数据当中存在着信息冗余,去除或者减少这些冗余信息,就能够用更少的数据来表示图像,起到压缩图像的目的。
1 DCT变换和基于DCT变换的信号压缩原理
1.1 一维DCT变换和二维DCT变换
离散余弦变换(DCT)诞生于1974年,由AHMED和RAO首先给出了它的定义式。
一维和二维DCT变换及其逆变换的定义式可参看参考文献[1]和参考文献[2]。一维DCT和二维DCT变换都有正变换及其对应的逆变换。正变换把信号变换到频域,然后由逆变换重构信号。把信号变换到频域,就可以利用频域的一些特点对信号进行处理,从而取得良好的效果。
1.2 DCT系数的聚集性和基于DCT变换信号压缩原理 DCT变换具有K-L变换近似的良好性质,信号经过DCT变换后,能量具有集中性,表现在DCT变换后,数值大的系数会集中在特定的区域,这个性质可以用来进行信号压缩。在进行信号存储或者信号传输时,仅仅存储或者传输数值大的数据,省略数值小的数据,从而起到压缩的作用。由于数值大的系数都会集中在特定的区域,因此处理起来就非常方便。
重构信号时,把省略了的数值用0代换,然后进行逆变换,就能够得到原信号。在压缩和解压缩过程中,因为忽略了DCT系数中的一些很小的数值,所以重构出来的信号与原来的信号相比会有误差,这是一种有损压缩。DCT系数矩阵系数保留得越多,重构的信号与原来的就越接近;系数保留得越少,重构信号质量就会下降得越多。
式(8)是三维DCT变换用于彩色图像压缩的矩阵表达形式。彩色图像的R、G、B分量经过变换之后,变成了频域的DCT系数,极大地去除了原始图像数据的相关性。根据DCT系数矩阵数值的特点,仅保留少数在左上角较大的系数,而忽略右下角近似为零的系数,从而把图像进行了压缩。然后用处理后的DCT系数逆变换,重构原始图像:
通过以上4个步骤,就可以对彩色图像进行大压缩比的压缩。当原始的彩色图像需要进行存储和传输时,仅仅存储和传输经过取舍得到的上述3个矩阵的数值就可以了,数据量比原始图像大大地减少了。那么如何用这些数据重构原始图像呢?重构图像与图像压缩是逆过程,步骤如下。
(1)把经过系数取舍的系数矩阵Xc(k,l,0)、Xc(k,l,1)和Xc(k,l,2),对省略了的系数以0代替,每个矩阵恢复到大小为8×8的矩阵,然后分别进行二维DCT逆变换;
(2)利用式(9)计算出每一小块R、G、B分量的值;
(3)将每一小块按原来的位置合并成一幅完整的图像。
由于系数矩阵Xc(k,l,0)、Xc(k,l,1)和Xc(k,l,2)的系数经过取舍舍去了一些值很小的系数,因此重构的图像与原来的图像是有所区别的。但适当控制压缩比,得到的图像质量还是相当好,与原来图像差别不大。
3 实验结果
对图像压缩算法的好坏评价标准主要有两方面:一是压缩比,在满足一定的图像质量前提下,压缩比越大越好;二是图像质量,压缩后的图像应该是人眼可以接受的,压缩后的图像的质量不能退化得太厉害,如压缩后的图像与原来图像相比已经面目全非,那么这个图像压缩就没有意义了。
压缩比是一个很客观的指标,就是原来图像的数据量与压缩后图像数据量的比值,即压缩比=原图像数值大小/压缩后的图像数值大小。对于图像质量好坏的评价,目前并没有通行的标准,可以说是一项很主观的工作。当然,图像质量也有一些客观的指标,例如均方误差(MSE)、峰值信噪比(PSNR),但这些客观的指标并不完美,有一定的局限性,并不能完全反映人的感受,与人对图像的主观感受并不完全一致。因此,观察者仍然是图像质量优劣的最终判断者。
本文采用512×512的彩色图像作为测试图像,以验证本算法的有效性,结果如图1所示。压缩后图像质量主要是采用主观评价方法,以人眼看不出与原始图像有差别的前提下,能够达到的最大压缩比。
其中,图1(a)是原始图像,图1(b)保留了DCT系数矩阵Xc(k,l,0)中左上角5×5个系数,Xc(k,l,1)中左上角4×4个系数,Xc(k,l,2)中左上角3×3个系数,压缩比为4:1;图1(c)保留了DCT系数矩阵Xc(k,l,0)中左上角3×3个系数,Xc(k,l,1)中左上角2×2个系数,Xc(k,l,2)中左上角1×1个系数,压缩比14:1;图1(d)保留了DCT系数矩阵Xc(k,l,0)中左上角2×2个系数,Xc(k,l,1)中左上角1×1个系数,Xc(k,l,2)中左上角1×1个系数,压缩比为32:1。
从实验结果可以看出,当压缩比为4:1时,压缩后的图像很好地保留了原来图像的色彩和细节,从肉眼看,与原来图像差别不大;当压缩比为14:1时,图像质量没有明显改变,色彩与细节方面没有明显变差,肉眼看依然可以接受;当压缩比为32:1时,从图像边缘上可以看到一些锯齿状的痕迹,有些模糊,细节有所缺失,但颜色依然与原图像保持一致。因此,本文算法在压缩比达到14:1时,能够保持很好的图像质量,做到压缩比与图像质量的平衡。
本文在传统的二维DCT变换的基础上提出了三维DCT变换,并将其用于彩色图像压缩。而在压缩算法中,将其转化为二维DCT变换,减少了算法的复杂度和运算量。通过一系列实验,表明该算法具有压缩比大、算法简单和速度快的特点。
参考文献
[1] 章毓晋. 图像处理和分析[M].北京:清华大学出版社,1999.
[2] 胡广书. 数字信号处理理论、算法与实现[M]. 北京:清华大学出版社,2012.
[3] 苏志武,林定祥,章文辉.数字电视系统测量与监测[M]. 北京:电子工业出版社, 2009.
[4] OPPENHEIM A V.信号与系统[M].刘树堂,译.北京:电子工业出版社, 2013.
[5] SKLAR B.数字通信(第2版)[M].徐平平,等,译.北京:电子工业出版社, 2010.