MPEG2与MPEG4在视频编码的简单比较
MPEG2 制定于1994年,是建立在MPEG1之上,设计目标是高级工业标准的图像质量以及更高的传输率.它主要应用在没有色度 畸变要求场合的高质量视频,数据速率在1.1Mbps到20Mbps之间.MPEG2能够提供广播级的视像和CD级的音质.MPEG2不仅能录制电视节目,而且还是为录制高清晰度的高质量动态图像而开发的,能够存储比MPEG1清晰度更高的动态图像.除了作为DVD的指定标准外,MPEG2还可用于为数字有线电视分配,通过ATM的网络数据库业务,数字VTR应用以及卫星和地面数字广播分配等提供广播级的数字视频.除此之外,在最近迅速增加的拥有电视录像功能的PC,及外置的视频捕获装置中也使用了MPEG2.
从本质上说,MPEG2可以视为是一组MPEG1的最高级编码标准,并设计能向后兼容MPEG1,即每一个MPEG2兼容解码器能对有效的MPEG1比特流进行解码.为了满足多种不同应用的需求,MPEG2将许多视频编码算法综合于单个句法之中;为获得足够的性能和质量,MPEG2还增添了许多新的编码特性.MPEG2具备两种编码模式,一是非可分等级的编码模式,二是可分等级的编码模式.
在非可分等级的编码中,与MPEG1一样,MPEG2是以通用的混合DCT和DPCM编码为基础,加入了宏块结构,运动补偿和帧间预测的编码方式.MPEG2引进了一些新的运动补偿场预测模式,以便有效地对场图像和帧图像加以编码,如,为了支持隔行视频的场图像的场间预测,帧图像的场间预测,用于P帧的双基预测和用于场图像的16x8预测等针对隔行扫描图像的更有效预测编码模式.另外,MPEG2还引入了更高的色信号取样模式.MPEG1中使用4:1:1模式,即色信号的取样无论在水平方向,还是在垂直方向上都是亮度信号样点数的1/2.MPEG2除了4:2:0外,还支持4:2:2和4:4:4模式,前者色信号的样点数在垂直方向上与亮度信号相同,只在水平方向上是亮度信号的1/2;后者的色信号的样点数和亮度信号则完全相同.
除了非可分等级的编码模式外,MPEG2已经对可分级性方法进行了标准化.可分级编码在不同业务之间能提供互操作性,能满足传输频道或存储媒体对带宽的特殊需求,能较灵活地支持具有不同显示功能的各种接收机.有的接收机既没有能力或者也不要求再现视频的全部清晰度,那么就可以只对分层比特流的子集进行解码,以较低的空间或时间清晰度,或者较低的质量,来显示视频图像.可分级编码灵活支持多种清晰度的这一功能对于HDTV跟标准清晰度电视(SDTV)相互配合运作来讲十分重要,保持HDTV接收机应跟SDTV产品相兼容.只要HDTV源进行了可分级编码,就能实现这一兼容性,这就能避免很浪费地将两个单独的比特流分别地传输给HDTV和SDTV接收机.MPEG2已对三种可分级编码方案进行了标准化:SNR可分级性,空间可分级性及时间可分级性——每一种方案的目标在于有助于满足特殊应用的需求.空间可分级性已经开发完成,以便在接收机显示不同的空间清晰度——从基层能够再现空间清晰度较低的视频,这一功能对于许多应用都是有用的,包括对HDTV/TV系统采用嵌入式编码,这样就允许从数字TV业务向具有较高空间清晰度的HDTV业务过渡.空间可分级性能够灵活的支持很宽范围的空间清晰度,但给主要编码方案增添了很大的装置复杂性.SNR可分级性已基本开发成功,对于按优先排列传输媒体来说,SNR可分级性能使视频质量下降时比较缓慢(质量可分级性),如果基层能避免受到传输误差的影响,那么只要对基层信号加以解码,就能获得质量衰减缓慢的视频.用来实现质量缓慢衰减的算法基于一种频率(DCT域)可分级性技术,能够获得极佳的编码效率.在基层,DCT系数在量化步长较大下被量化和发送,以便在低比特率情况下来获取适中的图像质量.非量化DCT系数跟来自基层,量化步长较小的量化系数之间存在差值,而增强层就对这一差值进行编码,加以发送.在解码器,通过对较低层和较高层比特流进行解码,就能再现最高质量的视频信号.利用这一方法,也可能在接收机中获取空间清晰度较低的视频图像.已开发的时间可分级性方法的目的跟空间可分级性的相类似——只要具有一个适用于立体显示功能接收机的分层比特流,立体视频就能得到支持.不同的可分级性方法还可以结合于一个混合编码方案之中,也就是说,将空间可分级性和时间可分级性方法结合于一个混合层编码方案之中,这样,拥有不同空间清晰度和帧频的各种业务之间的互操作性就能得到支持.将空间可分级性与SNR可分级性相结合,就能够获得HDTV与SDTV业务之间的互操作性,并对频道误差有一定的恢复功能 MPEG2句法最多可支持三个不同的可分级层.可分级编码的其它一些重要应用还有视频数据库浏览以及在多媒体环境中视频的多清晰度重放.
而MPEG4提出的来的初衷是制定一个通用的低码率(64KB/S以下)的标准,并打算采用第二代压缩编码算法,以有效的支持甚低码率的应用.但是由于很多压缩编码的第二代算法仍处于研究阶段或是不够成熟,MPEG4目标又转向支持目前的标准尚未全面支持的那些应用.例如,移动通信中的声像业务,与其他多媒体数据(如计算机产生的图形,图像)的集成和交互式多媒体服务等.在5-64KB/S的范围内,MPEG4支持的图像格式从每行几个像素,每帧几行到CIF格式,帧率从0Hz到15Hz.由于其压缩率非常高,数据量也很小,因而图像质量不如MPEG1及2.
MPEG4包括如下几部分主要功能:
1,基于内容的编码(content-oriented),即不是像MPEG1,2基于像素的编码,而是基于对象(object)和实体(entity)进行编码.对每一个对象的编码形成一个对象码流层,该码流中包含着对象的形状,位置,纹理以及其他方面的属性等.对一幅图像编码所形成的码流就由一系列这样的对象层码流所构成.用户可以直接对"对象层"进行存取操作.
2,编码效率的改进和并发数据流的编码.
3,错误处理的鲁棒性,有助于低比特率视频信号在高误码率环境(如移动通信环境)下的存储和传输.
4,基于内容的可伸缩性(scalable),用户可以有选择的只对感兴趣的对象进行传输,解码和显示.
与MPEG4主要面对移动通信或目前Internet上低带宽多媒体的应用相比,MPEG2主要是用于高带宽高保真的多媒体业务环境,它可以提供广播电视级图像质量乃至高清晰度电视的图像质量.MPEG2的提出使得目前人们在业余时间最主要的消费娱乐方式——电视,可以在数字网中传输,人们有可能通过网络来欣赏电视.对于多媒体业务来说,这是一个重要的进步.这使得多媒体业务系统真正走进人们的生活.目前,符合MPEG2标准的视频压缩编码器已形成商品化产品.