摘 要:阐述了电视系统中的音频嵌入技术,音视频信号标准,嵌入格式和加解嵌在电视系统中的应用。通过使用音频嵌入技术,大大降低了电视信号的传输成本,提高了音频信号的传输质量,解决了音视频信号传输中不同步的问题,实现了音视频无损耗传输,提高了电视节目的质量。
0 引言:
随着电视事业的飞速发展,数字电视技术也得到了突飞猛进的发展。在电视信号模数转换和传输的过程中,视频信号和音频信号的处理方式和特点有着明显的差异,导致数字视频滞后于数字音频。表现为国家和声音不同步。
音频嵌入技术使以往必须分开传送的音频和视频信号可合并在一根视频电缆中传输,从而大大简化了演播室中音视频互联所需的硬件开销和音视频信号的路由策略,并可实现音频和视频的同步传输与播放。
本文以SMPTE 259M标准定义的SD I ( Serial DIGItal In2ter—face)信号作为数字视频标准,其最大优点就是提供了大量的辅助数据区(An—cillary Data Space) ,可以用来嵌入音频信号以及其他有用信号。现有视频格式的辅助数据区可容纳最多16个通道的音频数据,足以满足当前电视系统的绝大多数需要。
1 数字音视频标准:
1. 1 AES/EBU数字音频信号:
AES/EBU标准的串行数字音频信号可以传输2个通道( channel)的音频数据, 2个通道既可以是来自同一声音源的立体声信号,也可以是完全不同的两路单音频信号。AES/EBU音频信号的最小传输单位是长度为64 bit 的帧( flame) ,每帧数据包含2个32 bit的子帧,对应于2个通道音频的各1个采样。每个子帧都由4 bit前导码、4 bit辅助数据、20 bit音频数据和4 bit其他数据组成,依照标准能够支持48 kHz, 44. 1 kHz, 32 kHz 3种采样率以及16~24 bit的采样字长。子帧格式见图1。
图1 AES/EBU串行音频的帧格式
在1个子帧中, 4 bit的辅助数据用于容纳音频采样字中超出20 bit的部分。当音频字长为21~24 bit时,第4 bit是最低有效位。当20 bit的编码字长足够使用时, 8~27 bit为取样码, 4~7 bit是辅助取样位。V,U, C, P分别为有效位、用户数据位、信道状态位和奇偶校验位。
在连续的AES/EBU串行音频数据流中,音频帧被进一步组织为192帧的数据包,数据包的第1帧中第1个子帧的前导码为Z,其余所有的子帧l和子帧2的前导码分别为X和Y。1个数据包中2个音频通道的信道状态位分别被组装成192 bit的数据组,这一数据组给出了诸如音频取样字长、取样频率之类与音频信号有关的重要信息,并指出了用户数据位的格式信息。
1. 2 分量视频信号:
625一line标准的数字分量视频信号格式如图2a所示。
一帧图像共有625 行, 每行有1 728 个10 bit的数据字(word) 。1~312行为第1场, 313~625行为第2场。其中奇数场的第5 行和偶数场的第318 行保留用作检错处理( ErrorDetecTION and Handlin9, EDH) ,奇数场的第6行和偶数场的第319行保留用作垂直间隔切换点(VerticalIntervalSwitching Point) ,除此之外的总共621行的辅助数据空间全部可以用来嵌入音频数据。
分量视频行的数据格式如图2b所示,一行视频由1 728word组成,前288 word是数字行消隐区,后1 440word是数字有效行数据区。其中行消隐区的开头和结尾各有4 word的时序参考信号(Timing Reference Signal, TRS) ,分别为EAV(End of ActiveVideo)和SAV ( STartof Active Video) 。嵌入的音频数据放置在每行视频行消隐区的EAV和SAV之间,并且必须紧接着EAV放置”。
1. 3 辅助数据空间:
分量视频信号的辅助数据包格式如图3所示。前3个数据字是同步头。视频信号中全0和全1的数据字是专门预留给同步标志使用的,故接收端通过这一包头能可靠识别出嵌入在视频中的音频数据。其后的D ID (Data ID)定义了辅助数据包的特定类型,接收端根据D ID可对用户数据进行正确解读。DBN (Data Block Number)是一个实现连续性指示的计数器,对于所有D ID编号相同的辅助数据包,DBN依次加1,实现连续计数,以使接收端可以判断数据是否有中断。DC (Data Count)给出了其后的用户数据个数,最后是从D ID到用户数据结尾的校验和,接收端通过校验和可判断接收到的数据包中是否含有错误。
1. 4 音频嵌入格式:
AES/EBU数字信号按照一定格式进行打包,填充进视频行消隐区即可实现音频嵌入。依据标准规定,可以嵌入的音频最少2路,最多16路。嵌入到视频数据中的音频包有3种:音频控制包、音频数据包((AudioControl Packet, ACP) Audio Data Packet, ADP) 和扩展数据包( Extended DataPacket, EDP) 。它们应该尽量均匀地嵌入视频信号中,以减小系统中的buffer所占用的资源。
音频控制包格式如图4a所示。待嵌入的音频每4路为1个音频组,每个音频组都拥有自己独立的一个控制包。控制包在每场视频切换点(Video Switching Point)后面的视频行中传输一次,它包含了采样率、音频声道有效性指示、音频处理延时等信息。控制包在辅助数据空间中的位置必须先于其他任何音频包。
音频数据包(图4b)携带的是有效音频信号,每一个AES/EBU音频子帧中的20 bit音频取样码和V,U, C 3个位通过一定的格式,映射为数据包中连续的3 word。将来自2个音频对的4个子帧的音频数据按顺序排列,数据包就可以承载多达4路AES/EBU音频信号的1个或多个采样。
当音频采样字长超过20 bit时,音频子帧中的4 bit辅助数据被打包进扩展数据包(图4c) ,每2个子帧的共8位辅助数据拼成扩展包中的一个有效word。
音频数据包和扩展包必须放在每行视频中紧接在EAV之后的位置上。扩展包必须和相关的音频数据包放置在同一辅助数据区中,并且紧接在音频数据包后面。
2 结束语:
通过音频嵌入技术在电视节目录制和播出中的应用,实现了音视频无损耗传输,提高了音频信号的传输质量,解决了音视频信号传输中不同步的问题,大大降低了电视信号的传输成本,提高了电视节目的质量。