《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > SVD分解和离散小波域特征值量化的安全数字语音水印算法
SVD分解和离散小波域特征值量化的安全数字语音水印算法
2015年电子技术应用第12期
戴 冬1,卫 娟1,王 磊2
1.河南机电高等专科学校 计算机科学与技术系,河南 新乡453003; 2.西南财经大学 经济信息工程学院,四川 成都610074
摘要: 针对传统数字语言水印算法鲁棒性较差、复杂度较高等问题,提出一种基于SVD分解和离散小波域特征值量化的安全水印算法。该算法以离散小波变换的特征值量化为基础,利用离散小波变换将每帧数字语音转化到小波域,再利用SVD奇异值分解计算近似系数特征值,而不是细节系数部分;最后,使用量化后的特征值嵌入水印比特位信息。实验结果表明,当量化步长和所选帧长较高时,该算法能有效抵御过滤攻击、加性高斯白噪声攻击、重采样攻击和剪切攻击,其中高斯白噪声攻击和剪切攻击的误码率几乎为0。相比其他优秀算法,该算法具有更好的鲁棒性。
中图分类号: TP391
文献标识码: A
DOI:10.16157/j.issn.0258-7998.2015.12.025

中文引用格式: 戴冬,卫娟,王磊. SVD分解和离散小波域特征值量化的安全数字语音水印算法[J].电子技术应用,2015,41(12):94-97,101.
英文引用格式: Dai Dong,Wei Juan,Wang Lei. Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain[J].Application of Electronic Technique,2015,41(12):94-97,101.
Secure digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain
Dai Dong1,Wei Juan1,Wang Lei2
1.Department of Computer Science & Technology,Henan Mechanical and Electrical Engineering College,Xinxiang 453003,China; 2.College of Economic Information Engineering,Southwestern University of Finance and Economics,Chengdu 610074,China
Abstract: As the low robustness and high complexity problem of traditional digital speech watermarking algorithm, a digital speech watermarking based on SVD decomposition and eigenvalues quantization in discrete wavelet domain is proposed. Eigenvalues quantization in discrete wavelet domain is the base of the proposed algorithm, firstly, discrete wavelet transform is used to transform every frame of the digital voice into wavelet domain; Then, SVD singular value decomposition is used to calculate the eigenvalues of approximate coefficient, rather than part of the detail coefficients; Finally, the watermark bits were embedded by quantization of the eigenvalue. The experimental results show that when quantization step size and the length of the selected frame are high, the algorithm can effectively resist filter attacks, additive white Gaussian noise attack, resampling and cropping attack, where the bit error rates of Gaussian white noise attacks and cut attacks are almost zero. Compared to other outstanding algorithms, the proposed algorithm has better robustness.
Key words : digital speech watermarking;approximate coefficient;discrete wavelet;eigenvalues quantization;SVD singular value decomposition

  

0 引言

    近年来,社会上很多企业、组织和用户通过互联网对数字媒体进行传播,数字媒体的版权保护等安全问题已成为社会关注的焦点。而数字水印是保护和监控数字媒体的最好方法之一[1]。数字水印的思想是将水印信息直接嵌入到载体,同时不影响原载体的性能和使用价值[2],在版权保护、商标隐藏和通信安全等方面应用十分广泛[3]。如何在水印信息载入到载体后,保证载入后的宿主拥有尽可能多的原属性、扩大载入容量以及对外界攻击的鲁棒性是现代水印技术主要目标[4]

    数字水印以图像水印和音频水印最为常见,本文讨论音频水印。音频水印可以分为变换域听觉屏蔽[5,6]、相位调制[7,8]和参数化建模[9,10]等主要类别。

    文献[7-8]利用一帧储存所有的水印数据。在对数谱域的倒谱系数中嵌入水印信息,仅对不可听性具有一定鲁棒性。

    参数化建模利用极点滤波器(如自回归模型)对语音信号进行建模及嵌入水印,有线性预测编码(Linear Predictive Coding,LPC)[9]或线谱对系数(Line Spectrum Pair,LSP)间接修改或量化参数[10]等算法。然而,该类算法容易受到在语音压缩期间或其后分流语音期间进行压缩攻击。

    虽然利用离散小波变换和奇异值分解技术嵌入水印[11]并不是一个新的想法,但本文相比于其他文献有其独特之处,主要创新点如下:(1)本文的水印是嵌入在离散小波变换的近似系数中,而不是离散小波变换的细节系数。研究表明,将水印嵌入近似系数鲁棒性更强;(2)本文主要讨论的语音水印是一种盲算法,即这种算法在水印提取或水印检测过程中不需要原始信号,增大了容量,提高了隐蔽性;(3)本文音频水印的量化指数调制(Quantization Index Modulation,QIM)选择简单,所需运行时间更少。

1 分解技术

    图1显示了单层离散小波变换(Discrete Wavelet Transformation,DWT)的一般过程,分别利用低通滤波器和高通滤波器将信号分解为近似系数(低频部分)和细节系数(高频部分),然后将其结果发给另一组低通滤波器和高通滤波器,作进一步分解。

wl1-t1.gif

    奇异值分解作用于对角矩阵,以最优方式将信号分解为基本态。N×N的矩阵A奇异值分解如式(1)和式(2)。矩阵S的对角线元素是矩阵A的奇异值,按照σ(i)>σ(i+1)降序排列。矩阵U和矩阵V的纵列分别是A的左奇异向量和右奇异向量。

    wl1-gs1-2.gif

    通常, 矩阵S各元素的细微变化不会改变观众对信号质量变化的感知,这个特点主要用于音频水印。因此,水印信息可以被简单添加到对角矩阵S的奇异值中,同时不会严重影响信号的感知性或可听性[11]

2 提出的数字语音水印算法

2.1 嵌入过程

    (1)将原始语音信号分成帧;

    (2)对每帧进行第一级离散小波变换,计算近似系数和细节系数;

    (3)通过近似系数使用二维矩阵公式;

    (4)对矩阵进行奇异值分解,找到右特性向量V、奇异值S和左特性向量U;

    (5)基于式(3)的每个特征值利用奇或偶调制函数嵌入水印,奇或偶调制函数能够保存原始信号的直方图,同时还能确保信号统计数据的改动较小,因为修改发生在小范围内,宿主信号失真较少;

wl1-gs3.gif

    (6)运用逆奇异值分解计算修正矩阵;

    (7)将修正矩阵转换为修正近似系数;

    (8)细节系数和近似系数进行逆小波变换,获得修正框架;

    (9)以修正框架为基础重构信号,得到有水印的语音信号。

2.2 提取过程

    (1)利用同步位寻找水印的初始位置;

    (2)将有水印的语音信号分成帧;

    (3)对每帧进行第一级离散小波变换,计算近似系数和细节系数;

    (4)通过近似系数使用二维矩阵公式;

    (5)对矩阵进行奇异值分解,找到右特征向量V、奇异值S和左特征向量U;

    (6)对每个特征值应用逆奇或逆偶调制函数,提取水印,如式(4)所示:

wl1-gs4.gif

3 实验结果与讨论

3.1 本文算法的实验结果

    本文采用模拟方法研究提出的数字语音水印的鲁棒性、隐蔽性和容量,仿真实验在Intel i5双核处理器、内存为4.0G、2.93 GHz主频、Windows7操作系统的笔记本电脑上进行,使用的平台为MATLAB2011b,实验材料为两组语音数据。wl1-t2.gif第一组采用交错正交幅度调制(SQAM)的6个信号,指数49~54,抽样频率44.1 kHz,平均时长大约22 s,分辨率16 bit。第二组采用ATCOSIM语音语料库的20个语音数据[12],抽样频率32 kHz,分辨率12 bit,平均时长3.8 s。图2所示的二值水印标志的尺寸为22×31,用于本文实验。

    表1显示了本文所提出盲数字语音水印的多种因素。分别运用式(5)的误码率(BER)、位秒(BPS)、式(6)的信噪比(SNR)来测量本文算法的鲁棒性、容量和隐蔽性:

wl1-gs5-6.gif

wl1-b1.gif式中,w是原始信号,wl1-b1-s1.gif是水印信号,wl1-b1-s2.gif是OX(XOR)运算子,N是信号长度。

    表1给出了增加容量对隐蔽性的影响。嵌入原始数据的水印越多,失真就越大,进而影响语音的隐蔽性。

    表2 给出了不同量化步长的误码率和信噪比。可以看出,量化步长越少,有水印信号的隐蔽性越强。

wl1-b2.gif

    表3给出了在不同攻击之下的误码率。可以看出,带通滤波器降低了一半的误码率,因为很多水印被嵌入低频区域。当加性高斯白噪声的信噪比增加时,误码率随之降低。

wl1-b3.gif

3.2 与其他算法的比较

    本文的对比算法与文献[5]和文献[11]算法作比较,选择的原因如下:在信号嵌入水印方面应用类似离散小波变换和奇异值分解的技术可以以相同的方式改变水印强度因子(Δ和α),且这些技术都流行且简单。设置Δ=0.2,α=0.2。

    表4从误码率和信噪比方面,对各算法的不同量化步长进行比较。可以看出,本文的平均误码率高于文献[11]和文献[5]的平均误码率,表现出了更强的鲁棒性。另外,本文算法的信噪比也高于文献[5]和文献[11],即本文算法的隐蔽性更强。

wl1-b4.gif

    表5给出了本文算法与文献[5]和文献[11]在误码率方面的鲁棒性表现,测试了5种不同情况,包括无攻击、添加高斯白噪声使信号SNR为35 dB、低通滤波使截止频率为22 kHz、随机设置嵌入水印和信号重采样然后恢复。当处于这些不同攻击下,本文算法的鲁棒性更强,这是因为水印是嵌入语音近似系数部分,该部分的能量多于语音细节系数部分的能量。

wl1-b5.gif

    图3是各算法在不同攻击下提取出来的水印标志,为了进行公平有效的比较,所有条件完全相同。可以看出,与文献[5]和文献[11]的算法相比,运用本文算法所提取出来的水印最为清晰,这也印证了表4和表5的数据结论。

wl1-t3.gif

    表6为各算法嵌入和提取水印的运行时间,可以看出本文算法明显快于其他两种算法,这是由于本文在量化特征值方面只修改了较小范围的统计数据,而且嵌入的系数部分是离散小波域的近似系数部分。而文献[5]和文献[11]均需要原始信号,水印嵌入在细节系数部分。

wl1-b6.gif

3.3 信噪比、误码率与帧长、量化步长的关系

    实验中帧长和量化步长的设置直接关系实验结果,故这节讨论信噪比、误码率与帧长、量化步长关系。

    图4给出了信噪比和帧长之间的关系,从图中可以看出,帧尺寸增大时,信噪比也会随之增加,其原因在于水印嵌入时,水印的语音信号失真较少。此外,选择较少的量化步长会提高语音信号的质量。

wl1-t4.gif

    图5给出了信噪比和量化步长之间的关系,很明显,增加量化步长会减少信噪比,信噪比的减少会降低语音信号的质量。而在量化步长非常小时,误码率并非都是零,较小的量化步长不适用于较大的帧尺寸,因为这样的量化步长无法改变特征值,会在水印提取过程中产生错误。

wl1-t5.gif

    图6给出了处于不同攻击下误码率与量化步长之间的关系。从图中可以看出,量化步长增加时,误码率会降低。因此,选择较高的量化步长会提高鲁棒性,但也会降低质量。图6还表明,选择较高的量化步长并不会提高使用低通滤波器的鲁棒性。使用低通滤波器时,小波的许多能量将会丧失,这会直接影响水印载体的特征值。

wl1-t6.gif

4 结论与展望

    本文提出了一种盲数字语音水印技术,在离散小波变换域进行特征值量化。实验表明,当量化步长和所选帧长较高时,该算法能够抵御多种攻击,鲁棒性很强,否则,水印就会减弱。而且,将水印嵌入细节系数中能够提高隐蔽性,但也会降低鲁棒性。未来工作主要研究自适应量化步长和同步技术,进一步改善水印提取过程。

参考文献

[1] PHADIKAR A.Multibit quantization index modulation:A high-rate robust data-hiding method[J].Journal of King Saud University Computer and Information Sciences,2013,25(2):163-171.

[2] 王新宇,詹永照.构造顶点分布特征的三维模型数字水印算法[J].计算机辅助设计与图形学学报,2014,26(2):272-279.

[3] 尹浩,林闯,邱锋,等.数字水印技术综述[J].计算机研究与发展,2005,42(7):1093-1099.

[4] 秦树东.音频数字水印算法的研究[D].南京:南京邮电大学,2014.

[5] 王飞.基于SVD和预测错误扩展的数字音频水印算法研究[D].长沙:湖南大学,2014.

[6] 谢斌,肖玲玲,吴君钦.一种抗剪切的DWT域多重音频数字水印算法[J].电子技术应用,2010,36(4):138-140.

[7] GOPALAN K.A unified audio and image steganography by spectrum modification[C].Industrial Technology.ICIT 2009.IEEE International Conference on.IEEE,2009:1-5.

[8] 侯剑,付永生,郭恺.基于相位调制的立体声音频数字水印[J].电子技术应用,2006,32(6):49-51.

[9] 高裴裴,朱耀庭,张世涛,等.基于数字水印载体的图像语音判读方法研究[J].激光与红外,2012,42(10):1187-1190.

[10] Nematollahi Mohammad Ali,Al-Haddad S A R.An overview of digital speech watermarking[J].Int.J.Speech Technol.2013,17(8):1-18.

[11] LEI B,SOON I Y,LI Z.A robust audio watermarking scheme based on lifting wavelet transform and singular value decomposition[M].Berlin:Digital Forensics and Watermarking,2012:1985-2001.

[12] HOFBAUER K,PETRIK S,HERING H.The ATCOSIM corpus of non-prompted clean air traffic control speech[J].Sixth International Conference on Language Resources & Evaluation Lrec,2008,24(1):2147-2152.

此内容为AET网站原创,未经授权禁止转载。