冯亮
(浙江师范大学 数理与信息工程学院,浙江 金华 321004)
摘要:结合深度学习相关理论,提出了海杂波背景下小目标检测的深度信念网络方法。该方法以无标签数据逐层进行非监督贪婪训练,使每层得到一个合适的初始值;构建深度信念网络初步模型,并以带标签的数据对该种模型以误差反向算法对整个网络的参数进行调优,建立预测模型;最后利用该种预测模型检测湮没在海杂波背景下的小目标信号。以加拿大McMaster实测的IPIX雷达数据进行实验,利用均方根误差评价性能。实验结果表明,针对第54#海杂波数据,文章提出的深度信念网络方法所预测的均方根误差为0.016,与已有的选择性支持向量机集成方法均方根误差0.026 4和K均值有效极限学习机所得的均方根误差0.042 8相比,预测精度有所提高。
关键词:深度信念网络;海杂波;小目标检测
中图分类号:TP393.1文献标识码:ADOI: 10.19358/j.issn.1674-7720.2017.07.016
引用格式:冯亮.海杂波背景下小目标检测的深度信念网络方法[J].微型机与应用,2017,36(7):53-55,66.
0引言
海杂波[1]通常是指海洋表面的雷达后向散射回波,具有混沌特性[2],利用该特性能有效检测雷达回波是否含有目标信号。海杂波背景下小目标检测对提高海面监测水平有重大意义。1995年,Haykin和Li[3]结合混沌背景的先验知识,利用神经网络构建了非线性预测模型,从预测误差中检测到了目标信号;2003年,LopezRisueno等[4]提出了一种基于卷积神经网络的高复杂度和非平稳杂波环境下的目标检测算法;2008年,CarreteroMoya等[5]提出了一种海杂波背景下基于radon变换的小目标检测方法。在国内,文献[6]基于经验模态分解理论, 提出了一种基于粒子群算法的支持向量机预测方法,从海杂波中检测出具有谐波特性的微弱信号;文献[7]提出了一种基于分形布朗运动模型的S波段雷达海杂波分形维数提取方法;文献[8]基于在复杂混沌噪声背景中快速准确提取有用信号,提出基于复杂非线性系统相空间重构理论,采用改进极限学习机(ELM)预测单步误差检测微弱信号的方法;文献[9]基于复杂非线性系统相空间重构理论, 提出了一种混沌背景中微弱信号检测的选择性支持向量机集成的方法。
1深度信念网络原理
深度信念网络(Deep Belief Nets,DBN)[10]是2006年Hinton提出的一种由多层受限玻尔茨曼机(Restricted Boltzmann Machine,RBM)单元概率生成模型,其参数通过预训练和微调训练两个过程来确定。DBN由多个RBM堆叠而成,两层RBM组成的DBN模型结构如图1所示。
DBN中的RBM是一种由可视层v和隐含层h两部分神经元构成的神经网络,每层有若干节点,层内的节点之间没有连接,v与h之间的权值生成采用非监督贪婪逐层方法。RBM在训练过程中,可视单元向量值映射给隐层单元,然后隐层单元重构可视单元,重构后的可视单元再次映射给隐层单元,继而获得新的隐层单元。假设v有n个可视单元,h有m个隐层单元,则v和h的联合组态能量函数定义为:
其中,vi表示第i个可视单元的状态,hj表示第j个隐层单元的状态;θ=(wij,ai,bj)是RBM模型中的3个参数:wij表示可视层节点i与隐含层节点j之间的连接权重,ai表示可视单元i的偏置,bj表示隐层单元j的偏置。基于能量函数,可以得到(v,h)的联合概率分布:
其中,RBM的分配函数为Z(θ)=∑v,he-E(v,h|θ),条件概率分布为:
其中,σ(x)=11+exp(-x)为Sigmoid激活函数。
RBM训练的目的在于求出参数θ=(w,a,b)的值,以此来拟合给定的训练数据。假设样本数目为T,参数θ可以通过最大化参数似然函数得到,即:
采用Hinton提出的对比散度(Contrastive Divergence,CD)算法,可求得各参数的更新准则:
Δwij=η(〈vihj〉data-〈vihj〉recon)(6)
Δai=η(〈vi〉data-〈vi〉recon)(7)
Δbj=η(〈hj〉data-〈hj〉recon)(8)
其中,η为预训练的学习率,〈·〉data为训练数据集所定义的分布上的数学期望,〈·〉rencon为重构后模型所定义的分布上的期望。
训练RBM的CD算法步骤如下:
(1)初始化可视层单元,可视单元数为n,隐层单元数为m。令v0=x0,w、a、b为服从高斯分布的随机较小数值,学习率为η,设最大迭代次数为K。
(2)计算P(h0j=1|v0)=σ(bj+∑ni=1v0iwij),从条件分布P(h0j|v0)中提取h0~P(h0|v0),其中,σ(x)为Sigmoid激活函数。
(3)计算P(v1i=1|h0)=σ(ai+∑mi=1h0jwij),从条件分布P(v1i|h0)中提取v1~P(v1|h0)。
(4)计算P(h1j=1|v0)=σ(bj+∑ni=1v1iwij)所有隐层单元。
(5)按如下规则更新参数:
w←w+η(P(h0=1|v0)vT0-P(h1=1|v1)vT1)
a←a+η(v0-v1)
b←b+η(P(h0=1|v0)-P(h1=1|v1))
(6)重复步骤(2)~(5),直到达到最大迭代次数K,该层RBM训练完成。
非监督的预训练完成之后,每层RBM可以调整到一个合适的初始值,然后通过自底向上组合多个RBM,可以构建一个DBN初步框架,接下来利用BP算法对整个网络有监督地进行调优,进一步优化网络各层的参数,使网络性能更优。
值得注意的是,在DBN的调优过程中,利用RBM的权值初始化BP神经网络各层的权值,而不像传统神经网络随机初始化。
总之,DBN的建立过程可简单地归纳为两步:
(1)非监督贪婪逐层训练:基于对比散度CD算法,依据求得的参数更新准则,依照能量最小逐层训练每个RBM,获取可视层与隐含层之间的连接权值。
(2)有监督微调:基于第一步RBM训练之后,DBN模型利用带标签的数据误差反向传播算法(BP)对整个网络的参数进行调优。
2DBN小目标检测
为了验证本文提出的DBN检测方法的有效性,对海杂波数据进行建模预测,研究DBN模在海杂波背景下小目标检测的精度,利用均方根误差作为评价指标。
本文采用的海杂波数据是加拿大McMaster大学的IPIX雷达实测海杂波数据。该雷达发射频率为9.39 GHz,天线高度30 m,极化方式分为HH、VV、HV 和VH,每个回波数据包含131 072个采样点,共包含16个距离单元,天线增益为45.7 dB。本文采用的是雷达数据集的第17#及54#海杂波数据。其中分别选取17#海杂波的第一距离单元(不含目标)和第九距离单元(含目标),数据采样VV极化方式的2 500个点,前1 700个采样点作为训练样本,后800个作为验证集。同样,分别选取54#海杂波的第一距离单元(不含目标)和第八距离单元(含目标),数据采样VV极化方式的2 500个点,前1 700个采样点作为训练样本,后800个作为验证集。程序在MATLAB2012b版本上运行。erri为预测值与实际值的偏差,均方根误差作为评价指标:
设置RBM训练最大迭代次数为1 000,BP微调时最大迭代次数也为1 000,DBN隐层数量(即RBM层数)为单层,隐层的神经元数量(即隐层节点)为20。建立DBN模型,用DBN进行单步预测,经计算17#第一距离单元的RMSE为0.012 4,第九距离单元RMSE为0.022 1。如图2所示。比较图2(b)和(c),第九距离单元(含目标)的预测误差中存在明显尖峰,而第一距离单元(不含目标)的预测误差则相对光滑。则可以证明DBN模型能检测湮没在海杂波背景下的小目标信号。
同理,选取54#海杂波的第一距离单元和第八距离单元数据再次进行验证,得到第一距离单元的RMSE为0.012 4,第八距离单元的RMSE为0.025 9,如图3所示。且从图3(b)中可直观地发现预测误差出现明显峰值。两组数据实验,将目标信号与不含目标信号的距离单元进行对比,都能从图中看出预测误差出现明显的峰值,这说明DBN模型能够有效地检测出湮没在海杂波中的小目标信号。
上述实验RBM层数为单层,隐层节点为20,接下来讨论RBM层数和隐层节点对检测结果的影响,RMSE均方根误差作为评价指标。从表1可以看出,当RBM层数逐步增加时,DBN模型的预测精度逐步减小;当隐层节点为20,隐层数量为1层时,17#数据集和54#数据集的预测精度最高,即更容易在海杂波背景中检测出目标信号;而DBN模型在RBM层数多于2层时,其预测误差的精度则大大降低。
较之传统神经网络方法,DBN模型预测方法克服了传统BP算法需要大量含标签的训练集样本、收敛速度慢、容易陷入局部最优等缺陷,DBN模型能检测出湮没在海杂波背景下的小目标信号。与文献[8]中所提到的有效K均值有效极限学习机所得的RMSE相比,其选取的第54#的第八距离单元的RMSE为0.042 8,本文所提出的DBN方法所得结果优于该方法,均能有效地提高预测的精度;与文献[9]中所提到的选择性支持向量机集成的方法相比,其54#的第八距离单元的RMSE为0.026 4,本文所提出的DBN方法预测的RMSE相差不大。
3结论
本文利用海杂波的混沌特性,结合深度学习相关理论,提出了在海杂波背景下的小目标检测方法,用DBN模型检测出湮没在海杂波背景下的小目标信号。在海杂波背景下,DBN模型能有效地检测到小目标信号,与文献[8]、[9]所述方法相比,DBN模型的检测效果更好,有更低的预测误差。
参考文献
[1] 行鸿彦, 朱清清, 徐伟. 一种混沌海杂波背景下的微弱信号检测方法[J]. 物理学报, 2014, 63(10):41-47.
[2] 朱艳平. 各种混沌系统性能比较研究[J]. 微型机与应用, 2016, 35(12):46.
[3] HAYKIN S, LI X B. Detection of signals in chaos[J]. Proceedings of the IEEE, 1995, 83(1):95-122.
[4] LOPEZRISUENO G, GRAJAL J, DIAZOLIVER R. Target detection in sea clutter using convolutional neural networks[C]. Proceedings of the Radar Conference, 2003. IEEE, 2003:321-328.
[5] CARRETEROMOYA J, GISMEROMENOYO J, ASENSIOLOPEZ A, et al. Smalltarget detection in sea clutter based on the radon transform[C]. International Conference on Radar, 2008:610-615.
[6] 行鸿彦, 张强, 徐伟. 混沌海杂波背景下的微弱信号检测混合算法[J]. 物理学报, 2015,64(4):48-54.
[7] 姜斌, 王宏强, 黎湘,等. 海杂波背景下的目标检测新方法[J]. 物理学报, 2006, 55(8):3985-3991.
[8] 商庆健, 张金敏, 王厅长. 基于有效K均值有效极限学习机的混沌海杂波背景中微弱信号检测[J]. 计算机应用, 2015, 35(3):896-900.
[9] 行鸿彦, 祁峥东, 徐伟. 基于选择性支持向量机集成的海杂波背景中的微弱信号检测[J]. 物理学报, 2012, 61(24):82-87.
[10] HINTON G E, OSINDERO S, TEH Y W. A fast learning algorithm for deep belief nets.[J]. Neural Computation, 2006, 18(7):1527-1554.