基于加窗光谱积分的高光谱遥感图像特征提取
2009-08-21
作者:邹 强1,冯 静2,王 宇
摘 要: 提出了一种基于加窗光谱积分的高光谱遥感图像特征提取算法。该算法借用子波变换多分辨率分析的思想,设计了一组波段相互重叠的窗函数来提取光谱曲线特征,然后进行有监督RBF神经网络分类实验,在实验过程中确定了相关参数的取值范围。实验结果表明,加窗光谱积分特征可以有效地描述光谱曲线,获得了比较好的正确分类率。
关键词: 高光谱遥感;光谱积分;特征提取
高光谱遥感技术是20世纪80年代以来在对地观测方面取得的重大技术突破。高光谱图像处理是目前遥感图像领域的热门研究内容之一。高光谱图像光谱覆盖范围广、光谱分辨力高、波段连续性强,可揭示单一波段或者多谱段图像所不能反映的地物信息。但是高光谱图像的数据量大,相邻波段之间具有较高的相关性、数据存在大量冗余,传统针对低维宽波段的遥感图像处理算法不再适用。因此,研究针对高光谱图像的快速而有效的特征提取算法成为高光谱图像分析与处理的首要问题。
光谱特征提取就是从已测得的某物质的原始光谱数据中,除去多余的信息而保留真实的、有用的、能区别于其他物质的特征信息。针对高光谱数据的特点,人们相继提出了一些特征提取算法,如主成分分析(K-L变换)[1]、判别边界法[2]、小波变换法[3]等。本文采用光谱曲线的参量化技术,提出了一种加窗光谱积分的高光谱遥感图像特征提取算法。该算法借用子波变换多分辨率分析的思想,设计了一组波段相互重叠的窗函数来提取光谱曲线特征。实验结果表明本文提出方法的有效性。
1 光谱曲线及其参量化
为了直观地表达图像上某一像元的光谱特征,本文引入二维光谱曲线。如果用直角坐标表示光谱数据,其横轴表示波段数,纵轴表示反射率,如图1所示。
图1给出了某一地物类型128个波段的光谱曲线,地物类型不同,各波段反射率也不同,因此,光谱曲线代表了高光谱遥感图像最本质的特征。
光谱曲线的特征提取是一个降维过程,它建立在各个光谱波段间的重新组合和优化的基础上。在经过特征提取后的光谱特征空间中,新的光谱特征矢量应该能够反映特定地物类型的光谱参量。本文采用光谱曲线的参量化技术对光谱曲线进行特征提取。常用的光谱曲线参量化技术有:光谱斜率和坡向指数、光谱吸收指数、光谱二值编码、光谱微分以及光谱积分等[4]。
光谱积分就是求光谱曲线在某一波长范围内的下覆面积,计算公式如下:
式中,p(f)为光谱曲线,[fi1,fi2]为第i个特征分量积分范围。因此,利用光谱积分进行特征提取首先要解决的问题是光谱的波段分割,即确定n个特征分量的积分范围[fi1,fi2]。波段分割方式直接影响到特征矢量的可分性。实践中,一种想当然的做法是均匀地、首尾相接地分割整个波段范围,然而这样做并不能得到最佳特征矢量。本文在光谱积分的基础上,提出了一种加窗光谱积分的高光谱遥感图像特征提取算法。它对光谱曲线p(f)乘以1个窗函数wi(f),然后再做积分处理,得到第i个特征分量:
因此,这里将积分范围[fi1,fi2]选择转化为窗函数wi(f)的选择。
2 加窗光谱积分特征提取
2.1 波段选择
由于高光谱图像的每个波段图像的像素值是相同区域地物对各个波段光的反射强度值,相邻波段地物反射率是相近的,由此产生了一定的相关性。设gk(x,y)代表第k个波段空间坐标为(x,y)的像素灰度值,定义第k波段与第k+1个波段的相关系数为ρk,则:
由于天气的原因以及测量过程中会在一些波段引入噪声,噪声可以在一定程度上破坏相邻波段的相关性。由此,本文定义第k波段与前后相邻波段相关系数的均值rk作为指标进行波段选择,以去除噪声波段:
如图2所示,图中横线为rk的均值,曲线k~rk在k等于65、73、96时得到局部极小点,说明这3个波段是受噪声影响最严重的3个波段。图3是第65波段的图像,可以看出,该波段图像基本上是由噪声组成,第73和第96波段也是如此,(为节省篇幅这里不予显示)。本文以rk的均值为门限,保留rk大于其均值(图2中位于横线上部)的那些波段,一共96个波段,用于特征提取。
2.2 窗函数设计
如图1所示的二维光谱曲线,本质上是能量对频率的函数。不同波段对应了地物对不同发射频率电磁波的响应。借用子波变换多分辨率分析的思想,本文设计1组波段相互重叠的窗函数来提取光谱曲线特征。
设中心频率在0的窗函数为:
以能量的3 dB衰减来定义w(f)的宽度b,当能量衰减到
窗函数在3 dB衰减处首尾相接,且能够实现动态地、非均匀连续地划分频域,其中q为第i+1个窗函数与第i个窗函数宽度之比。图4(a)、(b)、(c)是n=5、带宽比q依次等于1、1.5、2时的窗函数曲线,图中已经将窗函数的横坐标f转换成波段序号,序号范围为1~96。
由图4可以看出,随着n和q的变化,实现了分析波段的非线性划分。在实际特征提取过程中,总存在1个n与q的最佳组合,使得特征矢量具有比较好的类别可分性。
3 分类实验
实验数据来源于中科院上海技术物理研究所研制的OMIS成像光谱仪获取的江苏太湖沿岸的高光谱图像。光谱覆盖范围为0.46~12.85 μm,共128个波段,图像大小为512×512,选取三类地物类型:水体、道路或建筑物、植被。
为做定量分析,对三类地物类型每一类取500个样本点,共计1 500个样本。在所有样本中,等间隔地抽取的样本作为训练样本,其余作为测试样本,然后用RBF神经网络进行有监督分类实验。表1是参数n=5、q=1、1.5、2时的三类地物类型的正确识别率;表2是参数q=1.5,n=5、10、15时的地物类型的正确识别率。
从表1、表2的结果可以看出,水体的识别率最高,植被的识别率最低。这是因为,水体的光谱曲线相对比较稳定,而植被样本的类间距离相对较大。表1中,当固定参数n=5,q取1.5时,3种地物类型的识别率均高于q等于1、2的情况,说明q的最优取值介于1~2之间。表2中,当固定参数q=1.5,增大n值,3种地物类型的识别率略有提高,但n值增大,增加了分类器的复杂度,因此从实践的角度考虑,n的合适取值应该在5~10之间。
本文提出了一种基于加窗光谱积分的高光谱遥感图像特征提取算法。该算法借用子波变换多分辨率分析的思想,设计了一组波段相互重叠的窗函数来提取光谱曲线特征;然后进行有监督RBF神经网络分类实验,在实验过程中确定了相关参数的取值范围。实验结果表明,本文提出的加窗光谱积分特征可以有效地描述光谱曲线,获得了比较好的正确分类率。
参考文献
[1] WANG Cheng, MENENTI M, LI Zhao Liang. Modified principal component analysis for feature selection of hyperspectral imagery[J]. IEEE International, 2003(6):3781-3783.
[2] BENEDIKTSSON J A, SVEINSSON J R, KOLBEINN A. Classification and feature extraction of AVIRIS data[J]. IEEE Transaction on Geoscience and Remote Sensing,1995,33(5):1194-1205.
[3] LI Jiang. Liner unmixing of hyperspectral signals via wavelet feature extraction[D]. Ph D Thesis and Mississippi State University, 2002.
[4] 重庆禧,张兵,郑兰芬.高光谱遥感的多学科应用[M]. 北京:电子工业出版社,2006.