摘 要: 尺度不变特征变换(SIFT)算法具有良好的尺度、光照以及空间旋转不变性,在人机交互的环境中可以很好地识别出影像。介绍了SIFT算法和人机交互原理,并进行了实验论证。实验结果表明,该方法能较好地识别出遥感影像,并具有实时性意义。
关键词: SIFT;遥感影像;识别;人机交互
飞机在采集敌方重要地面目标影像时,会产生各种类型的影像,使得实时识别影像非常困难。通常目标影像会发生旋转、缩放、成像品质等变化。近年来,在计算机视觉领域,基于局部不变量描述符的方法在目标识别和图像配准方面取得了显著进展。2004 年,哥伦比亚大学的LOWE David G教授提出一种基于新特征点提取的尺度不变特征变换(SIFT)算法[1]。该算法较好地解决了物体发生旋转缩放、视角以及光照变化引起的图像变形等问题,并在人机交互的环境下,能实时识别地面目标。
1 SIFT算法原理
SIFT特征向量生成的实现顺序为检测尺度空间中的极值点、定位极值点的位置、确定特征点的方向、生成描述特征点的特征向量。
1.1 检测尺度空间极值点
尺度空间理论目的是模拟图像数据的多尺度特征,高斯卷积核是实现尺度变换的唯一线性核,一幅二维图像的尺度空间定义为:
式中,(x,y)是空间坐标;σ是尺度坐标,σ值越小,表征该图像被平滑得越少,相应的尺度也就越小。大尺度对应于图像的概貌特征,小尺度对应于图像的细节特征。为了有效地在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DoG Scale-space)。利用不同尺度的高斯差分核与图像卷积生成 DoG算子,其计算简单,是尺度归一化的LoG算子的近似。为了寻找尺度空间的极值点,每一个采样点要与它所有的相邻点比较,看其比它的图像域和尺度域的相邻点大或者小。如图1所示,中间的检测点与它同尺度的 8 个相邻点和上下相邻尺度对应的点(共26个点)进行比较,以确保在尺度空间和二维图像空间都检测到极值点。
1.2 特征点过滤并进行精确定位
在该过程中,精确确定关键点的位置和尺度,要同时去除低对比度的特征点和不稳定的边缘相应点,以增强匹配稳定性、提高抗噪声能力。
1.3 特征点的方向值分配
利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。首先在高斯尺度空间计算特征点的梯度模和方向公式:
其中,m是梯度模;θ是梯度方向;L是原图与高斯核的卷积,L所用的尺度为每个关键点各自所在的尺度,在实际计算时,通常以关键点为中心的领域窗口内采样,用直方图统计邻域像素的梯度方向。
1.4 生成描述特征点的特征向量
首区域上计算8个方向的梯度直方图,绘制每个梯度方向的累加值,即可形成一个种子点,因此,一共可以生成16个种子点。这样,对于每个关键点就可以产生一个长度为128的数据,即最终形成一个长度为128的 SIFT特征向量。此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响,再继续将特征向量的长度归一化,则可进一步去除光照变化的影响。这种邻域方向性信息联合的思想增强了算法的抗噪声能力,同时对含有定位误差的特征匹配也提供了较好的容错性。特征向量生成的示意图如图2所示。
2 人机交互原理
人机交互主要是利用人自身的高速、准确识别物体的能力对目标进行实时识别。其重要指标是反应时间[2]。反应时间是指人从机器或外界获得信息,经过大脑加工分析发出指令,到运动器官开始执行动作所需的时间。反应时间是从包括感觉反应时间(从信息开始刺激到感觉器官有感觉所用时间)到开始动作所用时间(信息加工、决策、发令开始执行所用时间)的总和。
由于人的生理心理因素的限制,人对刺激的反应速度是有限的。一般情况下,反应时间约为0.1 s~0.5 s,而受过特殊训练的飞行员反应时间可以在0.1 s左右。其反应时间的判别表示为:
式中,k为常数,n为等概率出现的选择对象数。
3 实验
桥梁是重要军事目标,实现对桥梁的实时打击具有重要意义。本实验的软件平台为Matlab r2009a,计算机平台为AMD 7750双核处理器(2 GB内存),选用某城市的某一桥梁(空间分辨率为10 m)进行实验。
3.1 采集图与模板图角度相同
图3为已知桥梁模板图,其像素值为26×57。图4为第一幅采集图,其像素值为200×112。图3、图4的视角高度为6 km。图5为对模板图的关键点分析。图6为对模板图的实时定位结果,其中在横坐标中,从0~26是模板图,26~226是采集图,从图6可以看出,采用SIFT算法可以将目标识别出来,并能精确定位该桥梁的位置。
3.2采集图与模板图角度不同
图7为发生旋转的采集图,其像素值为191×166,视角高度为6 km。图8为实时定位结果,其中在横坐标中,0~26是模板图,26~217是采集图。
3.3 采集图与模板图角度、视角高度都不同
图9为角度、视角高度都与模板图不同的采集图,其像素值为196×161,视角高度为6.52 km。图10是实时定位结果,其中在横坐标中,0~26是模板图,26~222是采集图。
实验关键参数如表1所示。从实验结果可知,由于检测出来的关键点较少,所以在人机交互的环境下,采用SIFT算法能实时地精确定位识别桥梁目标,定位的准确度高于以往采用二值化图像方法和提取边缘线方法来识别遥感影像目标,识别的速度高于以往的改进SIFT算法[3],并且其应用范围也比较广[4]。但是本文提出的方法同其他改进算法一样存在不足,对于天气较差时采集的影像,无法定位或识别率大大降低。如何提高特征向量的特征度,从而提高定位和识别的正确率,同时又可以保证实时性,将是下一步研究工作的重点。
参考文献
[1] LOWE D G. Distinctive image features from scale—invariant keypoints[J]. International Journal of Computer Vision,2004, 60(2):91-110.
[2] http://zhidao. baidu. com/question/109629278. html? si=8. 2010-08-29.
[3] GRABNER M, GRABNER H, BISCHOF H. Fast approximated SIFT[C]. Asian Conference on Computer Vision, Hyderabad, India, 2006: 918-927.
[4] 裴聪,戴立玲,卢章平.基于SIFT的简化算法下图像快速匹配[J].制造业自动化,2010,32(1):132-135.