彩色描述子SIFT的研究新进展-AET-电子技术应用

彩色描述子SIFT的研究新进展

来源:微型机与应用2010年第22期

韩顺1, 陶跃华1, 朱英南2

(1. 云南师范大学信息学院, 云南昆明 650092; 2. 密苏里大学计算机科学系，美国

摘要： SIFT算法是提取图像局部特征的算法，应用于物体识别、图像匹配等领域,对于旋转、尺度缩放、亮度变化保持不变，对于视角变化、噪声等也保持一定程度的稳定不变性。为了提高光照不变性，获得更高的识别率，在SIFT特征描述子中加入颜色信息。对SIFT特征进行深入的研究，分析了SIFT算法，归纳总结了SIFT彩色描述子的研究现状，给出了彩色描述子SIFT的性能评价及其发展趋势。

关键词： SIFT算法局部特征彩色描述子性能评价

Abstract：

Key words :

    随着多媒体技术、计算机技术迅速发展，Internet上呈现大量的图像信息。图像中包含了很多的物体特性，其中颜色是非常重要的特征之一，颜色包含了图像中更多有价值的识别信息。SIFT算法提取图像局部特征，成功应用于物体识别、图像检索等领域。该算法由DAVID G.L.于1999年提出[1]，并于2004年进行了发展和完善[2]，MIKOLAJCZYK[3]对多种描述子进行实验分析，结果证实了SIFT描述子具有最强的鲁棒性。然而这些描述子仅利用图像的灰度信息，忽略了图像的彩色信息。为了提高光照不变性，获得更高的识别率，研究者提出了基于颜色不变特性的SIFT彩色描述子。目前彩色描述子主要分为基于颜色直方图、基于颜色矩、基于SIFT三类。本文对彩色SIFT描述子进行了深入的研究，阐述了彩色SIFT描述子，给出了每种彩色描述子的性能评价。
1 SIFT算法分析
    SIFT描述子对图像的局部特征进行描述，当图像进行旋转、平移、尺度缩放、仿射变换等，SIFT特征具有很好的稳定性。SIFT算法主要分为四个步骤：检测尺度空间极值点、精确定位极值点、为每个关键点指定方向参数、关键点描述子的生成。
1.1 检测尺度空间极值点
    计算SIFT描述子的第一步是搜索所有尺度和图像位置，它通过使用高斯差函数识别对尺度和方向不变的潜在兴趣点来实现。关键点就是多尺度高斯差的极大值/极小值。
    对输入的图像进行尺度变换，利用高斯核与二维图像做卷积运算：

    高斯核定义如下：

    实际计算中，是在特征点的领域内采样，创建梯度方向直方图。直方图每10度分为一柱，共36个柱。然后将领域内的每个采样点按梯度方向Φ归入适当的柱，以梯度模m作为权重。选择直方图的主峰值作为梯度的主方向，能量值达到主峰值80%以上的局部峰值作为辅助方向。
1.4 关键点描述子的生成
     以特征点为中心取8×8的采样窗口，在4×4的小块区域上计算其梯度方向直方图。绘制好每个方向梯度累加值，形成了一个种子点。每个特征点由4个种子点构成。在实际计算过程中，通常使用4×4共16个种子点来描述特征点。这样总共产生了4×4×8共128维的特征描述子向量。
2 基于彩色的SIFT研究进展
    SIFT描述子对图像的高斯梯度进行编码，该描述子在空间模式下描述了灰度图像16个种子点及每个种子点8个梯度方向。由于SIFT算法只是利用图像的灰度信息，不能很好地区分形状相似但颜色不同的物体。光照的变化很大程度上影响着彩色物体识别的效果。在物体描述与匹配中,颜色可以提供更加有用的信息，物体的颜色信息被忽略，致使一些物体会被错误地分类。在图像处理中彩色图像能够表达更多的信息，彩色信息可以获得更高的辨别率。针对这一问题，研究人员对基于彩色的SIFT特征点提取算法进行了深入的研究。
2.1 SIFT彩色描述子
    彩色描述子主要分为基于直方图、基于颜色矩和基于SIFT三类。这三类描述子的选取依据其具体的环境。彩色直方图描述子丢失了颜色的空间分布，彩色矩包含了图像局部的光度信息与颜色空间信息分布。SIFT描述子包含了颜色局部空间信息分布。为了提高光照不变性,获得更高的识别率,基于SIFT的彩色描述子得到发展,例如: HSV-SIFT、HueSIFT、opponent SIFT、WSIFT、rgSIFT和transformed Color SIFT。
    彩色SIFT描述子基于颜色不变特性。在尺度空间中，对彩色图像特征点进行检测，确定特征点的位置，在颜色空间模型下计算特征点相关种子点的颜色梯度，对每个特征点用128×3维的特征描述子进行描述。该描述子融合了特征点的颜色信息与几何信息。
   HSV-SIFT HSV颜色空间中，H表示颜色的色调，S表示颜色的纯度，即表示一种颜色中加入了多少白光，V表示颜色值的大小。该颜色空间的模型对应于圆柱坐标系中的一个圆锥形子集。BOSCH[5]计算HSV颜色空间三个通道为每个特征点生成彩色描述子。每个通道经过计算生成128维向量，这样总共生成128×3维的向量。
    HueSIFT在HSV颜色空间中，色调捕捉了颜色的主要波长，描述了图像的彩色信息。VAN de Weijer[4]采用级联色调直方图的方法应用于SIFT描述子,计算三个通道为每一关键点生成128×3维HueSIFT描述子向量。
    OpponentSIFT对立色理论认为人类视网膜上存在三种光化学物质－视素，每种视素都能发生同化和异化两种变化，在同化过程中，视素产生合成，异化过程产生分解。同化异化的发生完全是由于不同光谱组成的色光刺激的结果。而同化异化的结果使人产生相应的对立颜色感觉。即红-绿、黄-蓝、黑-白等六种不同色觉。基于对立色理论，对立色空间模型如下：

该彩色模型具有O1、O2、O3三个通道分量。O3通道包含了大部分强度信息，O1与O2通道包含了彩色信息。生成特征点描述子时，对模型中每一分量计算SIFT特征描述子，这样生成了128×3维的描述子向量，该描述子称为OpponentSIFT。
    W-SIFT在对立色空间模型中O1与O2通道分量仍然会包含一些强度信息，为使强度的变化不影响SIFT特征，GEUSEBROKE[6]提出了用于消除强度信息的方法。消除强度信息直观表示为在对立色空间模型中定义与，对O1、O2分量做除法，这样去除了强度信息变化的干扰，然后对每一分量计算生成特征描述子，该描述子称为W-SIFT。
    rgSIFT rgb空间模型是一种归一化的RGB模型，定义如下：

r与g分量描述了图像的颜色信息。由于归一化的r与g分量具有尺度不变特征，因此不受其光照强度的变化、阴影与底纹的影响。计算rgSIFT特征描述子时结合了归一化RGB彩色模型中r分量与g分量。
    Transformed color SIFT在RGB空间模型中，光照的变化对RGB直方图稳定性产生影响。光强度的变化引起颜色不规则分布，致使直方图产生偏移。为了消除偏移，在RGB模型中对于每个通道颜色的分布减掉其颜色分布的均值μ，除以该通道下分布的标准差δ。定义后的空间模型如下：

   在该模型下计算每个通道分量的SIFT描述子,对特征点进行描述，该描述子称为Transformed color SIFT。
2.2 彩色SIFT描述子的性能评价
    BURGHOUTS G J[7]在试验中对比彩色SIFT描述子与灰度SIFT描述子，当光照颜色变化与光散射时彩色SIFT描述子具有更好的性能。然而彩色空间的选择与光照的变化对彩色SIFT描述子的性能还是有一定的影响。为了得到各种彩色描述子的性能，Koea[8]在光强度变化、光强度偏移、光强度的变化与偏移、光色的变化、光色的变化与偏移等多种光照变化情况下对描述子进行实验与分析，可以得到每种彩色描述子的性能如表1所示。

   SIFT算法是多尺度空间理论提出后产生的，对图像的局部特征进行提取，SIFT描述子对于旋转、尺度缩放、仿射变换、视角的变换具有很好的稳定性。对大多数图像尺度变换、旋转、仿射变换等具有很强的不变性。基于颜色不变特性的彩色描述子不仅保留了SIFT原有特性，可以获得更高的辨别率,而且对于光照的变化也保持了很好的不变性。
    为了提高SIFT的一些能力和加快匹配速度，对标准的SIFT描述子改进的技能是：(1)在标准的SIFT上利用不同的直方图、不同区域的形状、HSV组件、使用 RGB 直方图等等； (2)利用降维方法(如主成分分析(PCA))，以减少SIFT的特征维数。
参考文献
[1]    DAVID G L. Object recognition from local scale-invarint features[C]. International Conferenceon Computer Vision, 1999:1150-1157.
[2]    DAVID G L. Distinctive image features from scale-invariant key-points[J]. International Journal of Computer Vision，2004,60(2):91-110.
[3]    MIKOLAJCZYK K, SCHMID C. A performance evaluation of local descriptors[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2005,27(10):1615-1630.
[4]    WEIJER J, GEVERS T, BAGDANOV A. Boosting color saliency in image feature detection[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2006,28(1):150-156.
[5]    BOSCH A, ZISSERMAN A, MUOZ X. Scene classification using a hybrid generative /discriminative approach[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008,30(04):712-727.
[6]   GEUSEBROEK J M, BOOMGAARD R, SMEULDERS A W M,et al. Color invariance[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001,23(12):1338-1350,
[7]   BURGHOUTS G J, GEUSEBROEK J M. Performance evaluation of local color invariants[J]. Computer Vision and Image Understanding. 2009,133:48-62.
[8]    SANDE K E A, GEVERS T, SNOEK C G M. Evaluation of color descriptors for object and scene recognition[C]. IEEE Conference on Computer Vision and Pattern Recognition,Anchorage, Alaska, USA, June 2008.

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容