《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 设计应用 > 基于稀疏编码的人脸识别算法
基于稀疏编码的人脸识别算法
来源:微型机与应用2012年第22期
徐东勋, 李 超, 袁昌斌
(中国海洋大学 信息科学与工程学院, 山东 青岛 266100)
摘要: 介绍了一种基于稀疏编码的人脸识别算法。先对10副自然图像应用稀疏编码,学习到基函数和图像稀疏表示的拟合分布的参数。在人脸识别中,用稀疏编码和已得到的基函数表示图像的稀疏,再经过拟合分布函数得到人脸图像的最终表示,然后应用多分类线性支持向量机(SVM)来完成识别算法。通过在人脸数据库上的实验表明,该算法具有很高的识别正确率。
Abstract:
Key words :

摘   要: 介绍了一种基于稀疏编码人脸识别算法。先对10副自然图像应用稀疏编码,学习到基函数和图像稀疏表示的拟合分布的参数。在人脸识别中,用稀疏编码和已得到的基函数表示图像的稀疏,再经过拟合分布函数得到人脸图像的最终表示,然后应用多分类线性支持向量机(SVM)来完成识别算法。通过在人脸数据库上的实验表明,该算法具有很高的识别正确率。
关键词: 人脸识别;稀疏编码;多类线性SVM;循环ICA

    人脸识别是生物特征识别的重要组成部分,相对于其他的生物特征识别技术,人脸识别具有操作简单、结果直观、隐蔽性好等优点。从100年多前被提出来后,人脸识别的研究热度一直没有降低。随着互联网等信息技术的发展,安全识别变得更加重要,人脸识别的应用面也逐渐扩大,在商业、安全以及司法等行业内都有非常广泛的应用。人脸识别就是通过计算机完成人脸智能判别任务。图像识别是人脸识别的主要方法。
    由于自然条件下不同光照条件、拍摄角度、人脸表情等因素的影响,人脸图像有较强的不稳定性。找到对这些不利因素不敏感而又能有效鉴别特征的算法是提高识别性能的关键。主成分分析(PCA)是目前应用最多的人脸识别方法。但是PCA方法只考虑了图像的二阶统计信息,没有考虑更高阶的信息。基于稀疏编码的人脸识别则可以得到更高阶的信息,但目前的稀疏编码的识别算法中基函数的学习大多依赖于人脸数据库,基函数会随着识别任务不同而需要重新学习得到[1]。
    Shan[2]探索了一种模拟人类视觉过程的循环ICA(独立成分分析)算法。提出通过对自然图像的应用循环ICA学习,得到一种通用的视觉特征,这种视觉特征能应用在视觉的所有识别任务中。
    本文基于稀疏编码学习到的通用视觉特征,把学习到的通用视觉特征应用到基于稀疏编码的人脸识别任务中,通过对两种通用人脸数据库的实验,均得到了较高的识别正确率。


2.3估计a的累积分布函数
    使用参考文献[2]提到的累积分布函数方法,可以将图像稀疏表示ai的密集区域拉开距离以便于识别,而非密集的区域则改变不大。得到累积分布函数的方法是使用拟合的方式:首先计算得到所有2 430 490提取图像子

 


情和位置也有一定程度的变化。本文选择直接从参考文献[5]的主页下载已经手动剪切和处理过的64×64大小的图像。
    (1)用Matlab 中的imresize函数把所有人脸图像缩小为32×32。使用2.1节中的白化滤波器白化每个图像,接着标准化每副图像成零平均值和单位方差。对每副图像提取所有的625个8×8大小的图像子块。
    (2) 利用从自然图像已学习到的基函数D,应用稀疏编码的求解过程的式(1)得到每个图像子块的最可能的稀疏表示ai。
     (3) 对ai的每一维应用非线性激励函数Gi。当a的维数是64时,现在每个人脸图像被一个625×64=40 000维向量表示。
    延续参考文献[5]中的方法,随机地将图像分成训练和测试样本集,每次试验时从每个人的图像中随机选取M=2,3,…8个图像作为训练图像,剩余的作为测试图像。对应每个M,选择测试50个随机队列,最后的识别率是所有队列的平均识别率。
  当训练样本和测试样本选定后,每副图像由40 000维的向量表示,维数太高对识别的计算时间和准确度都有很大影响,接着选择使用PCA来降低它的维数。主成分数目的选择要使95%的方差被捕获。例如,当M从2~8时,主成分的数目为27~105。接着使用映射的PCA矩阵来得到训练样本和测试样本。
    (4)在分类器的选择上,选用支持向量机SVM,考虑到非线性SVM的随维数增加计算时间指数级地增长,而选用线性SVM。采用的参考文献[4]中用到的多类识别的线性SVM,其中的λ设置为0.01。
    表1列出了在测试图像上识别效果,随着训练图像数目的增加,图像的识别率逐渐增高,使用参考文献[5]在其主页最新更新的结果作为对比,得到的识别效果要明显地优于参考文献[5]的结果。即使是其最近更新的结果依旧不如本文的识别率高。

3.2 在ORL脸部数据库上的实验
    ORL数据库总共包含400个脸部图像,分属40个人,每人10副。这些图像拍摄在不同的时间、光照条件、脸部表情下,如图4所示。如Yale人脸识别的实验一样,从参考文献[5]作者的主页下载已手动对齐和切割的64×64大小的图像,接着用imresize函数缩小成32×32图像。具体的实验步骤与测试Yale数据库时一样。从每个人的图像中随机挑选M=2,3…….8个图像作为训练图像,剩余作为测试。平均识别正确率如表2所示,本文依然选择参考文献[5]和其主页最近更新的识别率作为比较。

    本文算法在ORL人脸数据库的表现也是随着训练样本数目的增加而增加,并且维数越大越接近参考文献[5]的结果,如维数为7或8时,得到的结果几乎没有差距。
    根据参考文献[2]中的通用视觉特征理论,利用稀疏编码从自然图像中学习到基函数和稀疏系数的累积分布函数参数,并利用稀疏编码应用到人脸识别中。通过选用两种通用的人脸数据库进行测试,均得到了比较高的识别率。并与别人的结果进行了对比。算法还有很多可以改进的地方:如分类器的其他选择、预处理方法的改进等。
参考文献
[1] 杨荣根,任明武,杨静宇. 基于稀疏表示的人脸识别方法[J].计算机科学,2010,37(9):267-269.
[2] SHAN H H, ZHANG L Y, COTTRELL G W. Recursive ICA[C]. In Advances in Neural Information Processing Systems, 2007:1273-1280.
[3] OLSHAUSEN B A, FIELD D J. Emergence of simple-cell receptive field properties by earning a sparse
code for natural images[J].Nature,1996(381): 607-609.
[4] YANG J, YU K, GONG Y, et al. Linear spatial pyramid matching using sparse coding for image classification[C]. IEEE Confenece on CVPR, 2009:1794-1801.
[5] CAI D, HE X F, HE Y X, et al. Learning  a spatially smooth subspace for face recognition[C]. IEEE
Confenece on CVPR, 2007:1-7.

此内容为AET网站原创,未经授权禁止转载。