杨文辉, 杨明静
(福州大学 物理与信息工程学院,福建 福州 350108)
摘要:基于手机加速度传感器的步态识别是根据人的生理特点,提取人行走时的加速度步态模式,以区分不同的个体。大多数研究是将加速器固定在同一个位置、同一个方向上,以减少传感器放置变化对识别的影响。文章比较了不同方法,包括统计学和机器学习的方法,用于减少加速器放置变化的影响。而经过滤波、特征提取等处理,使用机器学习的KStar算法分类效果最佳,准确率可达到99.11%,可消减放置变化的影响。
关键词:步态识别;加速度传感器;机器学习
0引言
基于加速度传感器的步态识别主要用于医疗和安全识别两方面。人体步态特征会因身体疾病而发生变化,步态检测有助于疾病的早期诊断[1]。在远程医疗上,智能化的步态加速度识别监测系统可以在一定程度上解决因监护人员不足特殊人群无人看护等问题[2]。人们很多信息都与手机息息相关,比如支付宝、手机银行等。很多手机只设置了开机密码或者图形密码,这些信息很容易被窃取。基于手机加速度传感器的步态识别系统,可以有效地保护手机信息的安全[3]。
当前,步态识别主要采用统计学和机器学习的方法。统计学中,通常采用动态时间归整(Dynamic Time Warping,DTW)算法[4]。NICKEL C等人把手机固定在测试者臀部的右边,用DTW算法比较训练集和测试集一个周期的最小规整路径[5],得到的相对错误率(Equal Error Rate,EER)为20%。张雨霆把加速度传感器固定放在测试者的左上臂、右手腕、左股、左大腿、右脚踝五个位置,用稀疏表示对175个人进行了识别分析,得到了95.8%的识别率[6]。DERAWI M O等人[7]把加速度传感器放在左边大腿上,用DTW等模版匹配方法得到EER为5.7%。MUAAZ M把手机固定在腰带,用机器学习中支持向量机(Support Vector Machine,SVM),对51个人进行分类测试[8],得到的EER大于36%。多数的文章没有考虑到传感器放置变化对识别的影响,HOANG T等人[9]提出用手机加速度传感器和磁力计解决此问题,将加速度传感器测量的数据转化到标准的坐标轴,以减少放置变化的影响,用SVM对38个人进行分类测试,得到98.71%的准确率。本文用HOANG提供的加速度传感器采集的数据,用统计学中DTW的方法和机器学习中IBk、KStar等方法探讨消减手机放置变化对识别的影响,得到的结果与HOANG T的方法相当,但效率相对提高,更易于实现。
1数据集
数据集是用手机HTC Nexus One的三轴加速度传感器采集的,采样频率约为27 Hz,实验人数为38人(年龄24~28岁),包括28个男士、10个女士。数据采集的过程中,人正常行走,手机放置在裤子的口袋里,每测量一次,手机改变一次放置。测量场地为水平的地板,数据为X、Y、Z轴三维数据。图1为一段采集的数据,横轴为采样点,纵轴为采样点的值,单位为m/s2。
2统计学方法
2.1典型步态周期
人正常行走的过程中动作呈规律性,左脚一步右脚一步,称为一个步态周期。本文通过查找Z轴极小值的方法进行步态周期的检测。如图2所示,两个小圆圈的距离就是一个步态周期长度。把每一次测量的数据按周期进行分割,以6个周期为一个样本,且覆盖3个步态周期。由于人在行走的过程中,每一个步态周期的时间不一样,因此每个步态周期的长度不一样。为了便于模版匹配,采用线性插值的方法,以使每个周期的采样点为40个。最后求出每个样本的典型步态周期,计算公式如式(1)所示,r(i,k)代表第k个步态周期,第i个采样点。
2.2识别结果
将X、Y、Z轴方向上的三轴数据分别经过步态检测和周期分割,提取典型的步态周期,用DTW进行模版匹配,受试者工作特征曲线(receiver operating characteristic curve,ROC)如图3所示。其中错误接收率(False Match Rate,FMR)和错误拒绝率(False NOMatch Rate,FNMR)是识别过程中的两类错误率。EER为错误接收率与错误拒绝率相等的值,即图3所示的曲线中横轴与纵轴相等的点。其中X轴方向的加速度EER为45.09%,Y轴EER为36.46%,Z轴EER为36.35%。其结果比DERAWI M O[5,7]等用DTW得到的EER大得多,识别效果较差。出现该情况的原因主要为采集数据过程中手机放置位置变化引起。为了消减此影响,本文接下来运用了机器学习的方法。
3机器学习
3.1数据预处理
由于在数据采集过程中,手机震动等因素容易引入噪声,进而影响分类结果,因而采用数字滤波器去除噪声。步态的频率主要在低频段,高频段的为噪声,一般采用低通滤波器。滑动加权平均滤波器可以达到较好的效果[10],长度设置为5。滤波器的运算表达式为式(2)所示,其中ri为滤波前信号,Ri为滤波后信号。
3.2周期分割和特征提取
运用机器学习的方法,一个类别需要较大的数据样本。如果以一个步态周期代表一个样本,提取的特征值不同,类之间差别小,分类效果较差。因此,用6个步态周期为一个样本,并且覆盖3个周期,以便于与统计学的方法比较。特征提取是以样本为单位的,分别计算X、Y、Z、M轴的特征值,其中M轴为3轴的模。特征值包括最大值、最小值、标准偏差STD、均方根RMS、能量E、步频(1 min所走的步数)L,其中t1、t2代表6个步态周期的初始时间和结束时间点,时间单位为s。ri表示样本的某个采样点,N为该样本采样点的总数量。由于同一个样本,各轴的步频特征值都一样,因此每个样本得到的特征值均为21个,各计算公式如下所示:
3.3分类识别
以软件Weka现有的多类算法,进行十折交叉验证,算法的参数均为默认值。本文列出4个效果相对较好的分类器结果,其中KStar的分类效果最好,分类准确率达到99.11%;IBk为98.89%,J48为85.58%,随机森林为98.51%。HOANG T等人[9]用SVM进行十折交叉验证,得到的分类准确率为98.71%,而本文用KStar和IBk也达到98.71%以上的分类准确率,因此基于特征提取的机器学习也可以用于消减手机放置变化带来的误差。将Weka运行的结果导出,用MATLAB求出J48、随机森林、KStar、IBk的EER。由表1所示,J48的EER为6%,效果最差;而KStar为0.017%,分类效果最好。
4结果分析
本文测试了DTW模版匹配的方法和Weka中J48、随机森林、KStar、IBk对手机放在裤子的口袋中放置变化时,步态识别的准确率。在数据采集过程中,传感器放置改变,以典型步态周期用于模版匹配,识别效果较差,低于手机固定一个位置的识别率,从而证实了传感器放置变化时,采集的数据发生较大变化。经过滤波处理、步态检测,以步态周期为基础,进行特征提取,用机器学习算法能有效地降低放置变化的影响。即使数据偏差较大,但是有些特征是不容易发生变化的。由数据提取的特征值经过机器学习的算法训练得到的分类模型准确性高,因此能减少传感器放置变化的影响。
5结论
本文用 HOANG T提供的加速度数据和机器学习、统计学的方法,研究减少手机在识别过程中放置变化带来的影响。其中KStar、IBk算法效果与 HOANG T提出的方法相当。HOANG T用手机加速度传感器和磁力计将加速度数据经过变换矩阵转换为地球坐标系上的数据,提高了传感器放置改变时步态识别的准确率。本文提出用代表性强的特征值和高效的算法KStar、IBk也可解决此问题,而且计算量相对于Hoang较小,易实现,特征值维度较小,有利于运行时间减少。本文提出的方法相对MUAAZ M[8]等把手机放置在固定的位置,实用性更强。本文方法比较简单,容易在现实生活中实现运用。
参考文献
[1] HSUY Y L, CHUNG P C, WANG W H, et al. Gait and balance analysis for patients with Alzheimer's disease using an inertialsensorbased wearable instrument[J]. IEEE Journal of Biomedical & Health Informatics, 2014, 18(6):1822 1830.
[2] TRUNG N T, MAKIHARA Y, NAGAHARA H, et al. Phase registration in a gallery improving gait authentication[C]. International Joint Conference on Biometrics. IEEE, 2011:1 7.
[3] NICKEL C, BUSCH C. Classifying accelerometer data via hidden Markov models to authenticate people by the way they walk[J]. IEEE Aerospace & Electronic Systems Magazine, 2011, 28(28):29-35.
[4] MLLER M. Information retrieval for music and motion[M]. Springer Berlin Heidelberg, 2007.
[5] NICKEL C, DERAWI M O, BOURS P, et al. Scenario test of accelerometerbased biometric gait recognition[C]. Third International Workshop on Security and Communication Networks. IEEE, 2011:15-21.
[6] ZHANG Y, PAN G, JIA K, et al. Accelerometerbased gait recognition by sparse representation of signature points with clusters[J]. IEEE Transactions on Cybernetics, 2014, 45(9):1864 1875.
[7] DERAWI M O, BOURS P, HOLIEN K. Improved cycle detection for accelerometer based gait authentication[C]. International Conference on Intelligent Information Hiding & Multimedia Signal Processing. IEEE, 2010:312 317.
[8] MUAAZ M. An analysis of different approaches to gait recognition using cell phone based accelerometers[C]. International Conference on Advances in Mobile Computing & Multimedia. ACM,2013:94 117.
[9] HOANG T, CHOI D, VO V,et al. A lightweight gait authentication on mobile phone regardless of installation error[M]. Security and Privacy Protection in Information Processing Systems. Springer Berlin Heidelberg, 2013:83 101.
[10] DERAWI M, BOURS P. Gait and activity recognition using commercial phones[J]. Computers & Security, 2013, 39(39):137 144.