摘 要: EPIC ECG穿戴装置是一种基于新型电势测量元件的非接触电机的穿戴心电获取装置。首先提出了穿戴式心电获取装置整体架构;其次基于心拍的数值表征参数和形态,在已有的支持向量机算法对心电信号进行预测分类的基础上,重点研究如何利用专家库和轮廓模式识别结合的综合特征向量提取方法对分类准确度进行改进;最后利用MIT-BIH数据库数据进行了实验验证。实验结果表明,综合特征向量的应用提高了SVM的分类准确度。
0 引言
心血管疾病是导致人类死亡的主要病种。ECG的实时采集和自动识别,将大幅提高预防突发性心脏疾病与早期发现的能力。Plessey公司的电势集成电路(Electric Potential Integrated Circuit,EPIC)传感器采用电容耦合技术,电极可不与皮肤接触,隔着绝缘织物仍可采集到心电信号[1]。本文旨在研究一种用于ECG穿戴装置中的分类预测算法并进行优化,提高实时预警能力。
1 EPIC装置实时心脏疾病预警方案
1.1 EPIC ECG系统
基于EPIC的穿戴系统与人体的连接如图1所示[1]。现有的ECG实时采集设备(如Holter等)仍需将采集的心电信号送给医学专业人员进行分析,不具备自动分析和实时预警功能。
1.2 实时预警系统实现架构
EPIC的穿戴系统主要包括ECG获取子系统和后端的支持向量机(Support Vector Machine,SVM)的模式识别分类子系统,如图2所示。
该系统可将获取的ECG心电信号数字化以后利用现代通信手段输出到个人计算机平台或移动终端显示并存储。利用SVM算法,计算机或移动终端可对获取自EPIC传感器并预处理完毕后的心电信号进行实时分析预警。
2 心拍与ECG数据库的建立
完整的心电图由基本单位心拍构成。一个完整的心拍由不同特征的波形组成,各个波形按照次序依次发生,如图3所示。
心电图还包含在诊断中提供重要信息的形态特征[2]。本文初始化数据库用到的数据主要取样自MIT-BIH数据库。用MATLAB读取该数据库数据,选取表1所示的4种心电图数据,4种心电图数据的典型形态如图4所示。
3 ECG特征向量提取
3.1 基于专家库的特征提取方法介绍
医生在诊断过程中以心拍特征为基础。心电图属于典型的图形信息,本文列出几类医生关注的心电图信息类别:数值特征,即时间特征与振幅特征,如PR间期、Q波振幅等;病人信息,如性别、年龄;形态特征,如QRS图像和ST图像特征等。
振幅特征、时间特征及病人信息容易表达及测量,整理其信号特征如表2所示。
分类时,利用上述13组实际值首先进行归一化,然后作为SVM的输入向量,进行分类识别。
3.2 基于轮廓的特征向量提取方法
根据要获得的目标形态区域,即QRS形态、RT间期波形态、PR间期波形态,按图5所示流程计算得到图像,使用8连接邻域寻找心拍图像的心拍骨架线,把骨架线上各点坐标的x、y值输入一个二维数组中。标准化这个二维数组,使之变为相同大小的新数组。依次取新数组中的两个元素,按式(1)将?兹值输入新数组。
其中,?兹是求得的每两个相邻边界点的角度值。?兹作为图像的特征向量,通过一次SVM方法将图像分类,最后将分好的类别值作为3个新特征向量,去除表1中3个特征向量,组成13组新特征向量作为SVM的输入,重新进行分类识别。
4 SVM分类平台设计
SVM从在线性可分类条件下求取最优化分类逐渐发展而来。过距离两类样本分类面最近的点并且与两类样本最优分类面平行的超平面上的所有训练样本,被称做支持向量[3]。
常用构造拉格朗日乘子法求解带有约束条件的优化问题[4]。对于高维特征空间,SVM算法引入核函数,然后转化为类比于式(2)的优化问题:
内积函数k(xi,xj)采用不同的函数形式,得到不同的支持向量机,分类效果也各不相同。对于多分类问题,可采用两类问题的“一对一”和“一对多”方案实现[5]。
5 实验方案与结果分析
5.1 输入
以初始化数据库中的部分数据为训练集样本,见表1。对样本取均值以消除基线漂移,再与标准偏差做商,可避免由于不同仪器产生的幅度偏差造成的误判。特征值按表2特征值选取。以MITBIH数据库中的一部分数据为测试样本,处理方法同训练样本。
5.2 核函数选择
SVM输出性能的优劣与内积函数及其系数、惩罚因子等参数的选择有较大关系。本文选择径向积核函数作为核函数[6]:
其中,ρsens为敏感度,ρindiv为特异度,ρacc为准确度[7]。
现在对属于MIT-BIH数据库中的测试样本做详细分析。选择表2中13组特征向量和去除表2中3组向量再加入3组形态特征向量后的13组新特征向量作为SVM输入,其分类准确度根据选取的被替换3组特征向量的不同而不同。表3列出了3种不同替换选择对分类准确度的影响结果。
实验结果表明,综合特征向量输入的分类准确度有所提高,提高程度依赖于被替换特征向量的类型。当S波振幅、PQ间期、ST间期3个特征向量被替换时,分类准确度提高程度最明显,总分类准确度提高了6.2%。EGG信号测试集识别结果如表4所示,S波振幅、PQ间期、ST间期3个特征被替换后的性能指标如表5所示,其中V、B两种类型数据测试结果最优,N、A测试结果较差。
6 结论
本文所提出的算法在个人计算机上的应用的技术难题已经解决,而在移动终端上SVM算法的实现、数据库的全面性建设和已获取信号的重利用是作者今后研究的方向和重点。
参考文献
[1] LOWNE A, BREAKSPEAR R. Non-contact ECG measurement using EPIC sensors[R/OL]. UK: Plessey Semiconductors Inc, 2012[2012-3-26]. http://www.plesseysemiconductors.com/epic-fitness-plessey-semiconductors.php.
[2] ?魻ZLEM ?魻ZCAN N, G?譈RGEN F. Fuzzy support vector machines for ECG arrhythmia detection[J]. International Conference on Pattern Recognition, 2010,2973-2976
[3] 邓乃扬,田英杰.数据挖掘中的新方法——支持向量机[M].北京:科学出版社,2004.
[4] Vapnik.统计学习理论[M].张学工,译.北京:电子工业出版社,2004.
[5] 唐孝,唐丽,莫智文.基于支持向量机算法的ECG分类策略[J].生物医学工程学杂志,2008,25(2):246-249.
[6] 周珂,彭宏,胡劲松.支持向量机在心电图分类诊断中的应用[J].微计算机信息,2006(22):237-239.
[7] 谢亮,汪晓东.基于改进的快速独立分量分析与支持向量机的ECG分类诊断[J].仪器仪表学报,2009,30(12):2599-2604.