俞一云,何良华
(同济大学 电子与信息工程学院,上海 201804)
摘要:提出了利用卷积神经网络(CNN)对儿童注意缺陷与多动症(ADHD)的功能性核磁共振图像(fMRI)进行特征分析,从而对ADHD患者进行判别分析。针对ADHD-200全球竞赛的三个数据库的fMRI数据,首先利用快速傅里叶变换将数据从时域转换到频域,并利用Fisher线性判别方法选择有效的频率信息,然后利用改进的卷积神经网络对选择频域数据进行特征学习,自动提取出有效的特征并进行分类。实验结果表明,提出的方法有助于ADHD患者的判别,为基于fMRI数据的ADHD研究提供了新的手段。
关键词:卷积神经网络;儿童注意缺陷与多动症;线性判别;分类
中图分类号:TP18文献标识码:ADOI: 10.19358/j.issn.1674-7720.2017.04.016
引用格式:俞一云,何良华.基于卷积神经网络的ADHD的判别分析[J].微型机与应用,2017,36(4):53-55,58.
0引言
儿童注意缺陷与多动症(ADHD)是一种儿童时期十分常见的神经性发育性障碍疾病,通常表现为注意力不集中、多动等[1]。目前,国内外ADHD患者越来越多,很大程度上影响了患者的学习与生活,因此ADHD的研究受到了家长、老师以及社会的广泛关注。传统的ADHD的诊断依靠于专业医生对临床数据(脑电图和注意变量检测等)、患者行为、心理测试等复杂信息的长时间分析。近年来,由于功能性核磁共振成像技术(fMRI)的不断发展,凭借其非侵入性、无辐射等特征被用于脑认知的研究。目前,尽管受到可用的数据来源限制,大量学者仍然投身ADHD的fMRI数据的分析[24],并且基于不同的fMRI数据的特征参数已经被提取用于ADHD的分类,如功能连接、低频振幅等特征。
2011年,美国1000 Functional Connectomes Project 项目组共享了丰富的数据库,并组织了全球ADHD的分类大赛,期望通过比赛来发现诊断ADHD患者的方法和检测ADHD的生物因子。比赛的优胜者利用fMRI数据和个人特征信息取得了61.3%准确率[5],表明了利用机器学习和神经影像学相结合的方法对ADHD进行研究具有广泛的应用前景。此后,基于fMRI数据的ADHD判别研究变得更加积极、活跃,并且产生了一系列算法。
卷积神经网络作为一种非常重要的深度学习方法,能够从低级特征中学习到可区分性、更加抽象、有意义的高级特征,具有局部感受域、权值共享、下采样等特点,使得该学习网络对图像的平移、旋转、倾斜、缩放等具有高度不变性。另外,该网络结构将特征提取和分类过程结合到一个全局优化过程中,凭借其有效提取特征和分类的优势在图像识别与分类领域取得了广泛应用,如物体识别[6]、人类行为认知[7]、语音识别[8]和车辆检测[9]等。
本文所有的研究数据均来自ADHD200国际比赛数据库,利用卷积神经网络实现对ADHD的fMRI的特征学习与提取,并对ADHD进行判别分析,为实际临床诊断提供有价值意义的参考。所有实验结果表明,基于深度学习的ADHD核磁共振成像数据判别分析思路可行,结果有效,为基于fMRI的ADHD研究提供了新的方向。
1实验数据及预处理
ADHD的fMRI数据是脑活动的3D图像的时间序列,大小为49×58×47×T,其中49×58×47是脑体素的空间维度,T代表一个脑体素的时间维度,具有高维度、高冗余、大数据的特点。考虑到对fMRI数据的时域信息比较难提取出有用的信息,而且频率特征比时间特征更易于观察,因此本文采用快速傅里叶变换将时域信息转换到频域信息,利用频率特征在一定程度上能够反映脑部信号的振动的特点,使得提取的振动信息更能体现脑部活动。
图1卷积神经网络的结构图经过快速傅里叶变换的数据仍然保持4D结构,直接对其进行分析计算复杂度太高,为此,提出了利用Fisher线性判别分析方法来对数据进行特征选择,达到降维降冗余的特点。其中,Fisher线性判别分析方法是一种有效的模式识别方法,它的目标是最大化两类之间的差异R,使得类间的散布矩阵SE最大,同时保证类内的散布矩阵SW最小,其类间比类内的计算方式为:
基于此原理,对每个脑体素的所有频率信息进行类间比类内计算并进行排序,选择R值相对大的n个频率,并重构成n个频率的49×58×47×1的信息,作为卷积神经网络的输入,在本文中n=5。
2改进的卷积神经网络
卷积神经网络是具有多层隐藏层的神经网络结构,这种深度学习网络具有更好的学习特征的能力,能够从初级特征中学习出高级特征,从而更利于可视化或分类,因此本文利用ADHD的fMRI频率表达特征作为原始输入,构建了基于卷积神经网络的深度学习网络来对fMRI数据进行分析学习,从而实现对ADHD的判别。
2.1卷积神经网络的结构
由于fMRI数据的三维立体空间,采用传统的2D卷积神经网络会丢失特征信息,因此本文采用3D卷积神经网络。另外,不同脑体素之间的相互作用也是脑活动的重要信息,因此需要对整个3D的脑体素活动进行分析,而不是单独对一个脑体素或一个脑区进行分析,通过连续卷积和下采样操作,提取有效的特征,并对提取出来的特征进行分类。
本文提出的卷积神经网络从传统的2D卷积神经网络发展而来,增加了网络模型维度和深度,共由8层构成,分别是1层输入层、3层卷积层、3层下采样层和1层输出层的结构,如图1所示。
对于给定的大小为49×58×47的fMRI数据,分别取大小为4×7×4、4×5×3、5×6×5的卷积矩阵和大小为2×2×2的下采样矩阵迭代进行卷积和下采样操作,在S6层(下采样层)得到8个大小为3×3×3的特征图,并重构成一维特征向量,与最后的输出层进行全连接操作,得到预测值。
其中,在卷积层,利用局部域连接和权值共享的优势,减少了学习模型的训练参数,降低计算复杂度。
令Xj为第i个特征图,Wji是卷积层中第i个特征图与前面输入层第j个特征图间连接的卷积矩阵,J是前面层的输入特征图的数量。因此,卷积层的第i个特征图Ci可表示为:
Ci=sigmoid(∑Jj=1(Wji·Xj)+bi)通过对卷积的结果加偏置b,并进行sigmoid激活函数计算,得到卷积层的特征图,并作为后面的下采样层的特征输入。
在下采样层,对前一层(卷积层)的每一个特征图进行均值下采样操作(下采样的大小是222),得到与前面卷积层相同数量的特征图,并且减低了特征向量维度和分辨率。这种卷积和下采样相结合的方式使得学习模型实现对位移、缩放、形变的高度不变性。
在输出层,对下采样层S6的输出进行重构,生成一维向量(F)作为输出层的输入,并利用sigmoid激活函数和权值W、偏置B,计算出预测值h。
h=sigmoid(W*F+B)
2.2卷积神经网络的算法
本文的卷积神经网络算法主要由多次迭代的前向传播和反向传播学习的两个阶段构成。前向传播是从输入层到输出层的逐层特征学习,经过迭代地卷积和下采样操作,并在输出层通过激活函数sigmoid函数,得出分类结果。反向传播是从输出层到第一个卷积层的BP算法实现,通过计算损失函数Fcost和残值以及利用梯度下降方法来更新参数,从而对卷积神经网络的整个学习参数进行调节。
考虑到是针对ADHD患者和正常人两类进行分类,本文从学习更高的可区分性差异特征出发,利用Fisher线性判别分析方法的思想,提高ADHD患者和正常人之间的类间与类内的比值,从而提高ADHD的识别率。通过在输出层的传统的损失函数Fcost计算中引入Fisher线性判别分析方法的类间比类内的比值能量函数,而从优化特征的学习。令样本数量为n,样本的实际标签为y,预测值为h,传统的损失值Icost计算如下:
其中,α为学习率,SW、SB为预测值的类内距离值和类间距离值,hpos、hneg分别为真实标签为positive和negative的样本预测值,Mean函数为样本均值的函数。
本文提出的损失函数实现了误差最小化,也使得同类样本间的特征差异更小,不同类间的特征差异更大,因此当卷积神经网络的反向传播采用损失函数Fnew时,并针对此损失函数进行每层的残值计算和梯度下降学习,从而使模型学习的不同类别的特征间的差异更大,促进样本预测值逐渐往样本的真实标签偏向。
3实验结果及分析
本文研究的fMRI数据全部来自于ADHD-200全球竞赛中的三个数据库:NYU数据库、OHSU数据库、NeuroImage数据库,分别来自于纽约大学、俄勒冈健康与科学大学和Donders研究所。数据分别如表1所示。表1数据库分布情况样本分类NYUNeuroImageOHSU训练集正常人982343ADHD1182536测试集正常人121428ADHD29116
本文将ADHD一类称为正类(positive),正常人一类称为负类(negative),并利用提出的卷积神经网络对三个公开数据库进行测试实验,与ADHD200全球比赛的优胜队的成绩从准确率(Accuracy)、敏感度(Sensitivity)、特异度(Specificity)和J_statistic四个指标来进行对比分析(如表2所示),可以发现本文提出的方法在准确率上有很大的提升。
4结论
本文利用傅里叶变换和Fisher线性判别分析方法对fMRI数据进行预处理,并利用改进的卷积神经网络进行数据分析与特征提取,从而实现对ADHD的分析与判别。该方法与ADHD200的优胜队相比,在大多数ADHD200国际数据库的准确率上获得了很大的提高。在以后的研究中,将尝试对本文提出的卷积神经网络继续改进,以期望得到更好的识别效果。
参考文献
[1] JOHNSTONE S. Computer gaming and ADHD: potential positive influences on behavior[Opinion][J]. IEEE Technology and Society Magazine, 2013, 32(1): 20-22.
[2] Wang Xunheng, Jiao Yun, Lu Zuhong. Discriminative analysis of restingstate brain functional connectivity patterns of attentiondeficit hyperactivity disorder using kernel principal component analysis[C]. 2011 Eighth International Conference on Fuzzy Systems and Knowledge Discovery(FSKD), IEEE, 2011: 1938-1941.
[3] WOLF R C, PLICHTA M M, SAMBATARO F, et al. Regional brain activation changes and abnormal functional connectivity of the ventrolateral prefrontal cortex during working memory processing in adults with attentiondeficit/hyperactivity disorder[J]. Human Brain Mapping, 2009, 30(7): 2252-2266.
[4] Zang Yufeng, He Yong, Zhu Chaozhe, et al. Altered baseline brain activity in children with ADHD revealed by restingstate functional MRI[J]. Brain and Development, 2007, 29(2): 8391.
[5] MILHAM M P, FAIR D, MENNES M, et al. The ADHD200 consortium: a model to advance the translational potential of neuroimaging in clinical neuroscience[J]. Frontiers in Systems Neuroscience, 2012(6): 62.
[6] Liang Ming, Hu Xiaolin. Recurrent convolutional neural network for object recognition[C].Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2015: 3367-3375.
[7] Ji Shuiwang, Xu Wei, Yang Ming, et al. 3D convolutional neural networks for human action recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(1): 221-231.
[8] ABDELHAMID O, MOHAMED A R, Jiang Hui, et al. Convolutional neural networks for speech recognition[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2014, 22(10): 1533-1545.