文献标识码: A
DOI:10.16157/j.issn.0258-7998.190314
中文引用格式: 聂雄,陈华,伍思霖. 基于灰度共生矩阵和BP神经网络的乳腺肿瘤识别[J].电子技术应用,2019,45(7):97-101,116.
英文引用格式: Nie Xiong,Chen Hua,Wu Silin. Recognition of breast tumor based on gray level co-occurrence matrix and BP neural network[J]. Application of Electronic Technique,2019,45(7):97-101,116.
0 引言
乳腺肿瘤是女性病发率极高的一种肿瘤疾病,但也是一种可以通过早期确诊,提早治疗,从而降低病死率的一种疾病。现有乳腺检查运用的手段是以钼靶、超声为主,其识别率普遍低于75%,这种检查方法都有自己的局部优势,但也受到了一定局限[1-4],如:钼靶对钙化敏感,但对东方女性的腺体型乳腺层次分辨不够,有射线,属有创检查,不宜做体检筛查使用。超声对囊性和实性的占位反映敏感,但对医生技术水平要求较高,检查速度较慢,不宜大规模体检筛查使用。核磁共振(MRI)检查方式虽然准确度可以达到90%以上[5],但其成本高,设备复杂,农村医院及一些小型医院没有配备。近年来,基于红外图像的乳腺肿瘤诊断逐渐成为学者研究的热点[6-8]。
本文提出基于红外成像技术,通过灰度共生矩阵提取乳腺等灰度曲线图像的纹理特征,通过BP神经网络进行分类,实现乳腺肿瘤计算机诊断识别的算法。具体过程为:首先通过红外乳腺透像仪获取乳腺红外图像,然后将乳腺图像均匀分块,并划分为病变区域和正常区域,通过分析不同的纹理特征,并找出能有效区分出病变区域和正常区域的特征值,统计好数据作为样本数据,然后通过将训练样本数据导入BP神经网络之中进行训练,使该BP神经网络具有组织分类的功能,能有效地将病变区域识别出来。
1 乳腺图像预处理
乳腺红外图像的预处理包括图像平滑、等灰度曲线处理、图像增强等操作。
1.1 高斯平滑
高斯滤波是对图像进行去噪处理的有效方法。从图1中可以看出,经过高斯平滑处理后的乳腺图像,明显较之前柔和,没有明显的噪点,突出图像的边缘效果,消除噪声的干扰影响。
1.2 灰度曲线处理
由于乳腺肿瘤组织呈浸润性生长,在发生病变的乳腺中,肿瘤以及周边血管的纹理包络都会呈现不规则的状态,并反映了病变区的边缘特征。为了突出病变区域的包络纹理特征,需将近红外图像转化为等灰度曲线图像,这一转变可以通过Sobel算子与图像的每一个点进行卷积实现[8-10]。
Sobel算子包括两组3×3的矩阵,A1表示垂直,A2表示水平。将它和原图像作平面卷积,即可分别得出垂直及水平的亮度差分近似值。
图2(b)是利用上述方法将近红外乳腺图像转化而成的等灰度曲线图像,可以看出病变区域灰度曲线包络纹理不均匀,为病变部位。
1.3 图像增强
在图像处理中,为了突出目标区域,需要对图像进行图像增强。直方图均衡化是图像处理领域中利用图像直方图对对比度进行调整的方法。这种方法通常用来增加许多图像的局部对比度,尤其是当图像的有用数据的对比度相当接近的时候。通过这种方法,亮度可以更好地在直方图上分布。
由于乳房边缘区域的包络纹理会对实验造成误判的影响,在此只截取乳腺图像较为中心的区域作为研究。图像增强处理如图3所示。
经过图像增强后的等灰度曲线图像纹理更加清晰明显,病变区域的边缘包络纹理也更为突出。
2 建立灰度共生矩阵提取纹理特征
2.1 建立灰度共生矩阵原理
纹理是组成图像的色调基元空间汇总相互作用的一种依赖于尺度效应的现象,它反映了图像灰度值分布的某种规律。灰度共生矩阵(CLCM)因为其简单有效的优点被广泛应用于纹理特征提取研究[11-13]。本文中选取了能量、对比度、相关性、熵、逆差距共5个参数作为乳腺图像的特征值[11]。
2.2 灰度级量化
由于灰度共生矩阵反映了两个不同位置的像素的联合概率分布,当原图像灰度级为0~255时,灰度共生矩阵的大小为256×256,计算时间比较长,实际应用中,将图像灰度等级降为16级,对应灰度共生矩阵的灰度级设为16,并对等灰度曲线图像进行直方图均衡化处理。
2.3 提取特征数据
在对乳腺肿瘤样本图像提取纹理特征之后,得到了关于能量、对比度、相关性、熵、逆差距这5个特征值的大量数据,对这些数据进行分析,研究它们的变化趋势。以图4病变乳腺图像为例进行特征提取。
图4的图像中分割为16个图像子块,并按从左到右、从上到下顺序命名为m1~m16。利用文献[11]的式(3-6)~式(3-8)以及式(3-10)、式(3-12)计算出每个图像子块对应的能量、对比度、相关性、熵、逆差距5个特征值的均值(如表1所示)和特征值的标准差(如表2所示)。类别有2个取值,其中1表示正常区域,2表示病变区域。
2.4 特征值数据分析
通过以上数据可以观察到:病变区域的能量值均值总体偏小,标准差总体偏小,反映的是病变区域灰度共生矩阵元素不集中,纹理较粗;病变区域的熵均值总体偏大,标准差总体偏小,反映的是病变区域灰度共生矩阵元素分散分布;病变区域的对比度均值总体偏小,标准差总体偏小,反映的是病变区域效果模糊,灰度差小;病变区域的相关性均值总体偏大,标准差总体偏小,反映的是病变区域灰度共生矩阵元素值相差大;病变区域的逆差矩均值总体偏小,标准差总体偏小,反映的是病变区域变化多,局部不均匀。
上述规律表明灰度共生矩阵提取出的纹理特征值可以作为区分乳腺病变区域和正常区域的依据。
3 建立BP神经网络
3.1 BP神经网络
BP(Back Propagation)神经网络是一种按误差逆传播算法训练的多层前馈网络。图5为BP神经网络基本结构图。
一般BP神经网络会抽取具有某种变化规律的样本特征参数,通过样本训练建立对样本的记忆信息,然后将未知样本作为BP神经网络的输出,通过BP神经网络识别该样本所属类别[14-17]。
通过不断调整权值和阈值,可以使BP神经网络越来越逼近理想模型。
3.2 确定BP神经网络参数
BP神经网络的输入层个数由样本数据种类确定,输出层个数由分类的个数确定。红外乳腺肿瘤BP神经网络采用了能量、对比度、相关性、熵、逆差距这5个特征值4个方向的平均值和方差作为输入,其输入层节点数应该为10个;输出层节点数确定为2个:病变区域、正常区域。隐藏层节点数,则由试凑法得出。最终确定的BP神经网络结构图如图6所示。
3.3 BP神经网络的创建
在提取了等灰度曲线图像的5个特征值后,就可以创建BP神经网络。图7为BP神经网络算法流程示意图。
本文建立的BP神经网络是一个10输入、2输出的神经网络,其中输出1表示该区域为正常区域或干扰区域,输出2表示该区域为病变区域。根据训练样本数据和训练样本输出送入BP神经网络中训练,不断地调整输入层和隐藏层之间的权值,隐藏层和输出层之间的阈值,使BP神经网络的模型不断逼近最优解。
3.4 BP神经网络的训练
在MATLAB中,神经网络进行训练的步骤为:
(1)设置生成的网络对象;
(2)调用train函数对网络进行训练:
①从训练集中取出训练样本,将数据输入神经网络中;
②通过各节点的连接情况正向逐层处理后,得到神经网络的实际输出;
③计算网络实际输出与期望输出的误差;
④将误差逐层反向回传至之前各层,并按一定原则将误差信号加载到连接权上,使整个神经网络的连接权值向误差减少的方向转化;
⑤对训练集中每一个输入输出样本对重复以上步骤,直到整个训练集的误差减小到符合要求位置。
3.5 BP神经网络的测试
在完成BP网络训练之后,将待测图片的纹理特征数据以矩阵形式读入MATLAB中,BP神经网络就能根据训练好的映射关系给出每一个子块相应的输出,输出1为正常区域,输出2为病变区域,具体流程如图8所示。
由于每一个BP神经网络都要结合自身的实际,特别是输入层和输出层,输入层的个数主要是由特征值的个数决定的,输出层个数则由需要分类的个数决定。将等灰度曲线图像中提取出来的5个纹理特征值的均值以及标准差作为输入,输出则定义了一个输出层,如果输出为1,则为正常区域;输出如果为2,则为病变区域。
4 实验结果与分析
4.1 实验方案
假设Cn为训练样本正常图片数,Cc为训练样本肿瘤图片数,Tn为测试样本正常图片数,Tc为测试样本肿瘤图片数。实验步骤如下:
(1)准备200张乳腺红外图像作为实验样本图像,其中正常乳腺的红外图像为100张,患者乳腺的红外图像为100张,实验时,根据需要将所有图像按不同比例分为训练样本集和测试样本集,如表3所示,每种样本比例重复训练和测试20次。
(2)对样本图像进行分块,并分别提取其对应的能量、对比度、相关性、熵、逆差距5个特征值的均值和特征值的标准差,保存为特征数据库文件,并对每个分块的类别进行标注,正常块(区域)标注为1,病变块(区域)标注为2。
(3)抽取不同比例的图像对应的特征数据作为训练样本数据集,导入到已经创建好的BP神经网络进行训练。
(4)除测试样本集以外的其他图像作为测试样本,将测试样本集对应的特征数据导入到经过训练后的BP神经网络进行测试。
(5)记录BP神经网络的输出结果,每种样本比例重复测试30次,实验结果如图9所示,不同训练样本比例条件下的平均识别率记录在表3中。
4.2 结果分析
从图9和表3的数据分析,不同样本比例条件下,乳腺肿瘤的正确识别率有所差别,其中第4、5、6组对应的样本比例训练效果较好,识别率可达80%以上。本方法具有成本低、便携的特点。
5 结论
实验结果表明,本文所采用的灰度共生矩阵结合BP神经网络的乳腺肿瘤图像识别方法对乳腺肿瘤病变区域具有较为良好的识别效果,可提高乳腺肿瘤早期的诊断率。
参考文献
[1] 陈丽君,黄崇权.不同影像学方法对乳腺癌诊断价值的比较[J].中国妇幼健康研究,2018,29(8):1031-1035.
[2] 杜睿,薛玉.超声造影及弹性成像技术在乳腺肿瘤诊断的现状与进展[J].医学研究生学报,2013,26(4):435-437.
[3] Wang Cong,Yang Guang,Wang Hui.Diagnostic accuracy of real-time tissue elastography for breast cancer:a metaanalysis[J].Oncology and Translational Medicine,2016,2(1):21-25.
[4] 林其忠,余建国,赵暖,等.乳腺肿瘤超声图像的特征分析[J].仪器仪表学报,2006(S1):744-746,752.
[5] 郑桦,符孔.MRI扩散峰度成像对乳腺病变性质的鉴别诊断[J].青岛大学学报(医学版),2018,54(6):652-655.
[6] 薛雯,杨柳茵,范丽,等.超微血管成像技术鉴别乳腺良恶性病变[J].中国医学影像技术,2019,35(1):77-81.
[7] 朱晓娟,赵华,徐祎,等.乳腺纤维瘤病临床病理分析[J].临床与实验病理学杂志,2019(1):93-95.
[8] 王亚丽,王金星,陈龙舟,等.三算子及血氧功能成像系统在乳腺癌诊断中的应用[J].中国微创外科杂志,2014(5):417-419.
[9] 胡徐怡,王超,厉丹.基于改进Sobel算子的边缘检测算法研究[J].福建电脑,2018,34(9):13-15.
[10] 凌军,宋启祥,房爱东,等.基于局部熵的边缘检测算子选择算法[J].南京理工大学学报,2018,42(4):424-429.
[11] 谢菲.图像纹理特征的提取和图像分类系统研究及实现[D].成都:电子科技大学,2009.
[12] 汪友明,张菡玫,汤少杰.数字乳腺层析图像纹理特征联合提取与识别[J].西安邮电大学学报,2018,23(3):65-68.
[13] 焦蓬蓬,郭依正.灰度共生矩阵纹理特征提取的Matlab实现[J].计算机技术与发展,2012,22(11):169-171,175.
[14] 赵景波,赵德安,蒋春彬.基于神经网络的电子鼻肺癌早期诊断系统[J].电子技术应用,2006,32(7):8-10.
[15] 刘标,周晓军.解读2012年WHO乳腺肿瘤分类[J].临床与实验病理学杂志,2012,28(11):1185-1187.
[16] 周进凡,张荣芬,马治楠,等.基于深度学习的胸部X光影像分析系统[J].电子技术应用,2018,44(11):29-32.
[17] 王波,杜晓昕,金梅.LVQ神经网络在乳腺肿瘤诊断中的应用[J].计算机仿真,2012,29(8):171-174.
作者信息:
聂 雄1,2,陈 华1,2,伍思霖1
(1.广西大学 计算机与电子信息学院,广西 南宁530004;2.广西多媒体通信与网络技术重点实验室,广西 南宁530004)