《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 设计应用 > 红细胞SEM图像的三维重构及形状特征提取
红细胞SEM图像的三维重构及形状特征提取
2016年微型机与应用第18期
唐思源,白金牛,杨敏
包头医学院 计算机科学与技术系,内蒙古 包头 014040
摘要: 临床经验及诊断中表明许多疾病都与红细胞形变有关。因此分析红细胞的形态特征可以辅助诊断病人的病情。运用模板匹配方法寻找12类形态变异的红细胞子图像的位置,应用PCA和LDA算法对12类产生形变的红细胞进行特征选择和提取,并针对噪声问题对算法进行了改进。通过实验数据对一些分类困难的形变细胞做进一步的数据对比及特征提取分类。实验表明,该算法及改进的方法能有效区分并提取出不同类型的红细胞,分类的准确率达到了92.7%。
Abstract:
Key words :

  唐思源,白金牛,杨敏

  (包头医学院 计算机科学与技术系,内蒙古 包头 014040)

       摘要:临床经验及诊断中表明许多疾病都与红细胞形变有关。因此分析红细胞的形态特征可以辅助诊断病人的病情。运用模板匹配方法寻找12类形态变异的红细胞子图像的位置,应用PCA和LDA算法对12类产生形变的红细胞进行特征选择和提取,并针对噪声问题对算法进行了改进。通过实验数据对一些分类困难的形变细胞做进一步的数据对比及特征提取分类。实验表明,该算法及改进的方法能有效区分并提取出不同类型的红细胞,分类的准确率达到了92.7%。

  关键词:红细胞形变;特征提取;PCA和LDA算法;噪声

0引言

  随着医学成像技术的发展和进步,在临床医学中,用计算机处理医学类图像的应用越来越广泛。应用计算机技术辅助分析与处理医学图像,逐渐成为一门交叉学科。该学科一方面可以对放射仪器采集的图像进行分析和处理,另一方面对扫描电子显微镜(SEM)[1]下的图像进行处理。本文所采集的图像就是在SEM下获取的红细胞图像。红细胞是脊椎动物与外界进行气体交换的媒介,即呼出二氧化碳,呼入氧气。当红细胞发生形变后,不仅影响到血液系统,还会涉及其他系统功能,并且会诱发很多疾病,比如缺铁性贫血、溶血性贫血等病症。因此,对红细胞形状特征的研究和提取很有研究的价值。

1红细胞形态分类的研究

图像 001.png

  人类正常的红细胞是双面凹陷的圆饼形状,中间比较薄,两边比较厚,通常在6~9 μm之间,如图1所示,这种形状的红细胞可以最大限度地获取氧气。各种血液系统疾病都可引起红细胞的形变,形变后的红细胞,其大小、形状、厚度、染色等都会有所改变,经过大量临床分析,红细胞形变后的形态大致分为12类[2], 分别是小红细胞、大红细胞、裂红细胞、口形红细胞,球形红细胞、椭圆形红细胞、半月形红细胞、刺毛红细胞、镰状红细胞、水滴形红细胞、靶形红细胞、棘形红细胞,图像如图2所示。

图像 002.png

  本节重点介绍了12类形态变异的红细胞的形态特征,为下一步对图像进行特征提取打下基础。

2红细胞图像特征提取的研究

  图像特征[3]是指人们能肉眼观察到的颜色、形状、亮度、大小等图像的信息,能观察到的特征称为低层次特征。而有些特征是通过测量或者公式变换计算出来的,称之为高级特征,比如直方图、滤波、频谱等。提取图像的特征是模式识别的基础,只有把相同图像的共有特征提取出来,才能从复杂图像中提取出需要的图像信息。例如:可以根据灰度值、角点等特征信息从图像中提取出文本内容等。基于对显微镜下大量红细胞图像分析,本文主要从红细胞的几何特征、纹理特征中提取几种对分类有意义的特征值。

  2.1图像特征的提取

  提取图像的特征[4]主要是提取出图像相关的像素点,并且对像素点进行归类的过程,广义上讲就是一种变换。在提取图像特征的时候,特征的选取也很重要,良好的特征应具备区别性大、可靠性高、独立性好、数量少这四个特点。提取过程如图3所示。

图像 003.png

  2.2图像特征的选择

  在图像分类过程中,必须从较大的特征集中选择符合条件的特征量,从得到的特征向量中选择少而精的向量集,进行分类识别,这样才能提高分类的准确率。特征选择[5]就是选取能代表同一类图像共同属性的特征集合,也是一个降低特征空间维数的过程。目前,搜寻策略方法是研究者们常用的特征方法,该方法有三种方式:分别为启发式、穷举式和随机方式。

  2.3红细胞几何特征

  常用的特征表达方法有颜色、纹理和形状等,这些特征信息具有各自的特点,本文采集的红细胞图像属于灰度图像,纹理和形状的描述显得较为突出。根据上文介绍,正常的红细胞与异常的12类红细胞的大小、形状差异比较大,因此几何特征[6]的提取在文章中显得尤为重要。首先本文通过计算面积、圆度、矩形度等,得到细胞的原始特征,形成特征后,经过变换、压缩维数或者用数学方法进行筛选,提取较少的新特征。

  本文选用了以下几个形态特征参数作为红细胞形态学的特征,它们容易提取并能反映不同红细胞的差异,其定义如下。

  (1)区域面积

  区域面积[7]指的是细胞区域的大小,其计算公式为:

  QQ图片20161018214717.png

  (2)区域周长

  区域周长就是区域轮廓的长度。其计算公式为:

  QQ图片20161018214720.png

  (3)细胞的圆形度(形状参数)

  圆形度表示细胞是否接近圆形。用公式表示为:X=QQ图片20161018214723.png,X的值越接近1,该细胞图形的形状越接近圆形,否则形状越不规范。

  (4)矩形度

  矩形度表示图形面积和矩形面积之比,公式表示为:

  R=S0/Sr

  (5)伸长度

  该参数可以反映图形的细长程度,定义的公式为:

  QQ图片20161018214728.png

  (6)长轴和短轴

  细胞图像中两点间最远距离是长轴长,细胞图像中两点间最近距离表示短轴长。

  (7)不变矩(中心矩)

  所谓中心矩是指以重心为原点进行计算的不变矩阵。

  2.4红细胞纹理特征

  纹理[8]是经过变换后,图像局部特征的一种表现,纹理可以对图像中不同区域的方向、粒度、结构和规则性的差异进行有效的描述,针对不同结构的纹理特征,目前存在着很多种分析方法,这些方法有统计法、结构法和空间频域联合分析法。本文应用统计法和结构法相结合的算法,计算图像的灰度-基元共生矩阵,并从矩阵中提取出能描述红细胞纹理特征参数的特征向量值,来描述不同类型红细胞的纹理特性,需要的纹理特征参数[9]如下:

  能量:ASM=∑L-1i=0∑L-1j=0P2δ(i,j)

  熵:QQ图片20161018214735.png

    对比度:QQ图片20161018214738.png

  相关:QQ图片20161018214742.png

       上述几种参数是应用灰度共生矩阵进行纹理分析的主要参数,可以将它们组合起作为纹理分析的特征参数使用。

  2.5红细胞特征提取

  首先应用模板匹配的方法寻找12类形态变异的红细胞子图像的位置,选择一个红细胞的形状模板,将模板的中心放在一个所匹配的图像点上,然后计算模板中有多少个点与图像点相匹配,对整幅的图像重复该过程,最佳匹配点即计数最大的点,定位红细胞的位置。模板匹配可以被定义为一种参数估计方法,算法如下:(1)求似然函数的最大值。将模板定义为一个离散函数,为所匹配的带噪声的图像计算图像的标准偏差,得到概率函数,因为影响每个像素的噪声都是独立的,所以模板所处位置的概率是该模板所覆盖的每个像素的联合概率。得到联合概率函数,最终可得似然函数,在最大似然估计中,需要选择参数,求得似然函数最大值。(2)计算最大化模板和图像之间的互相关。通过求似然函数的最大值,使目标函数的变化率最小化,由公式QQ图片20161018214742.png给出最小化问题的解,再通过计算式,得到最佳的匹配位置。此外,互相关的取值范围取决于模板的大小,并且相对于图像光照条件的变化来说也不是不变的。可以对互相关进行归一化处理,其中窗口内的点像素的平均值是模板像素的平均值。通过归一化后,并对红细胞图像进行二值化处理,可以减少计算量,得到最佳的匹配位置。

  其次,应用主成分分析(Principa1 Components Analysis,PCA)方法[10]与线性判别分析(Linear Discriminant Analysis,LDA)方法相结合的算法来提取红细胞的特征,该算法既可以降低空间维数,又可以克服两种算法的缺点。PCA算法[11]的优点是:识别速度快、识别率高,对于扭曲变形的图像有很强的鲁棒性,缺点是: 对光照敏感。LDA算法[11]的优点是:改善了光照敏感性,对光照不均匀的图像也能很好地计算出特征向量值进行特征的提取。本文的算法步骤如下:(1)空间降维及子空间融合。首先,利用PCA方法进行空间降维,将高维空间的样本投影到低维空间。接着,将PCA算法与LDA算法构成的特征子空间进行融合,获得其融合特征空间。(2)空间投影及求特征值。先进行规范化处理, 把规范化后的样本A投影到融合特征子空间中,利用公式:yd=Axk(k=1,2,…,d)得到一组投影向量y1,y2,…,yd,把投影向量排列成矩阵形式,把矩阵转换成直方图,通过直方图提取出细胞样本A的特征值。(3)特征选择及特征提取。通过计算分辨率系数,选择分辨率强的特征值,然后利用LDA特征选择的线性分类方法对红细胞进行特征提取。(4)去除噪声。由于经过降维之后,很多噪声数据还残留在细胞特征信息里,本文通过求解Fisher准则函数[12],对特征提取算法做去除噪声的改进处理。定义Fisher准则函数如下:QQ图片20161018214750.png,其中sw是非奇异矩阵,w是投影向量,本文通过具体分析sw、sb的特征空间,使Fisher准则函数最大化,求出对应的特征向量,满足等式sbwi=λSwWi(i=1,2,…,m)的解即为红细胞的特征值,否则视为噪声。通过改进处理后,同一类的样本特征值聚集在一起,而不同类的噪声样本相对比较分散。

  最后,对12类红细胞,共332个红细胞提取了7类与实验密切相关的几何特征值,这7类特征值的平均值见表1所示。

图像 004.png

该算法在MATLAB环境下实现,随机选取电子显微镜下100张红细胞图像进行实验,应用本文提出的主成分分析法和线性判别法进行特征的选择与提取,并通过实验数据提出对一些分类困难的红细胞进行进一步数据对比及特征分类的方法。实验结果表明,该算法的分类准确率达到了92.7%,是一种有效的方法。

3结论

  本文通过对红细胞图像进行筛选,最终选取了形态特征、纹理特征中的9个特征值组成的特征库,并增加了数据对比,明显提高了对12类红细胞分类的准确性。在今后的工作中要继续挖掘新的特征,比如色度和亮度特征、颗粒特征等,对那些环境复杂、形态不规则的细胞进行提取。

  参考文献

  [1] GEDDE M M,YANG E,HUESTIS W H.Shape response of human erythrocytes to altered cell pH[J].Blood, 2015, 86(6):1595 1599.

  [2] CASTLEMAN K R.Digital image processing[M].Beijing:Tsinghua University Press,2008.

  [3] VAPNIK V N. Statistical learning theory [M].New York: Wiley Press, 2008.

  [4] BERTHOLD K P H.Robort vision[M].Cambridge: MIT Press,2009.

  [5] DUNCAN J S,AYACHE N.Medical image analysis: progress over two decades and the challenges ahead[J].IEEE Transactions on Pattern Analysis and Machine Intelligenee,2009,22(1):85 106.

  [6] 王浩军,郑崇勋,李映,等.支持向量机在血细胞分类中的应用[J].生物医学工程学杂志,2003,20(3):484 487.

  [7] 田娅,饶妮妮,蒲立新.国内医学图像处理技术的最新动态[J].电子科技大学学报,2012,31(5):485 489.

  [8] 朱学芳.计算机图像处理导论[M].北京,科学技术文献出版社,2013.

  [9] 阮秋琦.数字图像处理[M].北京:电子工业出版社,2010.

  [10] 王亮申,欧宗瑛.图像纹理分析的灰度基元共生矩阵法[J].计算机工程, 2014, 23(30):19 21.

  [11] 孙即祥.现代模式识别[M].合肥:国防科技大学出版社, 2011.

  [12] 曾明,孟庆浩,张建勋,等.基于形态特征和SVM的血液细胞核自动分析[J].计算机工程,2008,34(2):14 19.


此内容为AET网站原创,未经授权禁止转载。