摘 要: 针对周围神经物理切片图像中不同类型的神经功能束染色后显示出的特异性,提出了一种基于K-均值聚类的神经切片染色图像中神经功能束类型识别的方法。首先通过特征分析与提取决定以灰度均值μ和方差σ2作为纹理特征,然后运用本文算法对神经切片染色图像中的不同类型神经功能束进行聚类和识别。通过在人体周围神经组织切片图像上的实验证明,该算法能对神经切片染色图像中的神经功能束类型进行有效分类识别。
关键词: 功能束识别;K-均值聚类;神经切片染色图像
数字图像处理在第三代计算机问世后开始迅速发展,目前,它已经成为工程学、计算机科学、信息科学、统计学、物理、化学、生物学、医学甚至社会科学等领域中各学科学习和研究的对象。数字图像处理是一门与国计民生紧密相连的应用科学,已给人类带来了巨大的经济和社会效益,在不久的将来它不仅在理论上会有更深入的发展,在应用上亦会是科学研究、社会生产乃至人类生活中不可缺少的强有力工具[1]。数字图像处理的飞速发展提供了平面图像三维重建的可能。因此,结合数字图像处理技术、解剖学技术以及组织学技术,通过对平面图像进行三维重建,可以实现直观而全面地显示周围神经内部功能束空间立体走行规律,从而有望成为提高周围神经损伤后治疗效果的重要途径。
神经的三维可视化技术主要由切片序列图像配准、神经切片染色图像边缘提取、神经内部功能束类型识别和神经内部功能束三维重建等步骤组成。其中,功能束类型的识别是三维可视化的重点和难点,其效果的好坏是最终三维可视化效果的决定因素之一。
目前国内外针对内部功能束类型识别方面的研究主要集中在根据功能束区域受染色程度的不同导致的图像灰度值的不同来判断。神经功能束类型识别比较先进的方法就是采用显微喇曼光谱技术对周围神经束进行特异结构的研究和分析,获得神经内部运动功能束和感觉功能束的特异性,这种特异性在组织中是恒定的,但喇曼光谱的识别还基本都是采用人工方式进行的,尚无有关自动识别的文献,有待更深一步的研究[2]。由于现有的医学三维重建软件Amira[3]或者Mimics[4]仅能识别灰度对比强烈的数据,而周围神经乙酰胆碱酯酶染色的不同类型功能束灰度对比度较低,因此目前的医学图像三维重建软件还不能基于染色结果对不同类型的功能束进行准确的自动识别,需要人工主观地一张一张地区分功能束,并且需在高质量的切片条件下完成,工作量很大,大大降低了工作效率。利用计算机图像图形技术实现其内部功能束的三维重建,可实现对周围神经功能束的定性分析和精确定位,做到相同类型的神经功能束组准确对接,提高神经修复的效果。
本文旨在对周围神经功能束类型自动识别方面进行一定的探索和研究,首先通过对图像进行预处理使其方便后期处理,接着通过特征分析与提取决定以灰度均值μ和方差σ2作为识别神经功能束类型的评价参量,然后基于K-均值聚类算法实现对医学神经切片染色图像不同神经功能束类型的自动识别,进而大大降低功能束识别的工作量,提高工作效率,为进一步的医学图像三维重建提供条件基础。
1 特征提取与分析
医学图像内容属性大多直接采用低层的图像特征描述,如颜色特征、纹理特征、形状特征等。提取出有效的医学图像数据特征决定着图像识别的成败。
由于神经图像中神经功能束的形状没有一定的特征规律,同类型的神经功能束可以是各种不同的形状,因此不把形状特征作为评价参量。而不同类型的神经功能束之间的颜色特征差异度太小,也不能用来作为有效的评价参量。因此纹理特征的选择将会直接影响到后期的识别结果。
有很多描述纹理的参量,本文基于图像的灰度直方图的以下纹理特征进行计算:
(1)均值。它反映的是一幅图像的平均灰度值。
虽然传统的K-均值是一个极其高效的聚类算法,但是它也存在着各种问题:(1)K-均值算法只能保证能收敛到某个解决方案,而不能保证能找到定位聚类中心的最佳方案;(2)K-均值算法无法指出应该使用多少个类别,在同一个数据集中,选择不同的类别数,必将导致结果输出的不同,甚至有可能不合理。在K-均值中,每个聚类中心拥有它的数据点,计算这些点的方差,最好的聚类结果是在不引起太大的复杂度的情况下使方差达到最小。
针对以上两个问题,本文采用如下解决方法。
(1)中心点最小方差法
因为每次运行K-均值聚类算法时的中心点是随机选取的,所以每次初始的聚类中心点都不一样,通过多运行几次K-均值,得到几个不同的聚类结果,然后从中选择方差最小的那个结果。
(2)类别数增量设置法
首先将类别数设为1,然后根据聚类效果重新修正,可以在原先规定的类别数的基础上加1或减1[7],每次聚类的时候使用前面提到的中心点最小方差法。一般情况下,总方差会很快下降,直到到达一个拐点,这意味着再加一个新的聚类中心不会显著地减少总方差。在拐点处停止,保存此时的类别数。
以lena图像为例加以说明。图2(a)为原始图像灰度图。图2(b)为类别数设为1的效果图,此时的中心点的像素值为60;由于效果不好,因此把类别数提高到2,效果明显好于类别数为1时的效果,如图2(c)所示,此时两个中心点的像素值分别为60、180;继续增加类别数到3,此时的聚类中心点像素值分别为60、100、180,效果如图2(d)所示,聚类效果基本实现。具体算法实现流程图如图3所示。
3 实验结果与分析
对本文算法在Matlab7.1平台下进行程序实现,在操作系统为Windows XP SP3、处理器为AMD Athlon(tm) 64 X2 Dual的环境下运行。实验结果如图4~图10所示。由于不同性质功能类型的神经功能束在经过乙酰胆碱酯酶组化法及HE染色法等单独染色和组合套染的受染的程度是不同的,如运动型神经功能束与感觉型神经功能束的受染程度就是有明显差别,从图5中的灰度直方图中也可以清晰地看到这一点,而这一点也是医生人工判别功能束类型的一个重要依据,因此采用基于像素点的空间位置和灰度值对图像进行聚类。对神经切片染色图像进行聚类处理,可以非常直观地看出,通过设置不同的灰度通道可以识别功能束的类型,并与医生通过肉眼人工判别的神经切片中功能束类型进行比照。总共343张的人体周围神经切片染色图像全部由某医院提供,运用本文算法可以成功地进行神经功能束自动识别的图片有217张,成功率为63.2%。
通过多次运行K-均值算法发现,最佳聚类数为3,图像背景作为一类,运动型功能束作为一类,感觉型功能束作为一类,这与图10所示的人工识别的神经切片图像结果一致。聚类完成后得到3个聚类中心的灰度值,基于这3个灰度值划分3个灰度范围并把这3个灰度范围的像素点的灰度值归一化。以聚类后灰度直方图(如图7所示)对比原始图像灰度直方图(如图5所示)为例,聚类完成后3个聚类中心点的灰度值分别为95.4、143.9、175.6,把灰度值在(0,95.4)范围内的像素点的灰度值统一设置为10,同时,这一类像素点将被设置为一类;范围在(95.4,143.9)内的像素点的灰度值设置为138,同时这些像素点被设置为另一类;范围在(143.9,255]内的像素点的灰度值设置为245,这一类是背景区域。原则上设置的灰度数据对比应该越强烈越好。
造成部分图像不能成功自动进行聚类识别的原因是:(1)神经切片染色图像过于复杂,难以提取到更多作为识别功能束类型的有效特征;(2)部分图片受染效果不好;(3)图片制备过程中形成的不可避免的人工操作误差,造成计算机难以自动识别功能束类型,只有通过医生的经验进行人工判断。
因为K-均值聚类算法是一种贪心算法,贪心算法并不一定能得到全局最优解,往往会陷入局部最优,而且K-均值聚类算法对初始化的类别数K和初始聚类中心具有很大的敏感性,所以本文采用多次运行K均值得到多个聚类结果,选择方差最小的那个结果的方法进行改进。如何改进算法中存在的以上问题以提高算法的效率,以及如何从医学图像中提取到更多能描绘图像信息的特征从而得到最佳识别效果,将是下一步亟待解决的问题。
参考文献
[1] 阮秋琦.数字图像处理学[M].北京:电子工业出版社,2000.
[2] 王虎,李学东,杜世新,等.微区喇曼光谱法区分周围神经束[J].中国神经再生研究,2006(8):104-106.
[3] CASPI O, LESMAN A, BASEVITCH Y, et al. Tissue engineering of vascularized cardiac muscle from human embryonic stem cells[J]. Circulation research, 2007, 100(2):263-272.
[4] JOVANOVIC-TALISMAN T, TETENBAUM-NOVATT J, MCKENNEY A S, et al. Artificial nanopores that mimic the transport selectivity of the nuclear pore complex[J]. Biophysical Journal, 2009, 96(3S1): 545-545.
[5] 冈萨雷斯.数字图像处理:MATLAB版[M].阮秋琦,译.北京:电子工业出版社,2006.
[6] 李弼程,彭天强,彭波,等.智能图像处理技术[M].北京:电子工业出版社,2004.
[7] 贲志伟,赵勋杰.基于改进的K均值聚类算法提取彩色图像有意义区域[J].计算机应用与软件,2010,27(9):11-13.