《电子技术应用》
您所在的位置:首页 > 嵌入式技术 > 设计应用 > 基于属性论的无监督图像聚类
基于属性论的无监督图像聚类
来源:微型机与应用2012年第2期
李根根, 冯嘉礼
(上海海事大学 信息工程学院,上海 200135)
摘要: 提出了应用属性论来实现无监督图像聚类的方法。首先提取图像的底层特征,再利用属性论方法中定性映射、转换程度函数理论对图像进行分类。由于一次聚类并未达到很好的效果,因此采取了多次聚类的策略。实验结果表明,本方法简单明了并且有效。
Abstract:
Key words :

摘   要: 提出了应用属性论来实现无监督图像聚类的方法。首先提取图像的底层特征,再利用属性论方法中定性映射转换程度函数理论对图像进行分类。由于一次聚类并未达到很好的效果,因此采取了多次聚类的策略。实验结果表明,本方法简单明了并且有效。
关键词: 属性论;定性映射;转换程度函数;图像聚类;HSV

    随着多媒体技术的飞速发展以及图像获取与存储技术的提高,图像数据库得到了快速发展。面对如此庞大的图像数据库,各个领域的图像都非常多,想要检索其中用户感兴趣的图像十分不容易。因此,有必要对图像数据库中的图像进行聚类以减少图像检索的代价。俗话说“物以类聚”,图像的聚类即是将图像数据库中最为相似的部分划为一类,使得类内的相似度尽可能高,而类间的相似度尽可能低。
    本文中的图像聚类采用图像的颜色以及轮廓两种特征。利用熟知的HSV模型来得到图像的颜色谱,以此作为颜色特征。轮廓特征则利用属性论方法来获取。在提取了特征之后,利用转换程度函数来完成聚类。
1 图像聚类
    在聚类之前,先来介绍本文所用到的一些理论知识。好的聚类结果离不开两个重要方面:准确有效的图像特征以及合适的理论与方法。这两方面缺任何一个都有可能达不到预期的效果。
1.1 定性映射[1-2]
    众所周知,事物有质和量的两种规定性,质和量之间有质量互变规律:只有超过度的范围的量变才导致质的变化,而限于度的范围之内的量变不导致质变。 这一性质可用如下定理表示:



 
1.3 轮廓特征提取
    对图像提取轮廓,首先将图像进行灰度化,然后获得图像的灰度直方图,再确定图像二值化的阈值,最后对图像进行二值化。
    二值化后的图像只有两种颜色,从属性论的观点出发,每幅图片只有黑色和白色两种属性,它们所对应的量值分别为0和255。由于图像轮廓产生在这两种属性发生转变的临界部分,这样图像的轮廓就很容易提取出来了。将图像分成若干个区域,在这些区域中利用表示白色与黑色属性的定性映射做一个差,这个差值的绝对值不外乎两种情况:1和0, 1表示发生了性质的转变,0表示未发生性质的转变。当每一个区域中有1值时,就将这个区域划为轮廓,否则不划为轮廓部分并将这个区域变成白色。
1.4  颜色特征提取
    图像颜色的表达有许多种方式,如比较常见的RGB空间、HSV空间、HIS空间等。HSV空间具有如下特点:三个分量相对于人的视觉彼此独立,信息结构更紧凑;能够获得对彩色的直观表示;各彩色值根据主观评价均匀量化,彩色距离的大小与人眼的感觉一致;人对颜色的感觉比较均匀。因此,本文以此空间来表示图像的颜色。HSV空间中,H表示色调,S表示饱和度,V表示亮度。
    HSV空间中,根据参考文献[5],各分量的计算公式如下:
 

其中,Qs、Qv分别表示S、V的量化级数,通过式(11)可知它们都取值为2。由式(12)式很容易得到l的取值范围,然后再统计图像中各值的分布,即可得到图像的颜色谱。
1.5 聚类算法
    将上面得到的颜色特征记为向量C,轮廓特征记为向量P。由于应用的不同,可能想要得到的结果也就不同。通常的做法是为每一种特征都赋一个权值,由于并无确定权值的具体算法,因此只能从反复实验中获得一组合理的。
    聚类的步骤如下:
    (1)由于开始时并无类别之分,因此就将第一个待归类的作为一个类别。
    (2)若待匹配的类别中只有一个元素,则可以用普通

 



    本文将属性论方法应用在图像聚类中,从表1中的结果可以看出该方法的有效性。但是本文提出的算法还存在很多不足,如权值以及相似度阈值的确定都比较依赖于人们的经验值或反复实验所获得的合理值,在无监督的聚类中,将这些值变为程序计算出来是很困难的。实验所用图像库是对物体做360°全方位拍摄所得的图片,本文只对图片做了一种变换(即对称变换)。下一步的工作就是对图像做一个三维的变换来提高聚类的正确率以及减少聚类的次数。
参考文献
[1] 李文佩. 基于定型映射和转化程度函数的汉字识别[D]. 上海:上海海事大学,2004.
[2] 冯嘉礼. 定性映射、基准变换、转化程度函数、人工神经元和集合模糊化[J].模糊数学与系统,2004,18:53-56.
[3] 冯嘉礼. 基于属性坐标学习和分析的核事故评估与决策模型[J].应用基础与工程科学学报,2006,5(14):1-8.
[4] 冯嘉礼. 基于定性映射的程度函数及其诱导的模糊拓扑空间[J].计算机科学,2003,30(5):106-108.
[5] 孙即祥. 图像处理[M].北京:科学出版社,2009.
[6] 谢从华,沈钧毅,宋余庆,等. 一种图像数据库聚类与归类方法的研究[J].控制与决策,2008,6(6):701-704.
 

此内容为AET网站原创,未经授权禁止转载。