集值信息下的粗集与知识获取
2016-02-21
作者:李兴宽
来源:2015年微型机与应用第23期
摘 要: 在复杂的决策环境中,集值信息是不可避免的。在此情况下,专家往往也能给出满意的决策。从集值信息系统中提取有用的规则,用于增强智能系统的知识库,具有实际意义。粗集是处理不确定信息的有效方法,但它通常适用于完全决策表。本文对粗集理论在集值信息下进行了初步的拓展,为从集值决策表中挖掘知识提供一定的理论基础。
关键词: 粗集;集值信息;规则
0 引言
集值信息系统是不完备的信息系统,传统的关系数据库不支持含集值的元组,但在现实中,集值信息系统又是不可避免的,此时,有些信息往往难以得到。
传统的粗集的研究对象是完全信息系统,它能够有效地利用约简算法分析决策表,提取决策表中属性之间存在的潜在模式。许多学者对空值型的信息系统进行了深入的研究[1-3],得到了一些很好的知识获取方法,但关于集值信息下的粗集的研究却很少。本文研究集值信息下粗集的有关性质及知识获取。
1 集值信息下的粗集
定义1称(U,A,F)为集值信息系统[4]。若U={x1,x2,…,xn}为对象集,A={a1,a2,…,am}为属性集,F={ft,|t≤m}为信息函数集。其中:
ft:U→P(Vt)(t≤m)
Vt为属性at的值域,P(Vt)表示Vt的非空子集全体。
若A=C∪D,C为条件属性集,D为决策属性集(其值域不含集值),则称(U,C∪D,F)为集值决策表。
2 集值信息下近似算子的性质
性质1 设(U,A,F)为集值信息系统,B,C?哿A,X?哿U,则有:
参考文献[1]讨论了完备信息系统下的近似算子的递推公式,对于集值信息下的近似算子,仍有下列递推公式,它们可用于概念的递增获取。
性质2 设(U,A,F)为集值信息系统,。若,则
例1 表1给出了一个协调的集值决策表(U,C∪D,F)
其中U={x1,x2,x3},C={a,b},D={d},Va={1,2,3,4},Vb={1,2},Vd={1,2}
取X={x1,x3},用上述性质2和性质3分析表1,则有:
3 集值信息下的知识获取
定义4 对于集值决策表(U,C∪D,F),t1,t2∈U。若t1∈SB(t2),且C(t1)=C(t2)(即t1与t2的条件属性相同),如果d(t1)=d(t2),则称(U,C∪D,F)是相容的,否则不相容。
定义5 x∈U,BC,若SB(x)di,则称规则x→di是确定的,否则称规则x→di是不确定的,其中di∈U/{d}。
定义6 规则x→di的置信度定义为B(di)=|SB(x)∩di|/|SB(x)|。
当B(di)=1时,规则x→di是确定的;
当B(di)<1时,规则x→di是不确定的。
例2 对于表1给出的集值决策表,下列规则是确定的:
{1,2}→di,{3,4}→d=2,{2}→d=1。
下列规则是不确定的:
{1}→d=1,{1}→d=2。
4 结论
在复杂的决策环境中,集值信息是不可避免的。在此情况下,从集值信息系统中提取有用的规则,用于增强智能系统的知识库,具有实际意义。粗集是处理不确定信息的有效方法,但它通常适用于完全决策表。本文对粗集理论在集值信息下进行了初步的拓展,为从集值决策表中挖掘知识提供一定的理论基础。
参考文献
[1] 张文修,梁怡,吴志伟.信息系统与知识发现[M].北京:科学出版社,2003.
[2] 赵卫东,曹文彬,戴伟辉.不完全信息下的粗集拓展[J].系统工程学报,2002,17(6):45-48.
[3] 李仁璞,王正欧.规则不确定性的几种度量及其相互关系[J].系统工程理论与实践,2004,24(1):68-72.
[4] 张文修,吴志伟.粗糙集理论与方法[M].北京:科学出版社,2001.