吴学辉
(运城学院 计算机科学与技术系,山西 运城 044000)
摘要: 针对煤矿瓦斯灾害,提出了将粗糙集理论应用于煤矿瓦斯预警。首先用粗糙集理论对样本数据进行属性约简,找出影响和控制瓦斯的关键属性,然后对生成的决策规则进行约简,最后建立煤矿瓦斯预警模型。通过实际应用证实了该模型是有效的。
关键词:粗糙集;属性约简;决策规则
中图分类号:TP182文献标识码:ADOI: 10.19358/j.issn.1674-7720.2017.06.026
引用格式:吴学辉. 粗糙集理论在煤矿瓦斯预警中的应用研究[J].微型机与应用,2017,36(6):86-88.
0引言
煤矿瓦斯又称煤层瓦斯,是煤矿生产中的有害因素,它不仅污染空气,而且当空气中的瓦斯含量为5%~16%时,遇火即会引起爆炸,造成事故。虽然决策树、神经网络、灰色预测技术等用于煤矿瓦斯预警中取得了比较好的效果,但是仍然有许多需要改进和完善的地方。
粗糙集理论是由波兰教授PAWLAK Z提出的一种数据挖掘新方法[12]。它是一种处理不确定、不完全、不一致信息的有效工具,其核心思想是利用已有的知识库近似刻画不确定或不精确的知识,因此将粗糙集理论引入煤矿瓦斯预警,可以发现隐藏的事故发生机制和诱因,导出分类规则,为煤矿安全生产提供预警。
1粗糙集相关理论
本文研究中所涉及的粗糙集相关理论如下:
定义1一个信息系统S可表示为:S=<U,R,V,f>。其中:U为对象的集合;R=C∪D,C为条件属性集合,D为决策属性集合;V=∪Vr,Vr表示属性r∈R的值域;f:U×R→V是一个信息函数。
定义2(上近似、下近似)令XU,则RX称为X关于R的上近似,表示为:
RX=∪{[x]R∈U/R|[x]R∩X≠}
RX称为X关于R的下近似,表示为:
RX=∪{[x]R∈U/R|[x]RX}
定义3(边界、正域、负域)定义集合X相对于R的边界域为BNG(X)=RX-RX;集合X相对于R的正域POSR(X)= RX;集合X相对于R的负域BNG(X)=U-RX。
定义4(属性核)当R是独立的,且PR,则P也是独立的。当Q独立,且IND(P)=IND(Q),QP为P的简化,虽然P可以有多种简化。P中所有不可省略关系的集合称为P的核,记为COREQ(P)。其中COREQ(P)=∩REDQ(P),P的所有Q约简关系簇为REDQ(P)。
定义5(关系独立、关系依赖)设S=<U,R,V,F>其中P、R为属性,P∈R,IND(R)=IND(R-{P}},则称P在R中是可缺的,否则称P在R中就是不可缺的,如果R中的每个知识都是不可缺的,则称R是独立的,否则就是依赖的。
2粗糙集预测模型的构建
利用粗糙集理论进行数据推理,首先把相关数据整理为信息表的格式,建立相应的特征数据库。知识库中有条件属性和决策属性,然后对条件属性进行约简得到最简规则,最后对决策规则再进行约简,得到预测模型[3]。
2.1属性约简
属性约简是利用约简算法从条件属性中找出对决策属性影响最大的属性[4]。约简算法主要有盲目法和启发式约简算法。由于前者采用穷尽搜索策略,所需要的时间和空间代价较高,实际约简主要采用后者。启发式约简算法中最经典的是基于Skowron差别矩阵属性约简算法,算法描述如下[56]:
输入:决策表;
输出:条件属性C相对于决策属性D的一个约简B
(1)求出差别矩阵Mm×n;
(2)求决策表的相对核CORED(C);令B= CORED(C);
(3)对于任意Cij,i,j=1,2,…,n,如果Cij∩B≠,则Cij=;
(4)对于任意Cij,i,j=1,2,…,n,如果Cij=,则转至步骤(6),否则转至步骤(5);
(5)统计差别矩阵中每个属性出现的次数,然后选出出现次数最多的元素am,令B=B∪{ am},转到步骤(3);
(6)输出B。
2.2决策规则约简
属性约简是数据约简的一部分,经过属性约简的数据依然存在数据冗余[78]。决策规则约简就是利用决策逻辑对决策规则的不必要条件进行约简,从而进一步简化决策规则[9]。
决策规则约简思想简述为:对于每一条决策规则,去掉该规则中的任意条件属性,如果决策表保持一致,则该属性可以去掉,否则予以保留,最终决策表中的每一行对应一条决策规则[10]。
2.3预测模型结构图
综上所述,抽取关键步骤,最终建立的煤矿瓦斯预警模型如图1所示。
3实验结果与分析
应用地点选定为山西同煤集团下属的潘家窑煤矿,瓦斯监测数据全部来自于该煤矿日常监测数据。
3.1信息表的形成
传感器监测的指标共有16项,包括掘进工作面瓦斯浓度、煤层温度、煤层含水量、煤层瓦斯压力、开采速度、煤层透气性系数、煤层破碎性综合特征系数、层间滑动综合系数、煤层及煤厚变化综合特征系数等。为了提高预测的准确率,把记录中的数据过少的记录合并到相关的状态特征向量中,在这些状态特征中,取出8个特征状态作为条件属性,分别为Con1、Con2、Con3、Con4、Con5、Con6、Con7、Con8,对其采用平均离散化方法划分为低、中、高档,分别用数值1、2、3表示。决策属性用D来表示,属性取值为1、2、3、4分别表示为不突出、突出威胁、一般突出、严重突出。
3.2属性约简
实验采用启发式Skowron差别矩阵属性约简算法,约简后的决策表如表1所示。
从约简结果可以看出,属性2、3、5、7是核属性,对决策属性是必要的。其中:K破碎(属性2)为煤体破碎性综合特征系数;K层滑(属性3)为层间滑动综合系数;K煤厚(属性5)为煤厚及煤厚变化综合特征系数;λ(属性7)为煤的透气性系数。
3.3规则约简
对表1采用基于二进制可辨矩阵的决策规则约简,得到最终的决策规则集如表2所示。对表2的决策规则集解释如下:(1)如果煤体破碎性综合特征系数为中,层间滑动综合系数为低,煤的透气性系数为高,则煤矿瓦斯预警结果为不突出。(2)如果煤体破碎性综合特征系数为低,层间滑动综合系数为高,煤的透气性系数为低,则煤矿瓦斯预警结果为一般突出。(3)如果煤体破碎性综合特征系数为低,层间滑动综合系数为低,煤的透气性系数为低,则煤矿瓦斯预警结果为严重突出。(4)如果煤体破碎性综合特征系数为高,层间滑动综合系数为中,煤的透气性系数为中,则煤矿瓦斯预警结果为不突出。(5)如果煤体破碎性综合特征系数为中,层间滑动综合系数为低,煤的透气性系数为低,则煤矿瓦斯预警结果为严重突出。
4结论
本文研究了将粗糙集应用于煤矿瓦斯预警,并建立相应的预测模型。首先利用粗糙集对决策表中的条件属性进行约简,然后对约简后的决策表进行规则约简,提取规则,最终建立瓦斯瓦斯预测模型,并将其应用于煤矿瓦斯预警,取得了很好的效果。
参考文献
[1] QUINLAN J R.Induction of decision trees[J].Machine Learning,1986(1):81-106.
[2] ZIARKO W. Variable precision rough set model[J].Journal of Computer and System Sciences,1993,46(1):39-59.
[3] 余承依,李进金.基于依赖空间的变精度粗糙集属性约简[J].模式识别与人工智能,2014,12(8):1216.
[4] 徐菲菲,毕忠勤,雷景生.基于联合属性重要度的决策风险最小化属性约简[J].计算机机科学,2016,43(6A):40-43.
[5] 李建林,姚一豫,聂明,边长生.基于粗糙集理论的高校教师教学质量评价系统研究[J].计算机应用与软件,2014,45(3):45-47.
[6] 赵洁,梁俊杰,董振宁,等.位运算和核属性快速识别下的粗糙集属性约简算法研究[J].小型微型计算机系统,2015,11(2):155-156.
[7] 陆悠.一种面向增删操作的粗糙集属性约简更新算法[J] 南京师大学报(自然科学版),2015,32(8):23-25.
[8] 张涛涛,薛晔.基于粗糙集属性约简方法的煤矿瓦斯爆炸灾害风险指标体系[J].煤矿安全,2014,45(1):80-86.
[9] 吴尚智.粗糙集和信息熵的属性约简算法及其应用[J].计算机工程,2011,37(7):56-61.
[10] 翟俊海,王熙照,张沧生.基于粗糙集技术的决策树归纳[J].计算机工程与应用,2009,45(11):45-47.