文献标识码: A
DOI:10.16157/j.issn.0258-7998.181019
中文引用格式: 杨晓军,钱成. 一种基于电流状态监测分析的系统自我监控管理技术[J].电子技术应用,2018,44(9):79-81,86.
英文引用格式: Yang Xiaojun,Qian Cheng. A self-monitoring and management technology for systems based on real-time current monitoring and analysis[J]. Application of Electronic Technique,2018,44(9):79-81,86.
0 引言
现代社会对信息系统设备的高可靠性、易测试性的要求越来越高,“实时、动态、快速、精确”已成为当今信息系统的新主题。系统健康管理技术日益发展,已成为提高系统高可用性的关键技术之一[1],其基本思想是对系统的关键部件状态进行实时监测,并基于系统的健康管理知识库,进行实时的自主保障诊断、预测与健康管理,从而提高系统的高可用性。
在规则知识自动挖掘获取方面,从数据中挖掘提取规则知识的技术在很多领域取得了成功应用,如:贺林晓利用关联规则挖掘方法提取变电设备故障诊断规则[2];黄常海等人对船舶事故的因果关系数据进行分析挖掘,提取预测和控制船舶事故的关联规则[3]。
电源系统是信息系统的关键部件之一,可以通过对电源系统电流的实时监测与数据挖掘分析,在线实时预测预警系统设备的运行状态,并根据不同运行状态对其进行状态诊断与保障维护,从而提高系统的高可用性。
本文以提高信息系统的高可用性、易测试性为目的,采用健康管理的技术理念,通过对一类系统的电源系统架构改造,增加了电流实时状态监测与诊断知识学习功能,通过对系统设备启动运行中的电流监测,实现了对运行状态的在线自诊断,从而给系统的维护检修提供辅助决策支持功能。
1 基于电流状态监测分析的自我状态监测诊断方法
本文设计的自我监控诊断系统架构如图1所示。其基本思想如下:对系统运行过程中的关键状态数据进行实时在线监测记录,保存到历史数据库中,并通过模式识别、数据挖掘等方法,挖掘提取出数据中潜在的规则知识;然后在系统实际运行中,根据关键状态数据的实时监测值,通过规则匹配及时诊断发现系统设备的异常运行状态,进行预警并提出相应的系统保障预案,以便及时对系统进行维护保障,从而提高系统的可用性。
供电系统是系统的关键部件之一,系统设备的不同工作负荷状态往往对应着一定的电流序列值。图2反映了一个服务器设备在运行大型程序、运行普通程序、系统空闲时的电流变化的动态状态(采样频率为10 Hz)。系统空闲时,电流稳定在一个较小范围内;当运行程序特别是在其运行大型程序或处于CPU占用率较高时,电流会出现明显上升并至一定峰值高度。可以通过对计算机设备电流变化的特征判定计算机的当前基本工作状态。本文即采用对系统设备运行中电流状态的监测与诊断分析的方法来进行系统自我监测诊断。
1.1 电源部件的改进
一些老旧系统的供电系统一般不具备电流状态在线监测分析功能,为了对系统电流进行实时状态诊断分析,本文对现有某系统的电源系统架构进行改进,增加了电源参数监控模块来实时采样记录工作设备的电流数据,对记录的历史数据通过数据聚类分类算法提取系统设备各种运行模式时的电流序列模式知识库,实现基于知识库的系统设备实时监控自我保障预警分析。
在系统架构中,电源是通过多个分线器与不同的工作设备连接来提供,原分线器不具备监控各工作设备电流状态的功能。为了采集记录分析各工作设备的工作电流,本设计增加了一个智能电源记录分析模块,如图3所示,它可以实时采集记录各工作设备的工作电流值的历史数据。
智能分线器按照10 Hz的采样频率对工作设备的电流进行采样记录,并传输给诊断分析仪对数据进行处理。由诊断分析模块从历史数据中挖掘系统设备工作模式的特征知识库,并基于实时采样的电流序列,通过知识库诊断分析系统设备的运行状态。
1.2 系统设备工作模式特征知识库构建
从图2可以看出,设备的每种工作模式对应着一定的电流特征模式,这里采用下列电流特征模型Mt来描述系统的不同工作状态的模式模型:
对系统正常运行中的历史数据进行模式学习,建立模式知识库,当实际运行时的模式与模式库中的正常模式匹配度较低时,则预警设备维护人员,并记录相应的异常模式,以辅助设备维护人员及时进行设备维护保障。
为了获得较高的归纳能力,这里采用模糊数学的模糊值方法来描述电流的状态、窗口的大小。其中,IS表示电流模糊取值为小,IM表示电流模糊取值中,IL表示电流模糊取值为大,IT表示电流模糊取值为特大;WS表示窗口大小取值为小,WM表示窗口大小取值为中,WL表示窗口大小取值为大。相应的隶属度函数曲线如图4所示。
采用这种模型,对于图2表示的某服务器工作模式曲线,可以建立如下的系统正常工作模式知识库:
学习获得系统工作模式的算法流程如下:
输入:电流序列数值ik;
输出:系统工作模式知识S。
begin
(1)计算电流模式窗口Wt:
①当|ik-ik-1|较小时,则将k-1时刻作为Wt的开始时刻;
②当|ik-ik-1|较大,且在模式窗口状态时,将k时刻作为窗口Wt的结束时刻;
③按照W的模糊隶属度函数,计算得出Wt的离散值
(2)统计Wt窗口内系统的电流值:
①去掉Wt窗口的电流状态值中的最大、最小值,然后求其平均值iwt;
②根据电流模糊隶属度函数求iwt的模糊值
(3)计算模式Mt=的支持度Ct:
①累计Mt的模式数;
②Ct=Mt的模式数/总模式数。
(4)由支持度大于阈值的模式组成系统的模式知识库S;
end
1.3 系统工作模式在线自诊断分析
从系统设备的正常运行状态下的电流历史状态数据中,学习建立了系统的正常模式知识库后,就可以根据电流序列的状态模式与知识库中的模式进行匹配,不能匹配的模式则为异常模式,或者人工分析判断为正常时作为正常模式加入模式库。
工作模式自诊断分析算法流程如下:
输入:电流状态值ik,模式知识库S;
输出:系统工作状态。
begin
(1)计算电流模式窗口Wt的模糊值
(2)统计Wt窗口内系统的电流值模糊状态值
(3)计算系统工作模式知识库中是否含有模式没可匹配的模式时,则预警系统存在异常工作状态;
end
2 试验分析
利用上述方法,本设计对某系统的无线通信设备6个月的正常运行中历史记录电流数据进行了学习,建立了系统正常无故障工作状态下的工作模式知识库。对系统中正常运行的无线发射设备以频率10 Hz进行电流采样,通常情况下,在其进行对外话音或数据通信时可以发现明显的电流变化,且每次发射的电流变化过程基本一致。在无线发射设备静默或待机状态,电流相对平稳,当出现话音通信或定期的数据通信时,其电流出现明显的跃升,该电流变化特征可作为该无线发射设备工作状态判定的依据,工作模式知识数据如图5所示。
在一次无线网络互联过程中发现数据通信中断。一般情况下需要排查整个通信链路中参与通信的终端设备、网络交换设备、路由设备、安防设备以及无线通信设备。在增加了电流数据采样后,系统发现该无线通信设备电流数据长时间保持在静默待机状态,与以往运行路由协议进行周期数据发射模式明显不同。
根据系统正常无故障状态下工作模式知识库:S={(IS,WM,0.32),(IS,WT,0.28),(IM,WM,0.10),(IM,WT,0.13),(IL,WM,0.17)},对系统运行中工作状态进行实时在线自诊断分析,并检测出该无线通信设备工作异常状态模式(IL,WS),进一步对该异常进行机理分析后,诊断为一电子器件老化故障。
3 结论
本文基于系统健康管理的思想,以提高系统的自我诊断保障功能为目标,通过对原有电源系统的改造,增加了运行电流状态实时监测记录功能,可以监测系统设备运行中的电流模式特征;建立了电流模式的特征模型,并通过历史数据学习获得正常模式知识库,根据实时运行中的电流模式特征和知识库自我监测诊断,发现异常运行状态,从而可以及时针对相应的异常按照相应异常预案进行维护保障,以提高系统维护的实时性,有利于提高系统的高可用性。
参考文献
[1] 胡茑庆,胡雷,陈凌,等.装备健康管理的现状、未来与挑战[J].国防科技,2015,36(1):10-15.
[2] 贺林晓.基于粗糙集的关联规则挖掘在变电设备故障诊断中的应用[D].北京:华北电力大学,2015.
[3] 黄常海,高德毅,胡甚平,等.基于Apriori算法的船舶交通事故关联规则分析[J].上海海事大学学报,2014,35(3):18-22.
作者信息:
杨晓军,钱 成
(中国电子科技集团第二十八研究所,江苏 南京210007)