电网设备故障统计数据与电能质量监测数据关联分析
2017-03-15
如今是大数据时代,大数据的价值被越来越多的人所认知与关注。大数据对于电力系统来说既是机遇,也是挑战。本文基于大数据中侧重相关分析的思想,运用数据挖掘中皮尔逊关联分析法分析电能质量各项监测数据与电容器组故障统计数据的相关性,分析的结果表明电压偏差和谐波电压畸变率与电容器组故障的相关性最大,在各次谐波中三次谐波与电容器组故障的相关性最大,与普遍认知一致,从而验证了大数据相关分析在电力系统中运用的有效性。
引言
中华人民共和国国民经济和社会发展第十三个五年规划纲要(简称“十三五”规划(2016-2020年))中提出:“实施国家大数据战略,推进数据资源开放共享”。在这样的背景下,大数据的应用必然会越来越广泛,创造的价值也必然会越来越多。然而,大数据带来的不仅仅是机遇,还有挑战。大数据带来的挑战不仅仅存在于技术方面,更重要的是思想方法和思维方式的变革。
大数据更侧重相关关系的分析,而非因果关系,这是大数据带来的挑战之一。当数据的数学或物理模型不明确时,这一侧重关联分析的思想尤其有效,不同类别数据交叉关联分析不仅能完成从数据到有用信息的转化,完成数据分析与挖掘的基本工作,而且能避免数学或物理模型不确定所带来的分析困难,提升数据的分析挖掘效率。因此,多类别数据交叉关联分析是大数据思想的重要体现,是大数据分析的重要理念之一。
在每天的运行中电网内部都会产生大量的数据,这些数据主要包括以下三种类型:电网设备运行中的监测数据、电网运营数据和电网管理数据。监测数据包括调度运行数据、设备故障与检修数据和GIS数据等;运营数据包括电力市场数据和客户服务数据等电网外部数据;管理数据包括电网内部行政管理的一些数据。由于用户直接与配电网打交道,因此配电网运营数据的数量至少是输电网中运营数据的数量十倍以上。除了电网内部数据,电网外部数据诸如天气数据、互联网数据甚至日后的电动汽车GPS数据都会提供数量极大的数据以供分析和挖掘。
因此,运用大数据的方法对电网相关数据进行分析就显得尤为重要。面对数量和维度都如此巨大的电网数据时,多变量交叉关联分析更能凸显出其优越性。
目前,对电力系统中数据的挖掘与分析仍处于单一类别的分析状态,未将多类别数据联合起来进行分析,导致很多有用的信息无法通过数据分析与挖掘得出。本文基于大数据中侧重相关分析的思想方法,运用皮尔逊相关分析,对电网设备故障统计数据和电能质量监测数据进行大量交叉分组关联分析,分析的结果表明在众多电网设备中,电容器组故障与电能质量监测数据的相关性最强,而在众多的电能质量指标中,电压偏差与三次谐波电压畸变率与电容器组故障的相关性最强,这与普遍认知一致。因此,大数据关联分析可以在电力系统数据中完成从数据向有用信息的转化,验证了方法的有效性。
1 数据来源及关联分析纬度
本文分析所用数据来源为2013年7月至2015年3月某市389个变电站的电能质量监测数据和所有变电站统计的设备故障信息。设备故障数据主要包括110kV及以上变电站内的主变、电容器、电抗器、开关、避雷器、电压互感器、电流互感器、GIS设备、有载调压器和套管等设备的故障记录。每条记录中都包含故障设备所属变电站,故障发生时间,故障类型等信息。将电容器和电抗器归为一类、电压互感器和电流骨干其归为一类,则统计数据中各种类型设备故障发生次数统计如图1所示,所有设备故障中电容器/电抗器发生故障的比重最大,达到42%。
电能质量监测数据包括谐波电压总畸变率、各次电压谐波含有率、电压偏差、电压长时闪变和三相电压不平衡度5个主要指标,包含各个相别中各个指标的最大值、平均值和95概率大值等。将上述两组数据各个分量进行组合型关联分析,关联分析纬度如图2所示。
2 关联分析原理及其流程
2.1关联分析原理
本文的关联分析采用皮尔逊相关分析法,也称为积差相关,是英国统计学家皮尔逊与20世纪提出的一种计算直线相关性的方法。其基本原理是假设存在两个变量X,Y,那么两变量的皮尔逊相关系数可以通过式(1)进行计算。
皮尔逊相关系数的范围为[-1,1],绝对值越接近1,相关性越强;绝对值越接近于0,相关性越弱,相关系数小于0时表示两个变量呈负相关,相关系数大于0时表示两个变量呈正相关。一般皮尔逊系数大于0.2时,可认为两个变量之间存在相关性。
2.2关联分析流程
对电网设备故障统计数据与电能质量监测数据进行关联分析时,首先需要分别对电能质量监测数据和电网设备故障统计数据进行预处理。
对电网设备故障统计数据的预处理包括两个步骤:
挑选出已安装电能质量监测终端的变电站内的设备故障统计数据,并将各变电站内的各类设备故障发生次数进行汇总;
将汇总得到的数据进行归一化处理,变换至[0,1]之间;
由于电网设备故障是瞬时性的,而稳态电能质量监测数据是长期性的。本文针对电网设备发生次数统计与电能质量监测数据进行关联分析,因此只能计及电能质量监测数据的空间特性,忽略时间特性。筛选出对应设备发生故障变电站,并获取其电能质量监测终端的监测数据,对监测数据按以下步骤进行预处理:
整个监测周期内电能质量监测终端监测得到的各电能质量指标最大值作为该变电站的电能质量指标最大值。
将电能质量监测终端按月统计的各电能质量指标平均值在整个监测周期内进行平均,获得该变电站各电能质量指标的平均值。
整个监测周期内容电能质量监测终端按月统计的各电能质量指标95概率大值在整个监测周期内做95概率大值进行计算,作为该变电站各电能质量指标的95概率大值。
对以上三个步骤中计算出的各变电站中各电能质量指标值进行归一化处理,将所有数据变换至[0,1]之间。
通过数据的预处理,电网设备故障次数的统计数据和电能质量监测的各项电能质量指标均映射为[0,1]区间的数值
通过皮尔逊相关分析法计算变量间的皮尔逊相关系数,可获得皮尔逊系数构成的mxn维的关联矩阵,如式(4)所示。
关联矩阵关联矩阵中皮尔逊相关系数大于0.3的两个变量可以认为具有相关性。
总结相关性分析流
电能质量监测数据的预处理按如下步骤进行:
设备故障数据的预处理按如下步骤进行:
将预处理后电能质量监测数据和设备故障数据进行正态分布检验或单峰分布检验,若检验未通过则进行适当的变换使变换后的数据近似服从正态分布或单峰分布,缩小皮尔逊相关系数的计算误差。
将通过正态分布或单峰分布检验的电能质量监测数据和设备故障数据按变电站进行配对,准备计算各组数据的皮尔逊相关系数。
在完成数据的预处理后,对各设备和各电能质量指标进行大范围、多角度的皮尔逊关联分析,由于分析过程较长,故较详细的分析过程不能在文章中给出。分析结果表明,电容器组故障与电能质量的相关性最强,因此,本文分析的重点放在电容器组故障与各电能质量指标相关性的分析。
3 关联分析结果分析
3.1谐波电压畸变率与电容/电抗器组故障统计数据
计算谐波电压各监测项目与电容器组故障数据的皮尔逊相关系数,各相谐波电压监测项目与电容器组故障数据的皮尔逊相关系数的计算结果如表3所示。
各次谐波电压含有率的95概率大值与电容器组故障数据的皮尔逊相关系数的计算结果如表4所示。
对于表3,首先从皮尔逊相关系数的正负性这个角度来分析。各相谐波电压的最大值、平均值与95概率大值都与电容器组故障数据呈正相关,而各相谐波电压合格率与电容器组故障数据都呈负相关,这符合我们的一般认知,说明计算结果合理、有效。其次从皮尔逊相关系数绝对值的大小这个角度来分析。我们可以看出,各相谐波电压监测项目中,谐波电压最大值与电容器组故障数据的皮尔逊相关系数均为最小,95概率大值次之,平均值和合格率均大于之前二者,但平均值与合格率的相对大小因相别的不同而不同。
从皮尔逊相关系数的这个特征我们可以得出,电容器组故障对谐波电压最大值不敏感,皮尔逊相关系数均小于0.1,从数据中无法得出二者存在相关性;而电容器组故障对谐波电压的平均值和合格率较为敏感,皮尔逊相关系数的绝对值均在0.35左右,相关性存在的证据较为明显。因此,从以上分析可以看出,谐波电压对电容器组故障的影响是长期性的,对个别峰值不敏感,若谐波电压长期处在较高水平,易引发电容器组的故障。
各次谐波对电容器组故障的影响可以很清晰地从表4中看出,其中三次谐波的谐波电压95概率大值与电容器组故障数据的相关系数的绝对值最大,达到了0.405,已算中等程度相关,其他各次谐波相关性均比较小。因此,以减少电容器组故障为目标的谐波治理重点在三次谐波。
3.2电压偏差与电容器组故障
计算电压偏差各监测项目与电容器组故障数据的皮尔逊相关系数,计算结果如表5所示。
分析表5中各电压偏差监测项目与电容器组故障的皮尔逊相关系数可以得出,A、B、C三相中A相电压偏差与电容器组故障的相关性最大,A相电压合格率的皮尔逊相关系数达到了-0.448,已属于中等程度相关;B、C相电压偏差与电容器组故障的相关性不明显,数据无法支持二者存在相关性。在A相电压偏差各监测项目中,电压偏差合格率的皮尔逊相关系数的绝对值最大,A相电压最大值的皮尔逊相关系数的绝对值最小,因此,可以得出,在由A相电压偏差引起的电容器组故障中,电压峰值较电压合格率影响较小,电容器组故障对电压偏差的个别峰值不敏感,电压偏差引起电容器组故障是一个长期过程。
3.3电压长时闪变与电容器组故障
计算电压闪变各监测项目与电容器组故障数据的皮尔逊相关系数,计算结果如表6所示。各电压闪变检测项目与电容器组故障数据的皮尔逊相关系数绝对值均很小,无法从现有数据中得到电压闪变与电容器组故障之间存在相关性。
3.4三相电压不平衡度与电容器组故障
完成对三相电压不平衡度数据的预处理后,计算三相电压不平衡度各监测项目与电容器组故障数据的皮尔逊相关系数,计算结果如表7所示。
各三相电压不平衡度检测项目与电容器组故障数据的皮尔逊相关系数绝对值均很小,无法从现有数据中得到三相电压不平衡度与电容器组故障之间存在相关性。
3.5各电能质量项目对电容器组故障的综合对比
综合谐波电压、电压偏差、电压闪变和三相电压不平衡度的皮尔逊相关系数计算结果,选取各电能质量监测数据的最大值,95概率大值,平均值和合格率综合进行对比、分析,对比结果如表8所示。
4 结论
通过对电能质量各监测项目和电网设备故障统计数据的皮尔逊相关分析,可以得到某地区电容器组故障与电能质量的相关性最强,而在各项电能质量指标中,电压偏差和三次谐波电压畸变率与电容器组故障相关性最强,这与普遍认知一致。因此,基于大数据的思想方法,将皮尔逊相关分析应用在电网设备故障关联特征提取这个场景中被证明是成功的。大数据思想方法和相关技术在电力系统其他应用场景中的应用仍需要进一步的探索和研究。
原标题:设备故障统计数据与电能质量监测数据的关联分析