摘 要: 在对城市燃气负荷数据特性进行分析的基础上,提出了针对城市燃气负荷量短期预测的思想即分解-组合预测模型,同时提出了三种分解方法对分解-组合预测模型进行了验证。首先在建模之前运用数据挖掘的方法对原始数据集进行了离群点挖掘与修正;其次,为了验证准确性,将三种方法的预测结果与其他单一、组合模型预测结果进行对比;最后为了验证该模型的有效性、适用性,对特殊日期、天气和其另一组燃气负荷量数据集进行了建模和预测,通过对预测值和实际值的误差分析,实验结果进一步验证了分解-组合模型的适应性和准确性。
关键词: 城市燃气负荷量;短期负荷预测方法;BP神经网络;差分自回归移动平均模型;小波分频;分解-组合模型
城市燃气负荷量的准确预测对于智慧型城市智能化燃气系统来说具有重要的作用。传统上,人们运用统计的方法来进行燃气负荷量的预测[1,2]。后来随着更复杂的神经网络模型的出现,人们开始将其用于燃气负荷量的预测[3,4]。近年来,研究者们综合考虑各单一模型的优缺点,提出了众多的组合预测模型,但是这些方法大多仅局限于特定的燃气负荷量数据集的预测或者仅适合于特殊情况下的燃气负荷的预测[5]。
本文在分析前人在短期燃气预测中提出的算法和产生相应误差的原因,以及对城市燃气负荷量的数据特征进行分析的基础上,提出了针对城市燃气负荷量短期预测的思想即分解-组合预测模型,同时提出了三种分解方法对分解-组合预测模型进行了验证。本文中采用的第一组数据样本来自于上海市某地区2005年12月1日至2009年10月31日之间的1 431组数据,前1 424组数据用于建模,后7组数据作为测试样本。
1 分解-组合思想的提出
本文通过研究发现城市燃气负荷量序列具有三种主要特性:趋势性、周期性和随机性。根据这三种特性,本文提出了针对城市燃气负荷量短期预测的思想即分解-组合预测模型。具体建模过程为首先对原始城市燃气负荷量时间序列进行离群点的挖掘与修正,然后对经过离群点处理的序列进行分解,目标是按照燃气负荷量序列的特性来进行分解,即分解为具有趋势性的序列、具有周期性的序列和具有随机性的序列;文中提出了三种分解方法即Eviews分解法、小波分频法和公式分解法,序列分解后再运用适合各个序列特性的算法进行预测;对趋势性序列选取ARIMA进行建模预测,对周期性和随机性序列运用BP神经网络进行建模和预测。最后将各单一模型的预测结果进行组合,得出模型的最终预测结果,同时将此结果与实际燃气负荷量进行误差对比分析。
2 离群点挖掘与修复
历史数据的获取中因为各种因素会造成原始数据的误差。有些表现得相当明显,简单方法即可识别,有些则要采用数据挖掘方法才可识别[6,7]。本文的离群点定义:如果一个孤立点的绝对值大于它前后连续3个点的绝对值中位数的4倍就视为离群点,即如果TS中的一个值如下:
通过统计分析软件Eviews对其进行处理,将燃气负荷量TS分解为3种TS:趋势-循环序列TC、季节性因子SF和不规则要素TR,TR因是不确定因素再次忽略,如图2、图3所示。其中TC和SF属于确定性成分,TR属于不确定成分(故不做预测)。
3.1 ARIMA概述与建模
3.1.1 ARIMA概述
ARIMA是一种可用于描述非平稳序列的方法,它由自回归AR(p)、差分I(d)和滑动平均MA(q)三部分组成,p表示模型的自回归阶数、d表示非平稳序列转化成平稳序列的差分阶数、q表示模型移动平均阶数。以p、d、q为参数的ARIMA(p,d,q)模型为:
3.2 BP神经网络概述与建模
3.2.1 BP神经网络概述
BP神经网络是基于反向传播算法的多层前向网络,包括输入层、隐含层和输出层,上下层之间实现全连接,而每层神经元之间无连接。输入信息从输入层经过隐含层传向输出层,如果在输出层得不到期望输出,则反向传播,将误差信号沿原来通路返回,通过学习来修改各层神经元的权值,使误差信号最小。
3.2.2 BP神经网络建模和预测
本文的神经网络的输入神经元采用了当天的最高气温、最低气温、当天的平均温度、天气情况,还有前三天的燃气负荷值,将当天的燃气负荷值作为网络的输出。由样本的构造方法可知,输入层神经元的个数为7,输出层神经元的个数为1。本文采用试凑法最终确定隐含层神经元数目为15。因此本文采用的神经网络模型为BP(7,15,1)。在BP神经网络的输出层函数、隐含层函数以及训练函数分别选择了线性-purelin函数、正切S型神经元-tansig函数和trainlm函数。最终得到E=-0.0027。预测结果最后进行反归一化处理得到SF的预测值。
最终得到的a1的MAPE为0.776%,同样的预测方法得到a2~a5的MAPE分别为0.784%、0.802%、0.821%、0.833%。
对上述分解得到的细节序列di本文采用BP神经网络对其进行建模和预测。其方法和参数与3.2节相似。最终得到d1的MAPE为0.001 549%。用同样的方法预测得到d2~d5的MAPE为0.001 77%、0.004 649%、0.000 929 4%、0.000 444 8%。
燃气负荷的逼近序列和细节序列的预测结果进行合成即得到最后的预测结果。
5 公式分解法
5.1 对趋势性的识别与处理
文中提出了一个通用的去趋势方法:将序列分割成段,段的长度等于季节性的长度即12个月序列。在各段中每个历史观察值减去各段的历史观察值的均值。设{m1,m2,…,mk}是一个序列的第K段,L是这个季度的长度,去趋势系列dti和原始序列xi关系如下:
采用和上述同样的原理进行建模和预测。最后为了突显出分解-组合模型的有效性,将模型和其他几种预测方法的预测结果进行对比分析,如图7所示。
对比可以发现,在总体上分解-组合模型中的小波分解效果最好。对于温度和天气突变以及节假日等特殊日期的日燃气负荷值进行预测。采用小波分解组合方法进行建模和预测与其他两种方法预测的结果进行对比分析,如表1和表2所示。其中MAPE、RESE分别为平均相对误差和绝对值均方根误差,值越小,预测效果越好。
从上述对比表中可以看出,三种方法中预测精度最好的是小波分解法,其次是BP神将网络,最后是基于信息熵的组合模型。
通过采用本文提出的分解-组合模型对城市燃气负荷量数据进行短期的预测可以更加准确有效地预测出城市燃气短期负荷量,从预测的燃气负荷量与实际的燃气负荷量的对比可以看出,本文采用方法的预测值基本可以满足日常工程的实际需求,可以给调度决策以及调度员提供有利的参考和帮助。
参考文献
[1] 窦东阳,赵英凯.利用ARIMA改进HHT端点效应的方法[J].震动、测试与诊断,2010,30(3):42-45.
[2] 胡莘,程良伦.一种基于ARIMA的无线传感器网络链路质量预测方法[J].计算机应用与软件,2012,29(6):46-50.
[3] 陈政,杨天奇.基于RBF神经网络的股票预测[J].计算机应用与软件,2012,29(6):108-111.
[4] 孙莉,翟永超.基于灰色BP神经网络的服装面料规格参数预测[J].计算机应用与软件,2012,29(7):154-157.
[5] Li Yuhong,Chen Yue.Grey system theory based parallel combination forecast method and its application[A].IEEE International Conference on Grey Systems and Intelligent Services[C].Nanjing:IEEE Computer Society,2009.
[6] ADYA M,COLLOPY F,ARMSTRONG J S,et al.Automatic identification of time series features for rule-based forecasting[J].Int.J.Forecast,2010,17(2):143-157.
[7] Wei Zhongyan.Toward automatic time-series forec-asting using neural networks[J].IEEE Transactions on Neural Networks and Learning Systems,2012,23(7):1028-1039.