摘 要: 作为一种新的机器学习方法,支持向量机的参数选择没有一个统一的模式和标准。为了克服这一缺点,对遗传算法进行改进,构造一种混沌云自适应模拟退火遗传算法(CCASAGA)对支持向量机回归参数进行优化。该算法将混沌优化、基于云模型的自适应控制机制和模拟退火的Metropolis准则结合起来,并采取精英保持策略加快算法的收敛速度。利用改进后的CCASAGA-SVR预测模型对某股份制银行ATM机现金需求进行预测,并引入GA-SVR模型和BP神经网络模型进行对比,从而证实该预测模型具有更高的预测精度。
关键词: 遗传算法;支持向量机;BP神经网络;预测
支持向量机SVM(Support Vector Machine)最初于20世纪90年代由Vapnik等人首先提出,是一种基于统计学习理论的新型的通用学习方法[1]。支持向量机模型可以用于分类和预测。在应用支持向量机模型进行预测时,对预测精度产生重要影响的参数是:惩罚因子C、不敏感损失函数参数ε和核函数及其参数。因此,本文的预测模型需要利用遗传算法对这3个参数进行优化以提高SVR预测模型的预测精度。标准遗传算法SGA(Standard Genetic Algorithm)存在早熟收敛和易陷入局部最优解的缺陷,主要表现在种群中所有个体状态趋于一致而停止进化,算法不能找到令人满意的解。针对上述缺点,各国学者对遗传算法的编码方式、适应度函数的设计、遗传算子机理等进行深入研究,提出了众多的改进方法,包括免疫遗传算法[2]、基于多样化成长策略的遗传算法[3]和模糊自适应遗传算法[4]等。
本文在前人研究成果的基础上,提出一种混沌云自适应模拟退火遗传算法CCASAGA(Chaos Cloud-based Adaptive Simulated Annealing Genetic Algorithm),使用混沌映射优化遗传算法的初始种群,采用云模型实现交叉概率和变异概率的自适应调整,引入模拟退火避免算法陷入局部最优,并采取精英保持策略,防止进化过程中产生的优秀个体模式遭到破坏,提高了算法的收敛速度。运用CCASAGA对SVR的参数进行优化,寻找到更好的参数值,从而提高模型的预测精度。
1 遗传算法的改进
1.1 利用混沌映射优化遗传算法初始种群
传统遗传算法的初始种群由随机的方法产生,因此每次寻优效果可能不尽相同,且容易导致算法陷入局部最优。本文采用混沌映射优化遗传算法的初始种群,利用混沌变量具有的遍历性、随机性和内在规律性,在一定范围内不重复地遍历所有状态,从而保证种群分布均匀,具有多样性。
3 实验结果
3.1 实验数据
本文数据来源于某股份制银行某市分行ATM交易后台数据库中的取款数据。这里选取某台ATM机2010年12月6日~2012年9月13日的日取款量数据作为研究样本,样本量的大小为648,以前643天数据为训练集,后5天数据为测试集。模型训练完后对后5天的ATM现金需求量进行多步预测,并在测试集上检验模型的预测效果。
3.2 实验的实现和结果
整个模型算法通过MATLAB软件编程实现,其中支持向量机的实现用到了台湾大学林智仁教授团队所编写的Libsvm-3.1工具箱,对遗传算法的改进用到了英国谢菲尔德大学开发的GATBX遗传算法工具箱。整个模型的参数设置如表1所示。
应用前面提出的预测模型对ATM机的现金需求进行预测。首先运用改进后的遗传算法对SVR参数进行优化,寻优过程如图2所示。最终得到最佳的C=0.270 589,γ=9.264 51,ε=0.081 102 7。将最佳参数代入SVR模型进行训练,得到最优的SVR预测模型,用最优模型预测后5天的现金需求量,并与测试集数据进行对比,得到最终的预测结果,如图3所示。
将本文提出的CCASAGA-SVR模型与传统GA-SVR模型及BP神经网络模型[5]预测结果进行对比,如表2所示。
由表2可知,本文提出的CCASAGA-SVR模型预测精度最高,而神经网络模型相对来说预测精度最低。本文对遗传算法改进后,使用CCASAGA-SVR的预测误差比GA-SVR的预测误差降低了约1.03个百分点。然而,本身GA-SVR模型的预测平均精度也在90%以上,这一方面说明采用标准遗传算法对支持向量回归机进行优化也可以得到预测精度较高的预测模型,另外也说明本文对遗传算法的改进是有效的,能够在原来较好的预测效果上进一步提高预测精度。另外,BP神经网络模型的总体预测精度较差,而且预测误差波动范围较大,这可能是由于其在训练过程中产生了过拟合的现象,因此其泛化能力不如支持向量回归机。
参考文献
[1] 曹建芳,王鸿斌.一种新的基于SVM-KNN的Web文本分类算法[J].计算机与数字工程,2010,38(4):59-61.
[2] 王洁,高家全,方志民,等.一种新的免疫遗传算法及应用[J].计算机应用与软件,2010,27(12):89-91.
[3] 袁煜明,范文慧,杨雨田,等.一种基于多样化成长策略的遗传算法[J].控制与决策,2009,24(12):1801-1804.
[4] Guo Yiqiang,Wu Yanbin,Ju Zhengshan,et al.Remote sensing image classification by the chaos genetic algorithm in monitoring land use changes[J].Mathematical and Computer Modelling,2010,51(11):1408-1416.
[5] 李仿华,王爱平,姚丽娜,等.基于遗传优化的RBF-BP 网络的实时故障检测[J].微型机与应用,2012,31(8):90-93.
[6] 戴朝华,朱云芳,陈维荣.云自适应遗传算法[J].控制理论与应用,2007,24(4):646-650.