《电子技术应用》
您所在的位置:首页 > 通信与网络 > 设计应用 > Hurst指数估计法中的修正方法研究
Hurst指数估计法中的修正方法研究
2016年电子技术应用第7期
朱灵蕾1,姚远程1,姜 军2,秦明伟1
1.西南科技大学 信息工程学院 特殊环境机器人技术四川省重点实验室,四川 绵阳621010; 2.西藏大学 工学院,西藏 拉萨850000
摘要: Hurst参数是表征网络业务量自相似性的重要参数,对突发业务的Hurst参数进行准确的估计能直接影响网络流量控制和缓冲资源分配。详细给出4种Hurst参数估计方法的实现过程,并针对这4种估计方法进行修正。通过估计不同Hurst参数的自相似业务量来对比修正前后估计方法的精度,结果表明采用修正的方法各个估计方法的相对误差都有降低,其中R/S法降低了2个百分点,聚类方差法降低了8个百分点,周期图法和小波分析法相对误差降低了一个数量级。
中图分类号: TN915;TP393
文献标识码: A
DOI:10.16157/j.issn.0258-7998.2016.07.026
中文引用格式: 朱灵蕾,姚远程,姜军,等. Hurst指数估计法中的修正方法研究[J].电子技术应用,2016,42(7):103-106,110.
英文引用格式: Zhu Linglei,Yao Yuancheng,Jiang Jun,et al. Research of the correction methods in Hurst estimations[J].Application of Electronic Technique,2016,42(7):103-106,110.
Research of the correction methods in Hurst estimations
Zhu Linglei1,Yao Yuancheng1,Jiang Jun2,Qin Mingwei1
1.Robot Technology Used for Special Environment Key Laboratory,School of Information Engineering, Southwest University of Science and Technology,Mianyang 621010,China; 2.Engineering Institute,University of Tibet,Lhasa 850000,China
Abstract: Hurst is an important parameter which can characterize the self similarity of network traffic, accurate estimating the Hurst parameters of the burst traffic can directly affects the network flow control and buffer resource allocation. This paper gives a detail implementation of the four Hurst parameter estimation methods, and proposes modified methods for these four estimation methods. The flour estimations before they are modified and after modified are compared though estimating the self similar traffic on different Hurst parameters, results shows that the relative error of each estimation methods reduced by using the modified method. Among them, the R/S method is reduced by 2 percentage points, and the aggregated variance method decreases by 8 percentage points, the relative error of the periodogram method and the wave estimator is reduced by an order of magnitude.
Key words : self-similarity;fractal Gaussian noise;Hurst;R/S method;aggressive variance;wave

0 引言

    越来越多的研究人员致力于网络流量特征的研究,现有的网络流量中都能检测到自相似特性。赫斯特指数(Hurst index,H指数)是描述自相似特性的唯一特征参数,它能刻画网络业务量突发的剧烈程度,影响网络业务量建模的准确度。

    赫斯特指数估计方法的研究开始于国外,起初学者大多数集中在对R/S法(Rescaled Range,R/S)的研究上,后来提出了一些新的H指数估计方法和应用。MARCIN M提出了基于p-variation的估计方法[1],这种方法可以估计单分形布朗运动的H指数。BLYTHE D A J[2]将H指数的估计方法运用到脑电图的分析当中,演示了信号噪声比例在H指数估计中的影响。国内的学者也对H指数的估计方法进行了大量的研究和应用。张广兴[3]将H指数估计方法运用于多尺度下的IP网络流量特征分析与研究。徐凌[4]提出了一种基于Haar小波的Hurst参数估计方法,比传统估计方法的精度有所提高。目前比较常用的自相似业务量估计方法有R/S分析法、聚类方差法、周期图法、Whittle法[5]、小波分析法。其中Whittle法需要在已知序列的谱密度形式的情况下才能对序列进行准确估计,而真实网络业务量的谱密度形式往往是未知的,所以本文只对其他4种方法进行研究。

1 自相似过程及其数学特性

1.1 自相似过程的定义

tx5-1.1-x1.gif

1.2 自相似过程的特征

tx5-1.2-x1.gif

    赫斯特效应:Hurst参数是自相似过程的唯一参数,当H=0.5表明时间序列是随机的,0.5<H<1表明时间序列具有自相似性,网络业务量的H值一般在0.75附近。

1.3 分形高斯噪声模型

    分形高斯噪声[9](Fractal Gaussian Noise,FGN)是目前最为广泛使用的一种自相似模型。FGN序列的自相关函数为:

tx5-1.1-gs1.gif

2 Hurst指数估计法及修正办法

2.1 R/S估计法

2.1.1 原理

tx5-1.1-gs2-5.gif

    对于具有自相似性的序列X有:

tx5-1.1-gs6.gif

2.1.2 R/S修正办法

    在实际应用中m值的设定关系到算法的运算时间和算法的精度。图1是m值的个数与估计方法运算一次所需要的时间关系,自相似业务量长度为216

tx5-t1.gif

    从图1可以看出,m的个数的增加带来了运算时间大幅增加,因此m值的个数应该固定,即m的个数不随自相似业务量序列的长度的增加而增加。同时仿真结果表明R/S法的估计精度不受m的取值个数影响,实验数据见表1。可以通过适当减少m值的个数提高运算速度。本文的仿真都是在自相似业务量序列长度为216,Hurst参数取0.6、0.7、0.8、0.9这4个值的情况下仿真出来的结果。相对误差是分别对设定的4个Hurst参数估计后求得的值求平均的结果。

tx5-b1.gif

    表2是m的最小值与算法的相对误差关系,表2的仿真数据可以看出随着m的最小取值的增加估计法的相对误差降低了2.42%,说明可以通过提高m的最小值的取值来提高R/S法的估计精度,N是自相似业务量序列长度。

tx5-b2.gif

    表3是m的最大值与估计法的相对误差之间的关系,最小值取lgN3,从表3可以看出m值的最大取值偏大时R/S法的估计相对误差较小。

tx5-b3.gif

    综上所述,对于R/S法的修正办法有:(1)m值的个数固定,避免因自相似业务量序列的增加带来的运算量的大幅增加;(2)增大m值的最小取值可以使R/S估计法的相对误差减少2.32%;(3)增大m的最大取值,这种方式也可以提高估计法的精度。

2.2 聚类方差法

2.2.1 原理

tx5-1.1-gs7-9.gif

    绘制对数坐标系下Vn与m的曲线,H=1+a/n,a为斜率,从而可以计算Hurst参数的值。当n=1时对应算法为绝对值法,当n=2时对应算法为方差时间法。

2.2.2 聚类方差修正办法

    同R/S法一样,聚类方差法中m值的选取也可以直接影响估计精度和运算速度。图2是m值的个数与估计方法运算一次所需要的时间之间的关系。

tx5-t2.gif

    从图2可以看出随着m的个数的增加,运算一次估计法所需的时间也大幅增加,所以m值的个数应该固定。表4中等间隔取值就是m在最大值和最小值之间等间隔地取值,不等间隔的取值就是在最小值与最大值之间呈对数取值。表4的仿真结果表明m以不等间距的方式来取值比等间距取值的精度高。从表4也可以看出当m的个数在40左右时精度较高。

tx5-b4.gif

    表5是在m的最小值取不同值时得到的估计误差,N表示自相似业务量序列的长度。从表5可以看出随着m的最小值的增大,估计法的精度逐渐下降。

tx5-b5.gif

    表6是在m的最小值取10的情况下讨论最大值对精度的影响,从表6可以看出m值的最大取值偏小时聚类方差法的估计精度高,即m的最大值的选择应该适当偏小,当取N/500时精度最高。

tx5-b6.gif

    综上所述,对于聚类方差法的修正办法有:(1)m取值的个数固定,避免序列的增加带来运算量的大幅增加;(2)m值不等间隔选取,可以使相对误差降低3个百分比;(3)降低m值的最小取值和最大取值,可以使相对误差降低8个百分比。

2.3 周期图法

2.3.1 原理

    周期图法[10]是一种信号功率谱密度估计方法。对于观测到的时间序列X={X(k),k=1,2,3,…,N},其周期图由下式定义为:

tx5-1.1-gs10.gif

2.3.2 周期图法修正办法

    选择原点附近的点来拟合曲线对周期图法是很重要的,选择过多的点I(λ)与|λ|1-2H失去了正比关系,选择的点过少会影响精度。从表7中可以看出,选择靠近原点15%左右的点进行拟合得到的估计精度是最高的。

tx5-b7.gif

    因此可以总结出对周期图法的修正办法:适当选择靠近原点15%的点进行曲线拟合,这种情况下周期图法的估计误差最小,精度最高。

2.4 小波法

2.4.1 原理

    给定一时间序列X={X(i),i=1,2,3,…,N},对其进行二进制小波变换可以得到信号的近似系数dx(j,k)[11]

    若X(i)为二阶平稳过程,则:

tx5-1.1-gs11-12.gif

其中 C(H,Ψ)是依赖H和Ψ的常数,j是尺度系数。从式(12)可以得出在对数坐标系下拟合一曲线,H=(1+a)/2,a是曲线的斜率。

2.4.2 小波法修正办法

    影响小波估计法精度的因素有两点:(1)小波基的选择;(2)尺度的选择。表8对比了4种小波基在H指数估计当中对精度的影响。Harr小波就是Daubechies小波中阶数为1的情况。

tx5-b8.gif

    从表8中可以看出,小波基和尺度j的选择会影响小波估计法的精度,采用Harr小波基进行小波估计在尺度j=5时小波估计的相对误差最低为0.25%。

    因此,可以总结出两点小波估计法的修正办法:(1)选择Harr和Biorthogonal小波基;(2)选合适的尺度,j=5左右情况下估计法的相对误差最小。

3 结论

    本文针对目前广泛使用的4种自相似业务量估计方法提出了详细的修正的办法。通过设置不同的Hurst参数以及长度为216的业务量序列来测试修正前后估计方法的精度,结果表明采用修正办法可以降低各个估计方法的相对误差,提高估计方法的估计精度,其中R/S法的相对误差降低到1.43%,聚类方差法的相对误差降低到1.30%,周期图法和小波估计法的相对误差降低了一个数量级,小波估计法的相对误差降低到了0.25%。

    下一步的工作:(1)研究这些方法的抗噪性能,改进估计方法,提高鲁棒性;(2)将估计方法采用硬件实现,用于对网络流量的实时检测。

参考文献

[1] MARCIN M,JAKUB K,JUSTYNA W.Estimation and testing of the Hurst parameter using p-variation[J].Journal of Physics A:Mathematical and Theoretical,2013,46(32):2589-2593.

[2] BLYTHE D A J,HAUFE S,M?譈LLER K R,et al.The effect of linear mixing in the EEG on Hurst exponent estimation[J].Elsevier,2014,99(1):377-387.

[3] 张广兴.多尺度下的IP网络流量特征分析与研究[D].长沙:湖南大学,2011.

[4] 徐凌,刘嘉焜,李亮.自相似网络流量Hurst指数估计算方法[J].科学技术与工程,2013,13(20):5848-5854.

[5] 宋春凤.通信网络流量的自相似研究[D].长春:吉林大学,2015.

[6] 李稚春.网络时延的自相似性研究[J].物联网技术,2015,38(4):38-40.

[7] KOROLKO M,SAHINOGLU Z,NIKOVSKI D.Modeling and forecasting self-similar power load due to EV fast chargers[J].IEEE Smart Grid,2015,12(9):508-519.

[8] YOON I,JEON J,PAIK J.Multi-frame example-based super-resolution using locally directional self-similarity[J].Consumer Electronics,2015,12(2);2-4.

[9] DELIGNIERES D.Correlation properties of (Discrete) fractional Gaussian noise and fractional brownian motion[J].Mathematical Problems Engineering,2015,10(8):1-3.

[10] 赵彦仲,吴立文.Hurst指数估计方法的比较和研究[J].计算机工程与应用,2014,50(16):1-3.

[11] 赵彤洲,李德华,吴量,等.基于多尺度小波分析的长程相关性研究[J].华中科技大学学报,2015,43(10):487-488.

此内容为AET网站原创,未经授权禁止转载。