衡量数据流趋势的重要指数——Hurst指数
- 格式:doc
- 大小:31.00 KB
- 文档页数:2
Hurst指数以及MF-DFA写在前⾯9⽉的时候说想把arch包加进去,昨⼉发现优矿已经加好了,由于优矿暂时没有开放历史⾼频接⼝,我索性就分享⼀个冷冷的⼩知识:分形市场假说(FMH),分析中玩的是低频数据(⽇线,或者分钟线)。
所谓分形市场假说,就是⼈们发现有效市场假说的种种不合理后,提出的⼀种假说,我曾经有仔细关注过这⼀块,因为这个假说真是太「中国特⾊」了:它有⼏个主要论点:1. 当市场是由各种投资期限的投资者组成时,市场是稳定的(长期投资者和短期投资者),当投资者单⼀时,则市场会出流动性问题; 2. 信息集对基本分析和技术分析来讲短期影响⽐长期影响要⼤; 3. 当某⼀事件的出现使得基础分析的有效性值得怀疑时,长期投资者或者停⽌⼊市操作或者基于短期信息进⾏买卖; 4. 价格是短期技术分析和长期基础分析的综合反应; 5. 如果某种证券与经济周期⽆关,那么它本⾝就不存在长期趋势。
此时,交易⾏为、市场流动性和短期信息将占主导地位。
总之就是⼀个具有「正反馈、⾮线性、分形、混沌、耗散」等等很⽜逼的概念,深深吸引着曾经学过物理学的我。
关于Hurst指数以及MF-DFA现在对于分形市场假说的主要⽅法论就是 Hurst指数,通过MF-DFA(Multifractal detrended fluctuation analysis)来计算,具体的可以维基百科⼀下,⼤体就是当hurst>0.5时时间序列是⼀个persistent的过程,当hurst>0.5时时间序列是⼀个anti-persistent的过程,当hurst=0.5时间序列是⼀个不存在记忆的随机游⾛过程。
⽽在实际计算中,不会以理论值0.5作为标准(⼀般会略⼤于0.5)写在最后这份⼯作来⾃于LADISLAV KRISTOUFEK这位教授在12年的⼯作,论⽂名叫做RACTAL MARKETS HYPOTHESIS AND THE GLOBAL FINANCIAL CRISIS: SCALING, INVESTMENT HORIZONS AND LIQUIDITY这位教授后来在13年把这项⼯作强化了⼀下(加了点⼩波的⽅法),把论⽂的图画得美美哒,竟然发表在了Nature的⼦刊Scientific Report上。
约翰·希尔趋势线指标全文共四篇示例,供您参考第一篇示例:约翰·希尔趋势线指标是一种技术分析工具,广泛应用于股市、期货市场和外汇市场。
它由约翰·希尔于1970年提出,用于辨别市场趋势和价格方向。
希尔趋势线通过一系列数学计算得出,能够帮助交易者识别价格趋势和变化点,帮助他们做出更明智的交易决策。
希尔趋势线指标是一种重要的技术分析工具,它被广泛用于预测价格趋势和市场走势。
在股市、期货市场和外汇市场中,交易者可以利用希尔趋势线指标来制定交易策略,降低风险,提高盈利能力。
希尔趋势线指标的核心概念是将市场价格数据进行平均处理,从而得出反映市场趋势的曲线。
希尔趋势线指标主要包括三条曲线,分别是趋势线、转折线和加速线。
趋势线代表市场的主要趋势方向,转折线代表市场的转折点,加速线则代表市场价格波动的加速程度。
希尔趋势线指标的计算方法比较复杂,但它的应用非常灵活。
交易者可以根据自己的交易风格和市场情况,灵活选择希尔趋势线指标的参数,从而得到适合自己的交易信号。
希尔趋势线指标也可以与其他技术分析工具结合使用,提高交易的成功率和盈利能力。
在实际交易中,希尔趋势线指标可以帮助交易者识别主要的价格趋势,从而制定适当的交易策略。
当市场处于上涨趋势时,交易者可以通过希尔趋势线指标确认并跟随趋势,从而获取更多的利润。
而当市场处于下跌趋势时,交易者则可以通过希尔趋势线指标做空或者进行止损操作,避免亏损。
除了单独使用,希尔趋势线指标还可以与其他技术分析工具结合使用。
交易者可以将希尔趋势线指标与移动平均线、随机指标、相对强弱指标等结合,从而得到更全面的市场分析。
通过多种技术分析工具的协同作用,交易者可以更准确地识别市场趋势和价格波动,制定更有效的交易策略。
作为一种技术分析工具,希尔趋势线指标也存在一定的局限性。
希尔趋势线指标的计算相对复杂,需要一定的数学知识和技术指标的运用经验。
希尔趋势线指标在特定市场环境下可能会出现滞后性,导致交易者错过最佳的交易时机。
基于Hurst指数的股票价格预测方法研究近年来,随着世界经济不断发展,股票交易越来越成为人们的关注点。
对于投资者来说,最关心的是股票的未来走势。
然而,股票交易具有不确定性和随机性,导致预测股票价格非常困难。
在这样的情况下,基于Hurst指数的股票价格预测方法备受关注。
一、Hurst指数的定义和原理Hurst指数是由英国工程师H.E. Hurst提出的一种刻画时间序列长期相关性的指标。
长期相关性意味着序列在不同时间段的波动程度是一致的,即存在自相似性。
Hurst指数越接近于0.5,说明序列的变化趋势随机性越大,反之越小越说明序列的趋势性越强。
因此,我们可以通过计算Hurst指数来判断序列的时间性质。
二、基于Hurst指数的股票价格预测方法在传统股票预测方法中,往往使用技术分析和基本分析等定量手段进行预测,这种方法基于假设市场趋势是由历史价格变化所确定的。
但是,股票价格受到众多因素的影响,单一因素并不能完全反映市场真实情况。
而基于Hurst指数的股票预测方法则是根据行情走势的自相似性去完成预测。
具体来说,其步骤如下:1、将历史价格数据分成许多个时间段。
2、计算每个时间段的Hurst指数。
3、根据不同公司或不同板块的Hurst指数趋势,判断其未来价格走势。
三、实证研究有研究显示,基于Hurst指数的股票价格预测方法在实践中表现良好。
较多的研究都是从时域的角度来分析的,即分析时间序列数据的特征。
比如,中国证券报就曾发表一篇题为《Hurst指数预测股票走势的可行性研究》的文章,通过对上证指数进行分析,发现在短期内进行预测比较准确,但长期预测准确率降低。
其他的研究也支持了这种方法的有效性,尤其是在应用于稳定市场时表现更佳。
四、不足之处虽然Hurst指数在股票预测中的有效性已被证实,但也存在着一些不足之处。
首先,由于股票交易市场的不确定性和随机性,Hurst指数在一定程度上还是受到影响的。
其次,该方法只能反映出历史行情走势的自相似性,而随着新的信息不断涌现,其预测准确性也会跟着变化。
描述混沌的指标全文共四篇示例,供读者参考第一篇示例:混沌是一个具有高度不确定性和复杂性的系统状态,常被描述为无序的、难以理解的状态。
在科学研究和实践中,我们常常需要寻找一些指标来描述混沌系统的特征,以便更好地理解和分析混沌现象。
下面将介绍一些常用的描述混沌的指标。
1. Lyapunov指数:Lyapunov指数是描述混沌系统的一个重要指标,它是衡量系统状态变化速率的指标。
当系统的Lyapunov指数为正时,系统将呈现混沌状态;当Lyapunov指数为负时,系统将呈现稳定状态。
通过计算Lyapunov指数,可以判断系统是否处于混沌状态。
2. 分形维数:分形维数是描述混沌系统结构的一个重要指标,它反映了系统结构的复杂程度。
分形维数越高,系统结构越复杂。
通过计算分形维数,可以揭示混沌系统的结构特征。
3. 自相关函数:自相关函数是描述混沌系统时间演化规律的一个重要指标,它反映了系统状态之间的相关性。
通过分析系统的自相关函数,可以揭示混沌系统的时间演化规律。
4. 峰谱特性:峰谱是描述混沌系统频率分布特性的一个重要指标,它反映了系统在不同频率上的能量分布。
通过分析系统的峰谱特性,可以了解混沌系统的频率分布规律。
以上是一些常用的描述混沌的指标,它们可以帮助我们更好地理解和分析混沌系统的特征。
在实际应用中,我们可以根据具体问题选择合适的指标来描述混沌现象,从而更好地理解混沌系统的特性。
混沌系统是一种具有复杂性和不确定性的系统,通过研究混沌系统的特征和规律,有助于我们更好地理解自然界的复杂现象。
【此为创作文章,仅供参考】。
第二篇示例:混沌理论最早由美国数学家爱德华·洛伦茨提出,它描述了一类非线性动力系统的行为特征。
混沌系统的演化非常敏感于初始条件,即所谓“蝴蝶效应”,微小的扰动可能导致系统的行为出现巨大的变化。
由于混沌系统的复杂性和不可预测性,其研究领域涉及到物理、天文、生物、社会和经济等方方面面。
在混沌系统中,我们需要一些指标来描述系统的混沌程度。
hurst指数第一篇:Hurst指数简介及应用领域Hurst指数是一种用于衡量时间序列数据的长期记忆性的统计量,其应用广泛于金融分析、水文学、信号处理等领域。
本文将对Hurst指数进行详细介绍,并探讨其应用领域。
Hurst指数最初是由数学家H.E. Hurst于1951年提出的,其用于衡量时间序列数据的波动性和相关性。
时间序列数据是指一组按时间顺序排列的观测值,例如股票价格、气温记录等。
Hurst指数的取值范围在0到1之间,其中0表示完全反序列相关,1表示完全正序列相关,0.5表示完全随机。
Hurst 指数越接近于0.5,说明时间序列数据的波动性越接近于随机,没有长期记忆性;而越接近于0或1,说明时间序列数据存在较强的趋势性,即具有长期记忆性。
Hurst指数的计算需要借助于重叠子序列的均值计算,具体步骤如下:首先,将时间序列数据分解成不同长度的子序列;然后,计算每个子序列的均值;最后,计算不同子序列长度下的均值之比。
根据计算得到的比值,可得到Hurst指数。
在金融分析中,Hurst指数常被用于衡量股票价格的长期记忆性和预测性。
通过计算Hurst指数,可以评估股票价格的波动性,进而辅助投资者进行风险管理和决策制定。
例如,当股票价格的Hurst指数较高时,说明价格具有较强的趋势性,投资者可以选择更长期的持有策略,以获得更大的收益。
此外,Hurst指数在水文学领域也得到了广泛的应用。
水文学研究常关注各种水文变量的波动性,例如降水量、水位等。
通过计算Hurst指数,可以评估水文变量的长期趋势,进而为水资源管理、洪水预测等提供科学依据。
除金融分析和水文学外,Hurst指数在信号处理、网络分析等领域也有着重要的应用价值。
例如,对于信号处理,Hurst指数可以用于评估信号的分形特性和自相似性,从而指导滤波、数据压缩等算法的设计与优化。
综上所述,Hurst指数是一种用于衡量时间序列数据长期记忆性的统计量,在金融分析、水文学、信号处理等领域有广泛的应用。
第42卷第2期2021年4月大连交通大学学报JOURNAL OF DALIAN JIAOTONG UNIVERSITYVol. 42 No. 2Apr. 2021文章编号:1673- 9590 (2021 )02- 0114- 06基于改进R/S 估计算法的网络流量长相关性分析荣红佳,盛虎,闫秋婷(大连交通大学电气信息工程学院,辽宁大连116028) **收稿日期:2019-11-17基金项目:辽宁省博士启动基金资助项目(20170520215);辽宁省教育厅自然科学基金资助项目(JDL2019014)作者简介:荣红佳(1993-),女,硕士研究生;盛虎(1978-),男,副教授,博士,主要从事随机信号处理和嵌入式设计的研究E- mail : hu. sheng@ djtu. edu. cn.摘要:R/S 估计算法被广泛应用于随机信号的长相关性分析,但存在准确性和计算效率不高的缺点, 很难应用于信号的长相关性的实时分析.为了提高传统R/S 估计算法的准确度和计算效率,基于R/S估计算法中重新标度的方法进行了优化,并采用分数阶高斯噪声序列和真实的网络流量数据对算法进 行验证.结果表明改进R/S 估计算法在准确度和计算效率上都有明显提升,可以广泛应用于网络流量数 据和水纹数据等具有长相关特性的随机信号实时处理.关键词:R/S 估计算法;长相关;网络流量文献标识码:ADOI : 10. 13291/j. cnki. djdxac. 2021. 02. 022水文专家H. E. Hurst 经过长期研究发现水文 数据存在长相关性(长记忆性),即某一阶段河流流量的数据变化将对以后很长时间的流量数据产 生影响•而在此之前的水文数据研究都忽略了水 文数据长相关性的存在,从而导致数据模型和流 量预测数据不准确*2].为了纪念Hurst 的发现, 使用Hurst 指数来描述一个时间序列的长相关性.H. E. Hurst 1951年提出传统R/S 估计算法对Hurst 指数进行估计,为随机信号的长相关特性分析奠定了基础.Hurst 指数估计在股票趋势分析、网络流量预警、交通调度、反恐战备等领域中起着至关重要的作用•而如今大数据时代的来临,带来了海量的数据资源,更是为Hurst 指数的研究带 来重大的支持•Hurst 指数计算的准确度直接影响着系统模型和预测的准确度,为了提升R/S 估计算法的准 确性,学者们提出了不同类型的R/S 改进算法,对算法性能进行了评价.Mandelbrot B. B.和Wal lis J. R.给出重标极差R/S 估计算法鲁棒性分析⑶;Lo,Andrew W 给出一种改进型R/S 估计算 法,将长相关分析推广到非高斯信号分析⑷;Gi-raitis L 和Kokoszka P 等人于2003年给出一种基于V/S 统计量的重标度方差估计算法,并分析了 算法的可靠性⑸.本文针在对比分析以上研究成果的基础上, 对传统R/S 估计算法中的重新标度方法进行改进和优化,给出一种基于序列长度公约数的改进R/S 估计算法,一定程度上提升了算法准确度和计算速度.此外,将算法应用于真实的网络流量数据长相关特性分析,得到了较好的分析结果.1 Hurst 指数和传统估计算法及相关对比估计算法介绍Hurst 指数用于测量随机序列的长相关或长记忆特性,当H = 0.5时,时间序列就是标准的随 机游走,可以认为现在时刻对未来不会产生影响,时间序列是没有记忆性的同•当0. 5 <H < 1时, 存在状态持续性,时间序列是一个持久性的或趋势增强的序列,时间序列遵循一个有偏的随机过程,偏倚的程度有赖于H 比0. 5大多少,在这种状 态下,如果序列前一期是向上走的,下一期也有大概率是向上走的•当0 < H < 0. 5时,时间序列是 反持久性的或逆状态持续性的,若序列在前一期间向上走,则下一期多半向下走⑷•本节给出传第2期荣红佳,等:基于改进R/S估计算法的网络流量长相关性分析115统R/S估计算法、残差方差估计算法和Higuchi估计算法三种常用算法的简单介绍.传统R/S估计算法提供了一个标准化的时间序列统计方法,用于揭示随机过程中的长期相关性•传统R/S估计算法是目前为止最常用的Hurst指数估计方法之一,基本思路是研究不同时间尺度条件下时间序列的变化,分为不相关的时间序列和相关的时间序列,研究整体与局部之间自相似性客观存在的统计特性•传统R/S估计算法首先将数据分成长度相等且互不重叠的子序列并计算子序列的均值和离差&问,进一步计算极差和标准差得到RS值的标准差,估计得到Hurst 指数.具体的,针对长度为"的时间序列衍严2,…,%,传统R/S估计算法的基本步骤如下:首先对序列进行重新标度,重新标度的参考值集合4”= {1,2,-,n},即将序列按照集合d中的取值分为n组子序列,每个子序列的长度满足:N n=Y(1)d”然后再对以上每个子序列进行特定的运算,最后得出Hurst指数的值.从式1中可知,传统的重新标度方法中参考值的合集取到了从1~n的所有值,或者间隔某一定数量进行取值,两种方法都未对信息进行刻意筛选,前者导致计算量过大,从而计算效率低,后者几乎必然会导致信息的丢失,从而导致计算出现偏差.残差方差估计算法针对长度为n的时间序列衍,%2,…将序列分成大小为m的子块,其中每个子块的部分和为r(t),最小均方线为a+bt,然后计算其余数的样本方差:该方差正比于m",利用log-log图进行最小二乘拟合,得到拟合直线的斜率为2H,进而可以得到Hurst指数的估计值Higuchi估计算法对长度为n的时间序列x1;厠2,…,%,重新构造成一组新的数据:,X(m+k),X(m+2k),—,[N—ml—-—I A),zn=1,2,■•-,k(3)式中,m,%为整数,分别为初始时间和间隔时间.设定时间间隔为k,则可以构造出k组新的序列.Higuchi法的计算公式如下:E(;v-i)/m]X I石泗-石_"1(4)k=\如果给定的序列具有长相关性,那么满足E(Z”($))8Cm2"利用log-log图进行最小二乘拟合,得到拟合直线的斜率为H-2,由此可以得到Hurst指数的估计值H.所以,传统R/S估计算法中重新标度过程对计算量和准确度影响极大•本文就传统R/S估计算法中重新标度过程提出改进,在提升计算效率和准确度方面具有实际的意义.2基于序列长度公约数的改进R/S 估计算法对传统R/S估计算法进行改进,首先对时间序列进行重新标度,重新标度的合理性直接影响其计算自相似序列Hurst指数的准确度,算法在重新标度的过程中,第一要考虑信息的完整性,当序列的长度与份数不能整除时,会有一部分信息丢失,从而造成计算出现偏差;第二要考虑计算的效率,例如将序列完全离散化或者直接使用整个序列进行计算,导致包含的信息量过大而没有计算意义考虑到以上两点,本文给出了一种基于序列长度公约数的重新标度方法,在1~n的分组策略中,利用公约数可以被整除的特性,挑选出了基于序列长度公约数的集合,既保证了计算时不会出现信息丢失,保证了估算的准确度,由于避免了_些没有意义的计算,也一定程度上提高了计算的效率,节省了计算的时间.针对长度为n的时间序列X1,x2,---,x n,算法的基本步骤如下:(1)找到一个略小于序列长度的参考值,其满足为一个非常接近1的数,例如“=0.99,这样可以保证在重新标度时,不会取到整个序列.(2)找到参考值n'公约数的集合d= {di,d2,"',d t},d i=丁(1W i W n')(5)I其中,i为整数,由于d为公约数的集合.同时dl, d2,-,d k大小依次递增,即公约数从小到大进行排列,为了保证序列在重新标度时,每个子序列的长度不至于太小,所以必大于,d min是一个大116大连交通大学学报第42卷小合适的数,例如取d min = 50.(3)对序列进行重新标度,将序列分为k 组子序列,其每个子序列的长度满足Nk ^k其中,d k 取自序列长度公约数的集合.得到子序列(6)X 21X 12X 22X 1N xX 2N 2⑺X k2(4) 计算子序列的均值:-1叫省=7rX V = 1,2,・・・必,叫7=1X 1,2,…,化(5) 计算子序列的离差:⑻Yij =叫 _ 心,i = 1,2,…,k,j=\,2,…,叫(6)计算累积离差:列~y 诡,k=ii = ',2,…,k,j = 1,2,…,化(7) 计算极差:& = max (夠)-min (旬),1 = 1,2,…,k,j = 1,2,…,化(8) 计算标准差:x J r 若厂",2 1,2,…如二1,2,…,化(9) 计算AS 值:码二亍2 1,2,…/(10) 将计算出的各子序列的RS 值求平均:—— 1 k rs = — S rs k 右1并计算其标准差:(9)(10)(11)(12)⑴)(14)(15)(11)对每一次分组按R/S 估计算法得到的统计量£(«S 或SQ.由此得%组数据(logTVJog 抵). 以应他为自变量,lo 歐为因变量,对以上数据做线性回归,得到的直线斜率即为Hurst 指数.H P 'K賢搽W 盒報O3基于序列长度公约数的改进R/S估计算法仿真分析为了分析基于序列长度公约数的改进R/S 估计算法的准确性和计算速度,首先采用功率谱快速 傅里叶变换方法合成分数阶高斯噪声(FGN : Fractional Gaussian Noise ).该合成方法的原理是利用谱合成法构造一定参数的分数阶布朗运动的功率谱密度函数,对功率谱密度函数进行傅里叶逆变换 得到分数阶布朗运动随机序列,经过一阶差分便可得到FGN 随机序列mi .再设定合适的H 参数就可以进行FGN 的仿真过程.仿真合成Hurst 指数分 别为0. 85,0. 8和0. 75的长度为30 000的FGN 序列,图1给出TH =0.75的FGN 序列.420-2-4600.51 1.52 2.5 3序列长度/个xlO 4图1 H = 0.75的FGN 序列使用改进后的R/S 估计算法,对相应H 值的FGN 序列拟合后的结果如图2所示其中,星形折线为应用改进后R/S 估计算法计算的Hurst 值,实线为传统R/S 估计算法拟合值,三角折线为Hurst 指数为0.75的真实值,点划线为多项式拟合后的Hurst 指数估计值,代表了 Hurst 指数的趋势.图2给出了改进R/S 估计算法和传统R/S估计算法计算丹二0. 75的FGN 序列的对比图,图3将图2中局部区域进行放大,并对直线斜率值进行了标注,对比上图中直线的斜率,可以看出点划线代表的改进R/S 估计算法的斜率值更接近 三角折线代表的真实值斜率,计算误差也较传统R/S 估计算法小,当计算H=0. 8和0. 85时的 FGN 序列也可以得出同样的结论.1.8r 1.75 乞1.7 算1651.62.4 2.45 2.5 2.55 2.6 2.65 2.7 2.75图2改进R/S 估计算法对77=0. 75FGN序列的拟合第2期荣红佳,等:基于改进R/S估计算法的网络流量长相关性分析1171.66 1.64—•—改进"s算法估计值仝|走?介一一改进"s算法拟合值科李:U./3-亠真实值/—传统"S算法拟合值罗 1.62斜率:0.74%1.6匕2.42-斜率:0.7432 2.44 2.46 2.48 2.5 2.52图3改进R/S估计算法对H=0.75FGN序列的拟合局部放大图表1本文方法传统Hurst估计算法准确度和计算速度对比算法估计值计算耗时/s传统R/S估计算法0.7432 3.72177=0.75改进R/S估计算法0.74740.381残差方差估计算法0.76120.251Higuchi估计算法0.76190.078传统R/S估计算法0.7806 3.78271=0.8改进R/S估计算法0.79990.369残差方差估计算法0.79350.221Higuchi估计算法0.79260.056传统R/S估计算法0.8617 3.846H=0.85改进R/S估计算法0.84360.367残差方差估计算法0.84090.217Higuchi估计算法0.86310.055s 比其余三种估计算法的准确度更高;在计算耗时方面:四种方法耗时从小到大分别为:Higuchi估计算法、残差方差估计算法、改进R/S估计算法、传统R/S估计算法,改进R/S估计算法虽然速度并不是最快,但是相比传统R/S估计算法计算速度提升较大.4改进R/S估计算法在网络流量数据分析中的应用Hurst指数作为自相似性网络流量的重要指标,对网络流量数据长相关特性的定量研究已成为网络流量特性研究的重点内容,如何快速、有效地估计Hurst指数对于网络流量相关业务的应用具有重要的意义:13_15].为了验证前面所介绍的基于序列长度公约数分段的改进R/S估计算法的有效性,本文采用美国贝尔实验室名为BC-Oct89Ext.TL的网络流量数据结合改进R/S估计算法对自相似性网络流量进行分析和研究•从实际网络流量分别获取五段长度为30000的数据,得到五份原始样本数据并展示其中一份数据样本如图4所示.针对长度为30000Hurst指数分别为0.75、0.8和0.85的FGN序列,采用传统R/S估计算法、改进R/S估计算法、残差方差估计算法、Higu・chi估计算法进行估计并记录估计值和计算速度.表1给出了四种算法在Intel(R)Core(TM)i5-8250处理器,8G内存,MATLAB2016b版本计算机运行得到的估计值和计算耗时数据,对比数据可以看出在准确度方面:改进R/S估计算法计相序列长度/个xio4图4网络流量样本数据利用改进R/S估计算法计算五段网络流量样本数据的Hurst指数,得到的结果如表2所示.表2网络流量样本数据Hurst值数据I数据U数据皿数据IV数据V 改进R/S估计算法0.86880.89590.94910.93640.9753传统R/S估计算法0.97760.9731 1.02350.9620 1.1117残差方差估计算法0.80450.94030.99880.9822 1.0221 Higuchi估计算法0.9985 1.00060.9979 1.00040.9990从表2可知,应用改进R/S估计算法计算的Hurst指数值介于0.5〜1之间,说明网络流量数据具有长期相关性,即该序列具有正的持续性,而且〃值虽然在0.5-1之间但更偏向1,H值越大,说明这种正持续性越强•并且随着H值的增大,网络流量数据具有的长相关性变强•应用传统R/ S估计算法在计算数据HI和V的Hurst指数值时;应用残差方差估计算法在计算数据V的Hurst指数值时;应用传统R/S估计算法在计算数据ID和V的Hurst指数值时;应用Higuchi估计算法在计118大连交通大学学报第42卷算数据H的Hurst指数值时出现了大于1的情况,无法刻画网络流量数据的长相关特性,计算结果没有意义,因此就准确性和有效性来说,改进R/S估计算法计算结果更精准,因此采用改进R/ S估计算法计算得出的Hurst指数值在刻画网络流量数据长相关特性方面显得尤为重要.5结果分析本文在计算准确度以及计算速度方面将改进R/S估计算法和传统R/S估计算法、残差方差估计算法、Higuchi估计算法进行对比,从表1中可以看出,改进R/S估计算法对H值不同的FGN 序列估计结果相比传统R/S估计算法的计算结果更加准确,计算耗时更少,同时改进R/S估计算法相比残差方差估计算法、Higuchi估计算法,其计算结果也更加准确•对传统R/S估计算法进行重新标度是计算自相似序列Hurst指数的_个有力工具,消除了传统R/S估计法中存在的短期依赖性,扩大了长相关序列适用范围•此外,通过对比H值分别为0.75、0.8、0.85时,传统R/S估计算法和改进R/S估计算法计算自相似序列Hurst指数的计算速度分别提升了9.76倍、10.25倍,10.48倍,极大的提升了计算效率.由此可见,利用公约数分段法对比传统R/S估计算法中随机分段法,由于省去了算法内部一些无意义的计算,所以在计算速度上要上升一个档次,在有限的时间内运用改进R/S估计算法计算自相似序列的Hurst指数极大的缩短了运算时间,提高了后续的计算效率.表2给出了五段网络流量样本数据经过改进R/S估计算法和传统R/S估计算法计算得出的Hurst指数值,对比了两种方法,发现无论在准确性还是有效性方面,改进R/S估计算法都优于传统R/S估计算法.6结论传统的R/S估计算法在重新标度方法上存在欠缺,当序列的长度与分段数不能整除时,会有一部分信息丢失,从而造成计算出现偏差,而且传统R/S估计算法在计算长相关序列Hurst指数时效率偏低,无法体现与其他方法在计算序列H值的优势所在•采用公约数分段法对传统R/S估计算法进行重新标度,可以在准确度和效率方面带来明显提升.改进R/S估计算法在网络流量数据分析结果验证了算法的有效性,对网络流量数据长相关性分析提供了_种有效方法.参考文献:[1]陈建,谭献海,贾真.7种Hurst系数估计算法的性能分析[J].计算机应用,2006(4):945-947,950.[2]魏进武,乌|5江兴.网络流量长相关特性估计算法性能评估[J]•计算机工程,2007(2)=22-24,27.[3]MANDELBROT B B,WALUS J R.Robustness of TheRescaled Range R/S in The Measurement of Noncyclic Long-Run Statistical Dependence[J].Water Resources Research,1969,5(5):967-988.[4]LO,ANDREW W.Long-Term Memory in Stock MarketPrices[J].Econometrica,1991,59(5):1279.[5]GIRAmS,LIUDAS KOKOSZKA,PIOTR LEIPUS,et al.Rescaled variance and related tests for long memory in volatility and levels[J].Journal of Econometrics, 2003,112(2):265-294.[6]覃邑龙,应益荣.重标极差方法下时变Hurst指数的构建和实证研究[J].系统管理学报,2011,20(5):620-626.[7]郑珂,郑伟.R/S方法、改进的R/S方法及其对比研究[J].商业时代,2012(8):84-85.[8]LI WAN,JUN DENG,XIAOCHENG DENG,et al.Rescaled Range Analysis and Mineralization Information Extraction[C].Computing,Control and Industrial Engineering(CCIE),2010International Conference on, 2010.[9]MARTHA ISABEL ALMANZA PINZ6N,KARINA L6PEZL6PEZ,CARLOS EDUARDO TeLLEZ VILLA.Aplicaci6n del andlisis de rango reescalado R/S para la predicci6n de genes en el genoma vegetal Rescaled range R/S analysis application for genes prediction in the plant genome[J].Acta Agronomica,2010,59(4):473-483.[10]朱灵蕾,姚远程,姜军,等.Hurst指数估计法中的修正方法研究[J].电子技术应用,2016,42(7):103-106,110.[11]张婷婷.长相关时间序列的Hurst参数估计方法改进及应用[D].大连:大连交通大学,2017.[12] YU XUE,LISI JIA,WEIZHONG TENG,et al.Long-range correlations in vehicular traffic flow studied in the framework of Kerner*s three-phase theory based on rescaled range analysis[J].Communications in Nonlinear Science and Numerical Simulation,2015,22(1/3):102 -104.[13]于海燕•重标极差分析法的研究[J]•数学学习与研究,2019(4):117.[14]张婷婷,盛虎.基于时变Hurst 指数的网络流量分析第2期荣红佳,等:基于改进R/S估计算法的网络流量长相关性分析119[J].变频器世界,2017(3):64-66.behavior]J].Nonlinear Dynamics,2017,89(1):243-[15]CHENHUA SHEN.An analysis for features of geospa-254.tially rescaled range analysis method and spatial scalingAnalysis of Network Traffic Long Correlation based onImproved R/S Estimation AlgorithmRONG Hongjia,SHENG Hu,YAN Qiuting(School of Electrical and Information Engineering,Dalian Jiaotong University,Dalian116028,China)Abstract:Aiming at the disadvantages of low accuracy and computational efficiency and the difficulty to realtime analysis of long correlation of signals,the accuracy and computational efficiency of the traditional R/S estimation algorithm is improved based on the rescaling method.The rescaling method of the R/S estimation algorithm is optimized,and the algorithm is verified by fractional Gaussian noise sequence and real network traffic data.The results show that the improved R/S estimation algorithm has obvious improvement in accuracy and computational efficiency,and it can be widely applied to real-time processing of random signals with long range dependence such as network traffic data and water wave data.Keywords:R/S estimation algorithm;long range dependence;network traffic『卞期待发表文章摘要预报)膨胀石墨作为质子交换膜燃料电池双极板材料研究余丽1,赵志鹏2,卢璐1,史继诚1,徐洪峰1(1.大连交通大学环境科学与工程学院,辽宁大连116028;2,大连交通大学材料科学与工程,辽宁大连116028)摘要:以膨胀石墨、T90密封剂为原料,采用真空加压注密和高温焙烧方法,制备得到膨胀石墨复合材料,并应用于质子交换膜燃料电池双极板.此方法有利于低成本化的模压生产,推动膨胀石墨作为质子交换膜燃料电池双极板材料的商业化发展.结果表明,在真空负压8h后注入密封剂,加压0.7MPa下维持12h.然后先在120%时焙烧4h,在200t时焙烧4h固化密封剂,制备得到改性后的注密膨胀石墨,并对其进行物理表征和化学表征.结果表明:在压力1-4MPa下,注密膨胀石墨的接触电阻为4.4mfl•cm?,小于美国doe标准(10mfl•cm2);相比较原始膨胀石墨,注密后的膨胀石墨比表面减小了48.594m'/g、孔体积减小了0.14cm%;腐蚀电位增加了0.409V,经过拟合后腐蚀电流密度从0.9579|iA/cm2降到0.0008jiA/cn?,耐腐蚀性良好,达到质子交换膜燃料电池双极板的要求.。
衡量数据流趋势的重要指数——Hurst指数
在科技文献搜索引擎中输入赫斯特指数(Hurst exponent),就会检索到大量的研究文章。
我随便以下列出部分论文的题目,或许你就会对这个指数的应用领域会有一个大概的了解。
(1)Using the Hurst’s exponent as a monitor and predictor of BWR reactor inst 用赫斯特指数来检测和预测BWR反应器的不稳定性),该论文发表于Annals of nuclear energy (2)Time-dependent Hurst exponent in financial time series(金融时间序列中的时特指数),发表于Physica A统计力学及其应用分刊;
(3)Can one make any crash prediction in finance using the local Hurst exponen 局部赫斯特指数概念能否预测金融灾难?),该文发表的期刊同上;
(4)Determining the Hurst exponent of fractal time series and its application rdiographic analysis(确定分形时间序列的赫斯特指数以及对心电图数据分析的应用);该文发医学的计算杂志;
等等
可以这么说,只要涉及到数据流(时间序列)的地方,就会出现赫斯特指数。
那么赫斯特指么东西呢?
H.E.HURST( 1900—1978)是英国水文学家。
他在研究尼罗河水库水流量和贮存能力的关系偏的随机游走(分形布朗运动)能够更好地描述水库的长期存贮能力,并在此基础上提出了用重标极方法来建立赫斯特指数(H)。
用这个指数可以作为判断时间序列数据是遵从布朗运动还是有偏的布朗洪水过程是时间系列曲线,具有正的长时间相关效应。
即干旱愈久,就可能出现持续的干旱后仍然会有较大洪水。
这种特性可以用赫斯特指数来表示。
任何一个时间序列都可以得到一个赫斯特指数。
赫斯特指数H的取值一般分为三种情况:(H>0.5;(3)H<0.5。
下面分别就以上三种情形做具体分析。
(1)对于有效市场,价格时间序列可以用布朗运动来描述,此时H=0.5。
由于布朗运动的此这就意味着价格指数的波动不会有系统性的偏差。
在这样的市场中比较适合价值投资者。
(2)1951年,赫斯特研究了75个地球物理现象(特别是水文研究)中的690个时间序列时间序列呈现长期持久性,即所谓的赫斯特效应。
例如赫斯特发现尼罗河的河水在一段时间t内的斯特指数H>0.5,不同于布朗运动,从而激发了科学家对各种自然和社会现象长期记忆性的研究,数学家对分形布朗运动和分形随机过程的研究,从而为实际现象建模提供了数学工具。
对于H>0.5的情形,数据流呈现出正效应,表示未来的趋势与过去一致,H愈接近1,持续观的就是金融市场的牛市或熊市。
处于牛市阶段的证券市场,在大涨之后很有可能会继续大涨,而大跌之后会继续大跌,仿佛时间序列具有记忆性,这使得时间序列呈现出有偏的或者是带趋势的布朗(3)当H<0.5时,数据流具有负效应,表示未来的趋势与过去相反,即大涨之后大跌的可而大跌之后则大涨的可能性会增加。
H愈接近0,反持续性愈强。
以上证综指日收盘值的对数收益率序列为例。
曾经有学者对对上证股票市场结构进行分析,数H的值为0.683,大于0.5,说明上证综指的波动不是随机游走的,而是有偏随机游走,即具有数上一个时刻是上升(下降)的,则下一个时刻上升(下降)的可能性比较大。
而从相对长的时间收益率序列H指数明显下降,接近0.5,即基本遵循随机游走。
这个结论的直观含义是指,如果截取一段时间标度不太大的数据流,那么其赫斯特指数大于说在任何一个时段或者属于牛市或者属于熊市。
而从一个大的时间标度上看,则是牛市和熊市交替目前正处于牛市阶段,因此不要因为手上的股票涨了几天就恐慌,你只管继续持有股票就也收益。
但是从长期来看,如果一直拿着股票不动,那么它迟早是要下跌的,而且一旦下跌,在一个度内,将会持续下跌,也就是说熊市来了。
如果炒股软件能够把赫斯特指数随时显示出来,或许就可以知道什么时候该落袋为安,什么了。