高频数据波动率预测论文
- 格式:doc
- 大小:39.50 KB
- 文档页数:11
中国股票市场波动率的高频估计与特性分析*黄后川(南方基金管理公司 510200) 陈浪南(中山大学岭南学院与中山大学经济所 510275) 内容提要:本文旨在应用高频数据估计中国股市的已实现波动率。
我们发现股票指数与个股的高频交易数据中的微观摩擦影响正好相反,使用极高频的数据会大大增加个股的波动率估计值,相反却会大大降低指数的波动率估计值。
在计算各种频率的已实现波动率的基础上,本文构造了一种较为精确的估计波动率的方法,可以更好地平衡测量误差与微观结构误差。
基于已实现波动率,本文研究了中国股市波动率不对称性和长期记忆特性。
关键词:波动率 高频估计 特征* 本文是国家自然科学基金课题(79800010、70042005)、上交所2002年联合研究计划课题、教育部社科“十五”课题(01j b790026)及2002年厦门大学校级课题成果之一。
一、引言与先前该领域研究述评近二十年来,对波动率模型的研究已成为金融经济学领域研究的重要内容之一。
自Engle 于1982年提出ARCH 模型以来,经济学界已经发表了数千篇关于条件异方差或波动率的论文。
特别是最近十年,一些学者提出用高频分时数据估计波动率的方法,这种方法可以得到比较准确的波动率估计值,称为“已实现波动率”(Realized Volatility )。
以此为基础,众多学者在波动率的特性和预测两方面进行了更深入的研究,大大拓展了这个研究领域。
Andersen 、Bollerslev 、Diebold 、Ebens (1998,2001)等金融经济学家对这种高频估计方法以及“已实现波动率”的特性与预测进行了一系列研究,他们得出了如下几个主要结论(计算的波动率都是日波动率):(1)如果价格遵循普通的扩散过程,用此方法计算的已实现波动率,是无偏的。
而且,当高频数据的时间间隔趋近于0时,已实现波动率的测量误差也趋于0。
因此可以把已实现波动率当作一个观测值,它没有经典算法所带来的时间滞后。
基于HHT的高频数据波动率的估计摘要:鉴于经济学与统计学的研究意义, 在经济学科和统计学科的高频率金融时间序列的分析研究已成为目前研究的热点问题,,高频率金融时间序列的产生中经过计算和研究存在着需要研究的不确定因素,因此对其波动性的估计与分形特征问题的研究对当前股票市场的涨幅和一段时间内的发展的规律,具有非常重要的意义。
即对金融资产的价格随时间的变化而变化的规律探索。
针对此问题高频数据波动率的估计变得越来越重要,结合数据进行实验,采用高频率数据的定义和性质特征,HHT方法、波动率、ARCH模型和SV模型,然后基于Hilbert-Huang 变换的高频率数据波动频率对研究的问题进行进一步估计。
关键词:高频数据波动率;SV模型;ARCH模型;Hilb1.1研究背景及意义1.1.1研究背景近年研究,根据经济学和统计学的研究发展,现在经济和统计界的热点问题之一是高频率金融时间序列的分析研究,即对金融资产的价格随时间的变化而变化的理论与实践的研究和探索。
不确定因素是高频率金融时间序列的产生中存在着需要研究的至关重要的问题,因此对国目前股票市场的结构和规律其波动性的估计与分形特征问题的研究对探究我具有非常重要的意义。
[1-3]。
上海证券交易所、深圳证券交易所自我国上世纪90年代初正式开业以来, 成千上万复杂的股票数据每天每小时每分钟每秒钟都会产生。
随着中国乃至世界的金融股票市场功能与规模伴随着经济发展的速度也不断扩大,高频数据研究分析其的作用变得越来越重要,且变得越来越具有研究意义。
由于近些年随着经济发展,投资股票和金融市场的人越来越多,因此,了解股票价格波动频率是怎么样的、波动范围大小是多少和波动率高低程度成为人们关注的重点。
随着老百姓参与股票市场人数一直在不间断的增加,高频数据在中国当前甚至未来的经济体系中的作用变得越来越重要,经目前各项研究发现股票价格起伏情况和波动规律已经成为中国目前影响社会经济中至关重要的因素,当然股票价格变化的程度和波动的大小也是衡量股票市场发展的重要指标和研究的重要问题。
高频金融数据的波动性建模与预测方法研究提要:本文研究的主题是高频金融数据的波动性建模与预测方法。
文章通过引入波动率概念,介绍了常见的波动性计量模型,包括ARCH模型、GARCH模型等,并对它们的应用进行了分析和评价。
同时,文章还探讨了一些新兴的波动性模型和预测方法,如高频数据波动性预测、机器学习方法等。
通过这些研究,可以提高对金融市场的波动性了解,为投资决策提供参考。
一、引言高频金融数据是指时间尺度较小、更新频率较高的金融市场数据,如分钟级或秒级的价格数据。
研究高频金融数据的波动性建模与预测方法,对于理解金融市场的运行机制、制定投资策略具有重要意义。
二、波动性建模方法波动率是衡量金融市场价格波动程度的指标,建立准确的波动性模型可以帮助我们更好地预测金融市场的未来走势。
常见的波动性计量模型包括ARCH模型、GARCH模型等。
ARCH模型是基于平方收益率序列的自回归模型,它假设价格波动率与历史平方收益率相关。
这种模型通过考虑历史收益率的波动来预测未来的波动情况,具有一定的效果。
但是该模型忽略了平方收益率之间的波动因果关系,无法很好地捕捉到价格波动率的非线性特征。
GARCH模型是在ARCH模型的基础上引入了波动率的滞后项,反映了价格波动率的长期记忆特征。
GARCH模型通过考虑不同滞后期平方收益率对波动率的影响来建模,可以更准确地描述价格波动的特征。
但是GARCH模型也存在较多参数需要估计的问题,对参数的选择和估计较为敏感。
三、应用与评价波动性计量模型在金融市场研究中得到了广泛的应用,为投资者提供了重要的参考依据。
通过对模型参数的估计和模型的拟合优度评价,可以对金融市场的波动性进行有效预测。
然而,传统的波动性模型在处理高频金融数据时存在一定的问题。
首先,高频金融数据具有更快的波动速度和更短的相关性,常见的波动性计量模型往往不能很好地适应这种情况。
其次,高频数据的大量噪音与异常值使得传统模型具有一定的局限性。
高频金融数据分析中的波动率预测模型研究在金融市场中,波动性是衡量市场风险的重要指标之一。
准确预测金融市场的波动率对于投资者制定风险管理策略和决策具有重要意义。
然而,由于金融市场的复杂性和不确定性,波动率预测一直是金融领域研究的热点问题之一。
近年来,随着高频金融数据的广泛应用,有关波动率预测模型的研究也日益增多。
高频金融数据是指以秒或分钟为单位,相对于传统的日度或周度数据更加精细和频繁的数据。
高频数据的特点是信息含量更为丰富,更能反映市场的瞬时变化,因此对于波动率预测具有较高的准确性要求。
这种数据类型的出现为开发更有效的波动率预测模型提供了新的可能性。
在高频金融数据分析中,有多种波动率预测模型被广泛应用。
其中最常见的模型是ARCH(自回归条件异方差模型)和GARCH(广义自回归条件异方差模型)模型。
这两种模型都是基于时间序列的方法,旨在捕捉金融市场波动的长期和短期特征。
ARCH模型建立了波动率和历史波动率之间的关系,而GARCH模型则进一步加入了残差序列的信息,以提高预测能力。
除了传统的ARCH和GARCH模型,近年来还有一些新的波动率预测模型被提出。
例如,随机波动率模型(SV)通过引入随机波动率因子来描述金融市场的波动率变化。
而另一种被广泛研究的模型是波动率跳跃模型(SVJ),它不仅考虑了波动率的变化,还能捕捉到市场中的突发跳跃。
这些新兴的模型在解决普通波动率模型无法解释的异常情况方面具有优势。
在高频金融数据分析中,波动率预测模型的选择并不是一个简单的任务。
不同模型之间的性能比较需要根据具体数据和预测目标来进行。
一种常用的评估方法是计算模型的预测准确度。
对于已知波动率和模型预测值之间的比较,可以使用均方根误差(RMSE)和平均绝对误差(MAE)等指标来衡量模型的准确性。
另外,还可以使用交叉验证等方法来进行模型的选择和比较,以找到最适合的波动率预测模型。
除了模型选择的问题,高频金融数据分析中的波动率预测还面临一些挑战和困难。
特区经济Special Zone Economy 2011年6月股市众议园摘要:本文利用上证综指在2005~2009年内的日间高频数据,通过已实现波动率这一概念对我国股市在这5年间的波动特性做了研究。
进一步地,根据已实现波动率序列的统计特征,对其进行长记忆建模,并对模型的波动率预测效果与常规GARCH 模型的预测效果做了对比分析。
基于上证综指的研究结果表明,利用了日间高频信息的波动率模型在波动率预测上,比仅利用了收盘信息的GARCH 模型更有优势。
关键词:已实现波动率;高频数据;波动率预测Abstract :This paper studies the volatility charac -teristics of China stock market using the intraday high -frequency data of the Shanghai Stock Exchange Composite Index (SSEC)from year 2005to year 2009via the idea of Realized Volatility.Moreover,according to the statistical properties of RV series of SSEC,this paper builds two long memory models on logarithmic RV and compares them with the conventional GARCH model in the domain of volatility forecasting.The analyses results show that the models using intraday high -fre -quency data are better than the model using only daily close price information in forecasting volatility.Keywords :Realized Volatility;High-frequency Data;Volatility Forecasting金融资产收益率的波动率,在构造投资组合、资产定价以及风险管理等方面均有着重要作用。
全球金融危机下的股票市场波动跳跃研究——基于高频数据的中美比较分析全球金融危机下的股票市场波动跳跃研究——基于高频数据的中美比较分析近年来,全球金融市场的不稳定性和金融危机给世界各国的股票市场带来了巨大的挑战。
中美两大经济体是全球最重要的经济体之一,其股票市场的波动情况备受关注。
本文通过对中美两国股票市场的高频数据进行比较分析,探讨全球金融危机对于股票市场波动的影响并研究波动跳跃现象。
一、全球金融危机对中美股票市场的波动影响分析1.1 金融危机前后的股票市场表现对比首先,我们对比了2006年至2008年金融危机爆发前后的中美股票市场表现。
在2006年至2007年期间,中美两国股票市场都呈现出稳定的上涨趋势,投资者普遍乐观。
然而,2008年金融危机爆发后,股票市场出现了剧烈波动,投资者信心受到严重打击。
在危机爆发初期,美国股票市场大幅下跌,标普500指数从2007年的1468点下降到2008年底的752点,跌幅超过了一半。
与此同时,中国股票市场也受到影响,上证指数从2008年初的6000点下降到2008年底的2000点以下。
1.2 波动跳跃现象除了整体市场下跌,全球金融危机还带来了波动跳跃现象。
波动跳跃是指在较短时间内,市场波动率迅速上升,股价的波动幅度大幅增加。
此类现象在金融危机爆发后的中美股票市场普遍出现。
以美国为例,波动跳跃现象在2008年至2009年期间尤为明显。
由于金融危机的爆发,投资者对市场前景持谨慎态度,交易量大幅下降,市场估值不稳定。
这导致了市场波动率的快速上升,标普500指数的日收益率波动跃升。
类似的情况也在中国股票市场出现,波动跃升现象比美国股票市场的变动略晚一些,但波动程度同样惊人。
二、中美股票市场波动跳跃现象的影响因素及波动传导机制分析2.1 经济基本面因素的影响波动跳跃现象的出现与经济基本面因素息息相关。
金融危机的爆发导致全球经济放缓,企业业绩下降,市场预期受到影响,投资者对经济前景的担忧进一步加剧。
基于BP神经网络的股指收益率预测研究——以高频数据为样本第4期(总第115期)2009年4月统计教育StatisticalThinktankNo.4(SeriesNo.115)Apr2009基于BP神经网络的股指收益率预测研究——以高频数据为样本叶银龙黄晓莉刘干摘要:高频金融数据和金融资产收益率是金融计量学的一个全新的研究领域.目前,国内学者利用年,月,日等低频数据对股票市场的收益率进行了很多的研究,但是以日内高频数据为基础的研究还不多见.如何较准确地预测基于高频数据的股票收益率是进一步深入研究金融市场的基础.论文采用数据挖掘中的BP神经网络对沪深300指数高频数据中的日内收益率进行建模与预测.结果表明:神经网络模型对股票高频数据的日内收益率具有很强的预测能力'关键词:高频金融数据;收益率;神经网络;预测ForecastofStockMarketReturnsBasedonBPNeuralNetwork——CaseoftheHigh-FrequencyDataYeYinlong,HuangXiaoli,LiuGanAbstract:Thestudyofhigh-~equencyfinancialdataandstockmarketreturnsisabrandnewfie ldinfinancialeconometrics,however,currentstudiesonfinancialreturnsusuallyuselow-frequencydatar atherthanhigh-frequencydata.Howtobettermeasurestockmarketreturnsbasedonhigh-frequencydataisthebasisoffu rtherstudyinthefinancialmarket.ThispaperattemptstobuildupaBPneuralnetbyusinghigh-frequencydatao ftheShanghaiandShenzhen300Indextoforecastthereturns.Theresultsshowthatneuralnetiscapableofmeasu ringthereturnsofstockmarketbasedonhigh—frequencydata.KeyWords:highfrequencyfinancialdata;returns;neuralnetwork;forecast1引言股票市场的价格走势是极为复杂且难以预测的,这是因为市场参与者难以准确把握宏观经济形势,金融政策,公司财务状况,国际环境以及投资者心理承受能力等因素的变化及其对市场的影响方式和作用.于是,如何较为准确地预测股票收益率引起许多研究者和市场分析人员的极大兴趣,他们都试图建立关于股票收益率适当的计量经济模型.以往很多文献都将股票收益率作为线性时间序列进行建模与预测,具体模型包括自回归滑动平均(ARMA)模型,季节模型及带时间序列误差的回归模型,它们试图用简单模型来刻画股票收益率与时间所拥有的信息之间的线性关系.这些模型的预测有一定的精度,但是模型仅仅局限于线性问题分析,并不能很好地解决股票市场中的非线性问题.随着研究的深入,一些非线性模型被很好地运用到股票市场时间序列上.此外,不少研究表明,门限自回归模型(TAR)及其扩展模型在预测股票收益率时也有较强的能力.近年来,许多学者在尝试着用核回归,局部最小二乘估计及神经网络等非参数方法对股票收益率进行预测.【q其作者简介:叶银龙,1983年生,浙江龙泉人,杭州电子科技大学财经学院统计学硕士研究生,研究方向:金融数据挖掘,神经网络;黄晓莉,1962年生,浙江台州人,杭州电子科技大学财经学院副教授,研究方向:数理统计与经济分析;刘干,1967年生,安徽安庆人,杭州电子科技大学财经学院副教授,研究方向:计量经济与统计建模.第4期叶银龙等:基于BP神经网络的股指收益率预测研究39中,神经网络是目前研究中较为常用的方法.股票市场本质上属于典型的非线性动力学系统,而神经网络模型可以很好地解决这一类非线性问题.与一般的统计模型相比较,神经网络可以不考虑传统统计模型中较多的研究条件与假设,可利用学习训练或设计网络结构的方式处理非线性问题.目前,神经网络模型被广泛地运用到关于股票市场的研究中.AtiyaAF,ChenJF利用股票市场中常用的技术指标或公司金融比率作为变量,通过神经网络学习并搜寻技术指标中可能存在的套利关系,以解决投资者在使用技术指针上的复杂性及消除可能的冲突.嘲嘞aa—soumi采用不同的预测期间,比较方式加以分析神经网络与ARMA模型在股市上价格的估计或应用的优劣.忸MeissnerG在分别采用股价原始信息及技术指标所建立的神经网络模型进行股价预测时,发现原始信息比技术指标更加有效.[51同样地,Chenoweth在采用不同周期的技术指标时,发现以周为单位且训练样本越多时,此时神经网络预测能力最佳,而变量越多并不见得能提高神经网络的预测能力.网众多研究表明,神经网络在股票市场的运用是相当广泛有效的,而且所建立模型的预测能力是非常不错的.不过, 他们的缺陷在于其研究基本上都是针对股票市场的低频数据进行建模,而关于日内高频数据建模的文献非常少.高频数据是指以小时,分钟或秒为抽样频率的日内数据,如果数据频率越高,获得的股票市场信息就越多.而且,股票日内收益率预测得越精确,股票市场波动率将会得到更有效的度量,从而进一步有利于风险管理和控制.因此,基于高频数据的股票日内收益率研究越来越受到人们的关注.基于以往研究的不足,本文以股票市场高频数据为对象,利用BP神经网络对日内收益率进行建模与预测,以寻求精度更高的预测模型,从而可以更好地把握股票市场的波动趋势及有助于市场参与者对证券市场进行风险控制和管理.2BP神经网络模型原理2.1BP模型概述BP(Back—Propagation)神经网络是一类前馈型神经网络,它由输入层,中间层和输出层组成,中间层也就是隐含层,可以是一个或多个.每层包含若干互不连接的神经元节点,相邻层之间各神经元通过不断变化的连接强度或权值进行全连接.图1所示为BP神经网络拓扑结构.其中:输入层有凡个节点,对应输入;输出层有m个节点,对应输出y_;隐含层有q个节点,对应的输出Zl;输入层与隐含层之间的权值,隐含层与输出层之间的权值为茸.Xl*xH"qm图一1BP神经网络基本结构BP网络中隐含层激活函数通常采用s型的对数或正切函数和线性函数.由于激活函数是连续可微的,不仅使得网络的容错性较好,而且可以严格利用剃度法进行推算,权值修正的解析式十分明确[71. 2.2BP学习算法BP学习算法是一种有监督的学习过程,它是根据给定的(输入,输出)样本数据来进行学习,并通过调整网络连接权值来体现学习的效果.就整个神经网络来说,一次学习过程由输人数据的正向传播和误差的反向传播两个子过程构成.设有Ⅳ个学习样本,),Ii}= 1,2,…,Ⅳ,对样本(,Yk'),在正向传播过程中,样本k的输入向量X.,强,…,从输入层的rt个节点输入,经隐含层逐层处理,在输出层的m个节点的输出端得到样本k的网络计算输出向量,,m).比较和样本k的期望输出向量Y:,五,…,),若Ⅳ个学习样本的计算输出都达到期望的结果,则学习过程结束;否则,进入误差反向传播过程,把与】,:的误差由网络输出层向输入层反向传播,在反向传播过程中,修改各层神经元的连接权值阐.BP反向传播算法的具体步骤可归纳如下:(1)输入Ⅳ个学习样本(孔,l,:),k=l,2,…,J7,r.(2)建立BP网络结构.确定网络层数L≥3和各层节点数,由学习样本输人向量的长度rg确定网络输入层节点数为rt;由学习样本输出向量y:的长度m 确定网络输出节点数为m;第z层的节点数为.定义各层间连接权矩阵,第层连接第/+1层的连接权矩阵为:[翱nO×n㈣(f=l,2,…,L一1),初始化各连接权矩阵的元素值.(3)输入允许误差和学习率,初始化迭代计算次数t=l,学习样本序号k=l.叶银龙等:基于BP神经网络的股指收益率预测研究2009生(4)取第k个学习样本,y:),Xk=(x越,…,,y,珐,…,).(5)由孔进行正向传播计算,计算输入层各节点的输出为(q=l,2,…,n)(1)逐层计算各层的各节点输人和输出为n(/-1)职="0q-"(2)=19亏,『)(f=2,…,=1,2,…,(3)(6)计算输出层(第L层)的各输出节点误差为=(4)=1(Y~-yyk)q=l,2,…,(5)(7)若对Ⅳ个学习样本的任一样本k有≤=1,2,…,m),则学习过程结束;否则,进行误差反向传播修改各连接权矩阵.(8)误差反向传播计算.修改第L一1层隐含层至输出层(第层)的连接权矩阵为J_一0孟—f(Jj2(6)Aw(L~0)=叼"0(7)(£+1)=(1)+△)(8)(j=l,2,…,m;=1,2,…,rt(L-))反向逐层修改连接各隐含层的连接权矩阵:n)∑6c(9)q1△c)=一D(1o)O+1)="(+△"O)(11)(f=一1,…,2,16=1,2,…,n田;i=1,2,…,【f_''(9)k=k+l(modN),t=t+1转步骤(4).3样本选取与模型设计.3.1样本选取和分析本文主要针对沪深300指数的Et内高频数据,对其收益率进行建模和预测.所用数据全部来自同花顺股票交易系统,采用沪深300指数2008年7月1日至9月18日每日的1分钟高频数据,共13817个有效样本,其中包括10658个学习样本和3159个测试样本. 本文的研究对象是高频金融时间序列的收益率,并采用下面的公式来表示:=,2,…,n(12)式中-.R为沪深300指数时刻(以1分钟为位)的恢益率,为t时刻的收盘价格,为f—时刻的收盘价格.在金融文献中,资本资产定价模型(CAPM)理论就假定资产收益率序列是不可预测的,应没有自相关性.零自相关系数的检验被用来作为有效市场假定是否成立的判定工具.然而,股价的决定方式和指数收益率的计算方式可导致在观察到的收益率序列中有自相关性,尤其是分析高频数据时.为研究样本时期内高频金融时间序列的计量统计特点,本文采用E—views对该数据进行相关性检验,并得到高频金融数据波动率自相关及偏相关分析如表1所示:表1高频数据收益率相关性检验表A…toD—Iat…123盆r¨jlrn—lati0nAr123Af:口tI:arnh-U…U……日JuIJL^J 20251—012054443o00030o'9—017054494o0004一o15B—El07257964oo0o 5—016800o161B730∞06一口079O05B627420o0070o,7006362936D000 801270o52B5174000090153oo246839400∞100102.002169日3700∞110022—00216990100口0 12—0065—0040704820000 13—0116—00327235日0000 14—0122—00237440500口0 15—0D92—00217SSB400口0 16—00300009756日70[3O0 17口D1B?D口057573,000口180D4B0007760500000190口4日00O576364Oo00 20002500017644B00∞21—0011—000776464000022oo33000376614000023一o034000日767760000 24—0019000576日27口000 250O06oo0876*******26o口37002D770200000 27005400127743100002B00570013778850000 29004000027日1100000300口1B00057日157000031—0005—00037B15000.032一口0.90o137B172000033—000100107B17200口0340016001178207000035003900227e4220o00360o4600047871800∞370o4400107日98300∞从表1可以发现,在0.05的临界水平下,高频金融时间序列收益率与其37阶以内的滞后项存在较为显着的相关性,但是与37阶以后的滞后项不存在明显的相关性.因此,在对高频金融时间序列收益率进行建模时,可以选择当前收益率及其37阶滞后项作为变量.3.2输入,出层的向量确定神经网络不需要任何已知的统计或数学知识描述输入一输出模式间的映像,它是根据已选取的样本数据,通过学习和训练,凭自身的网络结构实现对信息的记忆,然后对测试样本进行预测.因此,在神经网络训练时,训练数据应包含所研究对象的全部模式.即,本文输入向量的各个分量应该选取能充分反映沪深300指数收益率的定量指标.通过对高频金融时间序列波动率相关性表的研究,确立了38个输入层节点(神经元),包括时刻的收益率及其前37分钟每分钟的收益率,即(1),R(2)….,R(37),尺38).输出层是对基于高频数据的收益率进行预测,即以时刻的沪深300指数收益率作为输出神经元.输入及输出变量的样本数据见表2:.第4期叶银龙等:基于BP神经网络的股指收益率预测研究41 3-3隐层神经元数目的确定隐层神经元负责实现非线性样本的线性转换,所以在BP网络设计中具有十分重要的作用.隐含层层数和节点个数可自行指定,一般在神经网络中选择一层隐含层,而确定合适的隐层神经元数目是设计BP网络的关键.在以往的众多研究中,人们总结出一些关于确定隐层神经元个数的经验公式,其中,Mir—chadani认为隐含层单元数.,与输入模式P的关系为: log:P.本文根据Clementine神经网络训练方法中的快速训练法,运用多层感知机模型,确定为一层隐含层,而隐含层的节点数目依据公式max(3,+,20),其中://,为输入节点数;no为输出节点数.根据以上公式,可以计算隐含层的神经元数目为3.3.4激活函数的确定激活函数是一个神经元及网络的核心,网络的预测能力在很大程度上取决于所采用的激活函数.激活函数)的作用是激活神经元,使其对输入产生响应.在实际应用中,可根据需要选取适当的激活函数,常用的是Sigmoid类型的函数.由于激活函数浙具有的非线性特征,使BP算法训练的多层前馈式网络建立了从输入到输出的高度非线性映射,可以表达复杂的客观现象.而且,由于其导数常常可用.)自身表示,所以在误差反向传播的过程中,不需要另外计算激活函数的导数,大幅度地减少了计算量,提高了网络的效率.在实际应用中,通过对股票样本数据的学习训练,可以发现采用f(x)=tanf1/[1+exp(-x)1)作为激活函数,网络的收敛速度最快.4实证结果与分析本文运用SPSSClementine数据挖掘软件,以高频数据为样本对沪深300指数的日内收益率构建BP神经网络模型.其基本过程是,首先将2008年7月1日至8月29日的10658个样本数据作为学习和训练样本,建立一个三层BP神经网络模型,然后用剩余的3159个样本数据作为测试样本,来进行模式识别,再判断神经网络模型对沪深指数收益率的拟合程度及预测效果.用样本数据对神经网络进行训练时,需要网络训练参数进行设置,本文确定动力因子a=O.9,较高的0[ 值有助于避免网络的局部极小值,使神经网络的权数调整更加平滑;预测精度为90%,迭代周期为250次,控制误差取为0.0001.最大容许误差设为0.005,学习步长为0.01,最大训练次数为500.利用上述神经网络及其网络规则,可以得到预测精度为98.72%的神经网络模型.基于已构建的BP神经网络模型,再将其对剩余3159个测试样本进行判断,来验证系统的预测结果.在Clementine中,将BP神经网络加入到测试样本的数据流中,可以得到测试样本相对应的沪深指数收益率预测值.再将收益率预测值和收益率实际值做比较分析,如图2所示:图2收益率实际值与预测值比较从图2可以发现,神经网络模型较好地拟合了测试样本的收益率,仅仅有几个时点预测效果不佳.由于测试样本较大,为了更加直观清楚地判断收益率的预测效果,选取了预测周期第一天的收益率实际值与预测值进行比较,得到图3的时间序列图:,UIUU150200图3股指收益率预测值与实际值时序比较图由图3可见,BP神经网络对于沪深300指数收益率的拟合效果相当不错,就整体趋势而言,网络模型基本上模拟出实际收益率的特征,说明BP神经网络42叶银龙等:基于BP神经网络的股指收益率预测研究2009生对于指数收益率的预测能力是较强的.为检验模型的预测效果,引入MAPE指标,MAPE平均相对误差绝对值的定义为:组合等提供了一个可靠的工具.船:∑l曼l(13)iiI[2】式中,为实际值,为预期值.根据上述公式,计算得到BP神经网络3159个测试样本的MAPE=I.66%,表明神经网络的预测精度非t3J常高,BP神经网络对于高频金融时间序列收益率的预测是有效的,而且预测效果非常好.f415结论与启示股票市场高频数据是当前金融计量研究的热点问题,基于高频数据的股指日内收益率建模与预测对于深入研究证券市场具有十分重大的意义.本文采用数据挖掘中的神经网络对高频数据进行建模与预测,实证研究表明其预测能力是非常有效的,可以有效地模拟出短期的沪深300股票指数时间序列收益率的趋势特征.这不仅仅验证了数据挖掘技术在高频数据中应用的可行性,而且也为进一步测算股票市场波动率与金融领域的衍生工具定价,风险管理与控制及投资参考文献RueyS.Tsay.AnalysisofFinaneeialTimeSeries[M].北京:机械工业出版社,2006.234—263.AtiyaAF.Bankrucypredictionforcreditriskusingneuralnet—works:Asurveyandnewresults.NeuralNetworks,IEEETransac- tionson,2o01,(12):929-935.ChenJF.Analysisofanadaptivetime-seriesautoregressivemov—ing-averagemodelforshort-termloadforecasting.FuelandEner- gYAbstract,1996,(37):108—116.MaasoumiEandRacineJ.Entropyandpredictabilityofstockma卜ketreturns.JournalofEconometrics,2002,(107):291-312. MeissnerGandKawanoN.CapturingtheV olatilitySimpleofOp- tionsonHigh-TechStocks-ACombinedGARCH-NeuralNetwork Approach.JournalofEconomicsandFinance,2001,(25):276-292. ChenowethT.HubataR.LouisRDS.AutomaticARMAidentifica—tionusingneuralnetworksandtheextendedsampleautocorrela- tionfunetion:are—evaluation.DecisionSupportSystems,2000,(19): 21-30.袁曾任.人工神经元网络及其应用【M】.北京:清华大学出版社, 1999.朱大奇,史慧.人工神经网络原理及应用[M】.北京:科学出版社, 2O06.(责任编辑:王锋)上接第33页表3回归模型的参数估计值FromDatatoDecisions.NewYork:Wiley.【31Lambert,D.,Zero-inflatedPoissonregression,withanapplication todefectsinmanufacturing【J】.Teehnometrics1992,(34):1-14. [4】Ridout,M…JHinde,andC.G.B.Demetrio.ASCOretestfortesting azere-inflatedpoissonregressionmodelagainstzero-inflated negativebinomialAlternatives[J】.Biometrics2001,(57):219-23. 【5】Miaou,,Therelationshipbetweentruckaccidentsandgeometric designofroadsection:Poissonversusnegativebinomialregression [J】.AccidentAnalysisandPreventation1994,(26):471-482.【6】MullabyJ.SpecificationandTestingofSomeModifiedCountData Models01.JournalofEconometrics.1986,(33):341-365.【7】Dionne,G.,M.Artis,andM.Gullen.Countdatamodelsfora creditscoringsystem[J1.JournalofEmpiricalFinance.1996,(3):303-25.[8】SASInstituteInc.,SolvingbusinessproblemsusingSASenterprise minersoftware【M】.SASInstituteWhitePaper1998.CaryNC: SASInstituteInc.(责任编辑:宁红)。
基于高频数据的ARCH类模型波动预测比较分析西村友作,门明(对外经济贸易大学国际经贸学院,北京100029)摘要:Realized Volatility是在高频数据的研究基础上发展起来的度量波动率的新方法。
本文以上证综合指数的高频数据为研究对象,采用滚动式样本外一步预测的方法对5种ARCH类模型进行了模型预测能力的比较研究。
主要结论有:(1)Realized Volatility作为解释变量加入GARCH模型后能够提高波动预测精度。
(2)GARCH-RV的波动预测值为Realized Volatility的无偏估计量。
(3)沪市存在波动非对称性与很长的持续性。
关键词:股票市场;Realized Volatility;高频金融时序数据[中图分类号]F830[文献标识码]A[文章编号]1002-4034(2009)01-0039-06一、引言无论金融经济研究还是实际业务应用方面,资产收益率的波动率(volatility)一直扮演着一个非常重要的角色。
目前,波动率已经被广泛应用于在金融资产及其衍生产品定价、金融资产风险管理等各个领域。
然而,波动率是不可直接观测的、具有较强时变性的变量。
因此波动率研究受到许多学者的关注,金融市场波动率的估计和建模研究在过去几十年里成为金融研究领域最为重要的课题之一。
20世纪80年代以来,许多学者对波动率领域进行了大量的研究。
尤其是自Engle(1982)提出自回归条件异方差(Autoregressive Conditional Heteroskedasticity,ARCH)模型,突破了传统计量经济学同方差条件的限制以来,各种波动率模型应运而生,国内外对波动率的研究与应用出现了空前的发展。
波动率模型主要有两大类:ARCH类模型与随机波动率(Stochastic Volatility,SV)类模型①。
虽然该两种模型采用不同的建模方法,然而在抽样频率方面有共同点,即使用日间或更低频率的数据。
波动性的高频指标对收益分布预测能力的影响分析———基于上证综指的高频数据朱万锐,唐大为(中央财经大学 中国金融发展研究院,北京 100081)[摘 要]当今许多金融问题,例如VaR计算、期权定价等,都需要首先对收益率的分布特征有比较准确的描述。
之前的研究发现衡量波动性的高频指标———已实现波动(realizedvolatility,RV)———可以帮助我们更好地预测收益率分布。
文章探究这个结论是否适用于中国市场。
[关键词]高频指标;市场;收益分布;预测能力[DOI]10 13939/j cnki zgsc 2017 18 0631 引 言我们将异质自回归(HAR)模型(Corsi,2009;Andersenetal ,2007)与基准模型EGARCH进行比较,比较的方法是“预测似然度”。
预测似然度是根据已实现收益率预测得出的概率密度,是一种衡量数据与模型吻合程度的指标。
模型的预测能力越好,它的预测似然度就会越大。
平均预测似然度的期限结构能够显示RV在长短不同的预测步数中有多大的作用。
2 数 据本文选取2008年1月1日至2015年12月31日期间上证综指5分钟交易数据作为研究对象。
中国股市的开盘时间为9∶30-11∶30和13∶00-15∶00,所以每个交易日会有48个5分钟交易数据。
对于每个5分钟交易数据,我们计算一个5分钟连续复利对数收益率,并乘以100进行标准化,记为rt,i(i=1,…,I),其中I为第t天里5分钟收益率的个数。
在中国,I通常等于48,但由于会存在一些交易日提前闭市,所以1945个交易日中一共产生了93360个5分钟收益率。
其中,2008—2012年的数据用于模型估计,2013—2015年的数据用于预测,故样本内包含1218个交易日,样本外包含727个。
3 RV定义RV定义为一段时间内收益率的平方和,在股价连续且没有测量错误时,是波动性的一种无偏估计量(Merton,1980)。
高频交易数据的价格波动预测引言随着金融市场的发展和科技的进步,高频交易成为了股市中日益重要的组成部分。
高频交易通过快速的交易决策和执行速度,借助大数据和复杂的算法,来获取微小的价格波动中的利润。
然而,高频交易存在许多挑战,其中之一是准确预测价格波动。
本文将探讨高频交易数据的价格波动预测方法,并介绍一些常用的预测模型。
章节1 高频交易行业概述1.1 高频交易的定义和特点高频交易指的是以极高的速度进行交易的一种策略,通常在毫秒甚至微秒的时间内完成交易。
它依赖于算法和计算机程序来分析市场数据,并采取交易决策。
高频交易具有快速性、低交易成本、高执行效率和高频率交易等特点。
1.2 高频交易对价格波动预测的要求高频交易需要准确预测价格波动,以捕捉微小的利润机会。
对于价格波动的准确预测要求高频交易者分析大量的数据,并快速做出决策。
此外,高频交易需要具备快速的执行速度和稳定的系统,以保证交易的顺利进行。
章节2 高频交易数据的价格波动预测方法2.1 基于统计模型的预测方法基于统计模型的预测方法是最常见的一种方法,它基于历史数据对未来价格波动进行预测。
常见的统计模型包括时间序列模型、回归模型和ARCH/GARCH模型等。
这些模型通过分析历史价格数据和相关因素,识别出价格波动的规律,并预测未来的价格走势。
2.2 基于机器学习的预测方法机器学习在高频交易数据的价格波动预测中起着越来越重要的作用。
基于机器学习的预测方法通过分析大量的数据和特征,构建模型来预测价格波动。
常见的机器学习方法包括支持向量机、随机森林、神经网络和深度学习等。
这些方法具有较好的预测效果,能够捕捉到更复杂的价格波动模式。
2.3 基于自然语言处理的文本分析方法高频交易数据的价格波动预测不仅仅局限于市场数据,还可以包括其他信息源,如新闻报道和社交媒体上的评论。
基于自然语言处理的文本分析方法可以从这些非结构化数据中提取有关市场情绪和预测价格波动的信息。
这种方法结合了文本分析和时间序列模型等方法,可以提高预测的准确性。
高频交易数据的价格波动预测高频交易数据的价格波动预测是金融市场中的重要研究领域之一,通过分析市场中的大量交易数据,可以预测价格的波动情况,为投资者提供决策参考。
本文将通过对高频交易数据的价格波动预测进行深入研究,探讨其原理、方法和应用,并分析其在金融市场中的重要性。
在金融市场中,价格波动是一种常见现象。
投资者和交易员需要准确预测价格的走势,以获取更高的收益。
然而,市场行为受到许多因素影响,并且常常呈现出复杂和随机性质。
因此,通过对高频交易数据进行分析和建模来预测价格波动成为了一种重要方法。
高频交易数据是指以秒或更短时间间隔记录的大量交易记录。
这些数据包含了丰富而详细的信息,包括成交价、成交量、买卖方向等等。
通过对这些信息进行分析,并结合数学模型和统计方法,可以揭示出隐藏在数据背后的规律和趋势。
在进行高频交易数据分析之前,首先需要对数据进行清洗和处理。
由于高频交易数据的特点是数据量大、频率高,其中可能存在噪音和异常值。
因此,需要运用数据挖掘和统计学的方法,对数据进行预处理和过滤,以确保分析的准确性和可靠性。
在预处理过程完成之后,可以运用各种统计学方法和机器学习算法对高频交易数据进行分析。
其中,常用的方法包括时间序列分析、回归分析、神经网络等。
这些方法可以从不同角度揭示价格波动的规律,并预测未来价格的走势。
时间序列分析是一种常见且有效的高频交易数据分析方法。
通过对时间序列进行建模和预测,可以揭示价格波动的周期性、趋势性以及季节性等特征。
常用的时间序列模型包括ARIMA模型、GARCH模型等。
回归分析是另一种常见的高频交易数据分析方法。
通过建立价格与其他相关因素之间的关系模型,并利用历史数据进行拟合和预测,可以揭示价格波动与其他因素之间的关联程度,并为未来价格波动提供参考。
神经网络是近年来在高频交易数据预测中得到广泛应用的一种算法。
通过构建多层神经网络,并利用大量的历史数据进行训练和学习,可以建立起价格波动的非线性模型,提高预测的准确性和稳定性。
作者: 李胜歌[1];唐勇[2]
作者机构: [1]天津财经大学经济学院,天津300222;[2]福州大学管理学院,福建350002出版物刊名: 统计与决策
页码: 129-132页
年卷期: 2010年 第11期
主题词: 高频数据;VaR;“已实现”双幂次变差;持续性
摘要:选取具有良好统计性质的金融波动率估计量来构建VaR,,可以使市场风险的度量更为准确。
高频数据由于比低频数据包含了更多的市场信息.因此基于高频数据的金融波动率估计量更为准确。
但是基于高频数据的波动率估计量为数众多,目前仅有对各个估计量本身性质的比较研究,在应用于VaR的研究中如何选取估计量使得VaR的计算更为准确则不得而知。
因此,文章选取了高频数据下的若干个有代表性的金融波动率估计量,进行VaR值的计算,并对其结果进行了比较研究,同时进行了持续性分析。
通过实证研究表明VaR序列具有持续性,其中由赋权“已实现”双幂次变差计算所得的VaR值更准确.从而为VaR的精确计算和正确建模提供了依据。
高频数据波动率预测论文【摘要】金融市场的交易连续不断,其日内高频数据包含的信息也有一定的差别,除了考虑收盘价这一要素外,日内观测到的最高价、最低价、成交量等因素也要纳入对金融市场的分析中,这样可以获得比单独采用收盘价这一因素进行波动率研究更准确的研究结果。
一、引言随着科技进步尤其是电子计算机技术的发展,对高频数据的记录、收集、存储和操作的时间和金钱成本都大大下降,20实际90年代以来,高频数据的分析与建模得到了迅速的发展,并广泛运用与金融市场微观结构理论的实证研究中。
高频数据能精确到交易日日内分时收盘价,充分保证重要的市场信息不被丢失,使得基于高频数据估计的波动率包含更加丰富的波动信息。
高频波动率与低频波动率的特点不同,呈现出时间序列的负相关性、周期性U型日历效应和长记忆性等,而现有的基于低频数据的ARCH类或SV类模型并不能很好的描述这些统计特征。
对高频波动率的研究已经成为计量经济学领域的一个热点。
深入研究日内高频数据波动率的性质,选择合适的波动率预测模型和金融资产收益率分布来度量中国股票市场的风险,分析市场微观结构对高频波动率的影响,从而为金融机构和监管当局的风险监控提供一种有效的理论方法参考和政策建议具有重大意义。
本文通过选取沪深300指数5分钟交易数据,通过构建目前广泛用于高频数据分析的已实现波动率和已实现极差两个序列,通过R/S法计算Hurst指数,确定两个序列的长记忆性,进而对两者构建了长记忆性的ARFIMA模型,并用这一模型进行了波动率估计,再采用均方根误差和绝对平均误差两个指标对两个模型的预测结果进行了评价。
二、文献综述Engle(2000)为超高频数据或交易的建模应用提供了新的思路。
通过选取的52144条IBM股票的交易数据去为交易的时机建模并测量分析它对价格波动的影响,将ACD模型引入去估计到达比率的相关点过程,同时采用了半参数法去估计调和均数。
实证结果说明对于更长的持续期和更长的预期持续期,其波动会相应的更小。
Andersen (2001)等采用道琼斯工业指数中获取的日内高频交易数据对从已实现日股票收益波动率和相关系数进行研究,他们发现实现方差和协方差的非条件分布是高度右偏,然而实现对数标准差和相关系数却近似于高斯分布,已实现波动率与相关系数表现出了较强的短暂相关性,即所谓的长记忆性。
Andersen(2003)等构建了一个集高频日内数据测量、建模和每日预测和低频收益波动与收益分布的体系,大部分有关金融资产收益波动率、相关性和分布的建模与预测是基于多元ARCH 或者随机波动率模型的潜在限制性和复杂的参数,相比之下,使用由高频日内收益所计算得出的已实现波动率使得建模与预测允许采用传统时间序列方法。
在构造连续时间无套利价格理论与二次方差理论的基础上,他们提出了已实现波动率与条件协方差矩阵的关系。
通过德国马克兑美元和日元兑美元的10年以上的汇率数据的实证分析,他们发现简单的长记忆高斯向量回归对数日已实现波动率在预测上的表现优于许多ARCH类模型与更复杂的高频数据模型。
近年来,许多学者开拓了新的研究高频数据的思路,成果也不断涌现。
唐勇和张世英(2006)通过选取深圳成指的高频数据进行实证分析,通过对比已实现极差与已实现波动率这两个波动估计量,证明了实现极差在波动估计上优于已实现波动率。
此外,在高频数据的“日历效应”问题上,提出了加权已实现极差,并与实现极差作比较,证实了加权已实现极差在估计波动方面更为优秀,为在高频数据中将极差应用于估计波动率拓展了一个新的思路。
Sun(2009)等采用ARMA(1,1)-GARCH (1,1)模型这一参数模型,选取了德国DAX指数的高频数据并融入于列维过程去计算风险价值,并将运用这一方法计算所得的VaR和标准的非参数法计算所得的VaR进行对比,结果显示这一参数法获得了更好的结果。
Lu(2010)等分析了当2005年7月21日人民币再调整时相关货币兑美元的1分钟高频数据的变动,数据分析显示人民币再调整时汇率数据中存在一个大的跳跃,在这一跳跃之后,汇率的收益率存在着大的波动率,此外,外汇数据中一些大的跳跃伴随着这一跳跃发生。
Thanos和Owain(2010)提出了一种处理超高频金融市场数据中样本外预测的多维算法。
在数据统计分析中,对金融时间序列的统计特征采用稳健的平均绝对偏差法去分析,并提出将价位,价格波动和收益分布同时考虑进市场微观结构算法的原理中。
唐勇和刘微(2013)推导出了已实现极差多幂次变差族中最优的波动估计量,根据无偏性和有效性原则作了相应的加权处理,得出了加权估计量,将这些估计量与已实现GARCH相结合,并对此模型进行了拓展。
通过实证分析说明已实现极差四幂次变差是已实现极差多幂次变差族中最优的波动估计量,加权已实现极差四幂次变差能消除高频数据中的日内效应。
雷井生和林莎(2013)改进了统计套利策略,设计了一个新的统计套利策略并进行了实证分析,在新的策略下,运用不同频率数据进行套利统计,分析并得出了新的策略在套利统计上具有良好的绩效,并且样本内的盈利对于样本外的盈利预测性明显增强。
随着对金融高频数据研究的发展,由于高频数据本身所具有的特性如日历效应等,以及使得GARCH模型很难用于高频数据的分析,不同的学者提出与发展了新的适用于高频数据研究的成果,其中比较突出的成果要属已实现波动率和已实现极差这两个被广泛用于高频数据分析的研究成果。
三、方法简述已实现波动率(Realized volatility,简记为RV)由于其计算简便,无需进行模型参数估计(model-free),有助于研究多变量时间序列的波动特征。
同已实现波动率RV一样,已实现极差波动(Realized Range volatility,简记为RRV)也是具有无需模型(model free)和计算简便的波动率估计量,Parkinson(1980)提出了构造极差的表达式,在此基础上Christensen(2005)提出了已实现极差波动。
不同学者和研究人员经过理论和实证上的对比,认为已实现极差是比已实现波动率更为有效的波动率估计量。
下面分别对两者进行定义。
令Pclose(t,i)为日内观测的收盘价,R(t,i)=In(Pclose (t,i)-Pclose(t,i-1))Ht,i=■lnp■,L■=■lnp■,Sp■=H■-L■(t=1,2,,,T,i=1,2,,,N,j=1,2,,,N)上式中,T为研究天数,N为在[t-1,t]内等时间间隔的观测次数,Δ=■,为将[t-1,t]等分为N个时间段的某个小时间段的时间间隔,N取整数则已实现波动率定义为:RV=■R2(t,i),为日内对数收益率平方和的累加。
已实现极差定义为:RRVt=■■Sptj2,为日内最高价和最低价对数平方和的累加。
判定波动率序列是否具有长记忆性的方法主要有时域和频域两个两个方法,本文选择时域角度,以重标极差法(R/S)计算的Hurst 指数来度量波动率序列的长记忆性。
当H≤0.5时,序列{Xt}呈现短记忆性;当H>0.5时,序列{Xt}呈现长记忆性。
针对已实现波动序列{Xt}所具有的长记忆性,本文采用分整自回归移动平均模型(Autoregressive fractionally moving averagemodel,简称为ARFIMA(p,d,q)模型)对已实现类波动率序列进行建模分析。
ARFIMA(p,d,q)模型的具体形式为:φ(L)(1-L)d(Xt-μ)= θ(L)εt其中,μ为序列{Xt}的均值,εt~i.i.d(0,σ2s),φ(L)为P阶平稳回归算子,θ(L)为q阶可逆移动平均算子,它们的根都在单位圆外。
d为分数维滞后阶数,反映的是序列{Xt}的长记忆性。
ARFIMA(p,d,q)的特征主要在于用p+q个参数来刻画序列{Xt}的短记忆特性,用参数d来刻画{Xt}的长记忆特征。
对于ARFIMA(p,d,q)模型的参数估计,可以采用两步参数法:首先估计ARFIMA(p,d,q)模型中的分数维滞后阶数d,并对原序列取分数维差分,得到新的可用于估计的时间序列。
d确定好以后,ARFIMA模型可以当作ARMA模型进行估计,确定剩下的参数p和q。
由于参数d和Hurst指数满足:d=H-0.5,因此可以通过R/S法计算所得的Hurst指数确定参数d,再将模型当作ARMA模型,进行剩下的参数估计。
四、实证过程本文选择沪深300指数作为研究样本,样本选取的区间为2011年4月1日至2014年3月5日,选取的高频数据频率为5分钟的高频数据,数据来源于Wind资讯金融终端,在计算得到的已实现波动率RV和已实现极差RRV后,开始进行实证分析。
实证部分主要用matlab 软件进行。
下表为已实现波动率RRV和已实现极差的描述性统计:描述性统计结果从上表可以看出,无论是已实现波动率RV还是已实现极差RRV,都呈现出尖峰厚尾的特征,相应的JB统计量和括号内的P值都表明上述序列不服从正态分布,且根据偏度和峰度值来看,都呈现出右偏厚尾的特性。
下面对两个序列进行单位根检验,结果如下:单位根检验结果从上表的结果来看,RV和RRV两个序列检验的t统计量在99%的置信水平上都拒绝了原假设,其P值都是足够小的值,因此RV序列和RV序列都通过了检验,这两个序列都是平稳的。
下面对两个序列进行长记忆性检验,结果如下RV和RRV的长记忆性检验从上表可以看出,RV和RRV的Hurst指数0.5<h<1,相应的分数维滞后阶数0<d<0.5,说明这两个序列都呈现长记忆性,因此可以对这两个序列分别建立arfima模型。
< p="">RV序列的估计过程中,通过AIC和SC准则确定的(p,q)为(1,1),则所得到的RV-ARFIMA(1,0.264,1)的具体形式为:(1-0.064L)(1-L)0.264(RV-μ)=(1-0.95L)εt(1.466)(-66.643)RRV序列通过AIC和SC准则确定模型的(p,q)选择为(1,2),则得到的RRV-ARFIMA(1,0.467,2)的具体形式为:(1-0.62L)(1-L)0.467(RRV-μ)=(1-1.362L+0.4L2)εt (7.689)(-12.71609)(5.1173)括号内为相应参数的t统计量。
在构建完所有的模型后,我们对各模型进行波动率预测能力上的比较,比较的标准选择均方根误差(RMSE)和绝对平均误差(MAE)两个指标:RMSE=■■(MV-FV)■■MAE=■■(MV-FV)■其中,MV表示实际的波动率,FV表示模型预测的波动率。
设定预测期为100,就可以得到向前预测100期的预测值,再采用上述两个方法对波动率预测的结果进行评价,两个模型预测的评价结果如下:波动率预测评价对比RRV和RV序列构建的ARFIMA模型在波动率预测上的结果,我们可以发现无论从均方根误差还是绝对平均误差的角度,RRV序列的预测误差都小于RV序列的预测误差,这也从实证上印证了本文在理论上分析RV和RRV在波动率估计上的优劣区别。