上证50指数的统计套利模型(doc 11)
- 格式:doc
- 大小:2.72 MB
- 文档页数:19
基于高频数据阈值协整模型的上证50股指期货期现套利研究1. 引言1.1 研究背景2000股指期货和股票期指是金融市场中的两种重要工具,它们之间存在着一定的关联性。
在我国资本市场快速发展的背景下,股指期货市场也相应得到了快速的发展。
在这一市场上存在着很多套利机会,尤其是在股指期货与股票市场之间的期现套利方面。
股指期货和股票市场之间的关系是一个复杂的系统,在这个系统中,高频数据起着关键的作用。
随着信息技术的不断发展,高频数据的应用范围越来越广泛,尤其是在金融市场中的应用。
高频数据可以更准确地反映市场的变化,为投资者提供更多的交易机会。
基于高频数据的阈值协整模型在股指期货期现套利研究中具有重要意义。
通过对上证50股指期货期现套利进行研究,可以更好地理解股指期货与股票市场之间的关系,为投资者提供更多的投资策略。
这也是本研究的背景和动机所在。
1.2 研究目的本研究的目的是通过基于高频数据阈值协整模型的方法,探讨上证50股指期货期现套利的可行性。
具体来说,我们旨在分析高频数据在股指期货交易中的应用,研究阈值协整模型在套利策略中的效果,探讨上证50股指期货期现套利的具体方法,并通过实证分析验证该策略的有效性。
通过本研究,我们希望为投资者提供一种基于高频数据和阈值协整模型的股指期货套利策略,为投资者提供更多的交易决策参考,提高投资回报率并降低风险。
本研究也旨在为相关学术研究提供实证依据,并为未来相关研究提供借鉴和参考。
1.3 研究意义研究意义:本研究旨在通过基于高频数据阈值协整模型的研究方法,探讨上证50股指期货期现套利的可能性和风险控制策略,为投资者提供更为准确和有效的套利决策参考。
随着金融市场的不断发展和创新,股指期货与现货市场之间的互动关系日益密切,套利机会也不断涌现。
深入研究上证50股指期货期现套利的模型和方法,对于投资者在市场中获取收益、降低风险具有重要意义。
高频数据成为金融市场监测和分析的重要工具,其精准度和时效性高,能够更好地反映市场变化和交易行为。
收稿日期:2006年09月10日基金项目:本文得到04年教育部重大项目(05JJ D 790005)、05年国家社会科学基金项目(05B J Y100)、05年国家自然科学基金项目(70573040)、 吉林大学 985工程!项目∀资助。
文章编号:1002-1566(2007)05-0908-09统计套利模型研究###基于上证50指数成份股的检验韩广哲 陈守东(吉林大学数量经济研究中心,吉林大学商学院,长春130012)摘要:本文借鉴协整的思想,并采用比协整回归更一般化的方法来研究股票之间的统计套利模型。
采用逐步回归法来确定合适的定价子空间与证券组合,并将统计套利模型应用于上证50指数的50个成份股,并使用方差比分析来检验可预测性,其结果表明随机去势后的股票价格序列明显偏离随机游走,存在着可预测成分。
联立方程模型的估计结果表明错误定价趋于在短期内形成趋势,而在更长时间内回复。
样本外绩效对交易费用水平的变动非常灵敏,机构投资者的年夏普比为1.3。
关键词:统计套利模型;错误定价;方差比分析;均值回复中图分类号:F 830.91文献标识码:AA M odel Study of Statistical Arbitrage###A Test Based on C onstituent Shares of Index Shangz heng 50HAN Guang zhe ,C H EN Shou dong(Q uantitative Econom ic R esearch C enter ,Busi ness Schoo l o f Jili n U niversity ,Changchun ,130012)Abstrac t :W e adopt the idea o f Co i ntegrati on and apply t he m et hods t hat are m ore genera lized t han co i n teg ra ti on re g ressi on to st udy t he Stati stica lA rbitrage M ode l s o f the securities .W e use t he m ethod of stepw ise reg ressi on to i denti fy the appropriate subspace f o r pr i c i ng and the stock po rtfo lios fro m the Constituent Shares of Index Shang z heng 50。
上证50pb计算方法
上证50指数是由上海证券交易所编制的一种反映中国A股市场
上市公司股价综合变动情况的股票指数。
而上证50PB(Price-to-Book Ratio)是指上证50指数成分股的市盈率。
市盈率是指某一股
票的市场价格与其每股盈利的比率,而市净率是指某一股票的市场
价格与其每股净资产的比率。
计算上证50指数成分股的市盈率的方法如下:
1. 首先,我们需要获取上证50指数的成分股。
2. 然后,我们需要获取这些成分股的市场价格和每股盈利数据。
3. 接下来,我们可以使用以下公式来计算每一只成分股的市盈率,市盈率 = 市场价格 / 每股盈利。
4. 最后,我们可以对所有成分股的市盈率进行加权平均,以得
出上证50指数的市盈率。
需要注意的是,市盈率是一个重要的财务指标,可以帮助投资
者评估股票的估值情况。
然而,投资者在使用市盈率进行投资决策时,还需要考虑其他因素,如行业发展趋势、公司盈利能力的稳定性等。
总的来说,计算上证50指数成分股的市盈率需要获取成分股的市场价格和每股盈利数据,然后进行加权平均,以得出上证50指数的市盈率。
这样的计算方法可以帮助投资者更好地了解上证50指数成分股的估值情况。
股指期货与上证50成份股的套利机会分析本文以沪深300指数期货为研究对象,主要讨论了股指期货的套利交易。
研究目的在于讨论利用单一品种在考虑冲击成本的前提下,进行套利交易的可行性。
股指期货套利的关键问题是构建现货头寸,核心是确定套利的空间。
本文基于上证50成份股及50ETF,深入分析了计算其β值所用样本的取值方法,进而得出每
个单一品种的静态β值,并绘制出动态β值的历史时间序列图,有效解决了建仓
时现货头寸问题,并在持仓过程中,依据合理的动态β值预测方法,及时调整头寸,从而获取低风险下的最大化收益。
经过本文测算发现,上证50成份股及50ETF,共计51个品种,静态β值区间
为0.49595-1.35407,相关系数区间为0.46194-0.94973,其中β值大于0.9的为37个,相关系数大于0.7的为30个,而两条件均满足的为23个。
同时,股指期货保守总冲击成本为0.75‰,50ETF的总冲击成本为1.07‰,而个股的冲击成本则
较高,上证50成份股总冲击成本绝大多数在1.5—3.5‰之间。
此外研究发现,若不考虑冲击成本,截止11.12.15,股指期货上市以来共有102天正向套利机会,若考虑冲击成本,且以3‰计入,则仅有48天机会,很明显,由于冲击成本的存在,套利空间被大幅缩小。
上证50 ETF套利简析最近上海交易所推出了上证50 ETF,由此衍生了一个新的交易品种和交易方式:ETF 申赎和套利,并且通过套利操作可以变相的实现股票的T+0交易,对于券商和投资者而言,这既是一个机会也是一个考验,如何利用这个机遇实现各自利益的最大化,将是我们需要关注的话题。
ETF套利基础ETF套利的基础源于投资者在两个市场的参与,即投资者在一级市场上用一篮子股票组合申购ETF或把ETF赎回成一篮子股票组合,以及投资者在二级市场上买卖ETF份额。
所谓的“一篮子股票组合”指上证50 ETF根据上证50指数的构成所建立的投资组合,计量单位为100万50 ETF,分别对应多少股中国联通、多少股中国石化等50只股票。
申购就是用这一个篮子股票组合向基金公司“交换”得到100万份ETF,赎回就是拿100万份ETF向基金公司“交换”得到一篮子股票组合。
需要注意的是这一揽子股票不是固定不变的,交易所会定期调整这些样本股的组成,同时每只各股每天可能出现一些异常情况如停牌、涨跌停等影响交易的问题,交易所也会每天公布一个对这50只股票的情况说明如停牌的股票可以用现金替代同时赎回也只能获得现金等。
从上交所的行情发布中我们可以看到,增加了510050和510051这两只交易品种,分别叫做50 ETF和50申赎,分别有各自的行情走势,那么如何看待这两个行情走势呢?510050比较好理解,上证50 ETF作为一个交易所交易的品种实际上就是一种上市开放式基金,它揭示的是买卖的最新成交价也就是它的实时市值;而510051公布的实际上是这只基金的实时资产净值,由于ETF就是投资上证50的这些股票,它的资产净值实际上就可以换算成一篮子股票当前组合市价。
ETF净值和市值是由不同投资者和交易品种所决定,二者必然存在一定的偏差,只要该偏差扩大到一定程度就产生了套利机会。
实际上这种资产净值和市值之间的背离在所有的基金品种中都存在,但其他基金品种一者资产净值的公布不如ETF这样实时顺捷,二者即便是开放式基金它的申购赎回也不如ETF这样透明方便,所以也就失去了套利的基础。
上证50权重计算方法(原创实用版4篇)目录(篇1)1.上证 50 权重计算方法概述2.上证 50 权重股的构成3.上证 50 权重股的计算方法4.上证 50 权重股的意义5.结论正文(篇1)上证 50 权重计算方法上证 50 指数是中国上海证券交易所的一种股票指数,由上海证券市场中市值规模排名前 50 位的股票组成。
上证 50 权重计算方法是通过对这 50 只股票的自由流通市值进行计算,按照单只股票的市值除以 50 只股票的总市值的方式,确定每只股票在指数中的权重。
上证 50 权重股的构成上证 50 权重股包括浦发银行、民生银行、中国石化、南方航空、中信证券、招商银行、保利地产、中国联通、上汽集团等 50 只股票。
这些股票在市场上具有较高的知名度和影响力,是上海证券市场的重要组成部分。
上证 50 权重股的计算方法上证 50 权重股的计算方法是基于自由流通市值的。
每只股票的权重等于该只股票的自由流通市值除以 50 只股票的总自由流通市值之和。
自由流通市值是指股票在市场上实际可以流通交易的部分,它剔除了公司创始人、高管等持有的股份,因为这部分股份在市场上不能自由交易。
上证 50 权重股的意义上证 50 权重股的计算和发布,对于投资者了解上海证券市场的整体走势和投资热点具有重要意义。
权重股的走势往往能影响到整个市场的走势,因此投资者在投资时需要密切关注权重股的表现。
此外,权重股也是机构投资者和指数基金的重要投资对象,因为它们代表了市场上最具影响力的股票。
结论上证 50 权重计算方法是一种重要的股票指数计算方法,它对投资者了解市场走势和投资热点具有重要意义。
目录(篇2)1.上证 50 权重计算方法的概念2.上证 50 权重计算方法的具体步骤3.上证 50 权重计算方法的例子4.上证 50 权重计算方法的影响因素5.上证 50 权重计算方法的实际应用正文(篇2)上证 50 权重计算方法是指在上海证券交易所中,选取 50 只规模较大、流动性较好的股票,根据其自由流通市值计算其权重,并以此来确定其在上证 50 指数中的地位和影响力的方法。
基于ARMA模型的上证50股指期货收益率探究引言股指期货是一种衍生品合约,其价格取决于相关股指价格的变化。
上证50股指期货是上海期货交易所推出的交易品种之一,其价格波动与上证50指数的波动密切相关。
为了探究上证50股指期货的收益率变化规律,本文将采用ARMA模型对其收益率进行建模分析,以期能够更好地理解其价格的波动规律,为投资者提供参考。
一、相关概念解释1. ARMA模型ARMA模型是自回归移动平均模型的缩写,是一种常用于时间序列分析的模型。
其基本思想是将时间序列分解为自回归部分和移动平均部分,通过对序列数据的自相关和偏自相关函数的分析,可以确定合适的模型阶数,进而建立ARMA模型进行预测和分析。
2. 上证50股指期货上证50股指期货是以上证50指数为标的物,通过预定以后交割的合约进行买卖的一种金融衍生品。
上证50指数是上海证券交易所规定的一个反映上海证券市场一定时期内最具代表性的50只上市公司股价综合变动情况的指数。
二、建模分析1. 收益率数据我们需要获取上证50股指期货的历史价格数据,并计算出其对应的收益率数据。
收益率的计算公式为:\[r_t = \frac{P_t - P_{t-1}}{P_{t-1}}\]\(r_t\)为第t期的收益率,\(P_t\)为第t期的价格。
通过对收益率数据进行分析,我们可以得到其基本的统计特征,为后续建模分析提供基础。
接下来,我们将利用建立好的ARMA模型对上证50股指期货的收益率进行拟合分析。
我们需要根据时间序列数据的自相关和偏自相关函数图,确定适当的阶数,然后建立ARMA 模型进行拟合。
通过模型的参数估计和检验,我们可以得到一个较好的模型来描述收益率数据的变化规律。
3. 模型评价建立ARMA模型后,我们需要对其进行评价,主要包括模型的拟合优度和预测效果。
我们可以利用残差序列来检验模型的拟合优度,如果残差序列是白噪声序列,则表示模型的拟合效果较好。
我们还可以利用模型对未来收益率进行预测,评估模型的预测效果。
基于ARMA模型的上证50股指期货收益率探究ARMA模型是一种常用的时间序列分析方法,可以用来预测和估计时间序列的未来趋势。
本文将利用ARMA模型对上证50股指期货收益率进行探究。
我们需要获取上证50股指期货的收益率数据。
收益率是指投资资产在一段时间内的收益和投资成本之间的比率,通常以百分比形式表示。
收益率的计算公式为(当期收盘价-上期收盘价)/上期收盘价。
然后,我们可以将收益率数据进行时间序列分析,其中ARMA模型包括自回归(AR)和移动平均(MA)两个部分。
自回归模型描述了序列与其过去的值之间的关系,而移动平均模型描述了序列与其过去的误差的关系。
ARMA模型的数学表达式为:Yt = a1Yt-1 + a2Yt-2 + ... + apYt-p + e + b1e-1 + b2e-2 + ... + bqe-qYt表示时间t的收益率,ap表示自回归系数,e表示白噪声误差项,bq表示移动平均系数。
接下来,我们可以使用ARMA模型对上证50股指期货的收益率进行建模和预测。
我们需要确定最佳的AR和MA阶数,这可以通过观察自相关图(ACF)和偏自相关图(PACF)来判断。
ACF图展示了序列与其滞后版本之间的相关性,而PACF图展示了序列与其滞后版本的相关性,消除了中间滞后版本的影响。
根据ACF和PACF图的规律,可以确定AR和MA阶数。
我们可以使用ARMA模型进行未来收益率的预测。
根据已有数据得到的ARMA模型,可以对未来的收益率进行预测。
预测的精度取决于模型的拟合程度和数据的质量。
基于ARMA模型的上证50股指期货收益率探究可以帮助我们分析和预测股指期货的未来趋势,有助于制定投资策略和风险管理。
需要注意的是,ARMA模型是基于线性关系的假设,对于非线性时间序列数据可能不适用。
在实际应用中需要结合其他方法进行综合分析。
上证50ETF期权与上证50股指期货价格关系以及套利策略探究谢玮民【期刊名称】《广西经济》【年(卷),期】2022(40)5【摘要】上证50ETF期权与上证50股指期货的推出已有七年之久,期权市场与期货市场的不断发展使得人们对这两类金融产品的研究越发深入。
通过对更高频的上证50ETF期权与上证50股指期货在2022年7月至2022年8月的跨品种的买一价数据进行ADF单位根检验以及EG两步法进行协整检验分析,发现这两类金融衍生品的价格存在一阶单整的协整关系,并由此得出这两类金融衍生品存在跨品种套利机会的结论。
此外,通过对两类资产的价格变动对资产组合的影响进行边际分析,得出套利组合中上证50ETF期权与上证50股指期货的头寸比例应为30∶1。
对两类衍生品的价格数据进一步分析后我们发现使用前一日交易对手方的买一价均价作为当日我方买一价的资产组合构建策略,能够实现收益率、胜率、交易频率等多方面指标的平衡,表明将前一日交易对手方的买一价均价作为当日我方买一价的策略是一个具有较强可行性的套利策略。
【总页数】5页(P99-103)【作者】谢玮民【作者单位】广西大学经济学院【正文语种】中文【中图分类】F832.5【相关文献】1.中国上证A股50ETF期权套利路径及风险对策研究2.期权交易能提高标的资产的定价效率吗?--基于上证50ETF套利视角的实证研究3.上证50ETF期权推出对上证50指数的影响——基于Markov-switching GARCH模型4.上证50ETF期权推出对上证50指数的影响——基于Markov-switching GARCH模型5.波动率建模新视角:无套利局部波动率曲面——以上证50ETF期权市场为例因版权原因,仅展示原文概要,查看原文内容请购买。
基于高频数据阈值协整模型的上证50股指期货期现套利研究随着中国金融市场的不断发展,股指期货也逐渐成为投资者重要的投资工具之一。
股指期货的出现,为投资者提供了一个可以在未来利用的金融工具,同时也为投资者提供了一个可以进行套利交易的机会。
而在金融市场上,套利交易一直是投资者们追逐的终极目标,因为套利交易可以在较小的风险下获得较大的收益。
研究期货期现套利已成为当前金融市场中重要的课题之一。
上证50股指期货是中国金融市场中最重要的股指期货合约之一,作为中国A股市场中50家规模较大的上市公司股票的组合,上证50指数的波动情况对于中国A股市场的整体走势具有一定的指导性作用。
上证50股指期货的期现套利交易也一直备受市场关注。
在这样背景下,有必要对上证50股指期货期现套利的研究进行深入探讨。
基于高频数据阈值协整模型的研究方法是一种比较新的研究思路。
传统的股指期货套利策略多是基于基本面和技术面的分析,但高频数据阈值协整模型并未在相关研究中得到充分的应用。
本文将使用高频数据阈值协整模型对上证50股指期货期现套利进行研究,通过对高频数据的分析和建模,寻求更为有效的套利策略。
本文将首先对上证50股指期货的市场现状进行分析,包括期货价格与现货指数价格的协整关系、波动特点等方面进行研究,并结合高频数据进行实证分析。
将对高频数据阈值协整模型进行详细介绍,包括模型的基本原理、建模方法和参数选择等方面的讨论。
将利用高频数据阈值协整模型对上证50股指期货期现套利策略进行研究,探讨在不同阈值条件下的套利效果,并分析其稳定性和实用性。
笔者将对研究结果进行总结和讨论,并对未来的研究方向进行展望。
本次研究的目的是探索基于高频数据阈值协整模型的上证50股指期货期现套利策略,寻求更为有效的套利机会,并为投资者提供更多的投资建议。
通过此研究,可以为投资者提供更为科学的套利策略,提高投资的收益率和降低风险,同时也可以为学术界对高频数据阈值协整模型的应用提供更多的实证研究案例。
对上证50指数的思考——基于ARIMA模型的分析关键词:ARIMA模型 Ljung-Box检验上证50指数一.数据的来源本文选取上证50指数2004年1月2日至2022年1月14日共4384个收盘价数据作为研究对象(数据来源:网易财经),将对4384个数据进行实证分析,并进行有关的模型建立与模型检验。
二.时间序列数据的平稳性处理通过Eviews8软件对数据进行分析,发现原数据不平稳,因此对数据采取一阶差分处理。
其中CP代表上证50指数在T个交易日的收盘价,CP(-1)代表上证50指数在T-1个交易日的收盘价。
故CPD=CP-CP(-1)为一阶差分后的数据,处理后共4383个数据。
在显著性水平α=5%的条件下,经ADF检验一阶差分后的数据CPD平稳。
下述分析均围绕CPD数据进行。
三.模型的建立、诊断与估计因为CPD数据的自相关函数和偏自相关函数均拖尾,因此可通过普通最小二乘法建立ARIMA(p,1,q)模型。
通过建立ARIMA(1,1,1)、ARIMA(1,1,2)、ARIMA(2,1,1)、ARIMA(2,1,2)、ARIMA(2,1,3)、ARIMA(3,1,2)、ARIMA(3,1,3)七种模型,根据AIC准则和SC准则最小原则,最终选择ARIMA(2,1,3)模型。
由图一知ARIMA(2,1,3)模型系数的显著性符合要求,且AIC、SC均最小,因此确定ARIMA(2,1,3)为目前最合适的模型。
该模型的数学表达式写为:其中,为随机扰动项。
图一四.模型的检验对残差进行折线图分析和Ljung-Box检验。
图二中残差围绕0值上下波动,可见其为平稳数据;图三中残差的自相关图和偏自相关图的两系数均在虚线内且p>α,故ARIMA(2,1,3)模型的随机误差项为白噪声序列,模型建立合理。
图二图三五.相关建议对投资者而言,目前疫情尚未结束,市场不仅会有自身的波动,而且还有许多外部环境的影响。
因此,可以利用ARIMA模型对股票市场进行初步分析,利用模型的优势为自己的投资拟定一个比较正确的方向,但不能完全依赖模型的结果。
2015年第12期时隔8年,分级基金新模式启动,上交所首只分级基金产品确定为易方达上证50指数分级基金。
这只跟踪大盘股的新模式分级基金交易获利途径激增,一只基金产品提供了至少10种交易获利方式,堪称史上最强分级“大盘基”。
和此前分级基金一样,易方达上证50分级有三类份额,分别为50分级、上证50A 和上证50B,所不同的是,50分级的母基金份额也可以上市交易,可增加多种获利模式。
获利模式一、场内买入上证50B,基金价格上涨后卖出基金获利!适用人群:在券商开户的进取型投资者。
获利模式二、场内买入上证50A,基金价格上涨或折算后卖出基金获利!适用人群:在券商开户的低风险投资者。
获利模式三、场内买入50分级母基金,基金价格上涨后卖出基金获利!适用人群:在券商开户的看好蓝筹股投资机会的投资者。
获利模式四、场外申购50分级母基金,基金净值上涨后赎回基金获利!适用人群:在银行等机构开户的看好蓝筹股上涨机会的投资者。
获利模式五、场内申购50分级母基金,到账后场内卖出!适用人群:券商开户投资者。
适用条件:50分级母基金溢价或看好未来几日价格表现。
获利模式六、场内申购50分级母基金,到账后分拆成上证50A 和B 分别卖出!适用人群:券商开户投资者。
适用条件:上证50A 和B 整体溢价或看好未来几日价格表现。
获利模式七、买入50分级母基金后,T+0即可分拆成上证50A 和B 分别卖出!适用人群:券商开户投资者。
适用条件:上证50A 和B 平均交易价,相比50分级交易价格溢价。
获利模式八、买入50分级母基金后,T+0当日即可赎回!适用人群:券商开户投资者。
适用条件:50分级母基金折价或看好盘中到收盘指数上涨。
获利模式九、买入上证50A 和B 之后,T+0当日合并成50分级母基金卖出!适用人群:券商开户投资者。
适用条件:上证50A 和B 整体相比50分级母基金市价折价。
获利模式十、买入上证50A 和B 之后,T+0当日合并成50分级母基金赎回!适用人群:券商开户投资者。
作者: 张豪爽;乔金艳
作者机构: 东北财经大学,辽宁大连116021
出版物刊名: 中国经贸
页码: 132-133页
年卷期: 2010年 第16期
主题词: 套利定价;因子分析
摘要:上证50指数自2004年上市以来,样本股多次调整,本文以2004年来经过调整的上证50指数50只成分股的最新数据,从2009年7月2日到9月30日,对其进行套利定价研究。
套利定价理论(APT)与资本资产定价理论(CAPM)中单因素市场风险决定论不同,它认为证券系统风险由K个普遍存在的共同因子一起决定,每一证券对这K个共同因子的反应系数不同,从而导致不同证券之间收益率差别。
上证50指数的统计套利模型(doc 11)上证50指数的统计套利模型1韩广哲陈守东张炳辉吉林大学数量经济研究中心,吉林大学商学院,吉林,长春,130012摘要:本文使用逐步回归方法来确定合适的定价子空间,探讨上证50指数成分股之间的统计套利模型。
检验可预测性的方差比分析表明随机去势后的股票价格序列明显偏离随机游走,存在着可预测的成分。
联立方程模型表明股票的“错误定价(mispricing)”趋于在短期内形成趋势(trend),在更长时间内回复(revert)。
统计套利模型的样本外绩效通过使用一个简单的交易原则(构造并持有复合组合)就可以是盈利的,当交易费用水平是0.5%时,复合组合的年夏普比为1.8。
本文的研究有助于发现股票市场的统计套利机会并改善组合绩效。
关键词:统计套利模型错误定价方差比分析一、引言资产收益的波动在许多情形下是由其所在市1本文得到2002年教育部重大项目(02JAZJD790007)、吉林大学经济分析与预测哲学社会科学创新基地资助场甚至是国际市场的“趋势、变动”引起的,而不是某一特别资产的某个特殊性质。
这样就会存在着遮蔽资产收益的任何可预测成分的风险,许多学者提出建议,通过适当转换金融时间序列来减少这一遮蔽效应。
Lo和MacKinlay(1996)就一个特别的信息集构造“最大可预测”的资产组合。
Burgess和Refenes(1996)使用协整框架,由国际股票指数的一个组合来计算FTSE收益,组合权重是由协整回归系数给出的。
Steurer 和Hann(1996)也采用协整框架对汇率建模,将汇率作为货币和金融基本因素控制的“均衡”水平周围的短期波动。
Burgess(1996)使用主成分分析方法来建立欧洲美元投资组合,使用神经网络方法而不是线性技术,发现这一投资组合的收益是部分可预测的。
寻求收益的可预测成分的方法可以被刻画为“统计套利”。
Burgess (1999)在研究FTSE100指数及其成分股时,使用了逐步回归方法和ECM方法,他定义统计套利为传统的“零风险”套利的一个扩展。
零风险套利包括构造两组有着相同现金流的资产组合,充分利用这两个等价资产的任何价差。
多头(资产组合1)+空头(资产组合2)可以视为一个复合资产,零以外的价格偏离都代表一个“错误定价”和一个潜在的无风险利润(受到筹资成本、交易费用和买卖价格限制)。
统计套利与零风险套利的区别在于:构造复合资产组合,组合的非零价格偏离仍被视为“错误定价”,但在统计套利的意义下,动态价格存在着可预测成分。
本文以上证50指数50只成分股的收盘价格时间序列为研究对象,以样本内方差比曲线的信息和时间序列性质,探索动态价格时间序列的可预测成分,研究建立统计套利模型。
统计套利方法的使用包括三个阶段:构造复合资产组合,检验动态价格或收益的预测能力;构造协整回归,建立误差修正机制;实施交易系统,开发资产收益可预测的成分。
本文采用的统计套利方法,本质上是协整概念的一个推广。
我们在两个方面修改了标准协整方法:以检验可预测性的方差比(Variance Ratio,简记为:VR)方法来代替检验平稳性的协整方法;使用逐步回归法构造协整回归,而不是文献中常见的标准回归或者主成分方法。
这两个改进是有根据的:方差比检验相比于检验平稳性和长期均衡关系的协整方法来说,限制性少,更适合确定统计套利机会;问题空间(上证50又称为协整向量。
最常用的协整形式是(1,1)CI 。
但在我们的研究中,数据由上证50指数及其50个成分股组成,考虑到维数是51,大大高于普通的协整分析,样本大小320也相对很较小(数据描述见第3节)。
为了减小问题的维数,我们要确定相对较小的各变量子集,这就有了确定合适的子集来建立统计套利模型的问题。
为了保证取得整个变量空间的一个合理子集,我们采用逐个使用每一资产作为协整回归因变量的方法。
为了确定协整向量合适的子空间,我们使用向前逐步回归方法来代替标准“输入所有变量”的方法。
对上证50指数及其成分股进行单位根检验,发现大多数价格序列都是一阶单整的,少数几个价格序列不存在单位根,为平稳的,但这不影响我们的研究。
我们采用方差比来检验潜在的价格预测能力。
方差比检验遵循的事实是:随机游走的新息的方差随着时期线性增长,这些期间内增量是可以度量的。
这样,在τ期内计算的新息的方差应该近似等于τ倍的单期新息的方差。
基本的VR()τ统计量是:VR()τ=22()()t t t t d d d d τττ∆-∆∆-∆∑∑ (1)方差比是 的函数。
对于随机游走来说,方差比将会接近于1,且这一性质被很多人(Lo 和McKinley(1998)和Cochrane(1988))用作统计检验偏离随机游走行为的基础。
2.基于方差比分析检验预测能力我们不检验单独的VR统计量,而是从整体上检验方差比曲线,这能够总结时间序列的动态性质:方差比曲线正的斜率说明正的自相关,因此有趋势行为;方差比曲线负的斜率说明负自相关和均值回复或者周期行为。
计算方差比的时候,没有一个“很好的”区间来比较各个股票的方差比,基期的选择对方差比的计算也有着很大的影响,我们分析上证50指数的走势,分别计算下跌(2004年3月23日—2004年6月4日:50—100)和涨跌变化比较剧烈(2004年8月31日—2004年11月16日:160—210)两个区间(每个区间有51个样本)的方差比曲线。
下面给出了上证50指数及其成分股收益(为对数收益)的方差比曲线。
(图中:蓝色为下跌区间,红色为涨跌变化比较剧烈区间。
)我们给出了下跌区间与涨跌变化比较剧烈区间上证50指数收益的方差比曲线和50只成分股的平均方差比曲线(包括50只股票平均收益的方差比曲线和50只股票收益的平均方差比曲线),个股的方差比曲线不在此给出。
下跌区间的方差比曲线都要大过涨跌变化比较剧烈区间的方差比曲线;方差比曲线都在20天内有着显著变化,曲线在20天后趋于平稳。
所有股票都有着统一的特征:方差比曲线显著的偏离1,表明一定程度的可预测性。
除了下跌区间50只股票收益的平均方差比曲线表现为先上升再下降且显著大于1,其他方差比曲线的走势为下降且显著小于1,斜率为负。
各个成分股收益的方差比曲线的表现差异较大,下跌区间50只股票收益的平均方差比曲线,由于一部分股票的方差比1上方,而涨跌图2 图3 指数收益的方差比曲线图4上证50指数涨跌变化比较剧烈区间平均方差比曲线显示显著的负斜率,说明存在着高度的均值回复;而下跌区间平均方差比曲线斜率的正负变化较为剧烈,需要具体分析其趋势或者均值回复行为。
在本文,平均方差比曲线可被当作比较实际统计“错误定价”的方差比曲线的基线。
方差比曲线的有效性可以从以下事实中看出:它表明了时间序列偏离随机游走行为的程度,这可视为时间序列的潜在预测能力的度量。
这不同于关心平稳性的标准协整检验,一个序列可能是不平稳的但仍包含显著的可预测成分,这样方差比方法将会(比协整检验以及其他限制性的平稳性检验方法)找到更大范围的机会。
3.上证50股票“错误定价”的方差比曲线分析我们检验实际统计套利模型的残差偏离随机游走的情况。
数据包括上证50指数和它的50个成分股的日收盘价。
从2004年1月2日到2005年4月29日共320个观察值,其中270个作为协整回归估计使用,最后50个用作样本外评价。
使用向前逐步回归法代替标准的“输入所有变量”方法,选取多少个回归变量是一个重要的问题,我们借鉴Burgess(1999)和Connor & Korajczyk(1988)的研究,每一资产都依次作为向前逐步回归的因变量,对常数和从可能的49个股票中选出的5个(即选择向前逐步回归法最先选出的5个股票)回归量回归:270,,2,1 ; 50,,2,1 ,,51),,(,,, ==++=∑=t s P c P t s i t s i c i s t s t s εω (2) 分别得到50只股票的残差序列t s ,ε即为“错误定价”序列,其中:),(s i c P 是股票s 的模型的第i 个成分股票的价格,i s ,ω是相应的回归系数(组合的权重)。
我们对均值为负的残差序列进行取相反数调整,均值为正的残差序列保持不变,以t s ,ε'表示调整之后的错误定价序列,我们以这50个逐步回归模型构造一个复合组合,每个逐步回归模型是等权重的,不妨令权重和为1,组合的预期收益即为平均统计错误定价是正的,平均统计错误定价序列为:270,,2,1, 501501, ='=∑=t s t s t εε (3) 我们计算平均统计错误定价的方差比曲线,以检验潜在的预测能力,检验是以偏离随机游走行为的形式进行的。
下跌区间与涨跌变化比较剧烈区间的平均统计错误定价的方差比曲线如图5所示。
检验表明统计套利模型的平均错误定价明显偏离随机游走行为――说明存在着随机以外图5 平均统计错误定价的方差比曲线。
三、统计套利模型这一部分建立统计错误定价的动态性模型并建立预测错误定价变化的时间序列模型,研究统计错误定价未来变化的可预测性。
对样本期间270个观察值,估计了包含50个错误定价方程的联立方程模型。
270,,2,1 ; 50,,2,1 MIS ,s, =='=t s t s t ,ε (4)),(s i c P 是股票s 的模型的第i 个成分股票的价格,i s ,ω是相应的回归系数(组合的权重);为了捕捉错误定价的不同滞后时间段的动态性质,选择剩余的独立变量,形式如下:20,10,5,2,1,0, ,MIS MIS ),(,,,=-=--m n m n L m t s n t s t s (5)为了捕捉任何一个均值回复效应,错误定价的一天向前变化基于当前水平的错误定价进行回归,最终的回归形式为:1,,5,4,3,2,101)20,10()10,5( )5,2()2,1()1,0(MIS MIS MIS +++++++++=-t s t s t s t s t s t s s,t s,t s,t L L L L L εββββββα (6)分别采用了加权最小二乘法(WLS )和似不相关回归法(SUR )来估计联立方程模型,一共有50⨯249=12450个观察值用来估计联立方程模型,剩余50⨯50=2500个观察值作为样本外评价。
回归结果在表1(*表示系数在99%置信水平下显著)中给出。
加权最小二乘法和似不相关回归法估计得到的模型都显示统计错误定价的未来变化有着显著的可预测性。
预测性源自两方面:第一个是短期趋势,以滞后差分项(,)L n m的正的系数代表;第二个是长期误差修正,以错误定价MIS的负的系数代表。
考虑到估计模型的数据集的大小,结果是非常显著的。