当前位置:文档之家› 山西证券:多因子模型股票打分 权重配置及股票池

山西证券:多因子模型股票打分 权重配置及股票池

山西证券:多因子模型股票打分 权重配置及股票池
山西证券:多因子模型股票打分 权重配置及股票池

7种量化选股模型

7种量化选股模型 1、【多因子模型】 2、【风格轮动模型】 3、【行业轮动模型】 4、【资金流模型】 5、【动量反转模型】 6、【一致预期模型】 7、【趋势追踪模型】 1、【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为: (1)先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高 (2)按月计算个股的不同因子得分间的相关性矩阵; (3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值 (4)设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

股票定价模型增长模型

股票定价模型 -、零增长模型 零增长模型假定股利增长率等于零,即G=0,也就是说未来的股利按一个固定数量支付。 [例] 假定某公司在未来无限时期支付的每股股利为8元,其公司的必要收益率为10%,可知一股该公司股票的价值为8/0.10=80元,而当时一股股票价格为65元,每股股票净现值为80—65=15元,因此该股股票被低估15元,因此建议可以购买该种股票。 [应用] 零增长模型的应用似乎受到相当的限制,毕竟假定对某一种股票永远支付固定的股利是不合理的。但在特定的情况下,在决定普通股票的价值时,这种模型也是相当有用的,尤其是在决定优先股的内在价值时。因为大多数优先股支付的股利不会因每股收益的变化而发生改变,而且由于优先股没有固定的生命期,预期支付显然是能永远进行下去的。 二、不变增长模型 (1)一般形式。如果我们假设股利永远按不变的增长率增长,那么就会建立不变增长模型。 [例]假如去年某公司支付每股股利为1.80元,预计在未来日子里该公司股票的股利按每年5%的速率增长。因此,预期下一年股利为1.80×(1十0.05)=1.89元。假定必要收益率是11%,该公司的股票等于1.80×[(1十0.05)/(0.11—0.05)]=1.89/(0.11—0.05)=31.50元。而当今每股股票价格是40元,因此,股票被高估8.50元,建议当前持有该股票的投资者出售该股票。 (2)与零增长模型的关系。零增长模型实际上是不变增长模型的一个特例。特别是,假定增长率合等于零,股利将永远按固定数量支付,这时,不变增长模型就是零增长模型。 从这两种模型来看,虽然不变增长的假设比零增长的假设有较小的应用限制,但在许多情况下仍然被认为是不现实的。但是,不变增长模型却是多元增长模型的基础,因此这种模型极为重要。 三、多元增长模型 多元增长模型是最普遍被用来确定普通股票内在价值的贴现现金流模型。这一模型假设股利的变动在一段时间7、内并没有特定的模式可以预测,在此段时间以后,股利按不变增长模型进行变动。因此,股利流可以分为两个部分。 第一部分包括在股利无规则变化时期的所有预期股利的现值。

对股票收益率时间序列的检验研究

金融学 对股票收益率时间序列的非线性及机制转变的检验研究 王煦逸1林阳春2 (同济大学中德学院,上海 200092) 0 引言 近年来,对金融市场的时间序列的进行建模,试图通过计量经济学模型解释金融市场时间序列的内在关系一直是金融经济学和计量经济学研究的热点课题。关于金融市场的研究也大都集中于研究金融资产收益率。Campbell,Lo,MacKinlay认为金融资产收益率可以更好地解释投资的机会收益,同时金融资产收益率时间序列由于本身的统计特性也能更容易建立成模型。传统的金融资产收益率时间序列模型以线性关系为假设,最重要的是随机游走假设和ARMA模型。 关于随机游走假设的研究主要是讨论金融资产收益率的可预测性。一般来说,关于实证检验随机游走假设的研究十分困难,原因在于过去和将来的价格变化之间的独立性很难被直接检验出来。Granger和Morgenstern(1964)在美国的股票市场,Cristina Del Rio(1997)在西班牙的股票市场,Conrad和Jüttner(1993),Ronning(1974),Mühlbradt(1978)和M?ller(1986)在德国的股票市场上的研究都否定了随机游走假设。Conrad和Jüttner(1973)认为,连续的价格变化随机性地相互独立,许多股票收益率分布都存在显著的独立性。通过随后大量的研究发现,ARMA过程对于描述金融资产收益率时间序列是十分合适的,因为在这种情况下参数和矩函数都比较容易确定。1970年,Box/Jenkins(1976)解释了ARMA模型建立和参数估计的问题。从70年代开始,大量关于金融资产收益率的时间序列的线性模型研究都采用了ARMA与其扩展模型,实证研究表明,ARMA模型可以较好地解释金融资产收益率的时间序列的线性结构。然而由于金融资产收益率时间序列特殊的统计性质,80年代以来,越来越多的研究结果表明了金融资产收益率时间序列具有的非线性的关系,传统的金融资产收益率时间序列线性模型已经不能完整的刻画金融资产收益率时间序列的分布。90年代以来,关于金融资产收益率时间序列的非线性建模取得了很大的成功。Maravall(1983)用Bilinear模型研究了西班牙金融市场上的股票收益率。根据研究结果Maravall 认为,通过Bilinear模型可以修正由ARMA模型产生的10%的预测错误。Clements和Krolzig (1998),Rothman(1998)则利用了TAR模型成功地模拟了美国宏观经济指标的分布。De Gooijer (1998),Potter(1995),Montgomery等等的研究也得出了相似的结果。随着时间的推移,越来越多的经济科学家都致力于用研究金融资产收益率时间序列的非线性建模。例如,Granger和Anderson(1978)的Bilinear模型,Tong(1978)的TAR模型,Priestley(1980)的State Space模型,Hamilton(1989)的MRS模型。在用非线性模型描述金融资产收益率时间序列之前,首先必须解决下列问题: 1)线性模型(例如ARMA模型)是否足以描述德国股市DAX30收益率时间序列? 2)在DAX30 收益率时间序列中是否存在非线性和机制转变呢? 为了回答这两个问题,在本论文中,通过对德国股票市场DAX30指数的收益率时间序列进行实证研究,并对DAX30指数收益率时间序列的非线性性质和机制转变性质进行检验。 1 金融资产收益率时间序列的非线性检验 由于许多复杂的时间序列过程并不能通过线性模型完全描述出来,对于非线性模型的应用逐渐受到人们的关注。对时间序列的非线性检验则成为一个对时间序列成功建模的前提条件。只有能够成功地检测出时间序列非线性的性质,对时间序列的非线性分析才有意义。80年代以来非线性检验逐渐成为金融市场理论的一个重要的研究领域,在这种情况下,很多用于非线性检验的新方法和技术应运而生,例如McLeod-Li -检验,Bispectral检验,BDS检验,RESET检验,F检验,神经网络非线性检验等等。由于时间序列非线性的来源无法得知,因此哪种检验方法最好也很难下定论。本文将采用部分检验方法,如McLeod-Li -检验和BDS检验。 1王煦逸:管理学博士,同济大学中德学院内部控制学基金教席教授, 同济大学中德学院泽尔腾经济管理研究所常务副所长, 研究方向为行为金融,、金融风险控制和商业银行管理 2林阳春:经济学硕士,同济大学中德学院内部控制学基金教席,研究方向为资本市场,公司治理和风险控制;本项目由德国蒂森克虏伯公司基金资助

7种量化选股模型

【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。 同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余

多因子量化选股模型建立及优化

多因子量化选股模型建立及优化 股市在不断的变化,所以从目前来看,不断探讨哪些指标在量化选股中更为有效,是具有现实意义的。这也是本文研究工作开始的初衷。 在整个研究过程中,保持数据的严谨性、中立性、数据处理方法的科学性对于研究结论的准确性来说至关重要。本文首先构建了一个比较全面的候选因子库,通过对候选因子数据进行异常值、缺失值、标准化、市值中性化、行业中性化等一系列的处理之后,本文对候选因子进行有效性检验及再筛选,最终认为 RP_TTM(净利润TTM/总市值)、BP_LF(净资产TTM/总市值)、operete_profin gr_TM(营业利润增长率TTM)、sales_gr_TTM(营业收入增长率)、BOOK_LEVEL(账面杠杆)、stock_to market_volatility(个股与市场波动率比值)、 REV_LAST1M_MAX(近一个月日收益率最大值)、RSI(相对强弱)等八个因子是较为有效的因子。 在得出有效因子之后,本文利用打分法来构建八因子选股模型,回测区间选定为2016年1月至2019年4月。通过对模型的回测,我们发现本文构建的八因子模型相比于沪深300,有着较为稳定的超额收益。 在整个回测时间段内,八因子模型的总收益为41.02%,年化收益为11.07%。相比于基准的收益情况,八因子模型相对总收益为32.28%,年化平均超额收益为8.92%。 为了深入研究,我们对原有模型进行优化,优化方案为“在利用八因子模型进行正式选股之前,首先以增长率-经营活动产生的现金流量净额(TTM)指标对股票池进行初步筛选”。通过对优化八因子模型进行回测,我们发现加入增长率-经营活动产生的现金流量净额(TTM)指标优化后的八因子模型回测表现更好。

几种常用的股票价值计算法

几种常用的股票价值计算法 1.DDM模型(Dividend discount model /股利折现模型) 2.DCF /Discount Cash Flow /折现现金流模型) (1)FCFE (Free cash flow for the equity equity /股权自由现金流模型)模型 (2)FCFF模型(Free cash flow for the firm firm /公司自由现金流模型) DDM模型 V代表普通股的内在价值,Dt为普通股第t期支付的股息或红利,r为贴现率 对股息增长率的不同假定,股息贴现模型可以分为 :零增长模型、不变增长模型(高顿增长模型)、二阶段股利增长模型(H模型)、三阶段股利增长模型和多元增长模型等形式。 最为基础的模型;红利折现是内在价值最严格的定义;DCF法大量借鉴了DDM的一些逻辑和计算方法(基于同样的假设/相同的限制)。 1. DDM DDM模型模型法(Dividend discount model / Dividend discount model / 股利折现模型股利折现模型) DDM模型 2. DDM DDM模型的适用分红多且稳定的公司,非周期性行业; 3. DDM DDM模型的不适用分红很少或者不稳定公司,周期性行业; DDM模型在大陆基本不适用; 大陆股市的行业结构及上市公司资金饥渴决定,分红比例不高,分红的比例与数量不具有稳定性,难以对股利增长率做出预测。 DCF 模型 2.DCF /Discount Cash Flow /折现现金流模型)DCF估值法为最严谨的对企业和股票估值的方法,原则上该模型适用于任何类型的公司。 自由现金流替代股利,更科学、不易受人为影响。 当全部股权自由现金流用于股息支付时,FCFE模型与DDM模型并无区别;但总体而言,股息不等同于股权自由现金流,时高时低,原因有四: 稳定性要求(不确定未来是否有能力支付高股息); 未来投资的需要(预计未来资本支出/融资的不便与昂贵); 税收因素(累进制的个人所得税较高时); 信号特征(股息上升/前景看好;股息下降/前景看淡) DCF模型的优缺点 优点:比其他常用的建议评价模型涵盖更完整的评价模型,框架最严谨但相对较复杂的评价模型。需要的信息量更多,角度更全面, 考虑公司发展的长期性。较为详细,预测时间较长,而且考虑较多的变数,如获利成长、资金成本等,能够提供适当思考的模型。 缺点:需要耗费较长的时间,须对公司的营运情形与产业特性有深入的了解。考量公司的未来获利、成长与风险的完整评价模型,但是其数据估算具有高度的主观性与不确定性。复杂的模型,可能因数据估算不易而无法采用,即使勉强进行估算,错误的数据套入完美的模型中,也无法得到正确的结果。小变化在输入上可能导致大变化在公司的价值上。该模型的准确性受输入值的影响很大(可作敏感性分析补救)。FCFE /FCFF模型区别

股票定价模型.doc

股票定价模型 一、零增长模型六、开放式基金的价格决定 二、不变增长模型七、封闭式基金的价格决定 三、多元增长模型八、可转换证券 四、市盈率估价方法九、优先认股权的价格 五、贴现现金流模型 一、零增长模型 零增长模型假定股利增长率等于零,即G=0,也就是说未来的股利按一个固定数量支付。 [例] 假定某公司在未来无限时期支付的每股股利为8元,其公司的必要收益率为10%,可知一股该公司股票的价值为8

/0.10=80元,而当时一股股票价格为65元,每股股票净现值为80-65=15元,因此该股股票被低估15元,因此建议可以购买该种股票。 [应用] 零增长模型的应用似乎受到相当的限制,毕竟假定对某一种股票永远支付固定的股利是不合理的。但在特定的情况下,在决定普通股票的价值时,这种模型也是相当有用的,尤其是在决定优先股的内在价值时。因为大多数优先股支付的股利不会因每股收益的变化而发生改变,而且由于优先股没有固定的生命期,预期支付显然是能永远进行下去的。 二、不变增长模型 (1)一般形式。如果我们假设股利永远按不变的增长率增长,那么就会建立不变增长模型。 [例]假如去年某公司支付每股股利为1.80元,预计在未来日子里该公司股票的股利按每年5%的速率增长。因此,预期下一年股利为1.80×(1十0.05)=1.89元。假定必要收益率是11%,该公司的股票等于1.80×[(1十0.05)/(0.11-0.05)]=1.89/(0.11-0.05)=31.50元。而当今每股股票价格是40元,因此,股票被高估8.50元,建议当前持有该股票的投资者出售该股票。

(2)与零增长模型的关系。零增长模型实际上是不变增长模型的一个特例。特别是,假定增长率合等于零,股利将永远按固定数量支付,这时,不变增长模型就是零增长模型。 从这两种模型来看,虽然不变增长的假设比零增长的假设有较小的应用限制,但在许多情况下仍然被认为是不现实的。但是,不变增长模型却是多元增长模型的基础,因此这种模型极为重要。 三、多元增长模型 多元增长模型是最普遍被用来确定普通股票内在价值 的贴现现金流模型。这一模型假设股利的变动在一段时间7、内并没有特定的模式可以预测,在此段时间以后,股利按不变增长模型进行变动。因此,股利流可以分为两个部分。 第一部分包括在股利无规则变化时期的所有预期股利 的现值。 第二部分包括从时点T来看的股利不变增长率变动时期的所有预期股利的现值。因此,该种股票在时间了的价值(VT)可通过不变增长模型的方程求出 [例]假定A公司上年支付的每股股利为0.75元,下一年预期支付的每股票利为2元,因而再下一年预期支付的每股股利为3元,即

股票估值模型及其应用

股票估值模型及其应用 一、 股票估值模型 股票估值比债券估值更难一些。在债券估值情况下,现金流系列(利息)和时 间范围(到期日)都需要确定好,但在股票估值情况下,这些因素应更仔细地斟酌。 所以,介绍股票估值时,需考虑构成股票收益的因素是什么,我们先考虑持有时间 在1年的股票,然后再考虑期限无限长的股票。 一年期的投资者在其持有股票时期内,股票回报率公式如下 01P P P D k -+= (1) 简单地说,回报率k 等于支付的红利D 加上这一年内价格的变化P1-P0,再除 以初始股票价格P0。若采取熟悉的现值公式,可得: k P k D P +++=1110 (2) 这说明,股票的目前价格等于年末红利加年末股票价格以折现率k 折现到现在 的值。对于较长时间范围的投资者,可以以更一般的形式描述如下: ∑=+++=T t T t t t k P k D P 10) 1()1( (3) 随着投资期限越来越长——T 趋近于无穷,公式第二部分趋近于零,以至预期 的收益全部由红利流构成。求解下面的等式可求出预期的回报率k : ∑=+=T t t t k D P 10) 1( (4) 此公式表明:对于时间范围无限长的投资者(或者,从实际考虑,任何有足够 长远眼光的人),决定股票价值的基本决定因素是红利流。我们可以间接推断出:对 于一个相对短期的投资者来说,即使他是一个因想卖股票而买股票的人,红利流也 是股票价值的基本决定因素。因为若投资者所卖股票的价格被别的投资者接受,那 么这个价格即是有别的投资者根据未来预计的红利流判断确定的。 应注意:不管股票是否在当前支付红利,这种分析都是适用的。对不支付红利 的股票,如典型的高增长的股票,持有期不是无限期的股票持有者都希望一笔当前 支付红利的股票较高的价格卖出股票,获得他唯一的收益。这个卖价又是未来预计 支付红利的函数。所以对于一个投资者而言,无论是从短期还是从长期投资来看, 红利都是公司价值的决定因素。

最新 基于多因子模型的量化选股分析-精品

基于多因子模型的量化选股分析 随着中国资本市场复杂程度日渐加深和规模日益庞大,投资品种和数量与日俱增,无论是个人或是机构投资者所拥有的投资渠道与投资方法也在逐渐增多。量化投资作为一种来自海外资本市场的先进技术,在海外资本市场中受到了广泛追捧,著名的西蒙斯与大奖章基金便是利用了量化投资技术,于1989~2007年间获得了高达38.5%的平均年收益率。中国的量化投资发展虽仍在起步阶段,、金融学、科学相结合的优势来寻求超额收益。据统计显示,截至2016年10月,中国公募基金中共有48支基金以“量化”命名,其中长信量化先锋基金(519983),申万菱信量化小盘股票基金(163110)与大摩多因子策略混合基金(233009)等均表现出色,具有较高的年化收益率。而无论是在个体投资或是基金投资中,多因子选股模型均是较为广泛的量化模型之一。本文基于多因子模型策略,利用2011~2015年的数据对投资过程中的常用因子进行有效性检验,并使用有效因子构建基本多因子模型,根据假设创造性地使用简单打分法构建投资组合,基于2014~2016年的历史数据进行实证分析,为广大一般投资者提供了一种简单可行且收益率超过市场表现的投资策略。最后结合行业轮动效应与面板数据的多元回归分析对基本模型进行了深化与修正,创新性地提出了基于多因子模型的更多投资策略,也为较深层次的理论研究者提供了思路与数据参考。 一、文献综述 关于量化投资选股策略的研究涉及许多方面,常见的包括多因子模型、风格轮动模型、动量反转模型、趋势追踪模型等。对于多因子模型,最重要的环节便是有效因子的选取。大多数论文对于有效因子的选取通常采用因子评分法,此方法最早由Piotroski(2000)提出,常见操作为:将股票池中的股票按N个候选因子的大小依次排序,按照每个排序选取排名靠前的股票等权重构建N个极端的股票组合持有到期末,计算N个组合的平均收益率并与基准的指数收益率进行比较,用此方法能成功获取alpha收益组合所使用的排序因子即为有效因子[1]。另外一种方法则是回归法,通过计量模型求得单个因子对股价波动的贡献与显著性。丁鹏曾在其《量化投资——策略与技术》一书中使用1997~2006年的历史数据对常用的因子进行了有效性检验

操作股票的几种模型

一、MACD空中加油 (一)原理:空中加油就是是指主力在拉升一只股票过程中,暂时性的休整,已达到清除浮筹的目的。在MACD指标上就显示成为:1、当DIFF上穿DEA指标形成金叉,股价经过一波上攻出现短期的震荡回调DIFF下穿DEA形成死叉。当DIFF和DEA接近0轴时,不破0轴再次形成金叉。2、DIFF下探DEA,刚一接触马上反身拉起。3、DIFF下探DEA后马上反身拉起再次形成金叉。4、DIFF下探DEA后两线缠绕。 DIFF下穿DEA后马上反身向上再次形成金 叉 DIF下穿DEA后缠绕

问题一:如何区别是暂时修整?与修整相对的就是出货,如修整买入可以赢利;如出货进去就要割肉。所以这是第一个关键问题! 出现空中加油姿态后,要判断庄家是否为出货: 1、如股价经过长期调整后能判断出有大资金入住,可计算庄家成本判断其有无出货空间。如股票已经距底部有很大的涨幅,出现加油姿态后,更要慎重。 2、结合量能与筹码峰,量能上应为缩量修整,筹码峰上底部获利筹码稳定才符合加油状态。如放量修整、筹码峰显示底部筹码大幅减少则是出货状态。 【小贴士】庄家成本计算: 1、庄家的成本要素。主要有进货成本,利息成本,拉升成本、公关成本,交易成本等。 (1)进货成本:庄家进场时需要用大量资金买入股票,这部分资金是庄家的进货成本。 (2)利息成本(融资成本):除了少数自由资金充足的机构外,大多数庄家的资金都是从各种渠道的短期借贷资金,要支他一定利息,有的借贷方还要从坐庄盈利中按比例分成。因此坐庄时间越久利息支出越高,持仓成本也就越高,有时庄家贷款到期,而股票又没有获利,那只好再临时拆借找资金,拆东墙补西墙了,或者被迫平仓出局。 (3)拉升成本:大多数庄家需要盘中对到放量制造股票成交活跃的假象,因此近交易费用一项就花费不少。另外庄家还要准备护盘资金在大盘跳水或者技术形态变坏时进行护盘,有时甚至要高买低卖。 (4)公关成本:庄家的公关费用包括多个层面,主要有管理层、券商、银行、上市公司、中介机构等,这些机构的重要性是不言而喻的,庄家也应为此付出必要成本,否则庄家就很难做上去。 (5)交易成本:尽管庄家可享受高额佣金返还,但交易过程中的印花税还是免,返笔费用也计入持仓成本之中。 2、庄家成本的简易计算方法:

股票定价模型

股票定价模型 贴现现金流模型 贴现现金流模型是运用收入的资本化定价方法来决定普通股票的内在价值的。按照收入的资本化定价方法,任何资产的内在价值是由拥有这种资产的投资者在未来时期中所接受的现金流决定的。由于现金流是未来时期的预期值,因此必须按照一定的贴现率返还成现值,也就是说,一种资产的内在价值等于预期现金流的贴现值。对于股票来说,这种预期的现金流即在未来时期预期支付的胜利,因此,贴现现金流模型的公式为 式中:Dt为在时间T内与某一特定普通股相联系的预期的现金流,即在未来时期以现金形式表示的每股股票的股利;K为在一定风险程度下现金流的合适的贴现率; V为股票的内在价值。 在这个方程里,假定在所有时期内,贴现率都是一样的。由该方程我们可以引出净现值这个概念。净现值等于内在价值与成本之差,即式中:P为在t=0时购买股票的成本。 如果NPV>0,意味着所有预期的现金流入的净现值之和大于投资成本,即这种股票被低估价格,因此购买这种股票可行; 如果NPV<0,意味着所有预期的现金流入的净现值之和小于投资成本,即这种股票被高估价格,因此不可购买这种股票。 在了解了净现值之后,我们便可引出内部收益率这个概念。内部收益率就是使投资净现值等于零的贴现率。如果用K*代表内部收益率,通过方程可得 由方程可以解出内部收益率K*。把K*与具有同等风险水平的股票的必要收益率(用K表示)相比较:如果K*>K,则可以购买这种股票;如果K*

量化多因子选股简论(下)

太极量化多因子选股模型简论B 第二:因子的选取 候选因子的选取 (一)大数据因子搜索数据因子,搜索频率因子,搜索关键词因子,关注度因子,大众情绪因子等。其中搜索数据因子影响较为显著。 (二)规模因子通过对给定时间内(时间为为6年)市场的分析,不管是从总市值、还是流通市值和自由流通市值看,A股市场存在较为显著的小盘股效应。市值较小股票构造的组合整体上大幅超越沪深300指数,也**优于总市值较大股票构造的组合。规模因子(总市值、流通市值、自由流通市值)是影响股票收益的重要因子,其中总市值因子最为显著。 (三)估值因子通过6年内市场的分析,整体上来说,从市盈率、市净率、市销率、市现率、企业价值倍数等估值指标看,估值较低的股票组合表现较好。估值较低股票构造的组合整体上超越沪深300指数,也优于估值较高股票构造的组合。估值因子(市盈率、市净率、市销率、市现率、企业价值倍数)是影响股票收益的重要因子,其中市盈率(PE,TTM)因子最为显著,其次是市现率(PCF,TTM)。 (四)成长类因子,营业收入同比增长率、营业利润同比增长率,归属于母公司的近利润同比增长率、经营活动产生的现金流金额

同比增长率。 (五)盈利因子通过对时间内市场的分析,整体上来说,从净资产收益率、总资产报酬率和销售毛利率等盈利性指标看,盈利能力较强的股票组合表现较好。盈利能力较强股票构造的组合整体上超越沪深300指数,也优于盈利能力较弱股票构造的组合。但销售净利率较高股票构造的组合表现反而较差,落后于沪深300指数,也落后于销售净利率较低股票构造的组合。盈利因子(净资产收益率、总资产报酬率、销售毛利率)对股票收益的影响不是特别显著,其中净资产收益率指标较为显著。 (六)股东因子户均持股比例、、户均持股比例变化、机构持股比例变化。其中机构持仓比例变化影响较为显著。 (七)分析师预测因子分析师预测因子(预测当年净利润增长率、预测当年主营业务收入增长率、最近1个月预测净利润上调幅度、最近1个月预测主营营业收入上调幅度、最近1个月盈利预测调高占比、最近1个月上调评级占比)是影响股票收益的重要因子,其中最近1个月净利润上调幅度是最为显著的正向因子。(八)动量反转因子通过对时间内市场的分析,整体上来说,A 股市场上存在较为显著的反转效应,从前1个月涨跌幅、前两个月涨跌幅、前3个月涨跌幅、前6个月涨跌幅看,前期涨幅较小的股票组合表现较好,而前期涨幅较大的股票组合表现较差。前期涨幅较小的股票构造的组合整体上超越沪深300指数,也优于盈前期涨幅较大的股票构造的组合。动量反转因子(前1个月

基于GARCH模型族的中国股市波动性预测

基于GARCH 模型族的中国股市波动性预测 2005级数量经济学专业 倪小平 摘要:本文采用上证综合指数和深证成份指数2000年1月4日—2006年12月27日的每日收盘价对数百分收益率为样本采用GARCH 模型对我国股市波动性进行实证分析。 关键词:GARCH 模型 波动性 预测 一、引 言 波动性是金融市场最为重要特性之一。金融市场在一些时间段内显得非常平静,而在另外一些时间段内剧烈波动。描述波动性的时变特性是非常重要,因为第一,资产风险是资产价格的重要决定因素,投资者要求更高的预期收益作为持有更高风险资产的补偿,因此回报方差的变化对于理解金融市场是非常重要的,事实上,波动性是证券组合理论、资本资产定价模型(CAPM)、套利定价模型(APT)及期权定价公式的核心变量。第二,它与市场的不确定性和风险直接相关,是体现金融市场质量和效率的最简洁和最有效的指标之一。另一方面波动性对企业的投资与财务杠杆决策、消费者的消费行为和模式、经济周期及相关宏观经济变量等都具有重要影响。因此,波动性的估计、预测和影响因素分析一直是金融经济学研究的持续热点。 Engle 于1982年开创性的提出ARCH 模型,Bollerslev 于1986年对其进行扩展,给出了GARCH 模型。如今GARCH 模型族已经成为度量金融市场波动性的强有力工具。 本文的结构如下:首先对所选用的四种GARCH 模型给予了简单的描述;第二部分实证分析,包括:数据的选取与基本统计分析、模型参数的估计以及对波动性的预测和模型的比较;最后是本文的总结。 二、模型概述 1、一般GARCH 模型 ARCH 模型的主要贡献在于发现了经济时间序列中比较明显的变化是可以预测的,并且说明了这种变化是来自某一特定类型的非线性依赖性,而不是方差的外生结构变化。GARCH 模型是ARCH 模型族中的一种带异方差的时间序列建模的方法。 一般的GARCH 模型可以表示为 : 2011',t t t t t q p t i t i j t j i j y x v h h βεεααε θ--===+==++∑∑ 其中1var(|)t t t h ε?-=,1t ?-是时刻t-1及t-1之前的全部信息,其中, t v 独立同分布,且参数满足条件:这里t h 可以理解为过去所有残差的正加权平均,这与波动率的聚集效应相符合,即:大的变化后倾向于有更大的变化,小的变化后倾向于有小的变化。由于GARCH (p,q)模型是ARCH 模型的扩展,因此GARCH(p,q)同样具有ARCH(q)模型的特点。但GARCH 模型的条件方差不仅是滞后残差平方的线性函数,而且是滞后条件方差的线性函数。

两个好用的炒股模型

两个好用的炒股模型 散户炒股不容易,首先是获知信息渠道不如机构,得到往往是二手货,结果是人家都出货了,你还去入货;其次技术上也比不上专业操盘人士,看不懂复杂指标。但是,散户也有机构比不上的优势,一是资金量小,出入容易;二是时间成本较低。下面我介绍一下两种不同操作手法,希望大家能喜欢。 一.从价定盈炒股法 股票的价格,谁都能看明白,行情图上什么都可以做假,但是价格无法做假,因此,散户在信息和技术上都没有把握的话,干脆化繁为简,什么都不看,只看价格。 1.选择一只价格未创新高,并能看到发出买入信号的股票,至于信号是KDJ,或是MACD, 还是其他,都无所谓,看各自喜好。 2.假定这只股票价格为10元,而你的资金有10万,那就买500股。 3.那么此后有两种情况: (1)上涨,如果涨到10.25元,卖出。再上涨,那就回到步骤2,除非又跌回9.75,买回500股。 (2)下跌,如果跌至9.75元,再买500股。然后每下跌0.25元,就加仓500。直到反转上涨,而上涨后,每上涨0.25元,就要减仓500。 4.碰上涨停或跌停,停止操作一次,操作价位顺延到下一级。 5.0.25和500这两个数,根据资金量和股价计算,必须确保在股价下跌50%时候还有钱加 仓。 6.除非是碰上极端的V型走势或是单边下挫走势,该方法一般都能得到稳定收益。因此如 果在操作某个股票上,连续4次加仓,那要考虑该股票是不是破位了。 二.从价定损炒股法 上面讲的定盈操作法,下面就反过来做,定损不定盈,亏要亏少的,赚要赚大的。 1.选择几只价格未创新高,并能看到发出买入信号的股票,至于信号是KDJ,或是MACD,还是其他,都无所谓,看各自喜好。 2.将你资金分成几份,每一份分别买入一只股票,份数不多于5份为宜。 3.那么此后也有两种情况: (1)上涨,持有,直到该股票冲高,从最高价跌回4-5%,清仓。 (2)下跌,一旦跌破4-5%,清仓。 4.碰上开盘跌停,立即挂单减仓。涨停的话,看盘中是否打开而定。 5.尽量选择同一只股票反复操作,如果连续三次都是止损出局,那要看看这个股票是不是破位了。

股票收益率分析论文

股票收益率分析论文 1数据选取 本文实证分析的数据选取上海股市综合指数(简称上证综指)每日收盘指数。考虑到我国于1996年12月16日开始实行涨跌停板限价交易,即除上市首日以外,股票、基金类证券在一个交易日的交易价格相对上一个交易日收市价格的涨跌幅不得超过10%,本文把数据分析时段选择为:1996.12.16-2007.05.18,共2510组有效数据。数据来源为CCER中国经济金融数据库。数据分析采用软件为Eviews5.1。通过对原始序列的自然对数变换,得到上证综指收益率序列,有2509个数据,记为RSH。 2基本统计分析 2.1序列的基本统计量 对称分布的偏度应为等于0,而上证综指收益率的偏度为负值,说明该序列的分布是有偏的且向左偏斜,即收益率出现正值的概率小于收益率出现负值的概率。另外,已知正态分布的峰度等于3,而上证综指收益率的峰度是8.919924,远大于3,这表明RSH序列不服从正态分布,而是具有尖峰厚尾特性。 2.2序列的自相关性 采用Ljung-BoxQ统计量检验上证综指收益率序列的自相关性。原假设为序列不存在阶自相关。根据上证综指收益率的10阶滞后期的Q统计值及其相应概率值可知,上证综指收益率的相关性并不显著。 2.3序列的平稳性和正态性 为了避免伪回归现象的发生,在建立回归模型之前须对收益率序列进行平稳性检验。采用ADF方法检验RSH序列的平稳性,其检验统计值为-51.7733,远小于MacKinnon的1%临界值,认为上证综指收益率序列不存在单位根,是显著平稳的。这就避免了非平稳性带来的许多缺陷。上证综指收益率序列的 D.W.值为1.9705,非常接近于2,表明其残差序列不存在序列相关。 本文使用Jarque-Bera方法对RSH序列其进行正态性检验,检验统计值为3682.735(p=0.000),概率值足够小以至于必须怀疑原假设的正确性。这也就说明,用正态分布对中国股市收益率的波动性进行描述是不正确的。

股票交易数学模型

股票交易的数学模型 结论 股票价格的运行周期可以分为四个阶段,每个阶段都可以通过价格和成交量的趋势来定义: 第一阶段:价格递增,成交量递增。 第二阶段:价格递增,成交量递减,价格会达到最大值。 第三阶段:价格递减,成交量递减。 第四阶段:价格递减,成交量递增,价格会达到最小值。 买入的最好时间在第四阶段,卖出的最好时间在第二阶段。 成交量和买卖双方的关系 假设有100份股票,看多方(买方)为B ,看空方(卖方)为S 。则有: 100S B += (1) 成交量为Y ,则有成交量函数可以描述为: ,050 100,50100B B Y B B ≤ (3) 则有如下的函数关系图:

成交量和价格的关系 根据(2)和(3)可得: ,050100,50100P P a a Y P P a a ?≤

1 从0到50,价格递增成交量递增 2 从50到100,价格递增成交量递减 3 从100到50,价格递减成交量递增 4 从50到0,价格递减成交量递增 成交量和价格对股票波动周期的分析下面是上证指数的交易数据. 阶段阶段描述对应过程 1 价格递增,成交量递增价格属于上升通道 1 2 价格递增,成交量递减价格属于上升通道,价格达到最大值 2 3 价格递减,成交量递减价格属于下降通道 4 4 价格递减,成交量递增价格属于下降通道,价格达到最小值 3 显然,第四阶段是买入的最好时间,第一阶段是买入的次好时间。 第二阶段是卖出的最好时间。

7种量化选股模型

7种量化选股模型

业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动

等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体

相关主题
文本预览
相关文档 最新文档