当前位置:文档之家› 多因子选股模型之因子分析与筛选II:财务质量、价量和一致预期类指标

多因子选股模型之因子分析与筛选II:财务质量、价量和一致预期类指标

多因子选股模型之因子分析与筛选II:财务质量、价量和一致预期类指标
多因子选股模型之因子分析与筛选II:财务质量、价量和一致预期类指标

7种量化选股模型

7种量化选股模型 1、【多因子模型】 2、【风格轮动模型】 3、【行业轮动模型】 4、【资金流模型】 5、【动量反转模型】 6、【一致预期模型】 7、【趋势追踪模型】 1、【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为: (1)先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高 (2)按月计算个股的不同因子得分间的相关性矩阵; (3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值 (4)设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

7种量化选股模型

【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。 同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余

多因子量化选股模型建立及优化

多因子量化选股模型建立及优化 股市在不断的变化,所以从目前来看,不断探讨哪些指标在量化选股中更为有效,是具有现实意义的。这也是本文研究工作开始的初衷。 在整个研究过程中,保持数据的严谨性、中立性、数据处理方法的科学性对于研究结论的准确性来说至关重要。本文首先构建了一个比较全面的候选因子库,通过对候选因子数据进行异常值、缺失值、标准化、市值中性化、行业中性化等一系列的处理之后,本文对候选因子进行有效性检验及再筛选,最终认为 RP_TTM(净利润TTM/总市值)、BP_LF(净资产TTM/总市值)、operete_profin gr_TM(营业利润增长率TTM)、sales_gr_TTM(营业收入增长率)、BOOK_LEVEL(账面杠杆)、stock_to market_volatility(个股与市场波动率比值)、 REV_LAST1M_MAX(近一个月日收益率最大值)、RSI(相对强弱)等八个因子是较为有效的因子。 在得出有效因子之后,本文利用打分法来构建八因子选股模型,回测区间选定为2016年1月至2019年4月。通过对模型的回测,我们发现本文构建的八因子模型相比于沪深300,有着较为稳定的超额收益。 在整个回测时间段内,八因子模型的总收益为41.02%,年化收益为11.07%。相比于基准的收益情况,八因子模型相对总收益为32.28%,年化平均超额收益为8.92%。 为了深入研究,我们对原有模型进行优化,优化方案为“在利用八因子模型进行正式选股之前,首先以增长率-经营活动产生的现金流量净额(TTM)指标对股票池进行初步筛选”。通过对优化八因子模型进行回测,我们发现加入增长率-经营活动产生的现金流量净额(TTM)指标优化后的八因子模型回测表现更好。

最新 基于多因子模型的量化选股分析-精品

基于多因子模型的量化选股分析 随着中国资本市场复杂程度日渐加深和规模日益庞大,投资品种和数量与日俱增,无论是个人或是机构投资者所拥有的投资渠道与投资方法也在逐渐增多。量化投资作为一种来自海外资本市场的先进技术,在海外资本市场中受到了广泛追捧,著名的西蒙斯与大奖章基金便是利用了量化投资技术,于1989~2007年间获得了高达38.5%的平均年收益率。中国的量化投资发展虽仍在起步阶段,、金融学、科学相结合的优势来寻求超额收益。据统计显示,截至2016年10月,中国公募基金中共有48支基金以“量化”命名,其中长信量化先锋基金(519983),申万菱信量化小盘股票基金(163110)与大摩多因子策略混合基金(233009)等均表现出色,具有较高的年化收益率。而无论是在个体投资或是基金投资中,多因子选股模型均是较为广泛的量化模型之一。本文基于多因子模型策略,利用2011~2015年的数据对投资过程中的常用因子进行有效性检验,并使用有效因子构建基本多因子模型,根据假设创造性地使用简单打分法构建投资组合,基于2014~2016年的历史数据进行实证分析,为广大一般投资者提供了一种简单可行且收益率超过市场表现的投资策略。最后结合行业轮动效应与面板数据的多元回归分析对基本模型进行了深化与修正,创新性地提出了基于多因子模型的更多投资策略,也为较深层次的理论研究者提供了思路与数据参考。 一、文献综述 关于量化投资选股策略的研究涉及许多方面,常见的包括多因子模型、风格轮动模型、动量反转模型、趋势追踪模型等。对于多因子模型,最重要的环节便是有效因子的选取。大多数论文对于有效因子的选取通常采用因子评分法,此方法最早由Piotroski(2000)提出,常见操作为:将股票池中的股票按N个候选因子的大小依次排序,按照每个排序选取排名靠前的股票等权重构建N个极端的股票组合持有到期末,计算N个组合的平均收益率并与基准的指数收益率进行比较,用此方法能成功获取alpha收益组合所使用的排序因子即为有效因子[1]。另外一种方法则是回归法,通过计量模型求得单个因子对股价波动的贡献与显著性。丁鹏曾在其《量化投资——策略与技术》一书中使用1997~2006年的历史数据对常用的因子进行了有效性检验

多因子选股策略经典梳理

多因子选股策略经典梳理 股市之道无非三点:1择时,2选股,3 仓控。精通这 三点中的任何一点,都足以在股市中所向披靡。但是精通二 字何其艰难。 在量化选股策略中。多因子策略作为一个主要武器,被各种 公募基金和私募基金长期使用(小编注:国内策略同质化相 当严重,本文仅作为交流探讨推荐)。在此我们为不熟悉多 因子的各位朋友梳理一下不同风格的因子,以及他们的有效 性。 股价是由资金推动的(上涨为正向推动,下跌为反向推动)。但是影响资金进入和推出的因子确实千千万万,有基本面 的,有消息面的,有人看国家政策,有人看分析师预测,有 人听朋友介绍,有人跟风大V等等不一二足。 下面我将从9大类33个因子来给各位逐一分析。首先给出 在长时间来看表现优秀的因子。 1、规模因子,小市值效应。(推荐指数5颗星)。 在国内外不管是成熟市场还是我国的不成熟市场,小市值效 应一直存在。并且小市值的逻辑也很清晰,市值越小被操纵 的可能性就越来大,推动的估价上涨的资金需求就越小。试 用注意事项(震荡市或牛市表现优秀,下跌市跌幅大幅快于 大盘---牛市买小股,熊市进蓝筹)2、动量反转因子。(推荐

指数5颗星) 前一个月的涨跌幅度的反转效应明显。长得多了当然要跌, 跌得多了当然要涨,均值回归远离。这个其实和我们所说的 补跌补涨类似,从长期来看如果牛市来了,大家都会涨,只 不过有的先涨,有的后涨;熊市来了大家一块跌(贪婪与恐 惧的典型表现) 3 、交投因子,即换手率因子。(推荐指数4颗星) (我们选取一个月日均换手率)。换手率高的后面表现的貌 似都不佳(但经过测算新股和次新股貌似并不适用)。逻辑依然很清晰,长期换手率高,总让人觉得有点出货的嫌疑, 不是么?4、预测因子。(推荐指数5颗星) 预测当年主营业务收入增长率(平均值)。预测收入增长但 是是利好了,预测收入增长越高,利好越高。不是么,逻辑 依然清晰。这个因子在万德等软件上有统计,各位可能不太 容易获得。因子包括9类,规模因子,估值因子,成长因子,盈利因子,动量反转因子,交投因子,波动率因子,分析师 预测因子。 1.规模类因子。包括:总市值,流通市值,自由流通市值 2.估值类因子。包括:市盈率(TTM),市净率,市销率,市现率,企业价值倍数 3.成长类因子。营业收入同比增长率、营业利润同比增长率,归属于母公司的近利润同比增长率、经营活动产生的现金流

量化多因子选股简论(下)

太极量化多因子选股模型简论B 第二:因子的选取 候选因子的选取 (一)大数据因子搜索数据因子,搜索频率因子,搜索关键词因子,关注度因子,大众情绪因子等。其中搜索数据因子影响较为显著。 (二)规模因子通过对给定时间内(时间为为6年)市场的分析,不管是从总市值、还是流通市值和自由流通市值看,A股市场存在较为显著的小盘股效应。市值较小股票构造的组合整体上大幅超越沪深300指数,也**优于总市值较大股票构造的组合。规模因子(总市值、流通市值、自由流通市值)是影响股票收益的重要因子,其中总市值因子最为显著。 (三)估值因子通过6年内市场的分析,整体上来说,从市盈率、市净率、市销率、市现率、企业价值倍数等估值指标看,估值较低的股票组合表现较好。估值较低股票构造的组合整体上超越沪深300指数,也优于估值较高股票构造的组合。估值因子(市盈率、市净率、市销率、市现率、企业价值倍数)是影响股票收益的重要因子,其中市盈率(PE,TTM)因子最为显著,其次是市现率(PCF,TTM)。 (四)成长类因子,营业收入同比增长率、营业利润同比增长率,归属于母公司的近利润同比增长率、经营活动产生的现金流金额

同比增长率。 (五)盈利因子通过对时间内市场的分析,整体上来说,从净资产收益率、总资产报酬率和销售毛利率等盈利性指标看,盈利能力较强的股票组合表现较好。盈利能力较强股票构造的组合整体上超越沪深300指数,也优于盈利能力较弱股票构造的组合。但销售净利率较高股票构造的组合表现反而较差,落后于沪深300指数,也落后于销售净利率较低股票构造的组合。盈利因子(净资产收益率、总资产报酬率、销售毛利率)对股票收益的影响不是特别显著,其中净资产收益率指标较为显著。 (六)股东因子户均持股比例、、户均持股比例变化、机构持股比例变化。其中机构持仓比例变化影响较为显著。 (七)分析师预测因子分析师预测因子(预测当年净利润增长率、预测当年主营业务收入增长率、最近1个月预测净利润上调幅度、最近1个月预测主营营业收入上调幅度、最近1个月盈利预测调高占比、最近1个月上调评级占比)是影响股票收益的重要因子,其中最近1个月净利润上调幅度是最为显著的正向因子。(八)动量反转因子通过对时间内市场的分析,整体上来说,A 股市场上存在较为显著的反转效应,从前1个月涨跌幅、前两个月涨跌幅、前3个月涨跌幅、前6个月涨跌幅看,前期涨幅较小的股票组合表现较好,而前期涨幅较大的股票组合表现较差。前期涨幅较小的股票构造的组合整体上超越沪深300指数,也优于盈前期涨幅较大的股票构造的组合。动量反转因子(前1个月

7种量化选股模型

7种量化选股模型

业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动

等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体

行业轮动多因子选股模型及投资效果实证分析

行业轮动多因子选股模型及投资效果实证分析量化投资因其非凡的业绩表现引起了投资者的广泛关注,在过去的40年里颠覆了传统的投资哲学,被誉为“投资界的革命”。随着计算机技术的高速发展,该模式得到了更加迅速的进步和发展。许多把量化策略作为主要投资技术的资产管理公司已经发展成为同行中的佼佼者,这也说明了量化投资理念已经深入人心,量化投资技术渐渐成为主要的投资方法之一虽然我国在量化投资方面开始较晚,起点较低,且在量化投资策略研究、开发工具人才及交易技术等方面相较于国际水平比较落后,但是通过各方努力,已经在迅速发展了且取得了不错的成绩。根据统计资料可知,到2014年上半年为止我国资本市场上已有超过200只私募量化基金、87只公募量化基金和将近200只券商理财量化产品,去除大量小型化专户理财和有限合伙人投资企业等,这些量化产品管理着近千亿元人民币。 从量化产品占理财资金的比例和资本市场上现有量化策略方法的多少、量化投资思想的普及和认可度等多个角度都可以看出量化投资在我国有着非常大的发展空间。作为资本市场发展的必经阶段,量化投资也是市场有效性不断进步和发展的一种趋势。本文构建了多因子选股模型和行业轮动多因子选股模型,并采用沪深300指数成分股数据进行实证分析,实证结果表明文中构建的多因子选股模型和行业轮动多因子选股模型均可战胜沪深300指数表现,并且从多方面证明了行业轮动多因子选股模型的投资效果要好于多因子选股模型。文中第二章主要介绍了国内外量化投资的发展、经济周期的相关概念与货币周期的划分,从经济逻辑上论证了行业轮动策略的有效性及行业周期性非周期性划分依据,详细地说明了多因子选股模型的构建步骤。 第三章是对第二章中阐述的方法原理的实证检验。由实证结果可得,无论是战胜基准的概率还是信息比率和累计收益率,行业轮动多因子选股模型都好于多因子选股模型。在实证过程中还发现,行业轮动多因子选股模型优于多因子选股模型的关键之处在于当经济处于收缩阶段时非周期性行业的风险防御效果较好。

量化选股系列报告之六:基于纯技术指标的多因子选股模型

证券研究报告 | 金融工程 量化投资基于纯技术指标的多因子选股模型 2014年4月11日——量化选股系列报告之六 样本内各策略累计超额收益 资料来源:聚源数据、招商证券 样本外各策略累计超额收益 资料来源:聚源数据、招商证券 综合策略与沪深300收益 资料来源:聚源数据、招商证券 相关报告 《量化选股因子测试系列报告之 五-基于股票风格特征的量化评 分模型》2011/8/1 传统的多因子选股,主要考虑使用价值、成长、质量以及市场等四大类因子, 采用打分模型,构建月度选股策略。本报告尝试仅使用技术指标构建多因子选 股策略。在本报告中主要考察超买超卖型和趋势型指标的月度选股效果。 ?技术指标选股策略构建框架:在对单个技术指标测试时,使用优化后的参 数计算相应指标。为避免空仓月份较多的问题,提出以相对价格方式。在 考虑多个指标叠加的问题上,本文尝试:指标等权叠加、个股阈值限制、 资金等权分配以及个股多倍权重共四种方法检验模型效果。 ?趋势型指标死叉组合优于金叉组合:无论在哪种价格下,趋势型指标金叉 组合月均超额收益和累计超额收益几乎均为负,反而死叉信号给出组合这 两者基本为正值。显示股票反转效应更为明显:在趋势性指标给出买入信 号后的一个月时间,股价很可能已经反转,并且反转效应大于之前的动量 效应,导致持有金叉组合收益为负。因此基于反转效应,在处理趋势型指 标的问题上本文以死叉信号作为构建Top组合的依据。 ?样本内策略表现:在综合价格下以综合策略Ⅱ为例,样本内月均超额收益 为1.79%,月胜率在65%左右,年化信息比率达1.47。若以年化信息比率、 月均超额收益为评价标准,该方法具有明显优势。因此本文选择综合价格 下的综合策略Ⅱ作为样本内建模。 ?样本外策略检验:策略依然保持着相对于沪深300稳定的优势。过去15 个月沪深300收益率为-15%左右,而同期综合策略Ⅱ累计收益11.09%, 超额收益达26%左右,月均超额收益为1.85%,年化信息比率为1.57。 ?整体收益特征分析:综合策略Ⅱ与沪深300月收益的相关系数高达 92.36%,由此来看二者相关性非常显著。从回归方程的结果来看,相对于 沪深300的β系数为1.07,略大于1;α为1.13%,显著大于0。此外值 得注意的是,回归方程的拟合优度R 为0.853,拟合效果非常好。 ?未来可改进的方向:1、可以考虑以滚动5年作为样本内进行参数优化,并 用接下来1年作为样本外测试,构造动态选股模型;2、可在中证500、中 证800乃至全市场股票池中验证本文提出的选股策略效果;3、继续挖掘其 他类型指标。 陈军华 0755-******** chenjh2@https://www.doczj.com/doc/7612309507.html, S1090513080001 罗业华 0755-******** luoyh@https://www.doczj.com/doc/7612309507.html, -14% -12% -10% -8% -6% -4% -2% 0% 0% 50% 100% 150% 200% 250% 300% 350% 回撤超买超卖型趋势型 综合策略Ⅰ综合策略Ⅱ

多因子选股模型

多因子选股模型

————————————————————————————————作者: ————————————————————————————————日期:

多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。

例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。 同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。

多因子选股

多因子选股 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。 同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。

7种量化选股模型

7 种量化选股模型 1、【多因子模型】 【风格轮动模型】 2、 【行业轮动模型】 3、 【资金流模型】 4、 【动量反转模型】 5、 【一致预期模型】 6、 【趋势追踪模型】 7、 1、【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选 股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5 个步骤。 候选因子的选取

候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011 年底,则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n 个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法,同样的可以隔N 个月检验,比如2 个月,3 个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100 支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为: (1)先对不同因子下的n 个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高 (2)按月计算个股的不同因子得分间的相关性矩阵; (3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值 (4)设定一个得分相关性阀值MinScoreCorr ,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。 综合评分模型的建立和选股综合评分模型选取去除冗余后的有效因子,在模型运行期的某个时间开始,例如每个月初,对市场中正常交易的个股计算每个因子的最新得分并按照一定的权重求得所有因子的平均分。最后,根据模型所得出的综合平均分对股票进行排序,然后根据需要选择排名靠前的股票。例如,选取得分最高的前20%股票,或者选取得分最高的50 到100 只股票等等。举个例子:可以构建一个多因子模型为(PE,

多因子选股模型打分法

多因子选股模型打分法,是对于影响股票股价的因素给予相关的分值评定。然后将这些分值根据影响股票程度事先设定的权值加权得出的分数。是十分常见和成熟的一种选股方法。但打分法主观性较强,需要人为设定各个因子的权重,这也是比较困难的地方。 根据打分法确定基本面因子6个,其中成长性包括净利润增长率、主营业务收入增长率;盈利能力包括净资产收益率、总资产报酬率、收益质量(经营收益现金流/营业收入总额);现金流状况为经营活动产生的现金流净额/经营收入;估值因子2个,包括市盈率(个股PE值/行业PE平均值)和市净率(个股PB值/行业PB平均值);技术因子3个,包括资金流向(资金流入净额)、主力集中度(前十大流通股东持股占总流通股比例)和换手率(月均日换手率)。具体方法如下: (1)在对因子值进行排序打分时,分为100级。正向指标从低到高排序,反向指标从高到低排序,根据上述指标将公司分为100级,第i级的打分为i。因子值异常或者为0的股票不参与打分。 (2)股票综合得分为基本面、估值面和技术面按权重5:3:2计算得到。 (3)按照股票综合得分对所有股票进行排序,分值相同的股票按照流通市值排序,最后选择得分最靠前的30只股票。 (4)持有期为1个月。即股票调整周期为1个月,每个月的月末对个股综合打分进行更新,以确定下一期的股票组合。 按照以上选股策略,回测策略的实证效果,自2007年初至2011年12月底,策略组合取得了较为优异的绝对收益和明显的超额收益。实证期间策略组合累计收益为384.54%,同期沪深300累计收益15%,策略组合相对于沪深300的超额收益为369.53%,单期胜率为68.33%。 该策略组合在2012年1月至3月的累计收益,从图中可以看出,多因子选股组合扣除成本后在整个期间内累计获利为11.65%, HS300同期累计上涨 4.65%,相对于HS300的累计超额收益为7.0%。从周收益来看,多因子组合在三个月份中的2个月获得正收益、2个月获得超额收益。

多因子选股模型

多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。

例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未 来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。 同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大 小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。

相关主题
文本预览
相关文档 最新文档