当前位置:文档之家› 融合LDA模型的政策文本量化分析——基于国际气候领域的实证

融合LDA模型的政策文本量化分析——基于国际气候领域的实证

万方数据

万方数据

7种量化选股模型

7种量化选股模型 1、【多因子模型】 2、【风格轮动模型】 3、【行业轮动模型】 4、【资金流模型】 5、【动量反转模型】 6、【一致预期模型】 7、【趋势追踪模型】 1、【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。

候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为: (1)先对不同因子下的n个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高 (2)按月计算个股的不同因子得分间的相关性矩阵; (3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值 (4)设定一个得分相关性阀值 MinScoreCorr,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。

7种量化选股模型

【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如 PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。 同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验,具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余

关于课程关系量化分析的数学模型

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话):05 所属学校(请填写完整的全名):延安大学 参赛队员(打印并签名) :1. 彭瑞 2. 呼建雪 3. 朱培育 指导教师或指导教师组负责人(打印并签名): 日期: 2012 年 8 月 27 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):

关于课程关系量化分析的数学模型 摘要 本文探讨研究了关于某高校两个专业四门课程分数、学生学习水平的差异显著性以及课程间相互影响的情况。 首先我们对两个专业的各科成绩分别统计了平均值、标准差、及格率以及优秀率这些统计量值,又根据这些数据作出了特性指标矩阵;然后采用模糊聚类分析中的最优划分法得到了聚类分类结果,得到结论为:两专业的高级程序设计语言分数差异性显著,其他三门科目均没有显著差异。 接着我们根据课程间的联系,采用层次分析法得到各个科目在总成绩中所占的权重,即得到关于衡量学生学习水平的总成绩模型: 4j 3j 2j 1j 0.2323x 0.3619x 0.6090x 0.6664x +++=y 然后利用单因素方差分析法得到专业对学生学习水平影响的显著性05.0132.0>,即两个专业学生的学习水平无明显差异。 对于问题(3),我们直接利用SPSS 软件中的回归分析法得到高级程序语言设计、离散数学两门课程学习的优劣会影响到数据结构和数据库原理的学习。 最后,综合以上分析得到对于专业主干课的学习,我们应该认真学好专业基础课,以便为后续课程的学习打好基础。 关键词: 模糊聚类分析 层次分析 单因素方差分析 回归分析

幸福指数的评价与量化模型

承诺书 我们仔细阅读了数学建模竞赛选拔的规则. 我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。 我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。如有违反选拔规则的行为,我们将受到严肃处理。 我们选择的题号是(从A/B/C中选择一项填写): A 队员签名:1. 2. 3. 日期: 2011年 8月 18 日

编号专用页评阅编号(评阅前进行编号):

幸福感的评价与量化模型 摘要 幸福感是一种心理体验,它既是对生活的客观条件和所处状态的一种事实判断,又是对于生活的主观意义和满足程度的一种价值判断。而幸福指数,就是衡量社会这种感受具体程度的主观指标数值。在建立幸福指数的过程中对于 问题一:我们采用层次模型,首先根据主观将附表所给的18个数据分为5个类别(身心健康、物质条件、人际关系、社会环境、自我价值实现)。然后,采用加权平均的方法对主观指标进行分值量化(采取5到0分赋值法)得到 根据生活经验个人和政府可作为程度等因素建立比较判断矩阵,利用层次分析法由matlab 求出每一级对上一级的权重向量由此我们得到了第一层指标的分值向量F 和权重向量W ,由他们相乘可得主观幸福值: *H F W =3.3721 说明当前网民还是比较幸福的,基本符合现状。 问题二:在问题一所建立的模型的基础上,我们通过网上查找资料,分别以某地的教师和学生的调查问卷为样本,采用合成幸福法建立数学模型。合成幸福法的思路是首先将幸福指数指标体系中的各个指标量化(百分制),再根据因子分析法确定各个指标在整个体系中的权重,求解过程我们主要利用因子分析中的共同度这个概念,来求各个指标的权重, i b = 2 1 i n i i H H =? 然后根据各个指标的重要性合成幸福指数,建立该第区的幸福指数数学模型。通过计算测评指标对幸福指数的权重大小,我们得出了该地区教师和学生的幸福指数分别为69.3452和71.1856,和对当地调查的结果基本一致,表明模型是可用的。 问题三:我们对于以上两个模型进行了综合评价论证其有缺点提出改进建议,并对对模型的适用性进行了分析。 问题四:我们综合以上内容,根据影响幸福指数的主要因素,写信给校领导提出了一些建议,来提高师生们的幸福感。 关键词:幸福指数、层次分析法、加权平均法、因子分析

人力资源量化分析

人力资源量化分析 标准化文件发布号:(9312-EUATWW-MWUB-WUNN-INNUL-DQQTY-

人力资源量化分析 -支持人力资源战略转型与科学规划的坚强后盾 摘要:在全球激烈竞争的背景下,企业的持久核心竞争优势归根结底是人力资源特别是人力资本的竞争。如何将人力资源从成本转变为资本,如何开发、保持并传承企业优势人力资源,是企业进行人力资源战略转型和科学进行人力资源规划需要重点思考的问题。对于人力资源现状的分析,传统的定性分析给企业带来的价值越来越少,而人力资源的量化分析将用铁证如山般的事实数据来作为制定人力资源战略和规划的坚强后盾,推动人力资源的角色转变,为企业开发优势的人力资本,创造更大的价值。本文基于此,从人力资源的业务指标、运营指标和金额侧分析指标三个角度构建量化模型,并运用模型对人力资源规划进行了分析。 关键词:人力资源量化、人力资源战略、人力资源规划 当你问某一个企业负责人他企业有多少员工,可能他只能告诉你一个大概数。如果你进一步问他企业的人工成本、培训经费,也许他只能请你去问问人力资源经理了。令你更吃惊的是人力资源经理也不能准确的回答你的问题,只能敷衍地说去找具体负责这一工作的人。结果负责招聘、培训、薪酬的人哆哆嗦嗦,半天也说不出一个具体的数字,只能说一些大概、估计、也许之类的数据。质问他们为什么答案大体是人员变动太快,统计口径不一致,没有人力资源信息系统,统计量太大等等。这不是个别现象,在很多天天嚷着“以人为本”的企业,连自己的人才“家底”都不了解的时候,怎么去谈人力资源的规划怎么去制定科学合理的人力资源规划怎么去谈“人尽其才,才尽其用”正如部队打战,作为统帅,你要知道你手里有多少兵,有多少将,有多少可用之才。这些人员如何配备,如何才能充分利用人才提高战斗力。要随时掌握部队的人员变化,作战部队有多少,后勤部队有多少,人员是否配备合理。作为企业负责人,你首先要了解本企业员工的总数及变化情况,每个月人员的变动情况要及时通报。各部门的人员编制是否合理,如何将人力资源管理与公司战略更加紧密的结合等。

人力资源量化分析报告

人力资源量化分析 -支持人力资源战略转型与科学规划的坚强后盾 摘要:在全球激烈竞争的背景下,企业的持久核心竞争优势归根结底是人力资源特别是人力资本的竞争。如何将人力资源从成本转变为资本,如何开发、保持并传承企业优势人力资源,是企业进行人力资源战略转型和科学进行人力资源规划需要重点思考的问题。对于人力资源现状的分析,传统的定性分析给企业带来的价值越来越少,而人力资源的量化分析将用铁证如山般的事实数据来作为制定人力资源战略和规划的坚强后盾,推动人力资源的角色转变,为企业开发优势的人力资本,创造更大的价值。本文基于此,从人力资源的业务指标、运营指标和金额侧分析指标三个角度构建量化模型,并运用模型对人力资源规划进行了分析。 关键词:人力资源量化、人力资源战略、人力资源规划 当你问某一个企业负责人他企业有多少员工,可能他只能告诉你一个大概数。如果你进一步问他企业的人工成本、培训经费,也许他只能请你去问问人力资源经理了。令你更吃惊的是人力资源经理也不能准确的回答你的问题,只能敷衍地说去找具体负责这一工作的人。结果负责招聘、培训、薪酬的人哆哆嗦嗦,半天也说不出一个具体的数字,只能说一些大概、估计、也许之类的数据。质问他们为什么?答案大体是人员变动太快,统计口径不一致,没有人力资源信息系统,统计量太大等等。这不是个别现象,在很多天天嚷着“以人为本”的企业,连自己的人才“家底”都不了解的时候,怎么去谈人力资源的规划?怎么去制定科学合理的人力资源规划?怎么去谈“人尽其才,才尽其用”?正如部队打战,作为统帅,你要知道你手里有多少兵,有多少将,有多少可用之才。这些人员如何配备,如何才能充分利用人才提高战斗力。要随时掌握部队的人员变化,作战部队有多少,后勤部队有多少,人员是否配备合理。作为企业负责人,你首先要了解本企业员工的总数及变化情况,每个月人员的变动情况要及时通报。各部门的人员编制是否合理,如何将人力资源管理与公司战略更加紧密的结合等。 人们常说:“好的开头是成功的一半”,作为人力资源战略和规划也是一样,在制定战略和规划之前,我们需要有充足的准备,而且这些准备是有根有据,豪不动摇的。作为人力资源战略转型和科学规划的坚强后盾,人力资源的量化分析为企业制定人力资源战略和规划提供了科学的数据事实,而基于此的人力资源现状分析将更具准确性和说服力。

7种量化选股模型

7种量化选股模型

业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。 打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。 多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5个步骤。 候选因子的选取 候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011年底,则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动

等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验 一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。 上面的例子就已经说明了这种检验的方法,同样的可以隔N个月检验,比如2 个月,3个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除 不同的选股因子可能由于在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体

量化投资分析报告

1.概述 背景 量化投资在国外的实践已经有了40多年的发展,我国的量化投资起步较晚,从2004年开始出现量化投资的产品,由于缺乏有效的对冲手段,直到2010年4月沪深300股指期货上市之后才能算是真正意义上开始涉足量化投资。2015年的中国股市跌宕起伏,杠杆配资引发了大幅上涨和断崖式下跌,股市出现罕见的千股涨停、千股跌停、千股停牌的奇观,众多机构投资者和散户蒙受了巨大的损失。但其中少数量化投资基金在大幅波动的市场中却表现相对稳定。量化投资基金和量化对冲策略的稳健,很快引起了全市场的关注,也成为近期银行、券商、信托等机构追捧的新的产品模式。 在此背景下,结合建行现有的业务体系,本文将对量化投资的市场和可行性进行全面阐述,以分析其成为新业务模式的可能。 量化投资解读 量化投资定义 量化投资在学术界并没有严格统一的定义,现有的定义对于量化投资的定义的侧重点各有不同。本文对于量化投资的定义为: 量化投资是借助现代统计学和数学的方法,利用计算机技术从庞大的历史数据中海选出能带来超额收益的多种“大概率”事件以制定策略,用数量模型验证

及固化这些规律和策略,然后严格执行已固化的量化策略来指导投资,以求获取可持续的、稳定且高于市场平均的超额回报。 量化投资的特点 客观执行,避免情绪因素 传统投资的分析决策,大多数方面都由人工完成,而人并非能做到完全理性,在进行投资决策时,很难不受市场情绪的影响。量化投资运用模型对历史和当时市场上的数据进行分析检测,模型一经检验合格投入正式运行后,投资决策将交由计算机处理,一般情况下拒绝人为的干预,这样在进行投资决策时受人的情绪化的影响将很小,投资过程可以做到理性客观。 支持大数据处理,提高决策效率 我国股票市场上有近3000只股票,与上市公司相关的各种信息纷繁复杂,包括政策、国内外经济指标、公司公告、研究报告等,投资者靠自己手工的筛选根本就是力不从心。量化投资的出现为这个问题的解决带来了希望。量化投资运用计算机技术快速处理大量数据,对其进行辨别、分析、找出数据之间的关联并做出投资决策,大大减少了人工工作量,提高了投资决策效率。 统计模型支撑,策略选股择时精准 传统的投资方法中认为投资是一门艺术,投资决策需要的是投资者的经验和技术,投资者的主观评价起到决定作用。而量化投资有所不同,尤其是在套利策略中,它能做到精准投资。例如在股指期货套利的过程中,现货与股指期货如果

不可不知的N种量化策略模型

不可不知的N种量化策略模型 量化之星-策略模型研究小组 尖叫声在哪里??让小编听到你们的欢呼声!!! 是的!众所期待的量化(程序化)策略全方位揭密时间又到啦! 在上一个策略中,小编通过基于残差分析的动量反转策略向大家扒开了α的好基友——β与ε的秘密二三事。那么,接下来,就让小编化身贴心小棉裤,带大家走进动量反转的内心世界,探索策略优化的个中技巧,带大家一起装逼一起飞! 前情提要 α策略:核心思想是买入一组未来看好的股票,然后做空相对应价值的期货合约。 基于残差分析的动量反转策略:利用多元回归,得到排除市场影响的残差矩阵。对残差向量排序,前10%的股票做空,后10%的股票做多。 啥?前情提要太简略?不要懒,动起来,赶紧回去翻一翻前面的策略,打开“量化之星”微信号,找到右下角的“干货分享”模块,点击“策略分享”就出来啦~简直机智~ 动量反转策略优化 你以为小编会跟大家说要如何处理“做空前10%的股票”么? 呵呵,你果然还是太天真了。以小编飘忽而又销魂的笔法,小编又怎么能让你猜到呢?!首先,小编要来给大家扒一扒为啥我们要基于残差做分析。 残差分析的优势 其实,基于残差分析的动量反转策略已经是经过一次优化后的策略了。 传统的动量反转策略是直接基于总收益率计算动量的,并不需要求残差。因此,基于残差分析的动量反转策略,利用34个风控因子作多元回归后的标准化残差收益率来计算动量,挑选出来的股票组合风险暴露较小,更有利于考察动量和反转效应。 额,好绕,好晕。那下面还是让我们从策略绩效图中来看看两者的差别吧。 图一,传统动量反转策略

传统动量反转策略收益和沪深300指数走势基本重合。 图二,基于残差分析的动量反转策略 基于残差分析的动量反转策略收益高于沪深300指数走势,并且在大盘下跌的时候,收益依然保持上涨。 因此,从这两个绩效图,我们可以明显的看出,直接按总收益排序,不能有效的反应股票盈利的相对强弱,只有在去除风控因子的风险暴露之后的残差收益才能真正的反应股票的公司特有收益水平哦。 加入股指空头头寸 大多数人第一眼看到策略简介,对于需要优化部分的第一反应一定都是“做空前10%的股票”。没错,在中国市场,这是绝对的外挂,再好的绩效,出现了做空股票都是不可行的(融资融券不在本次讨论范畴)。因此,小编在策略中加入股指期货空头头寸来代替股票空头部分,也就是做成一个alpha策略哦。

量化选股系列报告之六:基于纯技术指标的多因子选股模型

证券研究报告 | 金融工程 量化投资基于纯技术指标的多因子选股模型 2014年4月11日——量化选股系列报告之六 样本内各策略累计超额收益 资料来源:聚源数据、招商证券 样本外各策略累计超额收益 资料来源:聚源数据、招商证券 综合策略与沪深300收益 资料来源:聚源数据、招商证券 相关报告 《量化选股因子测试系列报告之 五-基于股票风格特征的量化评 分模型》2011/8/1 传统的多因子选股,主要考虑使用价值、成长、质量以及市场等四大类因子, 采用打分模型,构建月度选股策略。本报告尝试仅使用技术指标构建多因子选 股策略。在本报告中主要考察超买超卖型和趋势型指标的月度选股效果。 ?技术指标选股策略构建框架:在对单个技术指标测试时,使用优化后的参 数计算相应指标。为避免空仓月份较多的问题,提出以相对价格方式。在 考虑多个指标叠加的问题上,本文尝试:指标等权叠加、个股阈值限制、 资金等权分配以及个股多倍权重共四种方法检验模型效果。 ?趋势型指标死叉组合优于金叉组合:无论在哪种价格下,趋势型指标金叉 组合月均超额收益和累计超额收益几乎均为负,反而死叉信号给出组合这 两者基本为正值。显示股票反转效应更为明显:在趋势性指标给出买入信 号后的一个月时间,股价很可能已经反转,并且反转效应大于之前的动量 效应,导致持有金叉组合收益为负。因此基于反转效应,在处理趋势型指 标的问题上本文以死叉信号作为构建Top组合的依据。 ?样本内策略表现:在综合价格下以综合策略Ⅱ为例,样本内月均超额收益 为1.79%,月胜率在65%左右,年化信息比率达1.47。若以年化信息比率、 月均超额收益为评价标准,该方法具有明显优势。因此本文选择综合价格 下的综合策略Ⅱ作为样本内建模。 ?样本外策略检验:策略依然保持着相对于沪深300稳定的优势。过去15 个月沪深300收益率为-15%左右,而同期综合策略Ⅱ累计收益11.09%, 超额收益达26%左右,月均超额收益为1.85%,年化信息比率为1.57。 ?整体收益特征分析:综合策略Ⅱ与沪深300月收益的相关系数高达 92.36%,由此来看二者相关性非常显著。从回归方程的结果来看,相对于 沪深300的β系数为1.07,略大于1;α为1.13%,显著大于0。此外值 得注意的是,回归方程的拟合优度R 为0.853,拟合效果非常好。 ?未来可改进的方向:1、可以考虑以滚动5年作为样本内进行参数优化,并 用接下来1年作为样本外测试,构造动态选股模型;2、可在中证500、中 证800乃至全市场股票池中验证本文提出的选股策略效果;3、继续挖掘其 他类型指标。 陈军华 0755-******** chenjh2@https://www.doczj.com/doc/1815259930.html, S1090513080001 罗业华 0755-******** luoyh@https://www.doczj.com/doc/1815259930.html, -14% -12% -10% -8% -6% -4% -2% 0% 0% 50% 100% 150% 200% 250% 300% 350% 回撤超买超卖型趋势型 综合策略Ⅰ综合策略Ⅱ

如何判断量化模型的优劣

如何判断量化模型的优劣 一、程序化的理解 程序化一般分为两类模型,一类是趋势模型,一类是震荡模型,如果你想两者结合起来就要看自己的本事了,程序化需要不停的去完善,但千万不能追求完美。 程序化是一种工具,帮助你积累财富的工具,却不是一种暴利的赚钱方式,程序化模型有好坏之分,程序化赚钱的前提是有好的模型,程序赚钱的关键是坚持的执行,程序赚钱的精髓就是在确定最终使用模型之后,彻底的放弃你对金融市场的一切理解和交易技能。就像武侠小说里说的,想练成最上层的功夫,就应该先废掉所有的武功。 二、程序化模型的选择与辨别 如果有人告诉你他的程序化能在不长的时间内,让你的资金翻几番,那你要为他的言语或者他的程序打个折扣,但是如果对方又能拿出不错的图形或者非常漂亮的收盘测试结果放在你的面前,你又当如何说服自己是相信还是不相信?以下内容就是帮助你如何辨别好坏模型。 1.测试时间:一个好的程序化必须经得起时间周期的测试,如果一个程序化,结果很漂亮,周期却只有一两个月,不可信; 2.使用资金:很多人贴出来的漂亮测试结果,使用资金常常是80%或者其它百分比,但这些都是不合理的选择,因为金融市场资金管理很重要,在行情好时候,资金使用越高,收益越大,行情不好时,资金使用越高亏损越大,但我们无法去判断接下来的行情会如何,所以,历史测试的结果使用百分比的开仓方式是不合理,这也就是为什么,有时候会出现,资金使用率为80%时,测试结果是亏损的,而使用率为40%时又是赢利的。总而言之,资金使用时应该选择固定的手数进行测试,不管他的行情如何,永不加仓或减仓,来测试一个模型更为合理; 3.测试方式:开盘价和收盘价测试均有其不合理性,趋势模型一般以趋势逆转点为开仓信号,故较为准确的是:出现指令的价位。 测试结果的分析: a.指令总数:也就是信号数,过高,说明震荡行情过滤不好,过低,说明风险大;如何判断信号数是否合理呢?那就只有不同的模型在同样的周期下的一个对比了;还有一个最简单的方式就是将指令总数/有效交易天数,以日内短线为例,一般一个有效交易日的平均信号数在2-5之间(此数据仅供参考); b.利润率:总利润不用看,只看扣出最大利润的结果,必须为正,而且测试周期越长利润率应该越大,很多模型,测近期不错,测远期就不行,所以测试时应该尽量的去测能测到的最长周期。(当然因为行情关系也可能出现,长期比短期利润率低,但总体而言,周期越长利润率越高,才是好的模型的测试结果) c.正确率:其它条件都完全一样的情况下,正确率越高自然越好,但也不用为了看到一个高正确率的模型而心动,也不用因为你自己模型的正确率低而担心,一般的正确率能在45%

7种量化选股模型

7 种量化选股模型 1、【多因子模型】 【风格轮动模型】 2、 【行业轮动模型】 3、 【资金流模型】 4、 【动量反转模型】 5、 【一致预期模型】 6、 【趋势追踪模型】 7、 1、【多因子模型】 多因子模型是应用最广泛的一种选股模型,基本原理是采用一系列的因子作为选 股标准,满足这些因子的股票则被买入,不满足的则卖出。 基本概念 举一个简单的例子:如果有一批人参加马拉松,想要知道哪些人会跑到平均成绩之上,那只需在跑前做一个身体测试即可。那些健康指标靠前的运动员,获得超越平均成绩的可能性较大。多因子模型的原理与此类似,我们只要找到那些对企业的收益率最相关的因子即可。 各种多因子模型核心的区别第一是在因子的选取上,第二是在如何用多因子综合得到一个最终的判断。 一般而言,多因子选股模型有两种判断方法,一是打分法,二是回归法。打分法就是根据各个因子的大小对股票进行打分,然后按照一定的权重加权得到一个总分,根据总分再对股票进行筛选。 回归法就是用过去的股票的收益率对多因子进行回归,得到一个回归方程,然后再把最新的因子值代入回归方程得到一个对未来股票收益的预判,然后再以此为依据进行选股。多因子选股模型的建立过程主要分为候选因子的选取、选股因子有效性的检验、有效但冗余因子的剔除、综合评分模型的建立和模型的评价及持续改进等5 个步骤。 候选因子的选取

候选因子的选择主要依赖于经济逻辑和市场经验,但选择更多和更有效的因子无疑是增强模型信息捕获能力,提高收益的关键因素之一。 例如:在2011年1月1日,选取流通市值最大的50支股票,构建投资组合,持有到2011 年底,则该组合可以获得10%的超额收益率。这就说明了在2011 年这段时间,流通市值与最终的收益率之间存在正相关关系。 从这个例子可以看出这个最简单的多因子模型说明了某个因子与未来一段时间收益率之间的关系。同样的,可以选择其他的因子,例如可能是一些基本面指标,如PB、PE、EPS 增长率等,也可能是一些技术面指标,如动量、换手率、波动等,或者是其它指标,如预期收益增长、分析师一致预期变化、宏观经济变量等。同样的持有时间段,也是一个重要的参数指标,到底是持有一个月,还是两个月,或者一年,对最终的收益率影响很大。 选股因子有效性的检验一般检验方法主要采用排序的方法检验候选因子的选股有效性。例如:可以每月检验, 具体而言,对于任意一个候选因子,在模型形成期的第一个月初开始计算市场中每只正常交易股票的该因子的大小,按从小到大的顺序对样本股票进行排序,并平均分为n 个组合,一直持有到月末,在下月初再按同样的方法重新构建n 个组合并持有到月末,每月如此,一直重复到模型形成期末。上面的例子就已经说明了这种检验的方法,同样的可以隔N 个月检验,比如2 个月,3 个月,甚至更长时间。还有一个参数是候选组合的数量,是50支,还是100 支,都是非常重要的参数。具体的参数最优的选择,需要用历史数据进行检验。 有效但冗余因子的剔除不同的选股因子可能由于内在的驱动因素大致相同等原因,所选出的组合在个股构成和收益等方面具有较高的一致性,因此其中的一些因子需要作为冗余因子剔除,而只保留同类因子中收益最好,区分度最高的一个因子。例如成交量指标和流通量指标之间具有比较明显的相关性。流通盘越大的,成交量一般也会比较大,因此在选股模型中,这两个因子只选择其中一个。 冗余因子剔除的方法:假设需要选出k 个有效因子,样本期共m 月,那么具体的冗余因子剔除步骤为: (1)先对不同因子下的n 个组合进行打分,分值与该组合在整个模型形成期的收益相关,收益越大,分值越高 (2)按月计算个股的不同因子得分间的相关性矩阵; (3)在计算完每月因子得分相关性矩阵后,计算整个样本期内相关性矩阵的平均值 (4)设定一个得分相关性阀值MinScoreCorr ,将得分相关性平均值矩阵中大于该阀值的元素所对应的因子只保留与其他因子相关性较小、有效性更强的因子,而其它因子则作为冗余因子剔除。 综合评分模型的建立和选股综合评分模型选取去除冗余后的有效因子,在模型运行期的某个时间开始,例如每个月初,对市场中正常交易的个股计算每个因子的最新得分并按照一定的权重求得所有因子的平均分。最后,根据模型所得出的综合平均分对股票进行排序,然后根据需要选择排名靠前的股票。例如,选取得分最高的前20%股票,或者选取得分最高的50 到100 只股票等等。举个例子:可以构建一个多因子模型为(PE,

量化分析研究报告

目录 目录 (1) 一,量化分析概念 (1) 二,CAMP模型原理 (1) 1,CAPM模型公式 (1) 2.马苛维茨的均值-方差模型中的效率边界 (1) 3.托宾的直线模型 (2) 4.证券市场线与贝塔值 (3) 5.关于证券市场线SML的一些特点 (5) 三,阿尔法策略实现 (6) 1,阿尔法策略概要 (6) 四,金融时间序列模型 (7) 一,量化分析概念 二,CAMP模型原理 1,CAPM模型公式 E(R i)=RFR+β[E(R M)-RFR] E(R i):风险资产i的期望收益或期望价格 RFR:无风险利率(Risk Free Rate) E(R M):市场期望收益 β=Cov(i, M)/δ2M Cov(i, M):风险资产与市场组和之间的协方差,反映单个资产与市场收益之间的联动性 δM:市场组合方差 δi:单个风险资产i的方差 2.马苛维茨的均值-方差模型中的效率边界 马苛维茨的均值-方差模型中的效率边界,也就是效率投资组合。遵循的原则是利益最大化和效用最大化。在投资者都是风险规避者的情况下,于是选择标准便是:风险相同,选择收益最大的资产;收益相等,选择风险最小的资产。 通过马氏理论做投资组合,投资者可以选取最佳投资组合来现实风险分散化,以最大化收益或最小化风险。资产之间的相关性越小,越容易构建投资组合。两资产之间的相关性使用相关系数ρij来表示[ρij=Cov(i,j)/ (δiδj)],-1≤ρij≤1,即介于完全相关与完全不相关之间。

马苛维茨资产组合效率边界图如下图1所示: a.当两资产相关系数ρij等于1时,边图为直线AB。 b.当两资产相关系数ρij等于-1时,边图为折线ADB。 c.当两资产相关系数-1<ρij<1时,边图为弧线ACB,见图中实线部分。 d.组合收益最高点为B点,风险最低点为A点。 e.效率边界是凸向纵轴的,这与风险厌恶者的效用无差异曲线正好相反,这是协方差效应的结果。效用无差异曲线是凹向纵轴的。 3.托宾的直线模型 马苛维茨假定所有资产都是有风险的,但经济学家托宾(James Tobin)在1958年发表的文章“投资组合原理”(The theory of portfolio selection)和“风险条件下的流动性偏好模型”(Liquidity Preference as Behavior Toward Risk)中,将马苛维茨的风险组合中加于无风险资产,这就将马苛维茨资产组合曲线转变成了直线。 公式推导:设定风险资产在投资组合中的权重为W i;则无风险资产的权重为1-W i。 E(R p)=(1-W i)RFR + W i R i δ2p=(1-W i)2δf2+W i2δi2+2(1-W i)W i Cov(f,i) (1) 因为是无风险资产,所以δf=0;Cov(f,i)=0。 所以: δp=W iδi或W i=δp/δi (2) 由(1)和(2)有: E(R p)=RFR + [ ( R i - RFR) /δi]δp (3) 所以从(3)试中,可以看出,加入无风险资产后,组合期望收益与组合方差之间成呈线性关系,且直线斜率为( R i - RFR) /δi。

相关主题
文本预览
相关文档 最新文档