回归法多因子策略
- 格式:pptx
- 大小:845.09 KB
- 文档页数:31
多因子回归模型
多因子回归模型是一种统计分析方法,可以通过分析多个变量之间的相关关系来推断模型的结果。
在经济研究中,多因子回归模型是经常用于分析股票市场、产品销量和全球经济因素等复杂行业的数据的统计模型。
多因子回归模型的基本形式用一个等式表示,其中Y是要预测的变量,多个因子X1至Xn(n≥2)代表该变量可能受到的其他因素影响,α和Β分别用于表征未知成分以及受影响因素之间的系数。
即:
Y = α + β1 * X1 + β2 * X2 + …… + βn * Xn
多因子回归模型包括三个组成部分:因变量Y,自变量X1到Xn以及未知系数β1到βn。
自变量X可以是定量变量或者定类变量,它可以表示各种可能影响Y的实际或潜在因素。
多因子回归模型的另一大优势在于它的易用性,它可以在任何可行的数据类型上实现,因而可以为复杂的经济问题提供有用的答案。
另外,它还可以通过确定各变量之间的相关性来检测复杂的模型结构,从而最大限度地提高模型的拟合精度。
总之,多因子回归模型是一种经常用于解决经济研究问题的有效分析方法,其能够精确地检测两个变量之间的相互影响及因素之间的系数,从而最大限度地提高模型的拟合精度。
随着我国资本市场日趋成熟,人们的投资理念日趋科学和理性,投资方式也变得多元化,开始将国外引入的量化投资思想结合中国资本市场的具体情况,而不是依赖于情感和过去的感性经验[1]。
这种投资模式的变化使得我国量化投资研究得到迅速发展,逐渐增加的量化基金及其他定量金融产品在投资策略中越来越重要,因此在我国金融市场中,量化投资得到了越来越多的关注[2]。
信息不对称使得我国资本市场出现较多的市场失灵现象,往往造成市场非完全有效,与内在价值偏离(定价错误)的股票也较多,因此在这样的市场中,量化策略具有特有的纪律性、分散化持股、套利组合、系统性等优势,量化投资策略的应用前景广阔[3]。
多因子选股模型作为一种应用较为广泛的量化投资策略[4],基本原理是通过经济逻辑和市场经验,捕获模型信息并采用一系列的因子,如价值因子、质量因子、成长因子、动量因子等作为选股标准,选入满足标准的因子,并剔除冗余因子[5]。
根据中国的A股市场特性,本文试图基于多因子模型,从众多的候选因子中找出能够有效解释股票收益率且非冗余的因子,根据这些因子所占权重来构建量化投资组合,并验证其有效性,对该策略运行的风险程度进行度量。
建立一种基于多因素模型的股票量化选择策略,希望为投资者提供可行的量化投资参考。
1 文献回顾国外学者及机构投资者都将上市公司基本面作为研究客体,分别从公司的财务状况、盈利能力、长期偿债能力和现金流等方面研究相应指标对公司股票内在价值的影响[6~8]。
既往的研究成果揭示了诸多因素都会影响上市公司的账面价值[9,10],上市公司的内在价值及股票价格涨跌的内在原因不能通过单个因素精确地反映,往往由多个因素决定[11,12]。
结合因子投资的概念,Dichtl等(2021)设计了一个灵活的框架,为传统的多资产分配构建不同的因子完成策略[13]。
他们的因子完成概念包括一个固定在多资产、多元风险模型中的最大多样化参考组合,该模型包含市场因子,如股票、持续时间和商品,以及携带因子、价值、动量和质量等风格因子,给定因子完成策略的具体性质因投资者的偏好和限制而不同。
多因子选股策略研究员:魏刚执业证书编号:S42☎✉——数量化选股策略之十二《数量化选股策略之十一:分析师预测因子分析》2011-08-31《数量化选股策略之十:股东因子分析》2011-08-30《数量化选股策略之九:交投波动因子分析》2011-08-24《数量化选股策略之八:动量反转因子分析》2011-07-27《数量化选股策略之七:盈利因子分析》2011-07-27《数量化选股策略之六:成长因子分析》2011-07-12《数量化选股策略之五:估值因子分析》2011-07-06《数量化选股策略之四:规模因子分析》2011-06-30在前面几篇报告中我们对规模因子、估值因子、成长因子、盈利因子、动量反转因子、交投波动因子、股东因子和分析师预测因子进行了分析,其中规模因子(总市值)、估值因子(市盈率TTM)、动量反转因子(前1个月涨跌幅)、波动因子(前1个月波动率)、分析师预测因子(最近1个月净利润上调幅度)等是较为显著的因子。
由总市值、市盈率TTM、营业利润同比增长率、净资产收益率、前1个月涨跌幅、前1个月日均换手率、前1个月波动率、户均持股比例变化、机构持股变化、最近1个月净利润上调幅度等10个因子构造的等权重多因子策略表现较好。
由综合得分最高的20只中证800指数成份股构成的等权重组合大幅跑赢沪深300指数,2005年1月至2011年5月间的累计收益率为1517.29%,年化收益率达54.34%;由综合得分最高的50只中证800指数成份股构成的等权重组合同期的累计收益率为1059.72%,年化收益率达46.54%;同期沪深300指数的累计收益率为200.16%,年化收益率为18.69%。
由总市值、市盈率TTM、营业利润同比增长率、净资产收益率、前1个月涨跌幅、前1个月日均换手率、前1个月波动率、户均持股比例变化、机构持股变化、最近1个月净利润上调幅度等10个因子影响股价走势的主要因子包括市场整体走势(市场因子,系统性风险)、估值因子(市盈率、市净率、市销率、市现率、企业价值倍数、PEG等)、成长因子(营业收入增长率、营业利润增长率、净利润增长率、每股收益增长率、净资产增长率、股东权益增长率、经营活动产生的现金流量金额增长率等)、盈利能力因子(销售净利率、毛利率、净资产收益率、资产收益率、营业费用比例、财务费用比例、息税前利润与营业总收入比等)、动量反转因子(前期涨跌幅等)、交投因子(前期换手率、量比等)、规模因子(流通市值、总市值、自由流通市值、流通股本、总股本等)、股价波动因子(前期股价振幅、日收益率标准差等)、分析师预测因子(预测净利润增长率、预测主营业务增长率、盈利预测调整等)。
基于多因子模型的量化选股方法研究作者:梁晓颖来源:《中国市场》2021年第25期[摘要]股票收益受很多因素影响,比如市场环境、行业发展、投资者预期等。
“多因子模型”中的因子即影响因素,该模型就是寻找对股票收益率影響显著的因素,用这些因素来分解股票收益并进行选股。
在量化选股的实践中,由于市场环境的多变性及市场参与者或分析师的不同理解,会构建出不同的多因子模型。
文章在简述多因子模型的理论基础后,叙述了多因子模型构建过程,从而为量化选股提供方法。
[关键词]量化选股;多因子模型;因子有效性[DOI]10.13939/ki.zgsc.2021.25.031随着大数据时代的来临以及多种基础金融理论的不断发展,量化投资获得了必要的理论来源和支持,而多因子模型也顺势成为量化投资选股的重要方法。
1 多因子模型概述1.1 多因子模型的基本概念多因子量化选股模型指的是在选股过程中利用多个对股价走势有显著且有效影响的因子,通过量化不同因子对股票收益率的影响,建立起选股模型。
1.2 多因子模型的理论基础1.2.1 CAPM模型1952年马柯维茨用均值和方差来定量描述资产的收益和风险,建立了基本模型以用于确定最佳资产组合。
后来,夏普等人在他的理论基础上,发展出了CAPM模型。
模型公式:E (ri)=rf+βi(E(rm)-rf),该模型表明资产的预期超额收益与市场超额收益成正比,股票的价格只与市场风险有关,跟上市公司基本面并没有关系,并且高的股价需要高的β值来支撑。
1.2.2 套利定价理论由于CAPM模型假设条件过于苛刻,后来的学者们打破原有假设,导出套利定价理论(APT模型)。
模型公式:E(ri)=rf+bi1F1+bi2F2+…+binFn, binFn为证券i第n个因素的敏感度。
该模型比CAPM模型的假设更宽松,但是无法从模型中获知哪些因子起到决定性的作用。
1.2.3 Fama-French三因子模型经过学者们的研究,很多现象不再可以用CAPM模型来解释,比如市场中的小市值、价值股表现明显超过市场。
多个因变量的回归分析多个因变量的回归分析是研究多元因素之间相互作用的必要方法,可以用于分析多个变量对响应变量的影响,从而有效控制其它变量,更好地理解变量之间的关系。
多变量回归分析可以提供有价值的决策信息,并有助于我们做出更好的决策。
一、多个因变量的回归分析的基本概念多个因变量的回归分析是一种统计分析方法,用于检测多个变量对响应变量的影响。
它的基本思路是,首先假设每一个因变量都可以与响应变量有关,然后用数据确定每一个因变量与响应变量之间的关系。
多变量回归分析也可以用来控制其它变量,以减少因变量对响应变量的影响,更好地理解变量之间的关系。
二、多个因变量的回归分析的应用多个因变量的回归分析有多种应用,其中包括估算多个因变量对某一变量的影响大小、分析多个因变量的相互作用、评估一种模型的拟合可能性、比较不同模型之间的差异等等。
这种分析方法可以帮助我们更好地理解变量间的相互关系,使我们能够在决策过程中控制多个变量,从而获得更好的决策结果。
三、多个因变量的回归分析的步骤接下来,将介绍多个因变量的回归分析的基本步骤:1、观察视角:首先根据研究的目的,确定因变量和响应变量。
2、变量定义:根据研究过程中收集的数据,对变量进行定义,定义变量的类型,如连续型、离散型等。
3、建立模型:在回归分析中,建立模型是指根据定义的变量,使用回归方程来表示变量之间的关系。
4、检验模型:根据模型建立后的结果,可以使用多种统计方法对模型进行检验,以确定模型的准确性。
5、结果可视化:使用可视化工具,将结果进行可视化,以便于更直观地分析变量之间的关系。
四、小结多个因变量的回归分析可以提供有价值的决策信息,有助于我们做出更好的决策。
在实践中,可以按照观察视角、变量定义、建立模型、检验模型以及结果可视化五个步骤来实施多个因变量的回归分析。
基于沪深300指数股票的多因子模型研究王婧橦;周生彬;王玉文【摘要】随着中国资本市场的发展、金融产品的完善以及市场竞争的客观需求,量化选股策略随之不断丰富,该文基于R、SPSS软件和choice金融数据库利用回归法构建了多因子选股模型.该文选取的样本数据为2011 ~ 2016年间的沪深300股票市场上的财务指标、行情指标等.对于因子的选取考虑了市场的经验以及因子对公司的代表性.首先对因子进行了初步的单因子检验删除了相关性不明显的部分因子;其次对剩余的因子做进一步的相关性分析,删除了相关性较高的因子;最后进行逐步回归,得到了最终的回归选股模型.【期刊名称】《哈尔滨师范大学自然科学学报》【年(卷),期】2019(035)002【总页数】4页(P19-22)【关键词】多因子模型;回归分析;投资者情绪【作者】王婧橦;周生彬;王玉文【作者单位】哈尔滨师范大学;哈尔滨师范大学;哈尔滨师范大学【正文语种】中文【中图分类】O2110 引言Markowitz 1952年在《portfllio selection》[1]中提出均值方差模型,首次把数学工具引入到金融研究中.1964年,在Markowitz模型的基础上William Sharpe 做了进一步研究,提出了单一模型;威廉夏普、约翰林德纳、Jan Mossin等人先后对资产定价理论进一步研究,提出了CAPM模型.这一模型后来发展为现代金融市场价格理论的支柱,被广泛应用到金融投资决策和公司理财等各个金融相关领域. Ross对套利定价理论APT进行了研究并提出资产收益率的状态空间是由因子矢量和常熟矢量所构成;Fama等认为资产定价模型中的定价因子可以从CAPM模型未能解释的市场异象中寻找,基于此两位学者提出了经典的三因子定价模型,这三因子是市场溢酬、市值因子和帐面市值比因子.继三因子模型之后,2015年Fama 和French[2]在三因子模型的基础上增加了盈利因素RMW和投资因素CMA,提出了五因子模型,并通过美国50余年的市场上数据证实了模型的有效性.随后,多因子模型逐渐受到各方的关注.1 基础知识考虑多个因素对证券收益率的影响,则产生多因素模型,多因素模型更加清晰明确解释了系统风险,从而展示不同的股票对不同的因素有不同的敏感性,这使得精确性得以提高.多因素模型的一般式是:Ri=ai+βi1F1+βi2F2+…βikFk+εi式中E(FK)=0,K=1,2,…,K;E(εj)=0,ai代表所有影响因素为零时的股票收益率的期望水平,各个F代表风险因素影响的实际水平,而相应的βi表明股票收益率对该因素的敏感度,从不同股票对同一风险因素F相关联的参数β可比较出不同股票对该因素的反应程度,并可因此得出某股票对该因素的风险评价[3].2 建立模型首先将影响股票收益的因子按估值因子、成长因子、宏观因子、行为因子进行划分,初步选取影响股票收益的常见因子见表1.表1 因子初选因子类型因子名称因子计算方法市净率(PB)每股市价/每股净资产估值因子市盈率(PE)股票价格和每股收益的比率股息率(DYR)股息/股票买入价格×100%市现率股票价格/每股现金流量资产收益率(ROA)净利润/平均资产总额×100%成长因子净资产收益率(ROE)净利润/平均股东权益×100%净利润增长率(NPG)(当期净利润-上期净利润)/上期净利润×100%换手率(TT)成交量/流通总股数(手)×100%宏观因子国内生产总值(GDP)预测宏观经济走势消费者信息指数(CCI)预测经济走势和消费趋势的一个先行指标,同时是监测经济周期变化的依据消费物价指数(CPI)衡量经济体的通货膨胀率行为因子投资者情绪投资者行为的量化2.1 因子选取说明市净率指的是每股股价与每股净资产的比率;市盈率亦称本益比,是股票价格除以每股盈利的比率;股息率,是一年的总派息额与当时市价的比例;市现率是股票价格与每股现金流量的比率;资产收益率,又称资产回报率,它是用来衡量每单位资产创造多少净利润的指标;净资产收益率ROE,是净利润与平均股东权益的百分比,该指标反映股东权益的收益水平,用以衡量公司运用自有资本的效率;净利润是指利润总额减所得税后的余额,是当年实现的可供出资人(股东)分配的净收益,也称为税后利润;“换手率”也称“周转率”,是反映股票流通性强弱的指标之一;GDP指标在宏观经济分析中占有重要地位;投资者信心指数,也成为信心风险,指的是股票对于投资者信心变化的敏感程度,大多数资产和信心风险有正相关关系;消费物价指数,该指标可以衡量经济体的通货膨胀率;许多实证表明有些股票横截面收益中未能被CAPM模型、Fama-French三因子模型和动量因子解释的部分,往往与股票市场中投资者的情绪、投资者认知偏差等非理性因素存在系统相关性[4].投资者情绪是一个抽象的概念,没有具体的表现形式,该文主要是将一些可作为市场风向标的金融变量作为投资情绪的代理指标,选取换手率、A股市场IPO数量、首日募集资金数量、A股新增开户数量四个指标,并运用主成分分析法构建投资者情绪指数.2.2 股票数据的选取该文所使用的所有数据均来源于choice金融客户端,所有行情数据均来自不复权的每日收盘价数据.所有的财务数据均为当年的季度财报数据.剔除有过ST和*ST的股票,因为这两类股票在市场上具有更大波动性,不适合采用价值投资的方法进行投资.剔除掉数据缺失的股票,剩余207只股票样本,样本选自2011~2016年6年的股票进行分析,其中因子检验筛选期是2011年1月~2013年12月共3年的数据,多因子选股模型检验期为2014年1月~2016年12月,共3年的数据.2.3 因子筛选该文使用的单因子检验方法为Fama-MacBech检验,将单因子取值与股票收益率进行一元线性回归得到回归系数b,然后代入公式t(bt)= 计算t统计量,与临界值2作比较,alpha取值为0.05,具体结果见表2.表2 因子检验结果因子名称t值FM检验结果市净率(PB)-4.35通过市盈率(PE)-2.87通过股息率(DYR)1.34未通过市现率0.79未通过资产收益率(ROA)2.06通过净资产收益率(ROE)-2.26通过净利润增长率(NPG)2.85通过换手率(TT)-2.12通过国内生产总值(GDP)0.63未通过消费者信息指数(CCI)2.21通过消费者物价指数(CPI)-0.33未通过投资者情绪指数 3.67通过由t统计量检验值可以知道,通过检验的因子有:市净率(PB)、市盈率(PE)、资产收益率(ROA)、净资产收益率(ROE)、换手率(TT)、消费者信息指数(CCI)、投资者情绪指数7个因子.利用相关系数判定,将入选的因子进行相关性检验,发现市净率(PE)和市盈率(PB)之间,资产收益率(ROA)和净资产收益率(ROE)之间相关性很高,比较回归检验结果后,剔除市盈率(PB)以及资产收益率(ROA).剩余6个因子进入下一步的逐步回归和模型构建.2.4 逐步回归法逐步回归是将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删除.以确保每次引入新的变量之前回归方程中只包含显著性变量.这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除为止.以保证最后所得到的解释变量集是最优的[5].逐步回归的因子有6个,加上常数项共有7个因子,通过逐步回归分析得到表3结果.表3 回归分析结果VARIABLECOCFFSTD.ERRSTATUSPC2.15623.9871IN0.0012PE1.01050.2135I N0.0619ROE-0.17160.0258IN3.7821NPG-0.00170.0196OUT0.6785TT0.00890.0875IN1.8972c-19CCI-0.02670.0436OUT0.1967SENT0.21930.0027IN0.0135于是,得到了多因子模型:Y=2.1562+1.01PE-0.17ROE+0.01TT+0.22SENT3 结束语该文以量化投资中常用的模型之一,多因子模型为基础,在因子选取层面上从基本面因素、宏观因素、行为金融因素三方面对股价的影响进行评估.通过一元回归分析、相关性检验、逐步回归筛选出较为有效的风险因子,构建了多因子模型.通过历史数据对模型进行检验,证明了量化投资在中国股市具有很强的可行性和潜力;未来,量化投资会在中国的市场上越来越得到普及.参考文献【相关文献】[1] Piotroski J D. Value Investing:The Use of Historical Financial Statement Information to Separate Winners form Losers[J]. Journal of Accounting Research,2000(38).[2] 史永东,田渊博,马姜琼,等.多因子模型下投资者情绪对股票横截面收益的影响研究[J].投资研究,2015,5(34):48-65.[3] Fama E F, French K R.A Five-Factor Asset Pricing Model[J].Journal of Financal Economics,2015(116).[4] 王玉文,刘冠琦,王紫,等. 随机金融数学导论[M]. 北京:科学出版社, 2015.[5] 马永开,唐小我.多因素证券组合投资决策模型[J].理论与方法研究,1998(5):62-65.。
逐步回归法在中长期水文预报中的应用
陈芷怡
【期刊名称】《西部探矿工程》
【年(卷),期】2022(34)10
【摘要】逐步回归法是中长期水文预报中重要方法之一,根据天一站近50年的径流量资料,采用逐步回归方法建立了天一站年枯期平均流量的中长期预报模型。
首先,通过单相关系数法对预报因子进行筛选,从中选出了71个因子,采用M-K法检验,分析天一站枯期平均流量变化趋势,发现在1963年和1978年发生了枯期平均流量的突变。
然后对预报因子进一步选择,选出7个因子,建立预报模型,代入逐步回归方程,对天一站平均流量的拟合合格率为88.23%,试预报合格率为100%。
预报结果较好。
【总页数】5页(P169-173)
【作者】陈芷怡
【作者单位】安徽省核工业勘查技术总院
【正文语种】中文
【中图分类】P338
【相关文献】
1.双重逐步回归分析在中长期水文预报中的应用
2.多因子逐步回归周期分析在中长期水文预报中的应用
3.双重逐步回归分析在中长期水文预报中的应用
4.多元线性
回归与逐步回归在洪水预报中的应用——以南汀河中长期洪水预报为例5.贝叶斯概率水文预报系统在中长期径流预报中的应用
因版权原因,仅展示原文概要,查看原文内容请购买。
三因子和四因子策略的原理和实现方式-回复三因子和四因子策略是投资领域中的两种流行的投资模型,它们基于股票市场中影响股票收益的主要因素,并利用这些因素来选择投资组合。
本文将详细介绍三因子和四因子策略的原理和实现方式,并一步一步回答与其相关的内容。
一、三因子模型的原理和实现方式1.1 原理三因子模型是由经济学家尤金·法马在1992年提出的,用于解释投资组合的收益。
该模型包括三个主要因素:市场因子、规模因子和价值因子。
- 市场因子代表整个市场的收益表现,通常以广义指数(如市场指数)来衡量。
- 规模因子代表市值较小的公司相对于市值较大的公司在收益方面表现出的差异。
通常用市值因子(SMB,Small Minus Big)来衡量。
- 价值因子代表价值股相对于成长股在收益方面表现出的差异。
通常用账面市值比(HML,High Minus Low)来衡量。
三因子模型认为,通过选择市场、规模和价值方面具有较高收益的股票,可以构建一个具有较高收益的投资组合。
1.2 实现方式要实现三因子模型,可以按以下步骤进行:步骤一:收集数据。
需要收集市场指数、公司的市值数据和账面市值比数据。
步骤二:计算市场因子。
通过计算市场指数的收益率,得到市场因子的收益。
步骤三:计算规模因子。
将公司根据市值大小分类,计算小市值公司和大市值公司的收益差异。
步骤四:计算价值因子。
将公司根据账面市值比分类,计算价值股和成长股的收益差异。
步骤五:建立回归模型。
利用市场因子、规模因子和价值因子的收益差异来建立回归模型,计算各因子的权重。
步骤六:选择投资组合。
根据回归模型计算出的各因子权重,选择具有较高预期收益的股票进行投资。
二、四因子模型的原理和实现方式2.1 原理四因子模型是基于三因子模型的基础上,增加了一个因子:动量因子。
该模型认为市场因子、规模因子、价值因子和动量因子是影响股票收益的重要因素。
- 动量因子代表股票价格的变动趋势,在投资组合中选择上升趋势的股票可以获得更高的收益。