断点回归和指数效应
- 格式:docx
- 大小:14.78 KB
- 文档页数:2
【知识文章】标题:深度解读stata模糊断点回归结果在统计分析领域,断点回归是一种常用的分析方法,能够帮助研究人员在研究数据中找到关键的转折点或阈值,从而更好地理解现象背后的规律。
而在实际应用中,stata软件提供了模糊断点回归分析的功能,更加贴近实际情况,对于研究人员来说是一个非常有用的工具。
本文将深度解读stata模糊断点回归结果,帮助读者更好地理解该分析方法的有效性和结果解释。
一、基本概念1.1 模糊断点回归模糊断点回归是一种用于发现数据中的结构转变的分析方法,相比传统的断点回归更加灵活和智能。
它能够针对数据的不确定性进行分析,帮助研究人员更好地理解数据中的变化规律。
1.2 staa软件及其应用stata是一种专业的统计分析软件,广泛应用于学术研究和商业领域。
它提供了丰富的统计分析功能,包括模糊断点回归分析,在实际数据分析中有较高的可靠性和灵活性。
二、结果解读2.1 模糊断点的确定在进行模糊断点回归分析时,首先需要确定数据中的模糊断点位置。
通过stata软件的分析工具,可以得到数据中的潜在断点位置及其置信区间,帮助研究人员更好地理解数据的结构变化。
2.2 断点处的效应估计在确定了模糊断点位置后,接下来需要对断点处的效应进行估计。
stata软件能够提供准确的效应估计值和显著性检验结果,帮助研究人员判断断点处的效应是否显著,从而更好地理解数据的变化规律。
2.3 结果的解释和应用通过对模糊断点回归结果的深度分析,研究人员可以更好地解释数据中存在的潜在断点和其影响,从而为进一步的研究和决策提供依据。
stata软件提供了直观的结果展示和解释功能,帮助研究人员更好地应用分析结果。
三、个人观点和总结在实际研究和数据分析中,模糊断点回归分析是一种非常有用的方法,能够帮助研究人员更好地理解数据中的结构变化和规律。
而stata软件提供了便捷和可靠的分析工具,能够有效支持模糊断点回归分析的实施和结果解释。
对于研究人员来说,掌握stata模糊断点回归分析的方法和技巧,能够更好地发掘数据的潜在规律和价值,为实际决策和研究提供更有力的支持。
我从断点回归的研究论文中学到
我从断点回归的研究论文中学到断点回归(Regression Discont inuity)是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。
断点回归的原理是“通过断点处一个天然跳跃造成关注变量的跳跃,从而识别因果”,换句话说,没有断点事件的干扰,这个变量本来会按它原本趋势继续下去。
这就让我想到了DID,DID原理是有两个具有平行性趋势的组,在经过一个特殊事件后,treatment group 的增长趋势发生改变,我们识别的就是treatment和control在事件后增长趋势的差异。
那么,断点回归就是DID的一个特殊案例,假设为control和treatment事件前趋势完全相同(都是它自己)且连续,事件后,treatment group发生了变化,treatment发生的变化完全是由于这一个事件引起的;目前我们掌握的是,control group事件前数据和treatment group事件后数据,由于我们的前提假设,趋势相同且连续,我们可以推断出control group原本应具有的事件后趋势,从而比较treatment和control的区别,得出事件具体影响效果。
一引言2010年4月24日,该年度的约翰·贝茨·克拉克奖章(John Bates Clark Medal)——针对40岁以下年轻经济学者的最高荣誉,授予了麻省理工学院经济系的Esther Duflo教授以表彰其在随机实验普及和其在发展经济学中应用方面的卓越贡献。
在因果关系分析的实证方法中,最优的选择应当为随机实验,但是随机实验的时间成本和经济成本都比较高,而在随机实验不可得的情况下,需要考虑使用其它方法。
断点回归(Regression Discontinuity)便是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。
Lee(2008)认为在随机实验不可得的情况下,断点回归能够避免参数估计的内生性问题,从而真实反映出变量之间的因果关系。
然而,断点回归也仅仅是在20世纪90年代末才被应用于处理经济学的问题。
2001年,Hahn等人对断点回归模型的识别和估计的理论问题进行了严格细致的分析,此后,断点回归才在众多的经济学研究领域中崭露头角。
时至今日,断点回归已经在劳动和教育经济学、政治经济学、环境经济学和发展经济学等领域取得了广泛的应用。
然而,断点回归却鲜为中国经济学者所应用,正是基于断点回归在实证研究中的重要性和国内文献的缺乏,本文拟以此为背景,从断点回归的理论、发展历史、实证步骤和经济学中的应用几个方面阐述断点回归这一个新“拟随机试验”方法的兴起。
二断点回归理论及发展历史断点回归是一种拟随机实验,此种随机实验定义了这样一个特征,即接受处置(Treatment)的概率是一个或者几个变量的间断函数。
Hahn et al.(2001)提出了断点回归的首要假设,如果变量表示处置效应,表示决定处置的关键变量,那么和必须存在,并且。
在使用断点回归的情况下,存在一个变量,如果该变量大于一个临界值时,个体接受处置,而在该变量小于临界值时,个体不接受处置。
一般而言,个体在接受处置的情况下,无法观测到其没有接受处置的情况,而在断点回归中,小于临界值的个体可以作为一个很好的可控组(Control Group)来反映个体没有接受处置时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系。
stata断点回归结果解读引言:断点回归是一种常用的统计方法,用于研究自变量对因变量的影响是否存在阈值效应。
Stata是一款流行的统计软件,可以进行断点回归分析并得出相应的结果。
本文将介绍如何解读Stata断点回归的结果,以帮助读者更好地理解和应用这一方法。
一、断点回归模型的基本原理断点回归模型是一种非线性回归模型,它假设自变量对因变量的影响在某个阈值点发生突变。
在Stata中,我们可以使用命令"regress"来拟合断点回归模型,并通过"margins"命令计算出相应的边际效应。
二、断点回归结果的解读1. 断点位置的确定在进行断点回归分析时,首先需要确定断点的位置。
Stata提供了一种自动选择断点的方法,即"rdrobust"命令。
该命令可以根据数据的特征自动选择最佳的断点位置,并给出相应的结果。
在解读断点回归结果时,需要注意断点位置的确定是否合理,是否与实际情况相符。
2. 断点效应的解读断点回归结果中最重要的是断点效应的解读。
断点效应可以通过计算边际效应来得到。
边际效应表示因变量在自变量达到断点时的变化情况。
在Stata中,可以使用"margins"命令来计算边际效应。
通过观察边际效应的符号和大小,可以判断断点对因变量的影响方向和程度。
3. 断点回归的显著性检验在解读断点回归结果时,还需要进行显著性检验。
Stata提供了多种方法来进行显著性检验,如t检验、F检验等。
通过观察p值的大小,可以判断断点回归结果是否显著。
一般来说,p值小于0.05可以认为结果是显著的。
4. 断点回归的模型拟合度除了断点效应和显著性检验外,还需要考虑断点回归模型的拟合度。
在Stata中,可以使用R方值来评估模型的拟合度。
R方值越接近1,说明模型的拟合度越好。
通过观察R方值,可以判断断点回归模型的拟合程度。
三、断点回归结果的应用1. 确定政策效果断点回归方法常用于评估政策效果。
模糊断点回归估计系数推导
模糊断点回归(FuzzyRegressionDiscontinuity)是一种在回归模型中使用断点方法来估计因果效应的方法。
在模糊断
点回归中,我们将特定变量(通常是一个连续变量)作为待估
计效应的“断点”,通过比较断点两侧的数据来估计因果效应。
1.设定断点:首先,我们需要选择一个自变量作为断点,并
且假设该变量存在一个连续的断点。
通常情况下,我们会根据
经验或理论来选择一个断点。
2.构建回归模型:然后,我们需要构建一个回归模型来估计
因果效应。
通常情况下,我们会使用线性回归模型或非参数回
归模型。
3.分组观察样本:接下来,根据自变量与断点的关系将样本
数据分为两个组:位于断点两侧的组。
这样我们就可以比较两
个组之间的差异,以估计因果效应。
4.进行回归分析:然后,我们使用回归模型对两个组的数据
进行回归分析。
具体地,我们将断点作为一个自变量加入回归
模型中,以及其他相关的控制变量,然后进行回归拟合。
5.估计因果效应:最后,我们利用回归模型的拟合结果来估
计因果效应。
一般来说,我们关注的是断点处因变量的差异,
也就是断点两侧的预测值之间的差异。
需要注意的是,模糊断点回归的核心在于寻找一个恰当的断点,以及合理地构建回归模型。
如果断点选择不当或者回归模型不恰当,估计的因果效应可能会有偏差。
因此,在进行模糊断点回归时,我们需要仔细选择合适的断点和回归模型,并进行必要的敏感性分析和稳健性检验,以确保估计的可靠性和有效性。
断点回归法事件研究法断点回归法(Breakpoint Regression Analysis)是一种常用的事件研究方法,在金融学、经济学、管理学等领域得到广泛应用。
本文将介绍断点回归法的基本概念、原理和应用,并探讨其优缺点。
一、断点回归法的基本概念断点回归法是一种用于研究某个事件对特定变量的影响的统计方法。
该方法通过在时间序列数据中选择一个或多个断点,将数据分为两个或多个子样本,然后对每个子样本进行回归分析,从而比较不同子样本之间的差异。
这种方法能够帮助研究者判断某个事件对变量的影响是否存在、是否显著,并进一步分析影响的程度和方向。
二、断点回归法的原理断点回归法的核心原理是基于时间序列数据中存在的某个结构性断点,该断点可能是由于政策改变、市场变动、经济周期变化等原因引起的。
研究者通过设定断点,将样本数据分为两个或多个子样本,然后对每个子样本进行回归分析。
在分析中,需要控制其他可能影响结果的变量,以确保所得的结果是由所关注的事件引起的。
三、断点回归法的应用断点回归法在金融学、经济学、管理学等领域有广泛的应用。
例如,在金融市场中,研究者可以使用断点回归法来分析某个重大事件对股票市场的影响。
他们可以选择一个事件作为断点,将数据分为事件前后两个子样本,然后对每个子样本进行回归分析,以比较事件前后的差异。
这样可以帮助研究者了解事件对股票价格、交易量等指标的影响程度和方向。
四、断点回归法的优缺点断点回归法具有一定的优点和缺点。
其优点在于可以通过选择合适的断点,准确地判断事件对变量的影响,并量化影响的程度和方向。
此外,断点回归法能够更好地控制其他可能的干扰变量,提高分析结果的可靠性。
然而,该方法也存在一些缺点,如对断点的选择比较主观,需要研究者具备一定的经验和专业知识;另外,断点回归法只能检测到存在结构性断点的影响,对于连续性变化的影响则无法有效分析。
断点回归法是一种常用的事件研究方法,通过选择断点,将样本数据分为两个或多个子样本,并对每个子样本进行回归分析,以比较不同子样本之间的差异。
断点回归方法及其应用下载温馨提示:该文档是我店铺精心编制而成,希望大家下载以后,能够帮助大家解决实际的问题。
文档下载后可定制随意修改,请根据实际需要进行相应的调整和使用,谢谢!并且,本店铺为大家提供各种各样类型的实用资料,如教育随笔、日记赏析、句子摘抄、古诗大全、经典美文、话题作文、工作总结、词语解析、文案摘录、其他资料等等,如想了解不同资料格式和写法,敬请关注!Download tips: This document is carefully compiled by theeditor. I hope that after you download them,they can help yousolve practical problems. The document can be customized andmodified after downloading,please adjust and use it according toactual needs, thank you!In addition, our shop provides you with various types ofpractical materials,such as educational essays, diaryappreciation,sentence excerpts,ancient poems,classic articles,topic composition,work summary,word parsing,copy excerpts,other materials and so on,want to know different data formats andwriting methods,please pay attention!断点回归方法及其应用断点回归方法是一种用于分析因果关系的方法,通过对处理组和对照组进行划分,并利用断点回归分析处理效应。
社会科学研究中的断点回归设计
断点回归设计是社会科学研究中常用的一种方法,旨在探究某个自变量在一个或多个特定阈值点发生变化时,对因变量产生的影响。
在断点回归设计中,研究者首先选择一个或多个自变量作为断点,并通过对该自变量的某个或多个阈值点进行分割,将样本观测值划分为低于、高于或等于阈值的不同组别。
然后,通过运用回归分析,分别对每个组别进行回归分析,以探究自变量在不同组别中对因变量的影响。
主要应用领域包括经济学、教育学、社会学等社会科学领域。
例如,在经济学中,研究者可能对所得水平进行断点回归分析,以探究所得对消费行为的影响是否存在非线性关系。
断点回归设计的优点包括能够识别自变量与因变量之间的不同关系模式,帮助理解自变量对因变量的影响方式;同时,通过考察阈值点,还可以揭示政策或实践上的相关意义。
然而,断点回归设计也存在一些限制和挑战。
例如,确定合适的阈值点需要在理论和实证的基础上进行推断,具有一定的主观性和不确定性;此外,样本选择和内生性问题也可能对分析结果产生影响。
总而言之,断点回归设计是一种用于社会科学研究中探究自变量对因变量影响的方法,其在研究领域中应用广泛,可以帮助研究者更深入地理解相关关系,并为政策制定提供参考依据。
断点回归(RD)学习手册断点回归由Thistlewaite and Campbell(1960)首次使用,但直到1990年代末才引起经济学家的重视。
Thistlethwaite、Campbell于1960年首次提出使用断点回归设计研究处理效应, 在该文中他们的目的是研究奖学金对于未来学业的影响, 学生是否获得奖学金取决于考试的分数。
由于奖学金由学习成绩决定,故成绩刚好达到获奖标准与差一点达到的学生具有可比性。
如果考试分数大于获奖标准分数, 则进入处理组;如果考试分数小于获奖标准分数, 则进入控制组。
因此处理变量在获奖标准分数处形成了一个断点, 该研究设计的主要思想是可以利用靠近这一断点附近的样本来有效估计处理效应。
Angrist and Lavy(1999)在研究班级规模对成绩的影响时,利用以色列教育系统的一项制度进行断点回归;该制度限定班级规模的上限为40名学生,一旦超过40名学生(比如41名学生),则该班级被一分为二。
此后30年, 该方法并未引起学术界的重视,直到1990年以后, 断点回归设计开始被应用于各种领域,并且近年来成为因果分析和政策评估领域最重要的研究方法。
Hahn et al(2001)提供了断点回归在计量经济学理论基础。
目前,断点回归在教育经济学、劳动经济学、健康经济学、政治经济学以及区域经济学的应用仍方兴未艾。
参见Imbens and Lemieux(2008),Van Der Klaauw(2008)以及Lee and Lemieux(2010)的文献综述。
断点回归设计是一种准自然实验, 其基本思想是存在一个连续变量, 该变量能决定个体在某一临界点两侧接受政策干预的概率, 由于X在该临界点两侧是连续的,因此个体针对X的取值落入该临界点任意一侧是随机发生的, 即不存在人为操控使得个体落入某一侧的概率更大, 则在临界值附近构成了一个准自然实验。
一般将该连续变量X称为分组变量 (assignment variable) 。
断点回归量化研究方法断点回归分析是一种常用的量化研究方法,用于分析在某个特定点发生突变对因果关系的影响。
它是一种因果研究设计,可用于评估某个政策或干预措施对特定变量的影响效果。
在这篇文章中,我们将介绍断点回归量化研究方法的基本原理和步骤,以及其在实践中的应用。
断点回归分析的基本原理是针对某一变量,通过在某个特定点将样本分为两组,比较两组之间的变化趋势来评估该变量对结果的影响。
为了实现这一目标,我们需要进行以下步骤:第一步是确定断点的选择。
断点通常是根据理论或确定性的阈值来选择的,它代表了某个变量从一个状态转变到另一个状态的临界点。
例如,我们可能想要分析某个政策对收入的影响,那么我们可以将政策实施的时间作为断点。
第二步是构建回归模型。
我们将因变量作为感兴趣的结果,自变量作为断点变量,并控制其他潜在的影响因素,例如个体特征或外部环境变量。
然后,我们可以使用线性回归等统计方法对模型进行估计。
第三步是进行断点估计。
为了获得关于断点附近的效应估计,我们可以在断点前后选择一个相对较小的区间,然后比较两个区间的回归系数是否有显著差异。
通常使用断点回归模型进行拟合,然后利用假设检验来评估估计的统计显著性。
在实践中,断点回归分析方法被广泛应用于多个研究领域。
例如,在经济学中,研究者可能使用断点回归方法来评估某个政策对就业率或经济增长的影响;在教育学中,研究者可能使用该方法来评估某个教育政策对学生学业成绩的影响。
断点回归方法的优势在于可以从统计上对特定变量的影响进行量化评估,并提供了一种因果推断的方式。
然而,它也存在一些限制。
首先,断点的选择可能会对结果产生较大的影响,因此需要仔细考虑。
其次,断点回归方法对数据的要求较高,需要足够的样本量和完整的数据。
总结起来,断点回归量化研究方法是一种寻找变量影响阈值的有效方法,可以帮助研究者评估某个政策或干预措施对特定变量的影响效果。
通过选择合适的断点,并建立适当的回归模型,我们可以得到关于断点附近效应的量化估计。
断点回归方法嘿,咱今儿来聊聊断点回归方法。
这玩意儿啊,就像是一把神奇的钥匙,能帮咱打开好多知识宝库的大门呢!你想想看,生活中很多事情不就像是有个断点似的嘛。
比如说,考试及格线就是个断点呀,过了及格线那感觉肯定不一样,就好像进入了另一个境界。
断点回归方法呢,就是专门来研究这种断点前后变化的。
它就像是个超级侦探,能把那些因为断点而产生的细微变化都给揪出来。
比如说,政策上有个小小的改变,在断点前后,人们的行为或者某些现象可能就会有很大的不同。
断点回归方法就能把这些不同给分析得透透的。
咱可以打个比方啊,就好比是跑步比赛。
在起跑线这儿就是个断点,没到起跑线的时候大家都在准备,到了起跑线后,那可就开跑啦!断点回归方法能看出来起跑前后大家的状态变化,是不是很厉害?这方法在好多领域都能大显身手呢!像经济学、社会学这些领域,经常要研究一些政策或者事件带来的影响。
这时候,断点回归方法就派上大用场啦。
它能让那些隐藏的影响无所遁形。
你说它是不是很神奇?就像有一双慧眼,能看穿一切似的。
而且啊,它还特别靠谱,得出的结论让人信服。
那怎么用这断点回归方法呢?这可得好好琢磨琢磨。
就像做菜一样,得有合适的材料,合适的步骤,才能做出美味的菜肴。
断点回归方法也是,要选对数据,设计好研究方案,一步一步来,才能得出有价值的结果。
比如说,咱要研究一个地区实行新政策后的效果。
那就要找到断点,也就是政策实施的那个时间点。
然后对比断点前后的各种数据,看看有啥不一样。
这可不能马虎,得仔细认真,就跟侦探破案似的,不能放过任何一个小细节。
总之呢,断点回归方法是个特别有用的工具。
它能让我们更好地理解世界,理解那些看似平常但其实蕴含着大道理的现象。
咱可得好好掌握它,让它为咱的学习和工作助力呀!所以啊,断点回归方法真的是值得我们好好去研究和运用的,你说是不是呢?。
断点回归法名词解释
断点回归法是一种可以用来应对数据和观测值之间的线性关系
的回归统计学方法。
其主要应用是在观测数据中模型化变量之间的关系,以捕捉变量之间的线性关系。
断点回归法是一种基于变量之间的有效回归,它通过将观测值映射到不同的值来确定断点,然后再用一条线形拟合所有断点,进而建立以变量之间的关系的模型。
断点回归的主要目的是将数据分组,以便能够更好地探索数据之间的关系。
该方法是将观测量分组,然后用最为适当的断点来分组。
断点的挑选非常重要,因为有些断点可能会更有效地捕捉回归方程的趋势,而有些断点可能会给模型带来麻烦。
断点回归法可以被用来预测结果,对比单变量回归模型,断点回归可以更准确地预测并识别数据之间的关系。
当数据之间存在重大变化时,断点回归可以有效地识别出数据的变化,因为它允许在变量之间使用不同的断点。
与单变量回归模型相比,断点回归法更有可能穿过重要的断点点,从而可以更准确地模拟复杂的数据回归。
断点回归法还可以应用于反应可能在某一特定断点处突然发生
变化的过程。
例如,对于探究学校环境对学习成绩的影响,断点回归可以帮助我们发现一个突变点,这一点表明在此断点处学校环境与学生成绩之间的关系发生了突变。
断点回归法可以帮助我们深入探究变量之间的关系,可以更准确地预测结果,也可以帮助我们发现和识别重大变化点。
因此,断点回归法被认为是一种有效的统计学方法,可以帮助我们研究数据之间的
关系,并可以有效解决一些复杂的统计学问题。
断点回归的例子
断点回归是一种常见的统计方法,它假设样本在断点处被随机分组,然后估计处理效应。
下面是一个断点回归的例子:
高考分数线为492分,对于高考成绩为489、490、491、492、493、494的考生,他们在各方面(不可观测因素)没有系统差异,甚至可以认为他们的成绩具有一定的随机性。
有的考生发挥好,成绩为492、493、494,达到了录取分数线(处理组);有的考生运气差点,成绩为489、490、491,未达到录取分数线(控制组)。
对于水平差不多的考生,若考生蒙对一道选择题,可能就考上了大学;相反,若考生蒙错一题,可能就上不了本科。
对于分数在492附近的考生能否考上大学,好像是上天在进行掷硬币的随机分组。
在这个例子中,断点为492分,考生的高考成绩落在(492-θ,492+θ)之间,好像是被随机分组了一般。
断点回归得到的结论一般不能推广至其他样本,在进行精确断点回归之前,首先要知道平均处理效应LATE。
这个例子只是断点回归的一个简单应用,在实际应用中,断点回归可以用于各种场景,例如政策实施效果评估、医疗效果评估等。
断点回归控制变量回归系数
断点回归(Regression Discontinuity Design,RDD)是一种非实验性的研究方法,用于估计一个变量对另一个变量的因果效应。
在断点回归中,如果一个变量在某个特定的阈值处发生跳跃,那么我们可以通过观察这个跳跃点附近的观察值来估计该变量的效应。
控制变量(Control Variables)在回归分析中用于帮助估计自变量对因变量的影响,并控制其他可能的干扰因素的影响。
控制变量的选择应基于理论和研究的假设,并能够解释因变量的变异。
控制变量回归系数(Control Variable Regression Coefficients)是指在回归分析中,控制变量对因变量的影响程度。
控制变量的回归系数可以用于估计其效应的大小和方向,以及检验其是否显著。
在断点回归中,控制变量回归系数的解释和常规回归分析中的解释类似。
如果一个控制变量在断点附近的回归系数显著,那么可以认为该控制变量对因变量有显著影响。
同时,通过比较控制变量在断点附近和非断点附近的回归系数,可以评估该控制变量对因变量的因果效应。
需要注意的是,在断点回归中,控制变量的选择和回归系数的解释应谨慎。
由于断点回归是一种非实验性的研究方法,因此无法完全排除其他干扰因素的影响。
因此,在解释控制变量回归系数时,应考虑到其他可能的干扰因素,并进行充分的讨论和检验。
rd did 研究方法
RD(断点回归)和DID(双重差分)是两种常用的研究方法,用于处理某些类型的问题,例如内生性问题、选择偏差等。
1. 断点回归(RD):这是一种类似于随机受控实验的准实验法。
它通过找到一个断点,使得处于断点左侧的观测值与断点右侧的观测值在处理效应上近似相等,来估计处理效应。
这种方法可以在一定程度上控制选择偏差和内生性问题。
2. 双重差分(DID):这是一种在政策评估研究中广泛应用的方法。
它的基本思想是,允许存在不可观测因素的影响,但假定这些因素是不随时间变化的。
通过比较处理组和对照组在政策实施前后的变化差异,可以估计政策的净效应。
DID 方法可以控制某些共同趋势和选择偏差,但在使用时需要注意其假设条件的合理性。
此外,还有工具变量法、倾向匹配方法等其他处理内生性问题的方法。
这些方法各有特点,使用时需要根据具体问题和数据特点进行选择。
断点回归法断点回归法是数理统计中一种常见的估计方法,可以用来估计某条数据记录在不同数据点上的状态变化情况。
这种统计方法在很多领域都得到了应用,在分析社会经济数据、物理研究以及医学研究中尤为有用,因其能从不同的角度展现数据的趋势变化以及其隐藏的函数关系的特点。
一、断点回归法的历史演变断点回归法是从弗里曼-格里利贝克斯(Friedman-Griliches)在20世纪50年代提出的批处理估计(batch estimation)演变而来。
弗里曼-格里利贝克斯认为,每个观察点(observation point)存在着一定的差异性,所以若想要估计某一不断变化的状态,就需要用到多个观察点(observation point)。
1972年英国统计学家柏林( Berliner)将这一想法运用到数据处理的技术中,提出了断点回归法的概念,即使用多个观察点(observation point)来估计一段不断变化的状态。
二、断点回归法的基本概念断点回归法是一种将数据分割为几个断点(break point),并在每个断点上建立回归模型的方法。
它可以从不同的角度描述一系列数据的变化状态,从而把一段时间的变化状态划分为几个阶段,每个阶段的变化趋势可以根据不同的数据集使用回归模型来估计。
三、断点回归法的运用实例当需要估计数据变化状态时,断点回归法可以很好地满足这种需求。
比如,在某段时间内,研究人员可能需要分析一段时间内某城市人口变化情况,从而估计城市发展趋势。
这时,就可以使用断点回归法,先从不同的角度去描述某段时间内城市人口的变化情况,比如城市的工业发展、科技进步、社会发展等,然后根据不同的阶段建立回归模型,从而可以估计城市发展的趋势。
四、断点回归法的优缺点断点回归法的一大优点在于能够从不同的角度描述数据变化情况,可以清晰地表现某种数据变化的特点,也能准确反映出数据隐藏的函数关系。
另外,断点回归法也有其缺点,比如在确定断点(break point)时可能会存在一些误差,从而影响最终的估计结果,而且在建立回归模型时也可能会出现欠拟合现象,影响准确性。
断点回归和指数效应
2015-10-08 金融学前沿论文速递
这是“金融学前沿论文速递”第177篇推送
选文:谢晓飞审稿:李娜编辑:张凡
仅用于学术交流,原文版权归原作者和原发刊所有,转载请注明出处
由Yen-Cheng Chang、Harrison Hong和InessaLiskovich共同撰写的Review of Financial Studies 2015年第1期文章“Regression Discontinuity and the Price Effects of Stock Market Indexing”采用Russell 1000和Russell 2000这两个指数之间交接处的独特样本研究了指数效应。
指数效应,指某只股票被纳入/剔除指数成份股后,其股价会上升/下降的现象。
Russell 1000和2000指数的成份股是按照市值排序最大的前1000家公司和随后的2000家公司。
排在第1000名前后的公司,只要市值稍稍变动就可能从一个指数移动到另一个指数中去。
由于指数以市值加权,因此追踪Russell 2000指数中最大股票的资金比追踪Russell 1000指数中最小股票的资金多。
文章利用这个不连续性,用断点回归方法发现了明显的指数效应:当股票从Russell 1000被纳入Russell 2000指数会导致价格上涨;而从Russell 2000中剔除到Russell 1000会导致价格下跌。
文章还研究了指数效应的时间趋势以及揭示了为指数交易者提供流动性的投资者类型。
虽然指数效应的研究众多,但已有研究还存在若干问题。
第一,有关指数效应是否真存在的问题。
传统研究方法认为纳入指数的股票存在指数纳入效应,因其与非纳入的控制组(一般为市场组合)的区别仅在于购买需求(纳入指数的股票会受到追踪指数的被动型投资者大量购买),因而推论应是股票的需求曲线向下倾斜。
这一推论与传统的有效市场假说相悖(假设股票的替代资产很多因而其需求曲线平直)。
后续研究提供了股票需求曲线向下倾斜的证据,但仍有一些问题待解:首先,纳入和剔除效应的具体大小尚未揭示(指数效应的论证中还混杂着其他潜在原因,已有研究揭示被纳入指数的股票有收益提升,但并未揭示多少提升是由于纳入指数而非基本面好或吸引关注等所造成);其次,纳入和剔除效应有什么不同没有研究(受研究样本和方法所限,少有研究关注剔除效应)。
第二,有关指数效应时间趋势的问题。
现有研究用一次性事件很难分离购买所导致的指数成份股股价上升和摩擦减少对冲纳入效应更方便所导致的股价下降两种力量。
第三,有关谁为跟踪指数者提供流动性的问题。
这个问题还没有研究,但这个研究对于搞清指数投资需求上升的原因很重要。
为了解决这些难题,文章通过对Russell 2000指数中市值排名在界断点附近的股票进行一系列断点回归的研究设计清晰地考察了指数效应。
每年5月末股票会按市值进行排序,第1-1000名归入Russsell 1000指数,第1001-3000名归入Russell 2000指数。
指数每隔一年调整一次。
本文考察第1000名左右处于Russell 2000指数断点处的样本(第3000名断点处情况类似)。
由于指数是市值加权的,因而每年5月末市值排名刚好在1000名之下(第1001-1010名)的股票会受到大量买入,与之相对,排名刚好在1000名之上(第990-1000名)则几乎没有什么买入。
实际上,Russell 2000指数中排名刚好在1000名之下的股票权重比Russell1000指数中排名刚好在1000名之上的股票权重大10倍。
换句话说,每年5月末,股票市值是排在1000名之上还是之下是随机的,但受指数配置的影响,断点处的需求却有显著差异。
比起以往用S&P500指数来研究指数效应,这个研究设计天然避免了内生性。
文章首先测度了那些在t-1年在Russell 1000指数中,在t年6月1日进入到Russell 2000指数的股票的纳入效应。
发现,那些恰好被纳入到Russell 2000指数的股票,比那些恰好没被纳入Russell 2000指数的股票(其他条件类似)在6月份收益会高出大约5%(T值为2.65)。
与之前对S&P500指数的研究相同,文章发现纳入效应发生在指数调整的一个月内,之后的月份没有纳入效应。
与对S&P500指数的研究不同,文章发现了剔除效应:Russell 2000的成份股在被移动到Russell 1000指数以后,比那些还留在Russell 2000的股票收益低,剔除效应的大小约为5.4%(T值为3)。
文章还发现随着追踪指数的日益普及,虽然交易量不断增大,资产组合调整的影响不断增加,但是需求曲线变得越来越有弹性。
通过计算个股相对于Russell 2000指数的β值,发现股指成份股之间过度的联动随着时间的推移有所下降。
对成份股的卖空(套利交易以及指数调整月后的交易)随着时间的推移也有增加的趋势。
这些都导致了虽然指数越来越多,但指数效应并没有不断增加,成份股联动也没有加强。
此外,采用断点回归设计,观察基金在5月31日前后的持股变化还可以识别出哪些基金在追踪Russell 2000指数。
将那些卖出比排名1000更大市值的股票(例如排名990),同时买入比排名1000更小市值的股票(例如排名1100)的基金称之为“Russell 2000指数追踪者(Russell 2000 indexer)”,将相反交易者称为“流动性提供者”。
结果表明:流动性提供者大部分都是追踪其他指数的基金,而不是以往理论中所说的套利者。
本文对Russell 2000指数的研究设计比以往的研究设计提供了更加干净的指数效应的度量。
研究还发现指数效应随着时间推移不断减弱。
本文提出的断点回归研究设计也可应用于金融学其他领域。
原文:
Chang, Yen-Cheng, Harrison Hong and InessaLiskovich, 2015, Regression Discontinuity and the Price Effects of Stock Market Indexing, Review of Financial Studies 28 (1),212-246.。