邹至庄检验
- 格式:doc
- 大小:6.11 MB
- 文档页数:6
[计量经济学讲义] 第九章:虚拟解释变量本章及下一章将变量类型由定量变量拓展到定性变量。
§1虚拟变量的性质1、变量的分类:定量变量:如收入、产量、价格、成本、高度等取值在一定分为内连续变化;定性变量:如性别、种族、肤色、宗教、国际、战争、地震、沿海省份等。
“量化”:将定性变量量化,可以根据其不同情况取值0或1。
2、虚拟变量(dummy variable ):取值为0、1等这样的变量。
虚拟变量有时也称为二值变量(binary variable)、二分变量(dichotomous variable)、定性变量(qualitative variable)、指标变量(indicator variable )3、ANOV A (方差分析analysis of variance ):解释变量全为虚拟变量例:i Y =α+βi D +i u其中i Y 表示教授年薪,i D =1,男教授i D =0,女教授(假定年龄、学位和经验可以忽略)女教授的平均年薪为:E(i Y |i D =0)=α;男教授的平均年薪为:E(i Y |i D =1)=α+β;一个例子(略)§2 一个定量变量和一个二分定性变量1、例子:i Y =1α+2αi D +βi X +i u其中i Y 表示教授年薪,i X 表示年龄,则有:女教授的平均年薪为:E(i Y |i X ,i D =0)=1α+βi X ;男教授的平均年薪为:E(i Y |i X ,i D =1)= 1α+2α+βi X ;(假设共同斜率)2、问:有截距项的情况下,区分两个类别要几个虚拟变量?答案是一个,否则有完全贡献性。
结论:有截距项的情况下,若一个定性变量有m 个类别,则仅引入m-1个虚拟变量。
3、0与1的分配问题。
4、基准(benchmark ):0类别的情况5、级差截距系数:D 的系数§3 一个定量变量和一个多分变量例子:假设在横截面数据的基础上,做个人保健支出对个人收入和教育水平的回归。
第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记考点一:带有虚拟自变量的回归★★★★★1.对定性信息的描述定性信息是指通常以二值信息(0-1)的形式出现的信息,如性别、是否结婚等。
在计量经济学中,二值变量又称为虚拟变量。
2.只有一个虚拟自变量(1)只有一个虚拟自变量的简单模型考虑决定小时工资的简单模型:wage=β0+δ0female+β1educ+u。
根据多元回归的解释方式,δ0表示控制educ不变时,female变化1单位给wage带来的变化。
假定零条件均值假定E(u|female,educ)=0成立,那么:δ0=E(wage|female=1,educ)-E(wage|female=0,educ),其中female=1表示女性,female=0表示男性。
可以发现,在任意教育水平下,男性与女性的工资差异是固定的,女性工资比男性工资多δ0。
除了β0之外,模型中只需要引入一个虚拟变量。
因为female+male=1,所以引入两个虚拟变量会导致完全多重共线性,即虚拟变量陷阱。
(2)当因变量为log(y)时,对虚拟解释变量系数的解释当变量中有一个或多个虚拟变量,且因变量以对数的形式存在时,虚拟变量的系数可以理解为百分比的变化。
将虚拟变量的系数乘以100,表示的是在保持所有其他因素不变时y 的百分数差异,精确的百分数差异为:100·[exp(∧β1)-1]。
其中∧β1是一个虚拟变量的系数。
3.使用多类别虚拟变量(1)在方程中包括虚拟变量的一般原则如果回归模型具有g 组或g 类不同截距,一种方法是在模型中包含g-1个虚拟变量和一个截距。
基组的截距是模型的总截距,某一组的虚拟变量系数表示该组与基组在截距上的估计差异。
如果在模型中引入g 个虚拟变量和一个截距,将会导致虚拟变量陷阱。
另一种方法是只包括g 个虚拟变量,而没有总截距。
这种方法存在两个实际的缺陷:①对于相对基组差别的检验变得更繁琐;②在模型不包含总截距时,回归软件通常都会改变R 2的计算方法。
第三篇高级专题第13章跨时横截面的混合:简单面板数据方法13.1 复习笔记考点一:跨时独立横截面的混合★★★★★1.独立混合横截面数据的定义独立混合横截面数据是指在不同时点从一个大总体中随机抽样得到的随机样本。
这种数据的重要特征在于:都是由独立抽取的观测所构成的。
在保持其他条件不变时,该数据排除了不同观测误差项的相关性。
区别于单独的随机样本,当在不同时点上进行抽样时,样本的性质可能与时间相关,从而导致观测点不再是同分布的。
2.使用独立混合横截面的理由(见表13-1)表13-1 使用独立混合横截面的理由3.对跨时结构性变化的邹至庄检验(1)用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(见表13-2)表13-2 用邹至庄检验来检验多元回归函数在两组数据之间是否存在差别(2)对多个时期计算邹至庄检验统计量的办法①使用所有时期虚拟变量与一个(或几个、所有)解释变量的交互项,并检验这些交互项的联合显著性,一般总能检验斜率系数的恒定性。
②做一个容许不同时期有不同截距的混合回归来估计约束模型,得到SSR r。
然后,对T个时期都分别做一个回归,并得到相应的残差平方和,有:SSR ur=SSR1+SSR2+…+SSR T。
若有k个解释变量(不包括截距和时期虚拟变量)和T个时期,则需检验(T-1)k 个约束。
而无约束模型中有T+Tk个待估计参数。
所以,F检验的df为(T-1)k和n-T -Tk,其中n为总观测次数。
F统计量计算公式为:[(SSR r-SSR ur)/SSR ur][(n-T-Tk)/(Tk-k)]。
但该检验不能对异方差性保持稳健,为了得到异方差-稳健的检验,必须构造交互项并做一个混合回归。
4.利用混合横截面作政策分析(1)自然实验与真实实验当某些外生事件改变了个人、家庭、企业或城市运行的环境时,便产生了自然实验(准实验)。
一个自然实验总有一个不受政策变化影响的对照组和一个受政策变化影响的处理组。
目前中国的人口老龄化程度正在呈指数式加深,2017年全国人口中65周岁以上人口占总人口的11.4%。
随着老年人口的不断增加,养老问题急需重点关注。
目前我国的社会保障制度城乡差距较为明显,农村人口老龄化程度高于城镇,养老保障水平却处于较低的水平。
我国的城乡养老差距主要体现在:第一,城乡养老保险发展不协调,城镇的社会保障体系发展成熟且项目较多,农村社会保障制度起步晚且不完善。
第二,城乡养老保险对接不协调,养老保险体系“碎片化”,城乡社会保障体系尚未形成协调的统筹与对接运行机制。
第三,筹资与给付水平不协调,近15年的城镇养老金替代率平均值为53.15%,而农村仅为23%。
第四,城乡养老公共资源配置不协调。
总而言之,在当前背景下,人口老龄化加剧问题对社会发展的阻碍程度日益加深。
城乡之间的养老保障差距不利于城乡的协调发展与公共一体化建设。
因此,研究如何缩小城乡养老差距对实现我国现阶段目标具有重大深远的现实意义。
一、文献回顾伴随着养老需求的增加,城乡养老差距日渐被学界关注,目前的研究主要集中在三块。
第一块是关于城乡养老差距的表现,金艳(2013)认为目前城乡养老差距表现为保障水平、替代率、覆盖率等差异。
薛惠元(2013)从制度模式、缴费标准、计发办法和待遇水平等方面分析比较城乡基本养老保险。
En-durance Uzobo 和Oluwatosin Abigail Dawodu (2015)在尼日利亚展开调查研究发现,城镇老年人相较农村老年人能够享受到更好的日常照料、医疗照护等养老服务。
第二块是关于城乡养老差距形成的原因,尹浩华(2013)认为,养老保险待遇的差距本质上是社会保障制度“碎片化”的一种具体表现形式。
戴欢(2014)认为目前城乡养老非均等的原因主要在于城乡制度间群体身份差异,权利义务非均等,城乡养老服务缺乏统一规划。
张箫箫(2019)认为,城乡二元经济结构的影响使得城乡居民基础养老保险制度差距不断拉大。
补充内容:结构变化与邹至庄检验(Structure Change and Chou-Test)一 问题提出二 问题的模型表述三 邹至庄检验(Chou-Test)结构变化与邹至庄检验(Structure Change and Chou-Test)一、问题提出:我们经常碰到这样的问题。
某项政策的出台及实施,其效果如何?不同地区或不同时期内,我们分别可以得到这两个地区或时期的观测值,我们的问题是:这两个地区或时期的情况是否不同,经济结构有无差异。
这类问题,被华人经济学家邹至庄用构造的F 检验解决了(1960年)。
这样的F 检验的统计量,就称为邹至庄检验(Chou-Test )。
二、问题的模型表述设1122( ),( )Z Y Z Y 分别表示这两个时期的观测值,允许两个时期中系数不同的无约束回归是11112222Y Z Y Z βεβε=+⎧⎨=+⎩,我们可以将其改写成一个回归方程1111222200Y Z Y Z βεβε⎛⎫⎛⎫⎛⎫⎛⎫=+ ⎪ ⎪⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭……(1) 即Y Z βε=+模型,其中Y=12Y Y ⎛⎫ ⎪⎝⎭,Z=1200Z Z ⎛⎫ ⎪⎝⎭,β=12ββ⎛⎫⎪⎝⎭,ε=12εε⎛⎫ ⎪⎝⎭。
上述问题就转换成检验012112::H H ββββ=≠的问题。
我们可以用两种方式来处理问题一)用约束条件12ββ=,来检验。
12ββ=是更一般约束条件R β=q 的一个特殊形式,其中R=(I,-I) 和 q=0。
这个直接可以从基于Wald 统计量的带约束条件的F 检验得到。
(请自己推导)。
例题:用约束条件下,F 检验推导出邹至庄检验的表达式: 解:在约束条件R β=q 下,F 检验211()[()]()(,)Rb q S R Z Z R Rb q F J n k J--'''---=。
而邹至庄检验时约束条件R β=q 的一种特殊形式,即R=(I,-I),而q=0,也即等同于条件12ββ=。
人民银行考试历年真题汇总整理(统计类)人民银行全国统一考试,分专业类别进行,考试内容主要包括行测+专业知识,题目实际上是不难的,但要有针对性的复习,多练题目是肯定的!建议报考的同学提前做好复习准备,考试资料可以到“柏蓝考”上面找找,资料确实不错,比较有针对性,大家可以去了解一下!行测就不说了,60分钟70题。
快完的时候监考会发专业科目的试卷答题卡之类,所以实际上用于回答专业课的时间稍微少于90分钟。
总的来说题目很难,有很多高等概率论和高等数理统计的内容。
(坑爹啊,我复习的社会经济统计、国民经济统计学和数理统计)。
吐槽试卷印刷质量很烂啊!一、判断题10道二、单选题三、多选题四、简答题1道 10分总共10五、计算题2道一道10分总共20判断题好几题都看不清印的什么泊松分布考了几个题计算FISHER信息量的题均匀分布的PITMAN估计量(这什么玩意儿啊?)计算极大似然估计几题条件期望计算测度的题考了几个非参数的考了Wilcoxon检验和秩和检验多选前几道考充分完备统计量简答是论述非参数统计和参数统计的特点及区别计算题第一题计算渐进分布已知sqrt(n)*((a b)'-(1,9)') ~N((0,0)'-((1,9)',(2,9)'),求sqrt(n)*(a*b-3)的渐进分布感觉那个1 29 9是错的难道不应该是1 22 9么?还有什么计算UMVRE的题,难道不是UMVUE么?简答题回忆:1:男性工资lnw=b0+b1 edui+b2 expi +ui;女性工资lnw=c0+c1 edui+c2 expi +vi写出邹至庄检验的步骤~~~2:给出一个正态分布的样本,求其期望u的置信区间。
3:计算题:给出一个项目组n=5,一个控制组n=6,对其改进之前与之后的效果进行说明效果如何?再问:用一个回归模型对效果进行模拟。
判断、单选、多选几乎都是统计学的内容。
有一个单选是国民经济核算:下面那一个不是GDP的核算方法:A收入法B支出法C生产法D工厂法。
第9章虚拟变量回归模型9.1 复习笔记考点一:ANOVA模型★★★1.虚拟变量含义虚拟变量是指仅有0和1两个取值的变量,是一种定性变量。
一般而言,虚拟变量等于0表示变量不具有某种性质,等于1表示具有某种性质。
虚拟变量也可以放到回归模型中。
这种模型被称为方差分析(ANOVA)模型。
2.虚拟变量模型(1)虚拟变量的表达式Y i=β1+β2D2i+β3D3i+u i应看到,除了不是定量回归元而是定性或虚拟回归元(若观测值属于某特定组则取值为1,若它不属于那一组则取值0)之外,方程与前面考虑的任何一个多元回归模型都是一样的。
所有的虚拟变量都用字母D表示。
(2)使用虚拟变量的注意事项①若定性变量有m个类别,则只需引入m-1个虚拟变量,否则就会陷入虚拟变量陷阱,即完全共线性或完全多重共线性(若变量之间存在不止一个精确的关系)情形。
对每个定性变量而言,所引入的虚拟变量的个数必须比该变量的类别数少一个。
②不指定其虚拟变量的那一组被称为基组、基准组、控制组、比较组、参照组或省略组。
所有其他的组都与基准组进行比较。
③截距值(β1)代表了基准组的均值。
④附属于方程中虚拟变量的系数被称为级差截距系数,它反映取值为1的地区的截距值与基准组的截距系数之间的差别。
⑤如果定性变量不止一类,那么,基准组的选择完全取决于研究者。
⑥对于虚拟变量陷阱,如果在这种模型中不使用截距项,那么引入与变量的类别相同数量的虚拟变量就能够回避虚拟变量陷阱的问题。
因此,如果从方程中去掉截距项,并考虑如下模型Y i=β1D1i+β2D2i+β3D3i+u i由于此时没有完全共线性,所以就不会陷入虚拟变量陷阱。
但要确定做这个回归时,一定要使用回归软件包中的无截距选项。
⑦在一个含有截距的方程中,能更容易地处理是否有某个组与基准组有所不同以及有多大的不同,所以在方程中包括截距更方便。
为了检查分组是否得当,也可通过将虚拟变量的系数相对0做t检验(或者更一般地,对适当的虚拟变量系数集做一个F检验),就可以检验分类是否适当。
我国GDP对居民消费影响的计量分析摘要:从经济理论角度来看,消费与gdp具有正相关。
文章依据1990年到2010年的gdp数据和居民消费水平数据,分析得出gdp —消费的一元线性回归模型,而1997年和2008年作为经济危机的发生时间,对这两个时间断点分别做邹至庄检验,文章的最后综合全文,给出结论,并提出相关建议。
关键词:gdp—消费模型一元线性回归邹至庄检验虚拟变量模型1990年以来,我国国内生产总值水平呈现增长的趋势,与此同时,居民消费水平也随着人均收入水平的上升而不断上涨。
从经济理论角度来说,消费是和gdp有正相关关系的。
而中国经济在1997年和2008年均发生了比较大的金融冲击,1997年的亚洲金融危机和2008年的全球经济危机都有可能会引起消费和收入之间关系的结构性变化。
因此,我希望能够在对消费和收入作出线性回归后,加入邹至庄检验,判断1997年和2008年是否发生了断点处结构性变化,并通过虚拟变量模型,判断回归方程的截距和斜率哪些发生了变化。
一、背景介绍国内生产总值和居民消费是直接相关的。
从经济逻辑上来讲,居民消费是反映整体经济活动的重要指标,整体经济活动越好,国内生产总值越高,那么居民消费就越高。
发生在1997年的亚洲金融危机,是继三十年代大危机之后,对世界经济有深远影响的重大事件。
这次金融危机影响极其深远,它暴露了一些亚洲国家经济高速发展的背后的一些深层次问题。
2008年环球金融危机,是一场在2007年8月9日开始浮现的金融危机。
自次级房屋信贷危机爆发后,投资者开始对按揭证券的价值失去信心,引发流动性危机。
直到2008年9月9日,这场金融危机开始失控,并导致多间相当大型的金融机构倒闭或被政府接管。
二、实证分析1.数据收集从中国统计局里找到中国统计年鉴,在中国统计年鉴找到年度数据。
2.一元线性回归将数据输入eviews软件,对其做最小二乘法,得出一元线性回归的表达式:式(1)式(1)中,斜率系数的t值为36.38875,p值近似为0,说明回归系数高度显著,gdp对消费有显著影响。
智慧树知到《计量经济学》章节测试答案第一章1、计量经济学是一门学科。
A:数学B:统计学C:经济学D:计量学答案: 经济学2、计量经济学的创始人是:A:凯恩斯B:弗里希C:格兰杰D:伍德里奇答案: 弗里希3、计量经济学主要由、和三门学科的内容有机结合而成。
A:计量学B:统计学C:经济学D:测度论E:数学答案: 统计学,经济学,数学4、国际计量经济学会成立标志着计量经济学作为一门独立学科地位的正式确立。
A:对B:错答案: 对5、计量经济学具有综合性、交叉性和边缘性的特点。
A:对B:错答案: 对6、计量经济模型一般由、、、等四个要素构成。
A:变量、公式、模型和方程B:经济变量、数学变量、统计变量和计量软件C:经济变量、参数、随机误差项和方程的形式D:函数关系、因果关系、统计关系和计量关系答案: 经济变量、参数、随机误差项和方程的形式7、对计量经济模型进行检验的三个常用准则是:A:经济意义准则、统计检验准则和计量检验准则B:线性准则、无偏性准则和最优性准则C:正确准则、有效准则和简洁准则D:渐进一致性准则、渐进有效性准则和渐进正态性准则答案: 经济意义准则、统计检验准则和计量检验准则8、判断模型参数估计量的符号、大小、相互之间关系的合理性属于经济意义准则。
A:对B:错答案: 对9、在同一时间不同统计单位的相同统计指标组成的数据列是横截面数据。
A:对B:错答案: 对10、建立计量经济模型的一般步骤是:A:模型设定,模型检验,参数估计,模型应用B:搜集资料,参数估计,模型设定,模型应用C:参数估计,模型应用,模型检验,改进模型D:模型设定,参数估计,模型检验,模型应用答案: 模型设定,参数估计,模型检验,模型应用第二章1、进行回归分析时,当x取各种值时,y的条件均值的轨迹接近一条直线,该直线称为y对x的回归直线。
A:对B:错答案: 对2、将总体被解释变量y的条件均值表现为解释变量x的函数,这个函数称为总体回归函数。
邹至庄(Gregory C. Chow )检验
比较两个回归 :检验模型的结构稳定性
所谓模型的结构稳定的指模型在样本期的不同时期(子样本),其
参数不发生改变。
而任何参数样本期的不同时期发生改变,则称模型不具有结构稳定性。
一般而言,导致模型发生结构变化的因素是重要的外生事件,或外生冲击,故常设定某一时点或年份,以此将样本分为二个子样本,分别估计这二个子样本和样本全体,构成F 统计量,据此推断模型是否发生结构变化。
例子:美国个人收入和储蓄(样本1970-1995)。
由于美国在1982年失业率达到8.2%,为检验这一高失业率是否
导致个人储蓄行为发生变化,将1981年设定为一个可能的结构变化点,将样本分为1970-1981和1982-1995,并设定这两个时期的储蓄函数为
t t t u x Y 121++=αα (1)
)1954(,,2,11==n t
t t t u x Y 221++=ββ (2)
)1963(,,2,12==n t
CHOW 检验:假设 ),0(~2σN u i ,0)(.2,121==u u E i ;
1.用全体样本(211,1,,2,1n n n t +=)对模型
t t t u x Y ++=21λλ (3)
进行OLS ,得到RSS ,其自由度为))2((21=-+k n n ,并记为S R ;这里下
标R 表示将两个子样本的回归参数约束为相等
2.用2个子样本分别估计(1)和(2),且分别记RSS 为S 1和
S 2;其自由度分别为k n -1和k n -2。
定义
452
14S S S S S S R -=+= 其自由度分别为k k k n n )),2(2(21=-+。
3.构造CHOW 的F 统计量,在上述假设下,有 )2,(~)
2/(/212145k n n k F k n n S k S F -+-+= (4) 以此检验原假设:无结构变化,备选假设:模型具有结构变化(任
意参数).
特别强调,结构变化检验,不是对于不同的子样本的估计进行比
较,而是计算(4)的F 值进行推断。
对于本例,两个子样本所得到的估计有着显著差别,其回归结果分别为
1.样本1:1970-1981的回归结果
图2 样本2的回归结果
All right reserved by Dr.Bill Wan Sing Hung - HKBU
121Sub-sample n 1Y = β0+ β1X +u 2Sub-sample n 2
样本1和样本2的回归直线
3.全样本(1970-1995)回归结果 图3. 全样本回归结果
All right reserved by Dr.Bill Wan Sing Hung - HKBU 7.30
All right reserved by Dr.Bill Wan Sing Hung - HKBU Structural stability : H : Var(u ) = Var(u Whole sample
计算)
2/(/2145k n n S k S F -+= F=((23248.3-1785.03-10005.22)/2)/(( 1785.03+10005.22)/2
2)=10.69
由F=10.69>F 0.01(2,22),P=0.00057,结论为在1%的显著性水平上
拒绝原假设而认为结构具有变化,隐含的意义为:高失业率改变了人们的储蓄行为,使边际储蓄倾向由0.08降为0.015。
进一步,CHOW 检验假设2221σσ=,即两个子总样的方差相同,在
此假定下,可证明(SEE CHOW ) ),(~)/ˆ()/ˆ(2122222121k n k n F F --=σσ
σσ 在假设2221σσ=下,有 2121ˆˆσ
σ=F (4-1) 利用(4-1)亦可实现结构变化检验。
本例
F =833.77/178.5=4.67 All right reserved by Dr.Bill Wan Sing Hung - HKBU
大于对应的临界值(5%为2.91),结论与前面的结论一致。
但F =4.67小于1%的临界值4.71,基于此接受原假设即无结构改变。
问题:是否有2221σσ=?如这一条件成立,可用上述检验,如不能成立,
CHOW 检验的形式与4不相同,但这部分内容已超出本书的范围。
欢迎您的下载,
资料仅供参考!
致力为企业和个人提供合同协议,策划案计划书,学习资料等等
打造全网一站式需求。