邹至庄检验
- 格式:doc
- 大小:6.29 MB
- 文档页数:5
[计量经济学讲义] 第九章:虚拟解释变量本章及下一章将变量类型由定量变量拓展到定性变量。
§1虚拟变量的性质1、变量的分类:定量变量:如收入、产量、价格、成本、高度等取值在一定分为内连续变化;定性变量:如性别、种族、肤色、宗教、国际、战争、地震、沿海省份等。
“量化”:将定性变量量化,可以根据其不同情况取值0或1。
2、虚拟变量(dummy variable ):取值为0、1等这样的变量。
虚拟变量有时也称为二值变量(binary variable)、二分变量(dichotomous variable)、定性变量(qualitative variable)、指标变量(indicator variable )3、ANOV A (方差分析analysis of variance ):解释变量全为虚拟变量例:i Y =α+βi D +i u其中i Y 表示教授年薪,i D =1,男教授i D =0,女教授(假定年龄、学位和经验可以忽略)女教授的平均年薪为:E(i Y |i D =0)=α;男教授的平均年薪为:E(i Y |i D =1)=α+β;一个例子(略)§2 一个定量变量和一个二分定性变量1、例子:i Y =1α+2αi D +βi X +i u其中i Y 表示教授年薪,i X 表示年龄,则有:女教授的平均年薪为:E(i Y |i X ,i D =0)=1α+βi X ;男教授的平均年薪为:E(i Y |i X ,i D =1)= 1α+2α+βi X ;(假设共同斜率)2、问:有截距项的情况下,区分两个类别要几个虚拟变量?答案是一个,否则有完全贡献性。
结论:有截距项的情况下,若一个定性变量有m 个类别,则仅引入m-1个虚拟变量。
3、0与1的分配问题。
4、基准(benchmark ):0类别的情况5、级差截距系数:D 的系数§3 一个定量变量和一个多分变量例子:假设在横截面数据的基础上,做个人保健支出对个人收入和教育水平的回归。
第六章 带有线性约束的多元线性回归模型及其假设检验在本章中,继续讨论第五章的模型,但新的模型中,参数β满足J 个线性约束集,R β=q ,矩阵R 有和β相一致的K 列和总共J 个约束的J 行,且R 是行满秩的,我们考虑不是过度约束的情况,因此,J <K 。
带有线性约束的参数的假设检验,我们可以用两种方法来处理。
第一个方法,我们按照无约束条件求出一组参数估计后,然后我们对求出的这组参数是否满足假设所暗示的约束,进行检验,我们在本章的第一节中讨论。
第二个方法是我们把参数所满足的线性约束和模型一起考虑,求出参数的最小二乘解,尔后再作检验,后者就是参数带有约束的最小二乘估计方法,我们在本章的第二节中讨论。
第一节 线性约束的检验 从线性回归模型开始,εβ+=X y (1)我们考虑具有如下形式的一组线性约束,JK JK J J K K K K q r r r q r r r q r r r =+++=+++=+++βββββββββ22112222212*********这些可以用矩阵改写成一个方程q R =β (2)作为我们的假设条件0H 。
R 中每一行都是一个约束中的系数。
矩阵R 有和β相一致的K 列和总共J 个约束的J 行,且R 是行满秩的。
因此,J 一定要小于或等于K 。
R 的各行必须是线性无关的,虽然J =K 的情况并不违反条件,但其唯一决定了β,这样的约束没有意义,我们不考虑这种情况。
给定最小二乘估计量b ,我们的兴趣集中于“差异”向量d=Rb -q 。
d 精确等于0是不可能的事件(因为其概率是0),统计问题是d 对0的离差是否可归因于抽样误差或它是否是显著的。
由于b 是多元正态分布的,且d 是b 的一个线性函数,所以d 也是多元正态分布的,若原假设为真,d 的均值为0,方差为R X X R R b Var R q Rb Var d Var ''='=-=-12)(])[(][][σ (3)对H 0的检验我们可以将其基于沃尔德(Wald )准则:d d Var d J W 12])[()(-'==χ=)(])([)(112q Rb R X X R q Rb -'''---σ (4)在假设正确时将服从自由度为J 的2χ分布(为什么?)。
目前中国的人口老龄化程度正在呈指数式加深,2017年全国人口中65周岁以上人口占总人口的11.4%。
随着老年人口的不断增加,养老问题急需重点关注。
目前我国的社会保障制度城乡差距较为明显,农村人口老龄化程度高于城镇,养老保障水平却处于较低的水平。
我国的城乡养老差距主要体现在:第一,城乡养老保险发展不协调,城镇的社会保障体系发展成熟且项目较多,农村社会保障制度起步晚且不完善。
第二,城乡养老保险对接不协调,养老保险体系“碎片化”,城乡社会保障体系尚未形成协调的统筹与对接运行机制。
第三,筹资与给付水平不协调,近15年的城镇养老金替代率平均值为53.15%,而农村仅为23%。
第四,城乡养老公共资源配置不协调。
总而言之,在当前背景下,人口老龄化加剧问题对社会发展的阻碍程度日益加深。
城乡之间的养老保障差距不利于城乡的协调发展与公共一体化建设。
因此,研究如何缩小城乡养老差距对实现我国现阶段目标具有重大深远的现实意义。
一、文献回顾伴随着养老需求的增加,城乡养老差距日渐被学界关注,目前的研究主要集中在三块。
第一块是关于城乡养老差距的表现,金艳(2013)认为目前城乡养老差距表现为保障水平、替代率、覆盖率等差异。
薛惠元(2013)从制度模式、缴费标准、计发办法和待遇水平等方面分析比较城乡基本养老保险。
En-durance Uzobo 和Oluwatosin Abigail Dawodu (2015)在尼日利亚展开调查研究发现,城镇老年人相较农村老年人能够享受到更好的日常照料、医疗照护等养老服务。
第二块是关于城乡养老差距形成的原因,尹浩华(2013)认为,养老保险待遇的差距本质上是社会保障制度“碎片化”的一种具体表现形式。
戴欢(2014)认为目前城乡养老非均等的原因主要在于城乡制度间群体身份差异,权利义务非均等,城乡养老服务缺乏统一规划。
张箫箫(2019)认为,城乡二元经济结构的影响使得城乡居民基础养老保险制度差距不断拉大。
第9章虚拟变量回归模型9.1 复习笔记考点一:ANOVA模型★★★1.虚拟变量含义虚拟变量是指仅有0和1两个取值的变量,是一种定性变量。
一般而言,虚拟变量等于0表示变量不具有某种性质,等于1表示具有某种性质。
虚拟变量也可以放到回归模型中。
这种模型被称为方差分析(ANOVA)模型。
2.虚拟变量模型(1)虚拟变量的表达式Y i=β1+β2D2i+β3D3i+u i应看到,除了不是定量回归元而是定性或虚拟回归元(若观测值属于某特定组则取值为1,若它不属于那一组则取值0)之外,方程与前面考虑的任何一个多元回归模型都是一样的。
所有的虚拟变量都用字母D表示。
(2)使用虚拟变量的注意事项①若定性变量有m个类别,则只需引入m-1个虚拟变量,否则就会陷入虚拟变量陷阱,即完全共线性或完全多重共线性(若变量之间存在不止一个精确的关系)情形。
对每个定性变量而言,所引入的虚拟变量的个数必须比该变量的类别数少一个。
②不指定其虚拟变量的那一组被称为基组、基准组、控制组、比较组、参照组或省略组。
所有其他的组都与基准组进行比较。
③截距值(β1)代表了基准组的均值。
④附属于方程中虚拟变量的系数被称为级差截距系数,它反映取值为1的地区的截距值与基准组的截距系数之间的差别。
⑤如果定性变量不止一类,那么,基准组的选择完全取决于研究者。
⑥对于虚拟变量陷阱,如果在这种模型中不使用截距项,那么引入与变量的类别相同数量的虚拟变量就能够回避虚拟变量陷阱的问题。
因此,如果从方程中去掉截距项,并考虑如下模型Y i=β1D1i+β2D2i+β3D3i+u i由于此时没有完全共线性,所以就不会陷入虚拟变量陷阱。
但要确定做这个回归时,一定要使用回归软件包中的无截距选项。
⑦在一个含有截距的方程中,能更容易地处理是否有某个组与基准组有所不同以及有多大的不同,所以在方程中包括截距更方便。
为了检查分组是否得当,也可通过将虚拟变量的系数相对0做t检验(或者更一般地,对适当的虚拟变量系数集做一个F检验),就可以检验分类是否适当。
我国GDP对居民消费影响的计量分析摘要:从经济理论角度来看,消费与gdp具有正相关。
文章依据1990年到2010年的gdp数据和居民消费水平数据,分析得出gdp —消费的一元线性回归模型,而1997年和2008年作为经济危机的发生时间,对这两个时间断点分别做邹至庄检验,文章的最后综合全文,给出结论,并提出相关建议。
关键词:gdp—消费模型一元线性回归邹至庄检验虚拟变量模型1990年以来,我国国内生产总值水平呈现增长的趋势,与此同时,居民消费水平也随着人均收入水平的上升而不断上涨。
从经济理论角度来说,消费是和gdp有正相关关系的。
而中国经济在1997年和2008年均发生了比较大的金融冲击,1997年的亚洲金融危机和2008年的全球经济危机都有可能会引起消费和收入之间关系的结构性变化。
因此,我希望能够在对消费和收入作出线性回归后,加入邹至庄检验,判断1997年和2008年是否发生了断点处结构性变化,并通过虚拟变量模型,判断回归方程的截距和斜率哪些发生了变化。
一、背景介绍国内生产总值和居民消费是直接相关的。
从经济逻辑上来讲,居民消费是反映整体经济活动的重要指标,整体经济活动越好,国内生产总值越高,那么居民消费就越高。
发生在1997年的亚洲金融危机,是继三十年代大危机之后,对世界经济有深远影响的重大事件。
这次金融危机影响极其深远,它暴露了一些亚洲国家经济高速发展的背后的一些深层次问题。
2008年环球金融危机,是一场在2007年8月9日开始浮现的金融危机。
自次级房屋信贷危机爆发后,投资者开始对按揭证券的价值失去信心,引发流动性危机。
直到2008年9月9日,这场金融危机开始失控,并导致多间相当大型的金融机构倒闭或被政府接管。
二、实证分析1.数据收集从中国统计局里找到中国统计年鉴,在中国统计年鉴找到年度数据。
2.一元线性回归将数据输入eviews软件,对其做最小二乘法,得出一元线性回归的表达式:式(1)式(1)中,斜率系数的t值为36.38875,p值近似为0,说明回归系数高度显著,gdp对消费有显著影响。
计量经济学复习题姓名: 学号: 系、所:(可以使用计算器)一.1984-1997年中国宏观消费(CONS ,千亿元人民币)与GDP (千亿元人民币)的样本数据、散点图、一元线性回归结果以及残差图分别如下所示。
(45分)1020304020406080C O N SGDP(1) 在划线处填上相应数字(共8处)(计算过程中保留4位小数。
) (2) 残差图中两条虚线之间的距离是多少?_____________(3) 把相对于1988年的残差点标在残差图的相应位置上并与相邻的残差点连线。
(4) 根据计算机输出结果,写出一元回归模型的表达式。
(5) 给定检验水平α = 0.05,检验上述回归模型显著性的临界值F 0.05 = __________。
(6) 给定检验水平α = 0.05,检验上述模型回归参数显著性的临界值t 0.05 = __________。
(7) 解释回归系数的经济意义。
(8) 试判断,模型是否明显地违反了某个假定条件?二.给定一元线性回归模型y t = β0 + β1 x t + u t ,其中y t , x t 是变量,β0, β1 是回归参数,u t 是随机误差项。
用t y ˆ =0ˆβ+1ˆβx t 表示估计的回归直线,定义统计量F =)2()ˆ()12()ˆ(1212----∑∑==T yy y yTt t t Tt t ,其中T 表示样本容量,y 表示y t 的样本平均数,用t 1表示相对于1ˆβ的t 统计量,证明F = (t 1)2。
(10分)一.中国农村居民家庭对数的人均食品支出(Lnfood )与生活支出(Lnlive )数据(1978-1998)散点图、一元线性回归结果如下所示。
(50分)4.04.55.05.56.06.57.045678LN LIVELN F OOD图1 Lnfood ,Lnlive 散点图(9) 在划线处填上相应数字(共5处)(用保留4位小数运算。
智慧树知到《计量经济学》章节测试答案第一章1、计量经济学是一门学科。
A:数学B:统计学C:经济学D:计量学答案: 经济学2、计量经济学的创始人是:A:凯恩斯B:弗里希C:格兰杰D:伍德里奇答案: 弗里希3、计量经济学主要由、和三门学科的内容有机结合而成。
A:计量学B:统计学C:经济学D:测度论E:数学答案: 统计学,经济学,数学4、国际计量经济学会成立标志着计量经济学作为一门独立学科地位的正式确立。
A:对B:错答案: 对5、计量经济学具有综合性、交叉性和边缘性的特点。
A:对B:错答案: 对6、计量经济模型一般由、、、等四个要素构成。
A:变量、公式、模型和方程B:经济变量、数学变量、统计变量和计量软件C:经济变量、参数、随机误差项和方程的形式D:函数关系、因果关系、统计关系和计量关系答案: 经济变量、参数、随机误差项和方程的形式7、对计量经济模型进行检验的三个常用准则是:A:经济意义准则、统计检验准则和计量检验准则B:线性准则、无偏性准则和最优性准则C:正确准则、有效准则和简洁准则D:渐进一致性准则、渐进有效性准则和渐进正态性准则答案: 经济意义准则、统计检验准则和计量检验准则8、判断模型参数估计量的符号、大小、相互之间关系的合理性属于经济意义准则。
A:对B:错答案: 对9、在同一时间不同统计单位的相同统计指标组成的数据列是横截面数据。
A:对B:错答案: 对10、建立计量经济模型的一般步骤是:A:模型设定,模型检验,参数估计,模型应用B:搜集资料,参数估计,模型设定,模型应用C:参数估计,模型应用,模型检验,改进模型D:模型设定,参数估计,模型检验,模型应用答案: 模型设定,参数估计,模型检验,模型应用第二章1、进行回归分析时,当x取各种值时,y的条件均值的轨迹接近一条直线,该直线称为y对x的回归直线。
A:对B:错答案: 对2、将总体被解释变量y的条件均值表现为解释变量x的函数,这个函数称为总体回归函数。
题目:stata虚拟变量的邹至庄检验概述在统计分析中,虚拟变量是指在面对分类变量时,将其转换为二进制变量,以便进行回归分析或其他统计方法。
而邹至庄检验则是用来检验虚拟变量的共线性问题,即是否存在多重共线性。
在本文中,将对stata中虚拟变量的应用和邹至庄检验进行深入探讨。
一、stata中虚拟变量的应用1. 什么是虚拟变量虚拟变量是将分类变量转换为二进制变量的一种方法。
在stata中,可以使用“tabulate”命令对分类变量进行二进制转换,即生成虚拟变量。
2. 虚拟变量的应用场景虚拟变量常用于回归分析中,尤其是在面对分类变量时。
通过将分类变量转换为虚拟变量,可以更好地进行数据分析和建模。
3. staa中生成虚拟变量的方法在stata中,可以使用“gen”命令来生成虚拟变量。
对于一个性别变量,可以使用“gen female = (gender==2)”来生成一个名为“female”的虚拟变量。
二、邹至庄检验1. 什么是邹至庄检验邹至庄检验是用来检验虚拟变量之间是否存在多重共线性的一种统计方法。
在回归分析中,多重共线性会导致模型的不稳定性和参数估计的不准确性。
进行邹至庄检验是十分重要的。
2. staa中进行邹至庄检验的方法在stata中,可以使用“estat vif”命令来进行邹至庄检验。
该命令会输出各个虚拟变量的方差膨胀因子(VIF),若VIF值大于10,则表明存在多重共线性。
三、个人观点和总结在实际数据分析中,虚拟变量的应用非常普遍,特别是在处理分类变量时。
通过将分类变量转换为虚拟变量,可以更好地进行统计分析和建模。
对于生成的虚拟变量,应当及时进行邹至庄检验,以确保模型的稳定性和准确性。
总结而言,stata中虚拟变量的应用和邹至庄检验的方法十分重要,对于进行回归分析的数据,尤其需要重视。
只有在充分了解虚拟变量的应用场景和邹至庄检验的方法后,才能更好地进行数据分析和建模,得到准确的结果。
以上是对stata中虚拟变量的邹至庄检验的一些探讨,希望对你有所帮助。
邹至庄(Gregory C. Chow )检验
比较两个回归 :检验模型的结构稳定性
所谓模型的结构稳定的指模型在样本期的不同时期(子样本),其参数不发生改变。
而任何参数样本期的不同时期发生改变,则称模型不具有结构稳定性。
一般而言,导致模型发生结构变化的因素是重要的外生事件,或外生冲击,故常设定某一时点或年份,以此将样本分为二个子样本,分别估计这二个子样本和样本全体,构成F 统计量,据此推断模型是否发生结构变化。
例子:美国个人收入和储蓄(样本1970-1995)。
由于美国在1982年失业率达到8.2%,为检验这一高失业率是否导致个人储蓄行为发生变化,将1981年设定为一个可能的结构变化点,将样本分为1970-1981和1982-1995,并设定这两个时期的储蓄函数为
t t t u x Y 121++=αα (1)
)1954(,,2,11==n t
t t t u x Y 221++=ββ (2)
)1963(,,2,12==n t
CHOW 检验:假设 ),0(~2σN u i ,0)(.2,121==u u E i ;
1.用全体样本(211,1,,2,1n n n t +=)对模型
t t t u x Y ++=21λλ (3)
进行OLS ,得到RSS ,其自由度为))2((21=-+k n n ,并记为S R ;这里下标R 表示将两个子样本的回归参数约束为相等
2.用2个子样本分别估计(1)和(2),且分别记RSS 为S 1和S 2;其自由度分别为k n -1和k n -2。
定义
452
14S S S S S S R -=+= 其自由度分别为k k k n n )),2(2(21=-+。
3.构造CHOW 的F 统计量,在上述假设下,有
)2,(~)
2/(/212145k n n k F k n n S k S F -+-+= (4) 以此检验原假设:无结构变化,备选假设:模型具有结构变化(任意参数).
特别强调,结构变化检验,不是对于不同的子样本的估计进行比较,而是计算(4)的F 值进行推断。
对于本例,两个子样本所得到的估计有着显著差别,其回归结果分别为
1.样本1:1970-1981的回归结果
图2 样本2的回归结果
All right reserved by Dr.Bill Wan Sing Hung - HKBU
121Sub-sample n 1Y = β0+ β1X +u 2Sub-sample n 2
样本1和样本2的回归直线
3.全样本(1970-1995)回归结果 图3. 全样本回归结果
All right reserved by Dr.Bill Wan Sing Hung - HKBU 7.30
All right reserved by Dr.Bill Wan Sing Hung - HKBU Structural stability : H : Var(u ) = Var(u Whole sample
计算)
2/(/2145k n n S k S F -+= F=((23248.3-1785.03-10005.22)/2)/(( 1785.03+10005.22)/22)=10.69 由F=10.69>F 0.01(2,22),P=0.00057,结论为在1%的显著性水平上拒绝原假设而认为结构具有变化,隐含的意义为:高失业率改变了人们的储蓄行为,使边际储蓄倾向由0.08降为0.015。
进一步,CHOW 检验假设2221σσ=,即两个子总样的方差相同,
在此假定下,可证明(SEE CHOW )
),(~)/ˆ()/ˆ(2122222121k n k n F F --=σσ
σσ 在假设2221σσ=下,有
2121ˆˆσ
σ=F (4-1) 利用(4-1)亦可实现结构变化检验。
本例
F =833.77/178.5=4.67
大于对应的临界值(5%为2.91),结论与前面的结论一致。
但F =4.67All right reserved by Dr.Bill Wan Sing Hung - HKBU
小于1%的临界值4.71,基于此接受原假设即无结构改变。
问题:是否有2221σσ=?如这一条件成立,可用上述检验,如不能成立,
CHOW 检验的形式与4不相同,但这部分内容已超出本书的范围。