经典单方程计量经济学模型一元线性回归模型
- 格式:doc
- 大小:608.50 KB
- 文档页数:20
第二章 一元线性回归模型2.1 一元线性回归模型的基本假定2.1.1一元线性回归模型有一元线性回归模型(统计模型)如下, y t = β0 + β1 x t + u t上式表示变量y t 和x t 之间的真实关系。
其中y t 称被解释变量(因变量),x t 称解释变量(自变量),u t 称随机误差项,β0称常数项,β1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t ) = β0 + β1 x t ,(2)随机部分,u t 。
图2.1 真实的回归直线这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。
所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
“线性”一词在这里有两重含义。
它一方面指被解释变量Y 与解释变量X 之间为线性关系,即1tty x β∂=∂220tt y x β∂=∂另一方面也指被解释变量与参数0β、1β之间的线性关系,即。
1ty x β∂=∂,221ty β∂=∂0 ,1ty β∂=∂,2200ty β∂=∂2.1.2 随机误差项的性质随机误差项u t 中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以在经济问题上“控制其他因素不变”是不可能的。
随机误差项u t 正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项u t 进行了。
回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略, (2)数学模型形式欠妥, (3)测量误差等,(4)随机误差(自然灾害、经济危机、人的偶然行为等)。
第二章经典单方程计量经济学模型:一元线性回归模型一、容提要本章介绍了回归分析的基本思想与基本方法。
首先,本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。
总体回归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总体回归函数做出统计推断。
本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS)的学习与掌握。
同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。
本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所谓的统计检验。
统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”,第二是检验样本回归函数与总体回归函数的“接近”程度。
后者又包括两个层次:第一,检验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成;第二,检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。
本章还有三方面的容不容忽视。
其一,若干基本假设。
样本回归函数参数的估计以及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。
其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。
Goss-markov定理表明OLS估计量是最佳线性无偏估计量。
其三,运用样本回归函数进行预测,包括被解释变量条件均值与个值的预测,以及预测置信区间的计算及其变化特征。
二、典型例题分析例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为β+μβkids=educ+1(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
解答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。
有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。
例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。
随机扰动项μ的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释α和β。
(2)OLS 估计量αˆ和βˆ满足线性性、无偏性及有效性吗?简单述理由。
(3)对参数的假设检验还能进行吗?简单述理由。
解答:(1)N βα+为接受过N 年教育的员工的总体平均起始薪金。
当N 为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金。
β是每单位N 变化所引起的E 的变化,即表示每多接受一年学校教育所对应的薪金增加值。
(2)OLS 估计量αˆ和仍βˆ满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项μ的正态分布假设。
(3)如果t μ的分布未知,则所有的假设检验都是无效的。
因为t 检验与F 检验是建立在μ的正态分布假设之上的。
例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距项与斜率项有无变化? 解答:首先考察被解释变量度量单位变化的情形。
以E*表示以百元为度量单位的薪金,则μβα++=⨯=N E E 100*由此有如下新模型)100/()100/()100/(*μβα++=N E或 ****μβα++=N E这里100/*αα=,100/*ββ=。
所以新的回归系数将为原始模型回归系数的1/100。
再考虑解释变量度量单位变化的情形。
设N*为用月份表示的新员工受教育的时间长度,则N*=12N ,于是μβαμβα++=++=)12/*(N N E或 μβα++=*)12/(N E可见,估计的截距项不变,而斜率项将为原回归系数的1/12。
例4、对没有截距项的一元回归模型i i i X Y μβ+=1称之为过原点回归(regrission through the origin )。
试证明(1)如果通过相应的样本回归模型可得到通常的的正规方程组∑∑==00iii X e e则可以得到1β的两个不同的估计值: X Y =1~β, ()()∑∑=21ˆiii X Y X β。
(2)在基本假设0)(i =μE 下,1~β与1ˆβ均为无偏估计量。
(3)拟合线X Y 1ˆˆβ=通常不会经过均值点),(Y X ,但拟合线X Y 1~~β=则相反。
(4)只有1ˆβ是1β的OLS 估计量。
解答:(1)由第一个正规方程0=∑te得0)~(1=-∑t t X Y β或∑∑=t t X Y 1~β求解得 X Y /~1=β由第2个下规方程0)ˆ(1=-∑tttX YX β得 ∑∑=21ˆt ttX YX β求解得 )/()(ˆ21∑∑=ttt XY X β(2)对于X Y /~1=β,求期望11111)](){[1)](1[1)()~(ββμβμββ==+=+==XXE n X E X X nE X X Y E E t t t t 这里用到了t X 的非随机性。
对于)/()(ˆ21∑∑=ttt XY X β,求期望)/()ˆ(21∑∑=t t t X Y X E E β12212122)()1()()1()]([)1()()1(βμβμβ=+=+==∑∑∑∑∑∑∑∑t t tt t t t t t t t t E X X X X X X E X Y X E X(3)要想拟合值X Y 1ˆˆβ=通过点),(Y X ,X 1ˆβ必须等于Y 。
但X XYX X ttt ∑∑=21ˆβ,通常不等于Y 。
这就意味着点),(Y X 不太可能位于直线X Y 1ˆˆβ=上。
相反地,由于Y X =1~β,所以直线X Y 1~ˆβ=经过点),(Y X 。
(4)OLS 方法要求残差平方和最小Min ∑∑-==212)ˆ(tt tX Y eRSS β 关于1ˆβ求偏导得 0))(ˆ(2ˆ11=--=∂∂∑tt t X X Y RSS ββ即0)ˆ(1=-∑tttX YX β ()()∑∑=21ˆii i X Y X β可见1ˆβ是OLS 估计量。
例5.假设模型为t t t X Y μβα++=。
给定n 个观察值),(11Y X ,),(22Y X ,…,),(n n Y X ,按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜率;最后对这些斜率取平均值,称之为βˆ,即β的估计值。
(1)画出散点图,给出βˆ的几何表示并推出代数表达式。
(2)计算βˆ的期望值并对所做假设进行述。
这个估计值是有偏的还是无偏的?解释理由。
(3)证明为什么该估计值不如我们以前用OLS 方法所获得的估计值,并做具体解释。
解答:(1)散点图如下图所示。
(X n ,Y n )首先计算每条直线的斜率并求平均斜率。
连接),(11Y X 和),(t t Y X 的直线斜率为)/()(11X X Y Y t t --。
由于共有n -1条这样的直线,因此][11ˆ211∑==---=n t t t t X X Y Y n β (2)因为X 非随机且0)(=t E μ,因此βμμβμβαμβα=--+=-++-++=--][])()([][1111111X X E X X X X E X X Y Y E t t t t t t t这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏的。
(3)根据高斯-马尔可夫定理,只有β的OLS 估计量是最付佳线性无偏估计量,因此,这里得到的βˆ的有效性不如β的OLS 估计量,所以较差。
例6.对于人均存款与人均收入之间的关系式t t t Y S μβα++=使用美国36年的年度数据得如下估计模型,括号为标准差:)011.0()105.151(067.0105.384ˆtt Y S +=2R =0.538 023.199ˆ=σ(1)β的经济解释是什么?(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗?(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。
同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行述。
你的结论是什么?解答:(1)β为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。
(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此α符号应为负。
储蓄是收入的一部分,且会随着收入的增加而增加,因此预期β的符号为正。
实际的回归式中,β的符号为正,与预期的一致。
但截距项为负,与预期不符。
这可能与由于模型的错误设定形造成的。
如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。
(3)拟合优度刻画解释变量对被解释变量变化的解释能力。
模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8 %的变动。
(4)检验单个参数采用t 检验,零假设为参数为零,备择假设为参数不为零。
双变量情形下在零假设下t 分布的自由度为n-2=36-2=34。
由t 分布表知,双侧1%下的临界值位于2.750与2.704之间。
斜率项计算的t 值为0.067/0.011=6.09,截距项计算的t 值为384.105/151.105=2.54。
可见斜率项计算的t 值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。
三、习题(一)基本知识类题型2-1.解释下列概念:1)总体回归函数2)样本回归函数3)随机的总体回归函数4)线性回归模型5)随机误差项(u i)和残差项(e i)6)条件期望7)非条件期望8)回归系数或回归参数9)回归系数的估计量10)最小平方法11)最大似然法12)估计量的标准差13)总离差平方和14)回归平方和15)残差平方和16)协方差17)拟合优度检验18)t检验19)F检验2-2.判断正误并说明理由:1)随机误差项u i和残差项e i是一回事2)总体回归函数给出了对应于每一个自变量的因变量的值3)线性回归模型意味着变量是线性的4)在线性回归模型中,解释变量是原因,被解释变量是结果5)随机变量的条件均值与非条件均值是一回事2-3.回答下列问题:1)线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计?2)总体方差与参数估计误差的区别与联系。