计量经济学4_一元线性回归
- 格式:pdf
- 大小:317.96 KB
- 文档页数:8
第四章一元线性回归第一部分学习目的和要求本章主要介绍一元线性回归模型、回归系数的确定和回归方程的有效性检验方法。
回归方程的有效性检验方法包括方差分析法、t检验方法和相关性系数检验方法。
本章还介绍了如何应用线性模型来建立预测和控制。
需要掌握和理解以下问题:1 一元线性回归模型2 最小二乘方法3 一元线性回归的假设条件4 方差分析方法5 t检验方法6 相关系数检验方法7 参数的区间估计8 应用线性回归方程控制与预测9 线性回归方程的经济解释第二部分练习题一、术语解释1 解释变量2 被解释变量3 线性回归模型4 最小二乘法5 方差分析6 参数估计7 控制8 预测二、填空ξ,目的在于使模型更1 在经济计量模型中引入反映()因素影响的随机扰动项t符合()活动。
2 在经济计量模型中引入随机扰动项的理由可以归纳为如下几条:(1)因为人的行为的()、社会环境与自然环境的()决定了经济变量本身的();(2)建立模型时其他被省略的经济因素的影响都归入了()中;(3)在模型估计时,()与归并误差也归入随机扰动项中;(4)由于我们认识的不足,错误的设定了()与()之间的数学形式,例如将非线性的函数形式设定为线性的函数形式,由此产生的误差也包含在随机扰动项中了。
3 ()是因变量离差平方和,它度量因变量的总变动。
就因变量总变动的变异来源看,它由两部分因素所组成。
一个是自变量,另一个是除自变量以外的其他因素。
()是拟合值的离散程度的度量。
它是由自变量的变化引起的因变量的变化,或称自变量对因变量变化的贡献。
()是度量实际值与拟合值之间的差异,它是由自变量以外的其他因素所致,它又叫残差或剩余。
4 回归方程中的回归系数是自变量对因变量的()。
某自变量回归系数β的意义,指的是该自变量变化一个单位引起因变量平均变化( )个单位。
5 模型线性的含义,就变量而言,指的是回归模型中变量的( );就参数而言,指的是回归模型中的参数的( );通常线性回归模型的线性含义是就( )而言的。
例1(一元线性回归模型) 令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为:µββ++=educ kids 10(1)随机扰动项µ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
解答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。
有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。
例2(一元线性回归模型) 已知回归模型µβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。
随机扰动项µ的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释α和β。
(2)OLS 估计量αˆ和满足线性性、无偏性及有效性吗?简单陈述理由。
βˆ(3)对参数的假设检验还能进行吗?简单陈述理由。
解答:(1)N βα+为接受过N 年教育的员工的总体平均起始薪金。
当N 为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金。
β是每单位N 变化所引起的E 的变化,即表示每多接受一年学校教育所对应的薪金增加值。
(2)OLS 估计量αˆ和仍满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项βˆµ的正态分布假设。
(3)如果t µ的分布未知,则所有的假设检验都是无效的。
因为t 检验与F 检验是建立在µ的正态分布假设之上的。
例3(一元线性回归模型) 对于人均存款与人均收入之间的关系式t t t Y S µβα++=使用美国36年的年度数据得到如下估计模型,括号内为标准差:)011.0()105.151(067.0105.384ˆtt Y S +=2R =0.538 023.199ˆ=σ(1)β的经济解释是什么?(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗?(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。
例1(一元线性回归模型) 令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为:µββ++=educ kids 10(1)随机扰动项µ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
解答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。
有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。
例2(一元线性回归模型) 已知回归模型µβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。
随机扰动项µ的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释α和β。
(2)OLS 估计量αˆ和满足线性性、无偏性及有效性吗?简单陈述理由。
βˆ(3)对参数的假设检验还能进行吗?简单陈述理由。
解答:(1)N βα+为接受过N 年教育的员工的总体平均起始薪金。
当N 为零时,平均薪金为α,因此α表示没有接受过教育员工的平均起始薪金。
β是每单位N 变化所引起的E 的变化,即表示每多接受一年学校教育所对应的薪金增加值。
(2)OLS 估计量αˆ和仍满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项βˆµ的正态分布假设。
(3)如果t µ的分布未知,则所有的假设检验都是无效的。
因为t 检验与F 检验是建立在µ的正态分布假设之上的。
例3(一元线性回归模型) 对于人均存款与人均收入之间的关系式t t t Y S µβα++=使用美国36年的年度数据得到如下估计模型,括号内为标准差:)011.0()105.151(067.0105.384ˆtt Y S +=2R =0.538 023.199ˆ=σ(1)β的经济解释是什么?(2)α和β的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗?(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。
第二章 一元线性回归模型2.1 一元线性回归模型的基本假定有一元线性回归模型(统计模型)如下, y t = β0 + β1 x t + u t上式表示变量y t 和x t 之间的真实关系。
其中y t 称被解释变量(因变量),x t 称解释变量(自变量),u t 称随机误差项,β0称常数项,β1称回归系数(通常未知)。
上模型可以分为两部分。
(1)回归函数部分,E(y t ) = β0 + β1 x t ,(2)随机部分,u t 。
图2.1 真实的回归直线这种模型可以赋予各种实际意义,居民收入与支出的关系;商品价格与供给量的关系;企业产量与库存的关系;身高与体重的关系等。
以收入与支出的关系为例。
假设固定对一个家庭进行观察,随着收入水平的不同,与支出呈线性函数关系。
但实际上数据来自各个家庭,来自同一收入水平的家庭,受其他条件的影响,如家庭子女的多少、消费习惯等等,其出也不尽相同。
所以由数据得到的散点图不在一条直线上(不呈函数关系),而是散在直线周围,服从统计关系。
“线性”一词在这里有两重含义。
它一方面指被解释变量Y 与解释变量X 之间为线性关系,即另一方面也指被解释变量与参数0β、1β之间的线性关系,即。
1ty x β∂=∂,221ty β∂=∂0 ,1ty β∂=∂,2200ty β∂=∂2.1.2 随机误差项的性质随机误差项u t 中可能包括家庭人口数不同,消费习惯不同,不同地域的消费指数不同,不同家庭的外来收入不同等因素。
所以在经济问题上“控制其他因素不变”是不可能的。
随机误差项u t 正是计量模型与其它模型的区别所在,也是其优势所在,今后咱们的很多内容,都是围绕随机误差项u t 进行了。
回归模型的随机误差项中一般包括如下几项内容: (1)非重要解释变量的省略,(2)数学模型形式欠妥, (3)测量误差等,(4)随机误差(自然灾害、经济危机、人的偶然行为等)。
2.1.3 一元线性回归模型的基本假定通常线性回归函数E(y t ) = β0 + β1 x t 是观察不到的,利用样本得到的只是对E(y t ) =β0 + β1 x t 的估计,即对β0和β1的估计。
计量经济学⼀元线性回归模型总结第⼀节两变量线性回归模型⼀.模型的建⽴1.数理模型的基本形式y x αβ=+ (2.1)这⾥y 称为被解释变量(dependent variable),x 称为解释变量(independent variable)注意:(1)x 、y 选择的⽅法:主要是从所研究的问题的经济关系出发,根据已有的经济理论进⾏合理选择。
(2)变量之间是否是线性关系可先通过散点图来观察。
2.例如果在研究上海消费规律时,已经得到上海城市居民1981-1998年期间的⼈均可⽀配收⼊和⼈均消费性⽀出数据(见表1),能否⽤两变量线性函数进⾏分析?表1.上海居民收⼊消费情况年份可⽀配收⼊消费性⽀出年份可⽀配收⼊消费性⽀出 1981 636.82 585 1990 2181.65 1936 1982 659.25 576 1991 2485.46 2167 1983 685.92 615 1992 3008.97 2509 1984 834.15 726 1993 4277.38 3530 1985 1075.26 992 1994 5868.48 4669 19861293.24117019957171.91586819871437.09128219968158.746763 19881723.44164819978438.896820 19891975.64181219988773.168662.⼀些⾮线性模型向线性模型的转化⼀些双变量之间虽然不存在线性关系,但通过变量代换可化为线性形式,这些双变量关系包括对数关系、双曲线关系等。
例3-2 如果认为⼀个国家或地区总产出具有规模报酬不变的特征,那么采⽤⼈均产出y与⼈均资本k的形式,该国家或者说地区的总产出规律可以表⽰为下列C-D⽣产函数形式y Akα=(2.2)也就是⼈均产出是⼈均资本的函数。
能不能⽤两变量线性回归模型分析这种总量⽣产规律?3.计量模型的设定(1)基本形式:y x αβε=++ (2.3)这⾥ε是⼀个随机变量,它的数学期望为0,即(2.3)中的变量y 、x 之间的关系已经是不确定的了。
一、单选题1、假设检验采用的逻辑推理方法是A.归纳推理法B.类比推理法C.反证法D.演绎推理法正确答案:C2、在Eviews软件操作中,预测是用()命令。
A.GENERATEB.PLOTC.FORECASTD.SCAT正确答案:C3、对任意两个随机变量X和Y,若EXY=EX*EY,则()A.X和Y不独立B.X和Y相互独立C.Var(XY)=VarX*VarYD.Var(X+Y)=VarX+VarY正确答案:D4、设随机变量X1,X2,...,Xn(n>1)独立同分布,且方差σ2>0。
令随机变量Y=1n ∑X ini=1,则()A.Var(X1+Y)=n+2nσ2B.Cov(X1,Y)=1nσ2C. Var(X1−Y)=n+2nσ2D. Cov(X1,Y)=σ2正确答案:B5、设随机变量X~t(n)(n>1),Y=1X,则A. Y~F(1,n)B. Y~F(n,1)C. Y~χ2(n−1)D. Y~χ2(b)正确答案:B二、多选题1、变量的显著性T检验的步骤有哪些?A.以原假设H0构造T统计量B.对总体参数提出假设C.给定显著性水平α,查t分布表得临界值tα/2(n-2)D.比较t统计量和临界值正确答案:A、B、C、D2、随机误差项的主要影响因素是A.变量观测值的观测误差的影响B.在解释变量中被忽略的因素的影响C.都不是D.模型关系的设定误差的影响正确答案:A、B、D3、下列中属于最小二乘法基本假设的有A.解释变量X是确定性变量,不是随机变量B.m服从零均值、同方差、零协方差的正态分布:μi~N(0,σμ2) i=1,2, …,nC.随机误差项μ与解释变量X之间不相关:Cov(Xi,μi)=0i=1,2, …,nD.随着样本容量的无限增加,解释变量X的样本方差趋于一有限常数。
正确答案:A、B、C、D4、最小二乘估计量的性质A.有效性B.无偏性C.一致性D.线性性正确答案:A、B、D5、缩小置信区间的途径有哪些A.增大样本容量B.降低模型的拟合优度C.提高模型的拟合优度D.减小样本容量正确答案:A、C三、判断题1、可以通过散点图来确定模型的形式。