(完整word版)计量经济学第三版复习知识要点庞皓(word文档良心出品)
- 格式:doc
- 大小:724.50 KB
- 文档页数:30
2009第一学期《计量经济学》试卷一、填空题(20%, 每空1分)1.计量经济学是以 为指导, 以 为依据, 以 为方法, 以计算机专用软件为手段, 研究经济关系和经济活动的 规律及其应用, 并以建立和应用经济数学模型为核心的一门经济学学科。
2、对于计量经济模型的检验的内容, 一般分为四种形式的检验: 、 、 和 。
3.在计量经济学中线性模型的“线性”有两种解释: 一是模型就 而言是线性的, 二是模型就 而言是线性的。
在计量经济学中, 从回归理论的发展和参数的估计方法考虑, 通常是就 而言来判断是否线性回归模型。
4.简单线性回归模型的五条基本假定是: (1) ;(2) ; (3) ;(4) ;(5) 。
5.根据高斯-马尔可夫定理, 最小二乘估计具有四个性质: (1) 、(2) 、(3) 、(4) 。
二、判断题(10%, 每题1分, 请将×或√写在表格中, 否则该题不得分。
) 1.( )经典线性回归模型 的零均值假设是指 。
2.( )对经济计量模型进行的各种检验中, 经济准则检验是第一位的, 如果经济准则检验无效, 则只能放弃模型。
3.( )如果可决系数r2等于0.8, 说明在总变差中有80%是可以由所拟合的回归直线作出解释的。
4.( )当估计标准误差s =0时, 说明被解释变量的观测值Yi 与回归估计值Ŷi 完全一致。
5.( )若X 与Y 为函数关系, 则相关系数| r|=1。
6、( )对于单个回归系数进行t -检验, 目的在于检验参数的估计量是否等于参数真值。
7、( )描述产品平均成本(Y )依存产品产量(X )而变动的关系, 适宜配合倒数变换模型 。
8、( )依据样本资料计算的相关系数r 是一个随机变量。
9、( )在使用横截面数据进行经济计量分析时, 要求指标统计的对象及其范围必须相同。
10、( )在经济计量研究中, 有时引入滞后内生变量作为解释变量, 作为解释变量的滞后内生变量是非随机变量。
第二章简单线性回归模型第一节回归分析与回归函数P15(一)相关分析与回归分析1、相关关系2、相关系数3、回归分析(二)总体回归函数(条件期望)(三)随机扰动项(四)样本回归函数第二节简单线性回归模型参数的估计P26(一)简单线性回归的基本假定(二)普通最小二乘法求样本回归函数(三)OLS回归线的性质(四)最小二乘估计量的统计性质1、参数估计量的评价标准(无偏性、有效性、一致性)2、OLS估计量的统计特性(线性特性、无偏性、有效性、高斯-马尔可夫定理)第三节拟合优度的度量(RSS、ESS、TSS)P35(一)总变差的分解(二)可决系数(三)可决系数与相关系数的关系第四节回归系数的区间估计与假设检验P38(一)OLS估计的分布性质(二)回归系数的区间估值(三)回归系数的假设检验1、Z检验2、t检验第五节回归模型预测P43第六节案例分析P48第三章多元线性回归模型第一节多元线性回归模型及古典假定P64一、多元线性回归模型二、多元线性回归模型的矩阵形式三、多元线性回归模型的古典假定第二节多元线性回归模型的估计P68一、多元线性回归性参数的最小二乘估计二、参数最小二乘估计的性质(线性特性、无偏性、有效性)三、OLS估计的分布性质四、随机扰动项方差的估计五、多元线性回归模型参数的区间估计第三节多元线性回归模型的检验P74一、拟合优度检验(多重可决系数、修正的可决系数)二、回归方程的显著性检验(F-检验)三、回归参数的显著性检验(t-检验)第四节多元线性回归模型的预测P79第五节案例分析P81第四章多重共线性第一节什么是多重共线性P94第二节多重共线性产生的后果第三节多重共线性的检验第四节多重共线性的补救措施第五节案例分析P109。
实用文档之"第二章"2.2(1)①对于浙江省预算收入与全省生产总值的模型,用Eviews分析结果如下:Dependent Variable: YMethod: Least SquaresDate: 12/03/14 Time: 17:00Sample (adjusted): 1 33Included observations: 33 after adjustmentsVariable Coefficient Std. Error t-Statistic Prob.X 0.176124 0.004072 43.25639 0.0000C -154.3063 39.08196 -3.948274 0.0004R-squared 0.983702 Mean dependent var 902.5148 Adjusted R-squared 0.983177 S.D. dependent var 1351.009S.E. of regression 175.2325 Akaike info criterion 13.22880Sum squared resid 951899.7 Schwarz criterion 13.31949Log likelihood -216.2751 Hannan-Quinn criter. 13.25931F-statistic 1871.115 Durbin-Watson stat 0.100021Prob(F-statistic) 0.000000②由上可知,模型的参数:斜率系数0.176124,截距为—154.3063③关于浙江省财政预算收入与全省生产总值的模型,检验模型的显著性:1)可决系数为0.983702,说明所建模型整体上对样本数据拟合较好。
2)对于回归系数的t检验:t(β2)=43.25639>t0.025(31)=2.0395,对斜率系数的显著性检验表明,全省生产总值对财政预算总收入有显著影响。
计量经济学第六章作业思考题:6.1 如何使用DW统计量来进行自相关检验?该检验方法的前提条件和局限性有哪些?答:(1)DW 检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951年提出的一种适用于样本容量大于等于15的检验自相关的方法,许多计量经济学和统计学计算机软件都可以计算出DW 值。
给定显著水平α,依据样本容量n和解释变量个数k’(不包括常数项),查D.W.分布表可得临界值(d统计量的上界d U和下界d L),当0<DW<d L时,表明存在一阶正自相关,而且正自相关的程度随DW向0的靠近而增强。
当d L<DW<d U时,表明为不能确定是否存在自相关。
当d U<DW<4-d U时,表明不存在一阶自相关。
当4-d U<DW<4-d L时,表明不能确定是否存在自相关。
当4-d L<DW<4时,表明存在一阶负自相关,而且负自相关的程度随DW向4的靠近而增强。
(2)DW检验的前提条件:<1>解释变量是非随机的(因此与随机扰动项不相关);<2>随机扰动项是一阶自回归形式,即u t=ρu t-1 +v t (v t满足古典假定);<3>线性模型的解释变量中不包含滞后的被解释变量,如不应出现下列形式:Y t =β1 +β2 X t +β 3 Y t-1 +u t;<4>截距项不为零,即只适用于有常数项的回归模型;<5>数据序列无缺失项,样本比较大。
(3)DW检验的局限性:<1>DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。
这时,只有增大样本容量或选取其他方法;<2>DW统计量的上、下界表要求n≥15, 这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断;<3> DW检验不适应随机误差项具有高阶序列相关的检验;<4> DW检验有运用的前提条件,只有符合这些条件DW检验才是有效的。
(完整word版)计量经济学总结第三版庞皓,推荐文档计量经济学第一章导论一节什么是计量经济学统计学,经济学,数学的结合二节研究步骤一、模型假定估计解释变量与被解释变量的关系,设置随机扰动项μ二、估计参数通过变量的样本观测值合理的估计总体模型的参数,是计量经济学的核心内容三、模型检验(1)经济意义检验,检验所估计的模型与经济理论是否相符(2)统计推断信息,检验参数估计值是否是抽样的偶然结果,需要运用数理统计中统计推断方法对模型及参数的统计可靠性作出说明(3)计量经济学检验,t检验和F检验检验模型是否符合计量经济学假定,如多重共线性,随机扰动项的自相关和异方差性(4)模型预测检验四、模型应用三节变量参数数据与模型一、变量经济变量:在不同的时间或空间有不同状态,回去不同的数值且可观测eg.居民家庭收入X和居民消费支出Y分类:(1)流量与存量(2)解释变量/自变量与被解释变量/因变量(3)内生变量(由模型所决定的变量,是模型求解的结果)和外生变量(由模型以外决定的变量)二、参数的估计所得到的参数估计值迎“尽可能接近总体参数真实值”原则三、计量经济学中应用的数据(1)时间序列数据(2)截面数据(3)面板数据(4)虚拟变量数据二章简单线性回归模型一节回归分析与回归函数一、相关分析与回归分析(一)经济变量之间的相关关系经济变量之间有两种关系,一种是确定性的函数关系,另一种是不确定的统计关系,也叫相关关系。
当一个或若干个变量x取一定值时,与之对应的另一个变量Y的值虽然不确定,但按照某种规律在一定范围内变化,称这种变量之间的关系为不确定的统计关系或相关关系。
分类(1)简单相关关系/多重相关关系(2)线性相关/非线性相关(3)正相关/负相关(4)完全相关/不相关(二)简单线性相关关系的度量1简单线性相关系数总体相关系数ρρ反应了总体两个变量X和Y的线性相关程度。
变量X和Y的样本相关系数通常用表示2相关系数特点(1)(2)相关系数至反应变量间线性相关程度,不能说明非线性关系(3)样本相关系数不是确定的值,二是随抽样变动的随机变量(三)回归分析相关分析:(1)分析是否存在相关关系(2)明确相关关系类型(3)激浪祥光关系密切程度回归分析用于具体测定变量之间相关关系的数量形式,是关于一个变量(被解释变量)对另一个变量(解释变量)依存关系的研究,用适当的数学模型近似的表达或估计变量之间平均变化关系二、总体回归函数将总体被解释变量Y的条件期望表现为解释变量X的函数,这个函数称为总体回归函数:若Y的总体条件期望是解释变量X的线性函数,可表示为关于线性的解释(1)模型就变量而言是线性的(2)模型就参数而言是线性的一般指第二个三、随机扰动项μ个别值总是分布在条件期望周围,而不是全在代表平均值轨迹的回归线上,零各个与条件期望的偏差为μ(表示对Y有影响但是没有纳入模型的诸多因素的综合影响)若总体回归函数是只有一个解释变量的线性函数,有有等式暗含的假设条件,也就是假设回归线通过Y的天健期望或条件均值引入随机扰动项的原因:(1)作为未知影响因素的代表(2)(3)(4)(5)(6)四、样本回归函数对于实际经济问题,由于总体包含的单位数太多,无法掌握所有单位的数值,总体回归函数虽然存在但往往未知,能做到的只是通过对样本观测获得的信息去顾及总体回归函数。
第一章导论第一节计量经济学的涵义和性质计量经济学是以一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技师,通过建立计量经济模型,定量分析经济变量之间的随机因果关系。
计量经济学是经济学的一个重要分支,以揭示经济活动中客观存在的数量关系的理论与方法为主要内容,其核心是建立计量经济学模型。
第二节计量经济学的内容体系及与其他学科的关系一、计量经济学与经济学、统计学、数理统计学学科间的关系计量经济学是经济理论、统计学和数学的综合。
经济学着重经济现象的定性研究,而计量经济学着重于定量方面的研究。
统计学是关于如何惧、整理和分析数据的科学,而计量经济学则利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。
数量统计各种数据的惧、整理与分析提供切实可靠的数学方法,是计量经济学建立计量经济模型的主要工具,但它与经济理论、经济统计学结合而形成的计量经济学则仅限于经济领域。
计量经济模型建立的过程,是综合应用理论、统计和数学方法的过程。
因此计量经济学是经济理论、统计学和数学三者的统一。
二、计量经济学的内容体系1、按范围分为广义计量经济学和狭义计量经济学。
2、按研究内容分为理论计量经济学和应用计量经济学。
理论计量经济学的核心内容是参数估计和模型检验。
应用计量经济学的核心内容是模型设定和模型应用。
第三节基本概念(4、5、7、8了解即可)1.经济变量:经济变量是用来描述经济因素数量水平的指标。
2.解释变量:解释变量也称自变量,是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
它对因变量的变动作出解释,表现为议程所描述的因果关系中的“因”。
3.被解释变量:被解释变量也称因变量或应变量,是作为研究对象的变量。
它的变动是由解释变量作出解释的,表现为议程所描述的因果关系的果。
4.内生变量:内生变量是由模型系统内部因素所决定的变量,表现为具有一定概率颁的随机变量,其数值受模型中其他变量的影响,是模型求解的结果。
第一章绪论1-14.计量经济模型中为何要包括随机误差项?简述随机误差项形成的原因。
答:由于客观经济现象的复杂性,以至于人们目前仍难以完全地透彻地了解它的全貌。
对于某一种经济现象而言,往往受到很多因素的影响,而人们在认识这种经济现象的时候,只能从影响它的很多因素中选择一种或若干种来说明。
这样就会有许多因素未被选上,这些未被选上的因素必然也会影响所研究的经济现象。
因此,由被选因素构成的数学模型与由全部因素构成的数学模型去描述同一经济现象,必然会有出入。
为使模型更加确切地说明客观经济现象,所以有必要引入随机误差项。
随机误差项形成的原因:①在解释变量中被忽略的因素;②变量观测值的观测误差;③模型的关系误差或设定误差;④其他随机因素的影响。
第二章 一元线性回归模型例1、令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。
生育率对教育年数的简单回归模型为μββ++=educ kids 10(1)随机扰动项μ包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。
解答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。
有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。
(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ 相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。
例2.已知回归模型μβα++=N E ,式中E 为某类公司一名新员工的起始薪金(元),N 为所受教育水平(年)。
随机扰动项μ的分布未知,其他所有假设都满足。
(1)从直观及经济角度解释α和β。
(2)OLS 估计量αˆ和βˆ满足线性性、无偏性及有效性吗?简单陈述理由。
第三章 多元线性回归模型学习辅导一、本章的基本内容(一)基本内容图3.1 第三章基本内容(二)本章的教学目标在现实的计量经济分析中,事实上影响被解释变量的因素不止一个,通常会有多个影响因素;另外,即使我们的分析目的是仅考察某一个因素对被解释变量的影响,但为了得到该因素对被解释变量的“净”影响,也需要将其他影响因素作为“控制变量”,使其以显性形式出现在模型中,以提高模型估计精度。
因此,在对现实经济问题进行计量经济分析时,通常需要建立包含两个及两个以上解释变量的计量模型,此类模型称为多元回归模型。
多元回归模型是在简单回归模型理论基础上的扩展,其建模的理论基础、基本思路、模型估计等与一元回归模型基本一致,只是因解释变量增多,从而带来一些新的内容,比如模型整体显著性检验(F 检验)、修正的可决系数(2R )以及解释变量之间多重共线性等问题。
本章的教学目标是:深刻理解建立多元回归模型的目的;掌握多元线性回归模型估计、检验的理论与方法;熟练掌握多元线性回归EViews 输出结果的解释。
二、重点与难点分析1.对多元线性回归模型参数意义的理解多元线性回归模型的参数与简单线性回归模型的参数有重要区别。
在多元线性回归模型中,解释变量对应的参数是偏回归系数,表达的是控制其他解释变量不变的条件下,该解释变量的单位变动对被解释变量平均值的“净”影响。
为了更深刻理解偏回归系数,可以两个解释变量的多元线性回归模型为例加以说明1。
例如,被解释变量Y 与解释变量2X 和3X 都有关,如果分别建立模型:多元线性回归: 12233i i i i Y X X u b b b =+++简单线性回归 : 1221i i i Y a a X u =++由于Y 与3X 有关,可以作回归:1332i i i Y b b X u =++,若用OLS 估计其参数,并计算残差213333ˆˆˆi i i i i e Y b b X y b x =--=-,这里的2i e 表示除去3i X 影响后的i Y 。
第二章练习题及参考解答2.1表2.9中是1992年亚洲各国人均寿命(Y)、按购买力平价计算的人均GDP(X1)、成人识字率(X2)、一岁儿童疫苗接种率(X3)的数据(1)分别分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系。
(2)对所建立的回归模型进行检验。
【练习题2.1 参考解答】(1)分别设定简单线性回归模型,分析各国人均寿命与人均GDP、成人识字率、一岁儿童疫苗接种率的数量关系:1)人均寿命与人均GDP 关系Y i 1 2 X1i u i估计检验结果:2)人均寿命与成人识字率关系3)人均寿命与一岁儿童疫苗接种率关系(2)对所建立的多个回归模型进行检验由人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命回归结果的参数t 检验值均明确大于其临界值,而且从对应的P 值看,均小于0.05,所以人均GDP、成人识字率、一岁儿童疫苗接种率分别对人均寿命都有显著影响.(3)分析对比各个简单线性回归模型人均寿命与人均GDP 回归的可决系数为0.5261 人均寿命与成人识字率回归的可决系数为0.7168 人均寿命与一岁儿童疫苗接种率的可决系数为0.5379相对说来,人均寿命由成人识字率作出解释的比重更大一些2.2为了研究浙江省财政预算收入与全省生产总值的关系,由浙江省统计年鉴得到以下数据:的显著性,用规范的形式写出估计检验结果,并解释所估计参数的经济意义(2)如果2011 年,全省生产总值为32000 亿元,比上年增长9.0%,利用计量经济模型对浙江省2011 年的财政预算收入做出点预测和区间预测(3)建立浙江省财政预算收入对数与全省生产总值对数的计量经济模型,. 估计模型的参数,检验模型的显著性,并解释所估计参数的经济意义【练习题2.2 参考解答】建议学生独立完成2.3 由12对观测值估计得消费函数为:(1)消费支出C的点预测值;(2)在95%的置信概率下消费支出C平均值的预测区间。
第一章导论第一节计量经济学的涵义和性质计量经济学是以一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技师,通过建立计量经济模型,定量分析经济变量之间的随机因果关系。
计量经济学是经济学的一个重要分支,以揭示经济活动中客观存在的数量关系的理论与方法为主要内容,其核心是建立计量经济学模型。
第二节计量经济学的内容体系及与其他学科的关系一、计量经济学与经济学、统计学、数理统计学学科间的关系计量经济学是经济理论、统计学和数学的综合。
经济学着重经济现象的定性研究,而计量经济学着重于定量方面的研究。
统计学是关于如何惧、整理和分析数据的科学,而计量经济学则利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。
数量统计各种数据的惧、整理与分析提供切实可靠的数学方法,是计量经济学建立计量经济模型的主要工具,但它与经济理论、经济统计学结合而形成的计量经济学则仅限于经济领域。
计量经济模型建立的过程,是综合应用理论、统计和数学方法的过程。
因此计量经济学是经济理论、统计学和数学三者的统一。
二、计量经济学的内容体系1、按范围分为广义计量经济学和狭义计量经济学。
2、按研究内容分为理论计量经济学和应用计量经济学。
理论计量经济学的核心内容是参数估计和模型检验。
应用计量经济学的核心内容是模型设定和模型应用。
第三节基本概念(4、5、7、8了解即可)1.经济变量:经济变量是用来描述经济因素数量水平的指标。
2.解释变量:解释变量也称自变量,是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
它对因变量的变动作出解释,表现为议程所描述的因果关系中的“因”。
3.被解释变量:被解释变量也称因变量或应变量,是作为研究对象的变量。
它的变动是由解释变量作出解释的,表现为议程所描述的因果关系的果。
4.内生变量:内生变量是由模型系统内部因素所决定的变量,表现为具有一定概率颁的随机变量,其数值受模型中其他变量的影响,是模型求解的结果。
5.外生变量:外生变量是由模型统计之外的因素决定的变量,不受模型内部因素的影响,表现为非随机变量,但影响模型中的内生变量,其数值在模型求解之前就已经确定。
6.滞后变量:滞后变量是滞后内生变量和滞后外生变量的合称,前期的内生变量称为滞后内生变量;前期的外生变量称为滞后外生变量。
7.前定变量:通常将外生变量和滞后变量合称为前定变量,即是在模型求解以前已经确定或需要确定的变量。
8.控制变量:控制变量是为满足描绘和深入研究经济活动的需要,在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量,它一般属于外生变量。
9.计量经济模型:计量经济模型是为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型,是以数学形式对客观经济现象所作的描述和概括。
第四节计量经济学的研究步骤一、建立理论模型。
建立计量经济学模型的第一步,包括了选择变量,确定变量间的数学关系,以及确定统计指标并收集整理数据。
二、模型参数的估计。
是理论计量经济学模型的一个核心内容,涉及对模型的识别、估计方法的选择等多个方面。
模型特性不同,所采用的估计参数方法就有所不同。
若满足古典假定,可以采用普通最小二乘法(OLS)等方法;若模型中存在异方差性,可以选用加权最小二乘法(WLS)等方法;若模型中存在自相关性,可以选用广义差分法、广义最小二乘法(GLS)等方法;若模型中存在多重共线性,可以选用逐步回归法、主成分回归法等方法。
三、模型的检验。
(1)经济意义检验。
根据一定的经济理论或人们的经济实践经验判断所估计出的参数的的符号和数值是否合理。
(2)统计检验。
利用数理统计方法,依据统计推断原理,对参数估计的可靠程度、观察数据的拟合程度等进行检验,主要包括:拟合优度检验、方程的显著性检验和变量的显著性检验。
(3)计量经济学检验。
统计显著性检验是在一定的假设条件下进行的,若假设条件被违背,统计显著性检验则失效,因此还必须对这些假设是否成立进行检验,当假设成立时,上述统计检验结果才是有效的。
对于单方程计量经济模型,计量经济学检验主要包括异方差检验、自相关检验和多重共线性检验。
对于联立计量经济学模型,计量经济学检验还包括模型的识别性检验。
(4)模型预测检验。
统计显著性检验和计量经济学检验是利用样本期内的数据进行检验的,预测性检验是利用样本期外的数据检验模型参数估计量的稳定性以及模型对样本期以外经济客观事实的近似描述能力。
预测性检验只是在建模的目的主要用于经济预测时才进行。
四、计量经济学模型的应用。
主要涉及四个方面:结构分析、经济预测、政策评价,以及检验与发展经济理论。
结构分析就是对经济现象中变量间关系的研究;经济预测包括短期预测与中长期预测;政策评价主要指研究不同的政策对经济运行的影响,并从中选择相对适当的政策的一种模拟性试验;检验与发展经济理论则是通过实际数据考察理论的适用性并发展新的适用的经济学理论。
第二章 简单线性回归模型第一节 古典回归模型一、相关分析和回归分析的区别(了解)1.变量性质:相关分析中都是随机变量且关系对等回归分析自变量与因变量的关系不对等的, 自变量是确定性变量,而因变量是随机变量。
;2.分析方法:相关分析通过图表法和相关系数;回归分析通过建立回归方程。
3.分析目的:相关分析是判定变量之间相关的方向和关系的密切程度;回归分析是分析变量之间的数量依存关系,并根据自变量的数值变化去推测因变量数值变化。
二、回归模型1、总体回归模型。
i i i bx a x f y E +==)()(。
回归分析的主要任务就是设法求出总体回归参数的具体数值,进而利用总体回归方程描述和分析总体的平均变化规律。
2、样本回归模型。
ii x b a y ˆˆˆ+=。
回归分析的主要内容可以概括成:(1)根据样本观察值确定样本回归方程;(2)检验样本回归方程对总体回归方程的近似程度;(3)利用样本回归方程分析总体的平均变化规律。
三、回归模型的随机设定1.随机误差项。
在i i i x b b y ε++=10中,i ε表示其他多种因素的综合影响,称为随机扰动项、随机项或误差项。
它是一个随机变量,其值是不可观测的,可正可负。
2.随机误差产生的原因:⑴宏观现象本身的随机性。
⑵模型本身的局限性。
⑶模型函数形式的设定误差。
⑷数据的测量与归并误差。
⑸随机因素的影响(如自然灾害等)。
四、古典回归模型的基本假定利用样本数据估计回归模型中的参数时,通常需要对模型的随机误差项和解释变量的特性事先做些假定。
回归模型的基本假定有:1.零均值假定:0)(=i E ε,即随机误差项的平均值为零。
2.同方差假定:2)(σε=i D (常数)。
这一假定表明,各随机误差项的离散程度(或波动幅度)是相同的。
3.非自相关假定:0),cov(=j i εε,),,2,1,(n j i j i =≠。
4.解释变量与随机误差项不相关假定: 0),cov(=i i x ε ,n i ,,2,1 =。
5.正态性假定。
即u i ~N(0,2i σ)。
6.无多重共线性假定。
即解释变量之间不存在完全的线性关系,这样才能分析每个解释变量各自对i y 的影响。
第二节 一元线性回归模型的参数估计设给定的一元线性回归模型i x b b y i ε++=10 ,假定10ˆ,ˆb b 分别为参数10,b b 的估计量,则有样本回归方程ii x b b y 10ˆˆˆ+=。
根据最小二乘原理,参数估计值10ˆ,ˆb b 应使残差平方和Min x b b y y y e b b Q ii i i i =--∑=-∑=∑=210221,0)ˆˆ()ˆ()ˆˆ( 根据微分学中的极值原理,Q 要达到最小,必须使上式对10ˆ,ˆb b 的一阶偏导数为零。
解方程组得:221)(ˆi i i i i i x x n y x y x n b ∑-∑∑-∑=x b y x b y nb i i 110ˆ)ˆ(1ˆ-=∑-∑= 由于10ˆ,ˆb b 是根据最小二乘法得到的,故称10ˆ,ˆb b 为回归参数10,b b 的最小二乘估计量,简记成OLS 估计量。
四、最小二乘估计的性质1、参数估计量的评价标准(1)无偏性:设βˆ是参数β的估计量,如果E(βˆ)= β ,则称βˆ是β的无偏估计。
无偏性保证了参数估计值是在参数真实值(简称参数真值)的左右波动,并且“平均位置”就是参数的真值 。
(2)有效性(最小方差性):设βˆ,*ˆβ均为参数的无偏估计量,若D(βˆ)≤D(*ˆβ),则称 βˆ比*ˆβ有效;如果在β的所有无偏估计量中, D(βˆ)最小,则称βˆ为有效估计量。
有效性衡量了参数估计值与参数真值平均离散程度大小。
(3)一致性:这是估计量的一个大样本性质,如果随着样本容量的增加,估计量βˆ越来越接近于真值,则称βˆ为β的一致估计。
严格地说,βˆ是依概率收敛于β,即:1)ˆ(lim =<-∞→δββP n 。
其中δ为一个任意小的正数。
2、高斯—马尔可夫定理在古典回归模型的若干假定成立的情况下,最小二乘估计是所有线性无偏估计量中的有效估计量。
这就是著名的高斯—马尔可夫定理,它表明:最小二乘估计与用其它方法得到的任何线性无偏估计量相比,具有方差最小的特性。
所以称OLS 估计为“最佳线性无偏估计量”(Best Linear Unbiased Estimator — BLUE ),这也是最小二乘估计被广泛使用的原因之一。
3.OLS 估计的几个重要性质(1)剩余项i e 的均值为零。
(2)OLS 回归线通过样本均值点(x ,y )。
(3)估计值i yˆ的均值等于实际观测i y 的均值y 。
(4)被解释变量估计值i yˆ与剩余项 i e 不相关,即cov (i y ˆ,i e )=0。
(5)解释变量i x 与剩余项i e 不相关,即cov (i x ,i e )=0。
五、回归模型的置信区间1、OLS 估计的概率分布0ˆb ,1ˆb 分别是y 的线性组合函数,故0ˆb ,1ˆb 的概率分布取决于y 。
而y 是正态分布的,正态随机变量的线性组合仍服从正态分布,其分布密度由其均值和方差唯一决定。
)/,(~ˆ211xxL b N b σ;)/,(~ˆ2200xx nL x b N b ∑σ 2、参数的估计误差参数的估计误差即估计值i b ˆ与真值i b 的偏差。
由于ib ˆ是一个随机变量,故误差大小也是一个随机变量,因此考虑概率意义下的平均误差。
参数估计量的平均误差为:xx L b D b b E /)ˆ()ˆ(21211σ==- 由于随机误差项i ε的方差2σ通常是未知的,在实际计算中2σ用其无偏估计量)2/(ˆ22-∑=n e i σ代替。
系数的标准差为: xx i xx L n e L b s )2(ˆ)ˆ(221-∑==σ;xxi i L n n x e b s )2())(()ˆ(220-∑∑= 3、参数的置信区间在α-1的置信水平下1b 的置信区间为:)]ˆ(ˆ),ˆ(ˆ[12/112/1b s t b b s t b εα+-,即以α-1的概率保证回归系数位于该区间。