计量经济学重点整理
- 格式:docx
- 大小:40.42 KB
- 文档页数:2
计量经济学考试重点整理第一章:P1:什么是计量经济学?由哪三组组成?定义:“用数学方法探讨经济学可以从好几个方面着手,但任何一个方面都不能和计量经济学混为一谈。
计量经济学与经济统计学绝非一码事;它也不同于我们所说的一般经济理论,尽管经济理论大部分具有一定的数量特征;计量经济学也不应视为数学应用于经济学的同义语。
经验表明,统计学、经济理论和数学这三者对于真正了解现代经济生活的数量关系来说,都是必要的,但本身并非是充分条件。
三者结合起来,就是力量,这种结合便构成了计量经济学。
”P9:理论模型的设计主要包含三部分工作,即选择变量,确定变量之间的数学关系,拟定模型中待估计参数的数值范围。
P12:常用的样本数据:时间序列,截面,虚变量数据P13:样本数据的质量(4点)完整性;准确性;可比性;一致性P15-16:模型的检验(4个检验)1、经济意义检验2、统计检验拟合优度检验总体显著性检验变量显著性检验3、计量经济学检验异方差性检验序列相关性检验共线性检验4、模型预测检验稳定性检验:扩大样本重新估计预测性能检验:对样本外一点进行实际预测P16计量经济学模型成功的三要素:理论、方法和数据。
P18-20:计量经济学模型的应用1、结构分析经济学中的结构分析是对经济现象中变量之间相互关系的研究.结构分析所采用的主要方法是弹性分析、乘数分析与比较静力分析。
计量经济学模型的功能是揭示经济现象中变量之间的相互关系,即通过模型得到弹性、乘数等。
2、经济预测计量经济学模型作为一类经济数学模型,是从用于经济预测,特别是短期预测而发展起来的。
计量经济学模型是以模拟历史、从已经发生的经济活动中找出变化规律为主要技术手段。
对于非稳定发展的经济过程,对于缺乏规范行为理论的经济活动,计量经济学模型预测功能失效。
模型理论方法的发展以适应预测的需要。
3、政策评价政策评价是指从许多不同的政策中选择较好的政策予以实行,或者说不同的政策对经济目标所产生的影响的差异。
计量经济学复习知识点重点难点计量经济学知识点第一章导论1、计量经济学的研究步骤:模型设定、估计参数、模型检验、模型应用。
2、计量经济学是统计学、经济学和数学的结合。
3、计量经济学作为经济学的一门独立学科被正式确立的标志:1930年12月国际计量经济学会的成立。
4、计量经济学是经济学的一个分支学科。
第二章简单线性回归模型1、在总体回归函数中引进随机扰动项的原因:①作为未知影响因素的代表;②作为无法取得数据的已知因素的代表;③作为众多细小影响因素的综合代表;④模型的设定误差;⑤变量的观测误差;⑥经济现象的内在随机性。
2、简单线性回归模型的基本假定:①零均值假定;②同方差假定;③随机扰动项和解释变量不相关假定;④无自相关假定;⑤正态性假定。
3、OLS回归线的性质:①样本回归线通过样本均值;②估计值的均值等于实际值的均值;③剩余项ei的均值为零;④被解释变量的估计值与剩余项不相关;⑤解释变量与剩余项不相关。
4、参数估计量的评价标准:无偏性、有效性、一致性。
5、OLS估计量的统计特征:线性特性、无偏性、有效性。
6、可决系数R2的特点:①可决系数是非负的统计量;②可决系数的取值范围为[0,1];③可决系数是样本观测值的函数,可决系数是随抽样而变动的随机变量。
第三章多元线性回归模型1、多元线性回归模型的古典假定:①零均值假定;②同方差和无自相关假定;③随机扰动项和解释变量不相关假定;④无多重共线性假定;⑤正态性假定。
2、估计多元线性回归模型参数的方法:最小二乘估计、极大似然估计、矩估计、广义矩估计。
3、参数最小二乘估计的性质:线性性质、无偏性、有效性。
4、可决系数必定非负,但是根据公式计算的修正的可决系数可能为负值,这时规定为0。
5、可决系数只是对模型拟合优度的度量,可决系数越大,只是说明列入模型中的解释变量对被解释变量的联合影响程度越大,并非说明模型中各个解释变量对被解释变量的影响程度也大。
6、当R2=0时,F=0;当R2越大时,F值也越大;当R2=1时,F→∞。
计量经济学知识点总结计量经济学是一门融合了经济学、统计学和数学的交叉学科,它通过建立经济模型,运用统计方法对经济数据进行分析,以揭示经济变量之间的关系和规律。
以下是对计量经济学中一些重要知识点的总结。
一、回归分析回归分析是计量经济学的核心方法之一。
简单线性回归模型表示为:$Y =\beta_0 +\beta_1 X +\epsilon$,其中$Y$是被解释变量,$X$是解释变量,$\beta_0$是截距项,$\beta_1$是斜率系数,$\epsilon$是随机误差项。
在进行回归分析时,需要对模型进行估计。
常用的估计方法是最小二乘法(OLS),其基本思想是使残差平方和最小,从而确定参数的估计值。
通过估计得到的回归方程可以用于预测和解释变量之间的关系。
回归分析还需要进行一系列的检验,包括拟合优度检验(如判定系数$R^2$)、变量的显著性检验($t$检验)和方程的显著性检验($F$检验)等。
二、多重共线性多重共线性指的是解释变量之间存在较强的线性关系。
这可能导致参数估计值不稳定、方差增大、$t$检验失效等问题。
检测多重共线性的方法有多种,如计算解释变量之间的相关系数、方差膨胀因子(VIF)等。
解决多重共线性的方法包括剔除一些相关变量、增大样本容量、使用岭回归或主成分回归等方法。
三、异方差性异方差性是指随机误差项的方差不是常数,而是随解释变量的变化而变化。
异方差性会影响参数估计的有效性和假设检验的可靠性。
常用的检测方法有图形法(如绘制残差平方与解释变量的关系图)、怀特检验等。
解决异方差性的方法有加权最小二乘法(WLS)等。
四、自相关性自相关性是指随机误差项在不同观测值之间存在相关关系。
自相关性会导致参数估计值有偏、无效,以及$t$检验和$F$检验不可靠。
常用的检测方法有杜宾沃森(DW)检验等。
解决自相关性的方法有广义差分法等。
五、虚拟变量虚拟变量用于表示定性变量,如性别、季节等。
在模型中引入虚拟变量可以更准确地反映经济现象。
计量经济学重点知识整理计量经济学是经济学中重要的一个分支,主要研究经济现象和经济理论的数理化方法。
本文将整理计量经济学中的重点知识,帮助读者系统地理解和掌握这门学科。
一、计量经济学简介计量经济学是运用统计方法和经济模型对经济问题进行定量分析的学科。
它利用数理统计学的工具,根据经济理论和实证研究的需要,对经济现象进行测度和解释。
计量经济学方法的特点是同时考虑了外生性和内生性变量之间的关系,能够揭示其中的因果关系。
二、计量经济学的基本原理1. 线性回归模型线性回归模型是计量经济学中最基本的模型之一,用于描述因变量与自变量之间的线性关系。
常见的线性回归模型有简单线性回归模型和多元线性回归模型。
对于简单线性回归模型,可以通过最小二乘法估计模型参数,求得最佳拟合曲线。
而多元线性回归模型则通过矩阵运算推导出参数的估计公式。
2. 假设检验在计量经济学中,假设检验是一种重要的统计方法,用于验证经济理论的假设。
常见的假设检验包括 t 检验、F 检验和卡方检验等。
通过构建原假设和备择假设,并计算相应的统计量,可以对经济理论提出的假设进行检验,从而得出结论。
3. 时间序列分析时间序列分析是计量经济学中的一个重要分支,用于研究随时间变化的经济现象。
常见的时间序列分析方法包括自相关函数(ACF)和偏自相关函数(PACF)的计算,以及平稳性检验、白噪声检验、单位根检验等。
这些方法可以帮助我们了解时间序列数据的性质,并进行有效的预测。
4. 面板数据分析面板数据是计量经济学中常用的一种数据类型,指同一时期内多个个体或单位的多个观测数据。
面板数据分析方法可以更好地解决普通截面数据和时间序列数据的缺陷,提高分析的效果。
常见的面板数据模型包括固定效应模型和随机效应模型,通过估计模型参数,可以得到各个因素对经济变量的影响。
三、计量经济学的应用领域1. 消费者行为分析计量经济学方法可以应用于消费者行为的分析,通过对消费者支出和收入等因素的测度和分析,揭示消费者行为背后的规律。
计量经济学重点引言计量经济学是经济学的一个重要分支,旨在通过使用统计学和数学方法来对经济理论进行实证分析。
它的核心目标是通过利用经济数据和数学经济理论的相互关系,解释经济现象,并提供经济政策的科学依据。
本文将介绍计量经济学的一些重要概念和方法,用以帮助读者更好地理解和应用计量经济学。
一、回归分析回归分析是计量经济学中最基本的统计方法之一。
它用于研究因果关系和预测变量之间的关系。
回归分析的核心思想是找到一个最佳的函数来解释因变量和自变量之间的关系。
在回归分析中,因变量是我们希望解释或预测的变量,而自变量是我们认为与因变量相关的变量。
通过建立数学模型并对数据进行估计,我们可以得到最佳的函数来解释因变量和自变量之间的关系。
常用的回归模型包括线性回归模型、多元回归模型和非线性回归模型等。
二、时间序列分析时间序列分析是计量经济学中研究时间序列数据的一种方法。
时间序列数据是按照时间顺序排列的观测值序列,如股票价格、GDP增长率等。
时间序列分析的目标是建立一个统计模型来描述数据的变化趋势和周期性,并进行预测。
时间序列分析涉及到许多重要的概念,包括平稳性、滞后项、自相关性和滑动平均等。
通过对时间序列数据的建模和分析,可以揭示数据背后的规律和趋势,为经济决策提供重要的参考。
三、计量经济学中的假设检验在计量经济学中,假设检验是一个非常重要的工具,用于验证经济模型的有效性和推断。
假设检验的核心思想是根据样本数据对经济理论中的假设进行检验。
假设检验通常包括一个原假设和一个备择假设。
原假设是对经济理论的一个特定假设进行的陈述,备择假设是对原假设的一个否定陈述。
通过计算统计量和确定显著性水平,可以对原假设做出决策,判断是否拒绝原假设。
一些常见的假设检验方法包括t检验、F检验和卡方检验等。
通过假设检验,我们可以评估经济理论的有效性,并对经济政策和决策提供科学依据。
四、面板数据分析面板数据分析是计量经济学中应用最广泛的方法之一,用于处理同时包含多个数据点和时间点的数据集。
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
计量经济学重点知识整理1一般性定义计量经济学是以经济理论和经济数据的事实为依据,运用数学和统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究的主体〔动身点、回宿、核心〕:经济现象及数量变化规律研究的工具〔手段〕:模型数学和统计方法必须明确:方法手段要服从研究对象的实质特征〔与数学不同〕,方法是为经济咨询题效劳2注重:计量经济研究的三个方面理论:即讲明所研究对象经济行为的经济理论——计量经济研究的根底数据:对所研究对象经济行为瞧测所得到的信息——计量经济研究的原料或依据方法:模型的方法与估量、检验、分析的方法——计量经济研究的工具与手段三者缺一不可3计量经济学的学科类型●理论计量经济学研究经济计量的理论和方法●应用计量经济学:应用计量经济方法研究某些领域的具体经济咨询题4区不:●经济理论重在定性分析,并不对经济关系提供数量上的具体度量●计量经济学对经济关系要作出定量的估量,对经济理论提出经验的内容5计量经济学与经济统计学的关系联系:●经济统计侧重于对社会经济现象的描述性计量●经济统计提供的数据是计量经济学据以估量参数、验证经济理论的全然依据●经济现象不能作实验,只能被动地瞧测客瞧经济现象变动的既成事实,只能依靠于经济统计数据6计量经济学与数理统计学的关系联系:●数理统计学是计量经济学的方法论根底区不:●数理统计学是在标准假定条件下抽象地研究一般的随机变量的统计规律性;●计量经济学是从经济模型动身,研究模型参数的估量和推断,参数有特定的经济意义,标准假定条件经常不能满足,需要建立一些专门的经济计量方法3、计量经济学的特点:计量经济学的一个重要特点是:它自身并没有固定的经济理论,而是依据其它经济理论,应用计量经济方法将这些理论数量化。
4、计量经济学什么缘故是一门单独的学科计量经济学是经济理论、数理经济、经济统计与数理统计的混合物。
1、经济理论所作的陈述或假讲大多数是定性性质的,计量经济学对大多数经济理论给予经验内容。
1、经济变量:用来描述经济因素数量水平的指标。
2、解释变量:用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
它对因变量的变额为发热所引5动做出解释。
3、被解释变量:是作为研究对象的变量。
它的变动是由解释变量做出解释的4、控制变量:在计量经济模型中人为设置的反映政策要求、决策者意愿、经济系统运行条件和状态等方面的变量。
5、计量经济模型:为了研究分析某个系统中经济变量之间的数量关系而采用的随机代数模型。
6、相关关系:如果一个变量y 的取值受另一个变量或另一组变量的影响,但并不由它们惟一确定,则y 与这个变量或这组变量之间的关系就是相关关系。
7、最小二乘法:用使估计的剩余平方和最小的原则确定样本回归函数的方法。
8、拟合优度:样本回归直线与样本观测数据之间的拟合程度。
9、残差:样本回归方程的拟合值与观测值的误差。
10、显著性检验:利用样本结果,来证实一个虚拟假设的真伪的一种检验程序。
11、偏相关系数:在Y 、X 1、X 2三个变量中,当X 1 既定时,表示Y 与X 2之间相关关系的指标。
12、异方差性:在线性回归模型中,如果随机误差项的方差不是常数,即对不同的解释变量观测值彼此不同,则称随机项U1具有异方差性。
13、序列相关性:对于模型01122i i k ki i y x x x i ββββμ=+++++… 1,2,,i n =…随机误差项互相独立的基本假设表现为(,)0i j Cov μμ= ,,1,2,,i j i j n ≠=…(1分)如果出现 (,)0i j Cov μμ≠ ,,1,2,,i j i j n ≠=…即对于不同的样本点,随机误差项之间不再是完全互相独立,而是存在某种相关性,则认为出现了序列相关性。
14、自回归模型:t t t y y μρ+=-115、广义最小二乘法:是最有普遍意义的最小二乘法,普通最小二乘法和加权最小二乘法是它的特例。
16、相关系数:度量变量之间相关程度的一个系数,一般用ρ表示。
2ˆσ1.同方差、异方差㈠同方差:回归模型中的随机误差项的方差相同①由于假定了X 值(解释变量)是给定的或非随机的,Y 的变异仅来源于u(扰动误差项).因此,给定的X i ,Y i 的方差与U i 的方差相同.简言之, Y i 与U i 的条件方差相同,即σ2.②假定扰动误差项U i 的方差为常数,或同方差,即var(U i )= σ2.该假定表明,与给定X 相对应的每个Y的条件分布具有同方差,即每个Y 值以相同的方差分布在其均值周围.㈡异方差:①定义:模型误差项随观察值的不同而变化.var(U i )= σi 2≠常数;②研究发现,异方差问题多存在于截面数据而非时间序列数据.在截面数据中,处理的是某个时点上的样本,例如个体消费者或家庭/企业/行业/州县市.且这些样本规模不同,如小/中/大公司,低/中/高收入,即可能存在规模效应;③如果CLRM 其他假定保持不变,放松同方差假定,异方差则有如下后果:⑴OLS 估计量仍是线性的/无偏的/不再具有最小方差性,即不再有效的,无论样本大小,OLS 估计量都不再是最优线性无偏估计量.⑵OLS 估计量的方差通常是有偏的.OLS 高估了估计量的真实偏差,产生正的偏差;低估则负偏差.⑶偏差的产生是由于即不再是真实σ2的无偏估计量.⑷建立在t 分布和F 分布之上的的置信区间和假设检验是不可靠的.沿用传统的假设检验方法可能得出错误结论.④检验异方差方法:⑴图形法:残差平方图,通常检验回归模型是否符合经典线性假设的第一步⑵帕克检验⑶格莱泽检验:⑵⑶将图形正规化,其通过假设解释变量同误差项之间的关系来检验模型中是否存在异方差问题⑷怀特的一般异方差检验:用普通最小二乘法估计回归方程,做辅助回归,求辅助回归方程的R 2值,χ2值超过临界值或P 值很低,则拒绝零假设:不存在异方差.⑤异方差的补救措施:⑴当σi 2已知时,加权最小二乘法⑵当σi 2未知时,情形1误差方差与X i 成比例用平方根变换,情形2误差方差与X i 2成比例用OLS 法估计方程⑶重新设定模型.2.完全多重共线性(近似)㈠完全多重共线性:是指两个或两个以上解释变量之间存在多个精确的线性关系.①当解释变量之间完全线性相关或完全多重共线性时,不可能得到所有参数的唯一估计值,因而也就不能根据样本进行任何统计推断(即假设检验)。
计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。
一、含义:多重共线性:对于解释变量 ,如果存在不全为0的数 ,使得 则称解释变量 之间存在着完全的多重共线性。
或者 异方差性:如果对于模型中随机误差项Ui 有: 则称Ui 具有异方差性。
自相关:是指总体回归模型的随机误差项之间存在相关关系。
即不同观测点
上的误差项彼此相关。
可以表示为:
造成的后果:不完全的多重共线性:(1)OLS 估计量仍保持BLUE 的性质(2)假设检验容易作出错误的判断(3)可能造成可决系数较高,但对各个参数单独的 t 检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。
异方差性和自相关:(1)OLS 估计量仍然是线性无偏的,但不再是有效的,即方差不再是最小的。
(2) T 检验和F 检验失效。
检验方法:多重共线性:(1)简单相关系数检验法(如果每两个解释变量的简单相关系数比较高,如果大于0.8则可以认为存在着严重的多重共线性.但此种方法只是充分条件而不是必要条件,也需要同时检查偏相关系数) (2)方差扩大(膨胀)因子法(3)直观判断法(当增加一个或者剔除一个解释变量改变一个观测值时,回归参数的估计值发生较大变化;从定性分析一些重要的解释变量的回归系数的标准误差较大,在回归方程没有通过显著性检验;有些解释变量回归系数所带正负号与定性结果违背时;相关矩阵种自变量之间的相关系数较大时都可能存在多重共线性
一些重要的解释变量在回归方程中没有通过显著性检验,同时R2很高(或F 检验显著),即t 检验和F 检验的结果相矛盾,或解释变量的回归系数所带正负号与定性分析结果违背时,模型可能存在严重的多重共线性。
(4)逐步回归法。
异方差性:(1)图示检验法(2)Goldfeld-Quanadt 检验作用:检验递增性(或递减性)异方差。
(3)White 检验检验步骤1)提出假设2)构造辅助回归方程 3)构造统计量并计算统计量的值,构造并计算统计量nR ²。
R ²为辅助回归的可决系数,n 为样本容量。
4)检验在零假设成立下,有nR ²渐进服从自由度为P 的X ²分布。
给定显著性水平阿尔法,查X ²分布表得临界值,如果nR ²>X ²(P),则拒绝原假设,表明模型中随机误差存在异方差 。
特点:不仅能够检验异方差的存在性,同时在多变量的情况下,还能判断出是哪一个变量引起的异方差。
(4)ARCH 检验(5)Glejser 检验以上方法的共同点是:基于不同的假设分析随机扰动项的方差与解释变量之间的相关性,以判断是否存在异方差。
自相关:(1)图示检验法(2)DW 检验法1)DW 检验法的前提条件(解释变量X 为非随机,随机误差项为一阶自回归形式,线性模型的解释变量种不包含滞后的被解释变量,截距项不为零,数据序列无缺失项)、缺点和局限性(有两个不能确定的区域,一旦DW 值落在这两个区域就无法判断,DW 统计上下界要求n 大于等于15样本如果再小就很难做出比较正确的判断,不适应随机误差项具有高阶序列相关的检验)2)DW 检验决策规则3)DW 检验步骤:提出假设: 构造的DW 统计量与的关系 计算DW 统计量的取值:检验:根据样本容量和解释变量的数目K(不包括常数项)查DW 分布表,得临界值dw 和du ,然后根据检验准则考察计算得到的DW 值,以决定模型的自相关状态。
补救方法:多重共线性:1)剔除变量法2)增大样本容量3)变换模型形式4)利用非样本先验信息5)横截面数据与时序数据并用6)变量变换7)逐步回归法。
异方差性:(1)模型变换法变换模型时,
(2)加权最小二乘法基本思想、权数序列的选取(加权之后选取效果最好的,选取t 值最显著的权数数列)。
(3)模型的对数变换。
自相关:(1)广义差分法 (2)一阶差分法 (3)科克伦-奥克特迭代法(4)德宾两步法
231,,,,k X X X
k λλλ...,21122330 (i 1, 2,,n)i i k ki X
X X λλλλ++++==231,,,,k X X
X ()Rank k <X 2Var(),1,2,3,...,i i u i n σ==j i u u Cov j i ≠≠,0),(0261H 0,H 2,,3,...,6
j :=...==:j ααα(=)不全为零0H :0ρ=0:1≠ρH
)ˆ1(2ρ-≈DW -112-1-1-=(1-)+(-)+-t t t t t t Y Y X X u u ρβρβρρ2-1=+-t t t t Y X u u β∆∆
基本假定:(1)对模型和变量的假定:假定模型设定是正确的;假定解释变量Xi是确定性变量,是非随机的或Xi是随机的但与Ui不相关(2)基本假定:①零均值假定(在给定解释变量Xi的条件下,随机扰动项Ui的条件期望为零);②同方差假定(对于每一个Xi,Ui 的条件方差等于某一个常数σ2);③屋子相关假定(Ui的逐次值不相关);④随机扰动项Ui 与解释变量Xi不相关;⑤正态性假定(假定Ui服从期望为零,方差为σ2的正态分布);⑥无多重共线性假定。