第1章 计量经济学的性质与经济数据
- 格式:doc
- 大小:148.00 KB
- 文档页数:12
《计量经济学导论》考研伍德里奇考研复习笔记二第1章计量经济学的性质与经济数据1.1 复习笔记一、什么是计量经济学计量经济学是以一定的经济理论为基础,运用数学与统计学的方法,通过建立计量经济模型,定量分析经济变量之间的关系。
在进行计量分析时,首先需要利用经济数据估计出模型中的未知参数,然后对模型进行检验,在模型通过检验后还可以利用计量模型来进行预测。
在进行计量分析时获得的数据有两种形式,实验数据与非实验数据:(1)非实验数据是指并非从对个人、企业或经济系统中的某些部分的控制实验而得来的数据。
非实验数据有时被称为观测数据或回顾数据,以强调研究者只是被动的数据搜集者这一事实。
(2)实验数据通常是通过实验所获得的数据,但社会实验要么行不通要么实验代价高昂,所以在社会科学中要得到这些实验数据则困难得多。
二、经验经济分析的步骤经验分析就是利用数据来检验某个理论或估计某种关系。
1.对所关心问题的详细阐述问题可能涉及到对一个经济理论某特定方面的检验,或者对政府政策效果的检验。
2构造经济模型经济模型是描述各种经济关系的数理方程。
3经济模型变成计量模型先了解一下计量模型和经济模型有何关系。
与经济分析不同,在进行计量经济分析之前,必须明确函数的形式,并且计量经济模型通常都带有不确定的误差项。
通过设定一个特定的计量经济模型,我们就知道经济变量之间具体的数学关系,这样就解决了经济模型中内在的不确定性。
在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型构造的细节。
一旦设定了一个计量模型,所关心的各种假设便可用未知参数来表述。
4搜集相关变量的数据5用计量方法来估计计量模型中的参数,并规范地检验所关心的假设在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。
三、经济数据的结构1横截面数据(1)横截面数据集,是指在给定时点对个人、家庭、企业、城市、州、国家或一系列其他单位采集的样本所构成的数据集。
第一章:绪论1.计量经济学的学科属性、计量经济学与经济学、数学、统计学的关系;2.计量经济研究的四个基本步骤(1)建立模型(依据经济理论建立模型,通过模型识别、格兰杰因果关系检验、协整关系检验建立模型);(2)估计模型参数(满足基本假设采用最小二乘法,否则采用其他方法:加权最小二乘估计、模型变换、广义差分法等);(3 )模型检验:经济意义检验(普通模型、双对数模型、半对数模型中的经济意义解释,见例1、例2 ),统计检验(T检验,拟合优度检验、F检验,联合检验等);计量经济学检验(异方差、自相关、多重共线性、在时间序列模型中残差的白噪声检验等);(4 )模型应用。
例1:在模型中,y某类商品的消费支出,x收入,P商品价格,试对模型进行经济意义检验,并解释A"》的经济学含义。
In X = 0.213 +0.25 In 一0.31£其中参数卩'",都可以通过显著性检验。
经济意义检验可以通过(商品需求与收入正相关、与商品价格负相关\商品消费支出关于收入的弹性为0.25 ( 1心/畑)=0.251】心/仏));价格增加一个单位,商品消费需求将减少31%。
例2 :硏究金融发展与贫富差距的关系,认为金融发展先使贫富差距加大(恶化), 尔后会使贫富差距降<氐(好转),成为倒U型。
贫富差距用GINI系数表示,金融发展用(贷款余额/存款总额)表示。
回归结果G/^VZ r =2.34 + 0.641;-1.29x;/模型参数都可以通过显著性检验。
在X的有意义的变化范围内,GINI系数的值总是大于1 ,细致分析后模型变的毫无意义;同样的模型还有:GINI系数的值总是为负= —13.34 + 7.12 兀一14.31#O3.计量经济学中的一些基本概念数据的三种类型:横截面数据、时间序列数据、面板数据;线性模型的概念;模型的解释变量与被解释变量,被解释变量为随机变量(如果—个变量为随机变量,并与随机扰动项相关,这个变量称为内生变量),被解释变量为内生变量,有些解释变量也为内生变量。
第1章计量经济学的性质与经济数据1.1复习笔记考点一:计量经济学★1计量经济学的含义计量经济学,又称经济计量学,是由经济理论、统计学和数学结合而成的一门经济学的分支学科,其研究内容是分析经济现象中客观存在的数量关系。
2计量经济学模型(1)模型分类模型是对现实生活现象的描述和模拟。
根据描述和模拟办法的不同,对模型进行分类,如表1-1所示。
(2)数理经济模型和计量经济学模型的区别①研究内容不同数理经济模型的研究内容是经济现象各因素之间的理论关系,计量经济学模型的研究内容是经济现象各因素之间的定量关系。
②描述和模拟办法不同数理经济模型的描述和模拟办法主要是确定性的数学形式,计量经济学模型的描述和模拟办法主要是随机性的数学形式。
③位置和作用不同数理经济模型可用于对研究对象的初步研究,计量经济学模型可用于对研究对象的深入研究。
考点二:经济数据★★★1经济数据的结构(见表1-3)2面板数据与混合横截面数据的比较(见表1-4)考点三:因果关系和其他条件不变★★1因果关系因果关系是指一个变量的变动将引起另一个变量的变动,这是经济分析中的重要目标之计量分析虽然能发现变量之间的相关关系,但是如果想要解释因果关系,还要排除模型本身存在因果互逆的可能,否则很难让人信服。
2其他条件不变其他条件不变是指在经济分析中,保持所有的其他变量不变。
“其他条件不变”这一假设在因果分析中具有重要作用。
1.2课后习题详解一、习题1.假设让你指挥一项研究,以确定较小的班级规模是否会提高四年级学生的成绩。
(i)如果你能指挥你想做的任何实验,你想做些什么?请具体说明。
(ii)更现实地,假设你能搜集到某个州几千名四年级学生的观测数据。
你能得到它们四年级班级规模和四年级末的标准化考试分数。
你为什么预计班级规模与考试成绩成负相关关系?(iii)负相关关系一定意味着较小的班级规模会导致更好的成绩吗?请解释。
答:(i)假定能够随机的分配学生们去不同规模的班级,也就是说,在不考虑学生诸如能力和家庭背景等特征的前提下,每个学生被随机的分配到不同的班级。
伍德里奇计量经济学导论第6版笔记和课后习题详解伍德里奇所著的《计量经济学导论》(第6版)是我国许多高校采用的计量经济学优秀教材,也被部分高校指定为“经济类”专业考研考博参考书目。
作为该教材的学习辅导书,(1)整理名校笔记,浓缩内容精华。
每章的复习笔记以伍德里奇所著的《计量经济学导论》(第6版)为主,并结合国内外其他计量经济学经典教材对各章的重难点进行了整理,因此,(2)解析课后习题,提供详尽答案。
(3)补充相关要点,强化专业知识。
一般来说,国外英文教材的中译本不太符合中国学生的思维习惯,有些语言的表述不清或条理性不强而给学习带来了不便,因此,对每章复习笔记的一些重要知识点和一些习题的解答,我们在不违背原书原意的基础上结合其他相关经典教材进行了必要的整理和分析。
第1章计量经济学的性质与经济数据1.1复习笔记考点一:计量经济学★||计量经济学的含义计量经济学,又称经济计量学,是由经济理论、统计学和数学结合而成的一门经济学的分支学科,其研究内容是分析经济现象中客观存在的数量关系。
计量经济学模型(1)模型分类模型是对现实生活现象的描述和模拟。
根据描述和模拟办法的不同,对模型进行分类,如表1-1所示。
表1-1模型分类(2)数理经济模型和计量经济学模型的区别①研究内容不同数理经济模型的研究内容是经济现象各因素之间的理论关系,计量经济学模型的研究内容是经济现象各因素之间的定量关系。
②描述和模拟办法不同数理经济模型的描述和模拟办法主要是确定性的数学形式,计量经济学模型的描述和模拟办法主要是随机性的数学形式。
③位置和作用不同数理经济模型可用于对研究对象的初步研究,计量经济学模型可用于对研究对象的深入研究。
拓展: 计量经济模型的检验(见表1・2)表1-2计量经济模型的检验考点二:经济数据★★★经济数据的结构(见表1-3)表1-3经济数据的结构面板数据与混合横截面数据的比较(见表1-4)表1-4面板数据与混合横截面数据的比较考点三:因果关系和其他条件不变★★因果关系因果关系是指一个变量的变动将引起另一个变量的变动,这是经济分析中的重要目标之一。
计量经济学重点第一章经济计量学的特征及研究范围1、经济计量学的定义P11经济计量学是利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学;2经济计量学运用数理统计学分析经济数据,对构建于数理经济学基础之上的模型进行实证分析,并得出数值结果;2、学习计量经济学的目的计量经济学与其它学科的区别P1-P21计量经济学与经济理论经济理论:提出的命题和假说,多以定性描述为主计量经济学:依据观测或试验,对大多数经济理论给出经验解释,进行数值估计2计量经济学与数理经济学数理经济学:主要是用数学形式或方程或模型描述经济理论计量经济学:采用数理经济学家提出的数学模型,把这些数学模型转换成可以用于经验验证的形式3计量经济学与经济统计学经济统计学:涉及经济数据的收集、处理、绘图、制表计量经济学:运用数据验证结论3、进行经济计量的分析步骤P2-P31建立一个理论假说2收集数据3设定数学模型4设立统计或经济计量模型5估计经济计量模型参数6核查模型的适用性:模型设定检验7检验源自模型的假设8利用模型进行预测4、用于实证分析的三类数据P3-P41时间序列数据:按时间跨度收集到的定性数据、定量数据;2截面数据:一个或多个变量在某一时点上的数据集合;3合并数据:包括时间序列数据和截面数据;一类特殊的合并数据—面板数据纵向数据、微观面板数据:同一个横截面单位的跨期调查数据第二章线性回归的基本思想:双变量模型1、回归分析P18用于研究一个变量称为被解释变量或应变量与另一个或多个变量称为解释变量或自变量之间的关系2、回归分析的目的P18-P191根据自变量的取值,估计应变量的均值;2检验建立在经济理论基础上的假设;3根据样本外自变量的取值,预测应变量的均值;4可同时进行上述各项分析;3、总体回归函数PRFP19-P221概念:反映了被解释变量的均值同一个或多个解释变量之间的关系2表达式:①确定/非随机总体回归函数:EY|Xi =B1+B2XiB1:截距;B2:斜率从总体上表明了单个Y同解释变量和随机干扰项之间的关系②随机/统计总体回归函数:Yi =B1+B2Xi+μiμi:随机扰动项随机误差项、噪声B1+B2Xi:系统/确定性部分μi:非系统/随机部分4、随机误差项P221定义:代表了与被解释变量Y有关但未被纳入模型变量的影响;每一个随机误差项对于Y的影响是非常小的,且是随机的;随机误差项的均值为02性质①误差项代表了未纳入模型变量的影响;②反映人类行为的内在随机性;③代表了度量误差;④反映了模型的次要因素,使得模型描述尽可能简单;5、样本回归函数P22-P251概念:是总体回归函数的近似2表达式①确定/非随机样本回归函数:i =b1+b2Xib 1:截距;b2:斜率②随机/统计样本回归函数:Yi =b1+b2Xi+eiei :残差项残差,ei= Yi-iB1+B2Xi:系统/确定性部分μ:非系统/随机部分6、条件期望与非条件期望1EY|Xi条件期望:在解释变量X给定条件下Y的条件期望,可以通过X给定条件下的条件概率分布得到;2非条件期望:在不考虑其他随机变量取值情况时,某个随机变量的期望值;它可以通过该随机变量的非条件分布或边缘分布得到;6、线性回归模型回归参数为线性B的模型7、回归系数/回归参数线性回归模型中的B参数8、回归系数的估计量bs说明了如何通过样本数据来估计回归系数Bs,计算出的回归系数的值称为样本回归估计值9、随机总体回归函数与随机样本回归函数的关系1随机样本回归函数:从所抽取样本的角度说明了被解释变量Yi 同解释变量Xi及残差ei之间的关系;2随机总体回归函数:从总体的角度说明了被解释变量Yi 同解释变量Xi及随机误差项μ之间的关系;10、关于线性回归的两种解释P25-P261变量线性:应变量的条件均值是自变量的线性函数此解释下的非线性回归:EY= B1+B2Xi2;EY= B1+B2×1/Xi2参数线性:应变量的条件均值是参数B的线性函数此解释下的非线性回归:EY= B1+B22Xi线性回归在教材中指的是参数线性的回归11、多元线性回归的表达式P261确定/非随机总体回归函数:EX=B1+B2X2i+B3X3i+B4X4i2随机/统计总体回归函数:Yi = B1+B2X2i+B3X3i+B4X4i+μi12、最小二乘法OLS法P26-P281最小二乘以残差被解释变量的实际值同拟合值之间的差平方和最小的原则对回归模型中的系数进行估计的方法;1表达式2重要性质①用OLS法得出的样本回归线经过样本均值点:;②残差的均值总为0;③对残值与解释变量的积求和,其值为0,即这两个变量不相关:④对残差与i 估计的Yi的积求和,其值为0,即第三章双变量模型:假设检验1、古典线性回归模型的假设P41-P441回归模型是参数线性的,但不一定是变量线性的:Yi =B1+B2Xi+μi2解释变量X与扰动误差项μ不相关3给定Xi ,扰动项的期望或均值为0:Eμ| Xi=04μi 的方差为常数,或同方差:varμi=σ2每个Y值以相同的方差分布在其均值周围,非这种情况为异方差5无自相关假定:两个误差项之间不相关,covμi ,μj=06回归模型是正确假定的:实证分析的模型不存在设定偏差或设定误差2、OLS估计量运用最小二乘法计算出的总体回归参数的估计量3、普通最小二乘估计量的方差与标准误P44-P461的方差与标准误①方差:②标准误:2的方差与标准误①方差:②标准差:3的计算公式n-2为自由度:独立观察值的个数4:回归标准误,常用于度量估计回归线的拟合优度,值越小,Y的回归值越接近根据回归模型得到的估计值4、OLS估计量的性质P461b1和b2是线性估计量:它们是随机变量Y的线性函数2b1和b2是无偏估计量:Eb1=B1,Eb2=B23Eσ^2=σ^2:误差方差的OLS估计量是无偏的4b 1和b 2是有效估计量:varb 1小于B 1的任意一个线性无偏估计量的方差,varb 2小于B 2的任意一个线性无偏估计量的方差 5、OLS 估计量的抽样分布或概率分布P47-P481新加的假设:在总体回归函数Yi=B 1+B 2X i +μi 中,误差项μi 服从均值为0,方差为σ^2的正态分布:μi ~N0,σ^2 2OLS 估计量服从的分布情况:b 1~NB 1,σ2b1 b 2~NB 2,σ2b26、假设检验P48-P53 1使用公式近似2方法①置信区间法②显着性检验法:对统计假设的检验过程 3几个相关检验①t 检验法:基于t 分布的统计假设检验过程 ②双边检验:备择假设是双边假设的检验 ③单边检验:备择假设是单边假设的检验 7、判定系数r 2P53-P56 1重要公式:TSS=ESS+RSS①总平方和TSS=:真实Y 值围绕其均值的总变异;②解释平方和ESS=:估计的Y值围绕其均值=的变异,也称为回归平方和由解释变量解释的部分③残差平方和RSS=:Y变异未被解释的部分2r2判定系数的定义:度量回归线的拟合程度回归模型对Y变异的解释比例/百分比3r2的性质①非负性②0≤r2≤14r2的计算公式5r的计算公式8、同方差性方差相同9、异方差性方差不同10、BLUE最佳线性无偏估计量,即该估计量是无偏估计量,且在所有的无偏估计量中方差最小11、统计显着拒绝零假设的简称第四章多元回归:估计与假设检验1、三变量线性回归模型EYi =B1+B2Xt+ B3X3tY i =B1+B2X2t+ B3X3t+μi2、偏回归系数B2,B3:1B2:在X3保持不变的情况下,X2单位变动引起Y均值EY的变动量2B3:在X2保持不变的情况下,X3单位变动引起Y均值EY的变动量3、多元线性回归模型的若干假定P73-P74 1回归模型是参数线性的,并且是正确设定的2X2,X3与扰动误差项μ不相关①X2,X3非随机:自动满足②X2,X3随机:必须独立同分布于误差项μ3误差项的期望或均值为0:Eμi=04同方差假定:varμi=σ25误差项μi ,μi无自相关:两个误差项之间不相关,covμi,μji≠j6解释变量X2和X3之间不存在完全共线性,即两个解释变量之间无严格的线性关系X2不能表示为另一变量X3的线性函数7随机误差μ服从均值为0,同方差为σ^2的正态分布:μi~N0,σ2 4、多重共线性问题1完全共线性:解释变量之间存在的精确的线性关系2完全多重共线性:解释变量之间存在着多个精确的线性关系5、多元回归函数的估计P74-P756、OLS估计量的方差与标准误P75-P761b1的方差与标准误2b1的方差与标准误3b3的方差与标准误7、多元判定系数P76-P778、多元回归的假设检验P78 方法类似于第三章9、检验联合假设P80-P811联合假设:H0:B2=B3=0H:R2=0多元回归的总体显着性检验2三变量回归模型的方差分析表2F分布公式10、F与R2之间的重要关系P82-P83 1关系式2R2形式的方差分析表11、设定误差P84会导致模型中遗漏相关变量12、校正判定系数P84-P851作用衡量了解释变量能解释的离差占被解释变量总离差的比例2公式3性质①如果k>1,则≤R2,即随着模型中解释变量个数的增加,校正判定系数越来越小于非校正判定系数②虽然未校正判定系数R2总为正,但校正判定系数可能为负13、受限最小二乘法P86-P871受限模型:B2=B3=02非受限模型:包含了所有相关变量3受限最小二乘法:对受限模型用OLS估计参数4非受限最小二乘法:对非受限模型用OLS估计参数5判定对模型施加限制是否有效的F分布公式14、显着性检验1单个多元回归系数的显着性检验①提出零假设和备择假设;②选择适当的显着性水平;③在零假设为真的情况下,计算t统计量;④将t统计量的绝对值|t|同相应自由度和显着性水平下的临界值相比较;⑤如果t统计量大于临界值,则拒绝零假设;该步骤中务必要使用合适的单边或双边检验;2所有偏斜率系数的显着性检验①零假设:H0:B2=B3=...=Bk=0,即所有的偏回归系数均为0;②备择假设:至少一个偏回归系数不为0;③运用方差分析和F检验;④如果F统计量的值大于相应显着性水平下的临界值,拒绝零假设,否则接受;⑤3在1和2中可以不事先选择好显着性水平,只需得到相应统计量的p值,如果p 值足够小,我们就可以拒绝零假设;第五章回归模型的函数形式1、不同的函数形式P121模型形式斜率强性线性双对数对数—线性线性—对数倒数逆对数2、多元对数线性回归模型P104-P1073、线性趋势模型P1104、多项式回归模型P116-P1175、过原点的回归P1186、标准化变量的回归P120第六章虚拟变量回归模型1、虚拟变量P133-P134因变量受到一些定性变量的影响,这类定性变量称为虚拟变量,用D表示虚拟变量,虚拟变量的取值通常为0和12、虚拟变量陷阱P136引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱3、虚拟变量回归模型的类型包含一个定量变量、一个定性变量的回归模型1只影响截距加法模型2只影响斜率乘法模型3同时影响截距与斜率混合模型4、交互效应P142:交互作用虚拟变量5、分类变量和定性变量这类变量的取值不是一般的数据数值变量或定量变量,它们通常代表所研究的对象是否具有的某种特征;6、方差分析模型ANOVA解释变量仅包含定型变量或虚拟变量的回归模型;7、协方差分析模型ANOCVA回归模型中的解释变量有些是线性的,有些是定量的;8、差别截距虚拟变量包含此变量的模型能够分辨被解释变量的均值在不同类别之间是否相同; 9、差别斜率虚拟变量包含此变量的模型能够分辨不同类别之间被解释变量均值变化率的变化范围第七章模型选择:标准与检验1、好的模型具有的性质P164-P1651简约性:模型应尽可能简单;2可识别性:每个参数只有一个估计值;3拟合优度:用模型中所包含的解释变量尽可能地解释应变量的变化;4理论一致性:构建模型时,必须有一定的理论基础;5预测能力:选择理论预测与实践吻合的模型;2、产生设定误差的原因1研究者对所研究问题的相关理论了解不深2研究者没有关注本领域前期的研究成果3研究者在研究中缺乏相关数据4数据测量时的误差3、设定误差的类型P1651遗漏相关变量:“过低拟合”模型P165-P168实际模型:估计模型:后果:①如果遗漏变量X3与模型中的变量X2相关,则a1和a2是有偏的;也就是说,其均值或期望值与真实值不一致;②a1和a2也是不一致的,即无论样本容量有多大,偏差也不会消失;③如果X2和X3不相关,则b32为零,即a2是无偏的,同时也是一致的;④根据两变量模型得到的误差方差是真实误差方差σ2的有偏估计量;⑤此外,通常估计的a2的方差是真实估计量方差的有偏估计量;即使等于零,这一方差仍然是有偏的;⑥通常的置信区间和假设检验过程不再可靠;置信区间将会变宽,因此可能会“更频繁地”接受零假设:系数的真实值为零;2包括不相关变量:“过度拟合”模型P168-169正确模型:错误模型:后果:①过度拟合模型的估计量是无偏的也是一致的;②从过度拟合方程得到的σ2的估计量是正确的;③建立在t检验和F检验基础上的标准的置信区间和假设检验仍然是有效的;④从过度拟合模型中估计的a是无效的——其方差比真实模型中估计的b的方差大;因此,建立在a的标准误上的置信区间比建立在b的标准误上的置信区间宽,尽管前者的假设检验是有效的;总之,从过度拟合模型中得到的OLS估计量是线性无偏估计量,但不是最优先性无偏估计量;3不正确的函数形式P170-171如果选了错误的函数形式,则估计的系数可能是真实系数的有偏估计量;4度量误差①应变量中度量误差对回归结果的影响i. OLS估计量是无偏的;ii. OLS估计量的方差也是无偏的;iii. 估计量的估计方差比没有度量误差时的大,因为应变量中的误差加入到了误差项中;②解释变量的度量误差对回归结果的影响i. OLS估计量是有偏的;ii. OLS估计量也是不一致的;③解决方法:如果解释变量中存在度量误差,建议使用工具变量或替代变量;4、设定误差的诊断1诊断非相关变量P172-P1742对遗漏变量和不正确函数形式的检验P174-P175①判定系数R2和校正后的R2;②估计的t值;③与先验预期相比,估计系数的符号;3在线性和对数线性模型之间选择:MWD检验P175-P176:线性模型:Y是X的线性函数①设定如下假设;HH:对数线性模型:lnY是X或lnX的线性函数1②估计线性模型,得到Y的估计值③估计线性对数模型,得到lnY的估计值④求⑤做Y对X和的回归,如果根据t检验的系数是统计显着的,则拒绝H0⑥求⑦做lnY对X或lnX和的回归,如果的系数是统计显着的,则拒绝H14回归误差设定检验:RESETP177-P178①根据模型估计出Y值;②把的高次幂,,等纳入模型以获取残差和之间的系统关系;由于上图表明残差和估计的Y值之间可能存在曲线关系,因而考虑如下模型③令从以上模型中得到的为,从前一个方程得到的为,然后利用如下F检验判别从以上方程中增加的是否是统计显着的;④如果在所选的显着水平下计算的F值是统计显着的,则认为原始模型是错误设定的;第八章多重共线性:解释变量相关会有什么后果1、完全多重共线性P183-P185回归模型的某个解释变量可以写成其他解释变量的线性组合;设X2可以写成其他某些解释变量的线性组合,即:X 2=a3X3+a4X4…+akXk至少有一个ai≠0,i= 2,3,…k称存在完全多重共线性2、高度多重共线性P185-P187X2与其他解释变量高度共线性,即可以近似写成其他解释变量的线性组合X 2=a3X3+a4X4…+akXk+i至少有一个ai ≠0,i= 2, 3,…k, vi是随机误差项;3、产生多重共线的原因1时间序列解释变量受同一因素影响经济发展、政治事件、偶然事件、时间趋势经济变量的共同趋势2模型设立:解释变量中含有当期和滞后变量4、多重共线性的理论后果P187-P188OLS估计量仍然是最优无偏估计量1在近似共线性的情形下,OLS估计量仍然是无偏的;2近似共线性并未破坏OLS估计量的最小方差性;3即使在总体回归方程中变量X之间不是线性相关的,但在某个样本中,X变量之间可能线性相关;5、多重共线性的实际后果P188-P1891OLS估计量的方差和标准误较大;2置信区间变宽;3t值不显着;4R2值较高;5OLS估计量及其标准误对数据的微小变化非常敏感6回归系数符号有误;7难以评估各个解释变量对回归平方和ESS或者R2的贡献6、多重共线性的诊断P189-P1921观察回归结果R2较高,F很大,但t值显着的不多;多重共线性的经典特征R2较高,F检验拒绝零假设,但各变量的t检验表明,没有或少有变量系数是统计显着的;2简单相关系数法解释变量两两高度相关;变量相关系数比如超过,则可能存在较为严重的共线性;这一标准并不总是可靠,相关系数较低时,也有可能存在共线性3检查偏相关系数不一定可行4判定系数法辅助回归某个解释变量对其余的解释变量进行回归如果判定系数很大,F检验显着,即X与其他解释变量存在多重共线i5方差膨胀因子7、多重共线性的补救P195-P1981从模型中删除引起共线性的变量①找出引起多重共线性的解释变量,将它排除出去最为简单的克服多重共线性问题的方法;②逐步回归法i. 逐步引入如果拟合优度变化显着—新引入的变量是一个独立解释变量;选择解释变量的原则:a. 调整的R2增加,每个∣t∣增加,则保留引入变量;b. 调整的R2下降,每个∣t∣变化不大,则删除引入变量;ii. 逐步剔除①排除变量时应该注意:i. 由实际经济分析确定变量的相对重要性,删除不太重要的变量;ii. 如果删除变量不当,会导致模型设定误差;2获取额外的数据或新的样本3重新考虑模型4先验信息5变量变换将原模型变换为差分模型可有效消除存在于原模型中的多重共线性一般,增量之间的线性关系远比总量之间的线性关系弱得多; 第九章异方差:如果误差方差不是常数会有什么后果1、异方差的定义随机误差项ui 的方差随着解释变量Xi的变化而变化,即:2、异方差的性质P205-P208OLS估计仍是线性无偏,但不具最小方差1线性性2无偏性3方差式1不具有最小方差,式2具有最小方差3、异方差性的后果P209-P210经典模型假定下,OLS估计量是最优线性无偏估计量BLUE;去掉同方差假定:1OLS估计量仍是线性的;2OLS估计量仍是无偏的;3OLS估计量不再具有最小方差性,即不再是最优有效估计量;4OLS估计量的方差通常是有偏的;5偏差的产生是由于,即不再是真实σ2的无偏估计量;6建立在t分布和F分布之上的置信区间和假设检验是不可靠的,如果沿用传统的检验方法,可能得出错误的结论;4、异方差的检验1图形检验P211-P212e2对一个或多个解释变量或Y的拟合值作图; 2帕克检验Park TestP212-P214假定误差方差与解释变量相关形式:步骤:①做OLS估计求平方,取对数②对ei③做辅助回归④检验零假设:B=023格莱泽检验Glejser TestP214假定误差方差与解释变量相关形式:步骤:①做OLS估计②对e求绝对值i③做辅助回归方程=0④检验零假设:B24怀特检验White TestP215-P216和交叉乘积呈线性关系假定误差方差与X、X2步骤:①OLS估计得残差②做辅助回归③检验统计量5、异方差的修正1加权最小二乘法WLSWeighted Least SquaresP217-P222①方差已知原模型:加权后的模型:误差项的方差为:1加权的权数:②方差未知成比例:i. 误差方差与Xi模型变换:ii. 误差方差与Xi2成比例:模型变换:2怀特异方差校正的标准误P222-P223①如果存在异方差,则对于通过OLS得到的估计量不能进行t检验和F检验;②怀特估计方法③大样本情形下回归标准差和回归系数的一致估计量,可以进行t检验和F检验;第十章自相关:如果误差项相关会有什么结果1、自相关的定义P233按时间或空间顺序排列的观察值之间存在的相关关系;2、自相关的性质P233-P2341若古典线性回归模型中误差项ui不存在自相关Covui,uj=Eui,uj=0,i≠j2若误差项之间存在着依赖关系—ui存在自相关Covui,uj=Eui,uj≠0,i≠j3、产生自相关的原因P235-P2361惯性2设定偏误①模型中遗漏了重要变量;②模型选择了错误的函数形式;i. 从不正确的模型中得到的残差会呈现自相关;ii. 检验是否由于模型设定错误而导致残差自相关的方法:3蛛网现象4数据的加工①在用到季度数据的时间序列回归中,这些数据通常来自于每月数据;这种数据加工方式减弱了每月数据的波动而引进数据的匀滑性;②用季度数据描绘的图形要比用月度数据看来匀滑得多;这种匀滑性本身可能使扰动项中出现自相关;③内插法或外推法:用这些方法加工得到的数据都会给数据带来原始数据没有的系统性,这种系统性可能会造成误差自相关;4、自相关的后果P236-P2371OLS估计得到的仍为线性、无偏估计;2OLS估计不再具有有效性;3OLS估计量的方差有偏:低估了估计量的标准差;4通常所用的t检验和F检验是不可靠的;5计算得到的误差方差是真实σ2的无偏估计量,并且很有可能低估了真实的σ2;6通常计算的R2不能测度真实的R27通常计算的预测方差和标准误也是无效的5、自相关的诊断1图形法—时序图P237-P239①误差u并不频繁地改变符号,而是几个正之后跟着几个负,几个负之后跟着t几个正,则呈正自相关;②扰动项的估计值呈循环型,而是相继若干个正的以后跟着几个负的,表明存在正自相关;③扰动项的估计值呈锯齿型一个正接一个负,随时间逐次改变符号,表明存在负自相关;2检验P239-P242①定义值d值近似1 =-1完全负相关d=42 =0无自相关d=23 =1完全正相关d=0②DW检验的判断准则6、自相关的修正ρ的估计主要方法1ρ=1:一阶差分方法P244假定误差项之间完全正相关 Y t = α+βX t +u tu t = u t-1+tY t - Y t-1= βX t -X t-1+t2从DW 统计量中估计ρP244-P245 3从OLS 残差e t 中估计Cochrane-OrcuttP245-P246①e t = e t-1+t②利用OLS 残差,得的估计量 ③迭代,得的收敛值。
第一章导论第一节计量经济学的涵义和性质计量经济学是以一定的经济理论和实际统计资料为依据,运用数学、统计学方法和计算机技师,通过建立计量经济模型,定量分析经济变量之间的随机因果关系。
计量经济学是经济学的一个重要分支,以揭示经济活动中客观存在的数量关系的理论与方法为主要内容,其核心是建立计量经济学模型。
第二节计量经济学的内容体系及与其他学科的关系一、计量经济学与经济学、统计学、数理统计学学科间的关系计量经济学是经济理论、统计学和数学的综合。
经济学着重经济现象的定性研究,而计量经济学着重于定量方面的研究。
统计学是关于如何惧、整理和分析数据的科学,而计量经济学则利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。
数量统计各种数据的惧、整理与分析提供切实可靠的数学方法,是计量经济学建立计量经济模型的主要工具,但它与经济理论、经济统计学结合而形成的计量经济学则仅限于经济领域。
计量经济模型建立的过程,是综合应用理论、统计和数学方法的过程。
因此计量经济学是经济理论、统计学和数学三者的统一。
二、计量经济学的内容体系1、按范围分为广义计量经济学和狭义计量经济学。
2、按研究内容分为理论计量经济学和应用计量经济学。
理论计量经济学的核心内容是参数估计和模型检验。
应用计量经济学的核心内容是模型设定和模型应用。
第三节基本概念(4、5、7、8了解即可)1.经济变量:经济变量是用来描述经济因素数量水平的指标。
2.解释变量:解释变量也称自变量,是用来解释作为研究对象的变量(即因变量)为什么变动、如何变动的变量。
它对因变量的变动作出解释,表现为议程所描述的因果关系中的“因”。
3.被解释变量:被解释变量也称因变量或应变量,是作为研究对象的变量。
它的变动是由解释变量作出解释的,表现为议程所描述的因果关系的果。
4.内生变量:内生变量是由模型系统内部因素所决定的变量,表现为具有一定概率颁的随机变量,其数值受模型中其他变量的影响,是模型求解的结果。
第一章导论计量经济学定义:计量经济学(Econometrics)是一门应用数学、统计学和经济理论来分析、估计和检验经济现象与理论的科学。
通过使用统计数据和经济模型,计量经济学试图量化经济关系,以更好地理解经济变量之间的相互作用。
研究的问题(相关关系):计量经济学的目的是研究经济变量之间的关系,例如:1. 消费与收入的关系。
2. 教育与工资的关系。
3. 利率与投资的关系。
第二章 OLS (普通最小二乘法):OLS 是一种用于估计线性回归模型中未知参数的方法。
它通过最小化误差平方和来找到回归线。
在一元线性回归中,我们通常使用普通最小二乘法(OLS)来估计模型参数。
对于模型 Y = α + βX + ε,我们可以使用以下公式来计算α和β:β= Σ( (X - mean(X)) (Y - mean(Y)) ) / Σ( (X - mean(X))^2 ) α̂ = mean(Y) - β̂ * mean(X)这里,mea n(X) 是 X 变量的平均值(即ΣX/n),mean(Y) 是 Y 变量的平均值(即ΣY/n)。
在这些公式中,mean 表示求平均值。
Σ 表示对所有数据点求和,n 是样本大小。
这里α_hat 是截距的估计值,β_hat 是斜率的估计值。
结论及推论:1. 在高斯马尔可夫假设下,OLS 估计量是最佳线性无偏估计量(BLUE)。
2. 当误差项的方差是常数时,OLS 估计量是有效的。
3. 如果模型是正确规范的,并且误差项是独立且同分布的,那么 OLS 估计量是一致的。
4. 如果误差项与解释变量相关,或者存在遗漏变量,那么 OLS 估计量可能是有偏的。
5. OLS 提供了估计的标准误差、t 统计量和其他统计量,这些可以用于进行假设检验和构建置信区间。
第三章一元回归:(1)总函、样函:总函数和样本函数是线性回归模型的两种表现形式。
总函数(总体函数)表示整体样本的关系,一般形式为Y = β0 + β1X + ε。
伍德里奇计量经济学导论摘要:一、伍德里奇《计量经济学导论》概述二、伍德里奇对计量经济学的定义和方法三、伍德里奇《计量经济学导论》的主要内容四、伍德里奇《计量经济学导论》的学术价值和影响五、总结正文:一、伍德里奇《计量经济学导论》概述伍德里奇(John M.Woodridge)是美国著名的计量经济学家,他的《计量经济学导论》(Introduction to Econometrics)是计量经济学领域的经典教材,自1974 年首次出版以来,已经多次修订,深受全球经济学者和学者的欢迎。
二、伍德里奇对计量经济学的定义和方法在《计量经济学导论》中,伍德里奇对计量经济学进行了明确的定义。
他认为,计量经济学是一门以一定的经济理论为基础,采用数学和统计学的工具,通过建立计量经济模型对经济变量之间的关系进行定量分析的学科。
在进行计量分析时,首先需要利用经济数据估计出模型中的未知参数,然后对模型进行检验,通过检验后,可以利用模型进行经济预测和决策分析。
伍德里奇在书中详细介绍了计量经济学的方法,包括横截面数据的回归分析、多元回归分析、时间序列数据的分析等。
他还对线性回归模型、非线性回归模型、随机回归模型等常见的计量经济模型进行了深入的讲解和分析。
三、伍德里奇《计量经济学导论》的主要内容伍德里奇的《计量经济学导论》共分为六章,涵盖了计量经济学的基本概念、方法和应用。
具体内容包括:第一章:计量经济学的性质与经济数据,介绍了计量经济学的定义、特点和基本概念,以及经济数据的收集、整理和分析方法。
第二章:简单回归模型,讲解了线性回归模型的基本原理和估计方法,包括最小二乘法、极大似然估计法等。
第三章:多元回归分析,介绍了多元线性回归模型的估计和检验方法,包括普通最小二乘法、矩阵形式等。
第四章:多元回归分析的推断,讲解了多元回归模型的预测和假设检验方法。
第五章:时间序列数据的分析,介绍了时间序列数据的基本特征和分析方法,包括自相关、平稳性、ARIMA 模型等。
第1章计量经济学的性质与经济数据第一章讨论的是计量经济学的研究领域,并提出在应用计量经济方法过程所遇到的一般问题。
第1.3节考查了商业、经济学和其他社会科学中所使用的数据集的种类。
第1.4节对社会科学中的因果性推断的困难进行了直观讨论。
1.1什么是计量经济学设想州政府雇佣了你,要求你对公共机构的在职培训项目的效果进行评价。
假设这个项目是培训工人在生产过程中使用计算机的各种方法。
为期二十周的培训都是在工人的非工作时间进行。
任何一个按小时计酬的生产工人都可以根据自愿参加全部或部分培训。
你要决定培训项目对每个工人随后的小时工资有何影响。
现在假设你为一家投资银行工作,并准备研究涉及到美国短期国库券的各种不同投资战略的回报,看看它们是否与经济理论的含义相一致。
回答这种问题的任务初看起来让人胆怯。
就此看来,你对需要搜集的数据类型只有模糊的认识。
在学完这本计量经济学入门教程后,你应该知道,如何用计量模型去规范地评价一个在职培训项目,或检验一个简单的计量经济理论。
计量经济学对经济关系的估计、对经济理论的检验、以及对政府和商业政策的评价和实施,都取决于统计方法的进步。
计量经济学最常见的应用就是对诸如利率、通货膨胀率和国内生产总值等重要宏观经济变量的预测。
尽管对经济指标的预测随处可见而又广为流传,但计量经济方法也可用于那些与宏观经济预测无关的经济领域。
比如,我们可以研究在政治竞争中支出对投票结果的影响,还可以考虑学校支出对教育领域学生表现的影响。
此外,我们还将了解如何使用计量方法来预测经济时间序列。
计量经济学已从数理统计分离出来并演化成一门独立学科,因为前者主要考虑在搜集和分析非实验经济数据时的固有问题。
非实验数据(nonexperimental data)并非从对个人、企业或经济系统中的某些部分的控制实验而得来。
(非实验数据有时被称为观测数据(observational data),以强调研究者只是被动的数据搜集者这一事实。
)自然科学中的实验数据(experimental data)通常是在实验环境中获得的,但在社会科学中要得到这些实验数据则困难得多。
虽然也可以设计一些社会实验,但通常都行不通、代价高昂而使人望而却步,或者解决经济问题所需要实施的各种控制实验在道德上使人极为反感。
在第1.4节我们给出一些特殊的例子,来说明实验数据与非实验数据之间的差别。
当然,计量经济学家只要有可能就会借用数理统计学家的一些方法。
多元回归分析方法虽然在上述两个领域都是主要支柱,但其着眼点和解释可以极为不同。
此外,经济学家已想出许多新方法,以处理经济数据的复杂性和检验经济理论所预测的结果。
1.2 经验经济分析的步骤计量经济方法几乎在应用经济学的每一个分支中都相当重要。
要么在我们有一个经济理论需要检验的时候,要么在我们的脑海中有一种关系,而在这一关系对商业决策或政策分析又相当重要的时候,便开始使用计量方法。
经验分析(empirical analysis)*就是利用数据来检验某个理论或估计某种关系。
应该如何构建一个经验经济分析呢?虽然看上去十分显然,但仍值得强调,任何一个经验分析的第一步都是对所关心问题的详细阐述。
问题可能是要处理对一个经济理论某特定方面的检验,或者涉及到对政府政策效果的检验。
原则上,计量经济方法可用来回答诸多方面的问题。
在某些情形下,特别是涉及到对经济理论的检验时,就要构造一个规范的经济模型(economic model)。
经济模型总是由描述各种关系的数理方程构成。
经济学家因建造模型来描述大量人类行为而声名远扬。
例*国内常称实证分析,但为了区别于positive analysis,故译为经验分析。
——译者注如在中级微观经济学中,个人在预算约束下的消费决策便可由一些数理模型来描述。
这些模型背后的基本前提是效用最大化。
个人选择能在资源约束条件下最大化其福利的假定,为我们创造一些简便的经济模型和做出一些明确的预测提供了强有力的框架。
在消费决策的背景下,效用最大化能导出一系列需求方程。
在每个需求方程中,每种商品的需求量取决于该商品的价格、其替代和互补品的价格、消费者的收入和影响消费者个人喜恶的一些个人特征。
这些方程便形成对消费需求进行计量分析的基础。
经济学家使用诸如效用最大化框架之类的基本分析工具,来解释那些初看起来具有非经济性质的行为。
一个经典的例子就是,贝克尔(1968)针对犯罪行为而做的经济模型。
在一篇开创性的论文中,诺贝尔经济学奖得主加里〃贝克尔系统地阐述了一个效用最大化框架,用以描述个人对犯罪行为的选择。
虽然每一特定的犯罪都有明显的经济回报,但大多数犯罪行为也有其成本。
犯罪的机会成本使罪犯不能参加诸如合法就业之类的其他活动。
此外,还存在与罪犯可能被抓住相联系的成本,以及罪犯被抓后,如果被证明有罪,与监禁相关的成本。
从贝克尔的视角来看,决定进行非法活动的决策是资源配臵的方式之一,并是在充分考虑了各种可选择行为的成本和收益后决定的。
在一般化的假定之下,我们便能推导出一个方程,把花在犯罪活动上的时间描述成各种影响因素的一个函数。
我们可以把这个方程表示为),,,,,,(7654321x x x x x x x f y (1.1)其中y =花在犯罪活动上的小时数x 1=从事犯罪活动每小时的“工资”x 2=合法就业的小时工资 x 3=犯罪或就业之外的收入 x 4=犯罪被抓住的概率x 5=犯罪被抓后,被证明有罪的概率 x 6=被证明有罪后预期的宣判 x 7=年龄虽然还有其他因素通常会影响个人参与犯罪的决策,但上述因素从规范的经济分析来看可能具有代表性。
如经济理论的惯常做法那样,我们未对(1.1)中的函数f 进行任何设定。
这个函数取决于一个很少有人知道的潜在效用函数。
尽管如此,我们还是可以用经济理论(或反思)来预测每个变量对犯罪活动可能具有的影响。
这正是对个人犯罪行为进行计量经济分析的基础。
虽然规范的经济建模有时是经验分析的起点,但更普遍的情况是,使用经济理论时不是那么规范,甚至完全是依赖直觉。
你可能也同意,方程(1.1)中出现的犯罪行为的决定因素从常识来看也是合情合理的;我们也许能直接得到这个方程,而不需要从效用最大化开始把它推导出来。
尽管在有些情况下,规范的推导能提供直觉看不到的洞见,但这种观点也有其优点。
下面这个例子中的方程,就是从多少有些不甚规范的推理中得到的。
例1.2 工作培训与工人的生产力现在考虑在1.1节之初提出的问题。
一位劳动经济学家想考察工作培训对工人生产力的影响。
在此情形下,几乎不需要什么规范的经济理论。
基本的经济常识就足以使我们认识到,所受教育、工作经历和培训等因素会影响工人的生产力。
此外,经济学家还清楚地知道,工人的工资与其生产力相称。
这种简单的理由就使我们得到如下模型wage =f(educ, exper, training ) (1.2)其中wage 为小时工资,educ 为接受正规教育的年限,exper 为工作年数,而training 为花在工作培训上的周数。
此外,虽然也有其他因素通常会影响工资率,但(1.2)式刻画了这个问题的本质。
在我们设定一个经济模型之后,我们需要把它变成所谓的计量模型(econometric model)。
既然我们在全书都要讨论计量模型,那么先了解一下计量模型和经济模型有何关系就很重要。
以方程(1.1)为例,与经济分析不同,在进行计量经济分析之前,我们必须明确函数f(·)的形式。
与(1.1)相关的第二个问题是,对不能合理地观测到的变量该如何处理。
比如,考虑一个人在进行犯罪活动时的工资。
原则上,这个工资是清楚界定的,但对一个特定的人来说,这个工资是很难观测到的,甚至是不可能观测到的。
虽然对某给定个人,诸如其被抓住的概率之类的变量也不能切实得到,但至少我们能找到相关的逮捕统计量,从而推导出一个能近似被抓住概率的变量。
还有其他影响犯罪行为的因素,不要说观测,甚至我们连列出来都做不到,但我们多少都要对它们做出解释。
通过设定一个特定的计量经济模型,我们就解决了经济模型中内在的模棱两可性:crime=β0+β1wage m+β2othinc+β3freqarr+β4freqconv+β5avgsen+β6age+u,(1.3) 其中crime是参与犯罪活动频率的某种度量,wage m是在合法就业中所得到的工资,othinc是通过其他途径得到的收入(如资产、继承等),freqarr是以前违法被抓住的概率(用来近似被捕概率),freqconv是被证明有罪的概率,而avgsen则是被证明有罪后判处的平均时间长度。
对这些变量的选择,既以经济理论为依据,又考虑到了数据。
u这一项则包括了不可观测的因素,诸如从事犯罪活动的工资、道德特征、家庭背景等,以及在度量犯罪活动和被捕概率等变量时的误差。
虽然我们也可以在模型中加入家庭背景变量,如兄弟姐妹的个数、父母所受教育等,但我们仍不能完全消除u。
实际上,对这个误差项(error term)或扰动项(disturbance term)的处理可能是任何计量分析中最重要的内容。
常数β0,β1,…,β6都是这个计量模型的参数,它们描述了此模型中用来决定犯罪的因素和犯罪之间关系的方向和强度。
对例1.2来说,一个完整的计量经济模型可能是wage=β0+β1edu+β2exper+β3training+u,(1.4)其中u这一项包含的因素有“天生能力”、教育的质量、家庭背景等,以及能影响一个人工资的无数其他因素。
如果我们专门考虑工作培训的影响,那β3就是我们所关注的参数。
在多数情况下,计量经济分析是从对一个计量经济模型的设定开始的,而没有考虑模型构造的细节。
我们一般遵循这一思路,主要原因是,对犯罪这种经济模型进行仔细地推导,不仅消耗的时间过长,而且会把我们带到经济理论的某个特定而通常又极为困难的领域。
在我们的例子中,经济上的逻辑如要起作用,那我们就要把其背后的任何一种经济理论都放到对计量模型的设定中。
而在犯罪一例的经济模型中,我们将从像(1.3)那样的一个计量模型出发,并以经济逻辑和常识作为选择变量的向导。
尽管这一方法有失经济分析之丰富,但它总是被仔细的研究者普遍而又有效地应用着。
一旦设定了一个像(1.3)或(1.4)那样的计量模型,我们所关心的各种假设(hypotheses)便可用未知参数来表述。
比如,在方程(1.3)中,我们可以假设合法就业的工资wage m对犯罪行为没有影响。
在这个特定的计量模型背景下,这个假设就等价于β1=0。
按定义,一项经验分析总需要数据。
在搜集到相关变量的数据之后,便用计量方法来估计计量模型中的参数,并规范地检验所关心的假设。
在某些情况下,计量模型还用于对理论的检验或对政策影响的研究。