计量经济学重点笔记第三讲样本
- 格式:doc
- 大小:1.05 MB
- 文档页数:27
计量经济学复习笔记第⼀章统计概念1.什么是计量经济学计量经济学是对经济的测度,利⽤经济理论、数学、统计推断等⼯具对经济现象进⾏分析的⼀门社会科学。
2.计量经济学的⽅法论(计量经济分析步骤)(1)建⽴理论假说。
(2)收集数据。
(3)假定数学模型。
(4)设⽴统计或计量模型。
(5)估计经济模型参数(6)核查模型的适⽤性:模型设定检验。
(7)检验源⾃模型的假定(8)利⽤模型进⾏预测4.数据类型(1)时间序列数据:按时间跨度获得的数据。
特征是⼀般变量如、下标为t。
(2)截⾯数据:同⼀时点上的⼀个或多个变量的数据集合。
如:各地区2002年⼈⼝普查数据。
(3)合并数据:既包括时间序列数据有包括截⾯数据。
例:20年间10个国家的失业数据。
20年失业数据是时间序列,10个国家⼜是截⾯数据。
(4)⾯板数据:同⼀个横截⾯的单位的跨期调查数据。
例:对相同的家庭数量在⼏个时间间隔内进⾏的财务状况调查。
5.理解回归关系回归关系是⼀种统计上的相关关系,并不意味着⾃变量和因变量之间存在着因果关系。
第⼆章线性回归的基本思想1.回归分析的含义: 回归分析是反映的⾃变量和因变量之间的统计关系,回归分析是在⾃变量给定条件下的因变量的变化,是⼀种条件回归分析E(|)=+2.随机误差项的性质(为什么要引⼊随机误差项)(1)随机误差项代表着未纳⼊模型变量对因变量的影响(2)即使模型包括了影响因变量的所有因素,模型也有不可避免的随机性。
(3)还代表着度量误差(4)模型设定应该尽可能简单,只要不遗漏重要变量,把因变量的次要影响因素归于随机项。
(奥卡姆剃⼑原则)3.参数估计⽅法———普通最⼩⼆乘法的基本思想选择参数使得残差平⽅和最⼩——Min =Min ()=Min ()4.根据Ols 法得出参数称为最⼩⼆乘估计量,最⼩⼆乘估计量的性质:(1)Ols ⽅法获得样本回归直线过样本均值点(,)(2)残差的均值总为0,(3)残差项与解释变量的乘积求和为0,即残差项与解释变量不相关。
y = b 0+ b 1x 1+ b 2x 2+ . . . b k x k + u一、多元线性回归模型1.我们可以研究控制一些变量不变的条件下,其他变量对y的影响,而不是假定他们不相关。
Cons = b 0+ b 1inc+b 2inc 2 +u2.我们还能推广变量之间的函数关系如:通过在模型中包含更多的变量,我们更好的达到了SLR.4所表达的目的E(u|x 1,x 2, …,x k ) = 0 (3.8)HYP.1一般多元回归模型的关键假定(u和所有x都不相关):( )仍然是最小化残差和:对(3.12)求k +1次偏导得一阶条件(交给计算机计算)(此时假定k +1个方程只能得到估计值得唯一解2.1 如何得到OLS 估计值例3.1分析两个系数时,可得出当我们把其中一个因素涵盖在模型中时,另外一个因素的预测就变得不有力了1.系数表示局部效应(控制其他变量不变时,对y的效应)多元回归分析给了我们在收集不到“其他条件不变”时的数据仍有同样效果的能力2.“控制其他变量不变”的含义3.同时改变不止一个自变量(只需要将效应加和)2.2 对OLS 回归方程的解释从单变量情形加以推广,得:1.残差的样本平均值为02.每个自变量和OLS 残差之间的样本协方差为0。
因此OLS 拟合值和OLS 残差之间的样本协方差也为03.点总位于OLS 回归线上(性质1. 2.由一阶条件得,性质3.由1.可得2.3 OLS 的拟合值和残差( )其中 是x1对其他变量回归后的残差(即排除其他变量对x1的影响,类似矢量正交)2.4 对“排除其他变量影响”的解释( )(是 对 简单回归的斜率1.样本中x2对y的偏效应为0,即2.x1和x 2不相关,即(1. 2.可解释、 的差异由(3.23)知,在两种情况下利用矢量正交的理解考虑简单回归和两个自变量的回归:2.5简单回归和多元回归估计值比较可以证明,R2的另一种理解是 的实际值与其拟合值 的相关系数的平方,其中2.6 拟合优度(与简单回归大致相同)二、普通最小二乘法(多元线性回归模型的代数特征和对方程的解释)使用提示:1.该笔记是对伍德里奇《计量经济学》第五版第三章学习过程中的内容梳理2.由于本人水平有限,单独看该笔记估计会很吃力,且很可能出现错误,建议结合书本进行理解3.希望能够对想学习计量经济学的人起到一点点帮助第三章多元回归分析:估计2020年3月19日10:47由于定义下增加解释变量不会降低R2,所以判断一个解释变量是否应该放入模型的依据应该是该解释变量在总体中对y的偏效应是否非02.7 过原点的回归1.之前推导的性质不再成立,特别是OLS残差的样本平均值不再是02.计算R2没有特定的规则3.当截距项b0不等于0,斜率参数OLS估计量将有偏误;当截距项b0=0,估计带截距项方程的代价是,OLS斜率估计量的方差会更大2.8 OLS估计量的期望值MLR.1(线性于参数)MLR.2(随机抽样)MLR.3(不存在完全共线性,允许一定程度的相关)(在定义函数时要小心不要违背了MLR.3MLR.4(条件均值为0)(内生解释变量:解释变量可能与误差项相关定理3.1 OLS的无偏性()2.9 过度设定和设定不足(多了无关变量和少了解释变量)2.9.1过度设定(不影响OLS估计量的无偏性,但影响OLS估计量的方差)2.9.2设定不足1.简单情形:从一个斜率参数到两个斜率参数由(3.23):取均值得偏误为:(因此偏误的方向取决于两个符号,偏误的大小取决于两者之积,在应用中可以通过常识来判断偏误方向2.扩展情形:从两个斜率参数到三个斜率参数当你假设和不相关时,就可以证明和的关系和简单情形一样2.10 OLS估计量的方差MLR.5(同方差性,不仅可以简化公式,还得到了有效性)定理3.2 OLS斜率估计量的抽样方差在MLR.1-5下,以自变量的样本值为条件,有()(是的总样本波动,则是对所有其他自变量(并包含一个截距项)回归所得到的由(3.51)可知,估计量的抽样方差由三个要素决定:1.误差方差(噪声越大,越难估计)2.的总样本波动(越分散,越容易估计)3.自变量之间的线性关系(和其他自变量相关性越高,越不利于估计(很高的并不一定有问题,抽样方差的大小还要取决于剩下两个因素,可以通过收集更多的数据来削减多重共线性(当考虑某一个自变量 的方差时,若 和其他自变量均无关,那么其他自变量间的关系是不造成影响的,某些经济学家为了分离特定变量的因果效应,而在模型中包括许多控制因素,但这并不影响因果效应的证实( )当含有两个解释变量时:( )当含有一个解释变量时:((3.54)和(3.55)表明除非样本中x1和x2不相关,否则 <1.当 =0时,两个都无偏,但 < ,所以前者更好2.当不等于0时,不放x 2进去会导致有偏,放了x 2进去会导致方差增加,但我们喜欢把x2放进去的理由是:不放进去的偏误不会随着样本容量扩大而缩减,而放进去增加的方差却会随着样本容量的扩大逐渐缩小至0所以有两个结论:2.10.1 过度设定的方差(建立在过度设定无偏讨论的基础上)( )2.10.2 OLS 估计量的标准误(与简单回归相同)在假定MLR.1-5下,有(MLR .5若不满足(即异方差),会使标准误失效(第二种表达清楚说明了随着样本容量的扩大,在其他三项( 、 、 )都趋于常数的时候,估计量标准误是如何变小的因此得估计量的标准误:定理3.3 的无偏估计OLS 估计量是最优线性无偏估计量(如(3.22)所示的线性、无偏误、在线性无偏估计量中方差最小在MLR.1-5下,得定理3.4 高斯-马尔科夫定理2.11 对OLS 估计的一个正确认识。
2023计量经济学笔记PERSONAL NOTES计量经济学笔记目录CH1导论 (3)CH2简单线性回归模型 (5)CH3多元线性回归模型 (11)CH4多重共线性 (14)CH5异方差 (16)CH6自相关 (19)CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:●模型设定——确定变量和数学关系式●估计参数——分析变量间具体的数量关系●模型检验——检验所得结论的可靠性●模型应用——做经济分析和经济预测3、模型(1)变量A.解释变量:表示被解释变量变动原因的变量,也称自变量,回归元,X。
B.被解释变量:表示分析研究的对象,变动结果的变量,也成应变量,Y。
C.内生变量:其数值由模型所决定的变量,是模型求解的结果。
D.外生变量:其数值由模型意外决定的变量。
(外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
)E.前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响,但能够影响我们所研究的本期的内生变量。
F.前定变量:前定内生变量和外生变量的总称。
(2)数据●时间序列数据:按照时间先后排列的统计数据(t)。
●截面数据:发生在同一时间截面上的调查数据(i)。
●面板数据:时间序列数据和截面数据结合的数据(t,i)。
●虚拟变量数据:表征政策,条件等,一般取0或1(d).4、估计评价统计性质的标准无偏:E(^β)=β有效:最小方差性一致:N趋近无穷时,β估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比6、计量经济学的研究过程CH2简单线性回归模型一、相关知识点:1、变量间的关系分为函数关系与相关关系(相关系数是对变量间线性相关程度的度量。
1.普通最小二乘法(Ordinary Least Squares,OLS):已知一组样本观测值{}n i Y X i i ,2,1:),(⋯=,普通最小二乘法要求样本回归函数尽可以好地拟合这组值,即样本回归线上的点∧i Y 与真实观测点Yt 的“总体误差”尽可能地小。
普通最小二乘法给出的判断标准是:被解释变量的估计值与实际观测值之差的平方和最小。
2.广义最小二乘法GLS :加权最小二乘法具有比普通最小二乘法更普遍的意义,或者说普通最小二乘法只是加权最小二乘法中权恒取1时的一种特殊情况。
从此意义看,加权最小二乘法也称为广义最小二乘法。
3.加权最小二乘法WLS :加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用普通最小二乘法估计其参数。
4.工具变量法IV :工具变量法是克服解释变量与随机干扰项相关影响的一种参数估计方法。
5.两阶段最小二乘法2SLS, Two Stage Least Squares :两阶段最小二乘法是一种既适用于恰好识别的结构方程,以适用于过度识别的结构方程的单方程估计方法。
6.间接最小二乘法ILS :间接最小二乘法是先对关于内生解释变量的简化式方程采用普通小最二乘法估计简化式参数,得到简化式参数估计量,然后过通参数关系体系,计算得到结构式参数的估计量的一种方法。
7.异方差性Heteroskedasticity :对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差性。
8.序列相关性Serial Correlation :多元线性回归模型的基本假设之一是模型的随机干扰项相互独立或不相关。
如果模型的随机干扰项违背了相互独立的基本假设,称为存在序列相关性。
9.多重共线性Multicollinearity :对于模型i k i i X X X Y μββββ++⋯+++=i k 22110i ,其基本假设之一是解释变量X 1,X 2,…,Xk 是相互独立的。
第16章联立方程模型16.1 复习笔记考点一:联立方程模型的性质★★当一个或多个解释变量与因变量联合被决定时,模型就会出现内生性问题。
联立方程模型是指从经济理论中推导出来的若干的相关的方程,联立起来就是一个模型,如凯恩斯的国民收入模型等。
联立方程的重要特征:(1)给定多个方程中的外生变量和误差项,所有的方程就决定了剩余的内生变量,因此任一方程的因变量和方程中的内生变量都是SEM的内生变量。
(2)模型中的外生变量的关键假设是与所有的误差项都不相关。
由于这些误差出现在结构方程中,所以它们是结构误差。
(3)SEM中的每个方程自身都应该有一个行为上的其他条件不变解释。
考点二:OLS中的联立性偏误★★★★1.约简型方程考虑两个方程的结构模型:y1=α1y2+β1z1+u1y2=α2y1+β2z2+u2专门估计第一个方程。
变量z1和z2都是外生的,所以每个都与u1和u2无关。
如果将式y1=α1y2+β1z1+u1的右边作为y1代入式y2=α2y1+β2z2+u2中,得到(1-α2α1)y2=α2β1z1+β2z2+α2u1+u2为了解出y2,需对参数做一个假定:α2α1≠1这个假定是否具有限制性则取决于应用。
如果上式的条件成立,y2可写成y2=π21z1+π22z2+v2其中,π21=α2β1/(1-α2α1)、π22=β2/(1-α2α1)和v2=(α2u1+u2)/(1-α2α),用外生变量和误差项表示y2的方程y2=π21z1+π22z2+v2是y2的约简型。
参数π21和π1被称为约简型参数,它们是结构方程中出现的结构型参数的非线性函数。
22约简型误差v2是结构型误差u1和u2的线性函数。
因为u1和u2都与z1和z2无关,所以v2也与z1和z2无关。
因此,可用OLS一致地估计π21和π22。
2.联立性偏误及其方向在约简型方程中,除非在特殊的假定之下,否则对方程y1=α1y2+β1z1+u1的OLS估计,将导致α1和β1的估计量有偏误和不一致。
计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:模型设定一一确定变量和数学关系式估计参数一一分析变量间具体的数量关系模型检验一一检验所得结论的可靠性模型应用一一做经济分析和经济预测3、模型变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。
被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。
内生变量:其数值由模型所决定的变量,是模型求解的结果。
外生变量:其数值由模型意外决定的变量。
外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响, 但能够影响我们所研究的本期的内生变量。
前定变量:前定内生变量和外生变量的总称。
数据:时间序列数据:按照时间先后排列的统计数据。
截面数据:发生在同一时间截面上的调查数据。
面板数据:虚拟变量数据:表征政策,条件等,一般取0或1.4、估计评价统计性质的标准无偏:E (人3 )= 3 随机变量,变量的函数?有效:最小方差性一致:N趋近无穷时,3估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比CH2 CH3线性回归模型模型(假设)一一估计参数一一检验一一拟合优度一一预测1、模型(线性)(1)关于参数的线性模型就变量而言是线性的;模型就参数而言是线性的。
Yi = 3 1+ 3 2lnX i+u线性影响随机影响Y i=E (Y|X i) +u E (Y|X i) =f(X i)= 3 1+3 2lnX 引入随机扰动项,(3)古典假设A零均值假定 E ( U i |X i) =0B同方差假定Var(u i|XJ=E(u i2)=2(TC无自相关假定Cov(u i ,u j)=0D随机扰动项与解释变量不相关假定Cov(u i ,X i )=0E正态性假定u~N(0, d 2)F无多重共线性假定Rank(X)=k2、估计在古典假设下,经典框架,可以使用OLS方法:OLS 寻找min Ee i2人B iois = (Y均值)-人B 2(X均值)人B 2ois = Ex i y〃Ex i23、性质OLS回归线性质(数值性质)(1)回归线通过样本均值(X均值,Y均值)(2)估计值人Y的均值等于实际值Y的均值(3)剩余项e i的均值为0(4)被解释变量估计值人Y与剩余项8不相关Cov(人Y,ej=0(5)解释变量X与剩余项8不相关Cov(e i,X i)=0在古典假设下,OLS的统计性质是BLUE统计最佳线性无偏估计4、检验(1) Z检验Ho: B 2=0原假设验证B 2是否显著不为0标准化:Z= (A B 2- B 2) /SE (A B 2)〜N( 0,1 ) 在方差已知,样本充分大用Z检验拒绝域在两侧,跟临界值判断,是否B2显著不为0(2) t检验一一回归系数的假设性检验方差未知,用方差估计量代替 A d 2=Ee i2/(n-k) 重点记忆t =(人卩2- B 2) / A SE (A B 2)〜t (n-2)拒绝域:|t|>=t 2/a( n-2)拒绝,认为对应解释变量对被解释变量有显著影响。
计量经济学复习笔记CH1导论1、计量经济学:以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
研究主体是经济现象及其发展变化的规律。
2、运用计量分析研究步骤:模型设定——确定变量和数学关系式估计参数——分析变量间具体的数量关系模型检验——检验所得结论的可靠性模型应用——做经济分析和经济预测3、模型变量:解释变量:表示被解释变量变动原因的变量,也称自变量,回归元。
被解释变量:表示分析研究的对象,变动结果的变量,也成应变量。
内生变量:其数值由模型所决定的变量,是模型求解的结果。
外生变量:其数值由模型意外决定的变量。
外生变量数值的变化能够影响内生变量的变化,而内生变量却不能反过来影响外生变量。
前定内生变量:过去时期的、滞后的或更大范围的内生变量,不受本模型研究范围的内生变量的影响,但能够影响我们所研究的本期的内生变量。
前定变量:前定内生变量和外生变量的总称。
数据:时间序列数据:按照时间先后排列的统计数据。
截面数据:发生在同一时间截面上的调查数据。
面板数据:虚拟变量数据:表征政策,条件等,一般取0或1.4、估计评价统计性质的标准无偏:E(^β)=β 随机变量,变量的函数?有效:最小方差性一致:N趋近无穷时,β估计越来越接近真实值5、检验经济意义检验:所估计的模型与经济理论是否相等统计推断检验:检验参数估计值是否抽样的偶然结果,是否显著计量经济检验:是否符合计量经济方法的基本假定预测检验:将模型预测的结果与经济运行的实际对比CH2 CH3 线性回归模型模型(假设)——估计参数——检验——拟合优度——预测1、模型(线性)(1)关于参数的线性 模型就变量而言是线性的;模型就参数而言是线性的。
Y i =β1+β2lnX i +u i线性影响 随机影响Y i =E (Y i |X i )+u i E (Y i |X i )=f(X i )=β1+β2lnX i引入随机扰动项,(3)古典假设A 零均值假定 E (u i |X i )=0B 同方差假定 Var(u i |X i )=E(u i 2)=σ2C 无自相关假定 Cov(u i ,u j )=0D 随机扰动项与解释变量不相关假定 Cov(u i ,X i )=0E 正态性假定u i ~N(0,σ2)F 无多重共线性假定Rank(X)=k2、估计在古典假设下,经典框架,可以使用OLS方法:OLS 寻找min ∑e i2 ^β1ols = (Y 均值)-^β2(X 均值)^β2ols = ∑x i y i /∑x i 23、性质OLS 回归线性质(数值性质)(1)回归线通过样本均值 (X 均值,Y 均值)(2)估计值^Y i 的均值等于实际值Y i 的均值(3)剩余项e i 的均值为0(4)被解释变量估计值^Y i 与剩余项e i 不相关 Cov(^Y i ,e i )=0(5)解释变量X i 与剩余项e i 不相关 Cov(e i ,X i )=0在古典假设下,OLS 的统计性质是BLUE 统计 最佳线性无偏估计4、检验(1)Z 检验Ho:β2=0 原假设 验证β2是否显著不为0标准化: Z=(^β2-β2)/SE (^β2)~N (0,1) 在方差已知,样本充分大用Z 检验拒绝域在两侧,跟临界值判断,是否β2显著不为0(2)t 检验——回归系数的假设性检验方差未知,用方差估计量代替 ^σ2=∑e i 2/(n-k) 重点记忆t =(^β2-β2)/^SE (^β2)~t (n-2)拒绝域:|t|>=t 2/a (n-2)拒绝,认为对应解释变量对被解释变量有显著影响。
《计量经济学》各章重点知识总结整理笔记第二章1、变量间的关系分为函数关系与相关关系。
相关系数是对变量间线性相关程度的度量。
2、现代意义的回归是一个被解释变量对若干个解释变量依存关系的研究,回归的实质是由固定的解释变量去估计被解释变量的平均值。
简单线性回归模型是只有一个解释变量的线性回归模型。
3、总体回归函数(PRF )是将总体被解释变量Y 的条件均值()i i E Y X 表现为解释变量X 的某种函数。
样本回归函数(SRF )是将被解释变量Y 的样本条件均值^i Y 表示为解释变量X 的某种函数。
总体回归函数与样本回归函数的区别与联系。
4、随机扰动项i u 是被解释变量实际值i Y 与条件均值()i i E Y X的偏差,代表排除在模型以外的所有因素对Y 的影响。
5、简单线性回归的基本假定:对模型和变量的假定、对随机扰动项u 的假定(零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定)6、普通最小二乘法(OLS )估计参数的基本思想及估计式;OLS 估计式的分布性质及期望、方差和标准误差;OLS 估计式是最佳线性无偏估计式。
7、对回归系数区间估计的思想和方法。
8、拟合优度是样本回归线对样本观测数据拟合的优劣程度,可决系数是在总变差分解基础上确定的。
可决系数的计算方法、特点与作用。
9、对回归系数假设检验的基本思想。
对回归系数t 检验的思想与方法;用P 值判断参数的显著性。
10、被解释变量平均值预测与个别值预测的关系,被解释变量平均值的点预测和区间预测的方法,被解释变量个别值区间预测的方法。
11、运用EViews 软件实现对简单线性回归模型的估计和检验。
第二章主要公式表第三章1、多元线性回归模型是将总体回归函数描述为一个被解释变量与多个解释变量之间线性关系的模型。
通常多元线性回归模型可以用矩阵形式表示。
2、多元线性回归模型中对随机扰动项u的假定,除了零均值假定、同方差假定、无自相关假定、随机扰动与解释变量不相关假定、正态性假定以外,还要求满足无多重共线性假定。
第1章导论1.1 复习笔记考点一:什么是计量经济学★1.计量经济学的产生与发展计量经济学是社会经济发展到一定阶段的客观需要,主要是用来对社会经济问题的数量规律进行研究。
随着世界计量经济学会的成立,计量经济学成为经济学的一门独立学科。
第二次世界大战以后,计量经济学在西方各国得到了广泛的传播,逐渐发展成为经济学中的重要分支。
尤其是在20世纪40~60年代,经典计量经济学逐步完善并得到广泛应用。
目前,计量经济学的理论和应用有了很多突破,形成了众多新的分支学科。
2.计量经济学的性质(1)计量经济学的定义计量经济学是以经济理论和经济数据的事实为依据,运用数学、统计学的方法,通过建立数学模型来研究经济数量关系和规律的一门经济学科。
注意:计量经济学研究的主体是经济现象及其发展变化的规律,所运用的数学方法只是工具,数学方法是为经济问题服务的,所以它是一门经济学科。
(2)计量经济学的类型①理论计量经济学理论计量经济学研究如何建立合适的方法,去测定由计量经济模型所确定的经济关系,理论计量经济学要较多地依赖数理统计学方法。
②应用计量经济学应用计量经济学是运用理论计量经济学提供的工具,研究经济学中某些特定领域经济数量问题的学科。
应用计量经济学研究的是具体的经济现象和经济关系,研究它们在数量上的联系及其变动规律性。
3.计量经济学与其他学科的关系计量经济学是与经济学、经济统计学及数理统计学都有关系的交叉学科。
但计量经济学又不是这些学科的简单结合,它与这些学科既有联系又有区别。
计量经济学与其他学科的联系与区别见表1-1。
表1-1 计量经济学与其他学科的联系与区别考点二:计量经济学的研究步骤★★1.模型设定:确定变量和数学关系式经济模型是指对经济现象或过程的一种数学模拟。
建立模型时需要考虑模型中变量的取舍与相互关系形式的设计(线性关系与非线性关系)这两个主要方面,进而把所研究的主要经济因素(表现为经济变量)之间的关系,用适当的数学关系式近似地、简化地表达出来。
第三讲假设检验一、经典线性模型假定对于模型 01i i i y x ββε=++,利用 OLS 有: 11( ˆi x εββ-=+ 其证明可参见第二讲附录。
在高斯-马尔科夫假定下, OLS 估计量的抽样分布完全取决于误差项的分布。
在高斯 -马尔科夫假定中, 我们要求误差项是序列无关与同方差的。
现在,我们施加更强的假定,即误差项服从正态分布,即2(0, i N δε 。
应该注意到,当误差项服从正态分布时, 序列无关与独立性是等价的。
因此,我们可以把上述分布假设写为:. . 2(0, i i di N δε , 即误差项服从独立同正态分布。
为什么要施加更强的假定呢 ? 这是为了进行小样本下的假设检验。
2(0, i N δε 与高斯 -马尔科夫假定一起,被称为经典线性模型假定。
在经典线性模型假定下, 可以证明, OLS 估计量是方差最小的无偏估计量(注意此时不需要把比较范围限制在线性估计量之中, 因此该结论比高斯 -马尔科夫定理更强。
施加更多的假设而得到更强结论, 这非常自然! 。
笔记:1、假设误差项服从正态分布的合理性在于,误差项是由很多因素构成的, 当这些因素是独立同分布时, 依照中心极限定理, 那么这些因素之和应该近似服从正态分布。
当然, 这并不意味着用正态分布来近似误差项的分布总是恰当的, 例如, 各因素或许并不同分布。
另外,如果 y 是价格这样的变量,那么假设误差项服从正态分布是不合理的, 因为价格不可能是负数, 不过我们可以进行变量变换,例如对价格取自然对数或者考察价格的变化率, 那么经过变量变换之后, 或许再假设误差项服从正态分布就变得合理了。
2、如果能够对误差项是否服从正态分布进行检验,那最好不过了。
一种常用的检验方法是 Jarqe-Bera 检验,这可以参见相关的教科书。
问题是,尽管我们能观察到解释变量、被解释变量的取值,然而,由于对参数的真实取值无法确定,因此误差是观测不到的, 我们或许不得不利用残差来代替误差以进行相关的检验。
第一章:绪论1.计量经济学的学科属性、计量经济学与经济学、数学、统计学的关系;2.计量经济研究的四个基本步骤(1)建立模型(依据经济理论建立模型,通过模型识别、格兰杰因果关系检验、协整关系检验建立模型);(2)估计模型参数(满足基本假设采用最小二乘法,否则采用其他方法:加权最小二乘估计、模型变换、广义差分法等);(3)模型检验:经济意义检验(普通模型、双对数模型、半对数模型中的经济意义解释,见例1、例2),统计检验(T 检验,拟合优度检验、F 检验,联合检验等);计量经济学检验(异方差、自相关、多重共线性、在时间序列模型中残差的白噪声检验等);(4)模型应用。
例1:在模型中,y 某类商品的消费支出,x 收入,P 商品价格,试对模型进行经济意义检验,并解释21,ββ的经济学含义。
t t t P x y 31.0ln 25.0213.0ln -+=∧,其中参数21,ββ都可以通过显著性检验。
经济意义检验可以通过(商品需求与收入正相关、与商品价格负相关)。
商品消费支出关于收入的弹性为0.25()/ln(25.0)/ln(11-∧-=t t t t x x y y );价格增加一个单位,商品消费需求将减少31%。
例2:研究金融发展与贫富差距的关系,认为金融发展先使贫富差距加大(恶化),尔后会使贫富差距降低(好转),成为倒U 型。
贫富差距用GINI 系数表示,金融发展用(贷款余额/存款总额)表示。
回归结果为: 229.164.034.2t t t x x GINI -+=∧,模型参数都可以通过显著性检验。
在x 的有意义的变化范围内,GINI 系数的值总是大于1,细致分析后模型变的毫无意义;同样的模型还有:GINI 系数的值总是为负231.1412.734.13t t t x x GINI -+-=∧。
3.计量经济学中的一些基本概念数据的三种类型:横截面数据、时间序列数据、面板数据;线性模型的概念;模型的解释变量与被解释变量,被解释变量为随机变量(如 果一个变量为随机变量,并与随机扰动项相关,这个变量称为内生变量),被解释变量为内生变量,有些解释变量也为内生变量。
(财务知识)计量经济学读书笔记最全版(财务知识)计量经济学读书笔记计量经济学读书笔记第壹部分基础内容一、计量经济学和相关学科的关系二、古典假设下计量经济学的建模过程1.依据经济理论建立模型2.抽样数据收集3.参数估计4.模型检验(1)经济意义检验(包括参数符号、参数大小等)(2)统计意义检验(拟合优度检验、模型显著性检验、参数显著性检验)(3)计量经济学检验(异方差检验、自相关检验、多重共线性检验)(4)模型预测性检验(超样本特性检验)5.模型的应用(结构分析、经济预测、政策评价、检验和发展经济理论)三、几个重要的“变量”1.解释变量和被解释变量2.内生变量和外生变量3.滞后变量和前定变量4.控制变量四、回归中的四个重要概念1.总体回归模型(PopulationRegressionModel,PRM)--代表了总体变量间的真实关系。
2.总体回归函数(PopulationRegressionFunction,PRF)--代表了总体变量间的依存规律。
3.样本回归函数(SampleRegressionFunction,SRF)--代表了样本显示的变量关系。
4.样本回归模型(SampleRegressionModel,SRM)---代表了样本显示的变量依存规律。
总体回归模型和样本回归模型的主要区别是:①描述的对象不同。
总体回归模型描述总体中变量y和x的相互关系,而样本回归模型描述所关的样本中变量y和x的相互关系。
②建立模型的依据不同。
总体回归模型是依据总体全部观测资料建立的,样本回归模型是依据样本观测资料建立的。
③模型性质不同。
总体回归模型不是随机模型,而样本回归模型是壹个随机模型,它随样本的改变而改变。
总体回归模型和样本回归模型的联系是:样本回归模型是总体回归模型的壹个估计式,之所以建立样本回归模型,目的是用来估计总体回归模型。
五、随机误差项的内容1.模型中被忽略的影响因素的影响2.模型关系设定不准确的影响3.变量的测量误差影响4.随机因素影响六、壹元线性回归模型的基本假定(古典假定)①零均值②同方差③无自相关性④解释变量和随机扰动项不相关⑤随机扰动项服从正态分布⑥解释变量之间不相关(多重共线性)(属于多元线性回归假定)七、OLS估计式特性(BestLinearUnbiasedEstimators)线性性(Linear,指参数估计量和分别为观测值和随机误差项的线性函数或线性组合)无偏性(Unbiased,指参数估计量和的均值分别等于总体参数值和)最小方差性(Best,有效性,指在所有的线性、无偏估计量中,最小二乘估计量和的方差最小)第二部分计量经济检验在古典线性回归模型中,应用最小二乘法估计的估计量具有BLUE 的特性,可是当模型不是线性模型和不满足古典假设的时候,最小二乘法估计的估计量不再有BLUE的特性。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解目录第1章计量经济学的性质与经济数据1.1复习笔记1.2课后习题详解第一篇横截面数据的回归分析第2章简单回归模型2.1复习笔记2.2课后习题详解第3章多元回归分析:估计3.1复习笔记3.2课后习题详解第4章多元回归分析:推断4.1复习笔记4.2课后习题详解第5章多元回归分析:OLS的渐近性5.1复习笔记5.2课后习题详解第6章多元回归分析:深入专题6.1复习笔记6.2课后习题详解第7章含有定性信息的多元回归分析:二值(或虚拟)变量7.1复习笔记7.2课后习题详解第8章异方差性8.1复习笔记8.2课后习题详解第9章模型设定和数据问题的深入探讨9.1复习笔记9.2课后习题详解第二篇时间序列数据的回归分析第10章时间序列数据的基本回归分析10.1复习笔记10.2课后习题详解第11章OLS用于时间序列数据的其他问题11.1复习笔记11.2课后习题详解第12章时间序列回归中的序列相关和异方差性12.1复习笔记12.2课后习题详解第三篇高级专题讨论第13章跨时横截面的混合:简单面板数据方法13.1复习笔记13.2课后习题详解第14章高级的面板数据方法14.2课后习题详解第15章工具变量估计与两阶段最小二乘法15.1复习笔记15.2课后习题详解第16章联立方程模型16.1复习笔记16.2课后习题详解第17章限值因变量模型和样本选择纠正17.1复习笔记17.2课后习题详解第18章时间序列高级专题18.1复习笔记18.2课后习题详解第19章一个经验项目的实施19.2课后习题详解本书是伍德里奇《计量经济学导论》(第5版)教材的学习辅导书,主要包括以下内容:(1)整理名校笔记,浓缩内容精华。
每章的复习笔记以伍德里奇所著的《计量经济学导论》(第5版)为主,并结合国内外其他计量经济学经典教材对各章的重难点进行了整理,因此,本书的内容几乎浓缩了经典教材的知识精华。
(2)解析课后习题,提供详尽答案。
引言计量经济学建模方法:1)理论或假设的陈述;2)理论的数学模型的设定;3)理论的计量经济模型的设定;4)获取资料;5)计量经济模型的参数估计;6)假设检验;7)预报或预测;8)利用模型进行控制或制定政策。
第一章回归分析的性质1、回归分析:研究一个叫应变量的变量对另一个或多个叫做解释变量的变量的依赖关系,其用意在于通过后者的已知或设定值,去估计和预测前者的均值。
2、虚拟变数:定性变量或范畴变量。
3、时间序列数据:一个变量在不同时间取值的一组观测结果。
4、横截面数据:一个或多个变量在同一时间点上收集的数据。
5、实验资料:在保持一些因素不变的情况下收集数据。
、6、非实验资料:收集的资料不受研究者控制。
、7、回归分析的主要用意,是分析一个叫做应变量的变量,对另一个或多个叫做解释变量的变量的统计依赖性,这种分析的目的,是要在解释变量已知或固定值的基础上,估计和预测应变量的均值,实际上,回归分析的成功有赖于适用资料的获得。
、、第二章 双变量回归分析:一些基本概念1、总回归函数(PRF ):)()(i i X f X Y E =它仅仅表明在给定i X 下Y 分布的均值与i X 有函数关系,换句话说,他说出应变量的均值或平均值是怎样随解释变量变化的。
在几何意义上,总体回归曲线就是解释变量给定值时应变量的条件均值或期望值的轨迹。
、i i X X Y E 21)/(ββ+=:称为线性总体回归函数或简称线性总体回归。
2、PRF 的随机设定)/(i i i X Y E Y u -= 或 i i i u X Y E Y +=)/(i u 称为随机干扰项或随机误差。
是从模型中省略下来的而又集体地影响这应变量的全部变量的替代物。
)/(i X Y E 这一个成分被称为系统性或确定性成份;i u 为随机或非系统性成分。
若i i X X Y E 21)/(ββ+=ii i u X Y ++=21ββ3、随机干扰项的意义 1)理论的模糊性。
第三讲 假设检验
一、 经典线性模型假定
对于模型01i i
i y x ββε=++, 利用OLS 有: 112()ˆ()
i i i x x x x εββ-=+-∑∑ 其证明可参见第二讲附录。
在高斯-马尔科夫假定下, OLS 估计量的抽样分布完全取决于误差项的分布。
在高斯-马尔科夫假定中, 我们要求误差项是序列无关与同方差的。
现在, 我们施加更强的假定, 即误差项服从正态分布, 即2(0,)i N δε。
应该注意到, 当误差项服从正态分布时, 序列无关与独立性是等价的。
因此, 我们能够把
上述分布假设写为: ..2(0,)i i d
i N δε, 即误差项服从独立同正态分布。
为什么
要施加更强的假定呢? 这是为了进行小样本下的假设检验。
2(0,)i N δε与高斯-马尔科夫假定一起, 被称为经典线性模型假定。
在经典线性模型假定下, 能够证明, OLS 估计量是方差最小的无偏估计量( 注意此时不需要把比较范围限制在线性估计量之中, 因此该结论比高斯-马尔科夫定理更强。
施加更多的假设而得到更强结论, 这非常自然! ) 。
笔记:
1、 假设误差项服从正态分布的合理性在于, 误差项是由很多因素构成的, 当这些因素是独立同分布时, 依照中心极限定理, 那么这些因素之和应该近似
服从正态分布。
当然, 这并不意味着用正态分布来近似误差项的分布总是恰当的, 例如, 各因素或许并不同分布。
另外, 如果y 是价格这样的变量, 那么假设误差项服从正态分布是不合理的, 因为价格不可能是负数, 不过我们能够进行变量变换, 例如对价格取自然对数或者考察价格的变化率, 那么经过变量变换之后, 或许再假设误差项服从正态分布就变得合理了。
2、 如果能够对误差项是否服从正态分布进行检验, 那最好不过了。
一种常见的检验方法是Jarqe-Bera 检验, 这能够参见相关的教科书。
问题是, 尽管我们能观察到解释变量、 被解释变量的取值, 然而, 由于对参数的真实取值无法确定, 因此误差是观测不到的, 我们或许不得不利用残差来代替误差以进行相关的检验。
当然, 一个前提是残差确实是对误差的良好近似, 这进而要求, 我们对参数的估计是合理的。
3、 根据公式:
111221()()1ˆ()()i i i i i i
N x x N x x x x x x εεβββ=•--=++--∑∑∑∑ 考虑x 非随机这种简单情况, 显然, 当样本容量很大时, 只要误差项是独立同分布的( 并不需要要假定误差项服从正态分布) , 那么根据中心极限定理, 1ˆβ应该近似服从正态分布。
当然, 为了保证误差项的独立性, 抽样的随机性十分关键。
二、 利用标准正态分布作假设检验
假定01i i
i y x ββε=++是真实模型, 当然我们并不知道各参数的真实值是多少。
如果某一经济经济理论预言1ωβ=, 而现在你手中正掌握一样本, 一个问题是, 你所掌握的样本支持这个预言吗?
笔记:
由于抽样误差的存在, 1ˆβ恰好等于ω的概率很小。
然而, 即使1
ˆωβ=, 我们也不能说理论被证实, 因为计量经济学方法本质上是属于归纳法, 而且由于其结论是基于某一样本而得到的, 因此它还是属于不完全归纳, 故, 计量经济学不能证实经济学理论。
当然, 计量经济学也不能推翻经济学理论。
经济学理论是逻辑推导, 其正确与否需要从逻辑入手。
总而言之, 我们能够说的是”样本
是否支持某个理论的预言”或者”样本与某个理论的预言是否一致”。
在经典线性模型假定下, 1121ˆˆ(,)N βββδ~或者
111ˆˆ()/()(0,1)sd N βββ-~①, 其中122ˆ2()i x x βδδ=
-∑
,
1
ˆ()sd β=。
练习: 确定0
ˆβ的分布。
现在, 假设经济理论的预言是正确的, 那么针对特定的样本你将得到标准正态分布图横坐标上的一个点: 11
ˆˆ()/()sd βωβ-②。
现在来考察标准正态分布。
在该分布上, 存在对称的两点: 0.025z 与0.025z -, 其中:
0.0250.025Pr()Pr()0.025Z z Z z ≥=≤-=
如果把概率为5%的事件称为小概率事件, 那么, 当
11ˆˆ()/()sd βωβ-的取
①定义111
ˆˆz ()/()sd βββ=-, 则z 就是所谓的z 统计量。
估计量是用来估计真实参数的, 而统计量是用来做统计推断(或者假设检验) 的; 统计量是随机的, 其分布也被称为抽样分布, 针对特定样本, 我们得到统计量值, 它是非随机的。
②在这里, 该式是非随机的, 而特别应该注意的是, 分子中的1
ˆβ是估计值, 而分母中的1
ˆβ是估计量。
估计值的标准差是零! 。
值大于0.025z 或者小于0.025z -时, 我们认为小概率事件发生了! 小概率事件一般是不容易发生的, 现在居然发生了, 因此, 我们应该怀疑上述经济理论所作出的预言。
笔记:
举一个生活中的例子。
我预先认为某一个同学十分优秀。
优秀学生某一次考试考砸了非常正常, 然而连续十次考试考砸了就应该是小概率事件了。
如果我预先所认为的那一个优秀同学确实连续十次考试都考砸了, 我是不是应该对我的先验判断产生怀疑? 当然, 如果我就此认为那一个同学并不优秀, 我也会犯错误, 此即”第一类错误”, 即”弃真”的错误。
但犯这个错误的概率是很小的。
如果优秀学生连续十次考试考砸了其概率是5%, 那么我犯”第一类错误”的概率就是5%。
问题是, 为什么我们取正态分布两端的区间作为小概率区间呢? 为什么我们不在正态分布密度曲线中随意取一小段作为小概率区间?
从直觉上看, 当1ωβ=这个假设为真时, 即使估计值1
ˆβ与ω完全相等不太可能, 但估计值1
ˆβ应该接近于ω。
然而我们也要注意到, 正确1β估计还存在精确性问题, 这经过
1ˆβ统计量的标准差体现出来。
也就是说, 在原假设为真时, 即使估计值1ˆβ与ω有一定的差异, 然而如果1
ˆ()sd β较大, 那么在1
ˆβ与ω间存在一定的可能是正常的。
不过总的来看, 当原假设为真时, z 统计量值是应该接近于0的, 这要么是因为11
ˆˆ()/()z sd βωβ=-中的分子确实接近于0, 要么是因为尽管1ˆβ与ω有一定的差异, 但主要是由1
ˆ()sd β较
大所引起的。
当z 统计量值与0具有较大差异时, 那么
1ωβ=这个假设的真实
性是值得怀疑的!
假设检验的正式步骤是:
( 1) 建立原假设与备择假设: 0111::H H βω
βω
=≠
笔记: 原假设与备择假设互斥; 假设体系应该是完备的, 即原假设与备择假设两者之一必为真, 但两者不能同时为真。
( 2) 确定小概率标准a 。
经常我们把1%、 5%或者10%作为小概率标准。
对a 更加正式的称呼是”显著水平”。
( 3) 考察统计量值11
ˆˆ()/()sd βωβ-是否落在拒绝域: /2/2(,][,)a a z z -∞-⋃+∞之内。
如果落在上述区间之内, 那么在a 显著水平上, 我们拒绝原假设, 接受备择假设; 反之, 我们不拒绝原假设, 拒绝备择假设。
笔记:
1、 为什么当统计量值落在拒绝域/2/2(,][,)a a z z -∞-⋃+∞之外时我们说”不拒绝原假设”而不是说”接受原假设”? 其解释是: 我们能够作出很多的原假设, 例如11βω=或者12βω=而我们所计算出来的一些统计量值恰
好都落在/2/2(,][,)a a z z -∞-⋃+∞之外, 难道我们既接受1
1βω=也接受12βω=? 显然更恰当的表示方式是, 即不拒绝11βω=也不拒绝12βω=。