高级计量经济学多元线性回归模型
- 格式:ppt
- 大小:498.00 KB
- 文档页数:84
第三章 多元线性回归与最小二乘估计3.1 假定条件、最小二乘估计量和高斯—马尔可夫定理1、多元线性回归模型:y t = β0 +β1x t 1 + β2x t 2 +…+ βk - 1x t k -1 + u t (3.1) 其中y t 是被解释变量(因变量),x t j 是解释变量(自变量),u t 是随机误差项,βi , i = 0, 1, … , k - 1是回归参数(通常未知)。
对经济问题的实际意义:y t 与x t j 存在线性关系,x t j , j = 0, 1, … , k - 1, 是y t 的重要解释变量。
u t 代表众多影响y t 变化的微小因素。
使y t 的变化偏离了E( y t ) = β0 +β1x t 1 + β2x t 2 +…+ βk - 1x t k -1 决定的k 维空间平面。
当给定一个样本(y t , x t 1, x t 2 ,…, x t k -1), t = 1, 2, …, T 时, 上述模型表示为 y 1 = β0 +β1x 11 + β2x 12 +…+ βk - 1x 1 k -1 + u 1,y 2 = β0 +β1x 21 + β2x 22 +…+ βk - 1x 2 k -1 + u 2, (3.2) ………..y T = β0 +β1x T 1 + β2x T 2 +…+ βk - 1x T k -1 + u T经济意义:x t j 是y t 的重要解释变量。
代数意义:y t 与x t j 存在线性关系。
几何意义:y t 表示一个多维平面。
此时y t 与x t i 已知,βj 与 u t 未知。
)1(21)1(110)(111222111111)1(21111⨯⨯-⨯---⨯⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡+⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡T T k k k T k T TjT k j k jT T u u u x x x x x x x x x y y yβββ (3.3) Y = X β + u (3.4)2假定条件为保证得到最优估计量,回归模型(3.4)应满足如下假定条件。
计量经济学实验报告(多元线性回归自相关 )1. 背景计量经济学是一门关于经济现象的定量分析方法研究的学科。
它的发展使得我们可以对经济现象进行更加准确的分析和预测,并对社会发展提供有利的政策建议。
本文通过对多元线性回归模型和自相关模型的实验研究,来讨论模型的建立与评价。
2. 多元线性回归模型在多元线性回归模型中,我们可以通过各个自变量对因变量进行预测和解释。
例如,我们可以通过考虑家庭收入、年龄和教育程度等自变量,来预测某个家庭的消费水平。
多元线性回归模型的一般形式为:$y_i=\beta_0+\beta_1 x_{i1}+\beta_2 x_{i2}+...+\beta_k x_{ik}+\epsilon_i$在建立模型之前,我们需要对因变量和自变量进行观测和测算。
例如,我们可以通过调查一定数量的家庭,获得他们的收入、年龄、教育程度和消费水平等数据。
接下来,我们可以通过多元线性回归模型,对家庭消费水平进行预测和解释。
在实际的研究中,我们需要对多元线性回归模型进行评价。
其中一个重要的评价指标是 $R^2$ 值,它表示自变量对因变量的解释程度。
$R^2$ 值越高,说明多元线性回归模型的拟合程度越好。
3. 自相关模型在多元线性回归模型中,我们假设各个误差项之间相互独立,即不存在自相关性。
但实际上,各个误差项之间可能会互相影响,产生自相关性。
例如,在一个气温预测模型中,过去的温度对当前的温度有所影响,说明当前的误差项和过去的误差项之间存在相关性。
我们可以通过自相关函数来研究误差项之间的相关性。
自相关函数表示当前误差项和过去 $l$ 期的误差项之间的相关性。
其中,$l$ 称为阶数。
自相关函数的一般形式为:$\rho_l={\frac{\sum_{t=l+1}^{T}(y_t-\bar{y})(y_{t-l}-\bar{y})}{\sum_{t=1}^{T}(y_t-\bar{y})^2}}$在自相关模型中,我们通过对误差项进行差分或滞后变量,来消除误差项之间的自相关性。
第五章 多元线性回归模型在第四章中,我们讨论只有一个解释变量影响被解释变量的情况,但在实际生活中,往往是多个解释变量同时影响着被解释变量。
需要我们建立多元线性回归模型。
一、多元线性模型及其假定 多元线性回归模型的一般形式是i iK K i i i x x x y εβββ++++= 2211令列向量x 是变量x k ,k =1,2,的n 个观测值,并用这些数据组成一个n ×K 数据矩阵X ,在多数情况下,X 的第一列假定为一列1,则β1就是模型中的常数项。
最后,令y 是n 个观测值y 1, y 2, …, y n 组成的列向量,现在可将模型写为:εββ++=K K x x y 11构成多元线性回归模型的一组基本假设为 假定1. εβ+=X y我们主要兴趣在于对参数向量β进行估计和推断。
假定2. ,0][][][][21=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡=n E E E E εεεε 假定3. n I E 2][σεε='假定4. 0]|[=X E ε我们假定X 中不包含ε的任何信息,由于)],|(,[],[X E X Cov X Cov εε= (1)所以假定4暗示着0],[=εX Cov 。
(1)式成立是因为,对于任何的双变量X ,Y ,有E(XY)=E(XE(Y|X)),而且])')|()([(])')((),(EY X Y E EX X E EY Y EX X E Y X Cov --=--=))|(,(X Y E X Cov =这也暗示 βX X y E =]|[假定5 X 是秩为K 的n ×K 随机矩阵 这意味着X 列满秩,X 的各列是线性无关的。
在需要作假设检验和统计推断时,我们总是假定: 假定6 ],0[~2I N σε 二、最小二乘回归 1、最小二乘向量系数采用最小二乘法寻找未知参数β的估计量βˆ,它要求β的估计βˆ满足下面的条件 22min ˆ)ˆ(ββββX y X y S -=-∆ (2)其中()()∑∑==-'-=⎪⎪⎭⎫ ⎝⎛-∆-nj Kj j ij i X y X y x y X y 1212ββββ,min 是对所有的m 维向量β取极小值。
计量经济学复习笔记(四):多元线性回归⼀元线性回归的解释变量只有⼀个,但是实际的模型往往没有这么简单,影响⼀个变量的因素可能有成百上千个。
我们会希望线性回归模型中能够考虑到这些所有的因素,⾃然就不能再⽤⼀元线性回归,⽽应该将其升级为多元线性回归。
但是,有了⼀元线性回归的基础,讨论多元线性回归可以说是轻⽽易举。
另外我们没必要分别讨论⼆元、三元等具体个数变量的回归问题,因为在线性代数的帮助下,我们能够统⼀讨论对任何解释变量个数的回归问题。
1、多元线性回归模型的系数求解多元线性回归模型是⽤k 个解释变量X 1,⋯,X k 对被解释变量Y 进⾏线性拟合的模型,每⼀个解释变量X i 之前有⼀个回归系数βi ,同时还应具有常数项β0,可以视为与常数X 0=1相乘,所以多元线性回归模型为Y =β0X 0+β1X 1+β2X 2+⋯+βk X k +µ,这⾥的µ依然是随机误差项。
从线性回归模型中抽取n 个样本构成n 个观测,排列起来就是Y 1=β0X 10+β1X 11+β2X 12+⋯+βk X 1k +µ1,Y 2=β0X 20+β1X 21+β2X 22+⋯+βk X 2k +µ2,⋮Y n =β0X n 0+β1X n 1+β2X n 2+⋯+βk X nk +µn .其中X 10=X 20=⋯=X n 0=1。
⼤型⽅程组我们会使⽤矩阵表⽰,所以引⼊如下的矩阵记号。
Y =Y 1Y 2⋮Y n,β=β0β1β2⋮βk,µ=µ1µ2⋮µn.X =X 10X 11X 12⋯X 1k X 20X 21X 22⋯X 2k ⋮⋮⋮⋮X n 0X n 1X n 2⋯X nk.在这些矩阵表⽰中注意⼏点:⾸先,Y 和µ在矩阵表⽰式中都是n 维列向量,与样本容量等长,在线性回归模型中Y ,µ是随机变量,⽽在矩阵表⽰中它们是随机向量,尽管我们不在表⽰形式上加以区分,但我们应该根据上下⽂明确它们到底是什么意义;β是k +1维列向量,其长度与Y ,µ没有关系,这是因为β是依赖于变量个数的,并且加上了对应于常数项的系数(截距项)β0;最后,X 是数据矩阵,且第⼀列都是1。
综合练习题1.多元线性回归模型:i ki k i i i X X X Y μββββ++⋅⋅⋅+++=22110 ),0(~2σμN i n i ,2,1 =模型设定是正确的。
如果遗漏了显著的变量k X ,构成一个新模型i i k k i i i X X X Y εββββ++⋅⋅⋅+++=--1122110试回答:⑴ 如果k X 与其它解释变量完全独立,用OLS 分别估计原模型和新模型,110,,,-k βββ 的估计结果是否变化?为什么?⑵ 如果k X 与其它解释变量线性相关,用OLS 分别估计原模型和新模型,110,,,-k βββ 的估计结果是否变化?为什么?⑶ 如果k X 是确定性变量,写出新模型中i ε的分布。
()2i i ,~σβμεk k X N +⑷ 如果k X 是随机变量,且服从正态分布,指出新模型中的i ε是否服从正态分布?为什么? ⑸ 如果k X 是随机变量,且服从正态分布,指出新模型是否存在异方差性?为什么?2. 多元线性回归模型:i ki k i i i X X X Y μββββ++⋅⋅⋅+++=22110 ),0(~2σμN i n i ,2,1 =现有n 组样本观测值,其中b Y a i <<(n i ,2,1 =),将它们看着是在以下3种不同的情况下抽取获得的:①完全随机抽取,②被解释变量被限制在大于a 的范围内随机抽取,③被解释变量被限制在大于a 小于b 的范围内随机抽取。
⑴ 用OLS 分别估计3种情况下的模型,结构参数估计量是否等价?为什么?⑵ 用ML 分别估计3种情况下的模型,结构参数估计量是否等价?为什么?⑶ 用ML 分别估计3种情况下的模型,比较3种情况的似然函数值。
3. 回答以下问题:⑴ 一位同学在综合练习中根据需求法则建立中国食品需求模型,以31个省会城市2006年数据为样本,以人均年食品消费量为被解释变量,以食品价格指数为解释变量,建立一元回归模型,估计得到食品价格指数的参数为正,于是发现“需求法则不适用于中国”。