第三章 多元线性回归模型
- 格式:doc
- 大小:32.50 KB
- 文档页数:2
第三章 多元线性回归模型一、知识点列表二、关键词1、多元线性回归模型的代数和矩阵表示形式 关键词: 多元线性总体回归模型多元线性总体回归模型是指被解释变量y 与多个解释变量12,,,n x x x 之间具有线性关系,是解释变量的多元线性函数。
可以表达为:01122(1,2,3,,)i i i k ki iy x x x i n ββββμ=++++=多元线性回归模型相对于一元线性回归模型来说,其解释变量较多,因而计算公式比较复杂。
必要时需要借助计算机来进行。
2、多元线性回归模型的基本假设 关键词: 线性于参数总体回归模型是关于参数是线性的,因此称其为线性于参数。
关键词:完全共线性在样本中,没有一个自变量是常数,自变量之间也不存在严格(完全)的线性关系。
如果方程中有一个自变量是其他自变量的线性组合,那么我们说这个模型遇到了完全共线性问题。
关键词:零条件数学期望给定解释变量的任何值,误差的期望值为零,即:12(|,,,)0n E u x x x =。
关键词:内生解释变量和外生解释变量如果解释变量满足零条件数学期望,则称该自编为内生解释变量;反之,则为外生解释变量。
关键词:同方差对于解释变量的所有观测值,随机误差项有相同的方差,即:22()(),(1,2,3,,)i i Var u E u i n δ===关键词:无序列相关性随机误差项两两不相关。
即(,)(,)0,(,,1,2,3,,)i i i i Cov u u E u u i j i j n ==≠=关键词:最优线性无偏估计量满足以下假设条件的OLS 估计量称为最优线性无偏估计量:(1)线性与参数;(2)X 固定;(3)X 有变异;(4)不存在完全共线性;(5)零条件数学期望;(6)同方差;(7)无序列相关性。
关键词:经典正态线性回归模型如果回归模型的OLS 估计量为最优线性无偏估计量,并且随机误差项u 服从均值为零,方差为2δ的正态分布,则称该线性回归模型为经典正态线性回归模型。
第三章 多元线性回归模型一、名词解释1、多元线性回归模型:在现实经济活动中往往存在一个变量受到其他多个变量影响的现象,表现在线性回归模型中有多个解释变量,这样的模型被称做多元线性回归模型,多元是指多个解释变量2、调整的可决系数2R :又叫调整的决定系数,是一个用于描述多个解释变量对被解释变量的联合影响程度的统计量,克服了2R 随解释变量的增加而增大的缺陷,与2R 的关系为2211(1)1n R R n k -=----。
3、偏回归系数:在多元回归模型中,每一个解释变量前的参数即为偏回归系数,它测度了当其他解释变量保持不变时,该变量增加1单位对被解释变量带来的平均影响程度。
4、正规方程组:采用OLS 方法估计线性回归模型时,对残差平方和关于各参数求偏导,并令偏导数为0后得到的方程组,其矩阵形式为ˆX X X Y β''=。
5、方程显著性检验:是针对所有解释变量对被解释变量的联合影响是否显著所作的检验,旨在对模型中被解释变量与解释变量之间的线性关系在总体上是否显著成立作出判断。
二、单项选择题1、C :F 统计量的意义2、A :F 统计量的定义3、B :随机误差项方差的估计值1ˆ22--=∑k n e iσ4、A :书上P92和P93公式5、C :A 参看导论部分内容;B 在判断多重共线等问题的时候,很有必要;D 在相同解释变量情况下可以衡量6、C :书上P99,比较F 统计量和可决系数的公式即可7、A :书P818、D :A 截距项可以不管它;B 不考虑beta0;C 相关关系与因果关系的辨析 9、B :注意!只是在服从基本假设的前提下,统计量才服从相应的分布10、D :AB 不能简单通过可决系数判断模型好坏,还要考虑样本量、异方差等问题;三、多项选择题1、ACDE :概念性2、BD :概念性3、BCD :总体显著,则至少一个参数不为04、BC :参考可决系数和F 统计量的公式5、AD :考虑极端情况,ESS=0,可发现CE 错四、判断题、 1、√2、√3、×4、×:调整的可决系数5、√五、简答题 1、 答:多元线性回归模型与一元线性回归模型的区别表现在如下几个方面:一是解释变量的个数不同;二是模型的经典假设不同,多元线性回归模型比一元线性回归模型多了个“解释变量之间不存在线性相关关系”的假定;三是多元线性回归模型的参数估计式的表达更为复杂。
第三章 多元线性回归模型第一节 多元线性回归模型及基本假定问题:只有一个解释变量的线性回归模型能否满足分析经济问题的需要?简单线性回归模型的主要缺陷是:把被解释变量Y 看成是解释变量X 的函数是前提是,在其它条件不变的情况下,并且,所有其它影响Y 的因素都应与X 不相关,但这在实际情况中很难满足。
怎样在一元线性回归的基础上引入多元变量的回归? 看教科书第72—73页关于汽车销售量的影响因素的讨论。
一、多元线性回归模型的意义1、建立多元线性回归模型的意义,即一元线性回归模型的缺陷,多个主要影响因素的缺失对模型的不利影响。
在一元线性回归模型中,如果总体回归函数的设定是正确的,那么,根据样本数据得到的样本回归模型就应该有较好的拟合效果,这时,可决系数就应该较大。
相反,如果在模型设定时忽略了影响被解释变量的某些重要因素,拟合效果可能就会较差,此时可决系数会偏低,并且由于忽略了一些重要变量而对误差项的影响会加大,这时误差项会表现出一些违背假定的情况。
2、从一个解释变量到多个解释变量的演变。
一个生产函数的例子,一个商品需求函数的例子,(教材第74页)。
二、多元线性回归模型及其矩阵表示1、一般线性回归模型的数学表达式。
设 12233i ii k k ii Y XXXu ββββ=+++++i=1,2,3,…,n在模型表达式里,1β仍是截距项,它反映的是当所有解释变量取值为零时,被解释变量Y 的取值;j β(j=2,3,…,k )为斜率系数,它的经济含义:在其它变量不变的情况下,第j 个解释变量每变动一个单位,Y 平均增加(或减少)j β个单位,这就是所谓的运用边际分析法对多元变量意义下回归参数的解释。
因此,称j β为偏回归系数,它反映了第j 个解释变量对Y 的边际影响程度。
4、2、总体回归函数,即12233(|)i i i k ki E Y X X X X ββββ=++++3、样本回归函数,即12233ˆˆˆˆˆi i k k iY X X Xββββ=++++ 4、将n 个样本观测值代入上述表达式,可得到从形式上看,像似方程组的形式。
第一章多元线性回归模型
前一章讲的简单线性回归模型,主要讨论的是一个应变量和一个解释变量之间的线性关系。
而在实际的经济问题中,一个经济变量往往同多个经济变量相联系。
比如,我们前面一直在举的例子:说消费支出与收入有关,而在实际生活中,消费支出同时又会与家庭的财富总量有关,还可能会与所处的年龄段、性别、所受教育程度等因素有关。
所以,我们有必要将一个解释变量的情况推广到多个解释变量。
利用多元回归方法进行分析/
第一节多元线性回归模型及古典假定
一、多元线性回归模型
1、多元线性回归模型的一般形式:
总体回归方程:E(Y│X1,X2,…Xk)=β0+β1X1+β2X2+β3X3+…+βkXk
Y=β0+β1X1+β2X2+β3X3+…+βkXk+µ
样本回归方程:Y=β0+β1X1+β2X2+β3X3+…+βkXk
Y=β0+β1X1+β2X2+β3X3+…+βkXk+e
2、回归系数的经济意义:
简单线性回归中的回归系数的经济意义:如 Y=50.78+0.86X 系数代表每增加一元收入,消费支出要增加0.86元
多元线性回归中的回归系数的经济意义:由于多个解释变量会同时对应变量的变动发挥作用,因此,如果我们要考察其中某个解释变量对应变量的影响,就必须使其他解释变量保持不变来进行分析.所以,模型中的单个回归系数βj就表示当控制其他解释变量不变的条件下,第j个解释变量的单位变动对应变量均值的影响.
多元线性回归模型中这样的回归系数,称为偏回归系数。
与简单线性回归分析一样,多元线性回归分析要解决的主要问题仍是:根据观测样本估计模型中的各个参数;对估计的参数及回归方程进行统计检验;利用回归模型进行预测和经济分析。
二、模型的古典假定
在回归分析中,为了使所作出的估计具有较好的统计性质,我们对模型中的随机扰动项和解释变量作出一些假定。
多元线性回归模型的假定条件有:
假定1:零均值假定: 即假定随机扰动项彻底均值为零E(μi)= 0
假定2:同方差假定: μi 的方差为某个相同的常数Var(μi)=σ2
假定3:无自相关假定: 随机扰动项μi的逐次值互不相关
Cov(μi , μj )=0 (i≠j)
假定4:随机扰动项μi与解释变量Xi 不相关。
Cov(μi ,Xi )=0
假定5:正态性假定,即假定μi服从均值为零、方差为σ2的正态分布u~ N (0, σ2)
假定6:无多重共线性假定:即假定各解释变量之间不存在线性关系,或者说各解释变量的观测值之间线性无关。
(这是多元线性回归模型与简单线性回归模型基本假定的区别)
多元线性回归模型参数所采用的最小二乘法估计思路以及估计的性质都与简单线性回归模型参数的估计是类似的,由于采用了矩阵,计算过程比较复杂,我们就省略了,因为实际操作过程中,这部分可以由软件代劳了。
第二节多元线性回归模型的检验
一、拟合优度检验
在简单线性回归模型中,我们用可决系数r2来衡量估计模型对观测值的拟合程度。
在多元线性回归模型中,我们也需要讨论所估计的模型对观测值的拟合程度。
1、多重可决系数
R2=ESS/TSS=1—RSS/TSS
大小意义
在应用过程中,人们发现R2的大小对于解释变量的数目容易作出灵敏的反映。
也就是说,随着模型中解释变量的增多,多重可决系数的值往往会变大,从而增加模型的解释功能。
这给人们一个错觉:要使模型拟合得好,就必须增加解释变量。
但是,在样本容量一定的情况下,增加解释变量必定使得待估计参数的个数增加,从而损失自由度(n—k—1)(回忆我们说的区间估计,置信区间,随着自由度的减小,临界值增大,置信区间增大,估计的精度降低)
而且,在实际应用中,有时所增加的解释变量并非必要,违背了我们尽可能采用最简单形式的原则。
因此,在比较应变量相同而解释变量个数不同的两个模型的拟合程度时,不能简单地比较多重可决系数。
为此,人们引入了修正可决系数:R2=1—RSS/(n-k-1)/TSS/(n-1)
修正的思路就是用平方和的自由度,消除可决系数对解释变量个数的依赖度。
多重可决系数与修正可决系数的关系是:
修正可决系数的性质:
(1)若K≥1,则R2≤R2
(2)修正可决系数可能出现负值。
如n=10,k=2,R2=0.1时,R2=—0.157.显然,负的拟合优度没有任何意义,在这种情况下,我们取R2=0
(3)在实际应用中,我们往往希望所建模型的R2和R2越大越好,但它们越大,只说明列入模型中的解释变量对应变量联合影响程度越大,并不能说明模型中各个解释变量对应变量的影响程度显著.
二、回归参数的显著性检验(t检验)
目的:在与检验当其他解释变量不变时,该回归系数对应的解释变量是否对应变量有显著影响。
检验方法与简单线性回归模型的检验基本相同。
三、回归方程的显著性检验(F检验)
与简单线性回归方程一样,方程的显著性检验,目的是判断模型中的多个解释变量同应变量之间是否存在显著的线性关系。
即对回归系数进行整体检验。
四、简单线性回归模型中的T检验与F检验的关系与多元线性回归方程中的有和区别:
简单线性回归模型中的T检验与F检验结果是一致的;
多元线性回归方程中的T检验与F检验的结果有可能不一致。
多元线性回归模型的预测与简单线性回归模型是类似的,同样包括对应变量均值和个别值的预测,其中又分点预测和区间预测。