第三章 多元线性回归分析1

  • 格式:doc
  • 大小:902.50 KB
  • 文档页数:14

下载文档原格式

  / 14
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三章 多元线性回归分析

主要内容:

⏹ 多元线性回归模型

⏹ 多元线性回归模型的参数估计 ⏹ 多元线性回归模型的统计检验 ⏹ 多元线性回归模型的预测 ⏹ 案例

3.1 多元线性回归模型

一、多元线性回归模型

多元线性回归模型:表现在线性回归模型中的解释变量有多个。 一般表现形式:

i ki k i i i u X X X Y +++++=ββββ 22110 i=1,2,…,n

其中:k 为解释变量的数目,j β称为回归参数(regression coefficient )。

ki k i i ki i i i X X X X X X Y E ββββ+⋅⋅⋅+++=2211021),,|(

经济解释:j β也被称为偏回归系数,表示在其他解释变量保持不变的情况下,j X 每变化1个单位时,

Y 的均值E(Y)的变化;

或者说j β给出了j X 的单位变化对Y 均值的“直接”或“净”(不含其他变量)影响。 样本回归函数:用来估计总体回归函数

i =1,2…,n

其随机表示式:

i e 称为残差或剩余项(residuals),可看成是总体回归函数中随机扰动项i u 的近似替代。

i ki ki i i i e X X X Y +++++=ββββˆˆˆˆ22110 ki ki i i i X X X Y ββββˆˆˆˆˆ22110++++=

§3.2 多元线性回归模型的估计

一、普通最小二乘估计

对于随机抽取的n 组观测值

对样本回归函数:

i=1,2…n

根据最小二乘原理,参数估计值应该是下列方程组的解

∑∑∑===+⋅⋅⋅+++-=-==⎪⎪⎪⎪⎪⎪⎪⎩

⎪⎪⎪⎪⎪⎪⎪⎨⎧=∂∂

=∂∂

=∂∂

=∂∂

n

i ki

k i i i n i n

i i

i i

k X X X Y Y Y e Q Q Q Q Q 1

2

2211011

22

210))ˆˆˆˆ(()ˆ(0ˆ0ˆ0ˆ0ˆββββββββ其中

即 Y X X X '='βˆ)(

由于X X '满秩,故有 Y X X X ''=-1)(ˆβ

随机误差项μ的方差σ的无偏估计

可以证明,随机误差项u 的方差的无偏估计量为

二、参数估计量的性质

在满足基本假设的情况下,其结构参数β的普通最小二乘估计、最大或然估计及矩估计仍具有:线性性、无偏性、有效性。 1、 线性

CY Y X X X =''=-1)(ˆβ

其中,C =X X X ''-1

)( 为一仅与固定的X 有关的行向量 2、无偏性

3、有效性(最小方差性)

参数估计量β

ˆ的方差-协方差矩阵 β

μX X X βμX βX X X Y X X X β

11=''+=+''=''=---)()())()(())(()ˆ(1E E E E 11

ˆ2

2

--'=

--=∑k n k n e

i

e e σ

Ki ki i i i X X X Y ββββˆˆˆˆˆ22110++++= k

j n i X Y ji i ,2,1,0,,,2,1),,(==

其中利用了 μ

βμββ

X X X X X X X Y X X X ''+=+''

=''=---11

1)()()()(ˆ 和 I E 2)(σμμ='

三、多元线性回归模型的参数估计实例 例题

3.1

Y : 某商品需求量 X1:该商品价格 X2:消费者平均收入

下图(图3.1) Y

ˆ= 113.83 - 8.36 X 1 + 0.18 X 2 (4.0) (-3.6) (0.9)

R 2 =0.88, F =26.4, n =10

图3.1

§3.3 多元线性回归模型的统计检验

多元线性回归模型的基本假定

假设1,解释变量是非随机的或固定的,且各X 之间互不相关(无多重共线性)。 假设2,随机误差项具有零均值、同方差及不序列相关性

假设3,解释变量与随机项不相关

假设4,随机项满足正态分布

一、拟合优度检验

1、可决系数与调整的可决系数

记 2

)(∑-=Y Y

T S S i

总离差平方和

2)ˆ(∑-=Y Y ESS i 回归平方和 2)ˆ(∑-=i

i Y Y RSS 剩余平方和 则

可决系数

该统计量越接近于1,模型的拟合优度越高。

问题:在应用过程中发现,如果在模型中增加一个解释变量,2

R 往往增大。

这就给人一个错觉:要使得模型拟合得好,只要增加解释变量即可。

但是,现实情况往往是,由增加解释变量个数引起的R2的增大与拟合好坏无关,R2需调整。

调整的可决系数(adjusted coefficient of determination ) 在样本容量一定的情况下,增加解释变量必定使得自由度减少,所以调整的思路是:将残差平方和与总离差平方和分别除以各自的自由度,以剔除变量个数对拟合优度的影响:

)

1/(T SS 1/(12----

=n k n RSS R )

其中:n-k -1为残差平方和的自由度,n -1为总体平方和的自由度。

2R 与2R 之间存在如下关系:

1

1

)

1(122-----=k n n R R

TSS RSS

TSS ESS R -==

12ESS RSS Y Y Y Y TSS i

i i +=-+-=∑∑22)ˆ()ˆ(2222

)ˆ()ˆ)(ˆ(2)ˆ())ˆ()ˆ(()(Y Y Y Y Y Y Y Y Y Y Y Y Y Y TSS i i i i i i i

i i i -∑+--∑+-∑=-+-∑=-∑=