三、系数的估计误差与置信区间 (一) OLS 估计的概率分析
根据(2-1)式计算的只是回归系数a,b 的点估计值,计量经济研究中经济使用系数(的估计值)来定量分析解释变量对y 的影响程度。因此,分析过程中需要了解参数估计值与真值之间究竟有多大误差,或者说,两者的接近程度如何,是否能以一定的概率确定参数真值所属的范围。例如,例2中曾估计出我国城镇居民的边际消费倾向为0.6237,这个估计值有多大误差?边际消费倾向的上下限各为多少(置信区间)?为了说明这些问题,需要先确定OLS 估计的概率分布。
在高斯——马尔可夫定理的证明过程中已经得到:
xx
S b
D b b
E /)?()?(2
σ== 而且 ∑∑++==)(?i
i
i
i
i
bx a k y k b
ε 假定:
i
ε
~),0(2
σN
由于正态分布的线性组合仍然服从正态分布,而且分布形式由其均值和方差惟一确定,所以:
b
?~)/,(2
xx
S b N σ 同理可以证得: a
?~)/,(22
∑xx
i nS x a N σ
(二) 系数的估计误差
估计误差即估计值b
?与真值的偏差b b -?,随着抽样的不同,误差大小是一个随机变量,因此考虑概率意义下的平均误差。由于,
平均误差(平方)=xx
S b D b E b E b b
E /)?())?(?()?(2
2
2
σ==-=-
上式解释:若不取平方,则0)?()?(=-=-b b
E b b
E ,第二等式应用的是:)?(b
E b =
上式的含义:即等于估计量的方差;这一点也容易理解,因为OLS 估计是无偏估计,均值即为参数真值,所以估计量匀值的平均偏差————方差也就反映了估计量与参数真值的平均偏差。 这样,参数估计量的平均误差为:
xx
S b D b b
E /)?()?(2
2
σ==-,
其中,涉及到随机误差项i ε的方差 ,这个值通常并不知道,实际计算中一般采用
2
σ
的无偏估计量:
∑-=)2/(?22
n e i
σ
来估计2
σ,并且用符号)?(b
S 表示系数b ?的估计误差:
xx
i
xx
S
n e S b S )2(?)?(22
-∑==σ
同理a 的估计误差为:
xx
i i
)S
n n x e a S 2()
)(()?(2
2
-∑∑=
)?(),?(a S b
S 又称为系数的标准误差(或标准差)。Eviews 软件在估计回归模型时,将同时输出系数的估计值和标准差。如在例2中,
b a
?,?的标准误差分别为86.4262和0.0144。 需要指出的是,系数的标准误差只是反映了估计量与真值的相对
偏离程度;)?(b
S 越小,由b b 与?的近似误差越小,但不能认为b b 与?之间的绝对误差就是)?(b
S ,这可以从参数的置位区间得到进一步的
说明。
(三) 系数的置信区间
利用OLS 估计式(2-1)得到的只是系数的点估计,为了对系数的取值情况有更多的了解,可以按一定的可靠性确定系数的取值范围:用统计术语来说,就是在一定的置信度下,求得系数的置信区间。 可以证明,统计量:
)?(?b
S b b t -=~)2(-n t
所以,对于给定的置信度α-1,由t 分布表可以查得临界值2/αt ,使得:
αα-=<1)|(|2
/t t P ,即:
αα
α-=+<<-1))?(?)?(?(2
/2
/b S t b b b S t b P 所以系数b 的100(1α-)%置信区间为:
))?(?),?(?(2
/2
/b S t b b S t b α
α+- 即以100(1α-)%的概率保证回归系数属于该区间内。 在例2中,若取05.0=α
,查表得25
.0t
)28(-=2.447,
6237.0?=b
,0144.0)?(=b S ,所以系数b 的置信区间为: 0.6237±2.447×0.0144=(0.5885, 0.6589)
即以95%的概率保证,我国城镇居民的边际消费倾向在(0.5885, 0.6589)该区间内。
显然,置信区间越小,对回归系数的估计精度就越高。从置信区
间的计算公式可以看出,置信区间的长度为)?(22/b
S t α,在α取定的情况下,2/αt 是一个常数,所以置信区间的长度主要取决于系数的标
准差)?(b
S 。)?(b S 越小,则估计的误差越小,估计值b ?与真值b 越接近。因此,称)?(b
S 为系数的估计误差,并用它来衡量估计的精度是合理的;而且,在一定的概率下,b
?与真值b 的绝对误差充其量不会超过)?(2/b
S t α。 四、多元线性回归模型的参数估计 (一) OLS 估计的矩阵表示形式 对于多元线性回归模型
n i x b x b x b b y i
ki
k
i
i
i
,,2,122
11
=+++++=ε
如果利用最小二乘法估计模型的参数,同样应该使残差平方和达到最小,即有:
∑=-----=∑-=∑最小2
22
11
2
2
)????()?(ki
k
i
i
i
i
i
i
x b x b x b b y y
y e
因此,参数估计值应该是下列方程的解:
???????????∑=-----=?∑?∑=-----=?∑?∑=-----=?∑?0)???(2?0)?
??(2?0)???(2?
11
2111
1211
02ki
ki
k
i
i
k
i
i
ki
k
i
i
i
ki
k
i
i
i
x x b x b b y b
e x x b x b b y b e x b x b b y b e
等价于:
????
?????∑++∑+∑+∑=∑∑++∑+∑+∑=∑∑++∑+∑+∑=∑∑++∑+∑+=∑2
22
11
22
22
121
20
21212
2
11
10
122
11
????????????????ki
k
i
ki
i
ki
ki
i
ki
ki
i
k
i
i
i
i
i
i
ki
i
k
i
i
i
i
i
i
ki
k
i
i
i
x b x x b x x b x b
y x x x b x b x x b x b
y x x x b x x b x b x b
y x x b x b x b b
n y
(2----2)
称(2-2)式为正规方程组。若定义矩阵:
)
1(21222
12
121
11
1
2
1
111+??????
?
????
???=?????
????
???=k n kn
n
n
k k n n
x x
x
x x
x x x
x X y
y y Y
1
2
1
1
)1(10??????+?????
???????=??????
????????=n n
k k
e
e e
e b b b B
则正规方程组(2-2)式可以用矩阵形式表示成如下形式:
B
X X Y X ?)('=' 所以,参数的最小二乘估计为:
)32()(?1
-''=-Y X X X B
(二) 系数的估计误差与置信区间 若记
1
)
(-'=X X C
可以证明:
k i c b
D ii
i
,,2,1,0)?(2
==σ
其中,ii c 为矩阵C 对角线上第i 个元素,2
σ为随机误差项的方差,可以用无偏估计量2
?σ进行估计:
1
1?2
2
--'=
--∑=k n e e k n e
i
σ 这样,系数估计值的标准差为:
)42(1
?)?(2
2
---∑==k n e c c b S i
ii
ii
i
σ
利用EViews 软件可以直接求得系数估计值的标准差。 同理,因为统计量
)?(?i
i i
b
S b b
t -=~)1(--k n t
所以,对于给定的置信度α-1,回归系数i b 的100(α-1)%置信区间为:
)52())?(?),?(?(2
/2
/-+-i
i
i
i b S t b b S t b α
α
例3 我国国有独立核算工业企业生产函数。根据生产函数理论,生产函数的基本形式为:),,,(εK L t f Y =。其中,L ,K 分别为生产过程中投入的劳动与资金,时间变量t 反映技术进步的影响。表2-7列出了我国1978~1994年期间国有独立核算工业企业的有关统计资料;其中产出Y 为工业总产值(可比价),L ,K 分别为年末职工人数和固定资产净值(可比价)。试利用EViews 软件建立线性生产函数: ε++++=K b L b t b b Y
3
2
1
(1)建立工作文件:CREATE A 78 94
(2)输入统计资料:DATA Y L K
(3)生成时间变量t GENR T=@TREND(77)
(4)建立回归模型: LS Y C T L K
资料来源:根据《中国统计年鉴——1995》和〈〈中国工业经济年鉴——1995〉〉计算整理
表2-8列出了回归方程式窗显示的有关信息
生产函数的估计结果(表2-8)
Variable Coefficien Std.Error t-Statistic Prob.
C -675.3208 2682.060 -0.251792 0.8051
T 77.67893 115.6731 0.671538 0.5136
L 0.666665 0.853626 0.780980 0.4488
K 0.776417 0.104459 7.432745 0.0000
R-squared 0.995764 Mean dependent avr 6407.247
Adjusted R-squared 0.994786 S.D. dependent var 2486.742
S.E. of regression 179.5630 Akaike info criter 10.58338
Sum squared resid 419157.5 Schwarz criterion 10.77943
Log likelihood -110.0807 F-statistic 1018.551
Durbin-Watson stat 1.510903 Prob(F-statistic) 0.000000
因此,我国国有独立工业企业的生产函数为:
K L t y
7764.06667,06789.7732.675?+++-= (2682.06)(115.67) (0.8536) (0.1045) 其中括号里的数字为系数的标准差。
模型的计算结果表明,我国国有独立核算工业企业的劳动力边际产出为0.6667,资金的边际产出为0.7764,技术进步的影响使工业总产值平均每年递增77.68亿元。但是模型中除资金变量K 之外,其他变量(包括常数项)所对应回归系数的估计误差都比较大。因此需要对模型做适当的调整。至于模型的统计检验和进一步调整,我们将在后面逐步介绍。
五、极大似估估计(ML ) (一) 极大似然估计原理
极大似然估计(Maximum Likelihood,简称ML,又称为最大似然估计)是一种估计原理与最小二乘估计完全不同的参数估计方法。虽然ML 估计没有OLS 估计应用普遍,但近代计量经济学理论的发展,更多地是以极大似然原理作为基础;一些特殊的计量经济模型也只有使用ML 估计才能获得理想的结果。因此,有必要了解极大似然估计的基本原理和方法。 若
i
ε
~),0(2
σN
则 i
i
i
bx a y ε++=~)
,(2
σi bx a N +
设随机抽取了n 组观察数据,则),,,(21n y y y 的联合密度函数
为:
∑---
=
==]
)(21exp[21()
()()(),,,(2
2
2
2
1
2
1
i
i
n
i
n
n
bx a y )
(
)
y y f y f y f y y y f L σ
πσ相互独立因为
对于一组确定的样本,这是一个关于参数2,,σb a 的函数,称之为参数的似然函数。
极大似然估计基于这样的原理:既然所抽取的样本是一次观测中得到的,表明“观察值落在该样本周围”是一个比较容易发生的大概率事件,因此,所选择的参数估计值应该使这一事件的概率达到最大。由于连续型随机变量在某一点周围取值的概率主要由联合密度函数
f
),,,(2
1
n
y y y 决定,所以一元线性回归模型的极大似然估计,就
是选择b a ?,?(实际上还包括2
?σ)
,使似然函数),(b a L 取到最大值。即:
),(max )?,?(b a L b a
L = (二) 回归系数的极大似然估计
由于对数函数是单调函数,使对数似然函数L ln 达到最大化的参数值同样也使似然函数L 达到最大值。因此,为了便于求解极值,将似然函数取成对数形式:
∑----=2
2
2
)??(21)2ln()?,?(ln i
i
x b a
y n b a L σ
πσ
根据:
0)??(1?ln 0)??(1?ln 2
2
=∑--=??=∑--=??i
i
i
i
i
x x b a y b
L x b a y a L σσ
解得:
??
?
??-∑-∑=-=2
2
???x n x y x n y x b x b y a i
i i
可见在正态分布的假定下,回归系数的ML 估计与OLS 估计完全相同。
最小二乘估计是使模型对样本的似合达到最优,而极大似然估计却是使样本出现的概率达到最大。两者的原理不同,所依据的基本条件也有很大区别,但在正态分布的假定下,回归系数的ML 估计与OLS 估计完全相同。
第三节 回归模型的统计检验
利用样本数据估计得到的样本回归方程只是对总体回归方程的一个近似估计模型,所估计的模型是否确切地反映了经济变量之间的相互关系还需要进行检验。回归分析中主要是通过一些统计检验方法来保证模型在统计意义上(即以样本推断总体)的可靠性。 一、 模型的拟合优度检验
所谓“拟合优度”,即模型对样本数据的近似程度。由于实际观察得到的样本数据是对客观事实的一种真实反映,因此,模型至少应该能较好地描述这一部分客观实际情况。为了考察模型的拟合优度,
需要构造一个数量指标——判定系数。 1、
总平方和分解公式
设估计的多元线性回归模型为: ki
k
i
i
i
x b x b x b b y
?????22
11
++++=
因为:
∑∑+-=∑-+=-22
2
)?()?()(i
i
i
i
e y y y e y
y y
∑-+∑+∑-=i
i
e y y e y y
)?(2)?(2
2
可以证明(《计量经济学》李子奈 高等教育出版社)P41 01=∑==∑=∑i
ki
i
i
i
e x e x e
则: ∑+++=∑i
ki
k
i
i
i e x b x b b e y
)???(?11
0???11
=∑++∑+∑=i
ki
k
i
i
i
e x b e x b e b
且: 0=∑=∑i
i
e y e y
所以:
)62()?()(2
2
2
-∑∑+∑-=-i
i
i
e y y
y y
记成 TSS = ESS + RSS
其中,TSS (Total Sum of Squares )称为总平方和(或总离差平方和),它反映了被解释变量y (关于均值y )的总变化情况;ESS(Explained Sum of Squares)称为回归平方和(或可解释的平方和),
它反映了变量y
?的总变化情况,即y 的变化中可以用回归模型(样本回归方程)来解释的部分,这部分变化实际上是由解释变量的变化引起的;RSS(Residual Sum of Squares)称为残差平方和,它反映了回归模型的总拟合误差,即y 的变化中不能用回归模型来解释的部分。 (2-6)式称为总平方和分解公式,它表明y 的变化由两部分组成,一部分是模型中解释变量引起的变化,另一部分是模型之外其他
因素引起的变化。 2、判定系数2
R
总平方和分解公式表明,在y 的总变化中,被回归模型解释的部分越多,则模型的拟合误差相对来说就越小。对于一组确定的样本数据,总平方和是一个确定的数值,因此,可以用回归平方和(ESS )占总平方和(TSS )的比重作为衡量模型对样本拟合优度的指标,该指标称为判定系数(或可决系数),用符号2R 表示,即:
∑-∑-
=∑-∑-=2
2
2
2
2
)
(1)()?(y y e
y y y y R i
i
i
i
(2-7)
显然,102
≤≤R ,并且,当12
→R
时,∑→02
i
e ;因此,2
R
的值越接近于1,则表明模型对样本数据的拟合优度越高。 判定系数不仅反映了模型拟合程度的优劣,而且有直观的经济含义:它定量地描述了y 的变化中可以用回归模型来说明的部分,即模型的可解释程度。如在例2中,我国城镇居民消费函数的
9968.02
=R ,这意味着城镇居民消费支出的变化中,有99.68%可
以通过所估计的消费函数来解释。 二、 模型的显著性检验
判定系数检验只能说明模型对样本数据的近似情况,但是建立计量经济模型的目的是为了描述总体的经济关系。所谓模型的显著性检验,就是检验模型对总体的近似程度,而且最常用的检验方法是F 检验 1、
F 检验
对于多元线性回归模型: i
ki
k
i
i
i
x b x b x b b y ε
+++++= 22
11
假设0H :
02
1
====k
b b b
若假设成立,则意味着:i
i
b y ε
+=0
表明y 的变化主要由模型之外的变量来决定,模型的线性关系不显著,所设定的模型没有意义。
在原假设0H 成立的情况下,可以证明:
)
1/(/)?(22
--∑∑-=k n e k y y
F i
i ~)1,(--k n k F
所以对于给定的显著水平α,可由F 分布表查得临界值αF ,如果根据样本数据计算得出: αF F
> 则拒绝原假设0
H
,即回归系数k b b b ,,21中至少
有一个显著地不为零;此时可以认为模型的线性关系是显著的。若
αF F <,则接受0
H
,认为模型的线性关系是不显著的。
2、检验的关系检验与F R 2
2
2
11//1)1/(/R
R
k k n TSS RSS TSS ESS k k n k n RSS k ESS F -?
--=?--=--=
因此,F 统计量是判定系数R 2的单调增函数,当12
→R
时,
∞→F 。从图
2-7也可以直观地看出:对于每一个临界值αF 都可
以找到一个2
αR 与之对应,当2
2
αR R >时,便有αF F >。这一事实
可以说明以下几个问题:
(1) F 检验实际上也是判定系数的显著性检验
(2) 如果模型对样本有较高的拟合优度,则F 检验一般都能通过 (3) 实际应用中不必过分苛求2
R 值的大小,重要的是考察模型
的经济意义是否合理。如例3中,n=17,k=3,n-k-1=13,取显著水平01.0=α时,由F 分布表查得临界值
74.5)13,3(01
.0=F ;因此,只要F 统计量的值大于5.74,
就能以99%的置信度认为模型的线性关系是显著的,由F 统计量与R 2的关系式可以计算出:
5698
.074
.531374
.53)1(2
=?+?=+--=kF k n kF R
也就是说,只要5698.02
>R ,则模型线性关系显著的概率就达
到99%。
三、 解释变量的显著性检验
如果模型通过了F 检验,则表明模型中所有解释变量对被解释变量的“总影响”是显著的,但这并不同时意味着模型中的每一个解释变量对y 都有重要影响,或者说并不是每个解释变量的单独影响都是显著的。在设定计量经济模型的时候,我们往往根据经济理论和对所研究系统的经验认识,尽量找出被解释变量的所有影响因素,这些初步选定的影响因素中间很可能就有一些实际上并不重要、或其影响可以由其它变量代替的变量。为了使模型更加简单、合理,应该剔除这些并不重要的变量,使模型中只保留有显著影响的变量。因此,有必要对模型中每个解释变量(影响)的显著性进行检验,检验过程仍然采用假设检验的方法。
对于多元线性回归模型,为了检验某个解释变量i x 对y 是否有显著影响,可以建立原假设:
0:0
=i
b H
即假设i x 对y 没有显著影响,在确定系数的置信区间时曾经使用过t 统计量:
)?(?i
i i
b
S b b t -=~)1(--k n t
在假设0:0
=i
b H 成立的情况下:
)?(?i
i b
S b
t =~)1(--k n t
因此,对于给定的显著水平α,可以由t 分布表查得临界值
2
/α
t ,若2
/||α
t t
>,则表明原假设0:0
=i
b H 是一个错误假设,应该
拒绝,即认为系数i b 显著地不等于0,y x i 对有显著影响;反之,则认为影响不显著,应考虑将i x 从模型中剔除而重新建立模型。
例4 我国国有独立核算工业企业生产函数的统计检验(例3续)。例3中,9958.02
=R
,表明模型有很高的拟合优度,而且F
检验也是高度显著的,说明职工人数L 、资金K 和时间变量t 对工业总产值的总影响是显著的。现对每个变量影响的显著性进行t 检验,取05.0=α
时,
查t 分布表得16.2)1317(025
.0=--t ,而由表(2-8)
中估计结果可知,t,L ,K 的t 统计值分别为:0.67,0.78和7.43,只有资金K 的t 检验是显著的。按照统计检验程序,一般应先剔除t 统计值最小的变量(即时间变量t )而重新建立模型;经分析,这一时期我国工业企业的技术进步率较低,技术进步对经济增长的贡献不太明显,因此考虑先剔除反映技术进步影响的时间变量t 而重新建立模型,模型的估计结果列入表2-9。此时,常数项和L ,K 的t 统计量值均满足145.2)1217(||025.0=-->t t ,即常数项和L ,K 的t 检验都
是显著的。
剔除时间变量后的估计结果(表2-9)
Variable Coefficien Std.Error t-Statistic Prob. C -2387.269 816.8895 -2.922390 0.0111
L 1.209532 0.273020 4.426528 0.0006 K 0.824496 0.057421 14.53287 0.0000 R-squared 0.995617 Mean dependent avr 6407.249
Adjusted R-squared 0.994990 S.D. dependent var 2486.742 S.E. of regression 176.0069 Akaike info criter 10.49983 Sum squared resid 433697.8 Schwarz criterion 10.64687 Log likelihood -110.3705 F-statistic 1589.953 Durbin-Watson stat 1.481994 Prob(F-statistic) 0.000000
实际应用中,经常采用一种近似检验方法来判断解释变量的显著性(即t 检验的近似检验)。当抽取的样本为大样本时,根据中心极限定理, t 分布趋近于正态分布;因此,取显著水平05.0=α时,近似地有:
95.0)96.1|(|=≤t P
或:
95.0)2|(|≥≤t P
这表明,只要t 统计量的值大于2,则基本上能以95%的置信度认为该变量的影响是显著的。
另外,EViews 软件输出的回归分析结果中,在每个t 统计量值i t 的右端还列出了一个概率值)p p 值又称为(,它表示:
p t t P i
=≥)|(|
即给出了所谓“精确的显著水平”。例如表2-9中,职工人数L 的t 统计量值是4.4265,p 值为0.0006,这说明:
006.0)4265.4|(|=≥t P
这样显著水平α取0.5(甚至0.01),t 检验均是显著的,因此,有了p 值之后,一方面不需要从t 分布表查临界值,使t 检验更加方便;另一方面也可以知道拒绝原假设0:0
=i
b H (即认为解释变量有显
著影响)的最低显著水平。例如p 值等于0.06时,若主观地将显著水平直接取成0.05,则检验结果认为x 无显著影响,但实际上在0.06
的显著水平之下,x 还是有显著影响的。所以,p 值又使t 检验更加客观、灵活。
利用软件建立回归模型之后,为了完整、清晰地反映有关统计信息,习惯上将有关计算结果书写成以下报告形式:
ki
k
i
i
i
x b x b x b b y
?????22
11
++++= )?()?()?(2
1
k
b S b S b
S
====
E S
F R t t t t k
.)
()()
(22
1
其中,第一组括号内的数字是系数的标准误差,第二组括号内的
数字是t 统计量值。由于)?(/?b S b t =,知道某一组值之后可以推算出另
一组值,所以实际应用中也可以只列出某一组括号的值(系数标准误差或t 统计量值)。如果研究目的是利用系数估计值进行定量分析,则列出系数的标准误差;如果是强调每个解释变量的重要性,则列出t 统计量值。如例4的估计结果可以写成:
176
.15909956.0)53.14()43.4(8345.02085.127.3287?2
====
++-=E S F R t K L y