当前位置:文档之家› 计量经济学 第三章 多元线性回归与最小二乘估计

计量经济学 第三章 多元线性回归与最小二乘估计

计量经济学  第三章  多元线性回归与最小二乘估计
计量经济学  第三章  多元线性回归与最小二乘估计

第三章 多元线性回归与最小二乘估计

3.1 假定条件、最小二乘估计量和高斯—马尔可夫定理

1、多元线性回归模型:

y t = β0 +β1x t 1 + β2x t 2 +…+ βk - 1x t k -1 + u t (3.1) 其中y t 是被解释变量(因变量),x t j 是解释变量(自变量),u t 是随机误差项,βi , i = 0, 1, … , k - 1是回归参数(通常未知)。

对经济问题的实际意义:y t 与x t j 存在线性关系,x t j , j = 0, 1, … , k - 1, 是y t 的重要解释变量。u t 代表众多影响y t 变化的微小因素。使y t 的变化偏离了E( y t ) = β0 +β1x t 1 + β2x t 2 +…+ βk - 1x t k -1 决定的k 维空间平面。

当给定一个样本(y t , x t 1, x t 2 ,…, x t k -1), t = 1, 2, …, T 时, 上述模型表示为 y 1 = β0 +β1x 11 + β2x 12 +…+ βk - 1x 1 k -1 + u 1,

y 2 = β0 +β1x 21 + β2x 22 +…+ βk - 1x 2 k -1 + u 2, (3.2) ………..

y T = β0 +β1x T 1 + β2x T 2 +…+ βk - 1x T k -1 + u T

经济意义:x t j 是y t 的重要解释变量。 代数意义:y t 与x t j 存在线性关系。 几何意义:y t 表示一个多维平面。 此时y t 与x t i 已知,βj 与 u t 未知。

)1(21)1(110)(11

1222111111)1(21111??-?---??

?????

??????+???????????????????????

???=?

?

??

??

??????T T k k k T k T Tj

T k j k j T T u u u x x x x x x x x x y y y

βββ (3.3) Y = X β + u (3.4)

2假定条件

为保证得到最优估计量,回归模型(3.4)应满足如下假定条件。

假定 ⑴ 随机误差项u t 是非自相关的,每一误差项都满足均值为零,方差 σ2相同且为有限值,即

E(u ) = 0 = ????

??????00 , Var (u ) = E(u ?u ?' ) = σ 2I = σ 2??????????10000001 假定 ⑵ 解释变量与误差项相互独立,即 E(X 'u ) = 0

假定 ⑶ 解释变量之间线性无关。 rk(X 'X ) = rk(X ) = k 其中rk (?)表示矩阵的秩。

假定⑷ 解释变量是非随机的,且当T → ∞ 时

T – 1X 'X → Q

其中Q 是一个有限值的非退化矩阵。

3 最小二乘估计

最小二乘 (OLS) 法的原理是求残差(误差项的估计值)平方和最小。代数上是求极值问题。

min S = (Y - X β?)' (Y - X β?) = Y 'Y -β?'X 'Y - Y ' X β? +β?'X 'X β?

= Y 'Y - 2β?'X 'Y + β?'X 'X β? (3.5) 因为Y 'X β?是一个标量,所以有Y 'X β? = β?'X 'Y 。(1.5) 的一阶条件为:

β

???S

= - 2X 'Y + 2X 'X β?= 0 (3.6) 化简得

X 'Y = X 'X β?

因为 (X 'X ) 是一个非退化矩阵(见假定⑶),所以有

β?= (X 'X )-1 X 'Y (3.7)

因为X 的元素是非随机的,(X 'X ) -1X 是一个常数矩阵,则β?是Y 的线性组合,为线性估计量。

求出β?,估计的回归模型写为

Y = X β?+u

? (3.9) 其中β?= (0?β 1

?β … 1?-k β)' 是 β 的估计值列向量,u ?= (Y - X β?) 称为残差列向量。因为 u

?= Y - X β?= Y - X (X 'X )-1X 'Y = [I - X (X 'X )-1 X ' ]Y (3.10) 所以u ?也是Y 的线性组合。β?的期望和方差是

E(β?) = E[(X 'X )-1 X 'Y ] = E[(X 'X )-1X '(X β + u )]

= β + (X 'X )-1X ' E(u ) = β (3.11)

由于:

111

1

1

?(')`(')`()(')`(')`(')`X X X Y X X X X u X X X X X X X u X X X u

β

βββ-----==+=+=+

Var(β?) = E[(β?–β) (β?–β)']= E[(X 'X )-1X ' u u ' X (X 'X )-1]

= E[(X 'X )-1X ' σ 2I X (X 'X )-1] = σ 2 (X 'X )-1 (3.12) 例:3.1(P113)略

4高斯—马尔可夫定理:

高斯—马尔可夫定理:若前述假定条件成立,OLS 估计量是最佳线性无偏估计量。β?具有无偏性。β?具有最小方差特性。β?具有一致性,渐近无偏性和渐近有效性。

3.2 残差的方差

2

2`?t

t t

e e e T k

T k

σ=

=

--∑ (3.13) 2?σ

是σ 2 的无偏估计量,E(2?σ ) =σ 2。 证明过程如下:

11??(`)`(`)`e Y Y Y X Y X X X X Y I X X X X Y β--??=-=-=-=-??

记:1(`)`I X X X X --=P

容易证明:P 为对等幂矩阵,即P=P`,P 2=P

11

(`)`(`)`()e I X X X X Y I X X X X X u Pu β--????=-=-+=????

[][]2

2

2

var()(`)()`(`)`(`)`()``e E ee E Pu Pu E P uu P PE uu P P I P PP P σσσ

=======

利用矩阵迹的性质,有:

2`(`)t

e

e e tr ee ==∑

[][][]222121

22

()(`)(`)(`)(`)`(`)`()t t t k E e E e e E tr ee tr E e e tr P tr I X X X X trI trX X X X T trI T k σσσσσ--??====??????=-=-????=-=-∑

β

?的估计的方差协方差矩阵是 ∧

Var (β

?) = 2?σ

(X 'X )-1 (3.14) βi 的置信区间

(1) 全部βi 的联合置信区间接受

F =

k

1

(β -β?)' (X 'X ) (β -β?) / s 2 ~ F α (k , T -k ) (3.15) ( β -β?)' (X 'X ) ( β -β?) ≤ s 2 k F α (k , T -k ),它是一个k 维椭球。 (3.16)

(2) 单个βi 的置信区间

t =

??()j j j

s βββ-

=??((j j j j

ββββ-=- t (T -k ) βi = i

β?

t α/2(T -k ) . (3.17) OLS 估计量的分布

若u ~ N (0, σ 2I ) ,则每个u t 都服从正态分布。于是有

Y ~ N (X β, σ 2I ) (3.18)

因β?也是u 的线性组合(见公式1.7),依据(3.11)和(3.12)有

β

? ~ N ( β, σ2(X 'X )-1 ) (3.19) 3.3多元回归模型的检验

1. 多重确定系数(多重可决系数)

Y = X β?+u

?=Y ?+u ? (3.20) 总平方和

SST =∑=-T t t y y 12)(=∑∑∑===+-T

t T t T t t t y y y y 121122

=21122y T y y y T

t T

t t t +-∑∑=== Y 'Y - T 2y , (3.21)

其中y 是y t 的样本平均数,定义为y = T y T

t t /)(1∑=。同理,回归平方和为

SSR =

∑=-T

t t y y

12)?(= Y ?'Y ?- T 2y (3.22) 其中y 的定义同上。残差平方和为

SSE =

=-T

t t t y y 1

2)?(=

∑=T

t t u

12?= u

?'u ? (3.23) 则有如下关系存在,

SST = SSR + SSE (3.24)

R 2

=

2

2??y T y T SST SSR -Y Y Y 'Y

'-=

(3.25)

显然有0 ≤ R 2 ≤ 1。R 2 →1,拟合优度越好。 2. 调整的多重确定系数

当解释变量的个数增加时,通常R 2不下降,而是上升。为调整因自由度减小带来的

损失(增加方差的无偏估计量2

2`?t

t t

e e e T k

T k

σ

=

=

--∑,会系数的置信区间及预测精度降低),又定义调整的多重确定系数2R 如下:

2R

= 1 -

))(1(1)1/()/(SST

SSR

SST k T T T SST k T SSE ----=--

= 1 -

)1(1

2R k

T T --- (3.26) 对于包含解释变量个数不同的模型,就用调整后的确定系数。

3 方差分析与F 检验

与SST 相对应,自由度T -1也被分解为两部分,

(T -1)= (k -1) + (T - k ) (3.27) 回归均方差定义为MSR =

1-k SSR ,误差均方差定义为MSE = k

T SSE

- 表1.1 方差分析表

方差来源 平方和 自由度 均方 回归 SSE =Y

?'Y ?-T y 2 k -1 MSE = SSE / (k -1) 误差

SSR = u

?'u ? T -k

MSR = SSR / (T -k )

总和

SST = Y 'Y - T y 2

T -1

H 0: β1= β2 = … = βk -1 = 0; H 1: βj 不全为零

F =

MSE MSR

= /(1)/()SSE k SSR T k -- ~ F (k -1,T -k ) (3.28)

设检验水平为α,则检验规则是,若 F ≤ F α (k -1,T -k ),接受H 0;若 F > F α (k -1,T -k ) , 拒绝H 0。

图3.1 F 检验示意图 图3.2 t 检验示意图

4.t 检验

H 0:βj = 0, (j = 1, 2, …, k -1), H 1:βj ≠ 0

t =)?(?j

j s ββ

=??ββ= t (T -k ) (3.29) 判别规则:若∣ t ∣≤ t α(T -k ) 接受H 0;若∣ t ∣> t α(T -k ) 拒绝H 0。

5、模型结构的稳定性检验:Chow 检验

对于多元回归模型:y t = β0 +β1x t 1 + β2x t 2 +…+ βk - 1x t k -1 + u t

我们可以得到一组大样本,这组大样本C1-Cn ,可能由于某一原因(时间序列的政策原因、战争;截面数据如不同地区等),分为两组小样本:C1-Ci ,Ci-Cn ,对于这两组小样本,模型结构是否相同,有待检验。方步骤如下:

1)、利用大样本对模型回归,得残差平方和:2t e ∑

2)利用两组小样本对模型分别进行回归,得残差平方和:21t e ∑、22t e ∑。

3)构造统计量:()()222121222

1212/(,2)/(2)t t t t t e e e k

F F k n n k e e n n k ??-+??=+-++-∑∑∑∑∑ 4)给定显著性水平α,检F 分布表,得临界值12(,2)f k n n k α+-

5)判断:若F 大于12(,2)f k n n k α+-,认为方程存在显著差异,即两个样本反映的两个经济关系显著不同,说模型结构发生了变化;反之,模型结构比较稳定。

例3.3(P129)略。

3.4多元回归方程预测

1、点预测

因为?()f E y

= E(β?0 +β?1 x f 1 + … +β? k -1 x f k -1= E (y f ) 所以?f y

是E (y f )的元偏估计值,可以作为y f 和E (y f )的估计值。 C = (1 x T +1 1 x T +1 2 … x T +1 k -1 ) (3.30) 则T + 1期被解释变量y T +1的点预测式是,

1?+T y

= C β?=β?0 +β?1 x T +1 1 + … +β? k -1 x T +1 k -1 (3.31) 2、E (y T +1) 的置信区间预测 首先求点预测式C β?的抽样分布

E (1?+T y

) = E (C β?) = C β (3.32) Var (1?+T y

) = Var (C β?) = E[(C β?- C β ) (C β?- C β ) ' ] = E[C (β?- β ) [C (β?- β )] ' ]= C E[(β?- β ) (β?- β ) ' ]C '

= C Var (β?)C '= C σ2 (X 'X )-1C ' = σ2 C (X 'X )-1C ' , (3.33)

因为β?服从多元正态分布,所以C β?也是一个多元正态分布变量,即

1?+T y

= C β?~ N (C β, σ2C (X 'X ) -1C ') (3.34) 构成 t 分布统计量如下

t =

'

)'()?(?1

11C X X C -++-s y E y

T T =

'

)'(?1

C X X C C C --s ββ ~ t (T -k ) (3.35)

置信区间 C β?± t α/2 (1, T -k ) s ')'(1C X X C - (3.36) 3、单个y T +1的置信区间预测

y T +1值与点预测值1?+T y

有以下关系 y T +1 = 1?+T y

+ u T +1 (3.37) 其中u T +1是随机误差项。因为

E( y T +1) = E(1?+T y

+ u T +1) = C β (3.38) Var( y T +1) = Var(1?+T y

) + Var(u T +1) = σ 2 C (X 'X )-1C ' + σ 2 = σ 2 (C (X 'X )-1C ' + 1) (3.39) 因为β?服从多元正态分布,所以y T +1也是一个多元正态分布变量,即

y T +1 ~ N (C β, σ2C (X 'X ) -1C '+ 1)

与上相仿,单个y T +1的置信区间是

C β? ± t α/2 (T -k ) s 1')'(1+-C X X C (3.40) 4、预测的评价指标

注意,以下6个公式中的e t 表示的是预测误差,不是残差。可以在样本内、外预测。 (1) 预测误差。预测误差定义为

e t = t y

?- y t , t = T +1, T +2, … 是对单点预测误差大小的测量。

(2) 相对误差PE (Percentage Error)。 PE =

t

t t y y y

-?, t = T +1, T +2, … 是对单点预测相对误差大小的测量。

(3) 误差均方根rms error (Root Mean Squared Error) rms error =

∑=-T

t t t

y y

T 12)?(1

通过若干个预测值对预测效果进行综合评价。

(4) 绝对误差平均MAE (Mean Absolute Error) MAE =

∑=-T

t t t y y

T

1?1

通过若干个预测值对预测的绝对误差进行综合评价。

(5) 相对误差绝对值平均MAPE (Mean Absolute Percentage Error) MAPE =

=-T

t t

t t y y y T

1

?1

综合运用以上4种方法,通过若干个预测值对预测的相对误差进行综合评价。

以上5个式子中,t y

?表示预测值,y t 表示实际值。公式中的累加范围是用1至T 表示的,当然也可以用于样本外预测评价。

0.0

0.51.01.52.02.53.0

1

2

3

4

5

6

7

8

9101112131415

Y F

?2 S.E.

图3 EViews 只给出样本内预测评价(前三个指标对应于公式3,4,5)Theil 不等系数的范围是[0,1]

3.5 建模过程与应注意的问题

05000

100001500020000250003000080

81

82

83

84

85

86

87

88

89

90

91

92

GDP

GDP(f)图3.4

1、多元线性回归模型的计算过程 1)根据样本写出如下矩阵:

12(1)T T y y Y y ???

??

??

=??

??

?? 111112122111()

111

j

k j k T Tj T k T k x x x x x x X x x x ---???

????=??

??

????

2)计算`X X 、1(`)X X -、`X Y

3)计算参数向量B 的最小二乘估计?B

:1?(`)`B X X X Y -= 4)计算应变量向量Y 的拟合值:??Y

XB =

5)计算残差的估计值:

2

2

`?t t t

e e e

T k T k σ==

--

6)计算多重决定系数及修正后的决定系数。

7)计算参数的标准差。

8)计算统计量t与F的值,作参数及回归方程显著性检验。

9)若模型未通过检验,则重新建立模型并重复上述过程;若通过检验,且满足模型的古典假定,则可用模型进行结构分析或经济预测等实际应用。

2、建立模型应注意的问题

(1)研究经济变量之间的关系要剔除物价变动因素。以上图为例,按当年价格计算,我国1992年的GDP是1980年的5.9倍,而按固定价格计算,我国1992年的GDP是1980年的2.8倍。另外从图中还可看出,1980-1992期间按名义价格计算的GDP曲线一直是上升的,而按不变价格(1980年价格)计算的GDP曲线在1989年出现一次下降。可见研究经济变量应该剔除物价变动因素。(1988、1989年居民消费价格指数分别为18.8%、18%。)

(2) 依照经济理论以及对具体经济问题的深入分析初步确定解释变量。

例:我国粮食产量= f(耕地面积、农机总动力、施用化肥量、农业人口等)。但根据我国目前情况,“耕地面积”不是“粮食产量”的重要解释变量。粮食产量的提高主要来自科技含量的提高。

例:关于某市的食用油消费量,文革前常驻人口肯定是重要解释变量。现在则不同,消费水平是重要解释变量,因为食用油供应方式已改变。

(3) 当引用现成数据时,要注意数据的定义是否与所选定的变量定义相符。

例:“农业人口”要区别是“从事农业劳动的人口”还是相对于城市人口的“农业人口”。

例:2002年起我国将执行新的规定划分三次产业。即将农、林、牧、副、渔服务业从原第三产业划归第一产业。

(4) 通过散点图,相关系数,确定解释变量与被解释变量的具体函数关系。(线性、非线性、无关系)

图3.5(nonli8,1982-1998)

(5)谨慎对待离群值(outlier )。离群值可能是正常值也可能是异常值。不能把建立模型简单化为一个纯数学过程,目的是寻找经济规律。(欧盟对华投资和中国从欧盟进口)

年 INV (投资) IMPORT (进口)

1991 2.562000 23.47000 1992 2.429700 32.29000 1993 6.712400 63.99000 1994 15.37600 78.75000 1995 21.31000 149.1300 1996 27.37000 113.8100 1997 41.71000 106.1500 1998

39.78000

112.2000

102030405060

7880828486889092949698000204

LABOR

图3.6 把5.1282错输入为51.28。

(6) 过原点回归模型与非过原点回归模型相比有如下不同点。以一元线性过原点模型,y t = β1 x t + u t ,为例,

①正规方程只有一个(不是两个),

12?)

?(β

??∑t

u = 2∑ (y t -1

?βx t ) (- x t ) = 0

即 ∑t u

?x t = 0,而没有∑t u ? = 0,即残差和等于零不一定成立。 ②可决系数R 2有时会得负值!原因是有时会有SSE>SST 。为维持SSE+SSR=SST ,迫使SSR<0。

(7) 改变变量的测量单位可能会引起回归系数值的改变,但不会影响t 值。即不会影响统计检验结果。以一元回归模型的估计公式为例说明之。

1

?β= ∑∑---2

)

())((x x y y x x t

t t

t =

)

1?

(1?ββs =

---2

)()

)((x x y y x x t t t σ

?)(2

∑-x x

t

=

∑∑---2

)

()

)((x x y y x x t

t

t

∑--2

)?()2(t

t

y y T

(8) 回归模型给出估计结果后,首先应进行F 检验。F 检验是对模型整体回归显著性的检验。 (检验一次,H 0: β1= β2 = … = βk -1 = 0; H 1: βj 不全为零。)若F 检验结果能拒绝原假设,应进一步作t 检验(检验k 次,H 0:βj = 0, (j = 1, 2, …, k -1),H 1:βj ≠ 0)。t 检验是对单个解释变量的回归显著性的检验。若回归系数估计值未通过t 检验,则相应解释变量应从模型中剔除。剔除该解释变量后应重新回归。按经济理论选择的变量剔出时要慎重。

(9) 在作F 与t 检验时,不要把自由度和检验水平用错(正确查临界值表)。回归系数的t 检验是双端检验,但t 检验表的定义有P (| t | > t α) = α, P ( t < t α) = α

图3.7 图3.8

(10) 对于多元回归模型,当解释变量的量纲不相同时,不能在估计的回归系数之间比较大小。若要在多元回归模型中比较解释变量的相对重要性,应该对回归系数作如下变换

j β?* =j

β?)

()

(t tj y s x s , j = 1, 2, …, k -1 (3.41) 其中s (x t ) 和s (y t ) 分别表示x t 和y t 的样本标准差。j

β?*可用来直接比较大小。 以二元模型为例,标准化的回归模型表示如下(标准化后不存在截距项),

)(t t y s y y -= β1*)(111t t x s x x -+ β2*)

(222t t x s x

x -+ … + u t

两侧同乘s (y t ),得

(y t -y ) = β1*

)()(1t t x s y s (x t 1 -1x ) + β2*)

()

(2t t x s y s (x t 2 -2x ) + … + u t s (y t ) 因为均值点必在回归直线上,去掉上式中由均值点构成的方程,则必有

y t = β1*

)()(1t t x s y s x t 1 + β2*)

()(2t t x s y s x t 2 + … + u t s (y t ) 所以有

βj *

)

()

(tj t x s y s = βj , i = 1, 2, … k -1, 即 βj * = βj

)

()(t tj y s x s , i = 1, 2, … k -1

既是 (1.41) 式。

(11) 利用回归模型预测时,解释变量的值最好不要离开样本范围太远。 原因是:

①根据预测公式离样本平均值越远,预测误差越大。以一元回归模型为例;

F y

? ~ N (β0 + β1 x F , σ 2

(1+T 1

+∑--2

2)()(x x x x t F ) ) 从公式看,当x F =x 时,F y

?的分布方差最小,即预测区间最小,预测精度最高。而预测点x F 越远离x ,F y

?的分布方差越大,即预测区间越大,预测精度越差。 ②有时,样本以外变量的关系不清楚。当样本外变量的关系与样本内变量的关系完全不同时,在样本外预测就会发生错误。图3.10给出青铜硬度与锡含量的关系曲线。若以锡含量为0-16%为样本,求得的关系近似是线性的。当把预测点选在锡含量为16%之外时,显然这种预测会发生严重错误。因为锡含量超过16%之后,青铜的硬度急剧下降,不再遵从锡含量为0-16%时的关系。

图3.9 y t 的区间预测的变化 图3.10 青铜硬度与锡含量的关系

4

6

8

10

12

LOG(TRADE)

(12) 回归模型的估计结果应与经济理论或常识相一致。如边际消费倾向估计结果为1.5,则模型很难被接受。(产出对劳动力的弹性为负值!)

(13) 残差项应非自相关(用DW 检验,亦可判断虚假回归)。否则说明①仍有重要解释变量被遗漏在模型之外。②选用的模型形式不妥。

(14) 通过对变量取对数消除异方差。 (15) 避免多重共线性。

(16) 解释变量应具有外生性,与误差项不相关。

(17) 应具有高度概括性。若模型的各种检验及预测能力大致相同,应选择解释变量较少的一个。

(18) 模型的结构稳定性要强,超样本特性要好。 (19) 世界是变化的,应该随时间的推移及时修改模型。

建模案例1:《全国味精需求量的计量经济模型》(file:1c02)

1.依据经济理论选择影响味精需求量变化的因素

依据经济理论一种商品的需求量主要取决于四个因素,即①商品价格,②代用品价格,③消费者收入水平,④消费者偏好。模型为:

商品需求量 = f (商品价格,代用品价格,收入水平,消费者偏好)

对于特定商品味精,当建立模型时要对上述四个因素能否作为重要解释变量逐一鉴别。

商品价格:味精是一种生活常用品,当时又是一种价格较高的调味品。初步判断价格会对需求量产生影响。所以确定价格作为一个重要解释变量。

代用品价格:味精是一种独特的调味品,目前尚没有替代商品。所以不考虑代用品价格这一因素。

消费者收入:显然消费者收入应该是一个较重要的解释变量。

偏好:由于因偏好不食味精或大量食用味精的情形很少见,所以每人用量只会在小范围内波动,所以不把偏好作为重要解释变量,而归并入随机误差项。

分析结果,针对味精需求量只考虑两个重要解释变量,商品价格和消费者收入水平。

味精需求量= f (商品价格,收入水平)

2.选择恰当的变量(既要考虑代表性,也要考虑可能性)

用销售量代替需求量。因需求量不易度量,味精是自由销售商品,不存在囤积现象,所以销售量可较好地代表需求量。味精商品价格即销售价格。

用人均消费水平代替收入水平。因为①消费水平与味精销售量关系更密切。②消费水平数据在统计年鉴上便于查找(收入水平的资料不全)。

味精销售量= f (销售价格,人均消费水平)

用平均价格作为销售价格的代表变量。不同地区和不同品牌的味精价格是不一样的,应取平均价格(加权平均最好)。

取不变价格的人均消费水平:消费水平都是用当年价格计算的,应用物价指数进行修正。

味精销售量= f (平均销售价格,不变价格的消费水平)

3.收集样本数据(抽样调查,引用数据)

从中国统计年鉴和有关部门收集样本数据(1972-1982, T= 11。数据见下页。)。定义销售量为y t(吨),平均销售价格为x1(元/ 公斤),不变价格的消费水平为x2(元)。相关系数表如下:

平均销售价格(x1t) 不变价格的消费水平(x2t)

味精销售量(y t) -0.3671 0.9771

注:临界值r0.05 (9) = 0.60。

4.确定模型形式并估计参数

y?= -144680.9 + 6313.4 x1t + 690.4 x2t(1)

t

(-3.92) (2.17) (15.32) R2 = 0.97, DW = 1.8, t0.05 (8) = 2.3

回归系数6313.4无显著性(y t与x1t应该是负相关,回归系数估计值却为正,可见该估计值不可信)。剔除不显著变量x1t,再次回归,

y?= -65373.6 + 642.4 x2t(2)

t

(-10.32) (13.8) R2 = 0.95, DW = 1.5, t0.05 (9) = 2.26 ?β= 6313.4,为什么检验结果是β1 = 0?量纲的变化对回归结果会造成影响问题:

1

吗?

建模案例2:(file:b1c4)中国国债发行额模型(多元回归)

首先分析中国国债发行额序列的特征。1980年国债发行额是43.01亿元(占GDP

的1%),2001年国债发行额是4604亿元(占GDP 的4.8%)。以当年价格计算,21年间(1980-2001)增长了106倍。平均年增长率是24.9%。

01000

2000

3000

4000

5000

80

82

84

86

88

90

92

94

96

98

00

DEBT

中国当前正处在社会主义市场经济逐步完善,宏观经济平稳运行的阶段。国债发行总量(DEBTt ,亿元)应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。选择3个解释变量,国内生产总值(百亿元),财政赤字额(亿元),年还本付息额(亿元),根据散点图建立中国国债发行额(DEBT t ,亿元)模型如下:

DEBT t = β0 +β

1 GDP t

+β2 DEF

t +β3 REP AY t + u t

其中GDP t 表示年国内生产总值(百亿元),DEF t 表示年财政赤字额(亿元),REP AY t 表示年还本付息额(亿元)。用1980-2000年数据得输出结果如下;

(file: nonli6)

变量的相关系数阵:

DEBT t = 4.38 +0.34 GDP t +1.00 DEF t +0.88 REP AY t

(0.2) (2.1) (26.6) (17.2) R 2 = 0.9986, DW=2.12, T =21, (1980-2000)

预测2001年的国债发行额(DEBT t ,亿元)。

DEBT 2001 = 4608.71 预测误差是 η =

4604

4604

71.4608-= 0.001

计量经济学·多元线性回归模型

计量经济学·多元线性回归模型

2006年 217656.6 77597.2 63376.86 2007年 268019.4 93563.6 73300.1 2008年 316751.7 100394.94 79526.53 2009年 345629.2 82029.69 68618.37 2010年 408903 107022.84 94699.3 2011年 484123.5 123240.56 113161.39 2012年 534123 129359.3 114801 2013年 588018.8 137131.4 121037.5 2014年 636138.7 143911.66 120422.84 数据来源:国家统计局 三、模型的检验及结果的解释、评价 (一)OLS 法的检验 相关系数: Y X1 X2 Y 1 0.9799919175967026 0.98352422945 0628 X1 0.97999191759 67026 1 0.99756527944 46187 X2 0.983524229450628 0.99756527944 46187 1 线性图: 100,000 200,000300,000400,000500,000600,000700,000Y X1 X2 估计参数: Dependent Variable: Y

Method: Least Squares Date: 12/14/15 Time: 14:47 Sample: 1985 2014 Included observations: 30 Variable Coefficient Std. Error t-Statistic Prob. C 3775.319359 326024 8769.9280467 183 0.4304846447 102545 0.67026006 64360232 X1 -0.91272630 85551189 1.9385186318 83585 -0.470837005 9194414 0.64153894 75333828 X2 5.522785592 51161 2.2548570541 42605 2.4492841275 08302 0.02108703 0146243 R-squared 0.967586049 4429319 Mean dependent var 173871.823 3333334 Adjusted R-squared 0.965185016 0683343 S.D. dependent var 187698.441 4104575 S.E. of regression 35022.22758 863741 Akaike info criterion 23.8599929 764685 Sum squared resid 3311702348 2.29852 Schwarz criterion 24.0001127 1463471 Log likelihood -354.899894 6470274 Hannan-Quinn criter. 23.9048184 8460881 F-statistic 402.9873385 683694 Durbin-Watson stat 0.54328498 36158895 Prob(F-statistic) 7.850214650 723685e-21 统计检验: (1)拟合优度:从上表可以得到R2=0.9675860494429319,修正后的可决系数R2=0.9651850160683343,这说明模型对样本的拟合很好。 (2)F检验:针对H0: (二)多重共线性的检验及修正 相关系数矩阵: X1 X2

计量经济学 案例分析

第二章 案例分析 研究目的:分析各地区城镇居民计算机拥有量与城镇居民收入水平的关系,对更多规律的研究具有指导意义. 一. 模型设定 2011年年底城镇居民家庭平均每百户计算机拥有量Y 与城镇居民平均每人全年家庭总收入X 的关系 图2.1 各地区城镇居民每百户计算机拥有量与人均总收入的散点图 由图可知,各地区城镇居民每百户计算机拥有量随着人均总收入水平的提高而增加,近似于线性关系,为分析其数量性变动规律,可建立如下简单线性回归模型: Y t =β1+β2X t +u t 50 60 708090100 110120130140 X Y

二.估计参数 假定所建模型及其随机扰动项u i满足各项古典假设,用普通最小二乘法(OLSE)估计模型参数.其结果如下: 表2.1 回归结果 Dependent Variable: Y Method: Least Squares Date: 11/13/17 Time: 12:50 Sample: 1 31 Included observations: 31 Variable Coefficient Std. Error t-Statistic Prob. C 11.95802 5.622841 2.126686 0.0421 X 0.002873 0.000240 11.98264 0.0000 R-squared 0.831966 Mean dependent var 77.08161 Adjusted R-squared 0.826171 S.D. dependent var 19.25503 S.E. of regression 8.027957 Akaike info criterion 7.066078 Sum squared resid 1868.995 Schwarz criterion 7.158593 Log likelihood -107.5242 Hannan-Quinn criter. 7.096236 F-statistic 143.5836 Durbin-Watson stat 1.656123 Prob(F-statistic) 0.000000 由表2.1可得, β1=11.9580,β2=0.0029 故简单线性回归模型可写为: ^ Y X t t=11.9580+0.0029 其中:SE(β1)=5.6228, SE(β2)=0.0002 R-squared=0.8320,F=143.5836,n=31

计量经济学实验报告(多元线性回归 自相关 )

实验报告 课程名称计量经济学 实验项目名称多元线性回归自相关 异方差多重共线性班级与班级代码 08国际商务1班实验室名称(或课室)实验楼910 专业国际商务 任课教师刘照德 学号: 043 姓名:张柳文 实验日期: 2011 年 06 月 23日 广东商学院教务处制

姓名张柳文实验报告成绩 评语: 指导教师(签名) 年月日说明:指导教师评分后,实验报告交院(系)办公室保存。

计量经济学实验报告 实验项目:多元线性回归、自相关、异方差、多重共线性 实验目的:掌握多元线性回归模型、自相关模型、异方差模型、多重共线性模型的估计和检验方法和处理方法 实验要求:选择方程进行多元线性回归;熟悉图形法检验和掌握D-W 检验,理解广义差分法变换和掌握迭代法;掌握Park或 Glejser检验,理解同方差性变换; 实验原理:普通最小二乘法图形检验法 D-W检验广义差分变换加权最小二乘法 Park检验等 实验步骤: 首先:选择数据 为了研究影响中国税收收入增长的主要原因,选择国内生产总值(GDP)、财政支出(ED)、商品零售价格指数(RPI)做为解释变量,对税收收入(Y)做多元线性回归。从《中国统计年鉴》2011中收集1978—2009年各项影响因素的数据。如下表所示: 中国税收收入及相关数据

实验一:多元线性回归 1、将数据导入后,分别对三个解释变量与被解释变量做散点图,选择两个变量作为group打开,在数据表“group”中点击view/graph/scatter/simple scatter,出现数据的散点图,分别如下图所示: 从散点图看,变量间不一定呈现线性关系,可以试着作线性回归。 2、进行因果关系检验

计量经济学简单线性回归实验报告精编

实验报告 1. 实验目的随着中国经济的发展,居民的常住收入水平不断提高,粮食销售量也不断增长。研究粮食年销售量与人均收入之间的关系,对于探讨粮食年销售量的增长的规律性有重要的意义。 2. 模型设定 为了分析粮食年销售量与人均收入之间的关系,选择“粮食年销售量” 为被解释变量(用Y 表示),选择“人均收入”为解释变量(用X 表 示)。本次实验报告数据取自某市从1974 年到1987 年的数据(教材书上101页表3.11),数据如下图所示:

1粮食年销售量Y/万吨人均收入X/ rF1974[ 9& 45153.2 1975100.7190 pl1976102.8240.3 1977133. 95301.12 [61978140.13361 71979143.11420 8—1980146.15491.76「91981144.6501 101982148. 94529.2 1 11-1983158.55552. 72匸1984169. 68771.16 131985P 162.1481L8 14二1986170. 09988.43 1519871F& 691094.65为分析粮食年销售量与人均收入的关系,做下图所谓的散点图 从散点图可以看出粮食年销售量与人均收入大体呈现为线性关 系,可以建立如下简单现行回归模型: 3?估计参数

Y t = ■? 1 2 X t ——I t 假定所建模型及其中的随机扰动项叫满足各项古典假定,可以 用OLS法估计其参数。 通过利用EViews对以上数据作简单线性回归分析,得出回归结果如下表所示: Dependent Variable Y Method: Least Squares Date 10/15/11 Time 14 49 Sample- 1 14 Included observations: 14 Variable Coefficient Std Error t-Statistic Prob C99 61349 6 431242 15 489000 0000 X0.0814700.010738 7.5071190.0000 R-squared0 827493Mean dependent var142 7129 Adjusted R-squared0 813123S.D. dependent var26.09805 S E of regression11 28200Akaike info criterion7 915858 Sum squared resid1527 403Schwarz criterion7 907152 Log likelihood-52.71101F-statisti c5756437 Durbin-V/atson stat0 638969Prob(尸-statistic)0 000006 可用规范的形式将参数估计和检验的结果写为: A Y t =99.61349+0.08147 X t (6.431242)(0.10738) t= (15.48900) (7.587119) R2=0.827498 F=57.56437 n=14 4?模型检验 (1).经济意义检验 A A 所估计的参数1=99.61349, 1 2=0.08147,说明人均收入每增加 1元,平均说来可导致粮食年销售量提高0.08147元。这与经济学中

多元线性回归分析预测法

多元线性回归分析预测法 (重定向自多元线性回归预测法) 多元线性回归分析预测法(Multi factor line regression method,多元线性回归分析法) [编辑] 多元线性回归分析预测法概述 在市场的经济活动中,经常会遇到某一市场现象的发展和变化取决于几个影响因素的情况,也就是一个因变量和几个自变量有依存关系的情况。而且有时几个影响因素主次难以区分,或者有的因素虽属次要,但也不能略去其作用。例如,某一商品的销售量既与人口的增长变化有关,也与商品价格变化有关。这时采用一元回归分析预测法进行预测是难以奏效的,需要采用多元回归分析预测法。 多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。 [编辑] 多元线性回归的计算模型[1] 一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释

因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。 设y为因变量,为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为: 其中,b0为常数项,为回归系数,b1为固定时,x1每增加一 个单位对y的效应,即x1对y的偏回归系数;同理b2为固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: 其中,b0为常数项,为回归系数,b1为固定时,x2每增加一 个单位对y的效应,即x2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为: y = b0 + b1x1 + b2x2 + e 建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是: (1)自变量对因变量必须有显著的影响,并呈密切的线性相关; (2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的; (3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度; (4)自变量应具有完整的统计数据,其预测值容易确定。 多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和()为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为 解此方程可求得b0,b1,b2的数值。亦可用下列矩阵法求得

计量经济学·多元线性回归模型

计量经济学·多元线性回归模型应用作业 1985~2014年中国GDP与进口、出口贸易总额的关系 一、概述 在当今市场上,一国的GDP与多个因素存在着紧密的联系,例如进口总额和出口总额等都是影响一国GDP 的重要因素。本次将以中国1985-2014年GDP和进口总额、出口总额两个因素因素的数据,通过建立计量经济模型来分析上述变量之间的关系,强调贸易对GDP 的重要性,从而促进国内生产总值的发展。 二、模型构建过程 ⒈变量的定义 解释变量:X1进口贸易总额,X2出口贸易总额被解释变量:Y国内生产总值 建立计量经济模型:解释原油产量与进口贸易总额、出口贸易总额之间的关系。 ⒉模型的数学形式 设定GDP与两个解释变量相关关系模型,样本回归模型为: ⒊数据的收集 该模型的构建过程中共有两个变量,分别是中国从1990-2006年民用汽车拥有量、电力产量、国内生产总值以及能源消费总量,因此为时间序列数据,最后一个即2006年的数据作为预测对比数据,收集的数据如下所示 时间国内生产总值(亿元) 出口总额(人民币亿 元) 进口总额(人民币亿 元) 1985年9039.9 808.9 1257.8 1986年10308.8 1082.1 1498.3 1987年12102.2 1470 1614.2 1988年15101.1 1766.7 2055.1 1989年17090.3 1956 2199.9 1990年18774.3 2985.8 2574.3 1991年21895.5 3827.1 3398.7 1992年27068.3 4676.3 4443.3 1993年35524.3 5284.8 5986.2 1994年48459.6 10421.8 9960.1 1995年61129.8 12451.8 11048.1 1996年71572.3 12576.4 11557.4 1997年79429.5 15160.7 11806.5 1998年84883.7 15223.6 11626.1 1999年90187.7 16159.8 13736.5 2000年99776.3 20634.4 18638.8 2001年110270.4 22024.4 20159.2 2002年121002 26947.9 24430.3 2003年136564.6 36287.9 34195.6 2004年160714.4 49103.3 46435.8 2005年185895.8 62648.1 54273.7

计量经济学模型分析论文

计量经济学模型分析论文 工商101

我国城镇居民储蓄存款影响因素的实证分析 摘要:近年来,随着中国经济的飞速发展,一直保持在高水平上的中国储蓄率受到了越来越多国内外经济学家的关注。高储蓄率给我国经济发展带来充裕资金来源,是支持经济快速增长的重要因素。更为重要的是,源源不断的资金流保证了金融机构的流动性,增强了银行的稳定性。与此同时,也给我国经济发展带来前所未有的挑战,因为,过高的储蓄,必然伴随着投资或消费的不足。所以对影响居民储蓄的主要因素进行分析,才能在制定宏观政策上采取适当的措施,使储蓄率保持在一个适当的水平,促进经济增长。本文利用我国1982年以来的统计数字建立了可以通过各种检验的城镇居民储蓄率的模型。通过对该模型的经济含义分析可以得出可支配收入率对储蓄率的影响不大,还有利率对储蓄率的影响很小,值得注意的是,模型中的基尼系数对城镇居民的储蓄影响是相当大的。

引言(提出问题) 自1949年以来,中国储蓄率随着经济增长和收入水平提高呈不断上升趋势,因而高储蓄率也被认为是解释中国经济高速增长的一个主要因素。虽然高储蓄率总是会导致更高的收入及较高的经济增长率,但并非储蓄率越高越好,必然会存在一个最优的储蓄率。 据统计,我国近年来的实际GDP平均每年增长9%左右,而资本的净边际产量即(MPK-δ),约为0.9%。我国的资本收益(MPK-δ)=每年0.9%,大大低于经济的平均增长率(n+g=9%)。可见,我国的资本存量已经远远超过了黄金律水平。也就是说,当前我国的储蓄率和投资水平已经偏高,而消费率则偏低。所以我们应该降低储蓄率,减少投资,把收入的更大份额用于消费,这样就会立即提高消费水平,并最终达到更高消费水平的稳定状态。 那应该如何降低我国的储蓄率呢?下面我们将以城镇居民的数据为例进行分析。

第三章多元线性回归模型(stata)

一、邹式检验(突变点检验、稳定性检验) 1.突变点检验 1985—2002年中国家用汽车拥有量(t y ,万辆)与城镇居民家庭人均可支配收入(t x ,元),数据见表。 表 中国家用汽车拥有量(t y )与城镇居民家庭人均可支配收入(t x )数据 年份 t y (万辆) t x (元) 年份 t y (万辆) t x (元) 1985 1994 1986 1995 4283 1987 1996 1988 1997 1989 1998 1990 1999 5854 1991 2000 6280 1992 2001 1993 2002 下图是关于t y 和t x 的散点图:

从上图可以看出,1996年是一个突变点,当城镇居民家庭人均可支配收入突破元之后,城镇居民家庭购买家用汽车的能力大大提高。现在用邹突变点检验法检验1996年是不是一个突变点。 :两个字样本(1985—1995年,1996—2002年)相对应的模型回归参数相等H H :备择假设是两个子样本对应的回归参数不等。 1 在1985—2002年样本范围内做回归。

在回归结果中作如下步骤(邹氏检验): 1、 Chow 模型稳定性检验(lrtest) 用似然比作chow检验,chow检验的零假设:无结构变化,小概率发生结果变化* 估计前阶段模型 * 估计后阶段模型 * 整个区间上的估计结果保存为All * 用似然比检验检验结构没有发生变化的约束 得到结果如下;

(如何解释) 2.稳定性检验(邹氏稳定性检验) 以表为例,在用1985—1999年数据建立的模型基础上,检验当把2000—2002年数据加入样本后,模型的回归参数时候出现显著性变化。 * 用F-test作chow间断点检验检验模型稳定性 * chow检验的零假设:无结构变化,小概率发生结果变化 * 估计前阶段模型 * 估计后阶段模型 * 整个区间上的估计结果保存为All

多元线性回归预测模型论文

多元线性回归统计预测模型 摘要:本文以多元统计分析为理论基础,在对数据进行统计分析的基础上建立多元线性回归模型并对未知量作出预测,为相关决策提供依据和参考。重点介绍了模型中参数的估计和自变量的优化选择及简单应用举例。 关键词:统计学;线性回归;预测模型 一.引言 多元线性回归统计预测模型是以统计学为理论基础建立数学模型,研究一个随机变量Y与两个或两个以上一般变量X 1,X 2,…,Xp 之间相依关系,利用现有数据,统计并分析,研究问题的变化规律,建立多元线性回归的统计预测模型,来预测未来的变化情况。它不仅能解决一些随机的数学问题,而且还可以通过建立适当的随机模型进而解决一些确定的数学问题,为相关决策提供依据和参考。 目前统计学与其他学科的相互渗透为统计学的应用开辟新的领域。并被广泛的应用在各门学科上,从物理和社会科学到人文科学,甚至被用来工业、农业、商业及政府部门。而多元线性回归是多元统计分析中的一个重要方法,被应用于众多自然科学领域的研究中。多元线性回归分析作为一种较为科学的方法,可以在获得影响因素的前提下,将定性问题定量化,确定各因素对主体问题的具体影响程度。 二.多元线性回归的基本理论 多元线性回归是多元统计分析中的一个重要方法,被广泛应用于众多自然科学领域的研究中。多元线性回归分析的基本任务包括:根据因变量与多个自变量的实际观测值建立因变量对多个自变量的多元线性回归方程;检验、分析各个自变量对因自变量的综合线性影响的显著性;检验、分析各个自变量对因变量的单纯线性影响的显著性,选择仅对因变量有显著线性影响的自变量,建立最优多元线性回归方程;评定各个自变量对因变量影响的相对重要性以及测定最优多元线性回归方程的偏离度等。由于多数的多元非线性回归问题都可以化为多元线性回归问题,所以这里仅讨论多元线性回归。许多非线性回归和多项式回归都可以化为多元线性回归来解决,因而多元线性回归分析有着广泛的应用。 2.1 多元线性回归模型的一般形式 设随机变量y 与一般变量12,, ,p x x x 线性回归模型为 01122...p p y x x x ββββε=+++++ (2.1) 模型中Y为被解释变量(因变量),而12,,,p x x x 是p 个可以精确测量并可控制的一般变 量,称为解释变量(自变量)。p =1时,(2.1)式即为一元线性回归模型,p 大于2时,(2.1)

计量经济学案例分析汇总

计量经济学案例分析1 一、研究的目的要求 居民消费在社会经济的持续发展中有着重要的作用。居民合理的消费模式和居民适度的消费规模有利于经济持续健康的增长,而且这也是人民生活水平的具体体现。改革开放以来随着中国经济的快速发展,人民生活水平不断提高,居民的消费水平也不断增长。但是在看到这个整体趋势的同时,还应看到全国各地区经济发展速度不同,居民消费水平也有明显差异。例如,2002年全国城市居民家庭平均每人每年消费支出为元, 最低的黑龙江省仅为人均元,最高的上海市达人均10464元,上海是黑龙江的倍。为了研究全国居民消费水平及其变动的原因,需要作具体的分析。影响各地区居民消费支出有明显差异的因素可能很多,例如,居民的收入水平、就业状况、零售物价指数、利率、居民财产、购物环境等等都可能对居民消费有影响。为了分析什么是影响各地区居民消费支出有明显差异的最主要因素,并分析影响因素与消费水平的数量关系,可以建立相应的计量经济模型去研究。 二、模型设定 我们研究的对象是各地区居民消费的差异。居民消费可分为城市居民消费和农村居民消费,由于各地区的城市与农村人口比例及经济结构有较大差异,最具有直接对比可比性的是城市居民消费。而且,由于各地区人口和经济总量不同,只能用“城市居民每人每年的平均消费支出”来比较,而这正是可从统计年鉴中获得数据的变量。所以模型的被解释变量Y选定为“城市居民每人每年的平均消费支出”。 因为研究的目的是各地区城市居民消费的差异,并不是城市居民消费在不同时间的变动,所以应选择同一时期各地区城市居民的消费支出来建立模型。因此建立的是2002年截面数据模型。 影响各地区城市居民人均消费支出有明显差异的因素有多种,但从理论和经验分析,最主要的影响因素应是居民收入,其他因素虽然对居民消费也有影响,但有的不易取得数据,如“居民财产”和“购物环境”;有的与居民收入可能高度相关,如“就业状况”、“居民财产”;还有的因素在运用截面数据时在地区间的差异并不大,如“零售物价指数”、“利率”。因此这些其他因素可以不列入模型,即便它们对居民消费有某些影响也可归入随即扰动项中。为了与“城市居民人均消费支出”相对应,选择在统计年鉴中可以获得的“城市居民每人每年可支配收入”作为解释变量X。 从2002年《中国统计年鉴》中得到表的数据: 表 2002年中国各地区城市居民人均年消费支出和可支配收入

matlab建立多元线性回归模型并进行显著性检验及预测问题

matlab建立多元线性回归模型并进行显着性检验及预测问题 例子; x=[143 145 146 147 149 150 153 154 155 156 157 158 159 160 162 164]'; X=[ones(16,1) x]; 增加一个常数项Y=[88 85 88 91 92 93 93 95 96 98 97 96 98 99 100 102]'; [b,bint,r,rint,stats]=regress(Y,X) 得结果:b = bint = stats = 即对应于b的置信区间分别为[,]、[,]; r2=, F=, p= p<, 可知回归模型y=+ 成立. 这个是一元的,如果是多元就增加X的行数! function [beta_hat,Y_hat,stats]=regress(X,Y,alpha) % 多元线性回归(Y=Xβ+ε)MATLAB代码 %? % 参数说明 % X:自变量矩阵,列为自变量,行为观测值 % Y:应变量矩阵,同X % alpha:置信度,[0 1]之间的任意数据 % beta_hat:回归系数 % Y_beata:回归目标值,使用Y-Y_hat来观测回归效果 % stats:结构体,具有如下字段 % =[fV,fH],F检验相关参数,检验线性回归方程是否显着 % fV:F分布值,越大越好,线性回归方程越显着 % fH:0或1,0不显着;1显着(好) % =[tH,tV,tW],T检验相关参数和区间估计,检验回归系数β是否与Y有显着线性关系 % tV:T分布值,beta_hat(i)绝对值越大,表示Xi对Y显着的线性作用% tH:0或1,0不显着;1显着 % tW:区间估计拒绝域,如果beta(i)在对应拒绝区间内,那么否认Xi对Y显着的线性作用 % =[T,U,Q,R],回归中使用的重要参数 % T:总离差平方和,且满足T=Q+U % U:回归离差平方和 % Q:残差平方和 % R∈[0 1]:复相关系数,表征回归离差占总离差的百分比,越大越好% 举例说明 % 比如要拟合y=a+b*log(x1)+c*exp(x2)+d*x1*x2,注意一定要将原来方程线化% x1=rand(10,1)*10; % x2=rand(10,1)*10; % Y=5+8*log(x1)+*exp(x2)+*x1.*x2+rand(10,1); % 以上随即生成一组测试数据 % X=[ones(10,1) log(x1) exp(x2) x1.*x2]; % 将原来的方表达式化成Y=Xβ,注意最前面的1不要丢了

计量经济学课后习题答案

计量经济学练习题 第一章导论 一、单项选择题 ⒈计量经济研究中常用的数据主要有两类:一类是时间序列数据,另一类是【 B 】 A 总量数据 B 横截面数据 C平均数据 D 相对数据 ⒉横截面数据是指【 A 】 A 同一时点上不同统计单位相同统计指标组成的数据 B 同一时点上相同统计单位相同统计指标组成的数据 C 同一时点上相同统计单位不同统计指标组成的数据 D 同一时点上不同统计单位不同统计指标组成的数据 ⒊下面属于截面数据的是【 D 】 A 1991-2003年各年某地区20个乡镇的平均工业产值 B 1991-2003年各年某地区20个乡镇的各镇工业产值 C 某年某地区20个乡镇工业产值的合计数 D 某年某地区20个乡镇各镇工业产值 ⒋同一统计指标按时间顺序记录的数据列称为【 B 】 A 横截面数据 B 时间序列数据 C 修匀数据 D原始数据 ⒌回归分析中定义【 B 】 A 解释变量和被解释变量都是随机变量 B 解释变量为非随机变量,被解释变量为随机变量 C 解释变量和被解释变量都是非随机变量 D 解释变量为随机变量,被解释变量为非随机变量 二、填空题 ⒈计量经济学是经济学的一个分支学科,是对经济问题进行定量实证研究的技术、方法和相关理论,可以理解为数学、统计学和_经济学_三者的结合。

⒉现代计量经济学已经形成了包括单方程回归分析,联立方程组模型,时间序列分 析三大支柱。 ⒊经典计量经济学的最基本方法是回归分析。 计量经济分析的基本步骤是:理论(或假说)陈述、建立计量经济模型、收集数据、计量经济模型参数的估计、检验和模型修正、预测和政策分析。 ⒋常用的三类样本数据是截面数据、时间序列数据和面板数据。 ⒌经济变量间的关系有不相关关系、相关关系、因果关系、相互影响关系和恒 等关系。 三、简答题 ⒈什么是计量经济学它与统计学的关系是怎样的 计量经济学就是对经济规律进行数量实证研究,包括预测、检验等多方面的工作。计量经济学是一种定量分析,是以解释经济活动中客观存在的数量关系为内容的一门经济学学科。 计量经济学与统计学密切联系,如数据收集和处理、参数估计、计量分析方法设计,以及参数估计值、模型和预测结果可靠性和可信程度分析判断等。可以说,统计学的知识和方法不仅贯穿计量经济分析过程,而且现代统计学本身也与计量经济学有不少相似之处。例如,统计学也通过对经济数据的处理分析,得出经济问题的数字化特征和结论,也有对经济参数的估计和分析,也进行经济趋势的预测,并利用各种统计量对分析预测的结论进行判断和检验等,统计学的这些内容与计量经济学的内容都很相似。反过来,计量经济学也经常使用各种统计分析方法,筛选数据、选择变量和检验相关结论,统计分析是计量经济分析的重要内容和主要基础之一。 计量经济学与统计学的根本区别在于,计量经济学是问题导向和以经济模型为核心的,而统计学则是以经济数据为核心,且常常是数据导向的。典型的计量经济学分析从具体经济问题出发,先建立经济模型,参数估计、判断、调整和预测分析等都是以模型为基础和出发点;典型的统计学研究则并不一定需要从具体明确的问题出发,虽然也有一些目标,但可以是模糊不明确的。虽然统计学并不排斥经济理论和模型,有时也会利用它们,但统计学通常

计量经济学习题解析

计量经济学习题解析 TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-

第一章 1、下列假想模型是否属于揭示因果关系的计量经济学模型为什么 (1)t S =+t R ,其中t S 为第t 年农村居民储蓄增加额(单位:亿元),t R 为第t 年城镇居民可支配收入总额(单位:亿元)。 (2)1t S -=+t R ,其中1t S -为第t-1年底农村居民储蓄余额(单位:亿元),t R 为第t 年农村居民纯收入总额(单位:亿元)。 2、指出下列假想模型中的错误,并说明理由: 其中,t RS 为第t 年社会消费品零售总额(单位:亿元),t RI 为第t 年居民收入总额(单位:亿元)(指城镇居民可支配收入总额与农村居民纯收入总额之和),t IV 为第t 年全社会固定资产投资总额(单位:亿元)。 3、下列设定的精良经济模型是否合理为什么 4、 (1)3 01i i i GDP GDP ββμ==+?+∑ 其中,i GDP (i=1,2,3)是第一产业、第二产业、第三产业增加值,μ为随机干扰项。 (2)财政收入=f (财政支出)+ μ,μ为随机干扰项。 答案1、(1)不是。因为农村居民储蓄增加额应与农村居民可支配收入总额有关,而与城镇居民可支配收入总额没有因果关系。 (2)不是。第t 年农村居民的纯收入对当年及以后年份的农村居民储蓄有影响,但并不对第t-1的储蓄产生影响。 2、一是居民收入总额RI t 前参数符号有误,应是正号;二是全社会固定资产投资总额IV t 这一解释变量的选择有误,它对社会消费品零售总额应该没有直接的影响。 3、(1)不合理,因为作为解释变量的第一产业、第二产业和第三产业的增加值是GDP 的构成部分,三部分之和正为GDP 的值,因此三变量与GDP 之间的关系并非随机关系,也非因果关系。 (2)不合理,一般来说财政支出影响财政收入,而非相反,因此若建立两者之间的模型,解释变量应该为财政收入,被解释变量应为财政支出;另外,模型没有给出具体的数学形式,是不完整的。 第二章五、计算分析题 1、令kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。生育率对受教育年数的简单回归模型为 (1)随机扰动项μ包含什么样的因素它们可能与受教育水平相关吗

计量经济学多元线性回归

低碳农业发展影响因素分析——以新疆南疆五地州为例 学生姓名方芳 学号1075717008 所属学院经济与管理学院 专业农村与区域发展 塔里木大学教务处制

目录 1 引言 (1) 2 数据来源和研究方法 (1) 2.1数据来源 (1) 2.2研究方法 (2) 3 模型检验与结果 (3) 3.1初始模型计量 (3) 3.2检验 (3) 4 结论与建议 (4) 5 参考文献 (4)

低碳农业发展影响因素分析 --以新疆南疆五地州为例 方芳 摘要:全球变暖问题引起世界各国的广泛关注,这一变化使得自然灾害频发,甚至危及人类安全,因此解决这一问题迫在眉睫。通过对新疆南疆五地州的农业总产值与化肥施用量、农用机械总动力及农作物总播种面积进行回归分析后,发现化肥施用量对农作物的总产值影响极大,是其主要的制约因素。要发展低碳农业应转变农业生产方式,实施保护性耕作;应推广施肥新技术,提高化肥利用率;应改进装置,利用新技术生产化肥;发展生态农业,实现经济循环发展。 关键字:低碳农业影响因素回归分析 1 引言 近年来气候变化所导致的高温热潮、暴雨连连、旱灾、沙尘暴频发事件的概率持续增加,CO2是造成该现象的源头之一,因此,发展低碳经济、发展节能减排成为全球关注的热点。2014 年《中美气候变化联合声明》提出我国将于2030 年左右达到碳排放峰值的庄严承诺,2015 年12 月12 日,195个缔约方在巴黎达成了新的全球气候协议———《巴黎协议》,提出努力将气温升幅限制在1.5℃内的目标。农业碳排放量介于电热生产和尾气之间,成为第二大排放源,占我国碳排放总量的17%。新疆位于亚欧大陆腹地,地处中国西北边陲,是中国面最大、交界邻国最多、陆地边境线最长的省区,肩负着与重要世界经济资源大国沿边开放的重任。同时,新疆作为我国重要的种植业和畜牧业基地,以8%的绿洲面积承载了90%以上的人口、耕地和生产总值,绿色生态压力相当严峻。新疆南疆位于天山以南的塔里木盆地 ,四周高山环抱。在行政区划上包括巴音郭楞、阿克苏、喀什、克孜勒苏、和田等五地州及生产建设兵团的四个农业师。塔里木河是我国最大的内陆河,它由西向东1321km,流域覆盖新疆南部地区,面积102万km2,人口825.7万 ,分别占新疆自治区的61%和 47%,是我国重要的棉花基地。冉锦成、苏洋等人研究表明,南疆各地 (州,市) 区域差异明显,喀什地区属碳排放量、碳排放强度“双高”型地区,因此,通过对农业产值与化肥施用量、机械总动力以及农作物播种面积的回归分析,试图找到影响低碳农业发展的主要因素,并提出相关的建议,促进农业实现低碳生产。 2 数据来源和研究方法 2.1数据来源 本文选取的是新疆2006--2016年的农业生产数据,其中包括:农业总产值(亿)Y,化肥施用量(万吨)(X1)、农用机械总动力(万千瓦)(X2)、农作物总播种面积(万公顷)(X3),数据来源于《中国统计年鉴》和《新疆统计年鉴》(2006--2016),数据见表1。 表1 新疆统计年鉴2006-2016样本数据

计量经济学数据分析

计量经济学数据分析 学院:管理与经济学院 专业:技术经济及管理 姓名:葛文 学号:20808172

分析中国经济发展对中国股票市场的影响本文通过分析2000年到2007年各月股票市场流通市值(value),成交金额(turnover),GDP现价和居民储蓄(saving)的相关数据,试图分析我国经济发展对股票市场的影响。数据来源为CCFR数据库和证监会网站。具体分析如下: 一、绘制四个数据变量的线性图,查看2000年到2007年他们各自的走势。 5000 10000 15000 20000 25000 2000200120022003200420052006 GDP 40000 60000 80000 100000 120000 140000 160000 180000 2000200120022003200420052006 SAVING 0 10000 20000 30000 40000 50000 60000 2000200120022003200420052006 turnover 10000 20000 30000 40000 50000 60000 2000200120022003200420052006 value 二、采用最小二乘法(OLS)进行分析

回归表达式:gdp=10433.48+0.191218*turnover 其中:Prob低于0.05,说明对应系数显著不为零;R2=0.195641,说明拟合程度一般;Prob(F-statistic)=0.000013<0.05,说明至少有一个解释变量的回归系数不为零。 回归表达式:gdp=8470.567+0.196853*value 其中:Prob低于0.05,说明对应系数显著不为零;R2=0.154730,说明拟合程度一般;Prob(F-statistic)=0.000125<0.05,说明至少有一个解释变量的回归系数不为零。

多元线性回归预测

多元线性回归预测 在预测中,当预测对象y 受到多个因素m x x x ,,,21 影响时,如果各个影响因素j x (m j ,,2,1 =)与y 的相关关系可以同时近似地线性表示,这时则可以建立多元线性回归模型来进行分析和预测。 假定因变量y 与自变量),,2,1(m j x j =之间的关系可表示为 i mi m i i i x b x b x b b y ε+++++= 22110 (2-22) n i ,,2,1 =(样本序号) 其中0b 、j b ),,2,1(m j =——模型回归系数;i ε为除自变量j x ),,2,1(m j =的影响之外对i y 产生影响的随机变量,即随机误差。该结论基于以下的假设: 随机误差i ε的期望值为零,),,2,1(0)(n i E i ==ε; 方差的期望值为一常数2σ,),,2,1()(22n i E i ==σε; 各随机误差项是互不相关的,即协方差的数学期望值为零,0),(=j i E εε ),,,2,1,(j i n j i ≠= 当以上假设得到满足时,式(2-22)便称为多元线性回归预测模型,这时可写成 ),,2,1(?22110n i x b x b x b b y mi m i i i =?++++= (2-23) 和一元线性回归预测模型一样,多元线性回归预测模型建立时也采用最小二 二乘法估计模型参数,但具体估计时有二种算法,分述如下。 一、多元线性回归预测模型的一般算法 1.建立模型 改写式(2-22) 得 ),,2,1(?n i y y i i i =-=ε 方差和Q 为

2 1 221102212 )()?(mi m n i i i i n i i i n i i x b x b x b b y y y Q -----=-==∑∑∑=== ε 根据最小二乘法原理,欲估计参数),,2,1(m i b i =,要满足条件: ?????? ?????=------=??=------=??=------=??0)(Σ20)(Σ20)(Σ2221102211011 221100mi m i i i mi m mi m i i i i mi m i i i x b x b x b b y x b Q x b x b x b b y x b Q x b x b x b b y b Q 整理上式可得到: ?? ???? ?=++++=++++=++++i mi mi m i mi i mi mi i i mi i m i i t i i mi m i i y x x b x x b x x b x b y x x x b x x b x b x b y x b x b x b nb ΣΣΣΣΣΣΣΣΣΣΣΣΣΣ222110112122 111022,110 而对于各变量的样本平均值,其误差平方和为: ??? ? ? ? ??? -=--==--==∑∑∑===n i i yy n i i j ji yj jy n i k ki j ji kj jk y y s y y x x s s x x x x s s 12 11 ) ())(() )(( (2-25) ),,2,1,(k k j = 式中 ∑==n i ji j x n x 1 1 ∑==n i i y n y 1 1 利用(2-24)式,将方程组(2-25)可改写为

计量经济学分析模型

计量经济学分析模型

摘要 改革开放以来,我国经济呈迅速而稳定的增长趋势,由于分配机制和收入水平的变化,城镇居民生活水平在达到稳定小康之后,消费结构和消费水平都出现了一些新的特点。本文旨在对近几年,我国城镇年人均收入变动对年人均各种消费变动的影响进行实证分析。首先,我们综合了几种关于收入和消费的主要理论观点;本文根据相关的数据统计数据,运用一定的计量经济学的研究方法,进而我们建立了理论模型。然后,收集了相关的数据,利用EVIEWS软件对计量模型进行了参数估计和检验,并加以修正。最后,我们对所得的分析结果和影响消费的一些因素作了经济意义的分析,并相应提出一些政策建议。并找到影响居民消费的主要因素。 关键词:居民消费;城镇居民;回归;Eviews

目录 摘要.................................................................. II 前言. (1) 1 问题的提出 (2) 2 经济理论陈述 (3) 2.1西方经济学中有关理论假说 (3) 2.2有关消费结构对居民消费影响的理论 (4) 3 相关数据收集 (6) 4 计量经济模型的建立 (9) 5 模型的求解和检验 (10) 5.1计量经济的检验 (10) 5.1.1模型的回归分析 (10) 5.1.2拟合优度检验: (11) 5.1.3 F检验 (11) 5.1.4 T检验 (12) 5.2 计量修正模型检验: (12) 5.2.1 Y与的一元回归 (13) 5.2.2拟合优度的检验 (13) 5.2.3 F检验 (14) 5.2.4 T检验: (15) 5.3经济意义的分析: (15) 6 政策建议 (16) 结论 (17) 参考文献 (19)

相关主题
文本预览
相关文档 最新文档