当前位置:文档之家› 面板数据模型与应用 张晓彤

面板数据模型与应用 张晓彤

面板数据模型与应用 张晓彤
面板数据模型与应用 张晓彤

面板数据模型与应用

张晓峒

中国数量经济学会常务理事,学术委员会委员

南开大学数量经济学专业博士生导师

xttfyt@https://www.doczj.com/doc/1716081660.html,,nkeviews@https://www.doczj.com/doc/1716081660.html,

最近新书:

1.Badi H. Baltagi, Econometric Analysis of Panel Data, John Wiley & Sons, 2005.

2.Jeffrey M. Wooldridge, Econometric Analysis of Cross Section and Panel Data,

3.Cheng Hsiao, Analysis of Panel Data, Cambridge University Press, 2003.

4.Manuel Arellano, Panel Data Econometrics (Advanced Texts in Econometrics), 2003.

5. Edward W. Frees, Longitudinal and Panel Data: Analysis and Applications in the Social Sciences, 2004.

6.谢识予朱宏鑫编著,高级计量经济学,2005-5

7.童光荣,计量经济学,武汉大学出版社2006-3

学术会议:

1. 13th International Conference on Panel Data, Faculty of Economics, & Robinson College, University of Cambridge, Cambridge, UK, 7-9 July 2006

1.面板数据定义

panel data的中译:面板数据、桌面数据、平行数据、纵列数据、时间序列截面数据、混合数据(pool data)、固定调查对象数据。

面板数据定义

(1)面板数据定义为相同截面上的个体在不同时点的重复观测数据。

(2)称为纵向变量序列(个体)的多次测量。

面板数据从横截面(cross section)看,是由若干个体(entity, unit, individual)在某一时点构成的截面观测值,从纵剖面(longitudinal section)看每个个体都是一个时间序列。

图1

面板数据用双下标变量表示。例如

y i t, i = 1, 2, …, N; t = 1, 2, …, T

i对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,y i ., ( i = 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。

这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。

案例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP )和人均收入(IP )数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。

人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。

图2 15个省级地区的人均消费序列(纵剖面) 图3 15个省级地区的人均收入序列(file:5panel02)

2000

4000600080001000012000140002

46

8

10

12

14

2000

4000600080001000012000140002

46

8

10

12

14

图4 7个时点人均消费横截面数据(含15个地区) 图5 7个时点人均收入横截面数据(含15个地区) (每条连线数据表示同一年度15个地区的消费值) (每条连线数据表示同一年度15个地区的收入值)

用CP表示消费,IP表示收入。AH, BJ, FJ, HB, HLJ, JL, JS, JX, LN, NMG, SD, SH, SX, TJ, ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、

图6 人均消费对收入的面板数据散点图(15个时间序列叠加)

2000

4000

6000

8000

10000

12000

2000400060008000100001200014000

IP(1996-2002)

C P1996

C P1997

C P1998

C P1999

C P2000

C P2001

C P2002

图7 人均消费对收入的面板数据散点图(7个截面叠加)

图8 北京和内蒙古1996-2002年消费对收入散点图图9 1996和2002年15个地区的消费对收入散点图

2.面板数据模型分类

用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。

2.1 混合回归模型(Pooled model)。

如果一个面板数据模型定义为,

y it = α+X it 'β+εit, i = 1, 2, …, N; t = 1, 2, …, T(1) 其中y it为被回归变量(标量),α表示截距项,X it为k?1阶回归变量列向量(包括k个回归量),β为k?1阶回归系数列向量,εit为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数α和β都相同。

如果模型是正确设定的,解释变量与误差项不相关,即Cov(X it,εit) = 0。那么无论是N→∞,还是T→∞,模型参数的混合最小二乘估计量(Pooled OLS)都是一致估计量。

2.2 固定效应回归模型(fixed effects regression model)。

固定效应模型分为3种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。

2.2.1个体固定效应回归模型(entity fixed effects regression model)

如果一个面板数据模型定义为,

y it = αi+X it 'β +εit, i = 1, 2, …, N; t = 1, 2, …, T(3)

其中αi是随机变量,表示对于i个个体有i个不同的截距项,且其变化与X it 有关系;y it为被回归变量(标量),εit为误差项(标量),X it为k?1阶回归变量列向量(包括k个回归量),β为k?1阶回归系数列向量,对于不同个体回归系数相同,则称此模型为个体固定效应回归模型。

αi 作为随机变量描述不同个体建立的模型间的差异。因为αi 是不可观测

的,且与可观测的解释变量X it 的变化相联系,所以称(3)式为个体固定效应回归模型。

个体固定效应回归模型也可以表示为

y it = α1 + α2 D 2 + … +αN D N + X it 'β +εit , t = 1, 2, …, T (4) 其中

D i =?

??=

其他,,个个体如果属于第,

...,,,021N i i ,

设定个体固定效应回归模型的原因如下。假定有面板数据模型

y it = β0 + β1 x it +β2 z i +εit , i = 1, 2, …, N ; t = 1, 2, …, T (5) 其中β0为常数,不随时间、截面变化;z i 表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以被解释为含有N 个截距,即每个个体都对应一个不同截距的模型。令

αi = β0 +β2 z i ,于是(5)式变为

y it = αi + β1 x it +εit , i = 1, 2, …, N ; t = 1, 2, …, T (6) 这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是β1),截距

αi 却因个体不同而变化。可见个体固定效应回归模型中的截距项αi 中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。αi 是一个随机变量。

以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。

以案例1为例(file:panel02)得到的个体固定效应模型估计结果如下:

注意:个体固定效应模型的EViwes输出结果中没有公共截距项。

图10 个体固定效应回归模型的估计结果

2.2.2 时点固定效应回归模型(time fixed effects regression model)

如果一个面板数据模型定义为,

y it = γt+X it 'β+εit, i = 1, 2, …, N(7)

其中γt是模型截距项,随机变量,表示对于T个截面有T个不同的截距项,且其变化与X it有关系;y it为被回归变量(标量),εit为误差项(标量),满足通常假定条件。X it为k?1阶回归变量列向量(包括k个回归变量),β为k?1阶回归系数列向量,则称此模型为时点固定效应回归模型。

时点固定效应回归模型也可以加入虚拟变量表示为

y it = γ1 + γ2W2 + … +γ T W T + X it 'β+εit, i = 1, 2, …, N; t = 1, 2, …, T(8) 其中

W t =?

??= 。,个截面其他个截面)(,;,...,,t t T t 不属于第如果属于第021

设定时点固定效应回归模型的原因。假定有面板数据模型

y it = β0 + β1 x it +β2 z t +εit , i = 1, 2, …, N ; t = 1, 2, …, T (9) 其中β0为常数,不随时间、截面变化;z t 表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。上述模型可以被解释为含有T 个截距,即每个截面都对应一个不同截距的模型。令γt = β0 +β2 z t ,于是(9)式变为 y it = γt + β1 x it +εit , i = 1, 2, …, N ; t = 1, 2, …, T (10) 这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是β1),γt 却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项γt 包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。γt 是一个随机变量。

以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。

图11

2.2.3 个体时点双固定效应回归模型(time and entity fixed effects regression model ) 如果一个面板数据模型定义为,

y it = αi +γt + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (11) 其中y it 为被回归变量(标量);αi 是随机变量,表示对于N 个个体有N 个不同的截距项,且其变化与X it 有关系;γt 是随机变量,表示对于T 个截面(时点)有T 个不同的截距项,且其变化与X it 有关系;X it 为k ?1阶回归变量列向量(包括k 个回归量);β为k ?1阶回归系数列向量;εit 为误差项(标量)满足通常假定(εit ?X it , αi , γt ) = 0;则称此模型为个体时点固定效应回归模型。

个体时点固定效应回归模型还可以表示为,

y it = α1+α2 D 2 +…+αN D N +γ2 W 2 +…+γ T W T + X it 'β +εit , t = 1, 2, …, (12) 其中

D i =??

?=

其他,,个个体如果属于第,

...,,,021N i i , (13)

W t =??

?= 。

,个截面其他个截面)(,;,...,,t t T t 不属于第如果属于第021 (14)

如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合OLS 估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法也可以使个体时点双固定效应回归模型得到更有效的参数估计量。

以例1为例得到的截面、时点固定效应模型估计结果如下:

图12

回归系数为0.67,这与个体固定效应回归模型给出的估计结果0.70基本一致。

在上述三种固定效应回归模型中,个体固定效应回归模型最为常用。

2.3 随机效应模型 对于面板数据模型

y it = αi + X it 'β +εit , i = 1, 2, …, N ; t = 1, 2, …, T (15) 如果αi 为随机变量,其分布与X it 无关;y it 为被回归变量(标量),εit 为误差项(标量),X it 为k ?1阶回归变量列向量(包括k 个回归量),β为k ?1阶回归系数列向量,对于不同个体回归系数相同,这种模型称为个体随机效应回归模型(随机截距模型、随机分量模型)。其假定条件是

αi ~ iid(α, σα2), εit ~ iid(0, σε2)

都被假定为独立同分布,但并未限定何种分布。

同理也可定义时点随机效应回归模型和个体时点随机效应回归模型,但个体随机效应回归模型最为常用。

个体随机效应模型又称为等相关模型(Equicorrelated model )。原因如下。随机效应模型可以看作是混合模型的特例。对于个体随机效应回归模型y it = αi + X it 'β +εit ,可以把αi 并入误差项εit 。模型改写为

y it = X it 'β + (αi +εit ) = X it 'β + u it (16)

其中u it = (αi +εit )。如果有αi ~(α, σα2),εit ~(0, σε2)成立,那么,

Cov(u it ,u is ) = Cov[(αi +εit )( αi +εis )] =

?????=+≠s t s t ,,222

εα

ασσσ (17)

因为对于t ≠ s ,有

r(u it ,u is

) =

2

2

2

ε

αα

σσσ+ (18)

相关系数r(u it ,u is )与 (t – s ) 即相隔期数长短无关。所以个体随机效应模型也称作等相关模型,或者可交换误差模型(exchangeable model )。

对于个体随机效应模型,E(αi ?X it ) = α,则有,E(y it ?x it ) = α + X it 'β,对y it 可以识别。所以随机效应模型参数的混合OLS 估计量具有一致性,但不具有有效性。

注意:“固定效应模型”这个术语用得并不十分恰当,容易产生误解。其实固定效应模型应该称之为“相关效应模型”,而随机效应模型应该称之为“非相关效应模型”。因为固定效应模型和随机效应模型中的αi都是随机变量。

3.面板数据模型估计方法

面板数据模型中β的估计量既不同于截面数据估计量,也不同于时间序列估计量,其性质随设定固定效应模型是否正确而变化。

3.1 混合最小二乘(Pooled OLS)估计

混合OLS估计方法是在时间上和截面上把NT个观测值混合在一起,然后用OLS法估计模型参数。给定混合模型

y it = α+X it 'β +εit, i = 1, 2, …, N; t = 1, 2, …, T(19) 如果模型是正确设定的,且解释变量与误差项不相关,即Cov(X it,εit) = 0。那么无论是N→∞,还是T→∞,模型参数的混合最小二乘估计量都具有一致性。

对混合模型通常采用的是混合最小二乘(Pooled OLS)估计法。

然而,在误差项服从独立同分布条件下由OLS法得到的方差协方差矩阵,在这里通常不会成立。因为对于每个个体i及其误差项来说通常是序列相关的。NT个相关观测值要比NT个相互独立的观测值包含的信息少。从而导致误差项的标准差常常被低估,估计量的精度被虚假夸大。

如果模型存在个体固定效应,即αi与X it相关,那么对模型应用混合OLS估计方法,估计量不再具有一致性。解释如下:

假定模型实为个体固定效应模型y it = αi+ X it 'β +εit,但却当作混合模型来估计参数,则模型可写为

y it = α+X it 'β + (αi-α +εit) = α+ X it 'β + u it(20) 其中u it = (αi-α +εit)。因为αi与X it相关,也即u it与X it相关,所以个体固定效应模型的参数若采用混合OLS估计,估计量不具有一致性。

3.2平均(between)OLS估计

平均OLS 估计法的步骤是首先对面板数据中的每个个体求平均数,共得到N 个平均数(估计值)。然后利用y it 和X it 的N 组观测值估计参数。以个体固定效应回归模型

y it = αi + X it 'β +εit (21)

为例,首先对面板中的每个个体求平均数,从而建立模型

i y = αi +i X 'β +i

ε, i = 1, 2, …, N (22)

其中i y =∑

=-T t it

y T

1

1

,i X =∑

=-T

t it

T 1

1

X ,i ε=∑=-T

t it

T

1

1

ε,i = 1, 2, …, N 。变换上式得

i y = α +i X 'β +(α i - α +i

ε), i = 1, 2, …, N (23)

上式称作平均模型。对上式应用OLS 估计,则参数估计量称作平均OLS 估计量。此条件下的样本容量为N ,(T =1)。

如果i X 与(α i - α +i ε)相互独立,α和β的平均OLS 估计量是一致估计量。平均OLS 估计法适用于短期面板的混合模型和个体随机效应模型。对于个体固定效应模型来说,由于αi 和X it 相关,也即αi 和i X 相关,所以,回归参数的平均OLS 估计量是非一致估计量。

3.3 离差(within )OLS 估计

对于短期面板数据,离差OLS 估计法的原理是先把面板数据中每个个体的观测值变换为对其平均数的离差观测值,然后利用离差数据估计模型参数。具体步骤是,对于个体固定效应回归模型

y it = αi + X it 'β +εit (24)

中的每个个体计算平均数,可得到如下模型,

i y = αi +i X 'β +i

ε

其中i y 、i X 、i ε的定义见(22)式。上两式相减,消去了αi ,得

y it -i y = (X it -i X )'β + (εit -i ε)

此模型称作离差数据模型。对上式应用OLS 估计,所得β的估计量称作离差OLS 估计量。对于个体固定效应回归模型,β的离差OLS 估计量是一致估计量。如果εit 还满足独立同分布条件,β的离差OLS 估计量不但具有一致性而且还具有有效性。

如果对固定效应αi 感兴趣,也可按下式估计。

i α?=i y -i

X 'β? (27) 个体固定效应回归模型的估计通常采用的就是离差(within )OLS 估计法。 在短期面板条件下,即便αi 的分布、以及αi 和X it 的关系都已知到,αi 的估计量仍不具有一致性。当个体数N 不大时,可采用OLS 虚拟变量估计法估计αi 和β。

离差OLS 估计法的主要缺点是不能估计非时变回归变量构成的面板数据模型。比如X it = X i (非时变变量),那么有i X = X i ,计算离差时有X i -i X = 0。

3.4 一阶差分(first difference )OLS 估计

在短期面板条件下,一阶差分OLS 估计就是对个体固定效应模型中的回归量与被回归量的差分变量构成的模型的参数进行OLS 估计。具体步骤是,对个体固定效应回归模型

y it = αi + X it 'β +εit

取其滞后一期关系式

y it -1 = αi + X it -1'β +εit -1

上两式相减,得一阶差分模型(αi 被消去)

y it -y it -1 = (X it - X it -1) 'β + (εit -εit -1) , i = 1, 2, …, N ; t = 1, 2, …, T

对上式应用OLS 估计得到的β的估计量称作一阶差分OLS 估计量。尽管αi 不能被估计,β的估计量是一致估计量。

在T >2,εit 独立同分布条件下得到的β的一阶差分OLS 估计量不如离差OLS 估计量有效。

3.5 随机效应(random effects )估计法(可行GLS (feasible GLS )估计法) 有个体固定效应模型

y it = αi + X it 'β +εi

αi ,εit 服从独立同分布。对其作如下变换

y it -i y λ?= (1-λ?)μ + (X it -λ?i

X )'β + v it (29) 其中v it = (1-λ?)αi + (εit -λ?i

ε)渐近服从独立同分布,λ = 1-2

2

α

ε

ε

σσσT +,应用OLS 估计,

则所得估计量称为随机效应估计量或可行GLS 估计量。当λ?= 0时,(29)式等同于混合OLS 估计;当λ?=1时,(29)式等同于离差OLS 估计。

对于随机效应模型,可行GLS 估计量不但是一致估计量,而且是有效估计量,但对于个体固定效应模型,可行GLS 估计量不是一致估计量。

面板数据模型估计量的稳健统计推断。在实际的经济面板数据中,N 个个体之间相互独立的假定通常是成立的,但是每个个体本身却常常是序列自相关的,且存在异方差。为了得到正确的统计推断,需要克服这两个因素。

对于第i 个个体,当N →∞,X i ?的方差协方差矩阵仍然是T ?T 有限阶的,所以可以用以前的方法克服异方差。采用GMM 方法还可以得到更有效的估计量。

EViwes 中对随机效应回归模型的估计采用的就是可行(feasible )GLS 估计法。

4.面板数据模型设定检验方法 4.1 F 检验

先介绍原理。F 统计量定义为 F =

)

/(/)(k T SSE m

SSE

SSE

u

u

r

--~ F ( m , T – k ) (30)

其中SSE r 表示施加约束条件后估计模型的残差平方和,SSE u 表示未施加约束条件的估计模型的残差平方和,m 表示约束条件个数,T 表示样本容量,k 表示未加约束的模型中被估参数的个数。在原假设“约束条件真实”条件下,F 统计量渐近服从自由度为( m , T – k )的F 分布。

以检验个体固定效应回归模型为例,介绍F 检验的应用。建立假设

H 0:αi =α。模型中不同个体的截距相同(真实模型为混合回归模型)。 H 1:模型中不同个体的截距项αi 不同(真实模型为个体固定效应回归模型)。 F 统计量定义为:

F =)

/()]

()/[()(k N NT SSE k N NT k NT SSE

SSE u

u

r

--------1=

)

/()/()(k N NT SSE

N SSE SSE u

u r ----1 (31)

其中SSE r 表示约束模型,即混合估计模型的残差平方和,SSE u 表示非约束模型,即个体固定效应回归模型的残差平方和。非约束模型比约束模型多了N -1个被估参数。

以案例1为例,已知SSE r = 4824588,SSE u = 4028843,

F = )

/()/()(11----N NT SSE

N SSE SSE

u

u r =

)

/()

/()(115105227038611522703864824588----

=

22510

182443= 8.1 (32)

F 0.05(6, 87) = 1.8

因为F = 8.1 > F 0.05(14, 89) = 1.8,推翻原假设,比较上述两种模型,建立个体固定效应回归模型更合理。

4.2 Hausman 检验

对同一参数的两个估计量差异的显著性检验称作Hausman 检验,简称H 检验。H 检验由Hausman1978年提出,是在Durbin (1914)和Wu (1973)基础上发展起来的。所以H 检验也称作Wu-Hausman 检验,和Durbin-Wu-Hausman 检验。

先介绍Hausman 检验原理

例如在检验单一方程中某个回归变量(解释变量)的内生性问题时得到相应回归参数的两个估计量,一个是OLS 估计量、一个是2SLS 估计量。其中2SLS 估计量用来克服回归变量可能存在的内生性。如果模型的解释变量中不存在内生性变量,那么OLS 估计量和2SLS 估计量都具有一致性,都有相同的概率极限分布。如果模型的解释变量中存在内

生性变量,那么回归参数的OLS 估计量是不一致的而2SLS 估计量仍具有一致性,两个估计量将有不同的概率极限分布。

更一般地,假定得到q 个回归系数的两组估计量θ?和θ~

,则H 检验的零假设和被择假设是:

H 0: plim(θ?-θ~) = 0 H 1: plim(θ?-θ~

) ≠ 0

假定两个估计量的差作为统计量也具有一致性,在H 0成立条件下,

N

(θ?-θ~) d

→N (0, V H )

其中V H 是(θ?-θ~

)的极限分布方差矩阵。则H 检验统计量定义为

H = (θ?-θ~)' (N -1H V ?)-1 (θ?-θ~

) → χ2(q ) (33)

其中(N -1H V ?)是(θ?-θ~

)的估计的方差协方差矩阵。在H 0成立条件下,H 统计量渐近服从χ2(q )分布。其中q 表示零假设中约束条件个数。

H 检验原理很简单,但实际中V H 的一致估计量H V ?并不容易。一般来说,

N -1H V ?= Var(θ?-θ~) = Var(θ?)+Var(θ~)-2Cov(θ?,θ~

) (34)

Var(θ?),Var(θ~)在一般软件计算中都能给出。但Cov(θ?,θ~

)不能给出。致使H 统计量(33)在实际中无法使用。

实际中也常进行如下检验。

H 0:模型中所有解释变量都是外生的。 H 1:其中某些解释变量都是内生的。 在原假设成立条件下,

H = (θ?-θ~)' ()~(θ∧Var -)?(θ∧Var )-1 (θ?-θ~)~χ2(k ) (36)

其中)~

(θ∧

Var 和)?(θ∧

Var 分别是对Var(θ~

)和Var(θ?)的估计。与(34)式比较,这个结果只要求计算Var(θ?)和Var(θ~

),H 统计量(36)具有实用性。

当θ表示一个标量时,H 统计量(36)退化为, H =

2

2

2

S

S ?~)~?(--θθ~χ2(1)

其中2S ~

和2S

?分别表示θ~

和θ?的样本方差值。 H 检验用途很广。可用来做模型丢失变量的检验、变量内生性检验、模型形式设定检验、模型嵌套检验、建模顺序检验等。

下面详细介绍面板数据中利用H 统计量进行模型形式设定的检验。

假定面板模型的误差项满足通常的假定条件,如果真实的模型是随机效应回归模型,那么β的离差OLS 估计量W β?和随机GLS 法估计量RE β~

都具有一致性。如果真实的模型是个体固定效应回归模型,则参数β的离差OLS 法估计量W β?是一致估计量,但随机GLS 估计量RE β~

是非一致估计量。可以通过H 统计量检验(RE β~-W β?)的非零显著性,检验面板数据模型中是否存在个体固定效应。原假设与备择假设是

H 0: 个体效应与回归变量无关(个体随机效应回归模型) H 1: 个体效应与回归变量相关(个体固定效应回归模型) 例:

W β?=0.7747,s(W

β?) = 0.00868(计算结果对应图15); RE β~

=0.7246,s(RE β~

) = 0.0106(计算结果取自EViwes 个体固定效应估计结果)

H =

222)?()~()

~?(W

RE RE W s s ββββ-- =

2

2

20087

00106

0724*******..)..(--= 68.4

因为H =68.4 > χ20.05 (1) = 3.8,所以模型存在个体固定效应。应该建立个体固定效应回归模型。

5.面板数据建模案例分析

图13 混合估计散点图 图14 平均估计散点图

以案例1为例,图13是混合估计对应数据的散点图。回归结果如下

CP = 129.63 + 0.76 IP

(2.0) (79.7)

图14是平均值数据散点图。先对数据按个体求平均数CP 和IP 。然后用15组平均值数据回归,

CP = -40.88+0.79IP

(-0.3) (41.1)

图15 离差估计散点图 图16 差分估计散点图

图15是离差数据散点图。先计算CP 、IP 分别对CP 、IP 的离差数据,然后用离差数据计算OLS 回归。

CPM = 0.77 IPM

(90)

图16是一阶差分数据散点图。先对CP 、IP 各个体作一阶差分,然后用一阶差分数据

回归。

DCP = 0.71 DIP

(24)

案例2(file:5panel01a )美国公路交通事故死亡人数与啤酒税的关系研究

见Stock J H and M W W atson, Introduction to Econometrics, Addison W esley, 2003第8章。美国每年有4万高速公路交通事故,约1/3涉及酒后驾车。这个比率在饮酒高峰期会上升。早晨1~3点25%的司机饮酒。饮酒司机出交通事故数是不饮酒司机的13倍。现有1982~1988年48个州共336组美国公路交通事故死亡人数(number )与啤酒税(beertax )的数据。

1.0

1.5

2.02.5

3.03.5

4.04.50.0

0.40.8 1.2 1.6 2.0 2.4 2.8BEER82

V F R 82

VFR82 vs. BEER82

图17 1982年数据散点图(File: 5panel01a-graph01) 图18 1988年数据散点图(File:5panel01a- graph07)

1982年数据的估计结果(散点图见图17)

number 1982 = 2.01 + 0.15 beertax 1982

(0.15) (0.13)

1988年数据的估计结果(散点图见图18)

number 1988 = 1.86 + 0.44 beertax 1988

(0.11) (0.13)

面板数据建模步骤

面板数据建模步骤 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归,尽管有较高的R平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时有三种检验模式:既有趋势又有截距、只有截距、以上都无。因此为了避免伪回归,确保估计结果的有效性,我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项,从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25~250 之间,截面数介于10~250 之间) 的面板单位根检验。Im et

al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。 由上述综述可知,可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。 其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square 统计量、Hadri Z统计量,并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程,lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程,Hadri Z统计量的检验原假设为不存在普通的单位根过程。 有时,为了方便,只采用两种面板数据单位根检验方法,即相同根单位根检验LLC(Levin-Lin-Chu)检验和不同根单位根检验Fisher-ADF 检验(注:对普通序列(非面板序列)的单位根检验方法则常用ADF 检验),如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的,反之则不平稳。 如果我们以T(trend)代表序列含趋势项,以I(intercept)代表序列含截距项,T&I代表两项都含,N(none)代表两项都不含,那么我们可以基于前面时序图得出的结论,在单位根检验中选择相应

基于面板数据模型及其固定效应的模型分析

基于面板数据模型及其固定效应的模型分析 在20世纪80年代及以前,还只有很少的研究面板数据模型及其应用的文献,而20世纪80年代之后一直到现在,已经有大量的文献使用同时具有横截面和时间序列信息的面板数据来进行经验研究(Hsiao,20XX)。同时,大量的面板数据计量经济学方法和技巧已经被开发了出来,并成为现在中级以上的计量经济学教科书的必备内容,面板数据计量经济学的理论研究也是现在理论计量经济学最热的领域之一。 面板数据同时包含了许多横截面在时间序列上的样本信息,不同于只有一个维度的纯粹横截面数据和时间序列数据,面板数据是同时有横截面和时序二维的。使用二维的面板数据相对于只使用横截面数据或时序数据,在理论上被认为有一些优点,其中一个重要的优点是面板数据被认为能够控制个体的异质性。在面板数据中,人们认为不同的横截面很可能具有异质性,这个异质性被认为是无法用已知的回归元观测的,同时异质性被假定为依横截面不同而不同,但在不同时点却是稳定的,因此可以用横截面虚拟变量来控制横截面的异质性,如果异质性是发生在不同时期的,那么则用时期虚拟变量来控制。而这些工作在只有横截面数据或时序数据时是无法完成的。 然而,实际上绝大多数时候我们并不关心这个异质性究竟是多少,我们关心的仍然是回归元参数的估计结果。使用面板数据做过实际研究的人可能会发现使用的效应①不同,对回归元的估计结果经常有十分巨大的影响,在某个固定效应设定下回归系数为正显着,而另外一个效应则变为负显着,这种事情经常可以碰到,让人十分困惑。大多数的研究文献都将这种影响解释为控制了固定效应后的结果,因为不可观测的异质性(固定效应)很可能和回归元是相关的,在控制了这个效应后,由于变量之间的相关性,自然会对回归元的估计结果产生影响,因而使用的效应不同,估计的结果一般也就会有显着变化。 然而,这个被广泛接受的理论假说,本质上来讲是有问题的。我们认为,估计的效应不同,对应的自变量估计系数的含义也不同,而导致估计结果有显着变化的可能重要原因是由于面板数据是二维的数据,而在这两个不同维度上,以及将两个维度的信息放到一起时,样本信息所显现出来的自变量和因变量之间的相关关系可能是不同的。因此,我们这里提出另外一种异质性,即样本在不同维度上的相关关系是不同的,是异质的,这个异质性是发生在回归元的回归系数上,而 不是截距项。我们试图从面板数据的横截面维度和时间序列维度的样本相关异质性角

面板数据模型

第十讲经典面板数据模型 一、面板数据(panel data) 一维数据: 时间序列数据(cross section data):变量在时间维度上的数据截面数据(time series data):变量在截面空间维度上的数据)。 二维数据: 面板数据(同时在时间和截面空间上取得的,也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。 面板数据=截面数据+时间序列数据。

面板数据用双下标变量表示。例如 y i t, i = 1, 2, …, N; t = 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i = 1, 2, …, N)是随机变量在横截面上的N个数据;若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 平衡面板数据(balanced panel data)。 非平衡面板数据(unbalanced panel data)。 例1998-2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(不变价格)和人均收入数据见表1。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。

表1.中国部分省级地区的居民数据(不变价格,元)

二、面板数据模型及其作用 1.经典面板数据模型 建立在古典假定基础上的线性面板数据模型. 2.非经典面板数据模型 (1)非平稳时间序列问题的面板数据模型(面板数据协整模型) (2)非线性面板数据模型(如面板数据logit模型, 面板数据计数模型模型) (3)其他模型(如面板数据分位数回归模型) 3.面板数据模型作用 (1)描述个体行为差异。

第9章-面板数据模型理论

5.2 面板数据模型理论 5.2.1 面板数据模型及类型。 面板数据(panel data )也称时间序列截面数据(time series and cross section data )或混合数据(pool data )。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section )上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。 面板数据用双下标变量表示。例如: it y , N i ,,2,1 ;T t ,,2,1 其中,N 表示面板数据中含有的个体数。T 表示时间序列的时期数。若固定t 不变,?i y ),,2,1(N i 是横截面上的N 个随机变量;若固定i 不变,t y ?,),,2,1(T t 是纵剖面 上的一个时间序列。对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data )。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data )。 面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模型。面板数据模型的解析表达式为: it it it it it x y T j N i ,2,1;,2,1 其中,it y 为被解释变量;it 表示截距项,),,,(21k it it it it x x x x 为k 1维解释变量向量;' 21),,,(k it it it it 为1 k 维参数向量;i 表示不同的个体;t 表示不同的时间;it 为 随机扰动项,满足经典计量经济模型的基本假设),0(~2 IIDN it 。 面板数据模型通常分为三类。即混合模型、固定效应模型和随机效应模型。 ⑴ 混合模型。 如果一个面板数据模型定义为: it it it x y T j N i ,2,1;,2,1 则称此模型为混合模型。混合模型的特点是无论对任何个体和截面,回归系数 和 都是相同的 ⑵ 固定效应模型。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression model )、时间固定效应模型(time fixed effects regression model )和时间个体固定效应模型(time and entity fixed effects regression model )。 ① 个体固定效应模型。 个体固定效应模型就是对于不同的个体有不同截距的模型。如果对于不同的时间序

张晓彤-如何选用育留人才

招聘如何为公司带来竞争优势 【自检】 人力资源部的工作包括哪些方面?你认为哪一项工作最容易? ____________________________________________________________________ ____________________________________________________________________ ____________________________________________________________________ 通常,在外部的人看来,做招聘工作无非就是筛选简历、面试、通知上班就可以了。而根据我做10年人力资源工作的经验来看,其实在薪酬、福利、员工关系、培训、绩效考核等等这些人力资源部各个职能部门的工作中,招聘和选才恰恰是最难的。 这项工作给我的感觉像一场冒险和赌博,因为我们后面会有一些数据告诉大家,你如果做一个很不正规的招聘,比如说只拿到他的简历,或者介绍人一介绍,就邀请他来了,坐一起聊一小时,然后就判断这个人可用不可用,那么这个招聘的可信度是1里面的0.38,也就是说不及格。所以,还要加上心理测评,测评完之后,如果是关键职位的人还要到他原公司取证,这样再加上把整个招聘与选才的流程走一遍以后,招聘的成功率才是0.66。也即做足了之后才刚刚及格。所以我们说整个招聘与选才的过程像打一场仗一样。 我们为什么认为招聘最难呢?因为公司的竞争优势来自于招聘活动。 传统的竞争优势理论认为公司的竞争优势来自于以下两点: ①成本领先:换句话说就是,东西卖得便宜。 ②产品特色:如果东西卖得不便宜的话,就要有产品特色。凭着这两点公司就可以在市场上站稳脚跟。 但是,从人力资源的角度来看,这两项内容是谁做出来的?答案是人。给企业的竞争增添优势的,不是产品和价格,而是人。人力资源经理人的鼻祖——DaveulRich,写过一本书,叫《人力资源冠军》(humanresourcechampion),在这本书里提出了HR的概念,就是人力资源(humanresource),在他提出HR这个词之前,人力资源部门叫人事部(humanmanagement),或者叫人事管理部门。他认为在出现人力资源这个概念之后,在这个不断变化的高科技驱使下的商业环境下,发掘和留住人才将成为竞争的主战场。 正如体育团体积极网罗最佳的球员一样,未来的公司,未来的商业组织,也将为获得最佳人才而展开激烈竞争。最后他重点指出:成功的商家将是那些善于吸引、发展和保留具备必要技能和经验的人才,这样才能推进公司全球的业务。人是比产品、价格更重要的东西。但是,我们往往也发现什么事只要一跟人打交道,它就会是最难的,因为它是软性的,是摸不着、看不透的。所以在招聘前,先想好一件事,就是人家为什么愿意来你的公司?这个问题可以先问问自己,因为这些候选人换工作时总会有理由,有个顺口溜说得很形象:“钱多事少离家近,位高权重责任轻。”找到这种工作当然最理想了,但是不可能都落到一个人身上。 【自检】 作为人力资源部主管,你认为通常应聘者在择业时最关注哪些问题? ____________________________________________________________________ ____________________________________________________________________ ____________________________________________________________________

计量经济学 张晓峒 第二章习题

1.最小二乘法对随机误差项u作了哪些假定?说明这些假定条件的意义。 答:假定条件: (1)均值假设:E(u i)=0,i=1,2,…; (2)同方差假设:Var(u i)=E[u i-E(u i)]2=E(u i2)=σu2 ,i=1,2,…; (3)序列不相关假设:Cov(u i,u j)=E[u i-E(u i)][u j-E(u j)]=E(u i u j)=0,i≠j,i,j=1,2,…; (4)Cov(u i,X i)=E[u i-E(u i)][X i-E(X i)]=E(u i X i)=0; (5)u i服从正态分布, u i~N(0,σu2)。 意义:有了这些假定条件,就可以用普通最小二乘法估计回归模型的参数。 2.阐述对样本回归模型拟合优度的检验及回归系数估计值显著性检验的步骤。 答:样本回归模型拟合优度的检验:可通过总离差平方和的分解、样本可决系数、样本相关系数来检验。 回归系数估计值显著性检验的步骤: (1)提出原假设H0 :β1=0; (2)备择假设H1 :β1≠0; (3)计算t=β1/Sβ1; (4)给出显著性水平α,查自由度v=n-2的t分布表,得临界值tα/2(n-2); (5)作出判断。如果|t|tα/2(n-2),拒绝H0 ,接受H1:β1≠0,表明X对Y有显著影响。 4.试说明为什么∑e i2的自由度等于n-2。 答:在模型中,自由度指样本中可以自由变动的独立不相关的变量个数。当有约束条件时,自由度减少,其计算公式:自由度=样本个数-受约束条件的个数,即df=n-k。一元线性回归中SSE残差的平方和,其自由度为n-2,因为计算残差时用到回归方程,回归方程中有两个未知参数β0和β1,而这两个参数需要两个约束条件予以确定,由此减去2,也即其自由度为n-2。 5.试说明样本可决系数与样本相关系数的关系及区别,以及样本相关系数与β^1的关系。答:样本相关系数r的数值等于样本可决系数的平方根,符号与β1相同。但样本相关系数与样本可决系数在概念上有明显的区别,r建立在相关分析的理论基础之上,研究两个随机变量X与Y之间的线性相关关系;样本可决系数r2建立在回归分析的理论基础之上,研究非随机变量X对随机变量Y的解释程度。

EViews面板数据模型估计教程

EViews 6.0 beta在面板数据模型估计中的应用 来自免费的minixi 1、进入工作目录cd d:\nklx3,在指定的路径下工作是一个良好的习惯 2、建立面板数据工作文件workfile (1)最好不要选择EViews默认的blanaced panel 类型 Moren_panel (2)按照要求建立简单的满足时期周期和长度要求的时期型工作文件

3、建立pool对象 (1)新建对象 (2)选择新建对象类型并命名 (3)为新建pool对象设置截面单元的表示名称,在此提示下(Cross Section Identifiers: (Enter identifiers below this line )输入截面单元名称。,建议采用汉语拼音,例如29个省市区的汉语拼音,建议在拼音名前加一个下划线“_”,如图

关闭建立的pool对象,它就出现在当前工作文件中。 4、在pool对象中建立面板数据序列 双击pool对象,打开pool对象窗口,在菜单view的下拉项中选择spreedsheet (展开表) 在打开的序列列表窗口中输入你要建立的序列名称,如果是面板数据序列必须在序列名后添加“?”。例如,输入GDP?,在GDP后的?的作用是各个截面单元的占位符,生成了29个省市区的GDP的序列名,即GDP后接截面单元名,再在接时期,就表示出面板数据的3维数据结构(1变量2截面单元3时期)了。

请看工作文件窗口中的序列名。展开表(类似excel)中等待你输入、贴入数据。 (1)打开编辑(edit)窗口

(2)贴入数据 (3)关闭pool窗口,赶快存盘见好就收6、在pool窗口对各个序列进行单位根检验 选择单位根检验 设置单位根检验

张晓峒Eviews使用教程简易版

计量经济学软件包Eviews 使用说明 一、启动软件包 假定用户有Windows95/98的操作经验,我们通过一个实际问题的处理过程,使用户对EViews 的应用有一些感性认识,达到速成的目的。 1、Eviews 的启动步骤: 进入Windows /双击Eviews 快捷方式,进入EViews 窗口;或点击开始 /程序/Econometric Views/ Eviews ,进入EViews 窗口。 2、EViews 窗口介绍 标题栏:窗口的顶部是标题栏,标题栏的右端有三个按钮:最小化、最大化(或复原)和关闭,点击这三个按钮可以控制窗口的大小或关闭窗口。 菜单栏:标题栏下是主菜单栏。主菜单栏上共有7个选项: File ,Edit ,Objects ,View ,Procs ,Quick ,Options ,Window ,Help 。用鼠标点击可打开下拉式菜单(或再下一级菜单,如果有的话),点击某个选项电脑就执行对应的操作响应(File ,Edit 的编辑功能与Word, Excel 中的相应功能相似)。 命令窗口:主菜单栏下是命令窗口,窗口最左端一竖线是提示符,允许用户在提示符后通过键盘输入EViews (TSP 风格)命令。如果熟悉MacroTSP (DOS )版的命令可以直接在此键入,如同DOS 版一样地使用EViews 。按F1键(或移动箭头),键入的历史命令将重新显示出来,供用户选用。 主显示窗口:命令窗口之下是Eviews 的主显示窗口,以后操作产生的窗口(称为子窗口)均在此范围之内,不能移出主窗口之外。 命令窗口 信息栏 路径 主显示窗口 (图一)

状态栏:主窗口之下是状态栏,左端显示信息,中部显示当前路径,右下端显示当前状态,例如有无工作文件等。 Eviews有四种工作方式:(1)鼠标图形导向方式;(2)简单命令方式;(3)命令参数方式[(1)与(2)相结合)] ;(4)程序(采用EViews命令编制程序)运行方式。用户可以选择自己喜欢的方式进行操作。 二、创建工作文件 工作文件是用户与EViews对话期间保存在RAM之中的信息,包括对话期间输入和建立的全部命名对象,所以必须首先建立或打开一个工作文件用户才能与Eviews对话。工作文件好比你工作时的桌面一样,放置了许多进行处理的东西(对象),像结束工作时需要清理桌面一样,允许将工作文件保存到磁盘上。如果不对工作文件进行保存,工作文件中的任何东西,关闭机器时将被丢失。 进入EViews后的第一件工作应从创建新的或调入原有的工作文件开始。只有新建或调入原有工作文件, EViews才允许用户输入开始进行数据处理。 建立工作文件的方法:点击File/New/Workfile。选择数据类型和起止日期,并在出现的对话框中提供必要的信息:适当的时间频率(年、季度、月度、周、日);确定起止日期或最大处理个数(开始日期是项目中计划的最早的日期;结束日期是项目计划的最晚日期,非时间序列提供最大观察个数,以后还可以对这些设置进行更改)。 下面我们通过研究我国城镇居民消费与可支配收入的关系来学习Eviews的应用。数据如下: 表一 下面的图片说明了具体操作过程。 1、打开新建对象类型对话框,选择工作文件Workfile,见图二。

第9章-面板数据模型理论

5.2 面板数据模型理论 5.2.1 面板数据模型及类型。 面板数据(panel data )也称时间序列截面数据(time series and cross section data )或混合数据(pool data )。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section )上看,是由若干个体(entity, unit, individual )在某一时刻构成的截面观测值,从纵剖面(longitudinal section )上看是一个时间序列。 面板数据用双下标变量表示。例如: it y , N i ,,2,1 =;T t ,,2,1 = 其中,N 表示面板数据中含有的个体数。T 表示时间序列的时期数。若固定t 不变,?i y ),,2,1(N i =是横截面上的N 个随机变量;若固定i 不变,t y ?,),,2,1(T t =是纵剖面 上的一个时间序列。对于面板数据来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data )。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data )。 面板数据模型是建立在面板数据之上、用于分析变量之间相互关系的计量经济模 型。面板数据模型的解析表达式为: it it it it it x y μβα++= T j N i ,2,1;,2,1== 其中,it y 为被解释变量;it α表示截距项,),,,(21k it it it it x x x x =为k ?1维解释变量向量;'21),,,(k it it it it ββββ =为1?k 维参数向量;i 表示不同的个体;t 表示不同的时间;it μ为 随机扰动项,满足经典计量经济模型的基本假设),0(~2μσμIIDN it 。 面板数据模型通常分为三类。即混合模型、固定效应模型和随机效应模型。 ⑴ 混合模型。 如果一个面板数据模型定义为: it it it x y μβα++= T j N i ,2,1;,2,1== 则称此模型为混合模型。混合模型的特点是无论对任何个体和截面,回归系数α和β都是相同的 ⑵ 固定效应模型。 固定效应模型分为3种类型,即个体固定效应模型(entity fixed effects regression

MATLAB空间面板数据模型操作介绍

MATLAB 空间面板数据模型操作简介 MATLAB 安装: 在民主湖资源站上下载 MA TLAB 2009a ,或者 2010a ,按照其中的安装说明 安装 MATLAB 。( MATLAB 较大,占用内存较大,安装的话可能也要花费一定的时间) 一、数据布局 首先我们说一下 MA TLAB 处理空间面板数据时,数据文件是怎么布局的,熟悉 eviews 的同学 可能知道, eviews 中面板数据布局是:一个省份所有年份的数据作为一个单元(纵截面:一个时间 序列),然后再排放另一个省份所有年份的数据,依次将所有省份的数据排放完,如下图,红框中 “1-94”“1-95” “1-96” “ 1-97”中, 1是省份的代号, 94,95,96,97 表示年份, eviews 是将每个省 份的数据放在一起,再将所有省份堆放在一起。 与 eviews 不同, MATLAB 处理空间面板数据时,面板数据的布局是(在 excel 中说明): 先排 放一个横截面上的数据(即某年所有省份的数据) ,再将不同年份的横截面按时间顺序堆放在一起。 如图:

这里需要说明的是, MA TLAB 中省份的序号需要与空间权重矩阵中省份一一对应,我们一般就采用《中国统计年鉴》分地区数据中省份的排列顺序。(二阶空间权重矩阵我会在附件中给出)。二、数据的输入: MATLAB 与 excel链接:在 excel中点击“工具→加载宏→浏览” ,找到 MA TLAB 的安装目录,一般来说,如果安装时没有修改安装路径,此安装目录为: C:\Programfiles\MATLAB\R2009a\toolbox\exlink ,点击 excllink.xla 即可完成 excel 与 MATLAB 的链接。这样的话 excel 中的数据就可以直接导入 MATLAB 中形成 MATLAB 的数据文件。操作完成后 excel 的加载宏界面如图: 选中“Spreadsheet Link EX3.0.3 for use with MATLAB ”即表示我们希望 excel 与

张晓彤,招聘与面试技巧

篇一:张晓彤——招聘与面试技巧 招聘与面试技巧 松下幸之助说:企业即人。企业的兴衰,关键在人,企业能否发展,在很大程度上取决于是否具备一支高素质的员工队伍。招聘与面试作为企业人才队伍建设的第一关,对于企业的长远发展起着十分重要的作用。因此,系统掌握招聘与面试技巧,为企业发展选拔符合需要的优秀人才是现代职业经理人必备的基本素质。 本课程讲师张晓彤女士有着丰富的跨国公司人力资源开发与管理经验,由她讲授的招聘与面试技巧,深入浅出而且实用有效,是中国企业招聘与面试工作的行动手册。 1.掌握职位分析的内容与方法 2.有效运用职位评估 3.编制完备的职位说明书 4.熟悉面试的每个流程及流程中的注意事项 5.辨识面试中的“事实”与“谎言” 6.根据目标和围度设定面试计划 7.掌握结构化面试的方法与技巧 8.认清招聘和选才误区并有效的加以避免 职位分析与职位评估职位描述及具体操作选才的作用及选才的方式 为什么要进行职位分析 什么是职位分析 职位分析(job analysis)也称为工作分析,它是人力资源工作的一个最基本的方法和工具。 职位分析是一种系统地收集与职位有关信息的过程,包括任职条件、工作职责、工作环境、工作强度以及工作的其他特征。 职位分析的一个结果是职位说明书或工作规范,职位分析就像体检,而职位说明书就像体检报告,是体检结果的一种反映,职位分析重在过程。 为什么说职位分析是人力资源管理的基础性工作 职位分析对人力资源其它模块有非常重要的依据作用。具体表现: 图3-1 职位分析是人力资源管理的基础性 ?职位分析是进行招聘录用的前提和基础 在招人之前,招聘条件的确定、任职资格的分析都是依据工作分析做出的。 ?职位分析评估的基础 职位评估直接得出

面板数据模型理论知识(最新)

1.Panel Data 模型简介 Panel Data 即面板数据,是截面数据与时间序列数据综合起来的一种数据类型,是截面上个体在不同时点的重复观测数据。 相对于一维的截面数据和时间序列数据进行经济分析而言,面板数据有很多优点。(1)由于观测值的增多,可以增加自由度并减少了解释变量间的共线性,提高了估计量的抽样精度。(2)面板数据建模比单截面数据建模可以获得更多的动态信息,可以构建并检验更复杂的行为模型。(3)面板数据可以识别、衡量单使用一维数据模型所不能观测和估计的影响,可以从多方面对同一经济现象进行更加全面解释。 Panel Data 模型的一般形式为it K k kit kit it it x y μβα++=∑=1 其中it y 为被解释变量,it x 为解释变量, i =1,2,3……N ,表示N 个个体;t =1,2,3……T ,表示已知T 个时点。参数it α表示模型的截距项,k 是解释变量的个数,kit β是相对应解释变量的待估计系数。随机误差项it μ相互独立,且满足零均值,等方差为2δ的假设。 面板数据模型可以构建三种形式(以截面估计为例): 形式一: 不变参数模型 i K k ki k i x y μβα++=∑=1 ,又叫混合回归模型,是指无论从时间上还是截面上观察数据均不存在显著差异,故可以将面板数据混合在一起,采用普通最小二乘估计法(OLS )估计参数即可。 形式二:变截距模型i K k ki k i i x y μβαα+++=∑=1 *,*α为每个个体方程共同的截距项,i α是不同个体之间的异质性差异。对于不同个体或时期而 言,截距项不同而解释变量的斜率相同,说明存在不可观测个体异质影响但基本结构是相同的,可以通过截距项的不同而体现出来个体之间的差异。当i α与i x 相关时,那就说明模型为固定效应模型,当i α与i x 不相关时,说明模型为随机效应模型。 形式三:变参数模型 i K k ki ki i i x y μβαα+++=∑=1 * ,对于不同个体或时期而言,截距项(i αα+*)和每个解释变量的斜率ki β都是不相同的,表 明不同个体之间既存在个体异质影响也存在不同的结构影响,即每个个体或时期都对应一个互不相同的方程。同样分为固定效应模型和随机效应模型两种。 注意:这里没有截距项相同而解释变量的系数不相同的模型。 2.Panel Data 模型分析步骤

面板数据模型入门讲解

第十四章 面板数据模型 在第五章,当我们分析城镇居民的消费特征时,我们使用的是城镇居民的时间序列数据;而当分析农村居民的消费特征时,我们使用农村居民的时间序列数据。如果我们想要分析全体中国居民的消费特征呢?我们有两种选择:一是使用中国居民的时间序列数据进行分析,二是把城镇居民和农村居民的样本合并,实际上就是两个时间序列的样本合并为一个样本。 多个观测对象的时间序列数据所组成的样本数据,被称为面板数据(Panel Data )。通常也被称为综列数据,意即综合了多个时间序列的数据。当然,面板数据也可以看成多个横截面数据的综合。在面板数据中,每一个观测对象,我们称之为一个个体(Individual )。例如城镇居民是一个观测个体,农村居民是另一个观测个体。 如果面板数据中各观测个体的观测区间是相同的,我们称其为平衡的面板数据,反之,则为非平衡的面板数据。基于面板数据所建立的计量经济学模型则被称为面板数据模型。例如,表5.3.1中城镇居民和农村居民的样本数据具有相同的采样区间,所以,它是一个平衡的面板数据。 §14.1 面板数据模型 一、两个例子 1. 居民消费行为的面板数据分析 让我们重新回到居民消费的例子。在表5.1.1中,如果我们将城镇居民和农村居民的时间序列数据作为一个样本,以分析中国居民的消费特征。那么,此时模型(5.1.1)的凯恩斯消费函数就可以表述为: it it it Y C εββ++=10 (14.1.1) it t i it u ++=λμε (14.1.2) 其中:it C 和it Y 分别表示第i 个观测个体在第t 期的消费和收入。i =1、2分别表示城镇居民和农村居民两个观测个体,t =1980、…、2008表示不同年度。it u 为经典误差项。 在(14.1.2)中,i μ随观测个体的变化,而不随时间变化,它反映个体之间不随时间变化的差异性,被称为个体效应。t λ反映不随个体变化的时间上的差异性,被称为时间效应。在本例中,城镇居民和农村居民的消费差异一部分来自收入差异和随机扰动,还有一部分差

面板数据分析方法步骤全解

面板数据分析方法步骤全解 面板数据的分析方法或许我们已经了解许多了,但是到底有没有一个基本的步骤呢?那些步骤是必须的?这些都是我们在研究的过程中需要考虑的,而且又是很实在的问题。面板单位根检验如何进行?协整检验呢?什么情况下要进行模型的修正?面板模型回归形式的选择?如何更有效的进行回归?诸如此类的问题我们应该如何去分析并一一解决?以下是我近期对面板数据研究后做出的一个简要总结, 和大家分享一下,也希望大家都进来讨论讨论。 步骤一:分析数据的平稳性(单位根检验) 按照正规程序,面板数据模型在回归前需检验数据的平稳性。李子奈 曾指出,一些非平稳的经济时间序列往往表现出共同的变化趋势,而这些序列间本身不一定有直接的关联,此时,对这些数据进行回归, 尽管有较高的R 平方,但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归(spurious regression)。他认为平稳的真正 含义是:一个时间序列剔除了不变的均值(可视为截距)和时间趋势 以后,剩余的序列为零均值,同方差,即白噪声。因此单位根检验时 有三种检验模式:既有趋势又有截距、只有截距、以上都无。 因此为了避免伪回归,确保估计结果的有效性, 我们必须对各面板序 列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先,我们可以先对面板序列绘制时序图,以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和(或)截距项, 从而为进一步的单位根检验的检验模式做准备。 单位根检验方法的文献综述:在非平稳的面板数据渐进过程中丄evin

an dLi n(1993)很早就发现这些估计量的极限分布是高斯分布,这些结 果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002的改进,提出了检验面板单 位根的LLC法。Levin et al. (2002)指出,该方法允许不同截距和时间趋 势,异方差和高阶序列相关,适合于中等维度(时间序列介于25?250 之间,截面数介于10?250之间)的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS法,但Breitung(2000)发现IPS法对 限定性趋势的设定极为敏感,并提出了面板单位根检验的Breit ung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位 根检验方法。 由上述综述可知,可以使用LLC IPS Breintung、ADF-Fisher和 PP-Fisher5种方法进行面板单位根检验。 其中LLC-T、BR-T IPS-W、ADF-FCS PP-FCS H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、Im Pesaran & Shin W 统计量、 ADF- Fisher Chi-square统计量、PP-FisherChi-square统计量、Hadri Z 统计量,并且Levin, Lin & Chu t*统计量、Breitung t统计量的原假设 为存在普通的单位根过程,Im Pesaran & Shin W统计量、ADF- Fisher Chi-square统计量、PP -Fisher Chi-square统计量的原假设为存在有效 的单位根过程,Hadri Z统计量的检验原假设为不存在普通的单位根 过程。

如何选、育、用、留人才——张晓彤(时代光华)学习笔记

学习笔记 全课时共二十二讲,八十七小节 第一节招聘如何为公司带来竞争优势 【自检】 人力资源部的工作包括哪些方面?你认为哪一项工作最容易? ____________________________________________________________________ ____________________________________________________________________ ____________________________________________________________________ 通常,在外部的人看来,做招聘工作无非就是筛选简历、面试、通知上班就可以了。而根据我做10年人力资源工作的经验来看,其实在薪酬、福利、员工关系、培训、绩效考核等等这些人力资源部各个职能部门的工作中,招聘和选才恰恰是最难的。 这项工作给我的感觉像一场冒险和赌博,因为我们后面会有一些数据告诉大家,你如果做一个很不正规的招聘,比如说只拿到他的简历,或者介绍人一介绍,就邀请他来了,坐一起聊一小时,然后就判断这个人可用不可用,那么这个招聘的可信度是1里面的0.38,也就是说不及格。所以,还要加上心理测评,测评完之后,如果是关键职位的人还要到他原公司取证,这样再加上把整个招聘与选才的流程走一遍以后,招聘的成功率才是0.66。也即做足了之后才刚刚及格。所以我们说整个招聘与选才的过程像打一场仗一样。 我们为什么认为招聘最难呢?因为公司的竞争优势来自于招聘活动。 传统的竞争优势理论认为公司的竞争优势来自于以下两点: ①成本领先:换句话说就是,东西卖得便宜。 ②产品特色:如果东西卖得不便宜的话,就要有产品特色。凭着这两点公司就可以在市场上站稳脚跟。 但是,从人力资源的角度来看,这两项内容是谁做出来的?答案是人。给企业的竞争增添优势的,不是产品和价格,而是人。人力资源经理人的鼻祖——DaveulRich,写过一本书,叫《人力资源冠军》(humanresourcechampion),在这本书里提出了HR的概念,就是人力资源(humanresource),在他提出HR这个词之前,人力资源部门叫人事部(humanmanagement),或者叫人事管理部门。他认为在出现人力资源这个概念之后,在这个不断变化的高科技驱使下的商业环境下,发掘和留住人才将成为竞争的主战场。 正如体育团体积极网罗最佳的球员一样,未来的公司,未来的商业组织,也将为获得最佳人才而展开激烈竞争。最后他重点指出:成功的商家将是那些善于吸引、发展和保留具备必要技能和经验的人才,这样才能推进公司全球的业务。人是比产品、价格更重要的东西。但是,我们往往也发现什么事只要一跟人打交道,它就会是最难的,因为它是软性的,是摸不着、看不透的。所以在招聘前,先想好一件事,就是人家为什么愿意来你的公司?这个问题可以先问问自己,因为这些候选人换工作时总会有理由,有个顺口溜说得很形象:“钱多事少离家近,位高权重责任轻。”找到这种工作当然最理想了,但是不可能都落到一个人身上。 【自检】 作为人力资源部主管,你认为通常应聘者在择业时最关注哪些问题? ____________________________________________________________________ ____________________________________________________________________

第十六章-面板数据模型一

第16章静态面板数据模型时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。 面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 对于面板数据y it(i=1,2,…,N,t=1,2,…,T)来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。 本章主要讨论静态面板数据模型的相关理论及软件操作,首先从模型的检验开始到介绍变截距模型中的固定影响变截距模型和随机影响变截距模型,然后到变系数模型。本章的流程图如下:

16.1面板数据模型建模的基本原理 在应用多元回归分析建立的计量经济模型时,如果所建的模型中缺失了某些不可观测的重要解释变量,使得回归模型随机误差项常常存在自相关。于是回归参数的最小二乘法OLS 估计量不再是无偏估计或有效估计。但是,运用面板数据建立的计量经济模型时,对于一些忽略的解释变量可以不需要其实际观察值,而通过控制该变量对被解释变量的影响的方法获得模型参数的无偏估计。 由此可见,面板数据不仅可以同时利用截面数据和时间序列数据建立计量经济模型,而且能更好地识别和度量单纯的时间序列模型和单纯截面数据模型所不能发现的影响因素,它能够构造和检验更复杂的行为模型。例如:在宏观领域,它被广泛用于劳动经济学、国际金融、经济增长、产业结构、技术创新、税收政策等领域。 16.1.1面板数据模型基本框架 面板数据能更好地识别和度量时间序列或截面数据不可发觉的效应,有助于建立和检验更复杂的行为模型,其基本模型是如下形式的一般回归模型: 1,2,,,1,2,,it it it i t it y x i N t T αβδγε=++++==L L (16.1.1) 其中:it y 是个体i 在时间t 时期的观测值,α表示模型的常数项,i δ代表固定或者随机的截面效应,t γ代表固定或者随机的时期效应,it x 表示k 阶解释变量观测值向量。β表示解释变量的系数向量,并且在根据其条件的限制分为三种值,一是对所有截面和时期都是相同的常数,二是在不同的截面是不同的系数,三是在不同的时期是不同的。it ε是独立同分布的误差项,即()0it E ε=。 在公式(16.1.1)中,如果考虑k 个解释变量,自由度NT 远小于参数个数,对于截面成员方程,待估计参数的个数为((1))NT k N ++,对于时间截面方程,待估计参数的个数为((1))NT k T ++,这使得该模型无法估计。为了对模型进行估计,则可以建立以下的两类模型:从个体成员角度考虑,建立含有N 个个体成员方程的面板数据模型;在时间点上截面,建立含有T 个时间点截面方程的面板数据模型。 1)含有N 个个体成员方程的面板数据模型 模型形式如下: i T i it i T T i y l x l I αβδγε=++++ (16.1.2) 其中:i y 是个体i 的观观测值的时间序列。系数向量β取值受不同个体的影响,i x 表示个体i 解释变量观测值时间序列。T l 是T 阶的单位行向量,T I 是T 阶的单位列向量。 '12()T γγγγ=L ,,,,包括所有的时点效应。该式含有N 个截面方程。

相关主题
文本预览
相关文档 最新文档