面板数据分析解析

  • 格式:ppt
  • 大小:355.50 KB
  • 文档页数:30

下载文档原格式

  / 30
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
面板数据分析 —Panel Data
1.面板数据模型简介
• 面板数据(panel data)也称作时间序列与截面混合 数据(pooled time series and cross section data)。面板数据是截面上个体在不同时点的重复观 测数据。
N=30,T=50的面板数据示意图 中国各省级地区消费性支出占可支配收入比例走势图
面板数据分两种特征:(1)个体数少,时间长。(2)个 体数多,时间短。面板数据用双下标变量表示。
yi t, i = 1, 2, …, N; t = 1, 2, …, T
i 对应面板数据中不同个体。N表示面板数据中含有N个个 体。t 对应面板数据中不同时点。T表示时间序列的最大长
度。
利用面板数据建立模型的好处是:(1)由于观测值的增多, 可以增加估计量的抽样精度。(2)对于固定效应回归模型 能得到参数的一致估计量,甚至有效估计量。(3)面板数 据建模比单截面数据建模可以获得更多的动态信息。
• yi t, i = 1, 2, …, N; t = 1, 2, …, T
• 若固定t不变,yi ., ( i = 1, 2, …, N)是横截面上的N个随
机变量;
• 若固定i不变,y. t, (t = 1, 2, …, T)是纵剖面上的一个时
间序列(个体)。
• 面板数据是不同个体和不同时期被观察的
数据(Longitudinal or Panel Data)
yi 1x1i 2 x2i i
横截面数据
yt 1x1t 2 x2t t 时间序列数据
yit 1x1it 2 x2it it
面板数据
2.面板数据模型分类
• 用面板数据建立的模型通常有3种,即混合模型、固定效应模型和随 机效应模型。
• 2.1 混合模型(Pooled model)。
• 如果一个面板数据模型定义为,

yit = + Xit ' +it, i = 1, 2, …, N; t = 1, 2, …, T
• 其中yit为被回归变量(标量), 表示截距项,Xit为k 1阶回归变 量列向量(包括k个回归量),为k 1阶回归系数列向量,it为误
差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是
无论对任何个体和截面,回归系数和都相同。
• 如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,it) = 0。那么无论是N,还是T,模型参数的混合最小二乘估计量
(Pooled OLS)都是一致估计量。
• 2.2 固定效应模型(fixed effects model)。
• 固定效应模型分为3种类型,即个体固定效应模型、时点固定 效应模型和个体时点双固定效应模型。下面分别介绍。
• 2.2.1个体固定效应模型(entity fixed effects model)
• 如果一个面板数据模型定义为,

yit = i + Xit ' +it, i = 1, 2, …, N; t = 1,
2, …, T
• 其中i是随机变量,表示对于i个个体有i个不同的截距项, 且其变化与Xit有关系;Xit为k 1阶回归变量列向量(包括k 个回归量),为k 1阶回归系数列向量,对于不同个体回归
系数相同,yit为被回归变量(标量),it为误差项(标量),
则称此模型为个体固定效应模型。
2.2 固定效应模型(fixed effects model)。
解释设定个体固定效应模型的原因。假定有面板数据模型
yit = 0 + 1 xit +2 zi +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数,不随时间、截面变化;每个个体回归函数的斜率1 相同;
zi 表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以 被解释为含有 N 个截距,即每个个体都对应一个不同截距的模型。令
i = 0 +2 zi,于是变为 yit = i + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
以家庭消费性支出与可支配收入关系为例,省家庭平均人口数就是这样 的一个变量,即对于短期面板,这是一个基本不随时间变化的量,但是 对于不同的省份,这个变量的值是不同的。 因为 zi 是不随时间变化的量,所以当对个体固定效应模型中的变量进行 差分时,可以剔除那些随个体变化,但不随时间变化的 zi 的影响。
2.2.2 时点固定效应模型(time fixed effects model)
如果一个面板数据模型定义为,
yit = t + Xit ' +it, i = 1, 2, …, N
其中t 是模型截距项,随机变量,表示对于 T 个截面有 T 个不同 的截距项,且其变化与 Xit 有关系;yit 为被回归变量(标量),it
为误差项(标量),满足通常假定条件。Xit 为 k 1 阶回归变量列
向量(包括 k 个回归变量),为 k 1 阶回归系数列向量,则称此
模型为时点固定效应模型。
2.2.2 时点固定效应模型(time fixed effects model)
设定时点固定效应模型的原因。假定有面板数据模型
yit = 0 + 1 xit +2 zt +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数,不随时间、截面变化;对于 T 个截面有 T 个不同的
截距项,zt 表示随不同截面(时点)变化,但不随个体变化的难以
观测的变量。令t = 0 +2 zt,上式变为 yit = t + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
这正是时点固定效应模型形式。对于每个截面,回归函数的斜率
相同(都是1),t 却因截面(时点)不同而异。可见时点固定效应 模型中的截距项t 包括了那些随不同截面(时点)变化,但不随个 体变化的难以观测的变量的影响。t 是一个随机变量。
以家庭消费性支出与可支配收入关系为例,“全国零售物价指数” 就是这样的一个变量。对于不同时点,这是一个变化的量,但是对 于不同省份(个体),这是一个不变化的量。
2.2.3 个体时点固定效应模型