面板数据分析解析

格式：ppt
大小：355.50 KB
文档页数：30

下载文档原格式

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

面板数据分析 —Panel Data
1.面板数据模型简介
• 面板数据（panel data）也称作时间序列与截面混合数据（pooled time series and cross section data）。面板数据是截面上个体在不同时点的重复观测数据。
N=30，T=50的面板数据示意图中国各省级地区消费性支出占可支配收入比例走势图
面板数据分两种特征：（1）个体数少，时间长。（2）个体数多，时间短。面板数据用双下标变量表示。
yi t, i = 1, 2, …, N; t = 1, 2, …, T
i 对应面板数据中不同个体。N表示面板数据中含有N个个体。t 对应面板数据中不同时点。T表示时间序列的最大长
度。
利用面板数据建立模型的好处是：（1）由于观测值的增多，可以增加估计量的抽样精度。（2）对于固定效应回归模型能得到参数的一致估计量，甚至有效估计量。（3）面板数据建模比单截面数据建模可以获得更多的动态信息。
• yi t, i = 1, 2, …, N; t = 1, 2, …, T
• 若固定t不变，yi ., ( i = 1, 2, …, N)是横截面上的N个随
机变量；
• 若固定i不变，y. t, (t = 1, 2, …, T)是纵剖面上的一个时
间序列（个体）。
• 面板数据是不同个体和不同时期被观察的
数据（Longitudinal or Panel Data）
yi 1x1i 2 x2i i
横截面数据
yt 1x1t 2 x2t t 时间序列数据
yit 1x1it 2 x2it it
面板数据
2．面板数据模型分类
• 用面板数据建立的模型通常有3种，即混合模型、固定效应模型和随机效应模型。
• 2.1 混合模型（Pooled model）。
• 如果一个面板数据模型定义为，
•
yit = + Xit ' +it, i = 1, 2, …, N; t = 1, 2, …, T
• 其中yit为被回归变量（标量），表示截距项，Xit为k 1阶回归变量列向量（包括k个回归量），为k 1阶回归系数列向量，it为误
差项（标量）。则称此模型为混合回归模型。混合回归模型的特点是
无论对任何个体和截面，回归系数和都相同。
• 如果模型是正确设定的，解释变量与误差项不相关，即Cov(Xit,it) = 0。那么无论是N，还是T，模型参数的混合最小二乘估计量
（Pooled OLS）都是一致估计量。
• 2.2 固定效应模型（fixed effects model）。
• 固定效应模型分为3种类型，即个体固定效应模型、时点固定效应模型和个体时点双固定效应模型。下面分别介绍。
• 2.2.1个体固定效应模型（entity fixed effects model）
• 如果一个面板数据模型定义为，
•
yit = i + Xit ' +it, i = 1, 2, …, N; t = 1,
2, …, T
• 其中i是随机变量，表示对于i个个体有i个不同的截距项，且其变化与Xit有关系；Xit为k 1阶回归变量列向量（包括k 个回归量），为k 1阶回归系数列向量，对于不同个体回归
系数相同，yit为被回归变量（标量），it为误差项（标量），
则称此模型为个体固定效应模型。
2.2 固定效应模型（fixed effects model）。
解释设定个体固定效应模型的原因。假定有面板数据模型
yit = 0 + 1 xit +2 zi +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数，不随时间、截面变化；每个个体回归函数的斜率1 相同；
zi 表示随个体变化，但不随时间变化的难以观测的变量。上述模型可以被解释为含有 N 个截距，即每个个体都对应一个不同截距的模型。令
i = 0 +2 zi，于是变为 yit = i + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
以家庭消费性支出与可支配收入关系为例，省家庭平均人口数就是这样的一个变量，即对于短期面板，这是一个基本不随时间变化的量，但是对于不同的省份，这个变量的值是不同的。因为 zi 是不随时间变化的量，所以当对个体固定效应模型中的变量进行差分时，可以剔除那些随个体变化，但不随时间变化的 zi 的影响。
2.2.2 时点固定效应模型（time fixed effects model）
如果一个面板数据模型定义为，
yit = t + Xit ' +it, i = 1, 2, …, N
其中t 是模型截距项，随机变量，表示对于 T 个截面有 T 个不同的截距项，且其变化与 Xit 有关系；yit 为被回归变量（标量），it
为误差项（标量），满足通常假定条件。Xit 为 k 1 阶回归变量列
向量（包括 k 个回归变量），为 k 1 阶回归系数列向量，则称此
模型为时点固定效应模型。
2.2.2 时点固定效应模型（time fixed effects model）
设定时点固定效应模型的原因。假定有面板数据模型
yit = 0 + 1 xit +2 zt +it, i = 1, 2, …, N; t = 1, 2, …, T 其中0 为常数，不随时间、截面变化；对于 T 个截面有 T 个不同的
截距项，zt 表示随不同截面（时点）变化，但不随个体变化的难以
观测的变量。令t = 0 +2 zt，上式变为 yit = t + 1 xit +it, i = 1, 2, …, N; t = 1, 2, …, T
这正是时点固定效应模型形式。对于每个截面，回归函数的斜率
相同（都是1），t 却因截面（时点）不同而异。可见时点固定效应模型中的截距项t 包括了那些随不同截面（时点）变化，但不随个体变化的难以观测的变量的影响。t 是一个随机变量。
以家庭消费性支出与可支配收入关系为例，“全国零售物价指数” 就是这样的一个变量。对于不同时点，这是一个变化的量，但是对于不同省份（个体），这是一个不变化的量。
2.2.3 个体时点固定效应模型

面板数据分析解析

相关主题

文档推荐

最新文档