计量经济讲义学stata课件
- 格式:ppt
- 大小:9.13 MB
- 文档页数:232
实验一:一元线性回归模型的估计、检验和预测【演示内容】1、stata常用命令Stata常用命令的介绍。
(1) 查找帮助:search [查找内容]如:search save //查找用什么命令保存文档(键盘上按“q”键可以停止显示搜索结果)(2) use "路径+文件名"use "F:\stata files\2.6.dta"(3) 编辑数据edit(4) 删除数据表中的变量或一个观测值drop 变量名1 变量名2如:drop X Ydrop in 行数n //删除第n个观测之如:drop in 32 //删除第32个观测值(5) 保存数据文档save "文件路径+文件名"2、以教材P49 例2.6.1为例介绍用Eview实现一元线性回归的参数估计、检验和预测。
实验步骤1.录入数据点击菜单Data Editor,直接把数据拷贝进去并在右下边的variables的框中修改变量名为X和Y2. 散点图scatter Y X4.按照关系式Y=C+βX+μ进行OLS回归,regress Y X5. 预测(1) 求X=20000时,人均消费支出均值预测值的点估计值. predict [type] newvar [,statistic]举例:先执行回归命令:use "F:\stata files\2.6",clearregress Y X再用edit命令新增一个X值20000,在执行以下命令predict yhat [,xb]–此命令意为:生成一个名为yhat的变量,该变量的取值为根据解释变量的每组取值对应生成被解释变量的估计值,(在最后一行可以看到X=20000所对应的Y的估计值)(2)求当X=20000时,人均消费支出均值预测值和个值的\95%的置信区间。
use "F:\stata files\2.6.dta",clear(1) regress Y X(2) 然后在数据chapter9_1中增加一个X的取值为20000(3) predict yhat–将每个x值对应的y的估计值存放在变量yhat中,则在X=20000的最后一个观测值可以看到对应的Y的预测值的点估计值(4) predict sef, stdf–生成一个名为sef的变量,该变量的取值为预测误差的标准差(5) predict sep, stdp–生成一个名为sep的变量,该变量的取值为预测值的标准差(6) scalar tc=invttail(29,0.025)–定义标量tc,其取值为自由度为29的t变量概率为0.025的临界值。
© 陈强,2015年,《计量经济学及Stata应用》,高等教育出版社。
第11章二值选择模型11.1 二值选择模型如果被解释变量y离散,称为“离散选择模型”(discrete choice model)或“定性反应模型”(qualitative response model)。
最常见的离散选择模型是二值选择行为(binary choices)。
比如:考研或不考研;就业或待业;买房或不买房;买保险或不买保险;贷款申请被批准或拒绝;出国或不出国;回国或不回12国;战争或和平;生或死。
假设个体只有两种选择,比如1y =(考研)或0y =(不考研)。
最简单的建模方法为“线性概率模型”(Linear Probability Model ,LPM):1122(1,,)i i i K iK i i i y x x x i n βββεε'=+=+= +++x β (11.1)其中,解释变量12()i i i iK x x x '≡ x ,而参数12()K βββ'≡ β。
LPM 的优点是,计算方便,容易得到边际效应(即回归系数)。
3LPM 的缺点是,虽然y 的取值非0即1,但根据线性概率模型所作的预测值却可能出现ˆ1y>或ˆ0y <的不现实情形。
图11.1 线性概率模型4为使y 的预测值介于[0,1]之间,在给定x 的情况下,考虑y 的两点分布概率:P(1|)(,)P(0|)1(,)y F y F ==⎧⎨==-⎩x x x x ββ (11.2)函数(,)F x β称为“连接函数”(link function) ,因为它将x 与y 连接起来。
y 的取值要么为0,要么为1,故y 肯定服从两点分布。
连接函数的选择具有一定灵活性。
通过选择合适的连接函数(,)F x β(比如,某随机变量的累积分布函数),可保证ˆ01y≤≤,并将ˆy 理解为“1y =”发生的概率,因为5E(|)1P(1|)0P(0|)P(1|)y y y y =⋅=+⋅===x x x x (11.3)如果(,)F x β为标准正态的累积分布函数,则P(1|)(,)()()y F t dt φ'-∞'===Φ≡⎰x x x x βββ (11.4)()φ⋅与()Φ⋅分别为标准正态的密度与累积分布函数;此模型称为“Probit ”。