当前位置：文档之家› 计量经济学stata上机命令整理

计量经济学stata上机命令整理

计量经济学上机命令整理

实验一

edit 打开数据编辑器

browse 打开数据浏览器

rename 对变量重新命名

label

save

describe 对数据集简要描述

sort 排序例如：list in -10/-1

list 显示变量的数值

Generate 缩小：gen 生成新的变量后面可以接if条件句

Replace 替换append 覆盖

Summarize 缩写：su 总结后面可以接if条件句

实验二

twoway (scatter y x)(connected ey_x x) 在该散点图上，做出条件均值点

sc y x||lfit y x 画出线图和散点图

Reg y x 做出回归

Rename ** y **指原变量名用于修改变量名字

graph twoway scatter y x 画出y x 的二维散点图

Line y x 做出y x 的线条图

egen Ey_x=mean(y),by(x) 求在同一x水平下，求y的均值

实验三

Regress y x1 x2 ........做多元回归

Precict e,re 预测方差

Sort e 按照方差排序

Cor y x 测试y与x的相关程度

Pwcorr y x 也是测试y与x的相关程度

Set obs 90 （90为任意一个数字），增加一个或者多个样本值

Replace x=980 in 90 为第90个样本值赋值（980为任意一个数字）

Predict yhat 预测y的估计值

Display invttail(n,p) n为自由度；p为概率（一般为0.025）。用来求t分布的t 值

Display ttail(n,t）知道t值求T

Destring (变量名,可省略),replace ignore("-$") 将其他类型的数据转化为数值型Hist e残差直方图hist e,norm加了一条正态分布线

Two connected y x 二维图连线

Two connected y x,yline(0) 在y=0处画一条线（也可x=0）

Kdensity e,normal 对残差画出密度图

Sktest e 利用e的偏锋度做是否符合正态分布的检验

gen low=yhat-t*se gen high=yhat+t*se 预测置信区间

Twoway lfitci y x 置信区间与回归之间作图

实验四（第五章）

Gen lny=log(y)生成y的对数

Gen lnx=log(x)生成x的对数

Drop y或者x 删除变量

Predict se,stdp 预测所有的标准误

实验五（第六章）虚拟变量

Tab quarter,gen(d) quarter代表变量，对变量quarter生成虚拟变量d

Gen d1_x=d1*x 或者是（d2,d3,d4与x2,x3,x4）生成交互作用的虚拟变量

Reg y x1 x2...d2 d3 d4.....（d1通常省略，常数项）

Egen ybar=mean(y) 生成y的均值

实验六（第八章：多重共线性）

Gen t=0

Replace t=1 if x<(或>或>=或<=)数值

Test (t=0)(t_x=0)做假设联合检验，求出新的F值

Test (lnx2+lnx3=1) 求出新的F检验统计量

Cor lnx2-lnx6 求lnx2与lnx3到Lnx6之间的相关程度，找出是否存在多重共线性问题

Pcorr lnx2 lnx3-lnx6 也是测量变量之间的相关程度

Estat vif 估计方差膨胀因子(方差膨胀因子越大，说明两个此变量与y的共线性越高，应该考虑删除)

实验七八（第九十章）

Predict e,re

Gen e2=e^2

Est store m1 记录原回归的内容

Est tab m1 m2 展示上述记录过的回归内容并作出比较

Est tab m1 m2.....,se

Estat imtest 怀特检验

Estat hettest BP检验

Regress y x2 x3...，robust 校正后的怀特检验

自相关检验

Regress y x...

Est store m1

Predict e,re

Sc e obs,yline(0）

Tsset obs或者其他变量，用来表示时间变化

Dwstat 进行DW检验并查表得出自相关程度

Gen rho=1-d/2 rho 代表ρ估计

Prais y x,corc (one,two...)括号可接可不接表示从OLS残差中估计ρ

Gen dy1=y-l.y*ρ1

Gen dx1=y-l.y*ρ1

Gen dy2=y-l.y*ρ2

Gen dx2=y-l.y*ρ2 (rho=ρ)

Replace dy1=sqrt(1-rho^2)*y if ......补充第一个样本值比如if obs==1958 Replace dx1=sqrt(1-rho^2)*x if .......

《计量经济学》第三版例题stata解答

第二章例2.1．1(p24) （1）表2.1.2中E(Y|X=800)即条件均值的求法，将数据直接复制到stata 中。程序： sum y if x==800 程序：程序：（2）图2.1.1的做法：程序： twoway(scatter y x )(lfit y x ),title("不同可支配收入水平组家庭消费支出的条件分布图")xtitle("每月可支配收入（元）")ytitle("每月消费支出（元）")xtick(500(500)4000)ytick(0(500)3500)

例2.3．1（p37）将数据直接复制到stata 中程序：（1） total xiyi return list scalars: r(skip) = 0 r(first) = 1 r(k_term) = 0 r(k_operator) = 0 r(k) = 0 r(k_level) = 0 r(output) = 1 r(b) = 4974750 r(se) = 1507820.761894463 g a=r(b) in 1 total xi2 xiyi 4974750 1507821 1563822 8385678 Total Std. Err. [95% Conf. Interval] Scatter 表示散点图选项， lfit 表示回归线，title 表示题目，xtick 表示刻度，（500 （500）4000）分别表示起始刻度，中间数表示以单位刻度，4000表示最后的刻度。要注意的是命令中的符号都要用英文字符，否则命令无效。

return list g b=r(b) in 1 di a/b .67 (2) mean Yi gen m=r(b) in 1 mean Xi g n=r(b) in 1 di m-n*0.67 142.4 由此得到回归方程：Y=142.4+0.67Xi 例2.6．2(p53) 程序：（1）回归 reg y x

STATA最常用命令大全

stata save命令 FileSave As 例1. 表1.为某一降压药临床试验数据，试从键盘输入Stata，并保存为Stata格式文件。 STATA数据库的维护排序 SORT 变量名1 变量名2 …… 变量更名 rename 原变量名新变量名 STATA数据库的维护删除变量或记录 drop x1 x2 /* 删除变量x1和x2 drop x1-x5 /* 删除数据库中介于x1和x5间的所有变量(包括x1和x5) drop if x<0 /* 删去x1<0的所有记录 drop in 10/12 /* 删去第10~12个记录 drop if x==. /* 删去x为缺失值的所有记录 drop if x==.|y==. /* 删去x或y之一为缺失值的所有记录 drop if x==.&y==. /* 删去x和y同时为缺失值的所有记录 drop _all /* 删掉数据库中所有变量和数据 STATA的变量赋值用generate产生新变量 generate 新变量＝表达式 generate bh=_n /* 将数据库的内部编号赋给变量bh。 generate group=int((_n-1)/5)+1 /* 按当前数据库的顺序，依次产生5个1，5个2，5个3……。直到数据库结束。 generate block=mod(_n,6) /* 按当前数据库的顺序，依次产生1,2,3,4,5,0。generate y=log(x) if x>0 /* 产生新变量y，其值为所有x>0的对数值log(x)，当x<=0时，用缺失值代替。 egen产生新变量 set obs 12 egen a=seq() /*产生1到N的自然数 egen b=seq(),b(3) /*产生一个序列，每个元素重复＃次 egen c=seq(),to(4) /*产生多个序列，每个序列从1到＃ egen d=seq(),f(4)t(6) /*产生多个序列，每个序列从#1到＃2 encode 字符变量名，gen(新数值变量名) 作用：将字符型变量转化为数值变量。 STATA数据库的维护保留变量或记录 keep in 10/20 /* 保留第10～20个记录，其余记录删除 keep x1-x5 /* 保留数据库中介于x1和x5间的所有变量(包括x1和x5)，其余变量删除keep if x>0 /* 保留x>0的所有记录，其余记录删除

stata命令总结

stata11常用命令注：JB统计量对应的p大于0.05，则表明非正态，这点跟sktest和swilk 检验刚好相反； dta为数据文件； gph为图文件； do为程序文件；注意stata要区别大小写；不得用作用户变量名： _all _n _N _skip _b _coef _cons _pi _pred _rc _weight double float long int in if using with 命令：读入数据一种方式 input x y 1 4 2 5.5 3 6.2 4 7.7 5 8.5 end su/summarise/sum x 或 su/summarise/sum x,d 对分组的描述： sort group by group:su x %%%%% tabstat economy,stats(max) %返回变量economy的最大值 %%stats括号里可以是：mean，count(非缺失观测值个数)，sum(总和)，max，min，range， %% sd，var，cv(变易系数＝标准差/均值)，skewness，kurtosis，median，p1(1％分位 %% 数，类似地有p10, p25, p50, p75, p95, p99)，iqr(interquantile range = p75 – p25) _all %描述全部 _N 数据库中观察值的总个数。 _n 当前观察值的位置。 _pi 圆周率π的数值。 list gen/generate %产生数列 egen wagemax=max(wage) clear use by(分组变量)

stata常用命令

用help命令熟悉以下命令的功能： cd：（Change directory）改变stata的工作路径用法：（cd changes the current working directory to the specified drive and directory.） ●指定全路径：cd e:\ ●指定相对路径（如果当前路径已经指向e:\那么下面命令将达到和上面全路径命令同样效果）： ●cd .. 返回上一级目录 dir：（Display filenames）显示当前目录下的文件信息用法：（list the names of files in the specified，the names of the commands come from names popular on Unix and Windows，filespec may be any valid Mac, Unix, or Windows file path or file）工作列表文件中指定的名称目录,命令的名称来自名字流行的Unix和Windows文件规范可以是任何有效的Mac,Unix或Windows文件路径或文件。 . dir, w . dir *.dta . dir \mydata\*.dta List：（List values of variables）列出指定变量的取值用法：（st displays the values of variables. If no varlist is specified, the values of all the variables are displayed）列表显示变量的值。如果没有指定varlist,所有的值显示的变量。list [varlist] [if] [in] [, options] . list in 1/10 . list mpg weight . list mpg weight in 1/20 . list if mpg>20 . list mpg weight if mpg>20 . list mpg weight if mpg>20 in 1/10 Describe：（Describe data in memory or in file）描述内存或者文件中的数据(样本数、变量类型等信息) 用法：（describe produces a summary of the dataset in memory or of the data stored in a Stata-format dataset. For a compact listing of variable names, use describe, simple.） ●描述内存数据： ●描述文件数据：describe [varlist] using filename [, file_options] Use：（Load Stata dataset）调用数据，打开数据文件（以dta结尾）文件名+.dta 数据读入stata 用法：（use loads into memory a Stata-format dataset previously saved by save. If filename is specified without an extension, .dta is assumed. If your

Stata命令整理教学内容

Stata 命令语句格式： [by varlist:] command [varlist] [=exp] [if exp] [in range] [weight] [, options] 1、[by varlist:] *如果需要分别知道国产车和进口车的价格和重量，可以采用分类操作来求得， sort foreign //按国产车和进口车排序 . by foreign: sum price weight *更简略的方式是把两个命令用一个组合命令来写。 . by foreign, sort: sum price weight 如果不想从小到大排序，而是从大到小排序，其命令为gsort。 . sort - price //按价格从高到低排序 . sort foreign -price /*先把国产车都排在前，进口车排在后面，然后在国产车内再按价格从大小到排序，在进口车内部，也按从大到小排序*/ 2、[=exp]赋值运算 . gen nprice=price+10 //生成新变量nprice，其值为price+10 /*上面的命令generate(略写为gen) 生成一个新的变量，新变量的变量名为 nprice,新的价格在原价格的基础上均增加了10 元。 . replace nprice=nprice-10 /*命令replace 则直接改变原变量的赋值，nprice 调减后与price 变量取值相等*/ 3、[if exp]条件表达式 . list make price if foreign==0 *只查看价格超过1 万元的进口车（同时满足两个条件），则 . list make price if foreign==1 & price>10000 *查看价格超过1 万元或者进口车（两个条件任满足一个） . list make price if foreign==1 | price>10000 4、[in range]范围筛选 sum price in 1/5 注意“1/5”中，斜杠不是除号，而是从1 到 5 的意思，即1，2，3，4，5。如果要计算前10 台车中的国产车的平均价格，则可将范围和条件筛选联合使用。 . sum price in 1/10 if foreign==0 5、[weight] 加权 sum score [weight=num] 其中，num为每个成绩所对应的人数 6、[, options]其他可选项例如，我们不仅要计算平均成绩，还想知道成绩的中值，方差，偏度和峰度等*/ . sum score, detail . sum score, d //d 为detail 的略写，两个命令完全等价 . list price, nohead //不要表头 Stata 数据类型转换 1、字符型转化成数值型 destring, replace //全部转换为数值型，replace 表示将原来的变量（值）更新 destring date, replace ignore(“ ”) 将字符型数据转换为数值型数据：去掉字符间的空格destring price percent, gen(price2 percent2) ignore(“$ ,%”) 与date 变量类似，变量price 前面有美元符号，变量percent 后有百分号，换为数值型时需要忽略这些非数值型字符 2、数值型转化为字符型

[推荐] stata基本操作汇总常用命令

[推荐] Stata基本操作汇总——常用命令 help和search都是查找帮助文件的命令，它们之间的区别在于help用于查找精确的命令名，而search是模糊查找。如果你知道某个命令的名字，并且想知道它的具体使用方法，只须在stata的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在stata下做某个估计或某种计算，而不知道具体该如何实现，就需要用search命令了。使用的方法和help类似，只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容，点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找，反复实验，通常可以较快地找到你需要的内容.下面该正式处理数据了。我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成，所以，当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同，你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在stata 窗口上部的工具栏中有个孤立的小按钮，把鼠标放上去会出

现“bring do-file editor to front”，点击它就会出现do文件编辑器。为了使do文件能够顺利工作，一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。capture clear （清空内存中的数据）capture log close （关闭所有打开的日志文件）set more off （关闭more选项。如果打开该选项，那么结果分屏输出，即一次只输出一屏结果。你按空格键后再输出下一屏，直到全部输完。如果关闭则中间不停，一次全部输出。）set matsize 4000 （设置矩阵的最大阶数。我用的是不是太大了？）cd D: （进入数据所在的盘符和文件夹。和dos的命令行很相似。）log using （文件名）.log,replace （打开日志文件，并更新。日志文件将记录下所有文件运行后给出的结果，如果你修改了文件内容，replace选项可以将其更新为最近运行的结果。）use （文件名）,clear （打开数据文件。）（文件内容）log close （关闭日志文件。）exit,clear （退出并清空内存中的数据。）实证工作中往往接触的是原始数据。这些数据没有经过整理，有一些错漏和不统一的地方。比如，对某个变量的缺失观察值，有时会用点，有时会用-9，-99等来表示。回归时如果使用这些观察，往往得出非常错误的结果。还有，在不同的数据文件中，相同变量有时使用的变量名不同，会给合并数

Stata统计分析命令

Stata统计分析常用命令汇总一、winsorize极端值处理范围：一般在1%和99%分位做极端值处理，对于小于1%的数用1%的值赋值，对于大于99%的数用99%的值赋值。 1、Stata中的单变量极端值处理： stata 11.0，在命令窗口输入“findit winsor”后，系统弹出一个窗口，安装winsor模块安装好模块之后，就可以调用winsor命令，命令格式：winsor var1, gen(new var) p(0.01) 或者在命令窗口中输入：ssc install winsor安装winsor命令。winsor命令不能进行批量处理。 2、批量进行winsorize极端值处理：打开链接：https://www.doczj.com/doc/c29133696.html,/judson.caskey/data.html，找到winsorizeJ，点击右键，另存为到stata中的ado/plus/目录下即可。命令格式：winsorizeJ var1var2var3,suffix(w)即可，这样会生成三个新变量，var1w var2w var3w，而且默认的是上下1%winsorize。如果要修改分位点，则写成如下格式：winsorizeJ var 1 var2 var3,suffix(w) cuts(5 95)。 3、Excel中的极端值处理：（略） winsor2 命令使用说明简介：winsor2 winsorize or trim (if trim option is specified) the variables in varlist at particular percentiles specified by option cuts(# #). In defult, new variables will be generated with a suffix "_w" or "_tr", which can be changed by specifying suffix() option. The replace option replaces the variables with their winsorized or trimmed ones. 相比于winsor命令的改进： (1) 可以批量处理多个变量； (2) 不仅可以winsor，也可以trimming； (3) 附加了by() 选项，可以分组winsor 或trimming； (4) 增加了replace 选项，可以不必生成新变量，直接替换原变量。范例： *- winsor at (p1 p99), get new variable "wage_w" . sysuse nlsw88, clear . winsor2 wage *- left-trimming at 2th percentile . winsor2 wage, cuts(2 100) trim *- winsor variables by (industry south), overwrite the old variables . winsor2 wage hours, replace by(industry south) 使用方法: 1. 请将winsor 2.ado 和winsor2.sthlp 放置于stata12\ado\base\w 文件夹下； 2. 输入help winsor2 可以查看帮助文件；

伍德里奇---计量经济学第6章部分计算机习题详解(STATA)

班级：金融学×××班姓名：××学号：×××××××C6.9 NBASAL.RAW points=β0+β1exper+β2exper2+β3age+β4coll+u 解：（ⅰ）按照通常的格式报告结果。由上图可知：points=35.22+2.364exper?0.077exper2?1.074age?1.286coll 6.9870.4050.02350.295 (0.451) n=269，R2=0.1412，R2=0.1282。（ⅱ）保持大学打球年数和年龄不变，从加盟的第几个年份开始，在NBA打球的经历实际上将降低每场得分？这讲得通吗？由上述估计方程可知，转折点是exper的系数与exper2系数的两倍之比：exper?= β12β2= 2.364[2×?0.077]=15.35，即从加盟的第15个到第16个年份之间，球员在NBA打球的经历实际上将降低每场得分。实际上，在模型所用的数据中，269名球员中只有2位的打球年数超过了15年，数据代表性不大，所以这个结果讲不通。（ⅲ）为什么coll具有负系数，而且统计显著？一般情况下，NBA运动员的球员都会在读完大学之前被选拔出，甚至从高中选出，所以这些球员在大学打球的时间少，但每场得分却很高，所以coll具有负系数。同时，coll的t统计量为-2.85，所以coll统计显著。（ⅳ）有必要在方程中增加age的二次项吗？控制exper和coll之后，这对年龄效应意味着什么？

增加age的二次项后，原估计模型变成： points=73.59+2.864exper?0.128exper2?3.984age+0.054age2?1.313coll 35.930.610.05 2.690.05 (0.45) n=269，R2=0.1451，R2=0.1288。由方程可知：age的t统计量为?1.48，age2的t统计量为1.09，所以age和age的二次项统计都不显著，而当不增加age2时，age的t统计量为?3.64，统计显著，因此完全没有必要在方程中增加age的二次项。当控制了exper和coll之后，年龄对points的负效应将会增大。（ⅴ）现在将log?(wage)对points，exper，exper2，age和coll回归。以通常的格式报告结论。所以，log wage=6.78+0.078points+0.218exper?0.0071exper2?0.048age?0.040coll 0.850.0070.0500.00280.035 (0.053) n=269，R2=0.4878，R2=0.4781。（ⅵ）在第（ⅴ）部分的回归中检验age和coll是否联合显著。一旦控制了生产力和资历，这对考察年龄和受教育程度是否对工资具有单独影响这个问题有何含义？

运用Stata做计量经济学

运用Stata做计量经济学运用Stata建模的7步骤： 1、准备工作；目录、日志、读入数据、熟悉数据、时间变量、more、……； 2、探索数据：数据变换、描述统计量、相关系数、趋势图、散点图、……； 3、建立模型：regress、经济理论检验、实际经济问题要求、统计学检验、计量经济学检验：R2，T，t，残差； 4、诊断模型：异方差、序列相关、多重共线性、随机解释变量问题、……； 5、修正模型：WLS、GLS、工具变量法（ivregress），……； 6、应用模型：置信区间、预测、结构分析、边际分析、弹性分析、常用模型回归系数的意义、……； 7、整理：关闭日志、生成do文件备用 1、准备工作让STATA处于初始状态，清除所有使用过的痕迹clear 指明版本号version11 设定并进入工作文件夹：cd D:\ （设定路径，将数据、程序和输出结果文件均存入该文件夹）关闭以前的日志capture log close 建立日志：log using , replace 设定内存：set mem 20m

关闭more：set more off 读入数据：use .dta, clear 认识变量：describe 建立时间变量：tsset 2、用描述统计方法探索数据特征必要的数据转换：gen、replace、……；描述统计量：summarize, detail 相关系数矩阵：corr/pwcorr 散点图和拟合直线图：scatter y x || lfit y x 矩阵散点图：graph matrix y x1 x2 x3,half 线性趋势图：line y x 3、建立模型 OLS建立模型：regress y x1 x2 x3；由方差分析表并用F和R2检验模型整体显著性；依据p值对各系数进行t检验，一次只能剔出一个最不显著的变量，直到不包含不显著的变量；估计参数，判别变量的相对重要性；构造和估计约束模型，用以检验经济理论

stata基础命令

display 命令 display “1+1”输出为1+1 display 1+1 输出为2 set mem设置内存 set mem 500m,perm 设置内存为500m set matsize 500 设置matsize为500 query memory 查看内存设置保留和删除变量keep & drop drop crcd repttype 删除crcd repttype keep stkcd stknme nindcd nnindcd 保留stkcd stknme nindcd nindcd （注意命令的大小写） save保存stata格式的数据 save “D:\Teach课件\STATA\data\CG_Co.dta “新建文件名 save “D:\Teach课件\STATA\data\CG_Co.dta ”,replace 重置已有文件 use&insheet using use 打开dta文件，insheet using打开csv文件 gen生成的新的变量 gen tdate=date(accper,"YMD") 产生一个tdate变量用来存放从accper变量中提取的年月日 format tdate %d 设置tdate为整数型变量 gen year=year(tdate) 提取tdate里面的年份存为year变量 gen month=month(tdate) 提取tdate里面的月份存为month变量 if条件句&tab离散变量的频率 keep if month==12 如保留变量month等于12的数据（注意双等号） tab year 画出变量year的离散频率纵向添加数据append use TRD_Year2011.dta,clear 打开2011的数据文件 append using TRD_Year2012.dta 向2011的数据文件中纵向加入2012的数据文件*注意2012内的文件变数量与变数名必须相同，若不同，用keep或drop 保留或删除 merge文件合并 use TRD_Year2011_2012.dta,clear 打开该数据文件 sort stkcd year 排列一下要合并文件内的数据顺序stkcd和year 均为变量名 save TRD_Year2011_2012.dta,replace 排列后重新储存该数据文件

计量经济学常用方法及应用-经济管理学院

计量经济学专题及应用【授课计划：计划讲8个专题。主要是对计量经济学中5块常用的方法进行总结性和归纳性的介绍，侧重于讲在实际经济研究和实证分析中碰到相应问题时，计量经济方法上应当怎样处理，为什么要这样处理，如何处理，并结合STATA 讲应用例子。此外，1次专题介绍STATA的基础功能，1次专题系统梳理计量经济学的基础理论，还有1次专题结合实际研究例子，介绍一手数据搜集的调查设计和组织。通过上述课程，使学生能够在已经接受过基本理论和方法训练的基础上，更好地理解计量经济学的内容，并培养和提高开展实证研究的能力】 1、STATA简介及简单应用介绍目前国内外最流行的计量经济分析软件STATA的基本功能和用法，通过简单例子介绍STATA在数据清理和管理、描述性统计分析、回归分析等方法的用法。同时插入EXCEL在处理数据方面的一些功能和应用。上午讲课，下午习题课。 2、计量经济分析基础对计量经济学的基础理论进行总结性和归纳性的回顾、输理和介绍，重点讲假设检验和回归的道理，以及回归诊断。上午讲课，下午习题课。 3、项目评估与政策分析应用系统介绍计量经济学在项目评估和政策分析上的方法和应用，特别介绍虚拟变量模型的建立及其在政策分析和项目评估研究中的应用。上午讲课，下午习题课。 4、经济学中的内生性问题及相关计量经济方法总结和介绍计量经济学中内生性问题在经济研究中的涵义和问题，内生性问题产生的主要原因，对计量估计结果的影响，内生性问题的处理方法（工具变量和两阶段估计等）和应用例子。上午讲课，下午习题课。 5、微观个体行为的计量经济分析方法总结和介绍分析微观个体行为的属性和受限因变量模型（Probit, Logit, Tobit, Heckman, Mlogit, Clogit等）等常用微观计量经济方法，包括模型内涵和适用范

stata命令大全

调整变量格式： format x1 %10.3f ——将x1的列宽固定为10，小数点后取三位 format x1 %10.3g ——将x1的列宽固定为10，有效数字取三位 format x1 %10.3e ——将x1的列宽固定为10，采用科学计数法 format x1 %10.3fc ——将x1的列宽固定为10，小数点后取三位，加入千分位分隔符 format x1 %10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符 format x1 %-10.3gc ——将x1的列宽固定为10，有效数字取三位，加入千分位分隔符，加入“-”表示左对齐合并数据： use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge using "C:\Documents and Settings\xks\桌面\1999.dta" ——将1999和2006的数据按照样本（observation）排列的自然顺序合并起来 use "C:\Documents and Settings\xks\桌面\2006.dta", clear merge id using "C:\Documents and Settings\xks\桌面\1999.dta" ,unique sort ——将1999和2006的数据按照唯一的（unique）变量id来合并，在合并时对id进行排序（sort）建议采用第一种方法。对样本进行随机筛选： sample 50 在观测案例中随机选取50%的样本，其余删除 sample 50,count 在观测案例中随机选取50个样本，其余删除查看与编辑数据： browse x1 x2 if x3>3 （按所列变量与条件打开数据查看器） edit x1 x2 if x3>3 （按所列变量与条件打开数据编辑器）数据合并（merge）与扩展（append） merge表示样本量不变，但增加了一些新变量；append表示样本总量增加了，但变量数目不变。one-to-one merge：数据源自stata tutorial中的exampw1和exampw2 第一步：将exampw1按v001～v003这三个编码排序，并建立临时数据库tempw1 clear use "t:\statatut\exampw1.dta" su ——summarize的简写 sort v001 v002 v003 save tempw1 第二步：对exampw2做同样的处理 clear use "t:\statatut\exampw2.dta" su sort v001 v002 v003 save tempw2 第三步：使用tempw1数据库，将其与tempw2合并： clear use tempw1 merge v001 v002 v003 using tempw2

常用到的stata命令

常用到的sta命令闲话不说了。help和search都是查找帮助文件的命令，它们之间的区别在于help用于查找精确的命令名，而search是模糊查找。如果你知道某个命令的名字，并且想知道它的具体使用方法，只须在sta的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在sta下做某个估计或某种计算，而不知道具体该如何实现，就需要用search命令了。使用的方法和help类似，只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容，点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找，反复实验，通常可以较快地找到你需要的内容。下面该正式处理数据了。我的处理数据经验是最好能用sta的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成，所以，当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同，你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在sta窗口上部的工具栏中有个孤立的小按钮，把鼠标放上去会出现“bring do-file editor to front”，点击它就会出现do文件编辑器。为了使do文件能够顺利工作，一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。 /*（标签。简单记下文件的使命。）*/ capture clear（清空内存中的数据） capture log close（关闭所有打开的日志文件） set mem 128m（设置用于sta使用的内存容量） set more off（关闭more选项。如果打开该选项，那么结果分屏输出，即一次只输出一屏结果。你按空格键后再输出下一屏，直到全部输完。如果关闭则中间不停，一次全部输出。） set matsize4000（设置矩阵的最大阶数。我用的是不是太大了？）

计量经济学与stata——第一章

第一章引言目录 1回归的本质 (1) 2计量经济学的一些基本概念和术语 (3) 2.1 统计关系与确定性关系 (3) 2.2 回归关系、相关关系与因果关系 (4) 2.3 术语与符号 (4) 2.4 数据类型 (4) 2.5 计量经济学的估计框架 (5) 2.6 经典计量经济学的方法论 (5) 3Stata简单介绍 (8) 4第一章附录： (8) 4.1 诺贝尔经济学奖与计量经济学 (8) 4.2 相关数学基础 (14) 4.3 本章相关数学证明 (19)

1 回归的本质计量经济学的一般模型： 2(,)[]0[]y F X E E βεεεεσ′=+==Ω 回归是计量经济学的核心，理解回归的本质，对于掌握计量经济的理论与方法至关重要。回归的本质用语言来描述其实很简单，就是：对于一组随机变量y 和X ，如果y 和X 存在特定的关系，为分析y 和X 之间的相互影响，或用X 去预测y ，需要知道y 和X 的模型形式以及模型中参数β的值，但是，由于—— 1、正确的模型形式(,)y F X β=未知，只能尽可能去逼近它（注：这涉及经济理论模型及模型设定的问题）。 2、即使假定模型的形式(,)y F X β=（不包括β）已被确定，也不可能穷尽随机变量和y X 的所有取值（即总体），来得到真实的β。基于这两点，真实的模型形式(,)F X β和β无法得到，只能利用估计方法和样本数据去尽可能得到与真实(,)F X β和β偏差或者误差最小的?(,)F X β和?β，即 2??min [((,))]E y F X β? （1）使得（1）成立的?(,)F X β即是对于y X 的条件数学期望： ??(,)[/]F X E y X β= 注：从参数估计的角度来说，对于不同的估计方法，比如OLS （最小二乘估计法）、MLE （最大似然估计法）、GMM （矩估计或广义矩估计法），最小化均方误差的表述不尽相同，但本质是一样的。理解回归的例子：凯恩斯消费函数、OLS 、一元线性回归（双变量回归）凯恩斯消费函数是一个典型的一元线性回归模型，根据凯恩斯的经济理论，消费和收入存在密切的联系，如果用表示消费，Y 表示收入，则最简单与最常见的凯恩斯消费函数C 理论模型可表示为： C Y αβ=+ （2）函数满足以下条件：

STATA面板数据模型操作命令

STATA 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令 εαβit ++=x y it i it 固定效应模型 μβit +=x y it it εαμit +=it it 随机效应模型（一）数据处理输入数据 ●tsset code year 该命令是将数据定义为“面板”形式 ●xtdes 该命令是了解面板数据结构 ●summarize sq cpi unem g se5 ln 各变量的描述性统计（统计分析） ●gen lag_y=L.y /////// 产生一个滞后一期的新变量

gen F_y=F.y /////// 产生一个超前项的新变量 gen D_y=D.y /////// 产生一个一阶差分的新变量 gen D2_y=D2.y /////// 产生一个二阶差分的新变量（二）模型的筛选和检验 ●1、检验个体效应（混合效应还是固定效应）（原假设：使用OLS混合模型）●xtreg sq cpi unem g se5 ln,fe 对于固定效应模型而言，回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000，检验结果表明固定效应模型优于混合OLS模型。 ●2、检验时间效应（混合效应还是随机效应）（检验方法：LM统计量）（原假设：使用OLS混合模型） ●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0

可以看出，LM检验得到的P值为0.0000，表明随机效应非常显著。可见，随机效应模型也优于混合OLS模型。 ●3、检验固定效应模型or随机效应模型（检验方法：Hausman检验）原假设：使用随机效应模型（个体效应与解释变量无关）通过上面分析，可以发现当模型加入了个体效应的时候，将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣，这需要进行接下来的检验，如下： Step1：估计固定效应模型，存储估计结果 Step2：估计随机效应模型，存储估计结果 Step3：进行Hausman检验 ●qui xtreg sq cpi unem g se5 ln,fe est store fe qui xtreg sq cpi unem g se5 ln,re est store re hausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出，hausman检验的P值为0.0000，拒绝了原假设，认为随机效应模型的基本假设得不到满足。此时，需要采用工具变量法和是使用固定效应模型。

常用stata命令-好用

我常用到的stata命令最重要的两个命令莫过于help和search了。即使是经常使用stata的人也很难，也没必要记住常用命令的每一个细节，更不用说那些不常用到的了。所以，在遇到困难又没有免费专家咨询时，使用stata自带的帮助文件就是最佳选择。stata的帮助文件十分详尽，面面俱到，这既是好处也是麻烦。当你看到长长的帮助文件时，是不是对迅速找到相关信息感到没有信心？闲话不说了。help和search都是查找帮助文件的命令，它们之间的区别在于help用于查找精确的命令名，而search是模糊查找。如果你知道某个命令的名字，并且想知道它的具体使用方法，只须在stata的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在stata下做某个估计或某种计算，而不知道具体该如何实现，就需要用search命令了。使用的方法和help类似，只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容，点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找，反复实验，通常可以较快地找到你需要的内容。下面该正式处理数据了。我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成，所以，当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同，你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在stata窗口上部的工具栏中有个孤立的小按钮，把鼠标放上去会出现“bring do-file editor to front”，点击它就会出现do文件编辑器。为了使do文件能够顺利工作，一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。 /*（标签。简单记下文件的使命。）*/ capture clear （清空内存中的数据） capture log close （关闭所有打开的日志文件） set mem 128m （设置用于stata使用的内存容量） set more off （关闭more选项。如果打开该选项，那么结果分屏输出，即一次只输出一屏结果。你按空格键后再输出下一屏，直到全部输完。如果关闭则中间不停，一次全部输出。）set matsize 4000 （设置矩阵的最大阶数。我用的是不是太大了？） cd D: （进入数据所在的盘符和文件夹。和dos的命令行很相似。） log using （文件名）.log,replace （打开日志文件，并更新。日志文件将记录下所有文件运行后给出的结果，如果你修改了文件内容，replace选项可以将其更新为最近运行的结果。） use （文件名）,clear （打开数据文件。）（文件内容）

Stata常用15条命令

【命令1】：导入数据一般做实证分析使用的是excel中的数据，其后缀名为.xls，需要将其修改为.csv insheet using name.csv, clear 【命令2】：删除重复变量 sort var1 var2 duplicatesdrop var1 var2, force 【命令3】：合并数据 use data1, clear merge m:m var1 var2 using data2 drop if _merge==2 drop if _merge==1 drop _merge 【命令4】：描述性统计分析 tabstat var1var2, stat(n min mean median p25 p75 max sd), if groupvar==0 or 1 输出到word中： logout, save(name) word replace: tabstat var, stat(n min mean p50 max sd) col(stat)f(%9.2g) 【命令5】：结果输出安装 ssc install estout, replace 单个回归 reg y x esttab using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01) 多个回归一起 reg y x1 est store m1 reg y x2 est store m2 esttab m1 m2 using name.rtf, compress nogap r2 ar2 star(* 0.1 ** 0.05 *** 0.01)