stata-第一章-基本操作

格式：ppt
大小：109.11 KB
文档页数：24

下载文档原格式

Stata入门

10、计算功能：di splay log(2) 11\用do 文件(下拉菜单倒数第6个钮）
三、回归
• 回归的命令很多，也有很多的参数在此只说最简单的，详细的请参考help reg • Reg y x1 x2 x3 if….,noc • 一般的回归参数在stata返回的结果上都有 • 如果要检验某些（如x1x3)参数的联合显著度: Test x1 x3 (test x1==1~~ test _b[X1]==1 test _b[_cons]) _b[varname]表示变量的系数 Testnl _b[x1]=_b[x2]^2,表示非线性检验约束回归：先定义约束条件，constraint def 1 x1+x2=4 然后进行回归：cnsreg y x1 x2 x3 x4,c(1) 如果有多个约束条件，则定义多个条件后,c(1-n)
9、面板数据
(1)FD 一阶差分法按时间顺序差分后即可用OLS （2）FE 固定效应估计 Tsset I (面板变量） t （时间变量） xtreg y x,fe (3) RE 随机效应估计 • Tsset i t/ xtreg y x ,re
• 三者比较：/xttest0/零假设为混合OLS由于随机效应 • Estimates store fixed / xtreg y x,re/Hausman fixed/ 零假设为，随机效应优于固定效应
Stata入门
东南大学经济管理学院秦双全
过程窗口
一、认识stata
结果窗口
变量窗口
命令窗口
• 通过下拉菜单“windows”在桌面上摆放各功能窗、可以把光标放在各窗口边缘来调整各窗口的大小，通过单击右键选择 “preferences”改变“结果”栏的颜色

Stata软件基本操作和数据分析入门

Stata软件基本操作和数据分析入门第一讲Stata操作入门张文彤赵耐青第一节概况Stata最初由美国计算机资源中心（Computer Resource Center）研制，现在为Stata公司的产品，其最新版本为7.0版。

它操作灵活、简单、易学易用，是一个非常有特色的统计分析软件，现在已越来越受到人们的重视和欢迎，并且和SAS、SPSS一起，被称为新的三大权威统计软件。

Stata最为突出的特点是短小精悍、功能强大，其最新的7.0版整个系统只有10M左右，但已经包含了全部的统计分析、数据管理和绘图等功能，尤其是他的统计分析功能极为全面，比起1G以上大小的SAS系统也毫不逊色。

另外，由于Stata在分析时是将数据全部读入内存，在计算全部完成后才和磁盘交换数据，因此运算速度极快。

由于Stata的用户群始终定位于专业统计分析人员，因此他的操作方式也别具一格，在Windows席卷天下的时代，他一直坚持使用命令行／程序操作方式，拒不推出菜单操作系统。

但是，Stata的命令语句极为简洁明快，而且在统计分析命令的设置上又非常有条理，它将相同类型的统计模型均归在同一个命令族下，而不同命令族又可以使用相同功能的选项，这使得用户学习时极易上手。

更为令人叹服的是，Stata语句在简洁的同时又拥有着极高的灵活性，用户可以充分发挥自己的聪明才智，熟练应用各种技巧，真正做到随心所欲。

除了操作方式简洁外，Stata的用户接口在其他方面也做得非常简洁，数据格式简单，分析结果输出简洁明快，易于阅读，这一切都使得Stata成为非常适合于进行统计教学的统计软件。

Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件（ADO文件），这些文件可以自行修改、添加和下载。

用户可随时到Stata网站寻找并下载最新的升级文件。

事实上，Stata的这一特点使得他始终处于统计分析方法发展的最前沿，用户几乎总是能很快找到最新统计算法的Stata程序版本，而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。

Stata教程(免费)

第一章 Stata 概貌§1.1 Stata的功能、特点和背景Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件，由美国计算机资源中心（Computer Resource Center）研制。

从1985至1998的十四年时间里，已连续推出1.1，1.2，1.3，1.4，1.5，……及2.0，2.1，3.0，3.1，4.0，5.0，6.0等多个版本，通过不断更新和扩充，内容日趋完善。

它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点，又在许多方面别具一格。

Stata融汇了上述程序的优点，克服了各自的缺点，使其功能更加强大，操作更加灵活、简单，易学易用，越来越受到人们的重视和欢迎。

Stata的突出特点是只占用很少的磁盘空间，输出结果简洁，所选方法先进，内容较齐全，制作的图形十分精美，可直接被图形处理软件或字处理软件如WORD等直接调用。

一、 Stata的数据管理能力1.Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。

对640k内存的微机，3.1版本的Stata可以管理2400个记录×99个变量，并随计算机扩展内存的增加而增加；对4.0的WINDOWS版本，Stata可以管理4800个记录×99个变量；对WINDOWS 95下的5.0版本，可根据计算机的配置情况设置变量数和记录数，如32M扩展内存的计算机，可处理2千万个数据。

变量数和记录数可以互相交易（trade），即减少记录数可以增加变量数，减少变量数可以增加记录数。

2.可以将分组变量转换成指示变量(哑变量)，将字符串变量映射成数字代码。

3.可以对数据文件进行横向和纵向链接，可以将行数据转为列数据，或反之。

4.可以恢复、修改执行过的命令。

5.可以利用数值函数或字符串函数产生新变量。

6.可以从键盘或磁盘读入数据。

二、 Stata的统计功能Stata的统计功能很强，除了传统的统计分析方法外，还收集了近20年发展起来的新方法，如Cox比例风险回归，指数与Weibull回归，多类结果与有序结果的logistic回归，Poisson回归、负二项回归及广义负二项回归，随机效应模型等。

Stata软件应用1---【Stata软件基本操作】

二、Stata常用基本操作
方式 2：直接将结果存入Word或Excel等文本编辑软件中，即在Stata结果窗口中选择上述计算结果→ 鼠标右键→Copy Table →打开Excel窗口粘帖，结果按表格方式呈现。计算相关系数（基本命令：corr）键入 corr rjgdp rjcap 回车→显示两个变量的相关系数矩阵 →依据前述两种方式保存运行结果；进行简单回归分析（基本命令：reg）键入 reg rjgdp rjcap 回车(第一个变量rjgdp为被解释变量，第二个变量rjcap为解释变量) →显示回归结果→依据前述两种方式保存运行结果；
二、Stata常用基本操作 Stata数据管理在对数据进行分析时，经常会遇到这些事情：合并两个文件；删除某个变量；重新生成一个新变量；计算某个变量的函数值等。这些事情的处理就是数据管理。这里介绍一些常用的数据管理命令，其他的可参考Stata帮助文件或User’s Guide。常用的数据管理命令包括以下几类：
二、Stata 常用基本操作

启动 Stata
下载Stata10压缩包，解压后，在Stata10文件夹中，找到wsestata图标，鼠标双击它即会出现Stata的界面。今后大部分工作都将在这个界面上完成。

Stata 窗口简介
Stata窗口主要由以下几部分构成： 1、Command(命令，右下部分)窗口：用于向Stata键入需要执行的命令，回车后即开始执行，相应的结果则会在结果窗口中显示出来。 2、Stata results(结果，右上部分)窗口：显示运行结果、所执行的命令以及出错信息等。窗口中会使用不同的颜色区分不同的文本，如白色表示命令，红色表示错误信息。
2、数据文件的合并

教你快速上手使用Stata进行数据处理和分析

教你快速上手使用Stata进行数据处理和分析快速上手使用Stata进行数据处理和分析第一章：Stata软件的介绍和安装Stata是一款功能强大的统计分析软件，广泛应用于各个学科领域的数据处理和分析工作中。

它提供了强大的数据管理、数据处理和数据分析功能，能够帮助用户高效地完成各种统计任务。

1.1 Stata软件的特点和应用领域Stata具有易于使用的界面、丰富的数据处理和分析功能，可以满足不同用户对数据分析的需求。

它被广泛应用于社会科学、经济学、医学、生物学等领域的数据处理和分析工作中。

1.2 Stata软件的安装和系统要求Stata软件的安装非常简单，只需按照安装向导进行操作即可。

同时，为了保证软件的正常运行，用户需要满足一定的系统要求，比如合适的操作系统版本、足够的内存和硬盘空间等。

第二章：Stata基本命令和语法在使用Stata进行数据处理和分析之前，我们需要了解一些基本的命令和语法。

下面是一些常用的命令和语法：2.1 数据导入和导出命令Stata可以导入多种数据格式，如Excel、CSV、SPSS等，通过命令"import"和"export"可以实现数据的导入和导出。

2.2 数据的描述性统计和图表命令Stata提供了丰富的命令来计算和展示数据的描述性统计信息，比如平均值、标准差、频数等。

通过命令"summarize"和"graph"可以生成相应的统计表和图表。

2.3 数据的清洗和转换命令在实际的数据处理中，我们经常需要对数据进行清洗和转换。

Stata提供了一系列的命令来处理缺失值、异常值、重复值等问题，比如命令"drop"和"replace"等。

第三章：Stata高级数据处理和分析技巧除了基本的命令和语法，Stata还提供了一些高级的数据处理和分析技巧，可以帮助用户更加高效地完成工作。

STATA软件操作(一)基础数据处理

STATA数据库结构维护
频数的展开 expand命令例： expand f
a
b
0 1
0 9 5
1 2 8
数据库结构的转换
频数的展开
f 9 5 2 8 a 0 0 1 1 b 0 1 0 1
expand f
ex9

ex8
no 1 2 3 4 5 6 7 8 9 10 11 12 h1 156.6 148.8 133.1 140.7 139.2 140.2 134.9 141.4 138.5 148.9 144.4 145.4 h2 142.3 134.4 150.3 141.9 143.5 138.1 142.9 140.9 134.7 141.2 135.5 140.2
STATA数据库的保留维护
保留变量或记录 keep in 10/20 /* 保留第10～20 个记录，其余记录删除 keep x1-x5 /* 保留数据库中介于x1和x5间的所有变量(包括x1和x5)，其余变量删除 keep if x>0 /* 保留x>0的所有记录，其余记录删除
STATA的函数: help functions
数学函数
abs(x),sqrt(x),exp(x),ln(x),log10(x)…… 统计函数 norm(u),invnorm(p),ttail(df,t),invttaill(df,p)…… 字符串函数 length(s),substr(s,n1,n2),string(x),real(s)…… 特殊函数 int(x),max(x1,x2,…),autocode(x,k,min,max)…… 随机数函数 uniform(seed),invnorm(uniform())

stata操作指南

stata操作指南计量经济学stata操作（实验课）第一章stata基本知识1、stata窗口介绍2、基本操作（1）窗口锁定：Edit-preferences-general preferences-windowing-lock splitter （2）数据导入（3）打开文件：use E:\example.dta,clear（4）日期数据导入：gen newvar=date(varname, “ymd”)format newvar %td 年度数据gen newvar=monthly(varname, “ym”)format newvar %tm 月度数据gen newvar=quarterly(varname, “yq”)format newvar %tq 季度数据（5）变量标签Label variable tc ` “total output” ’（6）审视数据describelist x1 x2list x1 x2 in 1/5list x1 x2 if q>=1000drop if q>=1000keep if q>=1000（6）考察变量的统计特征summarize x1su x1 if q>=10000su q,detailsutabulate x1correlate x1 x2 x3 x4 x5 x6（7）画图histogram x1, width(1000) frequency kdensity x1scatter x1 x2twoway (scatter x1 x2) (lfit x1 x2) twoway (scatter x1 x2) (qfit x1 x2) （8）生成新变量gen lnx1=log(x1)gen q2=q^2gen lnx1lnx2=lnx1*lnx2gen larg=(x1>=10000)rename larg largeg large=(q>=6000)replace large=(q>=6000)drop ln*（8）计算功能display log(2)（9）线性回归分析regress y1 x1 x2 x3 x4vce #显示估计系数的协方差矩阵reg y1 x1 x2 x3 x4,noc #不要常数项reg y1 x1 x2 x3 x4 if q>=6000reg y1 x1 x2 x3 x4 if largereg y1 x1 x2 x3 x4 if large==0reg y1 x1 x2 x3 x4 if ～large predict yhatpredict e1,residualdisplay 1/_b[x1]test x1=1 # F检验，变量x1的系数等于1test (x1=1) (x2+x3+x4=1) # F联合假设检验test x1 x2 #系数显著性的联合检验testnl _b[x1]= _b[x2]^2（10）约束回归constraint def 1 x1+x2+x3=1cnsreg y1 x1 x2 x3 x4,c(1)cons def 2 x4=1cnsreg y1 x1 x2 x3 x4,c(1-2)（11）stata的日志File-log-begin-输入文件名log off 暂时关闭log on 恢复使用log close 彻底退出（12）stata命令库更新Update allhelp command第二章有关大样本ols的stata命令及实例（1）ols估计的稳健标准差reg y x1 x2 x3,robust（2）实例use example.dta,clearreg y1 x1 x2 x3 x4test x1=1reg y1 x1 x2 x3 x4,rtestnl _b[x1]=_b[x2]^2第三章最大似然估计法的stata命令及实例（1）最大似然估计help ml（2）LR检验lrtest #对面板数据中的异方差进行检验（3）正态分布检验sysuse auto #调用系统数据集auto.dtahist mpg,normalkdensity mpg,normalqnorm mpg*手工计算JB统计量sum mpg,detaildi (r(N)/6)*((r(skewness)^2)+[(1/4)*(r(kurtosis)-3)^2]) di chi2tail(自由度，上一步计算值)*下载非官方程序ssc install jb6jb6 mpg*正态分布的三个检验sktest mpgswilk mpgsfrancia mpg*取对数后再检验gen lnmpg=log(mpg)kdensity lnmpg, normaljb6 lnmpgsktest lnmpg第四章处理异方差的stata命令及实例（1）画残差图rvfplotrvfplot varname*例题use example.dta,clearreg y x1 x2 x3 x4rvfplot # 与拟合值的散点图rvfplot x1 # 画残差与解释变量的散点图（2）怀特检验estat imtest,white*下载非官方软件ssc install whitetst（3）BP检验estat hettest #默认设置为使用拟合值estat hettest,rhs #使用方程右边的解释变量estat hettest [varlist] #指定使用某些解释变量estat hettest,iidestat hettest,rhs iidestat hettest [varlist],iid（4）WLSreg y x1 x2 x3 x4 [aw=1/var]*例题quietly reg y x1 x2 x3 x4predict e1,resgen e2=e1^2gen lne2=log(e2)reg lne2 x2,nocpredict lne2fgen e2f=exp(lne2f)reg y x1 x2 x3 x4 [aw=1/e2f]（5）stata命令的批处理（写程序）Window-do-file editor-new do-file#WLS for examplelog using E:\wls_example.smcl,replaceset more offuse E:\example.dta,clearreg y x1 x2 x3 x4predict e1,resgen e2=e1^2g lne2=log(e2)reg lne2 x2,nocpredict lne2fg e2f=exp(lne2f)*wls regressionreg y x1 x2 x3 x4 [aw=1/e2f]log closeexit第五章处理自相关的stata命令及实例（1）滞后算子/差分算子tsset yearl.l2.D.D2.LD.（2）画残差图scatter e1 l.e1ac e1pac e1（3）BG检验estat bgodfrey（默认p=1）estat bgodfrey,lags(p)estat bgodfrey,nomiss0（使用不添加0的BG检验）（4）Ljung-Box Q检验reg y x1 x2 x3 x4predict e1,residwntestq e1wntestq e1,lags(p)* wntestq指的是“white noise test Q”，因为白噪声没有自相关（5）DW检验做完OLS回归后，使用estat dwatson（6）HAC稳健标准差newey y x1 x2 x3 x4,lag(p)reg y x1 x2 x3 x4,cluster(varname)（7）处理一阶自相关的FGLSprais y x1 x2 x3 x4 （使用默认的PW估计方法）prais y x1 x2 x3 x4,corc （使用CO估计法）（8）实例use icecream.dta, cleartsset timegraph twoway connect consumption temp100 time, msymbol(circle) msymbol(triangle) reg consumption temp price incomepredict e1, resg e2=l.e1twoway (scatter e1 e2) (lfit e1 e2)ac e1pac e1estat bgodfreywntestq e1estat dwatsonnewey consumption temp price income, lag (3)prais consumption temp price income, corcprais consumption temp price income, nologreg consumption temp l.temp price incomeestat bgodfreyestat dwatson第六章模型设定与数据问题（1）解释变量的选择reg y x1 x2 x3estat ic*例题use icecream.dta, clearreg consumption temp price incomeestat icreg consumption temp l.temp price incomeestat ic（2）对函数形式的检验（reset检验）reg y x1 x2 x3estat ovtest （使用被解释变量的2、3、4次方作为非线性项）estat ovtest, rhs （使用解释变量的幂作为非线性项，ovtest-omitted variable test）*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat ovtestg lnq2=lnq^2reg lntc lnq lnq2 lnpl lnpk lnpfestat ovtest（3）多重共线性estat vif*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat vif（4）极端数据reg y x1 x2 x3predict lev, leverage （列出所有解释变量的lev值）gsort –levsum levlist lev in 1/3*例题use nerlove.dta, clearquietly reg lntc lnq lnpl lnpk lnpfpredict lev, leveragesum levgsort –levlist lev in 1/3（5）虚拟变量gen d=(year>=1978)tabulate province, generate (pr)reg y x1 x2 x3 pr2-pr30（6）经济结构变动的检验方法1：use consumption_china.dta, cleargraph twoway connect c y year, msymbol(circle) msymbol(triangle)reg c yreg c y if year<1992reg c y if year>=1992计算F统计量方法2：gen d=(year>1991)gen yd=y*dreg c y d ydtest d yd第七章工具变量法的stata命令及实例（1）2SLS的stata命令ivregress 2sls depvar [varlist1] (varlist2=instlist)如：ivregress 2sls y x1 (x2=z1 z2)ivregress 2sls y x1 (x2 x3=z1 z2 z3 z4) ,r firstestat firststage,all forcenonrobust （检验弱工具变量的命令）ivregress liml depvar [varlist 1] (varlist2=instlist)estat overid （过度识别检验的命令）*对解释变量内生性的检验（hausman test），缺点：不适合于异方差的情形reg y x1 x2estimates store olsivregress 2sls y x1 (x2=z1 z2)estimates store ivhausman iv ols, constant sigmamore*DWH检验estat endogenous*GMM的过度识别检验ivregress gmm y x1 (x2=z1 z2) （两步GMM）ivregress gmm y x1 (x2=z1 z2),igmm （迭代GMM）estat overid*使用异方差自相关稳健的标准差GMM命令ivregress gmm y x1 (x2=z1 z2), vce (hac nwest[#])（2）实例use grilic.dta,clearsumcorr iq sreg lw s expr tenure rns smsa,rreg lw s iq expr tenure rns smsa,rivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),restat overidivregress 2sls lw s expr tenure rns smsa (iq=med kww),r first estat overidestat firststage, all forcenonrobust （检验工具变量与内生变量的相关性）ivregress liml lw s expr tenure rns smsa (iq=med kww),r *内生解释变量检验quietly reg lw s iq expr tenure rns smsaestimates store olsquietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww) estimates store ivhausman iv ols, constant sigmamoreestat endogenous （存在异方差的情形）*存在异方差情形下，GMM比2sls更有效率ivregress gmm lw s expr tenure rns smsa (iq=med kww)estat overidivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm*将各种估计方法的结果存储在一张表中quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww)estimates store gmmquietly ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmmestimates store igmmestimates table gmm igmm第八章短面板的stata命令及实例（1）面板数据的设定xtset panelvar timevarencode country,gen(cntry) （将字符型变量转化为数字型变量）xtdesxtsumxttab varnamextline varname,overlay*实例use traffic.dta,clearxtset state yearxtdesxtsum fatal beertax unrate state yearxtline fatal（2）混合回归reg y x1 x2 x3,vce(cluster id)如：reg fatal beertax unrate perinck,vce(cluster state)estimates store ols对比：reg fatal beertax unrate perinck（3）固定效应xtreg y x1 x2 x3,fe vce(cluster id)xi:reg y x1 x2 x3 i.id,vce(cluster id) （LSDV法）xtserial y x1 x2 x3,output （一阶差分法，同时报告面板一阶自相关）estimates store FD*双向固定效应模型tab year, gen (year)xtreg fatal beertax unrate perinck year2-year7, fe vce (cluster state)estimates store FE_TWtest year2 year3 year4 year5 year6 year7（4）随机效应xtreg y x1 x2 x3,re vce(cluster id) （随机效应FGLS）xtreg y x1 x2 x3,mle （随机效应MLE）xttest0 （在执行命令xtreg, re 后执行，进行LM检验）（5）组间估计量xtreg y x1 x2 x3,be（6）固定效应还是随机效应：hausman testxtreg y x1 x2 x3,feestimates store fextreg y x1 x2 x3,reestimates store rehausman fe re,constant sigmamore （若使用了vce(cluster id)，则无法直接使用该命令，解决办法详见P163）estimates table ols fe_robust fe_tw re be, b se （将主要回归结果列表比较）第九章长面板与动态面板（1）仅解决组内自相关的FGLSxtpcse y x1 x2 x3 ,corr(ar1) （具有共同的自相关系数）xtpcse y x1 x2 x3 ,corr(psar1) （允许每个面板个体有自身的相关系数）例题：use mus08cigar.dta,cleartab state,gen(state)gen t=year-62reg lnc lnp lnpmin lny state2-state10 t,vce(cluster state)estimates store OLSxtpcse lnc lnp lnpmin lny state2-state10 t,corr(ar1) (考虑存在组内自相关，且各组回归系数相同)estimates store AR1xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1) (考虑存在组内自相关，且各组回归系数不相同)estimates store PSAR1xtpcse lnc lnp lnpmin lny state2-state10 t, hetonly (仅考虑不同个体扰动性存在异方差，忽略自相关)estimates store HETONL Yestimates table OLS AR1 PSAR1 HETONL Y, b se（2）同时处理组内自相关与组间同期相关的FGLSxtgls y x1 x2 x3,panels (option/iid/het/cor) corr(option/ar1/psar1) igls注：执行上述xtpcse、xtgls命令时，如果没有个体虚拟变量，则为随机效应模型；如果加上个体虚拟变量，则为固定效应模型。

stata入门操作总结

stata入门操作总结Stata是一种流行的统计分析软件，可以用于数据管理、统计分析和绘图。

以下是一些Stata入门操作的总结：1. 数据导入和导出：使用`use`命令导入Stata数据文件（.dta 文件），使用`import delimited`命令导入CSV或其他格式的数据文件。

使用`save`命令将数据保存为Stata数据文件，使用`export delimited`命令将数据保存为CSV或其他格式的数据文件。

2. 数据清理和转换：使用`drop`命令删除变量或观察值，使用`rename`命令重新命名变量，使用`generate`命令创建新变量，使用`egen`命令计算聚合统计量。

使用`sort`命令对数据进行排序，使用`replace`命令替换变量的值。

3. 描述统计：使用`summarize`命令计算变量的均值、标准偏差和其他描述统计量，使用`tabulate`命令制表并计算分组统计量，使用`histogram`命令绘制直方图，使用`scatter`命令绘制散点图。

4. 统计分析：使用`regress`命令进行线性回归分析，使用`logit`命令进行二元logistic回归分析，使用`probit`命令进行二元probit回归分析，使用`anova`命令进行方差分析。

使用`ttest`命令进行均值差异检验，使用`chi2`命令进行卡方检验。

5. 绘图：使用`graph`命令绘制各种图形，如折线图、柱状图、散点图和箱形图。

使用`twoway`命令绘制多元图形，如多个线条、散点和拟合线。

6. 循环和条件：使用`forvalues`命令进行循环操作，使用`if`命令进行条件筛选。

使用`foreach`命令在多个变量上执行相同的操作。

以上是Stata入门操作的一些总结，但这只是一个基本的概述。

Stata功能非常强大，可以进行更复杂的数据管理和统计分析操作。

要更全面地了解Stata的功能和用法，建议参考Stata的官方文档或参加Stata的培训课程。

第一章 stata编程基础

STATA 从入门到精通
第一章 Stata概述概述
本章安排
在第一部分，我们向读者介绍的历史和特点，在第一部分，我们向读者介绍Stata的历史和特点，了解的历史和特点了解Stata的历史的历史和特点有助于读者在后续的学习中更好地领略Stata命令的特点。命令的特点。和特点有助于读者在后续的学习中更好地领略命令的特点第二部分向读者介绍Stata的使用界面，使读者对Stata的外观有一个的使用界面，使读者对第二部分向读者介绍的使用界面的外观有一个感性的认识。感性的认识。第三部分我们将向读者介绍Stata两个最基本的命令两个最基本的命令——help、第三部分我们将向读者介绍两个最基本的命令、 search命令。命令。命令第四部分将为大家介绍Stata的各种学习资源，Statalist的申请与退的各种学习资源，第四部分将为大家介绍的各种学习资源的申请与退便于读者在阅读完本书后可以进一步研究Stata的使用方法。的使用方法。订，便于读者在阅读完本书后可以进一步研究的使用方法
Page 6
STATA从入门到精通从入门到精通
本章结束，谢谢观看！本章结束，谢谢观看！
7
Page 3
STATA从入门到精通从入门到精通
1.2 Stata的使用界面的使用界面
视频介绍
Page 4
STATA从入门到精通从入门到精通
1.3 Stata命令命令——help、search命令命令、命令
help和search都是查找帮助文件的命令，它们之间的区别在于和都是查找帮助文件的命令，都是查找帮助文件的命令它们之间的区别在于help 用于查找精确的命令名，是模糊查找。用于查找精确的命令名，而search是模糊查找。如果你知道某个命令是模糊查找的名字，并且想知道它的具体使用方法，只须在Stata的命令行窗口的名字，并且想知道它的具体使用方法，只须在的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命空格加上这个名字。中输入空格加上这个名字令的帮助文件的全部内容。如果你想知道在Stata下做某个估计或某令的帮助文件的全部内容。如果你想知道在下做某个估计或某种计算，而不知道具体该如何实现，命令了。种计算，而不知道具体该如何实现，就需要用 search命令了。使用命令了的方法和help类似，只须把准确的命令名改成某个关键词。回车后结类似，的方法和类似只须把准确的命令名改成某个关键词。果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容，表中寻找最相关的内容，点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找，反复实验，通常可以较快地找到你需要的内容。助文件。耐心寻找，反复实验，通常可以较快地找到你需要的内容。

stata入门操作

（3）点击，执行后得到数学成绩说明：*号表示注释，不会执行，只为方便程序阅读
3.4 三种操作的相互关系，在不记得命令时可以采用菜单操作方式得到命令，
-2-
如不记得列示数据的命令，选择 data>>describe data>>list data 在结果窗口和命令回顾窗口都出现 list，此即命令名。击活命令回顾窗口，点右键选择 save review content 即可得到程序操作的命令。
姓名
性别
年龄
寝室号
班级
电子邮件
手机号
家乡省份
预期薪水
自己是否有 PC
室友是否有 PC
提示：使用 input 时，如果需录入中文名，用命令 str#表示后面的变量为字复型变量，#表示
有多少个字符。
input id str8 name str2 sex age dom class str30 email mobile str10 province salary
windowing preference (3)点击右上角的 X 号退出。
建议安装路径为： D: /stata8 。这是因为我们通常会将数据和程序存储于安装目录下，如果安装c 盘，一旦计算机出现意外故障，很可能导致我们存储在上面的数据无法恢复。
3．录入数据
3.1 菜单式操作：
任务：录入五个学生的学号和姓名
4.1 菜单式 Help>>stata command…
4.2 命令式 • help contents • help search • search anything you want • search search
4.3 几个主要的网站 (1) STATA公司官方网站 (2) STATA 资源链接 /links/resources.html (3) STATA出版社 (4) STATA电子杂志/ 获得文章的摘要/archives.html 获得程序net from / (5) STATA 技术公告版

stata第一章基本操作

save "D:\Teach课件\STATA\data\corgov99-00.dta ",replace
insheet using "D:\Teach课件\STATA\data\corgov0110.csv ",clear
append using "D:\Teach课件\STATA\data\corgov99-00.dta "
keep year topone，删除其它变量，只保留year和topone这两个变量
keep if year==2010，删除其它年度变量，只保留2010年的变量
rename，编辑变量名称
rename topone top1
label ，为变量名贴标签，以更容易理解
label var top1 "第一大股东持股比例"
save "D:\Teach课件\STATA\data\corgov9910.dta",replace
br
merge命令
数据表之间横向合并，追加新的变量
insheet using "D:\Teach课件\STATA\data\corgov.csv",clear sort stkcd year save "D:\Teach课件\STATA\data\corgov.dta",replace insheet using "D:\Teach课件\STATA\data\earning.csv",clear sort stkcd year merge stkcd year using "D:\Teach课件\STATA\data\corgov.dta" tab _merge(数值为1表示表一有，表二没有；2表示表二有表一没有；

stata入门操作总结

Stata入门操作总结
1. 导入数据：
方法一：点击文件选项，选择导入，根据数据类型选择即可。

方法二：进入数据编辑器界面，点击“文件”选择打开。

注意，该方式只能打开.dta文件，若数据量较小建议在Excel 中的打开，全选后复制，粘贴至数据编辑器中。

2. 修改变量标签：
在数据编辑器的属性窗口直接输入即可。

在命令窗口输入label variable 城市“city”，注意var后面的跟变量名称，即使是汉字也不需要加引号。

3. 检视数据：
输入命令describe（可简写为d）看数据集中变量名称、标签等。

若想看某几个变量的具体数据，则输入命令：list A B C。

也可通过逻辑关系来定义数据集子集，比如列出C变量大于等于10000的数据，则使用命令：list A C if C>=10000。

这里注意下其他表示关系的逻辑符号有“==”（等于）、“~=”（不等于，也可以用“！”）。

4. 进行假设检验：T检验（又称学生t检验）用于统计量服从正态分布，但方差未知的情况。

具体操作包括单样本t检验、独立样本t检验和配对样本t检验，分别用于检验总体方差未知、正态数据或近似正态的单样本均值是否与已知的总体均值相等，两对独立的正态数据或近似正态的样本的均值是否相等（可根据总体方差是否相等分类讨论），以及一对配对样本的均值的差是否等于某一个值。

以上是Stata入门操作总结，希望对您有所帮助。

stata 第一章基本操作

--
练习1.3
用stata打开corgov文件看看一共有多少家样本看看2010年一共有多少家样本
keep year topone，删除其它变量，只保留year和topone这两个变量
keep if year==2010，删除其它年度变量，只保留2010年的变量
rename，编辑变量名称
rename topone top1
label ，为变量名贴标签，以更容易理解
lab;
数据
试试browse,list,edit三个命令，看看三者的区别注意：上述命令也可以通过菜单的方式实现。
--
保存数据
菜单窗口
File/save File/save as(另存为)
命令窗口
save "D:\Teach课件\STATA\data\corgov.dta " save "D:\Teach课件\STATA\data\corgov.dta
--
Insheet：导入数据
通常数据来源于数据库下载，而不是手工录入导入格式
Stata不能直接支持很多格式（Excel files, SAS files）可以先保存为csv格式后再导入stata
准备工作：将Excel文件另存为csv格式，然后导入 csv文件。
菜单窗口
File/import/ASCII data created by spreadsheet /browse file name
",replace
replace的作用是，如果文件已存在，则替换注意stata格式文件的后缀为.dta
--
练习1.1
导入表名为earning的Excel格式数据检查数据保存数据为stata数据格式

stata操作介绍之基础部分(一)

利用Stata做统计分析时，官方提供的命令包并不一定能满足需求，因此许多研究者编写了大量的非官方命令包（包括.do文件、 .ado文件和帮助文件），使用此类非官方命令包之前需要对其进行安装。 Stata中有两个命令对于用户寻找与安装命令包相当有用：search 和findit。通过这两个命令可以找到相关搜索内容中有哪些额外的命令，点击链接后安装即可。
注意：
1.如果为某一变量输入的第一个值是一个数字，比如对人口、失业率和预期寿命这些变量，那么stata便会认为这一列是一个“数值变量”，从此
以后只允许数字作为取值。
2.如果为某一变量第一次输入的是非数值字符，比如像地名的输入（或者输入了带逗号的数字），那么stata会判断此列是字符串或文本变量。 3.在数据编辑器或数据浏览器中，字符串变量值显示为红色，这将其与数值变量（黑色）或加标签的数值变量（蓝色）区分开来。
术语 prefix command 含义命令前缀命令术语 using filename in range 含义使用的文件观察个案范围
varlist
= exp.
变量串
表达式条件表达式
weight
权重
选项
options
if exp.
• Stata常用命令及其缩写
命令或选项 list describe display summarize tabulate lable li des di, dis sum ta, tab lab 缩写含义列出变量描述分析展示变量统计摘要列表显示标签命令或选项 rename generate graph regress variable column ren gen, g gr reg var col 缩写含义重命名新建变量绘图回归变量列来自1.8 Stata窗口介绍

stata操作指南

计量经济学stata操作（实验课）第一章stata基本知识1、stata窗口介绍2、基本操作（1）窗口锁定：Edit-preferences-general preferences-windowing-lock splitter （2）数据导入（3）打开文件：use E:\example.dta,clear（4）日期数据导入：gen newvar=date(varname, “ymd”)format newvar %td 年度数据gen newvar=monthly(varname, “ym”)format newvar %tm 月度数据gen newvar=quarterly(varname, “yq”)format newvar %tq 季度数据（5）变量标签Label variable tc ` “total output” ’（6）审视数据describelist x1 x2list x1 x2 in 1/5list x1 x2 if q>=1000drop if q>=1000keep if q>=1000（6）考察变量的统计特征summarize x1su x1 if q>=10000su q,detailsutabulate x1correlate x1 x2 x3 x4 x5 x6（7）画图histogram x1, width(1000) frequencykdensity x1scatter x1 x2twoway (scatter x1 x2) (lfit x1 x2)twoway (scatter x1 x2) (qfit x1 x2)（8）生成新变量gen lnx1=log(x1)gen q2=q^2gen lnx1lnx2=lnx1*lnx2gen larg=(x1>=10000)rename larg largeg large=(q>=6000)replace large=(q>=6000)drop ln*（8）计算功能display log(2)（9）线性回归分析regress y1 x1 x2 x3 x4vce #显示估计系数的协方差矩阵reg y1 x1 x2 x3 x4,noc #不要常数项reg y1 x1 x2 x3 x4 if q>=6000reg y1 x1 x2 x3 x4 if largereg y1 x1 x2 x3 x4 if large==0reg y1 x1 x2 x3 x4 if ～largepredict yhatpredict e1,residualdisplay 1/_b[x1]test x1=1 # F检验，变量x1的系数等于1test (x1=1) (x2+x3+x4=1) # F联合假设检验test x1 x2 #系数显著性的联合检验testnl _b[x1]= _b[x2]^2（10）约束回归constraint def 1 x1+x2+x3=1cnsreg y1 x1 x2 x3 x4,c(1)cons def 2 x4=1cnsreg y1 x1 x2 x3 x4,c(1-2)（11）stata的日志File-log-begin-输入文件名log off 暂时关闭log on 恢复使用log close 彻底退出（12）stata命令库更新Update allhelp command第二章有关大样本ols的stata命令及实例（1）ols估计的稳健标准差reg y x1 x2 x3,robust（2）实例use example.dta,clearreg y1 x1 x2 x3 x4test x1=1reg y1 x1 x2 x3 x4,rtestnl _b[x1]=_b[x2]^2第三章最大似然估计法的stata命令及实例（1）最大似然估计help ml（2）LR检验lrtest #对面板数据中的异方差进行检验（3）正态分布检验sysuse auto #调用系统数据集auto.dtahist mpg,normalkdensity mpg,normalqnorm mpg*手工计算JB统计量sum mpg,detaildi (r(N)/6)*((r(skewness)^2)+[(1/4)*(r(kurtosis)-3)^2])di chi2tail(自由度，上一步计算值)*下载非官方程序ssc install jb6jb6 mpg*正态分布的三个检验sktest mpgswilk mpgsfrancia mpg*取对数后再检验gen lnmpg=log(mpg)kdensity lnmpg, normaljb6 lnmpgsktest lnmpg第四章处理异方差的stata命令及实例（1）画残差图rvfplotrvfplot varname*例题use example.dta,clearreg y x1 x2 x3 x4rvfplot # 与拟合值的散点图rvfplot x1 # 画残差与解释变量的散点图（2）怀特检验estat imtest,white*下载非官方软件ssc install whitetst（3）BP检验estat hettest #默认设置为使用拟合值estat hettest,rhs #使用方程右边的解释变量estat hettest [varlist] #指定使用某些解释变量estat hettest,iidestat hettest,rhs iidestat hettest [varlist],iid（4）WLSreg y x1 x2 x3 x4 [aw=1/var]*例题quietly reg y x1 x2 x3 x4predict e1,resgen e2=e1^2gen lne2=log(e2)reg lne2 x2,nocpredict lne2fgen e2f=exp(lne2f)reg y x1 x2 x3 x4 [aw=1/e2f]（5）stata命令的批处理（写程序）Window-do-file editor-new do-file#WLS for examplelog using E:\wls_example.smcl,replaceset more offuse E:\example.dta,clearreg y x1 x2 x3 x4predict e1,resgen e2=e1^2g lne2=log(e2)reg lne2 x2,nocpredict lne2fg e2f=exp(lne2f)*wls regressionreg y x1 x2 x3 x4 [aw=1/e2f]log closeexit第五章处理自相关的stata命令及实例（1）滞后算子/差分算子tsset yearl.l2.D.D2.LD.（2）画残差图scatter e1 l.e1ac e1pac e1（3）BG检验estat bgodfrey（默认p=1）estat bgodfrey,lags(p)estat bgodfrey,nomiss0（使用不添加0的BG检验）（4）Ljung-Box Q检验reg y x1 x2 x3 x4predict e1,residwntestq e1wntestq e1,lags(p)* wntestq指的是“white noise test Q”，因为白噪声没有自相关（5）DW检验做完OLS回归后，使用estat dwatson（6）HAC稳健标准差newey y x1 x2 x3 x4,lag(p)reg y x1 x2 x3 x4,cluster(varname)（7）处理一阶自相关的FGLSprais y x1 x2 x3 x4 （使用默认的PW估计方法）prais y x1 x2 x3 x4,corc （使用CO估计法）（8）实例use icecream.dta, cleartsset timegraph twoway connect consumption temp100 time, msymbol(circle) msymbol(triangle) reg consumption temp price incomepredict e1, resg e2=l.e1twoway (scatter e1 e2) (lfit e1 e2)ac e1pac e1estat bgodfreywntestq e1estat dwatsonnewey consumption temp price income, lag (3)prais consumption temp price income, corcprais consumption temp price income, nologreg consumption temp l.temp price incomeestat bgodfreyestat dwatson第六章模型设定与数据问题（1）解释变量的选择reg y x1 x2 x3estat ic*例题use icecream.dta, clearreg consumption temp price incomeestat icreg consumption temp l.temp price incomeestat ic（2）对函数形式的检验（reset检验）reg y x1 x2 x3estat ovtest （使用被解释变量的2、3、4次方作为非线性项）estat ovtest, rhs （使用解释变量的幂作为非线性项，ovtest-omitted variable test）*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat ovtestg lnq2=lnq^2reg lntc lnq lnq2 lnpl lnpk lnpfestat ovtest（3）多重共线性estat vif*例题use nerlove.dta, clearreg lntc lnq lnpl lnpk lnpfestat vif（4）极端数据reg y x1 x2 x3predict lev, leverage （列出所有解释变量的lev值）gsort –levsum levlist lev in 1/3*例题use nerlove.dta, clearquietly reg lntc lnq lnpl lnpk lnpfpredict lev, leveragesum levgsort –levlist lev in 1/3（5）虚拟变量gen d=(year>=1978)tabulate province, generate (pr)reg y x1 x2 x3 pr2-pr30（6）经济结构变动的检验方法1：use consumption_china.dta, cleargraph twoway connect c y year, msymbol(circle) msymbol(triangle)reg c yreg c y if year<1992reg c y if year>=1992计算F统计量方法2：gen d=(year>1991)gen yd=y*dreg c y d ydtest d yd第七章工具变量法的stata命令及实例（1）2SLS的stata命令ivregress 2sls depvar [varlist1] (varlist2=instlist)如：ivregress 2sls y x1 (x2=z1 z2)ivregress 2sls y x1 (x2 x3=z1 z2 z3 z4) ,r firstestat firststage,all forcenonrobust （检验弱工具变量的命令）ivregress liml depvar [varlist 1] (varlist2=instlist)estat overid （过度识别检验的命令）*对解释变量内生性的检验（hausman test），缺点：不适合于异方差的情形reg y x1 x2estimates store olsivregress 2sls y x1 (x2=z1 z2)estimates store ivhausman iv ols, constant sigmamore*DWH检验estat endogenous*GMM的过度识别检验ivregress gmm y x1 (x2=z1 z2) （两步GMM）ivregress gmm y x1 (x2=z1 z2),igmm （迭代GMM）estat overid*使用异方差自相关稳健的标准差GMM命令ivregress gmm y x1 (x2=z1 z2), vce (hac nwest[#])（2）实例use grilic.dta,clearsumcorr iq sreg lw s expr tenure rns smsa,rreg lw s iq expr tenure rns smsa,rivregress 2sls lw s expr tenure rns smsa (iq=med kww mrt age),restat overidivregress 2sls lw s expr tenure rns smsa (iq=med kww),r firstestat overidestat firststage, all forcenonrobust （检验工具变量与内生变量的相关性）ivregress liml lw s expr tenure rns smsa (iq=med kww),r*内生解释变量检验quietly reg lw s iq expr tenure rns smsaestimates store olsquietly ivregress 2sls lw s expr tenure rns smsa (iq=med kww)estimates store ivhausman iv ols, constant sigmamoreestat endogenous （存在异方差的情形）*存在异方差情形下，GMM比2sls更有效率ivregress gmm lw s expr tenure rns smsa (iq=med kww)estat overidivregress gmm lw s expr tenure rns smsa (iq=med kww),igmm*将各种估计方法的结果存储在一张表中quietly ivregress gmm lw s expr tenure rns smsa (iq=med kww)estimates store gmmquietly ivregress gmm lw s expr tenure rns smsa (iq=med kww),igmmestimates store igmmestimates table gmm igmm第八章短面板的stata命令及实例（1）面板数据的设定xtset panelvar timevarencode country,gen(cntry) （将字符型变量转化为数字型变量）xtdesxtsumxttab varnamextline varname,overlay*实例use traffic.dta,clearxtset state yearxtdesxtsum fatal beertax unrate state yearxtline fatal（2）混合回归reg y x1 x2 x3,vce(cluster id)如：reg fatal beertax unrate perinck,vce(cluster state)estimates store ols对比：reg fatal beertax unrate perinck（3）固定效应xtreg y x1 x2 x3,fe vce(cluster id)xi:reg y x1 x2 x3 i.id,vce(cluster id) （LSDV法）xtserial y x1 x2 x3,output （一阶差分法，同时报告面板一阶自相关）estimates store FD*双向固定效应模型tab year, gen (year)xtreg fatal beertax unrate perinck year2-year7, fe vce (cluster state)estimates store FE_TWtest year2 year3 year4 year5 year6 year7（4）随机效应xtreg y x1 x2 x3,re vce(cluster id) （随机效应FGLS）xtreg y x1 x2 x3,mle （随机效应MLE）xttest0 （在执行命令xtreg, re 后执行，进行LM检验）（5）组间估计量xtreg y x1 x2 x3,be（6）固定效应还是随机效应：hausman testxtreg y x1 x2 x3,feestimates store fextreg y x1 x2 x3,reestimates store rehausman fe re,constant sigmamore （若使用了vce(cluster id)，则无法直接使用该命令，解决办法详见P163）estimates table ols fe_robust fe_tw re be, b se （将主要回归结果列表比较）第九章长面板与动态面板（1）仅解决组内自相关的FGLSxtpcse y x1 x2 x3 ,corr(ar1) （具有共同的自相关系数）xtpcse y x1 x2 x3 ,corr(psar1) （允许每个面板个体有自身的相关系数）例题：use mus08cigar.dta,cleartab state,gen(state)gen t=year-62reg lnc lnp lnpmin lny state2-state10 t,vce(cluster state)estimates store OLSxtpcse lnc lnp lnpmin lny state2-state10 t,corr(ar1) (考虑存在组内自相关，且各组回归系数相同)estimates store AR1xtpcse lnc lnp lnpmin lny state2-state10 t,corr(psar1) (考虑存在组内自相关，且各组回归系数不相同)estimates store PSAR1xtpcse lnc lnp lnpmin lny state2-state10 t, hetonly (仅考虑不同个体扰动性存在异方差，忽略自相关)estimates store HETONL Yestimates table OLS AR1 PSAR1 HETONL Y, b se（2）同时处理组内自相关与组间同期相关的FGLSxtgls y x1 x2 x3,panels (option/iid/het/cor) corr(option/ar1/psar1) igls注：执行上述xtpcse、xtgls命令时，如果没有个体虚拟变量，则为随机效应模型；如果加上个体虚拟变量，则为固定效应模型。

Stata教程

Stata教程编辑整理：尊敬的读者朋友们：这里是精品文档编辑中心，本文档内容是由我和我的同事精心编辑整理后发布的，发布之前我们对文中内容进行仔细校对，但是难免会有疏漏的地方，但是任然希望（Stata教程）的内容能够给您的工作和学习带来便利。

同时也真诚的希望收到您的建议和反馈，这将是我们进步的源泉，前进的动力。

本文可编辑可修改，如果觉得对您有帮助请收藏以便随时查阅，最后祝您生活愉快业绩进步，以下为Stata教程的全部内容。

第一章 Stata 概貌§1。

1 Stata的功能、特点和背景Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心（Computer Resource Center）研制。

从1985至1998的十四年时间里，已连续推出1.1，1.2，1.3，1.4，1。

5，……及2.0，2.1，3.0，3。

1，4.0，5.0，6.0等多个版本，通过不断更新和扩充，内容日趋完善。

它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点，又在许多方面别具一格.Stata融汇了上述程序的优点，克服了各自的缺点，使其功能更加强大，操作更加灵活、简单,易学易用,越来越受到人们的重视和欢迎。

Stata的突出特点是只占用很少的磁盘空间，输出结果简洁,所选方法先进，内容较齐全，制作的图形十分精美，可直接被图形处理软件或字处理软件如WORD等直接调用。

一、 Stata的数据管理能力1.Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响.对640k内存的微机,3.1版本的Stata可以管理2400个记录×99个变量,并随计算机扩展内存的增加而增加；对4.0的WINDOWS版本,Stata可以管理4800个记录×99个变量；对WINDOWS 95下的5。

0版本,可根据计算机的配置情况设置变量数和记录数，如32M扩展内存的计算机,可处理2千万个数据.变量数和记录数可以互相交易（trade），即减少记录数可以增加变量数，减少变量数可以增加记录数。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

练习1.1
导入表名为earning的Excel格式数据检查数据保存数据为stata数据格式
1.2编辑数据
打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear drop命令，删除变量或观察值
drop if year==2010，删除所有2010年的变量 drop year，删除year这个变量 drop _all，删除所有变量
为什么要加clear，原因是：
你必须先清除(clear)原来的数据，才能导入新的数据你也可以先用drop _all 删除原有数据，然后导入新的数据
பைடு நூலகம்
检查数据
describe ，list，browse，edit
导入数据之后，你可以检查一下数据是否导入成功，有好几种方式可以帮到你：
在命令窗口输入describe 或 d ，将显示样本、变量数、数据大小及变量的详细信息。
keep if year==2010，删除其它年度变量，只保留2010年的变量
rename，编辑变量名称
rename topone top1
label ，为变量名贴标签，以更容易理解
label var top1 "第一大股东持股比例"
clear，清空所有数据
练习1.２
打开stata数据删除private变量只保留stkcd year两个变量删除2008年的数据只保留2010年的数据将year变量改名为y 将y的标签设置为年度
1.3描述数据
count，看看有多少样本
count count if year==2008
summary or sum，描述样本的统计量
sum topone ，描述topone变量最基本统计量，均值、方差、最小值、最大值
sum topone, d，描述topone变量更为详细的统计量，包括偏度、峰度、分位数。
tabulate或tab，描述离散变量的基本统计量
tab private，描述private变量为0和1的百分比
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
然后试试以下两个的差别:
insheet using "D:\Teach课件\STATA\data\corgov.csv " insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
宋顺林中央财经大学会计学院
内容提纲
1.1导入数据 1.2编辑数据 1.3描述数据 1.4结果和程序管理 1.5多表数据管理
1.1 导入数据
打开Stata软件
STATA由四个窗口构成
Review (列出历史命令) Variables (变量列表) Results (报告结果) Command (输入命令)
输入入list，显示所有样本数据，试试以下命令： list in 1 list in 2/10
输入browse 或br，在数据窗口浏览所有数据输入edit，不仅可以数据窗口浏览数据，而且可以编辑和修改数
据
试试browse,list,edit三个命令，看看三者的区别注意：上述命令也可以通过菜单的方式实现。
你可以通过下列菜单调整窗口设置
Edit/preferences Window/command, variables ……
display 命令
在命令窗口输入:
display 1 display "song"
试试以下两者的区别：
display "1+1" display 1+1
Help 命令
菜单窗口
help/pdf document （Stata基本参考手册） help/content （Stata所有命令介绍） help/stata command （搜索查询Stata命令）
命令窗口
help + stata 命令，例如： help display help help 另外，你也可以利用search命令寻求帮助，例如： search display search help
Insheet：导入数据
通常数据来源于数据库下载，而不是手工录入导入格式
Stata不能直接支持很多格式（Excel files, SAS files）可以先保存为csv格式后再导入stata
准备工作：将Excel文件另存为csv格式，然后导入 csv文件。菜单窗口
File/import/ASCII data created by spreadsheet /browse file name
注意：stata值的等号全为双等号，单等号是赋值命令，在以后的操作中，注意=号和==号的区别。

打开stata数据 use "D:\Teach课件\STATA\data\corgov.dta",clear keep命令是drop命令的反向命令
keep year topone，删除其它变量，只保留year和topone这两个变量
命令窗口
insheet using "D:\Teach课件\STATA\data\corgov.csv ",clear
在知道文件路径的情况下，往往使用insheet命令更为方便对insheet了解更多, pls help insheet
drop _all and clear
首先导入数据
保存数据
菜单窗口
File/save File/save as(另存为)
命令窗口
save "D:\Teach课件\STATA\data\corgov.dta " save "D:\Teach课件\STATA\data\corgov.dta ",replace
replace的作用是，如果文件已存在，则替换注意stata格式文件的后缀为.dta

stata-第一章-基本操作

合集下载

Stata入门

Stata软件基本操作和数据分析入门

Stata教程(免费)

Stata软件应用1---【Stata软件基本操作】

教你快速上手使用Stata进行数据处理和分析

STATA软件操作(一)基础数据处理

stata操作指南

stata入门操作总结

第一章 stata编程基础

stata入门操作

stata第一章基本操作

stata入门操作总结

stata 第一章基本操作

stata操作介绍之基础部分(一)

stata操作指南

Stata教程

文档推荐

最新文档

stata-第一章-基本操作

合集下载

Stata入门

Stata软件基本操作和数据分析入门

Stata教程(免费)

Stata软件应用1---【Stata软件基本操作】

教你快速上手使用Stata进行数据处理和分析

STATA软件操作(一)基础数据处理

stata操作指南

stata入门操作总结

第一章 stata编程基础

stata入门操作

stata第一章基本操作

stata入门操作总结

stata 第一章 基本操作

stata操作介绍之基础部分(一)

stata操作指南

Stata教程

文档推荐

最新文档

stata 第一章基本操作