当前位置：文档之家› STATA 学习入门必须知道的基础

STATA 学习入门必须知道的基础

作者：量化研究方法

关于Stata软件，我经常会被人问道：“你知道它到底能做什么吗？”那我们今天就带大家来了解一下这门当下热门的软件究竟的用处是什么？

1 关于Stata，这些基础的东西你必须要知道

很长一段时间里，我一直把“Stata”读为“Stay-ta”。有一次和一个从日本回来的朋友聊天，她把Stata读为“Star-ta”，让我甚感不适。经查阅，方才发现，原来“Stata”并非数个单词的缩写（因此其正确拼写为Stata 而非STATA），而是由“statistics”和“data”合成的一个新词。从这个小小的趣闻中，可以看出Stata 在问世之初（1985年）的主要功能在于统计分析和数据处理。经历了三十余年的发展，Stata 已经升级到第15版，在不断强化上述功能的同时，Stata在矩阵运算、绘图、编程等方面的功能也在不断加强。Stata 擅长数据处理、面板数据分析、时间序列分析、生存分析，以及调查数据分析，但其它方面的功能也并不逊色。（表1）

2为何选择Stata？

这是个不太容易回答的问题。Stata网站列举了数条可能的原因。Edwards(2005)曾经非常细致地对比了Stata,SPSS和SAS的优劣。Princeton大学的Torres-Reyna博士则将四种常用软件的特征总结为表2。整体而言，Stata具有较强的优势。

3 弱水三千，我为何钟情于Stata？

就我个人的经历而言，如下几个原因使我自2003年以来一直钟情于Stata。

Stata的数据处理功能很强大。由于将数据导入内存后进行运算，其速度非常快。在多个数据文件的合并和追加，以及文字资料、时序资料，以及调查资料的处理方面，Stata 总能以极为简洁的命令完成分析。

自Stata12 发布以来，官方命令能快捷地导入导出文本(txt)和Excel(xls,xlsx)格式的数据文件。若进一步借助Stat/Transfer 软件，我们可以非常方便地实现不同软件数据格式的转换，如Excel, Access, SPSS, SAS, Eviews,Gauss, Limdep, S-Plus, R等。

我是做公司财务的，每年5月，在GTA、CCER、Wind 等数据库提供商提供了最新的数据后，我也需要更新自己的Stata 数据库（我把这些数据库提供的几十个子库合并为一个名为“Arlion_data.dta”的Stata数据文件，并与我的合作者们分享）。

借助Stata 的数据处理功能，我只需在上一年度已经完成的do-files 中稍作修改即可完成数据的更新工作。整个过程仅需2天的时间。我无法想象，如果没有Stata提供的merge、append、forvalues等命令，这个数据更新的过程将会有多么痛苦。

Stata 的do-files 带来的便利。我很少点击Stata 的菜单，也很少在命令窗口中输入命令，我使用do-files（当然，每天要在这个窗口中敲入几十次help 命令）。简单而言，Stata 的do-files 只是一个包含了多行Stata命令的文本文件而已（[U]16Do-files,Long(2009)）。有些时候，要完成一篇文章的数据处理过程需要数周的时间，do-files就显得格外重要，它使得我们很容易对此前的处理过程进行修改。更为重要的是，后续文章都可以在这个do-files 的基础上扩展。我与搭档合作时，每天只需通过电子邮件发送只有几k大小的do-file即可；而我的学生们则可以通过do-files 重现我上课时讲解的每一个估计命令；很多学生的第一篇实证分析的论文都是在我已经完成的do-files 基础上完成的。

Stata 绘制的图形非常精美。这也为回归分析提供了一种可视化的分析工具，自Stata10发布以来，Stata增加了图形编辑、多种字体支持，以及数学符号支持等功能。3Stata 可以输出十余种图片格式，可以非常方便地插入Word、LaTeX等文字排版软件。即使采用点击鼠标的方式绘制图形，Stata 也会自动生成命令代码，为图形的修改提供了极大的便利。

Stata 在编程方面提供了良好的平台。比如，做非线性最小二乘(NLS)、最大似然估计(MLE)、广义矩估计(GMM)，只需要设定函数形式，编写一些简单的程序即可完成，至于数值算法等比较复杂的技术问题，Stata都已帮你做好了。

例如，我完成的第一篇实证分析的论文便是以NLS为基础的，随后，我又采用MLE 完成了异质性随机边界模型（和双边随机边界模型）的估计。自Stata11发布以来，GMM 的实现

也变得非常简单了，你只需设定残差方程、指定工具变量，并选择何时得权重矩阵即可完成估计。

Stata 具有良好的扩展性。Stata具有自己的编程语言，其所有命令都对应着一个以“.ado”为后缀的同名程序文件。对于Stata 用户而言，我们可以使用viewsource 或doedit 命令查看这些程序的代码。更为重要的是，我们可以非常方便地自行编写命令，以实现对Stata 官方命令的补充和扩展。这种特殊的扩展功能赋予了Stata 用户极大的灵活性，我们可以用findit命令下载到大量的外部命令，以便适时跟进最新的统计方法。这同时也推动了Stata自身的发展，例如，Stata 用户开发出的可绘制地图的命令tamp,spmap,china_map 等就是一个很好的例证；由DavidRoodman 编写的xtabond2 命令则被Stata11 设定为估计动态面板模型的官方命令（xtdpd, xtdpdsys）；同样，由F.Bornhorstand C.F.Baum 编写的ipshin、levinlin 命令，C.F. Baum 编写的hadrilm 命令，以及S. Merryman 编写的xtfisher 等用于执行面板单位根检验的命令都被Stata11设定为官方命令xtunitroot。饮水思源，我自己也贡献了xtbalance等命令。若想发布自己编写的Stata 命令，只需发邮件给波士顿大学的C.F. Baum 教授即可。

最后，从我身边这些老师和朋友的经验来看，Stata受到了越来越多的关爱。我的导师使用Gauss十年有余，在2001年接触Stata 后，毅然改用Stata。还有很多国外的朋友，基本上都在使用Stata。当越来越多的人开始使用Stata 时，我们的交流成本会迅速下降。

当然，软件本身并无好还之分，只是一个习惯的问题。关键的问题还是对统计和计量理论的掌握，这是决定你是否能驾驭软件的关键。

4 Stata并不完美，但她正在趋近完美。

诚如MacStats网站的评价，Stata 结果似乎无法像SPSS或Eviews 那样非常美观地输出（或粘贴）到Word/Excel 文档中。然而，得益于广大Stata 用户的努力，这不再是个问题，我们可以使用tabout (Watson(2007)), esttab (Jannand Long(2010)), logout,outreg2 (Jann(2005),Jann(2007)), xml_tab (Lokshin andSajaia(2008)) 等命令非常方便的把Stata 结果输出到Excel,Word, LaTeX和HTML (Gini andPasquini(2006)) 等文件中。连玉君博士制作的视频文件Stata 与Word、Excel、LaTeX的亲密接触非常细致地介绍了这一主题。他的另一份文档Stata与LaTeX 的完美结合则较为全面的介绍了如何将Stata 结果输出到LaTeX。

在早期版本中，Stata 的do-files编辑器过于简单。Stata11发布后，其do-files 编辑器已然从灰姑娘变成了白雪公主，具有了语法高亮显示、结构代码折叠、书签设定等功能，而且，对于书写大型do-files 的用户而言，命令的行数也不再受到任何限制。对于中文用户而言，只需稍作调整，即可获得很好的显示效果。

Stata9以前的版本无法对图形进行二次编辑，且图形中的可供选择的字体也非常有限。自从Stata10 和Stata11发布以来，这两个问题得到了很好的解决。图形中的文字可以是粗体、斜体，亦可包含多种数学符号；在用户手动编辑图形时，相应的命令会自动显示在屏幕上，进而用于处理其他类似的图形。

不同于SAS等从硬盘上读取数据的统计软件，Stata将数据调入内存后执行运算的，这使得其运算速度非常快。然而，对于经常处理高频数据和大型调查数据的用户而言，Stata 的这种运算机制反而成了其缺陷——它能够处理的数据量受限于计算机的内存容量。虽然在既有的多个Stata 版本中，Stata11家族中进一步增加了Stata/MP，使其在配有多核处理器的计算机中运算速度进一步得到提升，但数据容量的限制问题仍然未能得到实质性的改进。

5 我如何学习 Stata？

我经常会被问到“Stata 好学吗”、“我多长时间能学会Stata”，诸如此类的问题。诚然，相比于SPSS 和Eviews等软件，Stata 的门槛的确要高一些。然而，问题的关键并不在于Stata 本身有多么难学，而在于你在统计和计量方面花费了多少时间，这与学习Stata 所需的时间显著负相关。因此，我的回答往往会是：“哦，这个不好说，如果……，其实很简单……”。

相比于十年前，现在学习Stata 的资料已经非常丰富了。虽说殊途同归，但不同的学习路径却存在着巨大的效率差异。对于初学者而言，我的建议是，首要的问题是知道“Stata 能做什么”，继而才是“Stata 如何做什么”。

STATA面板数据模型操作命令要点

STATA 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令 εαβit ++=x y it i it 固定效应模型 μβit +=x y it it ε αμit +=it it 随机效应模型（一）数据处理输入数据 ●tsset code year 该命令是将数据定义为“面板”形式 ●xtdes 该命令是了解面板数据结构 ●summarize sq cpi unem g se5 ln 各变量的描述性统计（统计分析） ●gen lag_y=L.y /////// 产生一个滞后一期的新变量

gen F_y=F.y /////// 产生一个超前项的新变量 gen D_y=D.y /////// 产生一个一阶差分的新变量 gen D2_y=D2.y /////// 产生一个二阶差分的新变量（二）模型的筛选和检验 ●1、检验个体效应（混合效应还是固定效应）（原假设：使用OLS混合模型）●xtreg sq cpi unem g se5 ln,fe 对于固定效应模型而言，回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000，检验结果表明固定效应模型优于混合OLS模型。 ●2、检验时间效应（混合效应还是随机效应）（检验方法：LM统计量）（原假设：使用OLS混合模型） ●qui xtreg sq cpi unem g se5 ln,re (加上“qui”之后第一幅图将不会呈现) xttest0

可以看出，LM检验得到的P值为0.0000，表明随机效应非常显著。可见，随机效应模型也优于混合OLS模型。 ●3、检验固定效应模型or随机效应模型（检验方法：Hausman检验）原假设：使用随机效应模型（个体效应与解释变量无关）通过上面分析，可以发现当模型加入了个体效应的时候，将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣，这需要进行接下来的检验，如下： Step1：估计固定效应模型，存储估计结果 Step2：估计随机效应模型，存储估计结果 Step3：进行Hausman检验 ●qui xtreg sq cpi unem g se5 ln,fe est store fe qui xtreg sq cpi unem g se5 ln,re est store re hausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出，hausman检验的P值为0.0000，拒绝了原假设，认为随机效应模型的基本假设得不到满足。此时，需要采用工具变量法和是使用固定效应模型。

[推荐] stata基本操作汇总常用命令

[推荐] Stata基本操作汇总——常用命令 help和search都是查找帮助文件的命令，它们之间的区别在于help用于查找精确的命令名，而search是模糊查找。如果你知道某个命令的名字，并且想知道它的具体使用方法，只须在stata的命令行窗口中输入help空格加上这个名字。回车后结果屏幕上就会显示出这个命令的帮助文件的全部内容。如果你想知道在stata下做某个估计或某种计算，而不知道具体该如何实现，就需要用search命令了。使用的方法和help类似，只须把准确的命令名改成某个关键词。回车后结果窗口会给出所有和这个关键词相关的帮助文件名和链接列表。在列表中寻找最相关的内容，点击后在弹出的查看窗口中会给出相关的帮助文件。耐心寻找，反复实验，通常可以较快地找到你需要的内容.下面该正式处理数据了。我的处理数据经验是最好能用stata的do文件编辑器记下你做过的工作。因为很少有一项实证研究能够一次完成，所以，当你下次继续工作时。能够重复前面的工作是非常重要的。有时因为一些细小的不同，你会发现无法复制原先的结果了。这时如果有记录下以往工作的do文件将把你从地狱带到天堂。因为你不必一遍又一遍地试图重现做过的工作。在stata 窗口上部的工具栏中有个孤立的小按钮，把鼠标放上去会出

现“bring do-file editor to front”，点击它就会出现do文件编辑器。为了使do文件能够顺利工作，一般需要编辑do文件的“头”和“尾”。这里给出我使用的“头”和“尾”。capture clear （清空内存中的数据）capture log close （关闭所有打开的日志文件）set more off （关闭more选项。如果打开该选项，那么结果分屏输出，即一次只输出一屏结果。你按空格键后再输出下一屏，直到全部输完。如果关闭则中间不停，一次全部输出。）set matsize 4000 （设置矩阵的最大阶数。我用的是不是太大了？）cd D: （进入数据所在的盘符和文件夹。和dos的命令行很相似。）log using （文件名）.log,replace （打开日志文件，并更新。日志文件将记录下所有文件运行后给出的结果，如果你修改了文件内容，replace选项可以将其更新为最近运行的结果。）use （文件名）,clear （打开数据文件。）（文件内容）log close （关闭日志文件。）exit,clear （退出并清空内存中的数据。）实证工作中往往接触的是原始数据。这些数据没有经过整理，有一些错漏和不统一的地方。比如，对某个变量的缺失观察值，有时会用点，有时会用-9，-99等来表示。回归时如果使用这些观察，往往得出非常错误的结果。还有，在不同的数据文件中，相同变量有时使用的变量名不同，会给合并数

5分钟速学stata面板数据回归(初学者超实用!)

5分钟速学stata面板数据回归（超实用！）第一步：编辑数据。面板数据的回归，比如该回归模型为：Y it=β0+β1X1it+β2X2it+β3X3it+εt，在stata中进行回归，需要先将各个变量的数据逐个编辑好，该模型中共有Y X1 X2 X3三个变量，那么先从Y的数据开始编辑，将变量Y的面板数据编辑到stata软件中，较方便的做法是，将excel的数据直接复制到stata软件的数据编辑框中，而excel中的数据需要如下图编辑：从数据的第二行开始选中20个样本数据，如图：

直接复制粘贴至stata中的data editor中，如图: 第二步：格式调整。首先，请将代表样本的var1Y变量数据是选20个省份5年的数据为样本，那么口令为rename var1 province 。例如：本例中的Y变量数据编辑接下来需要输入口令为reshape long var,i(province) 其中，var代表的是所有的年份（var2,var3,var4,var5,var6），转化后格式如图：转化成功后，继续重命名，其中_j这里代表原始表中的年份，var代表该变量的名称

例如，我们编辑的是Y变量的数据，所以口令3和口令4的输入如下：口令3：rename _j year 口令4：rename var taxi （注：taxi就是Y变量，我们用taxi表示Y）命名完，数据编辑框如下图所示。第三步：排序。例如，本例中的Y变量（taxi），是20个省份和5年的面板数据，那么口令4为sort province year （虽意思是将province按升序排列，然后再根据排好的province数列排year这一列升序排列。然很多时候在执行sort之前，数据已经符合排序要求了，但为以防万一，请务必执行此操作）第三步：保存。

Stata操作入门(中文)

第一讲Stata操作入门第一节概况 Stata最初由美国计算机资源中心（Computer Resource Center）研制，现在为Stata公司的产品，其最新版本为7.0版。它操作灵活、简单、易学易用，是一个非常有特色的统计分析软件，现在已越来越受到人们的重视和欢迎，并且和SAS、SPSS一起，被称为新的三大权威统计软件。 Stata最为突出的特点是短小精悍、功能强大，其最新的7.0版整个系统只有10M左右，但已经包含了全部的统计分析、数据管理和绘图等功能，尤其是他的统计分析功能极为全面，比起1G以上大小的SAS系统也毫不逊色。另外，由于Stata在分析时是将数据全部读入内存，在计算全部完成后才和磁盘交换数据，因此运算速度极快。由于Stata的用户群始终定位于专业统计分析人员，因此他的操作方式也别具一格，在Windows席卷天下的时代，他一直坚持使用命令行／程序操作方式，拒不推出菜单操作系统。但是，Stata的命令语句极为简洁明快，而且在统计分析命令的设置上又非常有条理，它将相同类型的统计模型均归在同一个命令族下，而不同命令族又可以使用相同功能的选项，这使得用户学习时极易上手。更为令人叹服的是，Stata语句在简洁的同时又拥有着极高的灵活性，用户可以充分发挥自己的聪明才智，熟练应用各种技巧，真正做到随心所欲。除了操作方式简洁外，Stata的用户接口在其他方面也做得非常简洁，数据格式简单，分析结果输出简洁明快，易于阅读，这一切都使得Stata成为非常适合于进行统计教学的统计软件。 Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件（ADO文件），这些文件可以自行修改、添加和下载。用户可随时到Stata网站寻找并下载最新的升级文件。事实上，Stata的这一特点使得他始终处于统计分析方法发展的最前沿，用户几乎总是能很快找到最新统计算法的Stata程序版本，而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。由于以上特点，Stata已经在科研、教育领域得到了广泛应用，WHO的研究人员现在也把Stata作为主要的统计分析工作软件。第二节Stata操作入门一、Stata的界面图1即为Stata 7.0启动后的界面，除了Windows版本的软件都有的菜单栏、工具栏，状态栏等外，Stata的界面主要是由四个窗口构成，分述如下： 1．结果窗口位于界面右上部，软件运行中的所有信息，如所执行的命令、执行结果和出错信息等均在这里列出。窗口中会使用不同的颜色区分不同的文本，如白色表示命令，红色表示错误信息。

stata入门教程

Stata 快速入门 1、Stata的窗口 ?在最上方有一排菜单，即“File Edit Data Graphics Statistics User Window Help”。?左上“Review”（历史窗口）：此窗口记录着自启动Stata以来执行过的命令。?右上“Variables”（变量窗口）：此窗口记录着目前Stata内存中的所有变量。?正上方“Results”（结果窗口）：此窗口显示执行Stata命令后的输出结果。 ?正下方“Command”（命令窗口）：在此窗口输入想要执行的Stata命令。 2、将数据导入Stata ?打开Stata软件后，点击Data Editor(Edit)图标（也可以点击菜单“Window”→“Data Editor”），即可打开一个类似Excel的空白表格。 ?用Excel打开文件“nerlove.xls”，复制文件中的所有数据，并粘贴到Data Editor 中。 ?导入数据的另一方法是，点击菜单“File”→“Import”，然后导入各种格式的数据。但这种方法有时不如直接从Excel表中粘贴数据来得方便直观。 3、变量窗口 ?关闭Data Editor后，即会看到右上方的“Variables”窗口出现了5个变量：?分别为tc（total cost，总成本），q（total output, 总产量），pl（price of labor，小时工资率），pf（price of fuel，燃料价格），与pk（user cost of capital，资本的租赁价格。 4、存为dta数据文件 ?此时，可以点击Save图标（也可以点击菜单“File”→“Save”），将数据存为Stata格式的文件（扩展名为dta），比如nerlove.dta。 ?以后就可以用Stata直接打开这个数据集了（不需要再从Excel表中粘贴过来）。 5、打开dta数据文件打开的方式有三种： 1.点击Open图标（也可以点击菜单“File”→“Open”），然后寻找要打开的dta 文件的位置。 2.直接双击想要打开的dta文件 3.在命令窗口输入以下命令（假设文件在E盘的根目录）并回车（按Enter键）

1 STATA入门

1 STATA入门 Stata统计软件包是目前世界上最著名的统计软件之一，与SAS、SPSS一起被并称为三大权威软件。它广泛的应用于经济、教育、人口、政治学、社会学、医学、药学、工矿、农林等学科领域，同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点，几乎可以完成全部复杂的统计分析工作。其功能非常强大且操作简单、使用灵活、运行速度极快，在许多方面别具一格，而且操作灵活简单，易学易用。 Stata的命令语句极为简洁明快，而且在统计分析命令的设置上又非常有条理，它将相同类型的统计模型均归在同一个命令族下，而不同命令族又可以使用相同功能的选项，这使得用户学习时极易上手。Stata语句在简洁的同时又拥有着极高的灵活性，用户可以充分发挥自己的聪明才智，熟练应用各种技巧，真正做到随心所欲。尽管它也提供了窗口菜单式的操作方式，但强烈建议大家坚持使用命令行／程序操作方式，很快你就会体会到使用程序和命令方式所带来的那种随心所欲自由地处理和分析数据的快感。 Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件（ADO文件），这些文件可以自行修改、添加和下载。用户可随时到Stata网站寻找并下载最新的升级文件。这一特点使得STATA始终处于统计分析方法发展的最前沿，用户几乎总是能很快找到最新统计算法的Stata程序版本，而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。 STATA由美国计算机资源中心（Computer Resource Center）研制，现为STATA 公司的产品。从1985至2007的二十多年时间里，已连续推出1.1，1.2，…,7.0，8.0，9.0，10.0等多个版本。我们将要学习的是9.0版本。 1安装 (1) https://www.doczj.com/doc/e812627130.html,/bbs/dispbbs.asp?boardID=67&ID=97705&page=2 上有stata9.rar下载，但是做正式的论文或工作还是应该尽量用正版软件。 (2)将其解压到D:/stata9。 (3)点击setup安装>>改变安装路径到D:/stata8>>选择Stata/SE版本。 1.2启用和退出 (1) 程序→Stata，即可进入Stata，启动后出现文件对话框，要求输入注册单位和密码等。

Stata软件学习者应该收藏的学习资源

此软文主要面向讲师和做科研的人员，建议发布在此类人员关注的互动性强的网站 Stata软件学习者应该收藏的学习资源 ---- Stata牛人的学习笔记分享（转帖）前言：小弟小本，非统计专业科班出身，参加工作才知道原来学的统计知识不够用，在头儿的刺激下开始学习统计软件，计量知识薄弱，为了理清一堆模型，在各经济论坛潜水多时，水平没见涨，倒是收集了不少学习资料。这里转一篇Stata牛人前辈的笔记分享，供广大奋战在软件学习道路上的同学参考+瞻仰正文如下：我经常会被问到“Stata好学吗”、“我多长时间能学会Stata”，诸如此类的问题。诚然，相比于SPSS和Eviews等软件，Stata的门槛的确要高一些。然而，问题的关键并不在于Stata本身有多么难学，而在于你在统计和计量方面花费了多少时间，这与学习Stata所需的时间显著负相关。因此，我的回答往往会是：“哦，这个不好说，如果……，其实很简单……”。相比于十年前，现在学习Stata的资料已经非常丰富了。虽说殊途同归，但不同的学习路径却存在着巨大的效率差异。对于初学者而言，我的建议是，首要的问题是知道“Stata能做什么”，继而才是“Stata如何做什么”。第一个问题之所以重要，是因为从本质上讲，Stata只是我们完成统计分析的工具而已，因此，其基本平台是否宽广、是否有扩展潜力，以及它提供的分析工具是否能满足你的专业需求，都是你在选择Stata之前需要深入了解的。Stata User’s Guide（400页，中文）对这些问题做出了很好的解答，是一幅绝佳的导航图，能帮助你在短时间内了解Stata的基本架构、语法特征和核心功能。对于第二个问题，则有众多的资料可供参考： (1)网络资源我精选了一些链接。值得一提的有如下几个： ●Stata官方网站。Stata公司提供的Web resources，涵盖了大量相关网络资源；其FAQ则提供了各种常见问题的解答；Statalist则是一个类似于人大经济论坛的免费的讨论区。加入Statalist的方法很简单，你只需要发送邮件至 majordomo@https://www.doczj.com/doc/e812627130.html,，邮件内容无需任何称谓，只需写上“subscribe Statalist”的字样即可。接到确认信息后，你便成为一名Statalist的成员了。当然，即使不加入，你仍然可以浏览，但不能提问。 ●UCLA(加州大学洛杉矶分校)提供的网络教程。该网站提供的Data Management、

计量经济学stata操作指南

计量经济学stata操作（实验课）第一章stata基本知识 1、stata窗口介绍 2、基本操作（1）窗口锁定：Edit-preferences-general preferences-windowing-lock splitter （2）数据导入（3）打开文件：use E:\example.dta,clear （4）日期数据导入： gen newvar=date(varname, “ymd”) format newvar %td 年度数据 gen newvar=monthly(varname, “ym”) format newvar %tm 月度数据 gen newvar=quarterly(varname, “yq”) format newvar %tq 季度数据（5）变量标签 Label variable tc ` “total output” ’ （6）审视数据 describe list x1 x2 list x1 x2 in 1/5 list x1 x2 if q>=1000 drop if q>=1000 keep if q>=1000 （6）考察变量的统计特征 summarize x1 su x1 if q>=10000 su q,detail su tabulate x1 correlate x1 x2 x3 x4 x5 x6 （7）画图 histogram x1, width(1000) frequency kdensity x1 scatter x1 x2 twoway (scatter x1 x2) (lfit x1 x2) twoway (scatter x1 x2) (qfit x1 x2) （8）生成新变量 gen lnx1=log(x1) gen q2=q^2 gen lnx1lnx2=lnx1*lnx2 gen larg=(x1>=10000) rename larg large

STATA高级视频教程简介(连玉君)

STATA高级视频教程简介培训目的： STATA高级视频教程的目的是使学员熟练使用STATA进行实证分析工作，主要包括： (1) 掌握多种常用的估计方法（如普通最小二乘法、广义最小二乘法、非线性最小二乘法、最大似然估计、IV估计和GMM）； (2) 学会估计和分析时间序列和面板数据常用模型（如单位根检验、协整分析、VAR、固定效应模型、随机效应模型、动态面板模型、面板单位根检验和面板协整分析等等）； (3) 学会编写一个完整的STATA程序； (4) 学会应用STATA进行抽样和模拟分析，包括Bootstrap和Monte Carlo 模拟分析。课程简介：（详见课程目录） STATA高级视频教程共9讲，共48个视频文件，总计50余个学时。第1-5讲介绍计量经济学中最为常用的五种估计方法，包括：普通最小二乘法（OLS）、广义最小二乘法（GLS）、非线性最小二乘法（NLS）、最大似然法（MLE）和广义矩估计法（GMM）。第6讲介绍时间序列模型，包括：ARIMA模型、VAR模型、单位根检验、协整分析、误差修正模型、GARCH模型。这些模型基本上涵盖了宏观时间序列、金融时间序列分析中的常用工具。第7讲介绍面板数据模型，包括：固定效应模型、随机效应模型、异方差和序列相关、动态面板模型、面板随机系数模型、面板随机前沿模型、面板单位根检验、面板协整分析等。这些模型由浅入深，基本上涵盖了目前文献中使用的多数面板分析方法。第8讲介绍STATA编程技巧，包括：输入项、输出项的设定，子程序、可分组执行、可重复执行等程序高级功能，以及帮助文件的编写方法。通过本讲的学习，学员将能够独立编写复杂的STATA程序，这些程序和STATA官方提供的程序完全一致。第9讲介绍自抽样和模拟分析，包括：Bootstrap(自抽样)、组合检验(Permutation tests)、刀切法(Jackknife)和蒙特卡洛模拟。不同于传统的假设检验和统计推断方法，这些方法都是以计算机模拟和抽样为基础的，在最近十年

STATA 学习入门必须知道的基础

STATA 学习入门必须知道的基础作者：量化研究方法关于Stata软件，我经常会被人问道：“你知道它到底能做什么吗？”那我们今天就带大家来了解一下这门当下热门的软件究竟的用处是什么？ 1 关于Stata，这些基础的东西你必须要知道很长一段时间里，我一直把“Stata”读为“Stay-ta”。有一次和一个从日本回来的朋友聊天，她把Stata读为“Star-ta”，让我甚感不适。经查阅，方才发现，原来“Stata”并非数个单词的缩写（因此其正确拼写为Stata 而非STATA），而是由“statistics”和“data”合成的一个新词。从这个小小的趣闻中，可以看出Stata 在问世之初（1985年）的主要功能在于统计分析和数据处理。经历了三十余年的发展，Stata 已经升级到第15版，在不断强化上述功能的同时，Stata在矩阵运算、绘图、编程等方面的功能也在不断加强。Stata 擅长数据处理、面板数据分析、时间序列分析、生存分析，以及调查数据分析，但其它方面的功能也并不逊色。（表1） 2为何选择Stata？这是个不太容易回答的问题。Stata网站列举了数条可能的原因。Edwards(2005)曾经非常细致地对比了Stata,SPSS和SAS的优劣。Princeton大学的Torres-Reyna博士则将四种常用软件的特征总结为表2。整体而言，Stata具有较强的优势。 3 弱水三千，我为何钟情于Stata？就我个人的经历而言，如下几个原因使我自2003年以来一直钟情于Stata。 Stata的数据处理功能很强大。由于将数据导入内存后进行运算，其速度非常快。在多个数据文件的合并和追加，以及文字资料、时序资料，以及调查资料的处理方面，Stata 总能以极为简洁的命令完成分析。

STATA初级视频教程说明书(连玉君)

STATA初级视频教程（2010版）使用说明连玉君（中山大学岭南学院金融系） arlionn@https://www.doczj.com/doc/e812627130.html, 目录 1 课程简介 (1) 2 课程特色 (2) 3 课程配套资料 (2) 4 配套资料的使用方法 (2) 5 讨论和建议 (4) 6 讲师介绍 (4) 7 报名咨询 (4) 8 培训优惠 (4) 附录A：STATA初级视频目录（时间节点） (5) 第一讲STATA简介 (5) 第二讲数据处理 (9) 第三讲Stata绘图 (13) 第四讲矩阵操作 (16) 第五讲STATA 编程初步 (18) 附录B：STATA高级视频教程简介 (20)

工欲善其事，必先利其器。无论是经济学、管理学还是社会科学的其他学科，定量分析都变得越来越重要了。作为一个较为年轻的计量软件，STATA自1985年问世以来，以其在数据处理、绘图、回归分析等方面的出色表现，赢得了越来越多的青睐。然而，相比于SPSS、Eviews等以菜单操作为主的软件，以命令操作见长的STATA软件门槛相对较高。由于进入国内的时间较短，相关的参考资料甚为有限，而STATA公司提供的近10000页的全英文使用手册更是令多数初学者望而生畏。这也成为阻碍多数国内同仁学习这款功能强大的计量软件的主要障碍。鉴于上述情况，我们分别于2007年11月和2008年10月推出了“STATA初级视频教程”和“STATA高级视频教程”，内容涉及STATA的基本操作、数据处理、绘图、编程、常用计量模型的估计，以及Bootstrap和Monte Carlo模拟等内容。视频教学的直观性，加之课程的实用性导向，使这两套教程获得了广泛的好评。承蒙广大STATA视频教程学员的积极参与和反馈，我在过去两年多的时间里收集到了100余条修改建议，历经半年多的制作，最终得以为大家呈现这套新版STATA初级视频——“STATA初级视频教程（2010版）”。 STATA初级视频教程（2010版）共5讲，包含36个视频文件，总计40余个学时。内容涉及：STATA入门、数据处理、绘图、矩阵以及编程。内容简介如下（详细目录见附录A）：第1讲从整体上介绍了STATA的基本架构，以便使学员在最短的时间内掌握STATA的精髓，包括：数据的导入导出、执行命令、修改和查验资料、log文件和do文件的使用、STATA与Word（Excel、LaTeX）等软件的完美结合，以及STATA常用设定等内容。第2讲通过大量的实例，介绍了各种数据处理技巧，是本课程最为核心、最有特色的内容。主要包括：复杂变量的创建；分位数；重复样本值、缺漏值和离群值的处理；资料的合并、追加和重新组合；文字变量、类别变量的处理；时间序列和面板资料的处理；以及数据的查验和对比等内容。这些内容的学习将大幅提高学员的数据处理能力。第3讲介绍STATA绘图。为了达到举一反三的效果，我先从整体上介绍STATA绘图的基本知识，进而将绘图命令拆解成8类选项和5类元素，并最终通过40余个实例全面介绍了15类常用图形的绘制方法。第4讲介绍STATA矩阵操作，包括矩阵的定义和管理、矩阵运算、矩阵解析等四个主题，为后续学习STATA编程知识奠定了扎实的基础。第5讲介绍STATA编程的基本知识，包括：程序的定义和调用、单值、暂时性物件（暂元、暂时性变量、暂时性文件、暂时性矩阵等）、循环语句、条件语句，以及STATA返回值的引用等内容。通过本讲的学习，学员将能够通过独立编写STATA程序来提高数据处理和模型估计的效率，为后续学习STATA高级程序奠定基础。以上各讲都以专题的形式进行讲解，其中不但包含了STATA官方提供的常用命令，还包含了大量外部命令（520多个），为学员提供了强有力的实证分析工具。

5分钟搞定Stata面板数据分析

【原创】5分钟搞定Stata面板数据分析简易教程ver2.0作者：张达 5分钟搞定Stata面板数据分析简易教程步骤一：导入数据原始表如下，数据请以时间（1998，1999，2000，2001??）为横轴，样本名（北京，天津，河北??）为纵轴将中文地名替换为数字。

注意：表中不能有中文字符，否则会出现错误。面板数据中不能有空值。去除年份的一行，将其余部分复制到stata的data editor中，或保存为csv格式。

打开stata，调用数据。方法一：直接复制到data editor中。方法二：使用口令：insheet using 文件路径调用例如：insheet using C:\STUDY\paper\taxi.csv 其中csv格式可用excel的“另存为”导出如图：

步骤二：调整格式首先请将代表样本的var1重命名口令：rename var1 样本名例如：rename var1 province 也可直接在var1处双击，在弹出的窗口中修改:

接下来将数据转化为面板数据的格式口令：reshape long var, i(样本名) 例如：reshape long var, i(province) 其中var代表的是所有的年份（var2,var3,var4??）转化后的格式如图：转化成功后继续重命名，其中_j 这里代表原始表中的年份，var代表该变量的名称口令例如： rename _j year rename var taxi 也可直接在需要修改的名称处双击，在弹出的窗口中修改如图：

stata 使用入门

Stata入门介绍 Stata入门介绍转载，原作者不详。 (1) Stata要在使用中熟练的，大家应该多加练习。 (2) Stata的很多细节，这里不会涉及，只是选取相对重要的部分加以解释，大家在使用Stata 过程中留心积累。作为入门性质的介绍，本文只选取和中级计量经济学作业相关的内容和一些处理数据所使用的基本命令。对于更高深的内容，请大家参看STATA manual.” 界面当我们把stata装好以后，首先需要了解的是它的界面。打开Stata后我们便可以看到它常用的四个窗口：Stata Results; Review; Variables; Stata Command。我们所有的运行结果都会在Stata Results界面中显示；而命令的输入则在Stata Command窗口；Review窗口记录我们使用过的命令；最后Variables窗口显示存在于当前数据库中的所有变量的名称。可以直接点击 Review窗口来重新输入已使用过的命令，我们所需变量可以通过点击Varaibles窗口来得到，这些都可以简便我们的操作。 Stata 命令 Stata软件功能强大，体现在它提供了丰富的命令，可以实现许多功能。每一个stata命令都相应的命令格式。我们在这里介绍常用的一些命令的功能和相应的格式，大家在使用stata的过程中会不断积累命令的相关知识。需要对命令的帮助时可以用help命令查询。例如了解命令：“reg” ，就可以在Stata Command 窗口输入“help reg” ，也可以在Help选项下content中查找我们需要的相关命令。用help 查询，则窗口会显示关于该命令的详尽说明。更直接的办法是看Examples中的范例是如何使用该命令，阅读一些相关的说明并加以模仿。重要习惯我们使用stata进行回归分析时，需要养成一些好的习惯。在进行一些数据量很大，过程复杂的分析时尤其重要。（1）使用日志（log）。它可以帮助我们记录stata的运行结果。格式：log using c:\stata8\logfiles\10.21.5_30.log （注意：我们需要先建好文件夹c:\stata8\logfiles）关闭log的命令为“log close”。格式: log close 那么“10.21.5_30.log”文件就记录了从“log using”命令到“log close”命令之间stata

STATA面板数据模型操作命令

S T A T A 面板数据模型估计命令一览表一、静态面板数据的STATA 处理命令 εαβit ++=x y it i it 固定效应模型 εαμit +=it it 随机效应模型（一）数据处理输入数据 ●tsset code year 该命令是将数据定义为“面板”形式 ●xtdes 该命令是了解面板数据结构 ●summarize sq cpi unem g se5 ln 各变量的描述性统计（统计分析） ●gen lag_y=L.y /////// 产生一个滞后一期的新变量 gen F_y=F.y /////// 产生一个超前项的新变量 gen D_y=D.y /////// 产生一个一阶差分的新变量 gen D2_y=D2.y /////// 产生一个二阶差分的新变量（二）模型的筛选和检验 ●1、检验个体效应（混合效应还是固定效应）（原假设：使用OLS 混合模型） ●xtreg sq cpi unem g se5 ln,fe 对于固定效应模型而言，回归结果中最后一行汇报的F 统计量便在于检验所有的个体效应整体上显着。在我们这个例子中发现F 统计量的概率为0.0000，检验结果表明固定效应模型优于混合OLS 模型。 ●2、检验时间效应（混合效应还是随机效应）（检验方法：LM 统计量）（原假设：使用OLS 混合模型） ●qui xtreg sq cpi unem g se5 ln,re (加上“qui ”之后第一幅图将不会呈现) xttest0 可以看出，LM 检验得到的P 值为0.0000，表明随机效应非常显着。可见，随机效应

模型也优于混合OLS模型。 ●3、检验固定效应模型or随机效应模型（检验方法：Hausman检验）原假设：使用随机效应模型（个体效应与解释变量无关）通过上面分析，可以发现当模型加入了个体效应的时候，将显着优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FE or RE的优劣，这需要进行接下来的检验，如下： Step1：估计固定效应模型，存储估计结果 Step2：估计随机效应模型，存储估计结果 Step3：进行Hausman检验 ●qui xtreg sq cpi unem g se5 ln,fe est store fe qui xtreg sq cpi unem g se5 ln,re est store re hausman fe (或者更优的是hausman fe,sigmamore/ sigmaless) 可以看出，hausman检验的P值为0.0000，拒绝了原假设，认为随机效应模型的基本假设得不到满足。此时，需要采用工具变量法和是使用固定效应模型。（三）静态面板数据模型估计 ●1、固定效应模型估计 ●xtreg sq cpi unem g se5 ln,fe (如下图所示) 其中选项fe表明我们采用的是固定效应模型，表头部分的前两行呈现了模型的估计方法、界面变量的名称（id）、以及估计中使用的样本数目和个体的数目。第3行到第5行列示了模型的拟合优度、分为组内、组间和样本总体三个层面，通常情况下，关注的是组内（within），第6行和第7行分别列示了针对模型中所有非常数变量执行联合检验得到的F统计量和相应的P值，可以看出，参数整体上相当显着。需要注意的是，表中最后一行列示了检验固定效应是否显着的F统计量和相应的P值。显然，本例中固定效应非常显着。 ●2、随机效应模型估计

stata命令大全(全)

*********面板数据计量分析与软件实现********* 说明：以下do文件相当一部分内容来自于中山大学连玉君STATA教程，感谢他的贡献。本人做了一定的修改与筛选。 *----------面板数据模型 * 1.静态面板模型：FE 和RE * 2.模型选择：FE vs POLS, RE vs POLS, FE vs RE （pols混合最小二乘估计） * 3.异方差、序列相关和截面相关检验 * 4.动态面板模型（DID-GMM,SYS-GMM） * 5.面板随机前沿模型 * 6.面板协整分析（FMOLS,DOLS） *** 说明：1-5均用STATA软件实现， 6用GAUSS软件实现。 * 生产效率分析（尤其指TFP）：数据包络分析（DEA）与随机前沿分析（SFA） *** 说明：DEA由DEAP2.1软件实现，SFA由Frontier4.1实现，尤其后者，侧重于比较C-D与Translog 生产函数，一步法与两步法的区别。常应用于地区经济差异、FDI溢出效应（Spillovers Effect）、工业行业效率状况等。 * 空间计量分析：SLM模型与SEM模型 *说明：STATA与Matlab结合使用。常应用于空间溢出效应（R&D）、财政分权、地方政府公共行为等。 * --------------------------------- * --------一、常用的数据处理与作图----------- * --------------------------------- * 指定面板格式 xtset id year （id为截面名称，year为时间名称） xtdes /*数据特征*/ xtsum logy h /*数据统计特征*/ sum logy h /*数据统计特征*/ *添加标签或更改变量名 label var h "人力资本" rename h hum *排序 sort id year /*是以STATA面板数据格式出现*/ sort year id /*是以DEA格式出现*/ *删除个别年份或省份 drop if year<1992 drop if id==2 /*注意用==*/

文档之家

STATA 学习入门必须知道的基础

STATA面板数据模型操作命令要点

最新Stata软件基本操作和数据分析入门

[推荐] stata基本操作汇总常用命令

5分钟速学stata面板数据回归(初学者超实用!)

Stata操作入门(中文)

stata入门教程

1 STATA入门

Stata软件学习者应该收藏的学习资源

计量经济学stata操作指南

STATA高级视频教程简介(连玉君)

STATA 学习入门必须知道的基础

STATA初级视频教程说明书(连玉君)

5分钟搞定Stata面板数据分析

stata 使用入门

STATA面板数据模型操作命令

stata命令大全(全)