stata上机实验第五讲
- 格式:ppt
- 大小:233.50 KB
- 文档页数:48
上机实训1.完成Stata 16.0的安装,并展示其工作界面。
Stata软件安装较为简单,按照安装向导一步一步进行即可。
用户选择接受Stata软件安装协议,并输入用户名等相关信息后,选择StataSE,并由用户指定安装路径后即可进行软件的初步安装。
软件初步安装完成后,需要创建桌面快捷方式,双击桌面快捷方式进行信息注册,并根据自己电脑操作系统的位数进行相应属性的修改后,生成新的桌面快捷方式,并删除原有桌面快捷方式,此时软件安装工作完成,可以双击Stata软件桌面快捷方式或在程序中寻找Stata软件,打开软件并进行数据分析工作。
上机实训参考答案1. 统计得到3个班级学生的基本信息,包括班级(class)、性别(sex)、年龄(age)、体重(height)和身高(weight),数据详情如表2-8所示。
表2-8 习题1数据详情将数据导入Stata软件,并形成名为xiti1.dta的数据文件(1)根据体重数据按照从小到大的顺序将观测个案排序。
(2)将身高大于165厘米的观测个案挑选出来。
(3)计算新变量体重身高比,其数值等于体重/身高。
上机实训参考答案1.某地区统计了1980~1982年3年间不同年龄组下的课外体育培训参与率,数据详情如表3-12所示。
其中年龄组分为5组,定义为1:14岁及以下;2:15~18岁;3:19~20岁;4:21~24岁;5:25岁以上。
数据包括3个变量,即年份(year)、课外体育培训参与率(rate)、年龄组(group)。
表3-12 实训1数据导入数据,保存为名为xiti2.dta的数据文件(1)分析不同年份的课外体育培训参与率和不同年龄组的课外体育培训参与率的平均水平。
(2)制作不同年份、不同年龄组下的交叉列联表,并就变量间的独立性进行分析。
(3)绘制不同年份、不同年龄组下课外体育培训参与率的条形图。
上机实训参考答案1.在某项医学试验中,对不同的群体测定尿铅含量,选定24个观测个案,将这24名观测个案分为男女两组,同时观测个案可分为3个年龄组。
Stata操作讲义知识讲解S t a t a操作讲义Stata操作讲义第一讲 Stata操作入门第一节概况Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。
它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。
Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10M左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小的SAS系统也毫不逊色。
另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。
由于Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows席卷天下的时代,他一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。
但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。
更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。
除了操作方式简洁外,Stata的用户接口在其他方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。
Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载。
用户可随时到Stata网站寻找并下载最新的升级文件。
事实上,Stata的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata程序版本,而这也使得Stata 自身成了几大统计软件中升级最多、最频繁的一个。
计量经济学上机命令整理实验一edit 打开数据编辑器browse 打开数据浏览器rename 对变量重新命名labelsavedescribe 对数据集简要描述sort 排序例如:list in -10/-1list 显示变量的数值Generate 缩小:gen 生成新的变量后面可以接if条件句Replace 替换append 覆盖Summarize 缩写:su 总结后面可以接if条件句实验二twoway (scatter y x)(connected ey_x x) 在该散点图上,做出条件均值点sc y x||lfit y x 画出线图和散点图Reg y x 做出回归Rename ** y **指原变量名用于修改变量名字graph twoway scatter y x 画出y x 的二维散点图Line y x 做出y x 的线条图egen Ey_x=mean(y),by(x) 求在同一x水平下,求y的均值实验三Regress y x1 x2 ........做多元回归Precict e,re 预测方差Sort e 按照方差排序Cor y x 测试y与x的相关程度Pwcorr y x 也是测试y与x的相关程度Set obs 90 (90为任意一个数字),增加一个或者多个样本值Replace x=980 in 90 为第90个样本值赋值(980为任意一个数字)Predict yhat 预测y的估计值Display invttail(n,p) n为自由度;p为概率(一般为0.025)。
用来求t分布的t 值Display ttail(n,t)知道t值求T<t的右端概率Destring (变量名,可省略),replace ignore("-$") 将其他类型的数据转化为数值型Hist e残差直方图hist e,norm加了一条正态分布线Two connected y x 二维图连线Two connected y x,yline(0) 在y=0处画一条线(也可x=0)Kdensity e,normal 对残差画出密度图Sktest e 利用e的偏锋度做是否符合正态分布的检验gen low=yhat-t*se gen high=yhat+t*se 预测置信区间Twoway lfitci y x 置信区间与回归之间作图实验四(第五章)Gen lny=log(y)生成y的对数Gen lnx=log(x)生成x的对数Drop y或者x 删除变量Predict se,stdp 预测所有的标准误实验五(第六章)虚拟变量Tab quarter,gen(d) quarter代表变量,对变量quarter生成虚拟变量d Gen d1_x=d1*x 或者是(d2,d3,d4与x2,x3,x4)生成交互作用的虚拟变量Reg y x1 x2...d2 d3 d4.....(d1通常省略,常数项)Egen ybar=mean(y) 生成y的均值实验六(第八章:多重共线性)Gen t=0Replace t=1 if x<(或>或>=或<=)数值Test (t=0)(t_x=0)做假设联合检验,求出新的F值Test (lnx2+lnx3=1) 求出新的F检验统计量Cor lnx2-lnx6 求lnx2与lnx3到Lnx6之间的相关程度,找出是否存在多重共线性问题Pcorr lnx2 lnx3-lnx6 也是测量变量之间的相关程度Estat vif 估计方差膨胀因子(方差膨胀因子越大,说明两个此变量与y的共线性越高,应该考虑删除)实验七八(第九十章)Predict e,reGen e2=e^2Est store m1 记录原回归的内容Est tab m1 m2 展示上述记录过的回归内容并作出比较Est tab m1 m2.....,seEstat imtest 怀特检验Estat hettest BP检验Regress y x2 x3...,robust 校正后的怀特检验自相关检验Regress y x...Est store m1Predict e,reSc e obs,yline(0)Tsset obs或者其他变量,用来表示时间变化Dwstat 进行DW检验并查表得出自相关程度Gen rho=1-d/2 rho 代表ρ估计Prais y x,corc (one,two...)括号可接可不接表示从OLS残差中估计ρ Gen dy1=y-l.y*ρ1Gen dx1=y-l.y*ρ1Gen dy2=y-l.y*ρ2Gen dx2=y-l.y*ρ2 (rho=ρ)Replace dy1=sqrt(1-rho^2)*y if ......补充第一个样本值比如ifobs==1958 Replace dx1=sqrt(1-rho^2)*x if .......。
《计量经济学》上机实验参考答案实验一:线性回归模型的估计、检验和预测(3 课时)实验设备:个人计算机,计量经济学软件Eviews,外围设备如U 盘。
实验目的:(1)熟悉Eviews 软件基本使用功能;(2)掌握一元线性回归模型的估计、检验和预测方法;正态性检验;(3)掌握多元线性回归模型的估计、检验和预测方法;(4)掌握多元非线性回归模型的估计方法;(5)掌握模型参数的线性约束检验与参数的稳定性检验。
实验方法与原理:Eviews 软件使用,普通最小二乘法(OLS),拟合优度评价、t 检验、F 检验、J-B 检验、预测原理。
实验要求:(1)熟悉和掌握描述统计和线性回归分析;(2)选择方程进行一元线性回归;(3)选择方程进行多元线性回归;(4)进行经济意义检验、拟合优度评价、参数显著性检验和回归方程显著性检验;(5)掌握被解释变量的点预测和区间预测;(6)估计对数模型、半对数模型、倒数模型、多项式模型模型等非线性回归模型。
实验内容与数据1(第2 章思考与练习:三、简答、分析与计算题第12 小题):12. 表1 数据是从某个行业的5 个不同的工厂收集的,请回答以下问题:ˆˆˆˆ(1)估计这个行业的线性总成本函数:yˆt= b0 + b1 x t ;(2)b0 和b1 的经济含义是什么?;(3)估计产量为10 时的总成本。
表1 某行业成本与产量数据参考答案:(1)总成本函数(标准格式):yˆt = 26.27679 + 4.25899xts = (3.211966) (0.367954)t = (8.180904) (11.57462)R 2 = 0.978098 S.E = 2.462819 DW =1.404274 F =133.9719ˆˆ(2) b0 =26.27679 为固定成本,即产量为0 时的成本;b1 =4.25899 为边际成本,即产量每增加1 单位时,总成本增加了4.25899 单位。