STATA第五讲
- 格式:ppt
- 大小:859.50 KB
- 文档页数:4
STATA 讲义目录Stata入门教程:Stata概貌Stata 第一章数据输入,存盘和调用文件命令以及数据管理命令Stata第二章 描述性统计命令与输出结果说明Stata第三章 正态检验与作图命令Stata第四章 t检验和单因素方差分析(上)Stata第四章 t检验和单因素方差分析(下)Stata第五章 多组计量资料比较的非参数检验命令与输出结果说明Stata第六章 卡方检验Stata第七章 相 关 分 析Stata第八章 单 因 素 生 存 分 析Stata第九章 多因 素 方 差 分 析 命 令 与 输 出 结 果 说 明Stata第十章 线 性 回 归 和 逐 步 回 归 命 令 和 输 出 结 果 说 明Stata第十一章 Logistic回归分析命令与输出结果说明Stata第十二章 Cox回归分析命令与输出结果说明第一章 Stata 概貌§1.1 Stata的功能、特点和背景Stata是一个用于分析和管理数据的功能强大又小巧玲珑的实用统计分析软件,由美国计算机资源中心(Computer Resource Center)研制。
从1985至1998的十四年时间里,已连续推出1.1,1.2,1.3,1.4,1.5,……及2.0,2.1,3.0,3.1,4.0,5.0,6.0等多个版本,通过不断更新和扩充,内容日趋完善。
它同时具有数据管理软件、统计分析软件、绘图软件、矩阵计算软件和程序语言的特点,又在许多方面别具一格。
Stata融汇了上述程序的优点,克服了各自的缺点,使其功能更加强大,操作更加灵活、简单,易学易用,越来越受到人们的重视和欢迎。
Stata的突出特点是只占用很少的磁盘空间,输出结果简洁,所选方法先进,内容较齐全,制作的图形十分精美,可直接被图形处理软件或字处理软件如WORD等直接调用。
一、 Stata的数据管理能力1. Stata的数据管理空间受计算机的操作系统和计算机扩展内存的影响。
Stata软件基本操作和数据分析入门第五讲多组平均水平的比较赵耐青一、复习和补充两组比较的统计检验1. 配对设计资料(又称为Dependent Samples)a)对于小样本的情况下,如果配对的差值资料服从正态分布,用配对t检验(ttest 差值变量=0)b)大样本的情况下,可以用配对t检验c)小样本的情况下,并且配对差值呈偏态分布,则用配对符号秩检验(signrank差值变量=0)2. 成组设计(Two Independent Samples)a)如果方差齐性并且大样本情况下,可以用成组t检验(ttest 效应指标变量,by(分组变量))b)如果方差齐性并且两组资料分别呈正态分布,可以用成组t检验c)(Ranksum test)二、多组比较1. 完全随机分组设计(要求各组资料之间相互独立)a)方差齐性并且独立以及每一组资料都服从正态分布(小样本时要求),则采用完全随机设计的方差分析方法(即:单因素方差分析,One Way ANOV A)进行分析。
b)方差不齐或小样本情况下资料偏态,则用Kruskal Wallis 检验(H检验)例5.1 为研究胃癌与胃粘膜细胞中DNA含量(A.U)的关系,某医师测得数据如下,试问四组人群的胃粘膜细胞中平均DNA含量是否相同?组别group DNA含量(A.U)浅表型胃炎 1 9.81 12.73 12.29 12.53 12.95 9.53 12.6 8.9 12.27 14.26 10.68肠化生 2 14.61 17.54 15.1 17 13.39 15.32 13.74 18.24 13.81 12.63 14.53 16.17早期胃癌 3 23.26 20.8 20.6 23.5 17.85 21.91 22.13 22.04 19.53 18.41 21.48 20.24晚期胃癌 4 23.73 19.46 22.39 19.53 25.9 20.43 20.71 20.05 23.41 21.34 21.38 25.70由于这四组对象的资料是相互独立的,因此属于完全随机分组类型的。
操S义讲作atatStata操作讲义第一讲 Stata操作入门第一节概况Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。
它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。
Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10M左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小的SAS系统也毫不逊色。
另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。
由于Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows席卷天下的时代,他一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。
但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。
更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。
除了操作方式简洁外,Stata的用户接口在其他方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。
Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载。
用户可随时到Stata网站寻找并下载最新的升级文件。
事实上,Stata的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata程序版本,而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。
Stata入门介绍✧说明:(1)这里很可能有错误,如果产生不良影响,请见谅。
(2) 下面用红色注明的都是可执行的过程。
(3) Stata要在使用中熟练的,大家应该多加练习。
(4) Stata的很多细节,这里不可能涉及到,只是选取相对重要的部分加以解释,而且仅仅是入门性质。
✧界面当我们把stata装好以后,首先需要了解的是它的界面。
打开Stata后我们便可以看到它常用的四个窗口:Stata Results; Review; Variables; Stata Command。
我们所有的运行结果都会在Stata Results界面中显示;而命令的输入则在Stata Command窗口;Review窗口记录我们使用过的命令;最后Variables窗口显示存在于当前数据库中的所有变量的名称。
可以直接点击Review窗口来重新输入已使用过的命令,我们所需变量可以通过点击Varaibles窗口来得到,这些都可以简便我们的操作。
✧Stata 命令Stata软件功能强大,体现在它提供了丰富的命令,可以实现许多功能。
每一个stata命令都相应的命令格式。
我们在这里介绍常用的一些命令的功能和相应的格式,大家在使用stata的过程中也会不断积累相关的知识。
命令格式可以用help命令查询。
也可以在Help选项下content中寻找相关命令。
使用help命令后,窗口中会有关于该命令的详尽说明。
更直接的办法是看Examples中的范例是如何使用该命令,阅读一些相关的说明并加以模仿。
✧重要习惯我们使用stata进行回归分析时,需要养成一些好的习惯。
在进行一些数据量很大,过程复杂的分析时尤其重要。
(1)使用日志(log)。
它可以帮助我们记录stata的运行结果。
格式:log using c:\stata\logfiles\10.21.5_30.log(注意:我们需要先建好文件夹c:\stata\logfiles)关闭log的命令为“log close”。
5函数与运算符5.1运算符expSTATA 共有四种运算,分别是代数运算、字符运算、关系运算和逻辑运算。
运算的优先序:!(或~),^,-(负号),/,*,-(减),+,!=(或~=),>,<,<=,>=,==,&,| 当不确定优先序的时候,最好用括号将优先序直接表达出来。
5.1.1代数运算包括加(+)、减(-)、乘(*)、除(/),幂(^)和负数(-),当遇到缺失值或者运算不可行时(比如除数为零)均会得到缺失值。
例:求正式的值,若x=4,y=2,显然经过心算,应该为:-1xyy x yx -+-. di –(4+2^(4-2))/(2*4) //di 是display 命令的略写,表示显示结果. di 4-2 //输出2 . di 3*5 //输出15. di 8/2 //8除以2,输出4 . di 2^3 //2的立方,输出8. di –(2+3^(2-3))/sqrt(2*3) //括号运算优先,想一想,结果应为多少?实际上,更多的情形是两个或多个变量的直接运算。
比如,将进口车的价格都增加100元(可能是关税),而国产车不变。
. sysuse auto, clear. gen nprice=price+foreign*100 . list nprice price foreign5.1.2字符运算加(+)号同样可用于字符运算,当加号出现在两个字符之间时,两个字符将被连成一个字符。
比如把”我爱”“STATA”合并在一起,命令为:. scalar a=”我爱” +“STATA” //要特别注意,引号必须是半角和英文模式. scalar list a //scalar命令将两个字符运算后的结果赋于a,然后显示a . scalar a=2 +“3” //注意到:字符与数值不能直接相加,显示类型不匹配type mismatchr(109);5.1.3关系运算关系运算包括大于、小于、等于;不等于、不小于、不大于等多种比较关系。