stata初级入门图形资料重点
- 格式:ppt
- 大小:1.36 MB
- 文档页数:10
操S义讲作atatStata操作讲义第一讲 Stata操作入门第一节概况Stata最初由美国计算机资源中心(Computer Resource Center)研制,现在为Stata公司的产品,其最新版本为7.0版。
它操作灵活、简单、易学易用,是一个非常有特色的统计分析软件,现在已越来越受到人们的重视和欢迎,并且和SAS、SPSS一起,被称为新的三大权威统计软件。
Stata最为突出的特点是短小精悍、功能强大,其最新的7.0版整个系统只有10M左右,但已经包含了全部的统计分析、数据管理和绘图等功能,尤其是他的统计分析功能极为全面,比起1G以上大小的SAS系统也毫不逊色。
另外,由于Stata在分析时是将数据全部读入内存,在计算全部完成后才和磁盘交换数据,因此运算速度极快。
由于Stata的用户群始终定位于专业统计分析人员,因此他的操作方式也别具一格,在Windows席卷天下的时代,他一直坚持使用命令行/程序操作方式,拒不推出菜单操作系统。
但是,Stata的命令语句极为简洁明快,而且在统计分析命令的设置上又非常有条理,它将相同类型的统计模型均归在同一个命令族下,而不同命令族又可以使用相同功能的选项,这使得用户学习时极易上手。
更为令人叹服的是,Stata语句在简洁的同时又拥有着极高的灵活性,用户可以充分发挥自己的聪明才智,熟练应用各种技巧,真正做到随心所欲。
除了操作方式简洁外,Stata的用户接口在其他方面也做得非常简洁,数据格式简单,分析结果输出简洁明快,易于阅读,这一切都使得Stata成为非常适合于进行统计教学的统计软件。
Stata的另一个特点是他的许多高级统计模块均是编程人员用其宏语言写成的程序文件(ADO文件),这些文件可以自行修改、添加和下载。
用户可随时到Stata网站寻找并下载最新的升级文件。
事实上,Stata的这一特点使得他始终处于统计分析方法发展的最前沿,用户几乎总是能很快找到最新统计算法的Stata程序版本,而这也使得Stata自身成了几大统计软件中升级最多、最频繁的一个。
Stata绘图学习⼿册转载请联系本⽂主要包括常见绘图的散点图、直⽅图、条形图、饼图等相关操作命令以及图⽰。
⼀.Stata图形汇总介绍graph twoway ⼆维图scatter 散点图histogram 直⽅图line 折线图area 区域图lfit 线性拟合图qfit ⾮线性拟合图kdensity 密度函数图function 函数图graph matrix 矩阵图graph bar 条形图graph dot 点图graph box 箱形图graph pie 饼图ac 相关系数图pac 偏相关系数图irf 脉冲相应函数图⼆.Stata 图形制作命令结构命令结构graph-command (plot-command, plot-options) (plot-command , plot-options) , graph-options或者graph-command plot-command,plot-options || plot-command , plot-options || , graph-options * graph-command定义图的类型,plot-command 定义曲线类型,同⼀个图中如果有多条曲线可以⽤括号分开,也可以⽤“| *”分开,曲线有其⾃⾝的选项,plot-command 定义曲线类型,同⼀个图中如果有多条曲线可以⽤括号分开,也可以⽤“| *”分开,曲线有其⾃⾝的选项,⽽整个图也有其选项。
例如twoway为graph-command中的命令之⼀,⽽scatter为plot-command *中的命令之⼀。
曲线选项和图选项,例如 * twoway (scatter mpg weight) , title("美国汽车") //图选项:标题 * twoway (scatter mpg weight , msymbol(Oh)) //曲线选项,点的类型上述命令没反应了直接敲 * twoway (scatter mpg weight , msymbol(Oh)) , title("美国汽车") //同时⽤图与曲线选项命令可以简写,如下列命令等价*sysuse auto, cleargraph twoway scatter mpg weighttwoway scatter mpg weight三.散点图散点图在各个绘图中占有重要作⽤,散点图具有表明变量之间关系的作⽤,因此在统计分析中得到⼴泛应⽤散点图的功能与意义:对数据进⾏预处理的重要图形之⼀,散点图深受专家学者的喜爱,散点图主要作⽤在于描绘某变量随着另⼀个变量变化的⼤致趋势,进⾏对变量之间的相关关系进⾏研究help twoway scattersysuse uslifeexp2, clearscatter le year, title("Scatterplot") subtitle("Life expectancy at birth, U.S.") note("1") caption("Source: National Vital Statistics Report, Vol. 50 No. 6") scheme(economist)四.直⽅图直⽅图⼜称为柱状图,是⼀种统计报告图,⼀般⽤横轴表⽰数据类型,纵轴表⽰分布状况,直⽅图可以表⽰分布状况变化,例如分别有⼀组数据,分别为地区,31个省份,然后分别为有⾼校的个数,分别字母region和number表⽰直⽅图命令为histogram number, frequency sysuse sp500histogram volumehistogram volume, frequency分组绘制直⽅图sysuse auto, clearhistogram mpg, percent discrete///by(foreign, col(1) note(分组指标:汽车产地)///title("图3:不同产地汽车⾥数")///subtitle("直⽅图") ///) ///ytitle(百分⽐) xtitle(汽车⾥数)五.折线图或者曲线标绘图折线图或者曲线标绘图是双向关系图中的⼀种,⽤线条的升降来表⽰变量或者现象之间的关系,与散点图的区别在于⽤线连接,可以看出整体趋势,但是弱化了每⼀个具体点上⾯的数值⼤⼩sysuse uslifeexp, cleargenerate diff = le_wm - le_bmlabel var diff "Difference"line le_wm year, yaxis(1 2) xaxis(1 2)|| line le_bm year|| line diff year|| lfit diff year|| lfit diff year||,ylabel(0(5)20, axis(2) gmin angle(horizontal)) ylabel(0 20(10)80, gmax angle(horizontal))ytitle("", axis(2))xlabel(1918, axis(2)) xtitle("", axis(2))ylabel(, axis(2) grid)ytitle("Life expectancy at birth (years)")title("White and black life expectancy")subtitle("USA, 1900-1999")note("Source: National Vital Statistics, Vol 50, No. 6" "(1918 dip caused by 1918 Influenza Pandemic)")六.条形图矩形的长度来表⽰相互独⽴的变量⼤⼩help graph bar命令格式1:graph bar yvars [if] [in] [weight] [, options]graph bar yvars [if] [in] [weight] [, options]graph hbar yvars [if] [in] [weight] [, options]基本⽤法: graph bar yvars ...sysuse nlsw88, cleargraph bar wage, over(race)累加柱体或者横向条形图sysuse educ99gdp, cleargraph hbar (mean) public private, over(country)重叠柱体sysuse nlsw88, cleargraph bar (mean) hours wage, over(race) over(married)七.饼图百分⽐图⽤圆形或者扇形内⼤⼩来表⽰总体中各部分所占⽐例的⼤⼩命令为帮助⽂件为help graph pie菜单式操作为Menu>raphics > Pie chartSyntaxSlices as totals or percentages of each variablegraph pie varlist [if] [in] [weight] [, options]Slices as totals or percentages within over() categories graph pie varname [if] [in] [weight], over(varname) [options] Slices as frequencies within over() categoriesgraph pie [if] [in] [weight], over(varname) [options]input sales marketing research developmentsales marketing research develop~t1. 12 14 2 82. end. label var sales "Sales". label var market "Marketing". label var research "Research". label var develop "Development". graph pie sales marketing research development, plabel(_all name, size(*1.5) color(white)) (Note 1) legend(off) (Note 2)plotregion(lstyle(none)) (Note 3)title("Expenditures, XYZ Corp.")subtitle("2002")note("Source: 2002 Financial Report (fictional data)")。
第三章 Stata 中的图形制作1.菜单操作2.直方图:用矩形的面积(即长度和宽度)来表示频数分布的图形。
D e n s i t y3.散点图:反映两个或多个变量之间的关系。
通常用纵轴来表示因变量,用横轴来表示自变量。
基本[twoway] scatter y x因变量在前数据标记的设定数据标记形状的设定、颜色的设定、大小的设定、散点标签的设定msymbol(散点形状代码);mcolor(red)散点为红色;msize(5)散点大小为5号散点标签:mlabel (标签内容的变量名)和mlabposition(代表钟表点数的数字)例如设定散点的内容为变量city,位置在3点钟处:mlabel (city) mlabposition(3)群组划分:by(foreign)案例:运用usaauto数据文件中的数据绘制mpg和weight关系的散点图。
(1)为图形添加标题“mpg与weight散点图”和副标题“1978年美国汽车数据图”;(2)为图形添加图例,位置在钟表2点钟处;(3)绘制一条拟合的趋势曲线;(4)将散点的形状设置为实心大三角,颜色为黑色;(5)为每个散点添加标签,内容为汽车的品牌(make),位置为9点钟处,颜色为黑色;(6)按照变量foreign分成两个图形进行绘制。
Twoway scatter mpg weight||lfit mpg weight,title(mpg与weight散点图) subtitle(1978年美国汽车数据图) legend(position(6))||表示多个图形在一个坐标轴中显示;lfit mpg weight绘制拟合曲线进一步设置:Msymbol(T) mcolor(black) mlabel(make) mlabpositon(9) by(foreign)4.曲线标绘图用线段的升降趋势来说明现象变化或变量之间关系的一种图形。
它与散点图类似,实际上它就是将连续型的数值变量点连接起来的一种图形,但由于它还可以用于回归曲线的绘制。