SAS作图详细教程1
- 格式:ppt
- 大小:2.45 MB
- 文档页数:75
第二十课散布图、折线图和层次图SAS系统中绘制散布图、折线图和层次图,使用PROC PLOT过程和PROC GPLOT过程。
PROC PLOT过程是用来画易生成的低分辨率的图形,输出在OUTPUT窗口。
而PROC GPLOT过程是用来生成订制的、高分辨率的图形,输出在GRAPH窗口,并且还可以对输出的图形进行编辑修改。
一、PROC PLOT过程使用PLOT过程可以在两个不同的坐标系中对两个变量作散布图、折线图、半对数图和层次图。
用于数据处理中,直观地了解数据的变化趋势和数据间的相互关系等。
它的一般形式为:Porc Plot DA TA=数据集</选项列表> ;Plot 纵坐标变量Y*横坐标变量X……</选项列表>;Run ;1.PROC PLOT语句PROC PLOT语句中的选项列表主要分成三类:有关图形的坐标轴选项、有关外观的选项和有关图形大小的选项。
其中,图形大小的两个选项较为常用:●VPCT=百分比列表——规定产生图形在垂直方向占一页的百分比。
例如,VPCT=33表示这张输出图占一页的33%,即占一页的1/3,所以一页可以纵向打印3张图。
VPCT=50 25 25表示每一页在纵向打印3张图,第一张占全页的一半,第二和第三张各占1/4页。
VPCT=200表示要求输出图占2页的长度。
●HPCT=百分比列表——规定产生图形在水平方向占一页的百分比。
2.PLOT语句PLOT语句里首先要规定数据集中的哪两个变量作为图形中的垂直变量和水平变量,以及在图形中用于画点的作图字符。
PLOT语句的几种使用格式如下:plot y*x ;plot y*x =’+’;plot y*x=符号变量;plot y*x $ 标记变量=’+’;plot y*x=’+’b*a=’*’ /overlay;第一条语句作图符号用缺省形式,依次用英文大写字母A、B、C…Z作为作图符号。
当观测的条数较多时,低分辨率图不可能画出所有观测的点,所以当图中的某一点表示有一条观测的点时,用作图符号A表示;当图中的某一点表示有二条观测的点时,用作图符号B表示;以此类推。
Sas代码作图详解SAS/Graph太强大了,本文主要讲一些常用且功能强大的Graph相关的过程步。
1 proc gplot的简单例子proc gplot data=sashelp.shoes;plot Returns * Sales ;run;结果:2 我们也可以只画出符合条件的数据的图形。
proc gplot data=sashelp.shoes;where Region in("United States", "Eastern Europe");plot Returns * Sales ;run;结果:3 输出的图像都是默认的黑色的小十字,因此我们不能区分来自不同地区的数据,下面的程序就是为了解决这一问题proc gplot data=sashelp.shoes;where Region in("United States", "Eastern Europe");plot Returns * Sales= Region;run;结果:这里红色的来自美国,黑色的来自东欧,当然我们也可以自己设定颜色(SAS基本颜色有:black, red, green, blue, cyan, magenta, grey, pink, orange, brown, and yellow)。
4 设定坐标轴和所有文字和颜色proc gplot data=sashelp.shoes;where Region in("United States", "Eastern Europe");plot Returns * Sales= Region/caxis=bluectext=redgrid;run;结果:5 如果要对网格进行更精细地设置,则要用到AUTOHREF和AUTOVREF选项。
AUTOHREF中,LHREF设置水平线的线类型,CHREF设置水平线的线颜色;AUTOVREF中,LVREF设置垂直线的线类型,CVREF设置垂直线的线颜色。
SAS数据分析完整笔记1. SAS INSIGHT启动:方法1:Solution→Analysis→Interactive Date Analysis方法2:在命令栏内输入insight方法3:程序编辑窗口输入以下代码,然后单击 Submit按钮;Proc insight;Run;1.1 一维数据分析用 sas insight做直方图、盒形图、马赛克图。
直方图:Analysis→Histogram/Bar Chart盒形图:Analysis→Box plot马赛克图:Analysis→Box plot/Mosaic plot(Y)1.2 二维数据分析散点图:Analysis→Scattery plot(Y X)曲线图:Analysis→Line plot( Y X)1.3 三维数据分析旋转图:Analysis→Rotationg Plot曲面图:Analysis→Rotationg Plot设置 Fit Surface等高线图:Analysis→Countor plot1.4 分布分析包括:直方图、盒形图、各阶矩、分位数表,直方图拟合密度曲线,对特定分布进行检验。
1.4. 1 Analysis→Distribution(Y)第一部分为盒形图,第二部分为直方图,第三部分为各阶矩,第四部分为分位数表。
1.4.2 添加密度估计A:参数估计:给出各种已知分布(正态,指数等),只需要对其中参数进行估计;Curves→Parametric DensityB:核估计:对密度函数没有做假设,曲线性状完全依赖于数据;Curves→Kernel Density1.4.3 分布检验Curves→CDF confidence bandCurves→Test for Distribution1.5 曲线拟合Analysis→Fit(Y X):分析两个变量之间的关系1.6 多变量回归Analysis→Fit(Y X)1.7 方差分析Analysis→Fit(Y X)1.8 相关系数计算Analysis→Multivariate1.9 主成分分析Analysis→Multivariate2.SAS ANALYST启动:方法1:Solution→Analysis→Analyst方法2:在命令栏内输入analyst2.1 分类计算统计量:Data→Summarize by group2.2 随机抽样:Data→Random Sample2.3 生成报表:Report→Tables2.4 变量计算:Date→Transform2.5 绘制统计图2.5.1 条形图:Graph→Bar Chart→Horizontal2.5.2 饼图:Graph→Pie Chart2.5.3 直方图:Graph→Histogram2.5.4 概率图:Graph→Probality plot2.5.5 散点图:Graph→Scatter plot2.6 统计分析与计算2.6.1 计算描述性统计量Statistics →Descriptive→Summart Statistics只计算简单统计量Statistics →Descriptive→Distribution可计算一个变量的分布信息Statistics →Descriptive→Correlations可计算变量之间的相关关系Statistics →Descriptive→Frequency counts可计算频数2.6.2 列联表分析Statistics →Table Analysis2.7假设检验2.7.1单样本均值Z检验:检验单样本均值与某个给定的数值之间的关系Statistics →Hypothesis tests→One-Sample Z-test for a mean2.7.2单样本均值t检验:适用于不了解变量的方差情形推断该样本来自的总体均数μ与已知的某一总体均属μ0是否相等Statistics →Hypothesis tests→ One-Sample t-test for a mean2.7.3单样本比例检验:检验取离散值的变量取某个值的比例Statistics →Hypothesis tests→One-Sample test for a proportion2.7.4单样本方差检验:检验样本方差是否等于给定的值。
第二十一课条形图、圆饼图和星形图与PLOT过程和GPLOT过程的关系一样,PROC CHART过程是用来画易生成的低分辨率的图形,输出在OUTPUT窗口。
而PROC GCHART过程是用来生成订制的、高分辨率的图形,输出在GRAPH窗口。
在这里我们将只介绍GCHART过程。
使用GCHART图表可以形象地表示变量的取值大小和两个以上变量之间的关系。
可以绘制垂直和水平的条形图、块形图、圆饼图、星形图等。
一、PROC GCHART过程的功能和语句说明GCHART过程不仅能把输入数据集中的变量值以各种图形的方式显示出来,而且能把输入数据集中的一个或多个变量按分组进行各种统计计算,然后再把统计结果以图形的方式显示出来。
也就是说,GCHART过程具有统计和显示图表的两大功能。
1.PROC GCHART过程的一般格式GCHART过程一般由下列语句控制:Proc Gchart DA TA=数据集;VBAR 变量列表</<通用选项列表><VBAR专用选项列表>>;HBAR 变量列表</<通用选项列表><HBAR专用选项列表>>;BLOCK 变量列表</<通用选项列表><BLOCK专用选项列表>>;PIE 变量列表</<通用选项列表><PIE专用选项列表>>;STAR 变量列表</<通用选项列表><STAR专用选项列表>>;By 变量列表;Run ;在PROC GCHART语句后面可以跟随着任何多个图形要求的语句,如上面的VBAR、BLOCK等语句。
也就是一个GCHART过程能够对一个指定的数据集画出任意多个各种不同的图形。
每一个图形要求语句需要指定一个图形变量或多个图形变量用于将它们的值画图。
由于每个图形要求语句的选项众多,将它们的选项分成两部分:通用选项列表和专用选项列表。