第三讲SAS的基本统计分析
- 格式:ppt
- 大小:381.00 KB
- 文档页数:50
目录一、描述性分析的分类_______________________________________________ 2(一)数据分类_________________________________________________________ 2(二)定量数据的描述性分析_____________________________________________ 3(三)定性数据的描述性分析_____________________________________________ 4(四)例题的数据说明___________________________________________________ 4二、SAS实现-程序___________________________________________________ 5(一)means过程_______________________________________________________ 5(二)summary过程_____________________________________________________ 7(三)univariate过程 ____________________________________________________ 9(四)tabulat过程______________________________________________________ 13(五)四个过程的比较__________________________________________________ 14(六)freq过程________________________________________________________ 14(七)capability过程___________________________________________________ 16(八)gchart过程 ______________________________________________________ 18(九)gplot过程 _______________________________________________________ 20三、SAS实现-图形界面______________________________________________ 21(一)SAS/ASSIST _____________________________________________________ 21(二)SAS/ANALYST(分析家)_________________________________________ 22(三)SAS/INSIGHT(交互式数据分析)__________________________________ 23(四)三种方法比较____________________________________________________ 23第三部分数据的描述性分析描述性统计分析(Descriptive Statistics )是基础统计分析(Elementary Statistics),是综合统计分析(Summary Statistics)。
第三课SAS数据集一、SAS数据集的结构SAS数据集是关系型的,它通常分为两部分:●描述部分——包含了一些关于数据属性的信息●数据部分——包括数据值SAS的数据值被安排在一个矩阵式的表状结构中,如图3-1所示。
●表的列称之为变量(Variable),变量类似于其他文件类型的域或字段(Field)●表的行称之为观察(Observation),观察相当于记录(Record)变量1 变量2 变量3 变量4Name Test1 Test2 Test3观察1 Xiaoer 90 86 88观察2 Zhangsan 100 98 89观察3 Lisi 79 76 70观察4 Wangwu 68 71 64观察5 Zhaoliu 100 89 99图3.1 一个SAS数据文件二、SAS数据集形式SAS系统中共有两种类型的数据集:●SAS 数据文件(SAS data files)●SAS 数据视窗(SAS data views)SAS 数据文件不仅包括描述部分,而且包括数据部分。
SAS 数据视窗只有描述部分,没有数据部分,只包含了与其他数据文件或者其他软件数据的映射关系,能使SAS的所有过程可访问到,实际上并不包含SAS 数据视窗内的数据值。
自始至终,在SAS语言中,“SAS数据集”与这两种形式中之一有关。
在下面的例子中,PRINT过程用相同方法处理数据集aaa.abc,而忽略它的形式:PROC PRINT DATA=aaa.abc三、SAS数据集的名字SAS数据集名字包括三个部分,格式如下:Libref.data-set-name.membertype●Libref(库标记)──这是SAS数据库的逻辑名字●data-set-name(数据集名字)──这是SAS数据集的名字●membertype(成员类型)──SAS数据集名字的这一部分用户使用时不必给出。
SAS 数据文件的成员类型是DATA;SAS数据视窗的成员类型是VIEW 例如,上面例子中的aaa.abc这个SAS数据集名字,aaa是库标记,abc是数据集名字,成员类型没有写出,应该是DATA或VIEW中的一个。
一、数据集的建立1.导入Excel数据表的步骤如下:1) 在SAS应用工作空间中,选择菜单“文件”→“导入数据”,打开导入向导“Import Wizard”第一步:选择导入类型(Select import type)。
2) 在第二步的“Select file”对话框中,单击“Browse”按钮,在“打开”对话框中选择所需要的Excel文件,返回。
然后,单击“Option”按钮,选择所需的工作表。
(注意Excel文件要是2003的!!)3) 在第三步的“Select library and member”对话框中,选择导入数据集所存放的逻辑库以及数据集的名称。
4 ) 在第四步的“Create SAS Statements”对话框中,可以选择将系统生成的程序代码存放的位置,完成导入过程。
2.用INSIGHT创建数据集1)启动SAS INSIGHT模块,在“SAS INSIGHT:Open”对话框的”逻辑库“列表框中,选定库逻辑名2)单击“新建”按钮,在行列交汇处的数据区输入数据值(注意列名型变量和区间型变量,这在后面方差分析相关性分析等都要注意!!)3)数据集的保存:•“文件”→“保存”→“数据”;•选择保存的逻辑库名,并输入数据集名;•单击“确定”按钮。
即可保存新建的数据集。
3.用VIEWTABLE窗口建立数据集1)打开VIEWTABLE窗口2)单击表头顶端单元格,输入变量名3)在变量名下方单元格中输入数据4)变量类型的定义:右击变量名/column attributes…4.用编程方法建立数据集DATA 语句; /*DATA步的开始,给出数据集名*/Input 语句;/*描述输入的数据,给出变量名及数据类型和格式等*/(用于DATA步的其它语句)Cards; /*数据行的开始*/[数据行]; /*数据块的结束*/RUN; /*提交并执行*/例子:data=数据集名字;input name$ phone room height; ($符号代表该列为列名型,就是这一列是文字!!比如名字,性别,科目等等)cards;rebeccah 424 112 (中间是数据集,中间每一行末尾不要加逗号,但是carol 450 112 数据集最后要加一个分号!!)louise 409 110gina 474 110mimi 410 106alice 411 106brenda 414 106brenda 414 105david 438 141betty 464 141holly 466 140;proc print data=; (这一过程步是打印出数据集,可要可不要!)run;*数据集中的框架我会用加粗来显示,大家主要记加粗的,下面的编程部分都是这样!!二、基本统计分析1.用INSIGHT计算统计量1)在INSIGHT中打开数据集在菜单中选择“Solution(解决方案)”→“Analysis(分析)”“Interactive Data Analysis(交互式数据分析)”,打开“SAS/INSIGHT Open”对话框,在对话框中选择数据集,单击“Open(打开)”按钮,即可在INSIGHT中打开数据窗口2)选择菜单“Analyze(分析)”→“Distribution (Y)(分布)”,打开“Distribution (Y)”对话框。