SAS数据分析与统计

  • 格式:doc
  • 大小:1.67 MB
  • 文档页数:49

下载文档原格式

  / 49
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、数据集的建立

1.导入Excel数据表的步骤如下:

1) 在SAS应用工作空间中,选择菜单“文件”→“导入数据”,打开导

入向导“Import Wizard”第一步:选择导入类型(Select import

type)。

2) 在第二步的“Select file”对话框中,单击“Browse”按钮,在

“打开”对话框中选择所需要的Excel文件,返回。然后,单击“Option”

按钮,选择所需的工作表。(注意Excel文件要是2003的!!)

3) 在第三步的“Select library and member”对话框中,选择导入数据集所存放的逻辑库以及数据集的名称。

4 ) 在第四步的“Create SAS Statements”对话框中,可以选择将系统生成的程序代码存放的位置,完成导入过程。

2.用INSIGHT创建数据集

1)启动SAS INSIGHT模块,在“SAS INSIGHT:Open”对话框的”逻辑库“列表框中,选定库逻辑名

2)单击“新建”按钮,在行列交汇处的数据区输入数据值

(注意列名型变量和区间型变量,这在后面方差分析相关性分析等都要注意!!)

3)数据集的保存:

•“文件”→“保存”→“数据”;

•选择保存的逻辑库名,并输入数据集名;

•单击“确定”按钮。即可保存新建的数据集。

3.用VIEWTABLE窗口建立数据集

1)打开VIEWTABLE窗口

2)单击表头顶端单元格,输入变量名

3)在变量名下方单元格中输入数据

4)变量类型的定义:右击变量名/column attributes…

4.用编程方法建立数据集

DATA 语句; /*DATA步的开始,给出数据集名*/

Input 语句;/*描述输入的数据,给出变量名及数据类型和格式等*/

(用于DATA步的其它语句)

Cards; /*数据行的开始*/

[数据行]

; /*数据块的结束*/

RUN; /*提交并执行*/

例子:data=数据集名字;

input name$ phone room height; ($符号代表该列为列名型,就是这一列是文字!!

比如名字,性别,科目等等)

cards;

rebeccah 424 112 (中间是数据集,中间每一行末尾不要加逗号,但是carol 450 112 数据集最后要加一个分号!!)

louise 409 110

gina 474 110

mimi 410 106

alice 411 106

brenda 414 106

brenda 414 105

david 438 141

betty 464 141

holly 466 140

;

proc print data=; (这一过程步是打印出数据集,可要可不要!)

run;

*数据集中的框架我会用加粗来显示,大家主要记加粗的,下面的编程部分都是这样!!

二、基本统计分析

1.用INSIGHT计算统计量

1)在INSIGHT中打开数据集

在菜单中选择“Solution(解决方案)”→“Analysis(分析)”

“Interactive Data Analysis(交互式数据分析)”,打开“SAS/INSIGHT Open”对话框,在对话框中选择数据集,单击“Open(打开)”按钮,即可在INSIGHT中打开数据窗口

2)选择菜单“Analyze(分析)”→“Distribution (Y)(分布)”,打开“Distribution (Y)”对话框。在数据集的变量列表中,选择分析变量X、分

组变量Y。(注意:分组变量就是那种可以区别不同种类的变量,例如地区编号、科目、组号等等,而分析变量一般是需要分析的数据,例如成绩,身高书目)

3)单击“Output(输出)”按钮,在打开的对话框中包含描述性统计量选项。

4)选择选项矩统计量和分位数,取消默认的选项:“Box Plot/Mosaic Plot”和“Histogra m/Bar Chart”,单击“OK”按钮,即可得到变量按分组的各种矩统计量(Moments)和分位数(Quantiles)

*描述性统计选项:Moments 矩统计量 Quantiles分位数

见书P37 Basic Confidence Intervals 基本置信区间

Tests for Location 位置检验 Frequency Counts 频数统计

Robust Measures of Scale 尺度的稳健估计

Tests for Normality 正态性检验

2.用“分析家”计算统计量

1)启动“分析家”

选择主菜单“Solutions(解决方案)”→“Analysis(分析)”→

“Analyst(分析家)”,打开“分析家”窗口。

选择主菜单“File(文件)”→“按SAS名称打开”,打开“选择成员”对话框,选择数据集。

2)通过Summary Statistics菜单计算描述性统计量

选择主菜单“Statistics(统计)”→“Descriptive(描述性统计)”→“Summary Statistics(汇总统计量)”,打开“Summary Sta tistics”对话框,选择变量列表中分析变量,单击“Analysis”按钮,选定分析变量

单击“Statistics”按钮,打开“Summary Statistics:Statistics”对话框。对话框中列出可以计算的所有统计量。

3)通过Distributions菜单计算描述性统计量

选择主菜单“Statistics(统计)”→“Descriptive(描述性统计)”→“Distributions(分布)”,打开“Distributions”对话框,选择变量列表中的分析变量,单击“Analysis”按钮。单击“OK”按钮,即可得到关于分析变量的矩统计量和基本统计测度。

3.用编程方法计算统计量

1)FREQ过程

FREQ过程包括多个控制频数输出与检验的语句和选项,格式如下:

PROC FREQ DATA = <数据集>;

[TABLES <变量1> <变量2> …;]

[FORMAT <变量1> <输出格式1>. <变量2> <输出格式2>. …;]

RUN;

其中PROC FREQ语句调用FREQ过程,标志FREQ过程的开始;

TABLES语句用于创建有关变量所构成的各种表格并进行相应的假设检验和计算,可以多次使用。

例如:proc freq data = ;

tables R_Id Income;

RUN;

这个语句提供了频数,所占百分数,累计频数,和累计百分数!