第04章_SAS过程步与过程步语句

格式：ppt
大小：93.00 KB
文档页数：17

下载文档原格式

/ 17

第04章 SAS过程步与过程步语句

第4章SAS过程步与过程步语句摘要：本章讲授过程步一般形式，SAS过程步的常用语句，程序设计中通用的SAS语句，学习过程步常用有关语句功能及其用法。

为后面统计分析过程的调用作好准备。

SAS过程步用来调用系统提供的标准常用过程或统计分析过程，对指定的SAS 数据集进行处理，并将分析结果显示输出到OUTPUT窗口。

一个过程步是一个功能程序模块，调用不同的过程可实现用不同方法对数据进行分析。

§4.1 SAS过程步的一般形式通常，SAS过程步的一般形式为：PROC 过程名选择项;[其他相关过程步语句;]RUN;说明：1．PROC表示一个过程的开始；“过程名”可以是后面各章节将要介绍的常用过程名或统计过程名。

不同的过程有不同的专用SAS名，而且各有一些可供选择的选择项（参数），对于同一过程，给定不同的参数，输出不同的计算结果和不同表格形式。

2．选项：选择项一般以关键字为核心构成，常用下面三种形式：①关键字在过程中，一个关键字代表该过程的某一特性，若关键字作为选项出现，则过程处理数据或输出结果时，这一特性予以考虑。

否则，忽略这一特性。

②关键字=值过程的某一特性可取不同的值，则指定该特性的书写格式为：特性关键字=特性值（数字或字符串）。

③关键字=SAS数据集有些过程需要特定的输入数据集，有些过程可以建立一些特殊的数据集。

过程指定特别输入输出数据集的选项书写格式为：关键字=数据集名该形式规定输入或输出的数据集，最常用的是DATA=数据集，指出本过程要处理的数据集名称，若缺省，则使用最新建立的数据集。

如“PROC PRINT DATA=new;”。

3．其他相关过程步语句：有VAR、ID、BY、CLASS、WEIGHT等过程步语句，将在下一节中讲述。

4．RUN的作用是通知系统开始执行本过程程序段，当一个程序文件中有几个过程时，它们可共用一个RUN语句。

5．常用的过程步名称及功能：SAS程序中涉及的过程多达数百种，实现统计功能时常用的过程也有数十种之多，现将最为常用的过程名称及其所能实现的功能列入下表（表4.1），以便各位提前热热身。

SAS过程步操作基础PPT课件

某些SAS过程同时兼备上述分类的两项以上功能，如 means过程、freq过程等既具有统计计算功能，又具有报表输出功能。
7
报表输出过程
CALENDLOT PRINT REPORT
SQL SUMMARY TABULATE TIMEPLOT
8
统计计算过程
对于指定的SAS数据集，contents过程将列出数据集的各种属性信息，以及所包含的全部变量及其属性。
有关变量信息的列表将按照字母顺序排列，变量属性信息包括变量类型、长度、标签以及格式等。
contents过程的一般形式如下： proc contents data=SAS-data-set options; run;
用户所能调用的SAS过程取决于安装SAS时所包含的模块。
不同的SAS模块包含着执行相应功能的一个或多个 SAS过程。
3
过程步程序的一般结构
以proc语句开始、run语句结束；过程步程序包含以下三方面的内容：
（1）proc语句，其中包含proc关键字、所要使用的过程名以及所要处理的数据集等；
FORMAT FSLIST IMPORT OPTIONS OPTLOAD OPTSAVE PDS
PDSCOPY PMENU PRINTTO PRTDEF PRTEXP REGISTRY RELEASE
SORT SOURCE SQL TAPECOPY TAPELABEL TEMPLATE TRANSPOSE
14
print过程
print过程用于将数据集中的全部或特定内容输出显示。可通过特定语句实现对选定列（变量）和特定行（观
测）的输出显示。 print过程功能特性：自动格式化，以变量名称或标签
为列标题，选择性输出，特定的by格式以及id格式。 print过程的一般形式：

SAS过程步通用语句

• Proc print data=class1;run; Title “title for two procedure”; Proc means data=class1; Var weight; Run;
10. LABEL 语句
• 格式：label 变量＝‚标识‛
• 功能：给变量赋以标记，输出时代替变量名。
• 第四句是其它SAS语句，仅允许使用by语句。
• 最后是过程结束语句。 rank过程步和sort过程步一样，不产生任何输出信息，必须借助于print 过程步，才能看到新数据集的结果。
rank过程步和sort过程步的区别
rank过程步不改变所有变量的观察值的顺
序，而s过程名。
过程步名
SORT PRINT UNIVARIATE MEANS
功能
将指定的数据集按指定的变量排序将数据集中的数据列表输出对指定的数值变量进行统计描述对指定的数值变量进行统计描述
FREQ
TTEST ANNOVA
对指定的计数变量进行统计描述
对指定的变量做t 检验对指定的变量做方差分析
3. rank 过程步
将SAS数据集中指定的变量的值按从小到大的顺序附给一个序数，也称为秩次。产生的新变量称为是原变量对应的秩次变量。结构： proc rank data=SAS数据集名；
var SAS变量名；
ranks 新变量名；其它SAS语句； run；
3. rank 过程步
• proc rank 语句，表明要建立SAS变量的秩次变量。 • 第二句是var 语句，指明数据集中要被秩次转换的变量。 • 第三句是ranks语句，给出秩次转换后新的变量名。若该句缺省，则新变量名覆盖原变量名。

SAS系统讲义第4章

• 例1：显示数据集dst.lonpar的内容，产生一个最简单的列表。 proc print data=dst.lonpar; run; • Output窗口中显示如下运行结果：
• 例2：修改上例的程序，去掉OBS列，并使变量按如下顺序显示（VAR语句）。 proc print data=dst.lonpar noobs; var flight date dest boarded revenue; run; • 运行结果如下：
• 例3：修改上例的程序，添加WHERE语句设置显示条件。
proc print data=dst.lonpar noobs; var flight date dest boarded revenue; where revenue between 155000 and 170000; run;
• 运行结果如下：
– 分类变量（Class Variable）的特性：
• 数据类型：数值型或字符型； • 如果是数值型变量，则代表一些离散的值； • 可以将数据分类，以便在每个类上进行计算和分析。
– 分析变量（Analysis Variable）的特性：
• 必须是数值型变量； • 适于作各种统计运算，例如计数、求和、平均、百分比等。
• 2.过程步TABULATE
– 2.1功能
• 产生一个格式化的汇总表格，并可以对其进行修饰； • 计算一些简单的统计量，包括：
– 频数、均值、标准差、最小值、最大值、极差、总和、百分数。
– 2.2最简形式
PROC TABULATE [DATA=数据集名] [/选项]; CLASS 分类变量1 [分类变量2 ……]; VAR 分析变量1 [分析变量2 ……]; TABLE 页表达式,行表达式,列表达式 [/选项]; RUN;

SAS统计软件过程步通用语句

M 10 Weight 10 108.9500000 22.7271864 83.0000000 150.0000000 Height 10 63.9100000 4.9379370 57.3000000 72.0000000
----------------------------------------------------------------------------------------------------------------
的输出变量名。
例10.15 应用举例。
proc means data=ResDat.class;
var height weight;
output out=out_m mean=h_m w_m ;
run; 例中，过程MEANS计算变量HEIGHT和 WEIGHT的均值统计量。关键词MEAN=规定输出数据集OUT_M中的变量为 H_M 和W_M。H_M和 W_M 分别表示变量 HEIGHT和 WEIGHT的均值。
例10.13 应用BY语句。 proc means data=ResDat.class; var weight height; by sex; output out=b mean=w_m h_m; ; run;
OUTPUT窗口输出： ----------------------------------------- Sex=F ----------------------------------------------------
-----------------------------------------------------------------------------------------
MODEL语句

SAS语句

sas有两种语句：数据步和过程步。

在sas中，通过数据步和过程步来使用sas语言的元素。

数据步：是一组语句组合：从外部文件中读取数据；将数据写入到外部文件中；读取sas数据文件和视图；创建sas数据文件和视图。

过程步：对sas数据集进行分析和产生报表。

例如：对数据集进行分析、画图、查询和打印等操作。

逻辑库：由一组sas文件组成。

sas软件系统的信息组织有两层，第一层是sas逻辑库，第二层是sas文件。

sas逻辑库是一个逻辑概念，本事并不是物理实体，它对应的实体是操作系统下一个文件夹或几个文件夹中的一组sas文件。

sas逻辑库是一组存储在同一目录下被同一引擎访问的文件，其他文件也可以存放在该目录下，但是只有能被sas识别的文件才能显示在逻辑库中。

建立sas逻辑库：用libname语句libname libref <engine>'sas-data-library'其中libref是逻辑库名，sas-data-library是逻辑库对应的物理地址，engine：引擎名称。

libname resdat 'D:\resdat';--创建逻辑库resdat，对应的物理文件夹为D:\resdatlibname a ('d:\resbd\','d:\resfin\');--多个文件夹创建一个sas逻辑库临时逻辑库；指它的内容只在启动sas时存在，退出sas时内容完全被删除。

系统默认的临时逻辑库为work，引用临时库中的文件时，可以不加库名work。

永久逻辑库：它的内容在sas关闭对话之后仍旧保留，直到再次修改或删除。

sas除了work 以外的逻辑库都是永久库。

引用永久逻辑库的文件时必须加上永久逻辑库名。

例如：sashelp.Abmfolder库引擎：是一组规定格式想逻辑库读写文件的内部命令。

每个sas逻辑库都对应一个库引擎。

sas逻辑库引擎是软件的一个元件用来组建sas与sas逻辑库之间的接口。

SAS分析常用的过程过程步大全

SAS分析常用的过程过程步大全为区分过程名称的拼写，故意部分小写，以便识别和记忆。

基本SAS程序代码结构：---------PROC MODE data=Arndata.moddat; /* 命令的解释*/var y x1-x6; /* 命令的解释 */model y = x1-x6;run;------------------------------------------正态性检验PROC UNIvariate---------PROCUNIvariate data=Arndata.unidat;var x1;run;------------------------------------------相关分析和回归分析PROC REG 回归---------PROC REG data=Arndata.regdat;var y x1-x6;model y = x1-x6 / selection=stepwise;/* 加入逐步回归选项 */print cli; /* 加入输出预测结果部分，还可以输出acov,all,cli,clm,collin,collinoint,cookd,corrb,covb,dw(时序检验统计量),i,influence,p,partial,pcorr1,pcorr2,r,scorr1,scorr2,seqb,spec,ss1,ss2,stb,tol, vif(异方差检验统计量),xpx*/plot y*x2 / conf95; /* 做散点图 */run;---------------------------------------------------DATA Arndata.regdat;x2x2 = x2*x2;x1x2 = x1*x2;PROC REG data=Arndata.regdat;var y x1 x2 x2x2 x1x2 ; /* 多项式回归,非线性回归 */model y = x1 x2 x2x2 x1x2 / selection=stepwise; /* 加入逐步回归选项*/print cli;plot y*x2 / conf95; /* 做散点图 */run;------------------------------------------PROC RSreg 二次响应面回归PROC ORTHOreg 病态数据回归PROC NLIN 非线性回归PROC TRANSreg 变换回归PROC CALIS 线性结构方程和路径分析PROC GLM 一般线性模型PROC GENmod 广义线性模型方差分析PROC ANOVA 单因素均衡数据和非均衡数据---------PROC ANOVA data=Arndata.anovadat; /* 命令的解释 */class typ; /* 命令的解释 */model y = typ; /* 可以看出此处是单因素方差分析(分类型自变量对数值型自变量的影响) */run;------------------------------------------PROC GLM 多因素非均衡数据:---------PROC GLM data=Arndata.glmdat; /* 命令的解释*/class typea typeb; /* 命令的解释 */model y = typea typeb; /* 可以看出此处是不考虑交互作用的多因素方差分析(分类型自变量对数值型自变量的影响) */run;---------------------------------------------------PROC GLM data=Arndata.glmdat; /* 命令的解释*/class typea typeb; /* 命令的解释 */model y = typea typeb typea*typeb; /* 可以看出此处是考虑交互作用的多因素方差分析(分类型自变量对数值型自变量的影响) */run;------------------------------------------主成分分析PROC PRINcomp---------PROCPRINcomp data=Arndata.pmdat n=4 out=w1 outstat=w2 ;var x1-x6;PROC print data=w1;PROC plot data=w1 vpct=80; /* 一句话，其实print就是plot输出图形的文字形式而已 */plot prin1*prin2 $ districts='*'/haxis=-3.5 to 3 by 0.5 HREF=-2,0,2vaxis=-3 to 4.5 by 1.5 HREF=-2,0,2; /* 主成分的散点图，也就是载荷图 */run;------------------------------------------因子分析PROC FACTOR---------PROC FACTOR data=Arndata.factordat simple corr ;var y x1-x6;title'18个财务指标的分析';title2'主成分解';run;PROC FACTOR data=Arndata.factordatn=4 ; /* 选择4个公共因子 */ var y x1-x6;run;PROC FACTOR data=Arndata.factordat n=4rotate=VARImaxREorder; /* 因子旋转：方差最大因子法 */var y x1-x6;run;------------------------------------------PROC SCORE---------PROC FACTOR data=Arndata.factordat n=4rotate=VARImax REorder score out=score_Out; /* 输出因子得分矩阵 */run;PROC print data=score_Out;var districts factor1 factor2 factor3 factor4;run;PROC plot data=score_Out;plot factor1*factor2 $ districts='*' / href=0 Vref=0; /* 因子的散点图，也就是载荷图 */run;------------------------------------------典型相关分析PROC CANcorr基本SAS程序代码结构：---------DATAjt(TYPE=CORR); /*TYPE=CORR 表明数据类型为相关矩阵，而不是原始数据, type还可以是cov,ucov,factor,sscp,ucorr等*/input names$ 1-2(x1 x2 y1-y3)(6.); /* name $ 表示读取左侧的变量名，1-2表示变量名的字符落在第1,2列上 */cards;x1 1 0.8 ……x2 ……y1 ……y2 ……y3 ……;PROC CANcorrdata=Arndata.cancorrdatedf=70 redundancy; /* 误差自由度的参考值，默认值是n=1000；redundancy表示输出冗余度分析的结果 */var x1 x2;with y1 y2 y3;run;------------------------------------------对应分析 /* 交叉表分析的拓展，寻找行和列的关系，一般行指代各种cases，而列代表各种visions */PROC CORResp---------PROC CORRespdata=Arndata.correspdat out=result;var x1-x6;id Type;run;options ps=40;proc plot data=result;plot dim2*dim1="*" $ Type / boxhaxis=-0.2 to 0.3 by 0.1Vaxis=-0.1 to 0.3 by 0.1Href=0 Vref=0;run;------------------------------------------聚类分析PROC CLUSTER---------PROC CLUSTER data=Arndata.clusdatmethod=ave outtree=clusdat_Out;var x1-x6;id datid;run;proc tree horizontal; /* 做聚类树 */run;------------------------------------------PROC FASTclus---------PROC FASTclus data=Arndata.clusdatmaxclusters=3 list out=clusdat_Out;var x1-x6;id datid;run;------------------------------------------PROC ACEclusPROC VARCLUS---------PROC VARclus data=Arndata.clusdat;/* 系统默认使用主成分法聚类 */var x1-x6;run;---------PROC VARclus hierarchy data=Arndata.clusdat; /* 保证分析过程中不同水平的谱系结构 */var x1-x6;run;---------PROC VARclus centroid data=Arndata.clusdatouttree=clusdat_out; /* 使用重心法聚类 */ var x1-x6;run;------------------------------------------PROC TREE---------PROC TREE data=Arndata.clusdat horizontal; /* 使用TREE过程绘制聚类谱系图*/var x1-x6;run;------------------------------------------判别分析PROC DISCRIM---------PROC DISCRIM data=Arndata.discrimdatlist out=discrimdat_Out distance pool=yes;class Typ; /* 指定分类变量 */var x1-x6; /* 用于建立判别识别函数的变量 */id iddiscrim; /* 标注样本的变量 */run;---------第二种方法，将需要判别的新样本放在testdata里：---------PROC DISCRIM data=Arndata.discrimdat1testdata=Arndata.discrimdat2testlist testout=discrimdat_Out; /* 将原来的几个选项加注test标示 */class Typ; /* 指定分类变量 */var x1-x6; /* 用于建立判别识别函数的变量 */id iddiscrim; /* 标注样本的变量 */run;------------------------------------------PROC STEPdisc：逐步判别分析过程---------PROC STEPdisc method=stepwise data=Arndata.discrimdatSLentry=0.10 SLstay=0.10; /* 设定引入和剔除的显著性水平 */class Typ; /* 指定分类变量 */var x1-x6; /* 用于建立判别识别函数的变量 */run;------------------------------------------PROC CANdisc： Fisher判别分析过程---------PROC CANdiscdata=Arndata.discrimdatout=discrimdat_Outdistance simple;class Typ; /* 指定分类变量 */var x1-x6; /* 用于建立判别识别函数的变量 */run;proc print data=discrimdat_Out;run;-----------------------------------------------------------------------------------------------------------------------------------------------------------友情协助：特征库豆瓣统计学小组 /group/stats。

SAS应用基础4

21
LINK语句
一般形式：
LINK 标号；功能：该语句指示DATA步立刻到标号处执行，执行到 RETRUN语句时才回到LINK的下一语句处执行。LINK与RETRUN间的语句相当于一段子程序。
22
示例
data tmp; input x y@@; z=x; link change; x=z; z=y; link change; y=z; return; change: if z=4 then z=999; return; cards; 1234 run;
19
GOTO语句
一般形式：
GOTO 标号；
功能：
立刻无条件地转到标号后的语句去执行，而不是执行GOTO语句的下一行语句。标号为一个始于字母或下划线、长度不超8字符的字符串，它于后继语句间用冒号分隔。
20
RETURN语句
一般形式：
RETURN；功能：该语句要求DATA步停止执行后继语句，输出当前观测到数据集，并从头开始对下一个观测执行 DATA 步。但注意，当 RETURN 语句在 LINK语句后进行配合时，它只是指示程序返回到LINK语句之后的一条语句去执行。
11
算术运算符
算术运算符是表示进行各种算术计算的符号。
SAS中的算术运算符有： ** （乘方） * （乘） + （加）－（减） / （除）
12
关系运算符
关系操作符是表示对两个数据量进行关系判断的符号。 SAS中的关系操作符是：
= 、EQ （等于） ^= 、NE （不等于）
> 、GT （大于）
格式2：
DO 循环变量=值1，值2，…，值n；循环体； END；
功能为满足循环条件（从初值到终值计数）时重复执行循环体内的SAS语句。

SAS过程步操作基础

推断性统计分析
01
推断性统计分析
通过样本数据推断总体特征，对总体参数进行估计和检验，从而对总体做出科学推断。
02
推断性统计分析的步骤
1.确定研究问题；2.选择合适的统计方法；3.收集样本数据；4. 进行统计分析；5.结果解释和推断。
03
推断性统计分析的常用方法
t检验、方差分析、回归分析、卡方检验等。
01
文本格式
如CSV、TXT等，适合于与其他软件或系统进行数据交换。
电子表格格式
如Excel、OpenOffice等，适合于数据分析与可视化。Biblioteka 0302数据库格式
如SQL、Access等，适合于存储在数据库中。
统计报告格式
如PDF、DOC等，适合于生成统计报告或文档。
04
数据保存路径选择
本地存储
SAS过程步的分类
总结词
SAS过程步可以根据其功能和应用场景分为多种类型。
详细描述
根据其功能和应用场景，SAS过程步可以分为多种类型，如数据输入/输出过程步（如`INPUT`和`OUTPUT`）、数据转换过程步（如`IF`、`WHERE`、`SET`等）、数据筛选过程步（如`WHERE`）、数据分组和汇总过程步（如`GROUP BY`、`SUM`等）、数据标签和格式化过程步（如`LABEL`、`FORMAT`）等。这些过程步在数据处理过程中起着不同的作用，能够完成各种复杂的数据处理任务。
THANKS
SAS过程步操作基础
目录
Contents
• SAS过程步概述 • 数据输入与处理 • 数据分析与可视化 • 数据输出与保存 • SAS过程步进阶操作
01 SAS过程步概述

第4章 SAS过程步与过程步讲义

信管2班成绩
第4章过程步与过程步语句
OPTIONS语句语句 OPTIONS语句用于改变SAS系统环境设置，环境设置的参数由语句中的选项给出，语句的格式为： OPTIONS 选项选项; SAS提供了二十多个OPTIONS的选项，用户可以在命令行键入OPTIONS查看OPTIONS窗口中列出的全部选项。下面通过介绍几个常用选项来说明 OPTIONS作为语句的使用方法。 (1) LINESIZE=n，其中n为正整数，n的值指定SAS输出时每一行的字符个数。 (2) PAGESIZE=n，n的值指定SAS输出时每一页的行数。
第4章过程步与过程步语句
4.2 常用过程步语句
4.2.1 VAR语句语句格式： VAR 变量表; 说明：指定过程步中参与数算。例如:数据步产生x1-x10这10个数据集变量，而我们只对后8个数据感兴趣,则可用该语句指明var x3-x10; 4.2.2 ID语句语句格式： ID 变量; 说明：某些过程的输出结果与观测有关，ID语句指定的变量值用于区分不同的观测。如果ID语句缺项，则用观测的序号来区分不同的观测。
第4章过程步与过程步语句
在图4.1表编辑器的第一行“A”、“B”、“C”、... 各框内顺序输入数据集的各个变量名；而后在以下的各行内输入各个观测的数据值即可。在输入完成后，如图4.2所示。
图4.2
这时需要保存建立的数据集到一个逻辑库中且退出这种建立数据集的状态。操作：“文件（F）”→ “保存（S）”，弹
（1）SAS数据集转换为其它数据文件（导出数据）为了叙述方便，假设以下的操作是将存放在c:\mydir下的数据集myset1转换为EXCEL文件sastoexcel.xls,并且将数据集 myset1与逻辑库mylib建立联系。操作如下： “文件（F）” → “导出数据（R）”，系统弹出如图4.8的导出数据窗口。在该窗口内的Library框内选择Mylib并且在 Member框内输入myset1,点击“Next”后系统弹出如图4.9的窗口，在列出的项目中，选择“Microsoft Excel 97,2000 or 2002 Workbook”，点击“Next”后系统弹出如图4.10的窗口，在 Workbook框内输入(或者浏览选择)转换后的EXCEL文件的

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

4.1 SAS过程步的一般形式过程步的一般形式
其他相关过程步语句：其他相关过程步语句：有VAR、ID、BY、CLASS、WEIGHT等、、、、等过程步语句。过程步语句。 RUN语句： RUN语句：语句作用是通知系统开始执行本过程程序段，作用是通知系统开始执行本过程程序段，当一个程序文件中有几个过程时，当一个程序文件中有几个过程时，它们可共用一个RUN语句。语句。共用一个语句
4.2.6 WEIGHT语句语句
功能：在有些试验中的某一变量（功能：在有些试验中的某一变量（列）的值表示所在DATA student;的相关权重，该变量必须用观测（行） INPUT curr$ x1-x7 wgt; WEIGHT语句来说明。语句来说明。语句来说明 CARDS; 格式：WEIGHT75 60 76 73 77 68 78 0.15 格式： English 变量；说明：说明： Chinese 80 70 81 82 83 78 84 0.35
4.1 SAS过程步的一般形式过程步的一般形式
选项：以关键字为核心构成，常有三种形式：选项：以关键字为核心构成，常有三种形式：
①关键字在过程中，关键字代表该过程的某一特性，在过程中，关键字代表该过程的某一特性，若关键字作为选项出现，若关键字作为选项，这一特性予以考虑。否则，忽略这一特性。 ②关键字=值过程的某一特性可取不同的值，则指定关键字= 过程的某一特性可取不同的值，该特性的书写格式为：该特性的书写格式为：特性关键字= 数字或字符串）。特性关键字=特性值（数字或字符串）。关键字=SAS数据集有些过程需要特定的输入数据 ③关键字数据集有些过程可以建立一些特殊的数据集。集，有些过程可以建立一些特殊的数据集。过程指定特别输入输出数据集的选项书写格式为：特别输入输出数据集的选项书写格式为：关键字= 关键字=数据集名如: PROC PRINT DATA=new
4.2.7 MODE语句语句
功能：功能：为一些统计分析过程指定所要进行分析的模型形式，模型形式，及给出模型包含的自变量和因变量的个数以及变量名。个数以及变量名。格式：MODE 因变量表自变量表选项；因变量表=自变量表选项；格式：说明：其中因变量表中的变量个数等于要进行分说明：析的模型个数。析的模型个数。自变量表给出模型包含的自变量名及其自变量的运算组合。名及其自变量的运算组合。例如： X*X；例如：MODEL Y=X X*X；
Math 66 88 67 77 59 57 92 0.30 在此语句中只能定义一个加权变量， 81 0.20 在此语句中只能定义一个加权变量，并以它的值作为 Agronomy 87 85 97 68 68 75 观察值的权值。本语句也叫作权重变量标识语句。观察值的权值。本语句也叫作权重变量标识语句。 PROC MEANS MEAN STD; VAR 个学生的4门课程成绩进行综合评估，例如： x1-x7; 例如：对7个学生的4门课程成绩进行综合评估，不同 WEIGHT wgt; 课程权重不同，可用下列程序段实现：课程权重不同，可用下列程序段实现： RUN;
Tabulate 将数据按指定的分类变量以表格的形式分类汇总 Means Freq 对指定的数值变量进行简单的统计描述对指定的分类变量进行简单的统计描述
过程名 Ttest
功能 4.1 SAS过程步的一般形式过程步的一般形式对指定的变量做t检验对指定的变量做检验对指定的变量做方差分析对指定的变量做非参数检验对指定的变量做回归分析对指定的变量做相关分析对指定的变量做判别分析对指定的变量做聚类分析绘出低分辨率的统计图提供用户自定义的输出格式对两个变量作的散点图或折线图
4.1 SAS过程步的一般形式过程步的一般形式
一般形式：一般形式：
PROC 过程名选择项选择项; [其他相关过程步语句其他相关过程步语句;] 其他相关过程步语句 RUN;
说明：说明：
PROC表示一个过程的开始；过程名” PROC表示一个过程的开始；“过程名” 是指被调用的表示一个过程的开始常用过程或统计过程。不同的过程有专用过程名，常用过程或统计过程。不同的过程有专用过程名，对于同一过程，可供选择的选择项（参数）于同一过程，可供选择的选择项（参数），给定不同选择项的参数，输出不同的计算结果和不同表格形式。的参数，输出不同的计算结果和不同表格形式。
4.1 SAS过程步的一般形式过程步的一般形式
常用的过程步名称及功能：常用的过程步名称及功能：
SAS程序中涉及的过程多达几百种，实现统程序中涉及的过程多达几百种，程序中涉及的过程多达几百种计功能时常用的过程也有数十种。计功能时常用的过程也有数十种。
过程名 Sort Print 功能将指定的数据集按指定变量排序将数据集中的数据列表输出
4.2.3 BY语句语句
4.2.4 CLASS语句语句
功能：指定分类变量。功能：指定分类变量。在一些分组统计过程中，在一些分组统计过程中，要对数据进行分类处理，用该语句给出分类的依据变量名，处理，用该语句给出分类的依据变量名，进行各种组合处理。种组合处理。格式：格式：CLASS 变量表；说明：说明： CLASS语句的作用类似于语句，但 BY语语句的作用类似于BY语句语句的作用类似于语句，语句要求先排序，另外二者之间的输出格式也不同。句要求先排序，另外二者之间的输出格式也不同。
4.2.5 FREQ语句语句
功能：指定一个数值变量，功能：指定一个数值变量，它的值表示工作数据集中观察值重复出现的频数。值重复出现的频数。 DATA height; 会截去小数部分，若此变量不是一个整数，SAS会截去小数部分，只取若此变量不是一个整数，会截去小数部分 INPUT height number@@; 其整数部分。该变量通常称作频数变量，其整数部分。该变量通常称作频数变量，该语句也叫频数变量标识语句。变量标识语句。 CARDS; 75 20 76 23 77 28 78 38 79 52 格式：格式：FREQ 变量； 80 40 81 32 83 28 84 23 85 16 说明：说明： PROC MEANS; 在某些试验中，同一观测值多次出现，在某些试验中，同一观测值多次出现，这样在数据集 VAR height; 中增加 1 个变量，用来number; 观测出现的次数。用 FREQ 记录每一 FREQ语句可减少数据输入，加快计算。语句可减少数据输入，语句可减少数据输入加快计算。 RUN;
4.3 通用的通用的SAS语句语句
RUN语句语句
功能：可使前面的过程被执行。功能：可使前面的过程被执行。一般一个过程步的最后是一个RUN语句，也可几个过程步合用语句，的最后是一个语句一个RUN语句。语句。一个语句格式：格式：RUN;
4.3 通用的通用的SAS语句语句
指出模型将包含自变量X 指出模型将包含自变量X的一次项和二次项
4.2.8 OUTPUT语句语句
功能：功能：用来将所在过程的结果输出到一个新的 SAS数据集中。输出数据集可作为下一步处理的数据集中。数据集中输入。输入DATA new; 。
INPUT x y@@; 格式：OUTPUT OUT=数据集名格式：数据集名 CARDS; [统计关键字变量名；统计关键字=变量名统计关键字变量名]； 10 20 11 12 说明：统计关键字指明在新的数据集中包含的统说明PROC UNIVARIATE; ： VAR x y; 计量，变量名是给这些统计量所起的名字。计量，变量名是给这些统计量所起的名字。对多 OUTPUT OUT=mydata MEAN=mx meany 个变量进行分析时，OUTPUT语句中统计关键字后个变量进行分析时， OUTPUT语句中统计关键字后 STD=stdx; 所跟变量名需要根据VAR 语句内所列变量的顺序， VAR语句内所列变量的顺序所跟变量名需要根据 VAR 语句内所列变量的顺序， RUN; 对应的一一列举，未列举者不予输出。对应的一一列举，未列举者不予输出。
4.2.2 ID语句语句
功能：指定用于区分不同观测的变量。功能：指定用于区分不同观测的变量。格式：变量；格式：ID 变量；例 data; 说明：说明：
input name$ sex$ age; 其中，变量是一个数据集变量，通常称为“ 其中，变量是一个数据集变量，通常称为“标 cards; 识变量” 不同的观测中该变量的值不同，识变量 ” ，不同的观测中该变量的值不同，某些 aa f 34 ab 25 过程的输出结果与观测有关，语句指定的变量过程的输出结果与观测有关f，ID语句指定的变量 ba m 56 值用于区分不同观测；如果ID语句省略语句省略，值用于区分不同观测；如果语句省略，则用观 bb m 21 测的序号来区分不同的观测。测的序号来区分不同的观测。 proc print; id name; run;
data student; input bj$ xm$ yy gs; 功能：过程步将数据集数据按指定的变量以升序功能：过程步将数据集数据按指定的变量以升序 p=yy+gs; cards; 进行分组处理。 1 aaa 89 91 格式：变量；格式：BY 变量； 2 bbb 70 88 例如：将学生的成绩输入，作为一个数据集，例如：将学生的成绩输入，作为一个数据集，再用班级进 1 ccc 90 92 行分组。行分组。 2 ddd 70 87 2 eee 85 83 proc print; proc sort; by bj gs; proc print; run;
第4章 SAS过程步与过程步语句章过程步与过程步语句

第04章_SAS过程步与过程步语句

合集下载