SAS上机练习总结
- 格式:ppt
- 大小:901.00 KB
- 文档页数:53
第一章 什么是统计?统计学(statistics )是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。
统计=数据+模型+不确定性• 总体:根据研究目的确定的全部同质的观察对象某项观察值的集合。
• 样本:根据随机化的原则,从总体中抽出有代表性的部分观察单位,其实测值的集合。
总体是包含所有要研究的个体(element)的集合。
而样本是总体中选出的一部分。
• 定量资料和定性资料(之间的转换,主要是将定量资料分组)• 概率:反映随机事件发生可能性大小的量,是在0和1之间(包含0或1)的一个数。
注:对小概率事件的理解。
• 统计量:根据样本中的个体值计算出来的描述样本特征的指标,常用英文字母表示。
• 样本统计量可表达为任何样本的函数。
(注:总体参数是常数,而样本统计量可随样本不同而不同。
)包括均值(mean )、中位数(median)、众数(mode)、总体方差(various )、 标准差( standard deviation )、样本方差、上下四分位数、 k-百分位数、极差(range) 、峰度(Kurtosis )、偏度(Skeewness )、变异系数(CV )。
• 对于定性变量来说,有饼图和条形图;而对于定量变量,有直方图、茎叶图、盒形图和散点图等。
• 统计表的制作可以利用Excel 中的 “数据”菜单中的“数据透视表和图表报告”选项。
• 统计图可以用Spss 中的Graph 或Analyze-Descriptive Statistics-Explore 制作。
题目:30例6-7岁正常男童胸围(cm)测量结果51.6 54.1 59.3 57.5 52.4 57.1 53.8 52.7 54.0 57.3 59.8 53.9 52.0 54.9 52.3 52.8 57.7 54.5 51.4 54.6 52.1 54.3 57.3 54.8 59.356.453.461.854.854.758.149.1上机练习1:1、 利用Excel ,公式计算均值、中位数、众数、总体方差、标准差、样本方差、上下四分位数、 k-百分位数、极差(range)、变异系数(CV )、置信度为95%的置信区间、双侧95%的参考值范围。
重庆医科大学--卫生统计学统计软件包SAS上机练习题(一)1、SAS常用的窗口有哪三个?请在三个基本窗口之间切换并记住这些命令或功能键。
2、请在PGM窗口中输入如下几行程序,提交系统执行,并查看OUTPUT窗和LOG窗中内容,注意不同颜色的含义;并根据日志窗中的信息修改完善程序。
3、将第2题的程序、结果及日志保存到磁盘。
4、试根据如下例1的程序完成后面的问题:表1 某班16名学生3门功课成绩表如下问题:1)建立数据集;2)打印至少有1门功课不及格同学的信息;(提示,使用if语句)参考程序:data a;input id sh wl bl;cards;083 68 71 65084 74 61 68085 73 75 46086 79 80 79087 75 71 68084 85 85 87085 78 79 75086 80 76 79087 85 80 82088 77 71 75089 67 73 71080 75 81 70118 70 54 75083 70 66 84084 62 73 65099 82 70 79;run;data b;set a;if sh<60 or wl<60 or bl<60then output;run;proc print data=b;var id sh wl bl;run;5、根据下列数据建立数据集表2销售数据开始时间终止时间费用2005/04/28 25MAY2009 $123,345,0002005 09 18 05OCT2009 $33,234,5002007/08/12 22SEP2009 $345,600提示:(计算,如果读入错误,可试着调整格式的宽度;显示日期需要使用输出格式) 开始时间,输入格式yymmdd10.终止时间,输入格式date10.费用,输入格式dollar12.参考程序:data a;input x1 yymmdd10. x2 date10. x3 dollar13.;cards;2005/04/28 25MAY2009 $123,345,0002005 09 18 05OCT2009 $33,234,5002007/08/12 22SEP2009 $345,60020040508 30JUN2009 $432,334,500;run;proc print;run;proc print;format x1 yymmdd10. x2 date9. x3 dollar13.;run;6、手机号码一编码规则一般是:YYY-XXXX-ZZZZ,其YYY为号段;XXXX一般为所在地区编码;ZZZZ为对应的个人识别编号。
SAS编程技术课后习题总结(大全)第一篇:SAS编程技术课后习题总结(大全)第一章1.缺省情况下,快捷键F1, F3, F4, F5, F6, F7, F8, F9和Ctrl+E 的作用是什么?F1帮助,F3 end,F4 recall调回提交的代码,F5 激活编辑器窗口,F6激活日志窗口,F7键激活输出窗口,F8 提交,F9键查看所有功能键功能,Ctrl+E键清除窗口内容。
2.缺省情况下SAS系统的五个功能窗口及各自的作用是什么?怎样定义激活这些窗口的快捷键?1)资源管理器窗口。
作用:访问数据的中心位置。
2)结果窗口。
作用:对程序的输出结果进行浏览和管理。
3)增强型编辑器窗口。
作用:比普通编辑窗口增加了一些功能,如定义缩写,显示行号,对程序段实现展开和收缩等。
4)日志窗口。
作用:查看程序运行信息。
5)输出窗口。
查看SAS程序的输出结果。
3.怎样增加和删除SAS工具?使用菜单栏中的工具=>定制=>“定制”标签实现工具的增加和删除。
4.SAS日志窗口的信息构成。
提交的程序语句;系统消息和错误;程序运行速度和时间。
5.在显示管理系统下,切换窗口和完成各种特定的功能等,有四种发布命令的方式:即,在命令框直接键入命令;使用下拉菜单;使用工具栏;按功能键。
试举例说明这些用法。
如提交运行的命令。
程序写完后,按F3键或F8键提交程序,或单击工具条中的提交按纽,或在命令框中输入submit命令,或使用菜单栏中的运行下的提交,这样所提交的程序就会被运行。
6.用菜单方式新建一个SAS逻辑库。
在菜单栏选择工具—》新建逻辑库出现如图所示界面。
在名称中输入新的逻辑库名称。
在引擎中根据数据来源选择不同的引擎,如果只是想建立本机地址上的一个普通的SAS数据集数据库,可以选择默认。
然后选中“启动时启用”复选框,在逻辑库信息中,单击路径后的“浏览”按钮,选择窗口可以不填,单击确定产生一个新的逻辑库。
7.说明下面SAS命令的用途并举例: keys,dlglib,libname,dir,var,options,submit,recall.Keys激活功能键的设定窗口。
1.随机取组随机取组 有无重复试验的两种有无重复试验的两种 本题是无重复本题是无重复 DATA PGM15G; DO A=1 TO 4; /*A 为窝别*/ DO B=1 TO 3; ; /*B /*B 为雌激素剂量*/ INPUT X @@; X @@; /*X /*X 为子宫重量*/OUTPUT ;END ;END ;CARDS ;106 116 145 42 68 115 70 111 133 42 63 87 ; RUN ;ods html ; /*将结果输出成网页格式,SAS9.0以后版本可用*/ PROC GLM DATA =PGM15G; CLASS A B;MODEL X=A B / X=A B / SS3SS3;MEANS A B; /*给出因素A 、B 各水平下的均值和标准差*/MEANS B / B / SNK SNK ; /*对因素B (即剂量)各水平下的均值进行两两比较*/ RUN ;ODS HTML CLOSE ;2. 2*3析因设计析因设计 两因素两因素 完全随机完全随机 统计方法统计方法 2*3析因设计析因设计 tiff =f 的开方的开方DATA aaa; DO zs=125,200;DO repeat=1 TO 2; ; /*/*每种试验条件下有2次独立重复试验*/ do js=0.015,0.030,0.045; INPUT cl @@; OUTPUT ;END ;END ;END ; CARDS ;2.70 2.45 2.60 2.78 2.49 2.72 2.83 2.85 2.86 2.86 2.80 2.87 ; run ;PROC GLM ;CLASS zs js; MODEL cl=zs js zs*js / cl=zs js zs*js / SS3SS3; MEANS zs*js;LSMEANS zs*js / TDIFF PDIFF ; ; /*/*对 zs 和js 各水平组合而成的试验条件进行均数进行两两比较*/ RUN ;ODS HTML CLOSE ;练习一:2*2横断面研究列链表横断面研究列链表 方法:卡方方法:卡方 矫正卡方矫正卡方 FISHERDATA PGM19A;DO A=1 TO 2; DO B=1 TO 2;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 2 26 8 21 ;run ;PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQ CHISQ ;RUN ;样本大小 = 57练习二:对裂列连表练习二:对裂列连表 结果变量结果变量 换和不换换和不换 三部曲三部曲 1横断面研究横断面研究 P 《0.05 RDATA PGM19B; DO A=1 TO 2; DO B=1 TO 2;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 40 3414 1 19252 ; run ; ods html ;PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQCHISQ cmh ; RUN ;ods html close ;样本大小 = 57练习三:病例对照2*2 病例组中病例组中 有何没有那个基因有何没有那个基因 是正常的3.8倍,倍, 则有可能导致痴呆则有可能导致痴呆 要做前瞻性研究要做前瞻性研究 用对裂用对裂DATA PGM20;DO A=1 TO 2; DO B=1 TO 2;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 240 60 360 340 ;run ; ods html ; PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQ CHISQcmh ; RUN ; ods html close ;总样本大小 = 1000 练习四:配对设计配对设计 隐含金标准2*2 MC 卡方卡方 检验检验 34和0在总体上在总体上((B+C 《40 用矫正卡方) 是否相等是否相等 则可得甲培养基优于乙培养基则可得甲培养基优于乙培养基 一般都用矫正一般都用矫正 因卡方为近似计算因卡方为近似计算DATA PGM19F; INPUT b c;chi=(ABS(b-c)-1)**2/(b+c);p=1-PROBCHI(chi,1);求概率 1减掉从左侧积分到卡方的值减掉从左侧积分到卡方的值 chi=ROUND(chi, 0.001);IF p>0.0001 THEN p=ROUND(p,0.0001);FILEPRINT ; PUT (打印在输出床口) #2 @10'Chisq' @30 'P value'(#表示行) #4 @10 chi @30 p; CARDS ; 34 0 ;run;ods html close;练习五:双向有序R*C列连表列连表用KPA data aaa;do a=1 to 3;do b=1 to 3;input f @@;output;end;end;cards ;58 2 31 42 78 9 17;run;ods html;*简单kappa检验;proc freq data=aaa;weight f;(频数)(频数)tables a*b;test kappa;run ;*加权kappa检验;proc freq;weight f;tables a*b;test wtkap;run ;ods html close;SAS 系统FREQ 过程频数 百分比 行百分比列百分比a *b 表a b 合计1 2 31 5839.4621.3632.046342.8692.06 86.57 3.173.774.7611.112 10.682.001.49 4228.5784.0079.2574.7614.0025.935034.013 85.4423.5311.94 96.1226.4716.981711.5650.0062.963423.13合计 6745.58 5336.052718.37147100.00a *b 表的统计量对称性检验统计量 (S) 2.8561自由度 3Pr > S 0.4144对称性检验指 总体上主对角线的上三角数相加是否与下三角三个数相加 对称性检验与KPA 检验是否一致 是否一个可以代替另一个检验 Pe理论观察一致率 独立假设性基础上计算的 相互独立简单 Kappa 系数Kappa 0.6809渐近标准误差 0.050095% 置信下限 0.583095% 置信上限 0.7788H0 检验: Kappa = 0总体的H0 下的渐近标准误差 0.0597Z 11.4112H0 检验: Kappa = 0单侧 Pr> Z <.0001双侧 Pr>|Z| <.0001总体的KPA是否为0 KPA大于0两种方法的一致性有统计学意义 小于0 不一致性有统计学意义加权的 Kappa 系数加权的 Kappa 0.6614渐近标准误差 0.056095% 置信下限 0.551695% 置信上限 0.7711置信区间不包括0 拒绝H0 按此计算结果可以用一种取代另一种方法 但要看专业要求达到多少才可以 观测一致率达到多少才可以代替样本大小 = 147FREQ 过程频数 百分比 行百分比列百分比a *b 表a b 合计1 2 31 5839.4692.0686.5721.363.173.7732.044.7611.116342.862 10.682.001.494228.5784.0079.2574.7614.0025.935034.013 85.4423.5311.9496.1226.4716.981711.5650.0062.963423.13合计 6745.58 5336.052718.37147100.00a *b 表的统计量对称性检验统计量 (S) 2.8561自由度 3Pr > S 0.4144简单 Kappa 系数Kappa 0.6809渐近标准误差 0.050095% 置信下限 0.583095% 置信上限 0.7788加权的 Kappa 系数加权的 Kappa 0.6614渐近标准误差 0.056095% 置信下限 0.551695% 置信上限 0.7711H0 检验: 加权的 Kappa = 0H0 下的渐近标准误差 0.0646Z 10.2406单侧 Pr> Z <.0001双侧 Pr>|Z| <.0001对加权的KPA 检验 与简单的(利用对角线上的数据分析)加权还要利用对角线以外的数据分析 样本大小 = 147练习六:双向无序R*C 列连表列连表 用卡方理论频数小于5没有超过五分之一,没有超过五分之一,一般用卡方一般用卡方一般用卡方 实在不行用FISHER 检验检验 超过用KPA 两种血型都是按小中大排列两种血型都是按小中大排列 相互不影响相互不影响 独立的独立的 接受H0 不一致不一致行与列变量相互不影响行与列变量相互不影响 DATA PGM20A; DO A=1 TO 4; DO B=1 TO 3;INPUT F @@;OUTPUT ;END ;END ;CARDS ;431 490 902 388 410 800 495 587 950 137 179 325 ; run ; ods html ; PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQCHISQ ;*exact; RUN ;ods html close ;样本大小 = 6094练习七:单向有序R*C 秩和检验秩和检验*方法1;(单因素非参数 HO 三个药物疗效相同 H1不完全相等)不完全相等) DATA PGM20C; DO A=1 TO 4; DO B=1 TO 3; INPUT F @@;OUTPUT ;END ;END ;CARDS ; 15 4 1 49 9 15 31 50 45 5 22 24 ; run ; ods html ;PROC NPAR1WAY WILCOXON ; FREQ FREQ F;CLASS B; VAR A; RUN ;*方法2;(FIQ CHIM ) proc freq data =PGM20C; weight f;tables b*a/ b*a/cmh cmhscores =rank; run ; ods html close ;总样本大小 = 270练习八:练习八: 双向有序双向有序 属性不同属性不同 R*C 4种目的4种方法种方法SPEARMAN 秩相关分析 DATA PGM20E; DO A=1 TO 3; DO B=1 TO 3;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 215 131 148 67 101 128 44 63 132;run ; ods html ; PROC CORR SPEARMAN ;VAR A B; FREQ F; RUN ;ods html close ;统计分析与SAS 实现第1次上机实习题一、定量资料上机实习题要求:要求:(1) 先判断定量资料所对应的实验设计类型;(2) 假定资料满足参数检验的前提条件,请选用相应设计的定量资料的方差分析,并用SAS 软件实现统计计算;(3) 摘录主要计算结果并合理解释,给出统计学结论和专业结论。
SAS课程上机练习一下面的数据是一次对20岁以上人群进行心血管病随访研究的结果,数据中各变量的含义如下:V1—随访号V2—年龄V3—开始随访时的求诊机构V4/V5—开始随访时的收缩压/舒张压V6/V7—体重/身高V8—开始随访时的胆固醇V9—社会经济地位(1-高2-中3-底)V10—原有心血管病(0-其他心脏病1-冠心病2-冠心与高心3-高心4-高心及风心5-风心6-可疑心脏病7-高血压8-正常)V11—随访结束时的求诊机构V12/V13—随访结束时的收缩压/舒张压V14—随访结束时的胆固醇V15—随访结束时的体重V16—随访结束时的最后诊断(0-未诊断1-3心肌梗塞4-7心绞痛8-9其他)V17—死亡年份(63-68)0-未死。
一、数据集练习操作1、用data步建立SAS永久数据集(下次练习可以调用此数据集)2、将年龄(V2)按20—30—40—50—及60岁以上分组3、计算体重指数={体重/身高2}*1004、将随访结束时最后诊断的结果(V16)分为四组:(1)心肌梗塞(2) 心绞痛(3)其他心脏病(4)未诊断5、按体重指数的大小( 0.30)分为二类:1-超重0-未超重6、将死亡年份(V17)按是否死亡分为二类(1为死亡,0为未死亡)。
7、将原有心血管病(V10)分为患有心血管病与不患有心血管病二类(1有0无)8、将数据集按是否死亡分为二个数据集。
9、将社会经济地位(V9)设置为哑变量。
10、计算开始随访时的收缩压与/舒张压(V4/V5)之差。
二.。
计算分析1.年龄分布的特征。
2.开始时收缩压频数分布的特征。
3·超重病人开始时胆固醇(V8)的分布的特征。
3·比较不同体重的人开始时的收缩压。
4·比较不同社会经济地位与患心血管病的差别。
5·比较心肌梗塞的病人开始时的收缩压与随访结束时的收缩压的差别。
6·比较不同年龄、不同体重(指数)间开始时的胆固醇的差别。
SAS金融数据处理综合练习题1.创建一包含10000个变量(X1-X10000),100个观测值的SAS数据集。
分别用DATA步,DATA步数组语句和IML过程实现。
(1)用data步实现data test1a;informat x1-x10000 9.2; /*创建100个变量,规定输出格*/do i=1to100; /*做循环*/output;/*每一次循环,输出所有的变量,包括i*/drop i;/*去掉i*/end;run;或者data test1a;format x1-x10000 best12.; /*创建10000个变量x1-x10000,但未有初始化*/do i=1to100; /*创建100个观测*/output;/*且每一个观测都输出到数据集test1a*/end;drop i;run;(2)用data步数组语句实现data test1b;array t{10000} x1-x10000 ;/*创建数组变量*/do i =1to100;/*每个变量有100个观测*/output;/*每一次循环,输出所有的变量,包括i*/drop i;/*去掉i*/end;/*循环结束*/data test1c;array t{10000} x1-x10000;do j=1to100;/*100次观测的循环*/do i = 1to10000;t{i}=i;/*第i个变量等于i*/end;output;/*输出第i次观测的i个变量的值*/end;drop i j;/*去掉i和j*/run;或者data test1b;array t{10000} x1-x10000;do j=1to100;/*100次观测的循环*/do i = 1to10000;t{i}=i;/*第i个变量等于i*/end;output;/*输出第i次观测的i个变量的值*/end;drop i j;/*去掉i和j*/run;(3)用IML过程实现proc iml;/*启用iml环境*/x='x1':'x10000';/*定义数组x1-x10000*/t= j(100,10000,1) ;/*创建100行10000列的. 同元素矩阵*/print t x;/*打印两个矩阵察看*/create test1d from t[colname=x];/*创建数据集c,变量数为列数,观测数为行数,列名更改为变量名,默认逻辑库为临时*/append from t; /*将t中的值填充的数据集中*/show datasets;show contents;/*显示数据集的一些7788的属性*/close test1d;run;quit;或者proc iml;x='x1':'x10000';t= shape(1,100,10000) ;/*shape和j不太一样,顺序是元素,行,列,j的顺序为行,列,元素*/print t x;create test1d from t[colname=x];append from t;show datasets;show contents;close test1d;run;quit;(4)用宏实现%macro names(name,number,obs);data a;%do i=1%to &obs;%do n=1%to &number;&name&n=1;%end;output;%end;run;%mend names;%names(x, 10000,100);2.多种方法创建包含变量X的10000个观测值的SAS数据集。
sas实践总结与体会SAS是一套用于数据分析与管理的软件,在各种企业、机构和学术界中广泛应用。
在实践中,我结合自己的经验,总结出了一些关于SAS使用的体会和总结,旨在帮助初次接触SAS的人士更好地理解并使用这一软件。
一、前期准备在运用SAS进行数据分析之前,需要进行一些基本的前期准备工作,包括建立可用的数据源并进行数据清洗、理解SAS语法并掌握SAS程序的编写与操作。
此外,还需要考虑项目的目标和数据分析的需求,并为此做出准备。
建立可用的数据源并进行数据清洗是一项至关重要的工作,如果数据不准确或存在缺失,则结果无法保证准确。
在数据清洗中,需要关注数据的格式、缺失值、异常值和重复等问题,并根据数据类型、范围和特征采取相应的清洗方法和策略。
理解SAS语法并掌握SAS程序的编写与操作是使用SAS的基础,要成功进行数据分析需要熟练运用SAS语言和工具。
需要熟悉SAS的各种操作和函数,掌握数据预处理、数据转换和模型建立等基本操作,以及熟悉宏、数组、循序操作和条件判断等高级编程技术。
二、数据预处理在进行数据分析之前,需要对数据进行预处理。
数据预处理是数据分析的第一步,可以清除无用信息,减小数据文件的体积,提高数据的质量,更好地适应数据分析需求。
常见的预处理方法包括数据缩放、数据标准化、缺失值处理和重采样等方法。
数据缩放是一种常见的数据预处理方法,用于将数据归一化到相同的尺度上,消除变量之间的量纲差异,方便后续的数据分析。
数据缩放的方法包括最小-最大缩放、标准化缩放和对数变换等方法,根据数据的特点和分析目标选择不同的方法进行缩放。
缺失值处理是另一种常用的预处理方法,用于处理数据中存在的缺失值。
常见的缺失值处理方法包括删除法、替换法、插补法和基于模型的方法,根据数据的特点和缺失值的特征选择相应的缺失值处理方法。
需要注意的是,缺失值处理可能会影响结果的准确性,因此需要在处理缺失值之前对数据进行充分的分析和理解。
三、模型建立在数据预处理之后,需要根据分析目的和数据特征选择适当的模型进行建立。
SAS实训报告心得在SAS实训中,我对SAS软件有了更深入的了解,掌握了数据清洗、数据分析等操作技能。
以下是我从SAS实训中学到的一些心得体会。
整体感受SAS软件界面简洁,操作容易上手,对于从未接触过SAS的人来说,也很容易上手使用。
在实训过程中,老师讲解并演示的实验,让我更好的理解并掌握了SAS数据处理和数据分析的技巧。
数据清洗数据清洗是数据分析的重要一环,通过去除噪音、异常值,把不准确、不完整、重复的数据进行处理,对数据源进行进一步的加工,提高数据分析的准确度。
在SAS中,对数据进行清洗可以使用delete、drop、proc sql等语句,其中proc sql是一种常见的数据清洗方式,它提供了更多的操作方式。
数据分析在数据清洗后,我们需要对数据进行分析,了解数据的规律和趋势,通过数据分析来进行数据挖掘。
SAS在数据分析方面提供了很多强大的操作方式,如数据描述、变量分析、因子分析、聚类分析、回归分析等,这些分析方式可以在实际工作中帮助我们更好地理解和把握数据。
基本统计量的计算基本统计量,如均值、中位数、众数、标准差等,可以表现出数据的中心趋势、离散程度和分布特征。
SAS通过使用简单高效的代码实现了基本统计量的计算,使用户能够更快速地完成统计分析。
建立回归模型建立回归模型有助于预测目标变量,并找到解释自变量和因变量之间关系的变量和因素。
SAS提供了多种回归分析技术,如简单线性回归、多元线性回归、逻辑回归、多元逻辑回归等,这些技术可以帮助我们选择最合适的模型类型,提高预测准确度。
图表的绘制SAS提供了许多用于绘制各种图表的过程和语句,可以直观的表达和展现数据。
其中,PROC GPLOT可以绘制2D图表,PROC GCHART可以绘制各种条形图、饼图、分组柱状图等。
图表的展示可以直观的呈现数据分析的结论,更深入、准确地理解和掌握数据。
总结通过SAS实训,我对数据清洗和数据分析方面的一些操作技巧有了更加全面、系统的认识,掌握了SAS软件相关操作和技术,并在实践中进行了应用,提高了实际操作能力。
1.3SAS的程式结构在SAS中,对数据的处理可划分为两大步骤:(1)将数据读入SAS建立的SAS数据集,称为数据步;(2)调用SAS的模块处理和分析数据集中的数据,称为过程步。
每一数据步都是以DATA语句开始,以RUN语句结束。
而每一过程步则都是以PROC语句开始,以RUN语句结束。
当有多个数据步或过程步时,由于后一个DATA或PROC语句可以起到前一步的RUN语句的作用,两步中间的RUN语句也就可以省略。
但是最后一步的后面必须有RUN语句,否则不能运行。
SAS还规定,每个语句的后面都要用符号“;”作为这个语句结束的标志。
在编辑SAS程式时,一个语句可以写成多行,多个语句也可以写成一行,可以从一行的开头写起,也可以从一行的任一位置写起。
每一行输入完成后,用ENTER键可以使光标移到下一行的开头处。
1.4 SAS程式的输入及运行SAS程式的输入及运行步骤如下:(1)进入SAS的显示管理系统;(2)进入并扩大编辑窗口;(3)调出、编辑或修改SAS程式或数据文件;(4)将编辑窗口的SAS程式或数据文件存盘;(5)按功能键F8或点击“跑步”键运行SAS程式并注意观察日志窗口中的信息,如有ERROR出现,应将光标移到日志窗口,用PgUp和PgDn两键翻页,找到错误的所在;(6)将光标移到编辑窗口,按功能键F4或点击Locals菜单中的Recall text命令调出已经运行的SAS程式,改正错误后转入步骤(4),直到日志窗口中的信息没有ERROR出现为止;(7)将光标移到输出窗口,用PgUp和PgDn两键翻页阅读输出的结果。
〖上机练习1.1〗进入SAS的显示管理系统,在编辑窗口输入程式:data ex;a=1;b=2;c=3;x=2*a+b;y=a-b/2;z=b+c**3;proc;print;run;在程式中,data后面的ex是给数据集所取的名字,在这个数据集内将储存变量a、b、c、x、y、z及它们所取的值,proc后面的print是要打印6个变量所取的值。
实验内容1试用产生标准正态分布的随机数normal(seed)产生参数为10的卡方分布随机数100个。
2根据数据集:(1)创建一个仅包含地区、销售的产品类型、销售数量和销售额的数据集。
(2)分别创建一个仅包含产品类型a100和产品类型a200和SAS数据集。
(3)选择一个人口在50000以上的部分子集。
3 以下数据来自7位同学的高考语文、数学和英语成绩,试用编程的方法计算出平均成绩在75以上的男同学的人数。
实验步骤:实验1:data a (drop=i) ;do i=1to100by1;z=normal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2+no rmal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2+normal(0)**2; output;end;结果如下:实验2:(1)data biao1;input region$ product$ quantity price; cards;es a100 150 3750so a100 410 10250es a100 350 8750so a100 710 17750es a100 750 18750so a100 760 19000es a100 150 3000so a100 410 8200es a100 350 7000so a100 710 14200es a100 750 15000so a100 760 152000es a200 165 4125so a200 425 10425es a200 365 9125ne a100 200 5000we a100 180 4500ne a100 600 15000we a100 780 19500ne a100 800 20000we a100 880 22000ne a100 200 4000we a100 180 3600ne a100 600 12000we a100 780 15600ne a100 800 16000we a100 880 17600ne a200 215 5375we a200 195 4875ne a200 615 15375;实验结果:(2)data biao2;input region$ citisize$ pop product$ saketype$ quantity price; cards;es s 25000 a100 r 150 3750so s 48000 a100 r 410 10250es m 125000 a100 r 350 8750so m 348000 a100 r 710 17750es l 62500 a100 r 750 18750so l 748000 a100 r 760 19000es s 25000 a100 s 150 3000so s 48000 a100 w 410 8200es m 125000 a100 w 350 7000so m 348000 a100 w 710 14200es l 62500 a100 w 750 15000so l 748000 a100 w 760 15200ne s 37000 a100 r 200 5000we s 32000 a100 r 180 4500ne m 237000 a100 r 600 15000we m 432000 a100 r 780 19500ne l 837000 a100 r 800 20000we l 93200 a100 r 880 22000ne s 37000 a100 w 200 4000we s 32000 a100 w 180 3600ne m 237000 a100 w 600 12000we m 432000 a100 w 780 15600ne l 837000 a100 w 800 16000we l 932000 a100 w 880 17600;data biao3;input region$ citisize$ pop product$ saketype$ quantity price; cards;es s 25000 a200 r 165 4125so s 48000 a200 r 425 10425es m 125000 a200 r 365 9125ne s 37000 a200 r 215 5375we s 32000 a200 r 195 4875ne m 237000 a200 r 615 15375;run;(3)data biao4;input region$ citisize$ pop product$ saketype$ quantity price; if pop <= 50000then delete;cards;es s 25000 a100 r 150 3750so s 48000 a100 r 410 10250es m 125000 a100 r 350 8750so m 348000 a100 r 710 17750es l 62500 a100 r 750 18750so l 748000 a100 r 760 19000es s 25000 a100 s 150 3000so s 48000 a100 w 410 8200es m 125000 a100 w 350 7000so m 348000 a100 w 710 14200es l 62500 a100 w 750 15000so l 748000 a100 w 760 15200es s 25000 a200 r 165 4125so s 48000 a200 r 425 10425es m 125000 a200 r 365 9125ne s 37000 a100 r 200 5000we s 32000 a100 r 180 4500ne m 237000 a100 r 600 15000we m 432000 a100 r 780 19500ne l 837000 a100 r 800 20000we l 93200 a100 r 880 22000ne s 37000 a100 w 200 4000we s 32000 a100 w 180 3600ne m 237000 a100 w 600 12000we m 432000 a100 w 780 15600ne l 837000 a100 w 800 16000we l 932000 a100 w 880 17600ne s 37000 a200 r 215 5375we s 32000 a200 r 195 4875ne m 237000 a200 r 615 15375;run;实验结果:实验3:data biao5;input sex$ yuwen shuxue yingyu @@;ave=sum(yuwen+shuxue+yingyu)/3;if ave>75 & sex='m'then n+1;else delete;cards;m 82 78 69 f 90 78 89 m 79 86 98 m 76 56 80 f 72 76 81 f 69 78 91 m 92 71 85;实验结果:。