SAS统计分析练习题
- 格式:doc
- 大小:21.50 KB
- 文档页数:1
统计分析软件上机实验1. 已知某班四名同学某次考试成绩如下:姓名性别语文数学物理化学英语王辉男 80 85 82 78 90李唱女 85 93 88 70 89张三男 77 86 67 82 85王二女 81 78 93 83 87试建立一个临时性SAS数据集SC ORE,并据此计算每位同学的总成绩和平均成绩并筛选出数学成绩大于85分的同学。
2.某人将500美元存入在某银行的存款帐户,这个帐户资产收益率为7%,每年复利计息。
用累加语句和循环语句计算三年末此人能得多少钱。
3. 下列五个年份中,按收入性质分农村居民家庭平均每人纯收入如下(数据摘自《自中国统计年鉴2002》)(单位:亿元):年份1985 1990 1995 2000 2001第一产业收入298.28510.86996.511125.341165.17第二产业收入29.4770.68287.24488.89532.61第三产业收入39.9575.81195.74515.35533.80试分别用1.DROP语句; 2.KEEP语句;输出年份和每年的三产业总收入;3.用循环语句和累加语句计算五年各产业的总收入。
家庭平均每人纯收入的省份,并对其进行计数。
5. 下表列出了2001年各地区国有单位分行业职工平均工资(摘自《中国统计年鉴2002》)(单位:元):用DELETE语句输出年平均工资达到10000元的地区。
6. 表1、表2分别给出了我国农业和工业部分主要产品产量居世界位次(摘自《中国统计年鉴2002》):表1:7.下面是从1954-1998年我国的人均GDP,试根据所给出的数据计算这期间人均GDP的平均值、标准差、标准误差、变异系数、偏度和峰度。
年份 1954 1955 1956 1957 1958 1959 1960 1961 1962 1963 1964 1965 1966 1967 1968GDP 144 150 165 168 200 216 218 185 173 181 208 240 254 235 222年份 1969 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 1982 1983GDP 243 275 288 292 309 310 327 316 339 379 417 460 489 525 580年份 1984 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998GDP 692 853 956 1104 1355 1512 1634 1879 2287 2939 3923 4854 5576 6053 63928.根据《我国各地区的支出法国内生产总值表》(摘自《中国统计年鉴2002》):地区国内生产总值(亿元)最终消费资本形成总额货物和服务净出口北京2845.651467.711775.3-397.36天津1840.1901.85934.48 3.77河北5577.782509.32511.57556.91山西1787.761046.43800.27-58.94内蒙古1545.326789936.1894062614.137383-5辽宁5033.082828.091625.5579.49吉林2087.871331.32790.99-34.44黑龙江3515.699822110.541130.53982274.62上海4950.842149.072294.46507.31江苏9403.34295.964239.17868.17浙江6749.183306.12891.02552.06安徽3290.1304142108.094751185.49566-3.46福建4218.312225.231939.6153.47江西2161.751357.47800.83 3.45山东9438.314582.614513.32342.38河南5640.113114.132329.32196.66湖北4557.022408.841963.46184.72湖南39832553.141426.47 3.39广东10647.715841.323860.81945.58广西2231.191597.05769.04-134.9海南546.62299.86254.79-8.03重庆1769.771078.06819.08-127.37四川4421.762691.471726.33 3.96贵州1084.9833.87599.95-348.92云南2074.711430.44929.73-285.46西藏138.3182.7949.72 5.8陕西1844.271004.5972.51-132.74甘肃1081.51674.42444.89-37.8青海294.83197.79207.39-110.35宁夏298.38223.52207.69-132.83新疆1485.48854.6771.42-140.54用PROC语句,(1)按国内生产总值排序;(2)对已创建的数据集进行转置;(3)对数据集的各变量求和;(4)计算各项经济指标平均值、标准差、标准差系数、偏度、峰度、置信区间并显示最大值与最小值。
SAS统计分析练习题[实验一]表1 某医学院12名学生成绩医学基础课程医学专业课程编号解剖学组织胚胎学生物化学生理学内科外科妇产科儿科1 70 64 97 77 59 81 63 812 77 53 72 62 76 82 77 793 75 82 66 68 62 75 72 824 74 84 84 58 78 79 59 825 62 78 82 56 74 91 74 926 63 66 69 51 84 86 75 747 74 70 90 62 71 76 73 738 90 96 77 65 82 82 78 769 75 68 73 72 77 81 73 7610 74 70 94 79 66 93 64 8211 74 84 86 82 79 79 55 7812 68 83 79 66 80 67 66 78(1) 用INPUT和CARDS语句将以上数据建立一个永久性数据集;(2) 用INFILE和INPUT语句将以上数据建立一个临时数据集,且该数据集不包括外科成绩低于85分的学生成绩;(3) 将(1)中建立的数据及拆分成医学基础课程与医学专业课程两个数据集,并将妇产科命名为GY;(4) 将(3)中建立的基础课与专业课的两个数据集合并成一个新的数据集,且该数据集增加医学基础课程总成绩与医学专业课总成绩两个变量;(5) 将(1)建立的数据集中妇产科与生理学成绩高于60分的学生成绩建立一个新的数据集,且该数据集还包括学生的平均成绩。
以上5个SAS统计程序写在实验报告中。
[实验二]1. 某年某市120名12岁健康男孩身高资料如表2-1。
表2-1 某年某市120名12岁健康男孩身高(cm)测量资料142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6151.1 144.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2125.9 132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.9要求:(1)编写SAS程序编制数据的频数表,绘制直方图。
附录A 习题答案习题1答案1.什么是观测值OBS?答:一份问卷、一个单一的整体、一个人、一个被测对象就是一个观测值,或称一个“个案”。
每个个案是由若干变量组成。
2. 什么是变量Variable?一份问卷一般有几个甚至几十个问答题,一个问答题就是一个变量。
如id、sex、age、location、income等。
3.下面的变量名哪些有效?哪些无效?sex、age、v1、location、_ab_、1age、1v、location1、@1、#1、%1、&2答:(1)有效的变量名是由1-8个有效字符组成且字母领头,后跟数字或有效的字母。
但字母@、#、$、%、^、&、*等是无效的字符。
比如:sex、age、v1、location、_ab_等变量名是正确的;(2)无效的变量名:1age、1v、location1、@1、#1、%1、&2等。
4.变量有哪些类型?答:变量有2种类型。
数字型:如INPUT id sex age;字符型:如“INPUT id sex $ age;”中的“sex $”表示性别是以m=男性,f=女性表示的。
5.给下面程序A.1a改错。
程序A.1a:DATA sj5; INPUT a b c @@; IF 4=<a<15 THEN GOTO OK; a=3; COUNT+1; RETURN; /*RETURN(返回)到DATA步执行它下面的语句*/ OK:SUMa+a; CARDS;3 6 9 10 22 15 12 10 14 ; PROC PRINT; RUN;解答:错在第3条语句上。
改错后的程序见程序A.1b。
程序A.1b:DATA sj5; INPUT a b c @@; IF a>=4 & a<15 THEN GOTO OK; a=3; COUNT+1; RETURN; /*RETURN(返回)到DATA步执行它下面的语句*/OK:SUMa+a; CARDS;3 6 9 10 22 15 12 10 14 ; PROC PRINT; RUN;习题2答案1.指出下列命令的作用。
SAS 统计软件知识要点与试题库1. 试述SAS系统中PGM、EDITOR、OUTPUT、EXPLORER、RESULT和LOG窗口的功能。
2. 窗口切换(移至前台并击活)可用以下任一种做法实现:(1)点击窗口本身;(2)由菜单项“窗口(W)”可切换到已打开的窗口,或由查看(View)加入新窗口;(3) Ctrl + T ab 依次切换;(4) 用设置的热键; (5) 发布命令;(6) 点击窗口条中某一窗口图标.3. 发布命令有四种方式:在命令框直接键入命令;使用下拉菜单(弹出菜单);使用工具条;按功能键(KEYS命令显示功能键所表示的命令).4. SAS数据集可以读取的数据类型:数据行直接输入、流行的数据库、其它文件格式5. SAS数据集的描述部分(创建与修改日期,引擎,变量名,类型,长度,标题,格式等)6. 字符型变量的缺失值用空格符表示数值型变量的缺失值用句号“ . ”表示7. SAS逻辑库包括临时库、永久库两种,区别?8. ViewT able窗口提供两种打开数据的方式:Browse模式和Edit模式,区别?9. SAS数据集的变量属性有6个,哪六个?(变量名及标签,类型,长度,输入输出格式).10. 在SAS系统中浏览和编辑SAS数据集一般必须先设定SAS逻辑库(文件库),然后将要浏览和编辑的数据集存放在已设定的SAS逻辑库(文件库)中.11. 多个SAS逻辑库可与同一个物理位置项连接;一个SAS逻辑库也可与多个物理位置相连接.12. 新建逻辑库(New Library)的方法:1. 按工具条上图标(New Library)可进入设定新的SAS逻辑库的N ew Library窗口;2. 资源管理器(浏览器)窗口击活时,在下拉菜单中选:文件(File) ⇒新建(New… )⇒逻辑库=>可进入设定新建逻辑库(New Library)窗口.3. 在“SAS 环境”(Environment)处击右键,在弹出的菜单中选新建(New …)=>逻辑库,也可进入新建逻辑库(New Library)窗口.13. 上机试题(1).用菜单方法建立新库(库标志名为dsta),此库包含本课程所使用的sas数据集; (2).用两种方法(菜单或命令)进入ViewT able窗口,并浏览数据集class;(3)先浏览class中SEX=…F‟的观测及AGE>=14的观测,然后浏览全部观测;(4)浏览数据集class的描述信息和数据内容;(5)浏览SAS永久库SASUSER的属性和内容,并浏览数据集AIR的描述信息和数据内容.14. 数据集名应由字母或下划线开始且不超过32个(V6为8) 个字节的字符、数字或下划线构成. 变量名,数组名,库名15. 上机(1). 用VT命令进入ViewT able窗口,直接输入数据并进行编辑修改后存为sas数据集; (2). 使用Import窗口菜单系统,将*.txt 转换为sas数据集;(3). 用数据步建立SAS数据集.16. SAS的Import/Export菜单界面提供一个使用菜单的图形界面:17. SAS语句书写的格式较为灵活:语句可以在某一行的任何位置开始和结束;词间可任意加入空格和换行;一个语句可以写成几行,只要语句中的单词不被断开就可以;多个语句可写在一行;SAS语句用大写字母、小写字母或两者混合书写均可以.18. 通常用DAT A步产生SAS数据集,而用PROC步对SAS数据集中的数据进行分析处理并输出结果. 一个SAS程序可由一个DAT A步或一个PROC步组成;或者由DAT A 步和PROC步两部分组成;也可由多个DAT A步和PROC步组成.19. SAS的字符型变量缺省的长度是8个字符,可以用LENGTH语句直接指定变量长度。
抑郁自评量表(SDS)请仔细阅读每一条,把题目的意思看明白,然后按照自己最近一周以来的实际情况,对下面的20个条目按1-4级评分:①很少;②有时;③经常;④持续。
1、我感到情绪沮丧,郁闷。
①很少②有时③经常④持续2、我感到早晨心情最好。
①很少②有时③经常④持续3、我要哭或想哭。
①很少②有时③经常④持续4、我夜间睡眠不好。
①很少②有时③经常④持续5、我吃饭象平时一样多。
①很少②有时③经常④持续6、我的性功能正常。
①很少②有时③经常④持续7、我感到体重减轻。
①很少②有时③经常④持续8、我为便秘烦恼。
①很少②有时③经常④持续9、我的心跳比平时快。
①很少②有时③经常④持续10、我无故感到疲劳。
①很少②有时③经常④持续11、我的头脑象往常一样清楚。
①很少②有时③经常④持续12、我做事情象平时一样不感到困难。
①很少②有时③经常④持续13、我坐卧不安, 难以保持平静。
①很少②有时③经常④持续14、我对未来感到有希望。
①很少②有时③经常④持续15、我比平时更容易激怒。
①很少②有时③经常④持续16、我觉得决定什么事很容易。
①很少②有时③经常④持续17、我感到自己是有用的和不可缺少的人。
①很少②有时③经常④持续18、我的生活很有意义。
①很少②有时③经常④持续19、假若我死了别人会过得更好。
①很少②有时③经常持续20、我仍旧喜爱自己平时喜爱的东西。
①很少②有时③经常④持续计分方式:1、①、②、③、④依次计1、2、3、4分;2、第2、5、6、11、12、14、16、17、18、20题反向计分,即①、②、③、④依次计4、3、2、1分。
统计结果:< >总分(20个项目所得分之和):___标准T分(标准分=原始总分X 1.25并四舍五入取整数):———抑郁自评量表(SDS)的计分标准及注意事项抑郁自评量表(Self—Rating Depression Scale,SDS)由Zung编制于1965年。
为美国教育卫生福利部推荐的用于精神药理学研究的量表之一,因使用简便,应用颇广。
SAS上机练习题(全部-含参考答案)重庆医科大学--卫生统计学统计软件包SAS上机练习题(一)1、SAS常用的窗口有哪三个?请在三个基本窗口之间切换并记住这些命令或功能键。
2、请在PGM窗口中输入如下几行程序,提交系统执行,并查看OUTPUT窗和LOG窗中内容,注意不同颜色的含义;并根据日志窗中的信息修改完善程序。
DATS EX0101;INPUTT NAME $ AGE SEX;CARDS;XIAOMIN 19 1LIDONG 20 1NANA 18 2;PROD PRONT DATS=EX1;RUN;PROC PRINT DATA=EX1;V AR NAME AGE;RUN;3、将第2题的程序、结果及日志保存到磁盘。
4、试根据如下例1的程序完成后面的问题:表1 某班16名学生3门功课成绩表如下问题:1)建立数据集;2)打印至少有1门功课不及格同学的信息;(提示,使用if语句)参考程序:data a;input id sh wl bl;cards;083 68 71 65084 74 61 68085 73 75 46086 79 80 79087 75 71 68084 85 85 87085 78 79 75086 80 76 79087 85 80 82088 77 71 75089 67 73 71080 75 81 70118 70 54 75083 70 66 84084 62 73 65099 82 70 79;run;data b;set a;if sh<60 or wl<60 or bl<60 then output ;run ;proc print data =b;var id sh wl bl;run ;5、根据下列数据建立数据集表2 销售数据开始时间 终止时间费用2005/04/28 25MAY 2009 $123,345,0002005 09 18 05OCT2009 $33,234,5002007/0822SEP2$345,600/12 009200405 08 30JUN2009$432,334,500提示:(格式化输入;数据之间以空格分隔,数据对齐;注意格式后面的长度应以前一个位置结束开始计算,如果读入错误,可试着调整格式的宽度;显示日期需要使用输出格式)开始时间,输入格式yymmdd10.终止时间,输入格式date10.费用,输入格式dollar12.参考程序:data a;input x1 yymmdd10. x2 date10. x3 dollar13.;cards;2005/04/28 25MAY2009 $123,345,0002005 09 18 05OCT2009 $33,234,5002007/08/12 22SEP2009 $345,60020040508 30JUN2009 $432,334,500;run;proc print;run;proc print;format x1 yymmdd10. x2 date9. x3 dollar13.;run;6、手机号码一编码规则一般是:YYY-XXXX-ZZZZ,其YYY为号段;XXXX一般为所在地区编码;ZZZZ 为对应的个人识别编号。
正态性检验Data t;/*正态性检验*/INPUT x @@;CARDS;63 106 112 88 150 104 8875 78 140 167 155 122 12899 130 113 45 133 133 124187 101 87 70;PROC UNIVARIATE NORMAL PLOT DATA=t;VAR x;QQPLOT x/NORMAL(MU=111SIGMA=34);RUN;单样本t检验data a;input x@@;cards;20.99 20.41 20.10 20.00 20.91 22.60 20.99 20.41 20.00 23.00 22.00 ;proc univariate mu0=20.70;/*调用univariate过程进行单样本的t检验,与总体均数20.70比较*/var x;run;proc ttest h0=20.70;/*调用ttest过程进行单样本的t检验*/var x;run;配对设计资料t检验P104 例7-3DATA t; /*p104 例7-3*/INPUT no x1 x2 @@;d=x2-x1;CARDS;1 0.94 0.922 1.02 1.013 1.14 1.114 1.23 1.225 1.31 1.326 1.41 1.427 1.53 1.518 1.61 1.619 1.72 1.7210 1.81 1.8211 1.93 1.9312 2.02 2.04;/*调用means过程进行配对t检验,得到样本含量、均数、标准差、标准误、t值及P值*/ PROC MEANS N MEAN STD STDERR T PRT DATA=t;VAR d;TITLE'paired-comparisons t test';RUN;proc univariate normal data=t;/*做正态性检验*/var d;run;proc ttest;/*调用ttest过程进行配对t检验,和用means过程的结果一致*/paired x1*x2;run;两独立样本t检验P121 #5DATA GT;INPUT G X1 X2 @@;/*X1、X2分别为治疗前和治疗后的数据,G为分组变量,G=1表示A 组,G=2表示B组*/X=X1-X2;;/*X为治疗前后的差值*/CARDS;1 1183.03 983.08 1 822.52 469.34 1 1294.00 704.39 1 852.50 979.66 1 568.89 1040.331 532.12 895.93 1 896.36 612.27 1 530.46 616.70 1 808.22 870.14 1 375.44 1245.541 1055.26 1753.67 1 614.55 1850.56 1 450.22 538.452 992.85 236.66 2 767.33 293.00 2 645.85 166.77 2 709.54 204.81 2 995.41 127.272 1043.40 186.63 2 1022.76 200.80 2 486.27 151.47 2 694.28 254.49 2 871.44 178.092 973.73 147.19 2 1063.76 111.22;proc univariate normal;/*调用univariate过程进行正态性检验*/class G;/*定义分组变量为G*/var X;/*分析变量为*/PROC TTEST;/*调用t检验过程*/CLASS G; /*指定分组变量*/VAR X; /*指定分析变量*/RUN;P106 例7-4DATA t2;/*p106例7-4*/INPUT x g @@;CARDS;10.2 1 8.9 1 10.1 1 9.2 1 -0.8 1 10.6 1 6.5 1 11.2 1 9.3 1 8.0 1 10.71 9.5 1 12.7 1 14.4 1 11.9 15.0 26.7 2 -1.4 2 4.0 27.1 2 -0.6 2 2.8 2 4.3 2 3.7 2 5.8 2 4.6 2 6.0 2 4.1 2 5.1 2 4.7 2;PROC UNIVARIATE NORMAL DATA=T2;CLASS g;VAR x;run;PROC TTEST DATA=t2;CLASS g;VAR x;RUN;完全随机设计资料的方差分析P123 例8-1DATA ce8_1;/*p123例8-1*/INPUT x grp@@;CARDS;332.96 1 297.64 1 312.57 1 295.47 1 284.25 1 307.97 1292.12 1 244.61 1 261.46 1 286.46 1 322.49 1 282.42 1253.21 2 235.87 2 269.30 2 258.90 2 254.39 2 200.87 2227.79 2 237.05 2 216.85 2 238.03 2 238.19 2 243.49 2232.55 3 217.71 3 216.15 3 220.72 3 219.46 3 247.47 3280.75 3 196.01 3 208.24 3 198.41 3 240.35 3 219.56 3;PROC UNIVARIATE NORMAL;VAR X;BY GRP;RUN;PROC GLM;/*调用GLM过程进行方差分析*/CLASS grp; /*定义进入模型的分类变量*/MODEL x=grp;/*构造统计分析模型,以x为结果变量,grp为自变量*/MEANS grp/SNK BON SIDAK HOVTEST=LEVENE(TYPE=ABS) HOVTEST=BARTLETT; /*给出grp各组的均数,并用SNK,Bonferroni,Sidak三种方法进行两两比较;同时用离均差的绝对值进行Levene方差齐性检验和方差齐性的Bartlett检验。
1.随机取组随机取组 有无重复试验的两种有无重复试验的两种 本题是无重复本题是无重复 DATA PGM15G; DO A=1 TO 4; /*A 为窝别*/ DO B=1 TO 3; ; /*B /*B 为雌激素剂量*/ INPUT X @@; X @@; /*X /*X 为子宫重量*/OUTPUT ;END ;END ;CARDS ;106 116 145 42 68 115 70 111 133 42 63 87 ; RUN ;ods html ; /*将结果输出成网页格式,SAS9.0以后版本可用*/ PROC GLM DATA =PGM15G; CLASS A B;MODEL X=A B / X=A B / SS3SS3;MEANS A B; /*给出因素A 、B 各水平下的均值和标准差*/MEANS B / B / SNK SNK ; /*对因素B (即剂量)各水平下的均值进行两两比较*/ RUN ;ODS HTML CLOSE ;2. 2*3析因设计析因设计 两因素两因素 完全随机完全随机 统计方法统计方法 2*3析因设计析因设计 tiff =f 的开方的开方DATA aaa; DO zs=125,200;DO repeat=1 TO 2; ; /*/*每种试验条件下有2次独立重复试验*/ do js=0.015,0.030,0.045; INPUT cl @@; OUTPUT ;END ;END ;END ; CARDS ;2.70 2.45 2.60 2.78 2.49 2.72 2.83 2.85 2.86 2.86 2.80 2.87 ; run ;PROC GLM ;CLASS zs js; MODEL cl=zs js zs*js / cl=zs js zs*js / SS3SS3; MEANS zs*js;LSMEANS zs*js / TDIFF PDIFF ; ; /*/*对 zs 和js 各水平组合而成的试验条件进行均数进行两两比较*/ RUN ;ODS HTML CLOSE ;练习一:2*2横断面研究列链表横断面研究列链表 方法:卡方方法:卡方 矫正卡方矫正卡方 FISHERDATA PGM19A;DO A=1 TO 2; DO B=1 TO 2;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 2 26 8 21 ;run ;PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQ CHISQ ;RUN ;样本大小 = 57练习二:对裂列连表练习二:对裂列连表 结果变量结果变量 换和不换换和不换 三部曲三部曲 1横断面研究横断面研究 P 《0.05 RDATA PGM19B; DO A=1 TO 2; DO B=1 TO 2;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 40 3414 1 19252 ; run ; ods html ;PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQCHISQ cmh ; RUN ;ods html close ;样本大小 = 57练习三:病例对照2*2 病例组中病例组中 有何没有那个基因有何没有那个基因 是正常的3.8倍,倍, 则有可能导致痴呆则有可能导致痴呆 要做前瞻性研究要做前瞻性研究 用对裂用对裂DATA PGM20;DO A=1 TO 2; DO B=1 TO 2;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 240 60 360 340 ;run ; ods html ; PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQ CHISQcmh ; RUN ; ods html close ;总样本大小 = 1000 练习四:配对设计配对设计 隐含金标准2*2 MC 卡方卡方 检验检验 34和0在总体上在总体上((B+C 《40 用矫正卡方) 是否相等是否相等 则可得甲培养基优于乙培养基则可得甲培养基优于乙培养基 一般都用矫正一般都用矫正 因卡方为近似计算因卡方为近似计算DATA PGM19F; INPUT b c;chi=(ABS(b-c)-1)**2/(b+c);p=1-PROBCHI(chi,1);求概率 1减掉从左侧积分到卡方的值减掉从左侧积分到卡方的值 chi=ROUND(chi, 0.001);IF p>0.0001 THEN p=ROUND(p,0.0001);FILEPRINT ; PUT (打印在输出床口) #2 @10'Chisq' @30 'P value'(#表示行) #4 @10 chi @30 p; CARDS ; 34 0 ;run;ods html close;练习五:双向有序R*C列连表列连表用KPA data aaa;do a=1 to 3;do b=1 to 3;input f @@;output;end;end;cards ;58 2 31 42 78 9 17;run;ods html;*简单kappa检验;proc freq data=aaa;weight f;(频数)(频数)tables a*b;test kappa;run ;*加权kappa检验;proc freq;weight f;tables a*b;test wtkap;run ;ods html close;SAS 系统FREQ 过程频数 百分比 行百分比列百分比a *b 表a b 合计1 2 31 5839.4621.3632.046342.8692.06 86.57 3.173.774.7611.112 10.682.001.49 4228.5784.0079.2574.7614.0025.935034.013 85.4423.5311.94 96.1226.4716.981711.5650.0062.963423.13合计 6745.58 5336.052718.37147100.00a *b 表的统计量对称性检验统计量 (S) 2.8561自由度 3Pr > S 0.4144对称性检验指 总体上主对角线的上三角数相加是否与下三角三个数相加 对称性检验与KPA 检验是否一致 是否一个可以代替另一个检验 Pe理论观察一致率 独立假设性基础上计算的 相互独立简单 Kappa 系数Kappa 0.6809渐近标准误差 0.050095% 置信下限 0.583095% 置信上限 0.7788H0 检验: Kappa = 0总体的H0 下的渐近标准误差 0.0597Z 11.4112H0 检验: Kappa = 0单侧 Pr> Z <.0001双侧 Pr>|Z| <.0001总体的KPA是否为0 KPA大于0两种方法的一致性有统计学意义 小于0 不一致性有统计学意义加权的 Kappa 系数加权的 Kappa 0.6614渐近标准误差 0.056095% 置信下限 0.551695% 置信上限 0.7711置信区间不包括0 拒绝H0 按此计算结果可以用一种取代另一种方法 但要看专业要求达到多少才可以 观测一致率达到多少才可以代替样本大小 = 147FREQ 过程频数 百分比 行百分比列百分比a *b 表a b 合计1 2 31 5839.4692.0686.5721.363.173.7732.044.7611.116342.862 10.682.001.494228.5784.0079.2574.7614.0025.935034.013 85.4423.5311.9496.1226.4716.981711.5650.0062.963423.13合计 6745.58 5336.052718.37147100.00a *b 表的统计量对称性检验统计量 (S) 2.8561自由度 3Pr > S 0.4144简单 Kappa 系数Kappa 0.6809渐近标准误差 0.050095% 置信下限 0.583095% 置信上限 0.7788加权的 Kappa 系数加权的 Kappa 0.6614渐近标准误差 0.056095% 置信下限 0.551695% 置信上限 0.7711H0 检验: 加权的 Kappa = 0H0 下的渐近标准误差 0.0646Z 10.2406单侧 Pr> Z <.0001双侧 Pr>|Z| <.0001对加权的KPA 检验 与简单的(利用对角线上的数据分析)加权还要利用对角线以外的数据分析 样本大小 = 147练习六:双向无序R*C 列连表列连表 用卡方理论频数小于5没有超过五分之一,没有超过五分之一,一般用卡方一般用卡方一般用卡方 实在不行用FISHER 检验检验 超过用KPA 两种血型都是按小中大排列两种血型都是按小中大排列 相互不影响相互不影响 独立的独立的 接受H0 不一致不一致行与列变量相互不影响行与列变量相互不影响 DATA PGM20A; DO A=1 TO 4; DO B=1 TO 3;INPUT F @@;OUTPUT ;END ;END ;CARDS ;431 490 902 388 410 800 495 587 950 137 179 325 ; run ; ods html ; PROC FREQ ; WEIGHT F;TABLES A*B / A*B / CHISQCHISQ ;*exact; RUN ;ods html close ;样本大小 = 6094练习七:单向有序R*C 秩和检验秩和检验*方法1;(单因素非参数 HO 三个药物疗效相同 H1不完全相等)不完全相等) DATA PGM20C; DO A=1 TO 4; DO B=1 TO 3; INPUT F @@;OUTPUT ;END ;END ;CARDS ; 15 4 1 49 9 15 31 50 45 5 22 24 ; run ; ods html ;PROC NPAR1WAY WILCOXON ; FREQ FREQ F;CLASS B; VAR A; RUN ;*方法2;(FIQ CHIM ) proc freq data =PGM20C; weight f;tables b*a/ b*a/cmh cmhscores =rank; run ; ods html close ;总样本大小 = 270练习八:练习八: 双向有序双向有序 属性不同属性不同 R*C 4种目的4种方法种方法SPEARMAN 秩相关分析 DATA PGM20E; DO A=1 TO 3; DO B=1 TO 3;INPUT F @@;OUTPUT ;END ;END ;CARDS ; 215 131 148 67 101 128 44 63 132;run ; ods html ; PROC CORR SPEARMAN ;VAR A B; FREQ F; RUN ;ods html close ;统计分析与SAS 实现第1次上机实习题一、定量资料上机实习题要求:要求:(1) 先判断定量资料所对应的实验设计类型;(2) 假定资料满足参数检验的前提条件,请选用相应设计的定量资料的方差分析,并用SAS 软件实现统计计算;(3) 摘录主要计算结果并合理解释,给出统计学结论和专业结论。
SAS统计分析练习题
[实验二]
1.《医学统计学》,P13,例2-1。
要求:编制频数分布表;用原始资料计算均数、标准差、标准误、变异系数、95%可信区间、中位数、百分位数、正态性检验、正态概率图。
2.《医学统计学》,P49,例3-6。
3.《医学统计学》,P51,例3-7。
[实验三]
4.《SAS统计分析》,P102,习题2,完全随机设计方差分析。
要求做方差齐性检验和均数间的多重比较。
5.《医学统计学》,P77,例4-4。
6.《医学统计学》,P80,例4-5。
7.《医学统计学》,P84,例4-6
8.《医学统计学》,P236,例11-1。
[实验四]
9.《医学统计学》,P249,例11-5,表11-19。
10.《医学统计学》,P259,习题5。
随机区组裂区实验。
11.《医学统计学》,P276,习题5。
重复测量数据方差分析。
[实验五]
12.《医学统计学》,P137,例7-1。
13.《医学统计学》,P140,例7-2。
14.《医学统计学》,P141,例7-3。
15.《医学统计学》,P142,例7-4。
16.《医学统计学》,P146,例7-6。
17.《医学统计学》,P148,例7-8。
18.《医学统计学》,P154,例7-11。
19.《医学统计学》,P118,例6-4。
20.《医学统计学》,P125,例6-12。
[实验六]
21.《医学统计学》,P162,例8-1。
22.《医学统计学》,P166,例8-3。
23.《医学统计学》,P170,例8-5。
24.《医学统计学》,P172,例8-7。
25.《医学统计学》,P184,例9-1。
26.《医学统计学》,P197,例9-8。
27.《医学统计学》,P211,例9-14。
[实验七]
28.《医学统计学》,P281,例13-1。
29 《医学统计学》P288习题2。
30.《医学统计学》,P315,例15-1。
采用全回归模型和逐步回归方程。
[实验八]
31《SAS统计分析》,P215,习题1。
32《SAS统计分析》,P215,习题2。
33《SAS统计分析》,P217,习题5。
34.《医学统计学》,P364,例17-4。
并绘制生存率曲线图。
35.《医学统计学》,P372,例17-5。