实验报告
实验项目名称SAS的描述统计功能所属课程名称统计分析及SAS实现实验类型验证性实验
实验日期2016-10-20
班级数学与应用数学
学号
姓名
成绩
⑴利用INSIGHT模块画出直方图:
图2.1 INSIGHT模块绘制频数直方图⑵利用“分析家”绘制频数直方图:
图2.2“分析家”绘制频数直方图
⑶编程绘制频数直方图:
proc gchart data=lmf.p21;
vbar grade;
run;
图2.3 编程绘制频数直方图
②求出上述数据的平均值、中位数、四分之一分位点及四分之三分位点:
⑴利用INSIGHT模块求平均值、中位数、四分之一分位点及四分之三分位点:
图2.4 利用INSIGHT模块求统计量
表2.1 利用INSIGHT模块求矩统计量:
矩统计量(moment)
表2.2 利用INSIGHT模块求分位数:
分位数(quantiles)
由表2.1、表2.2得出,均值(mean)为77.7167,中位数(med)为81.0000,四分之一分位点(Q1)为72.0000,四分之三分位点(Q3)为86.0000。
⑵利用“分析家”求平均值、中位数、四分之一分位点及四分之三分位点:
Ⅰ. 利用Summary Statistics菜单计算描述性统计量:
图2.5 Summary Statistics菜单计算描述性统计量
Ⅱ. 利用Distributions菜单计算描述性统计量:
表2.3 利用“分析家”模块求矩统计量:
矩统计量(moment)
表2.4 “分析家”求基本统计测度:
基本统计测度(Basic Statistical Measure)
表2.5 “分析家”求分位数:
分位数(quantiles)
由表2.3、表2.4、表2.5得出,均值(mean)为77.71667,中位数(med)为81.00000,四分之一分位点(Q1)为72.0,四分之三分位点(Q3)为86.0。
⑶利用编程求平均值、中位数、四分之一分位点及四分之三分位点:
proc means data=lmf.p21 mean median Q1Q3;
var grade;
run;
表2.6 编程求数据的平均值、中位数、四分之一分位点及四分之三分位点:
由表2.6得出,均值(mean)为77.7166667,中位数(med)为81.0000000,四分之一分位点(Q1)为72.0000000,四分之三分位点(Q3)为86.0000000。
【练习2-2】掷一枚均匀子42次,记录朝上一面的点数,画出记录的频数和频率
直方图,并说明记录的分布规律。
3 2
4 1
5 1
5 3 4 3 5 6
4 2
5 3 1 3
4 1 4
5 1 6
3 3 1 2
4 2
6 3 4 6 6 1
6 2 4 5 2 6
【解答】
①利用编程计算频数:
proc freq data=lmf.p22;
table dice;
run;
表2.7 编程计算频数
频数(freq)
由表得出出现点数1的次数为7;出现点数2的次数为6;出现点数3的次数为8;出现点数4的次数为8;出现点数5的次数为6;出现点数6的次数为7。
②利用编程绘制频率直方图:
proc gchart data=lmf.p22;
vbar dice;
run;
图2.4 编程绘制频数直方图
表2.7、图2.4可以说明,骰子的数字分布是均匀的,每点掷出的概率计划一样,而在这42次中,3、4两点概率值最高且一样,2、5两点出现概率最低且一样,1、6两点出现概率适中且一样。
【练习2-5】某高校对本校财经类学科硕士毕业生的收入状况进行调查,抽查了30位毕业生,得到他们的年收入数据如下(单位:千元):
①求年收入的均值、中位数和四分位数;
②求年收入的极差和标准差;
③绘制年收入的盒形图,并概括年收入的分布情况。
【解答】
①利用编程求年收入的均值、中位数和四分位数:
proc means data=lmf.p23 mean median Q1Q3;
var income;
run;
表2.8求描述年收入位置的统计量:
30.7 30.7 31.1 30.5 32.2
29.9 30.2 30.3 32.3 31.8
29.7 29.1 30.6 31.2 32.7
30.3 28.9 30.3 30.9 33.3
28.8 30.0 30.1 32.2 32.1
29.3 30.4 30.6 32.9 30.3
由表2.8得出,均值(mean)为30.7800000,中位数(median)为30.5500000,下四分位数(Q1)为30.1000000,上四分位数(Q3)为31.8000000。
②利用编程求年收入的极差和标准差:
proc means data=lmf.p23 range std;
var income;
run;
表2.9求描述年收入离散程度的统计量:
③
⑴利用INSIGHT绘制年收入的盒形图:
图2.5 INSIGHT绘制年收入盒形图
⑵概括年收入的分布情况:
由图2.5得出,50%的硕士研究生的年收入在30.6千元以上,25%的硕士研究生的年收入小于30.1千元,75%的硕士研究生的年收入小于31.6千元。
【练习2-6】某城市自来水水费收缴员某次对某一居民楼内各用户两个月的用水
量查表记录如下(单位:m3):
47 23 22 13 20 11 19 9 20 9 20 9 12
9 10 12 7 8 10 10 15 10 4 13 13 6 62 6 23 14 9 8 6 5 12 15 20 20 14 10 47 10 12 17 9 5 17 68 30 9 35 20 25 20 25 20 14 8 10 24 11 16 16 20 9 试对该居民楼的用水情况做出分析。
【解答】
①利用“分析家”通过distributions菜单计算用水量的描述性统计量:
图2.6 “分析家”求解统计量
得出结果如表2.10、2.11、2.12:
表2.10 用水量的矩统计量(moments):
表2.11 用水量的基本统计测度(Basic Statistics Measures):
表2.12 用水量的百分位数(quantiles):
由表 2.10、2.11、2.12得出⑴用水量的位置分布的统计量:均值(mean)为16.64615m3,中位数(median)为13.00000m3,众数(mode)为20.00000m3,上四分位数(Q3)为20m3,下四分位数(Q1)为9m3;⑵用水量的分散程度的统计量:极值(range)为64.00000m3,标准差(std dev)为12.21223m3,方差(var) 为149.13846m3。
②利用編程做出频数直方图:
proc gchart data=lmf.p24;
vbar WatConspt;
run;
图2.7 用水量的频率直方图
③利用INSIGHT作出用水量的盒形图:
图2.8 用水量的盒形图
由①、②、③得出该居民楼两个月内的用水量主要集中在20m3,75%的居民用水量小于20m3,50%的居民用水量小于13m3,25%的居民用水量小于9m3,平均用水量约为16m3,极差为64m3,说明该楼居民用水量的差异大。
【练习2-7】某高校学生逃课的情况进行抽样调查的结果如下:
e e e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2004
femal
e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2005
femal
e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2005
femal
e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2005
femal
e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2005
femal
e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2005
femal
e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2005
femal
e
2 G2004 male 2 G2005 femal
e
2 G2005
femal
e
3 G2005
femal
e
2 G2004 male 2 G2005 femal
e
3 G200
4 male 3 G2005
femal
e
(其中各变量表示含义:1:从不逃课;2:偶尔逃课;3:经常逃课;G2004:2004级;G2005:2005级;male:男;female:女)
①利用INSIGHT模块做出直方图从整体上对逃课情况进行分析:
图2.9 整体上逃课情况
由图2.9得出,从不逃课的有8人,偶尔逃课的有66人,经常逃课的有26人,说明该校学生大多偶尔逃课,但经常逃课的也较多,从不逃课的很少,该校的学
习氛围不够浓。
②利用INSIGHT绘制直方图对两个年级逃课状况进行比较分析:
图2.10 两个年级逃课情况
由图2.10可以看出,2005级从不逃课的学生多于2004级,多6人;2005级偶尔逃课的学生多于2004级,多4人;2005级经常逃课的学生少于2004级,少10人。总体来看2004级学生逃课情况较严重,学习氛围不够。
③利用统计图形对男女生逃课进行比较分析:
⑴利用INSIGHT作出直方图对男女生逃课进行比较:
图2.11 INSIGHT绘制男女逃课分布情况⑵利用“分析家”作出直方图对男女生逃课进行比较:
图2.12 “分析家”绘制男女逃课分布情况
由图2.11、图2.12得出,不同年级男、女从不逃课人数差不多,男生多一点;不同年级男生偶尔逃课人数少于女生;不同年级男生经常逃课人数少于女生。说明女生在学校里较守纪,逃课情况和男生相比较好。
【小结】
通过本章学习,掌握了SAS中利用INSIGHT、“分析家”、编程三个模块对数据进行描述统计,学会熟练地使用三个模块绘制直方图、盒形图等统计图形,并且能够通过图形以及基本统计量对数据进行分析、归纳得出实际结论。
指导教师评语及成绩:
评语:
成绩:指导教师签名:
批阅日期: