当前位置:文档之家› 实验报告二sas的描述统计功能

实验报告二sas的描述统计功能

实验报告二sas的描述统计功能
实验报告二sas的描述统计功能

实验报告

实验项目名称SAS的描述统计功能所属课程名称统计分析及SAS实现实验类型验证性实验

实验日期2016-10-20

班级数学与应用数学

学号

姓名

成绩

⑴利用INSIGHT模块画出直方图:

图2.1 INSIGHT模块绘制频数直方图⑵利用“分析家”绘制频数直方图:

图2.2“分析家”绘制频数直方图

⑶编程绘制频数直方图:

proc gchart data=lmf.p21;

vbar grade;

run;

图2.3 编程绘制频数直方图

②求出上述数据的平均值、中位数、四分之一分位点及四分之三分位点:

⑴利用INSIGHT模块求平均值、中位数、四分之一分位点及四分之三分位点:

图2.4 利用INSIGHT模块求统计量

表2.1 利用INSIGHT模块求矩统计量:

矩统计量(moment)

表2.2 利用INSIGHT模块求分位数:

分位数(quantiles)

由表2.1、表2.2得出,均值(mean)为77.7167,中位数(med)为81.0000,四分之一分位点(Q1)为72.0000,四分之三分位点(Q3)为86.0000。

⑵利用“分析家”求平均值、中位数、四分之一分位点及四分之三分位点:

Ⅰ. 利用Summary Statistics菜单计算描述性统计量:

图2.5 Summary Statistics菜单计算描述性统计量

Ⅱ. 利用Distributions菜单计算描述性统计量:

表2.3 利用“分析家”模块求矩统计量:

矩统计量(moment)

表2.4 “分析家”求基本统计测度:

基本统计测度(Basic Statistical Measure)

表2.5 “分析家”求分位数:

分位数(quantiles)

由表2.3、表2.4、表2.5得出,均值(mean)为77.71667,中位数(med)为81.00000,四分之一分位点(Q1)为72.0,四分之三分位点(Q3)为86.0。

⑶利用编程求平均值、中位数、四分之一分位点及四分之三分位点:

proc means data=lmf.p21 mean median Q1Q3;

var grade;

run;

表2.6 编程求数据的平均值、中位数、四分之一分位点及四分之三分位点:

由表2.6得出,均值(mean)为77.7166667,中位数(med)为81.0000000,四分之一分位点(Q1)为72.0000000,四分之三分位点(Q3)为86.0000000。

【练习2-2】掷一枚均匀子42次,记录朝上一面的点数,画出记录的频数和频率

直方图,并说明记录的分布规律。

3 2

4 1

5 1

5 3 4 3 5 6

4 2

5 3 1 3

4 1 4

5 1 6

3 3 1 2

4 2

6 3 4 6 6 1

6 2 4 5 2 6

【解答】

①利用编程计算频数:

proc freq data=lmf.p22;

table dice;

run;

表2.7 编程计算频数

频数(freq)

由表得出出现点数1的次数为7;出现点数2的次数为6;出现点数3的次数为8;出现点数4的次数为8;出现点数5的次数为6;出现点数6的次数为7。

②利用编程绘制频率直方图:

proc gchart data=lmf.p22;

vbar dice;

run;

图2.4 编程绘制频数直方图

表2.7、图2.4可以说明,骰子的数字分布是均匀的,每点掷出的概率计划一样,而在这42次中,3、4两点概率值最高且一样,2、5两点出现概率最低且一样,1、6两点出现概率适中且一样。

【练习2-5】某高校对本校财经类学科硕士毕业生的收入状况进行调查,抽查了30位毕业生,得到他们的年收入数据如下(单位:千元):

①求年收入的均值、中位数和四分位数;

②求年收入的极差和标准差;

③绘制年收入的盒形图,并概括年收入的分布情况。

【解答】

①利用编程求年收入的均值、中位数和四分位数:

proc means data=lmf.p23 mean median Q1Q3;

var income;

run;

表2.8求描述年收入位置的统计量:

30.7 30.7 31.1 30.5 32.2

29.9 30.2 30.3 32.3 31.8

29.7 29.1 30.6 31.2 32.7

30.3 28.9 30.3 30.9 33.3

28.8 30.0 30.1 32.2 32.1

29.3 30.4 30.6 32.9 30.3

由表2.8得出,均值(mean)为30.7800000,中位数(median)为30.5500000,下四分位数(Q1)为30.1000000,上四分位数(Q3)为31.8000000。

②利用编程求年收入的极差和标准差:

proc means data=lmf.p23 range std;

var income;

run;

表2.9求描述年收入离散程度的统计量:

⑴利用INSIGHT绘制年收入的盒形图:

图2.5 INSIGHT绘制年收入盒形图

⑵概括年收入的分布情况:

由图2.5得出,50%的硕士研究生的年收入在30.6千元以上,25%的硕士研究生的年收入小于30.1千元,75%的硕士研究生的年收入小于31.6千元。

【练习2-6】某城市自来水水费收缴员某次对某一居民楼内各用户两个月的用水

量查表记录如下(单位:m3):

47 23 22 13 20 11 19 9 20 9 20 9 12

9 10 12 7 8 10 10 15 10 4 13 13 6 62 6 23 14 9 8 6 5 12 15 20 20 14 10 47 10 12 17 9 5 17 68 30 9 35 20 25 20 25 20 14 8 10 24 11 16 16 20 9 试对该居民楼的用水情况做出分析。

【解答】

①利用“分析家”通过distributions菜单计算用水量的描述性统计量:

图2.6 “分析家”求解统计量

得出结果如表2.10、2.11、2.12:

表2.10 用水量的矩统计量(moments):

表2.11 用水量的基本统计测度(Basic Statistics Measures):

表2.12 用水量的百分位数(quantiles):

由表 2.10、2.11、2.12得出⑴用水量的位置分布的统计量:均值(mean)为16.64615m3,中位数(median)为13.00000m3,众数(mode)为20.00000m3,上四分位数(Q3)为20m3,下四分位数(Q1)为9m3;⑵用水量的分散程度的统计量:极值(range)为64.00000m3,标准差(std dev)为12.21223m3,方差(var) 为149.13846m3。

②利用編程做出频数直方图:

proc gchart data=lmf.p24;

vbar WatConspt;

run;

图2.7 用水量的频率直方图

③利用INSIGHT作出用水量的盒形图:

图2.8 用水量的盒形图

由①、②、③得出该居民楼两个月内的用水量主要集中在20m3,75%的居民用水量小于20m3,50%的居民用水量小于13m3,25%的居民用水量小于9m3,平均用水量约为16m3,极差为64m3,说明该楼居民用水量的差异大。

【练习2-7】某高校学生逃课的情况进行抽样调查的结果如下:

e e e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2004

femal

e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2005

femal

e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2005

femal

e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2005

femal

e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2005

femal

e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2005

femal

e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2005

femal

e

2 G2004 male 2 G2005 femal

e

2 G2005

femal

e

3 G2005

femal

e

2 G2004 male 2 G2005 femal

e

3 G200

4 male 3 G2005

femal

e

(其中各变量表示含义:1:从不逃课;2:偶尔逃课;3:经常逃课;G2004:2004级;G2005:2005级;male:男;female:女)

①利用INSIGHT模块做出直方图从整体上对逃课情况进行分析:

图2.9 整体上逃课情况

由图2.9得出,从不逃课的有8人,偶尔逃课的有66人,经常逃课的有26人,说明该校学生大多偶尔逃课,但经常逃课的也较多,从不逃课的很少,该校的学

习氛围不够浓。

②利用INSIGHT绘制直方图对两个年级逃课状况进行比较分析:

图2.10 两个年级逃课情况

由图2.10可以看出,2005级从不逃课的学生多于2004级,多6人;2005级偶尔逃课的学生多于2004级,多4人;2005级经常逃课的学生少于2004级,少10人。总体来看2004级学生逃课情况较严重,学习氛围不够。

③利用统计图形对男女生逃课进行比较分析:

⑴利用INSIGHT作出直方图对男女生逃课进行比较:

图2.11 INSIGHT绘制男女逃课分布情况⑵利用“分析家”作出直方图对男女生逃课进行比较:

图2.12 “分析家”绘制男女逃课分布情况

由图2.11、图2.12得出,不同年级男、女从不逃课人数差不多,男生多一点;不同年级男生偶尔逃课人数少于女生;不同年级男生经常逃课人数少于女生。说明女生在学校里较守纪,逃课情况和男生相比较好。

【小结】

通过本章学习,掌握了SAS中利用INSIGHT、“分析家”、编程三个模块对数据进行描述统计,学会熟练地使用三个模块绘制直方图、盒形图等统计图形,并且能够通过图形以及基本统计量对数据进行分析、归纳得出实际结论。

指导教师评语及成绩:

评语:

成绩:指导教师签名:

批阅日期:

相关主题
文本预览
相关文档 最新文档