频数分布表的编制举例
- 格式:ppt
- 大小:658.50 KB
- 文档页数:37
案例7编制频数分布表并绘制相应的统计图对某地区居民储蓄情况进行调查,所得部分数据见表3-4。
思考与讨论问题:1、编制按户口分组的居民户频数分布表并绘制条形图;2、编制按存取款金额分组的频数分组表并绘制直方图;3、编制户口与存款金额总和、平均数交叉的平面数据透视表;4、编制按户口、存取款金额层叠分组的频数表。
表3-4 居民储蓄调查数据表存取款金额(元) 户口(城镇=1,农村=2) 存取款金额(元) 户口(城镇=1,农村=2)存取款金额(元)户口(城镇=1,农村=2)存取款金额(元) 户口(城镇=1,农村=2)1500 1 3700 1 7000 1 100 1 5000 1 100 2 200 1 10000 1 200 1 100 1 10000 1 2500 1 1000 1 300 1 300 1 3500 1 300 1 600 2 300 1 3 1 6500 1 500 1 2000 1 10 1 18000 1 100 1 500 1 8 1 3200 1 100 1 2000 1 20 1 480 1 50 1 1000 1 5000 1 400 1 100 1 200 1 2400 1 300 1 200 1 5000 1 14800 1 10 1 200 1 500 1 25000 1 6000 1 100 1 100 1 100 1 100 1 300 1 1000 1 5000 1 500 1 100 1 3 1 200 1 1000 1 10000 1 2000 1 30 1 10 1 500 1 300 1 1000 1 200 2 400 1 300 1 200 2 6 1 148 1 5400 1 800 2 10 1 3 1 300 1 40 2 5000 1 10 1 3000 1 500 2 8000 1 150 1 20000 1 60 2 300 2 500 1 23900 2 100 2 1000120011100150023268250001100110002 70001100011000018002 800150150015002 1000110001500014002 1000131300012002 5001600130000130002 10001315000110002 201120021000150002 311000146001102 5190012000282 12001500013501502 10012000110001102 50011000011000152 30013600130015002 20011000150017002 3001300135001502 600220011000151 10001500120018002 301100011000122 80001300011000192 9001500150001142 1000190013000110002 3000011001200120002 60018001900115002 200130016029802 1500110002100025002 70001250001100025002 100011000110000210002 805022100013000252 3110001200252 100110001120282 10001200001800262 312000110021102 9016002100028002 8001100001400212 100012017021002 90250250112602 1000155001400210002 170011500290027002 10000155001700230002 100115001100017002500120001300015002 100150001100012002 100011500110110002 400015001600112002 80120011015002 1001700115000113002 10012601450012002 1001500011500111002 200150001500120002 10011000150016002 20013250021002 40012001200120001500011001100012000130001资料来源:薛薇,《SPSS统计分析方法及应用》,电子工业出版社,2007年4月。
实验一:频数分布表的编制统计学的最基本工作是收集数据。
把原始数据收集上来之后,首先要对数据进行整理并分析这些数据的特性和变化规律。
生物统计学中经常遇到的数据有两种类型,一种是连续型数据(continuous data),又称为计量数据(measurement data);另一种是离散型数据(discrete data),又称为计数数据(count data)。
描述数据变化规律的最简单方法是将这些数据列成频数表(frequency table)。
1、离散型数据频数分布表的制作例1:检查200丛稻遗株,每丛内越冬三化螟幼虫的原始调查资料如下(见SAS程序),试编制频数分布表。
data freq_01; input x @@; cards;1 1 0 02 0 0 1 0 2 1 0 1 1 0 1 0 03 0 2 1 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 5 0 1 0 0 0 04 2 0 0 3 0 4 1 3 1 4 0 1 2 6 0 3 2 1 0 2 0 0 1 1 0 0 0 0 0 0 0 0 2 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 02 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 1 0 0 0 1 1 0 0 0 0 0 1 0 1 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0 0 0 1 0;proc freq; run;运行结果:2 连续型数据频数分布表的制作例2:在广州天河区称量106头越冬三化螟幼虫的体重(单位:毫克),根据原始资料(见SAS程序),以6毫克为组距,分成13组,第一组下限为10毫克,制作频数分布表。
Excel频数分布表制作的方法总结Excel可以使用函数或者数据透视表制作一组数据的频数分布表。
划分的组比较少时,可以使用函数"COUNTIFS(数据,条件1,条件2,...)",相关的介绍有很多,本文对此不作赘述。
组数较多时,则建议使用函数"FREQUENCY(数据,分组)"或者数据透视表,但不同的方法中对于每组的划分有细微的差别,会导致结果不一样,下面将一一总结。
工具/原料MS Excel方法一:FREQUENCY函数1. 1以制作一次考试成绩的频数分布表为例,分数范围为0-100分,以5分为组距:2. 2先在空白处写下每组的分割点,本例为5,10,15,...,95,100,如图中F列;然后选中准备写入相应频数的区域“H2:H21”,在输公式处输入“=FREQUENCY(C2:C564,F2:F21)”,再按Ctrl+Shift+Enter,选中的区域“H2:H21”中就会出现相应的频数。
3. 3从上图中已可见,用FREQUENCY函数算出的每组频数是不包括左端而包括右端的。
例如组“(15,20]”中,成绩为15分的人数不会被算入该组,而成绩为20分的人数会被算入该组。
END方法二:数据透视表1. 1仍用上例,选择要统计的数据区域,点击菜单栏中的“插入->数据透视表”。
2. 2在数据透视表页面,将需要统计的数据(本例为“分数”)拖入“行标签”和“数值”中;点击“数值”中“求和项:分数”,选择“值字段设置”,在弹出的对话框中的“值汇总方式”选择“计数”;3. 3在得到的数据透视表中点击“行标签”列中的任意一格,便可以看到菜单中有一个“将字段分组”的选项,点击该选项后,就可以在弹出的对话框中设置要分组的起点、终点和步长,本例中应该分别设置为0,100,5。
4. 4点击确定后,便可得到所要的频数分布表,如下图中左边的表。
注意,用数据透视表统计的频数分布中,可能会缺少频数为0的组(如本例中得到的结果中缺少“5-10”这一组,),因此最后需要检查一遍各分组,添上缺少的组,相应的频数为0。
“健力芬达682.00%雪碧9100.00% 二、用Excel作数值数据的频数分布表和直方图例2 某班50名学生的统计学原理考试成绩数据如下:798878507090547258728091959181726173978374616263747499846475657566758567697586597688697787步骤一:输入数据并排序(一)打开Excel工作簿,把本例中的数据输入到A1至A50单元格中。
(二)对上述数据排序。
结果放到B1至B50。
具体步骤如下:1.拖曳鼠标选中A1:A50单元格区域。
在该处,单击鼠标右键,选中“复制”命令。
2.拖曳鼠标选中B1:B50单元格区域。
在该处,单击鼠标右键,选中“粘贴”命令。
3.再次选中B1:B50,选择“数据”下拉菜单中的“排序”选项。
出现对话框,选中按递增 排序即可。
4.单击确定。
步骤二:指定上限在C3至C7单元格中输入分组数据的上限59,69,79,89,100。
I 提示:Excel在作频数分布表时,每一组的频数包括一个组的上限值。
这与统计学上的“上限不在组”做法不一致。
因此50-60这一组的上限为59。
以此类推。
步骤三:生成频数分布表和直方图(一)选择“工具”下拉菜单中的“数据分析”选项。
出现该对话框。
(二)在“数据分析”对话框种选择“直方图”。
(三)当出现直方图对话框时,1.在“输入区域”方框中输入数据所在单元格区域B1:B50。
2.在“接受区域”方框中输入分组数据上限所在单元格区域C3:C7。
3.在“输出区域”方框中输入D3,表示输出区域的起点。
4.在输出选项中,选择“输出区域”、“累计百分比”和“图表输出”。
(四)点击确定。
(五)为了便于阅读,单击频数分布表中的有“接受”字样的单元格,输入“考试成绩”;同样,用50-60代替频数分布表中的第一个上限值59,60-70代替第二个上限值69,以此类推,最后,用90-100代替频数分布表中最后一个上限值100。
频数分布表与频数分布图频数是指某一随机事件在n次试验中出现的次数。
各种随机事件在n次试验中出现的次数分布就称为频数分布。
对一批数据,将其频数分布用表格的形式表示出来就构成了频数分布表。
(1)编制频数分布表的步骤编制频数分布表是数据整理的基本方法,下面我们结合一个实例来说明频数分布表的编制步骤。
例1.一次物理测验之后,某班48位同学的成绩如下.86 77 63 78 92 72 66 87 75 83 74 47 83 81 76 82 97 69 82 88 7167 65 75 70 82 77 86 60 93 71 80 76 78 57 95 78 64 79 82 68 7473 84 76 79 86 68;根据这一成绩编制频数分布表,其具体步骤是:①求全距(用R表示)。
全距是原始数据中的最大值与最小值之差,即R=max{xi}-min{xi}。
式中R是全距,max{xi}为这批数据中的最大数,min{xi}为这批数据中的最小数.在本例中,max{xi}=97,min{xi}=47,因此R=97—47=50.②定组数(用K表示)。
根据全距决定组数(K)。
组数就是对这批数据分组的个数。
一般而言,组数以10组为宜,多至20组,少至5组。
若组数太多,便会失去实行分组化繁为简的作用;若组数太少,又会引起计算结果的失真。
组数与数据的个数有关,若数据多时,要分10组以上;数据少时,可分5—10组。
③定组距(用i表示)。
组距就是每一个组内包含的间距,即组距(i)是指每个小组的组上限(即组的终点值)与组下限(即组的起点值)之间的距离.显然,在一批数据中,组距一般是相同的.组数与组距有关,组距越小,则组数越多;组距越大,则组数越少.根据上面的讨论,我们得到全距R、组距i、组数K三者之间的关系即i=或K=根据上式,由全距R、组距i决定组数时,将全距R除以组距后取整数即得组数i。
在本例中,全距R=50,若取组距i=5,则组数K=10.④列组限。
第7课时编制频数分布表教学目标1、掌握编制频数(率)分布表的步骤2、能对一组数据进行统计,会根据确定组数的经验法则合理分组3、学生通过对数据的整理、制表和分析,更好地理解和掌握频数和频率的概念;从中体会数据有多种不同的表示方法,能分析讨论得出各种方法的优缺点;逐步学会用多种方法来表示统计数据重点难点重点:编制频数(率)分布的步骤难点:确定组数、组距及每一组的上下界限教学过程一、复习引入前面几节课,我们己经知道要全面地掌握一组数据,了解数据的分布情况,通过编制频数(率)分布表可以给我们提供关于数据的更多信息,怎样编制频数(率)分布表呢?二、创设情境小明调查了他住的那栋宿舍30户职工家庭月收人情况,见教科书P132"统计活动"根据小明的统计表能直观、明确地获知月收人情况吗?如果不能,怎么办呢?三、探究新知分析:1.小明给出的数据是没有经过整理的数据,数据多,而且数量表示上不简单也不直观,各个数据所占人数多少也看不出来,要经过计算才知道.2.看来根据学生现在已有的经验所绘制的统计图不一定能很好地反映频数的分布状况.怎么办呢?(在编制频数分布表时,若不同的数据不多,可以直接算出每种数据在数据组中出现的次数,然后列表表示;若不同的数据较多,分布比较零散,可以先适当分组,计算数据在各组中出现的频数,然后列表表示.)3.引导学生观察、分析、创造出新的编制方法:分组划定数据取值的不同范围,然后统计数据在各范围中出现的频数引导学生自己动手设计,再与同伴交流,最后统一具体做法如下:(1)分组①确定最大值M和最小值m.②确定组数的各组界限.为了分组的方便,我们取略小于m的数作为第一组的下限,例如取720;而取略大于m 的数作为最后一组的上限,例如取960.再适当分组(960-720=240),可分为6组,每组的长度(240÷6=40)即为组距.故所分6组为:720~759,760~799.800~。
实验一计量资料频数表的整理与统计描述一、测得12人的血红蛋白含量(g/L)121,118,130,120,122,118,116,124,127,129,125,132。
请计算其均数,几何均数,中位数,标准差,极差,变异系数。
二、某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.715.69 4.12 4.56 4.375.396.30 5.217.22 5.54 3.93 5.21 6.51 5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89 6.25 5.32 4.50 4.63 3.61 4.44 4.43 4.25 4.03 5.85 4.09 3.35 4.08 4.79 5.30 4.973.18 3.97 5.16 5.10 5.864.795.34 4.24 4.32 4.776.36 6.384.885.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.726.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.704.60 4.095.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.345.186.14 3.24 4.90 3.051、编制频数分布表并绘制直方图,简述其分布特征。
2、选择适当的集中趋势指标、离散趋势指标并计算。
三、某市1974年为了解该地居民发汞(μmol/kg)的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝、肾疾病,无汞接触史地2382、计算均数X、几何均数G和中位数M,何者较大?为什么?何者用于说明本资料的集中位置较适合?3、选用何种指标描述其离散程度较好?请计算。
熟练使用SPSS创建频数分布表
试验内容:
[试验]
下表为10个人对两个不同的问题作出的回答(回答为“Yes”或“No”)后得到的数据,利用SPSS为该数据创建频数分布表。
表1 调查结果表
sample1sample2gender
No Yes女
Yes No女
No Yes女
No No女
No No女
Yes Yes男
Yes Yes男
Yes Yes男
No Yes男
No Yes男
1.在数据输入区域输入需要进行描述性统计分析的数据,如下图所示。
图1 数据录入界面
2.选择“analyze”下拉菜单。
3.选择“Descriptive Statistics”选项。
4.在子菜单中选择“Frequencies”。
图2 选择分析工具5.在左侧选择需要分析的参数添加到右侧的分析列表。
图3 选取变量进入右侧列表6.在“Statistics”选项中选择需要进行分析的参数。
图4 设置分析参数SPSS输出的结果:
图5 分析结果显示。