高中数学 第2章《统计》频率分布表 精品导学案 苏教版必修三
- 格式:doc
- 大小:99.50 KB
- 文档页数:3
2.2.1 频率分布表整体设计教材分析“频率分布表”这一节主要通过探究“北京地区的气温分布状况问题”逐步引入频率分布表.用例题说明分布表的编制过程.在实际应用中,很多问题的解答需要总体分布的信息,而总体分布则需要用样本来估计,在“北京地区的气温分布状况问题”中,要解决的是怎样通过已知数据分析比较两时间段的高温状况.频率分布是总体分布的一种近似,频率分布表具有如下特性:(1)教科书中只给出了样本容量不超过100时,分组数k在5~12组之间的情形.(2)频率分布表中的数字与分组数(组距)有关.(3)通过样本的改变让学生体会频率分布表的随机性.(4)由于随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上,要让学生体会频率分布表的这种随样本容量增加的规律性.(5)由于频率分布表编制的工作量一般很大,课本介绍了利用Excel制作频率分布表的方法和步骤.三维目标1.通过实例体会分布的意义和作用;学会列频率分布表;体会频率分布表的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的概率分布估计总体分布.3.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.4.在教学过程中,通过学生的相互交流,来加深对频率分布表概念的理解,增强学生数学交流能力,培养学生倾听、接受别人意见的优良品质.5.通过引导学生欣赏蕴含在我们生活中与频率分布表有关的实际问题,使学生感受数学、走进数学.重点难点教学重点:用样本频率分布估计总体分布.教学难点:1.对总体分布概念的理解;2.频率分布表的编制.课时安排1课时教学过程导入新课设计思路一:(实例导入)教师出示投影胶片1:为了了解7月25日至8月24日北京地区的气温分布状况,我们对以往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.88月 828.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3日至8月24日怎样通过上表中的数据,分析比较两时间段的高温(≥33 ℃)状况呢?上面两样本中的高温天数的频率用下表表示:时间总天数高温天数(频数)频率7月25日至8月10日17 11 0.6478月 8日至8月24日17 2 0.118 由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月 8日至8月24日.上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.引入课题,板书课题——用样本频率分布估计总体分布.设计思路二:(情境导入)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某城市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准为a,用水量不超过a的部分按平价收费,超出部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出标准,需要做哪些工作?分析:如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须了解全市居民的日常用水量的分布情况.比如月均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市的居民较多,不可能也没有必要一一调查,那如何处理呢?可以采用随机抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民某年的月均用水量(单位:吨).推进新课新知探究(给出投影胶片2:100位居民的月均用水量)100位居民的月均用水量(单位:吨).分析:上面这些数字能告诉我们什么呢?可以看出居民月均用水量的最小值为0.2,最大值为4.3,其他在0.2到4.3之间. 除此以外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.分析研究:分析数据的一种基本方法是用紧凑的表格改变数据的排列方式.或者用图形将它们画出来.表格可以改变数据的构成形式,为我们提供了解释数据的新方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.这就是我们初中学过的频数分布图和频数分布表,在此基础上我们从各个小组数据在样本容量中所占比例大小的角度进一步研究频率分布表.1.首先求极差,如何求?是多少?求极差即一组数据中的最大值与最小值的差.4.3-0.2=4.1,说明样本数据的变化范围是4.1.2.如何选定适当的组距与组数?组数是越多越好吗?通常是就样本的量而定,抽取样本的量也要视实际问题的需要来确定,并非越多越好.本例样本量是100,组数为8~12组比较适当,组距力求取整.在此问题中,如果取组距为0.5,那么有:组数=2.85.01.4==组距极差 因此可以将数据分为9组.3.选定组距与组数后为进一步分析数据还需要确定分点,将数据分组.进行数据分组后可以详细地记录每组数据在所抽取的样本中占的频数及频率.组数少了,频数及频率就有可能相应的变大,因此,样本的频率分布表可随组数的变化而改变.第N 组的频率=样本容量组频数第N 上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表(frequency distribution table ).一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.其中,整个取值区间的长度称为全距;分成的区间的长度称为组距.频率分布表的优点是:能直接反映数据在各范围内的频率和频数;其缺点是:不能直观地反映数据的频率分布.应用示例例1 从规定尺寸为25.40 mm 的一堆产品中任意抽取100件,测得它们的实际尺寸如下:制作频率分布表.分析: 根据编制频率分布表的步骤完成.解:如果把这对产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,他们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间的长度为0.03,计出每个区间内的频数,并计算相应的频率,将结果填入下表:分组 频数累计 频数 频率[25.235,25.265) 1 1 0.01[25.265,25.295) 3 2 0.01[25.295,25.325) 8 5 0.05[25.325,25.355) 20 12 0.12[25.355,25.385) 38 18 0.18[25.385,25.415) 63 25 0.25[25.415,25.445) 79 16 0.16[25.445,25.475) 92 13 0.13[25.475,25.505) 96 4 0.04[25.505,25.535) 98 2 0.02[25.535,25.565]100 2 0.02合计100 1.00 点评:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值.由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一组数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第一组的下限略去或把第一组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.例2 在编制频率分布表时,①组距不变时,不同的起始点不影响分组数;②组距不变,分组数不变时,不同起始点对应的频率分布表中的各组频率一定是不同的;③分组数越多,频率分布表就越准确地反映总体的情况.以上结论中正确的共有()A.0个B.1个C.2个D.3个分析:①错,不同的起始点可能会引起组数的增加;②错,有可能相同;③错,只能是更准确地反映样本的情况,而不是总体.答案:A点评:使学生更好地理解频率分布表的制作.例3 有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)估计数据小于30.5的可能性是百分之几?分析:此题已给出了组距和组数,可以直接列出频率分布表.解:(1) 样本的频率分布表如下:分组频数频率[12.5,15.5) 6 0.06[15.5,18.5)16 0.16[18.5,21.5)18 0.18[21.5,24.5)22 0.22[24.5,27.5)20 0.20[27.5,30.5) 10 0.10[30.5,33.5] 8 0.08合计 100 1.00(2)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的可能性是92%.点评:解决总体分布估计问题的一般精简程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=组数频数). 例4 根据中国银行的外汇牌价,2005年1季度的60个工作日中,欧元的现汇买入价(100欧元的外汇可兑换的人民币)的分组与各组频数如下:[1 050,1 060),1;[1 060,1 070),7;[1 070,1 080),20;[1 080,1 090),11;[1 090,1 100),13;[1 100,1 110),6;[1 110,1 120],2.(1)列出欧元的现汇买入价的频率分布表;(2)估计欧元的现汇买入价在区间1 065~1 105内的频率;(3)如果欧元的现汇买入价不超过x 的频率的估计为0.95,求此x.分析:第1问学生已无障碍,下面两问要结合对频率分布表中分布意义的理解.解:(1)欧元的现汇买入价的频率分布表为分组 频数 频率[1 050,1 060) 1 0.017[1 060,1 070) 7 0.117[1 070,1 080) 20 0.333[1 080,1 090) 11 0.183[1 090,1 100) 13 0.217[1 100,1 110) 6 0.100[1 110,1 120] 2 0.033合计 60 1.00(2)欧元的现汇买入价在区间1 065~1 105内的频率的估计值为 0.117×1060107010651070--+0.333+0.183+0.217+0.100×1100111011001105--=0.84. (3)因为0.017+0.117+0.333+0.183+0.217=0.867<0.95,0.017+0.117+0.333+0.183+0.217+0.100=0.967>0.95,所以x 在区间[1 100,1 110)内,且满足0.867+0.100×110011101100--x =0.95,所以x≈1 108.3.即欧元的现汇买入价不超过1 108.3的频率的估计为0.95.点评:通过对生活实例的分析,使学生更好地体会分布的意义和作用.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.知能训练对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30(1)列出频率分布表;(2)估计电子元件寿命在100 h~400 h以内的概率;(3)估计电子元件寿命在400 h以上的概率.解:(1)频率分布表:寿命频数频率100~200 20 0.1200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布表可以算出,寿命在100 h~400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100 h~400 h的概率为0.65.(3)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35 .点评:结合例题配套练习,让学生熟练掌握解题过程.课堂小结总体分布情况可以通过样本来估计,频率分布是总体分布的一种近似.频率分布表编制步骤:①求极差;②决定组距与组数;③将数据分组;④列频率分布表.频率分布表具有如下特性:①分组的变化可以引起频率分布表的结构的变化.②随机性:频率分布表是由样本决定的,因此它们会随样本的改变而改变,而样本是随机抽取的.③规律性:由于频率趋近于概率的原则,若固定分组,随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上.作业1.课本习题2.2 1.2.现实生活中,很多问题的解决需要总体分布的信息,而总体分布需要用样本来估计.如身高、体重、考试成绩、农作物产量、某种特定新产品的各种质量指标、股票价格等.请自己查阅资料做进一步的调查了解,作出分析判断,提出建议.要注意抽样的合理性与可操作性.设计感想研究分布规律的方法应在解决实际问题的过程中探索出来,所以制作频率分布表的过程或步骤应该是在结合实例的基础上,一边实践一边总结,因此一开始例题的解决过程应是探索过程.。
2.2.1 频率分布表2.2.2 频率分布直方图与折线图1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图及折线图,了解频率分布折线图和总体密度曲线的定义.(重点、难点)3.通过实例体会频率分布直方图的特征,会用频率分布直方图对总体分布规律进行估计.(重点、难点)[基础·初探]教材整理1 频率分布表阅读教材P 53~P 55“思考”上边的部分,并完成下列问题.1.频率分布表的概念率分布.我们把反映估计总体的频样本的频率分布或不便于获得时,可以用很大当总体分布的表格称为频率分布表.总体频率 2.制作频率分布表的步骤;全距组数和组距,组距=组数求全距,决定(1)区间;闭区间,最后一组取左闭右开分组,通常对组内数值所在区间取(2) ,列出频率分布表.频率,计算频数登记(3)判断正误:(1)制作频率分布表时,一般分组使每组的组距相等,但组距没有固定的标准.( ) (2)数据分组的组数与样本容量有关,一般是样本容量越大,所分组数越多.( )(3)制作频率分布表时,组距一般取整数.( )【解析】 (1)√.根据频率分布表的制作步骤知正确.(2)√.由频率分布表的制作步骤知正确. (3)×.组距不一定为整数,而是没有固定的限制要求.【答案】 (1)√ (2)√ (3)×教材整理2 频率分布直方图与折线图阅读教材P 56~P 58“例4”上边的部分,并完成下列问题.1.频率分布直方图,这样的直方图称为频率分布直方图,样本的频率分布规律定义:我们用直方图反映(1)简称频率直方图.(2)绘制步骤;频率分布表先制作① ,纵轴等于该组的组距建立直角坐标系:把横轴分成若干段,每一段对应一个组的②频率组距,并标上一些关键点; ,这样得矩形为高作频率组距,以纵轴上底画矩形:在横轴上,以连接相邻两点的线段为③到一系列矩形,就构成了频率分布直方图.2.频率分布折线图顺次连接起来,就得到频上底边的中点定义:将频率分布直方图中各个相邻的矩形的(1)率分布折线图,简称频率折线图.(2)总体分布密度曲线,分组的组足够大,如果将样本容量取得数据的变化趋势频率折线图的优点是它反映了,那么相应的频率折线图将趋于一条光滑曲线,称这条光滑曲线为总体分布的足够小距取得密度曲线.判断正误:【导学号:11032038】(1)频率分布直方图中每个小矩形的面积等于相应组的频数;( )(2)频率分布直方图中的所有小矩形的面积之和等于1;( )(3)在频率分布表中,组距越大,频率分布折线图就越接近于总体密度曲线.( )【解析】 (1)×.小长方形的面积=组距×频率组距=频率.故错误. (2)√.由小长方形面积的意义知正确.(3)×.当分组越细时,折线图越接近于总体密度曲线,故错误.【答案】(1)× (2)√ (3)×[小组合作型]。
2.2.1 频率分布表
一、学习目标:
1.了解频数、频率的概念,了解全距、组距的概念;
2.能正确地编制频率分布表;会用样本频率分布去估计总体分布;
3.通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.
二、例题:
例1 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.并估计身高不小于170的同学的所占的百分率.
164
170
155
点评:列频率分布表的步骤如下:
(1)求全距,决定组数和组距,组距=全距/组数;
(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;
(3)登记频数,计算频率,列出频率分布表.
例2 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)
[138,1
(1)列出样本频率分布表﹔
(2)估计身高小于134cm的人数占总人数的百分比.
练习:
如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温:
.
)状况?
问题:怎样通过上表中的数据,分析比较两时间段内的高温(33C
四、课外作业:
课本第52~53页练习第1、3题.。
2.2.1 频率分布表教学目标:1.了解频数、频率的概念,了解全距、组距的概念;2.能正确地编制频率分布表;会用样本频率分布去估计总体分布;3.通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.教学重点:用样本频率分布估计总体分布;教学难点:对总体分布概念的理解;频率分布表的绘制.教学方法:1.通过实例体会频率分布表的意义和作用,会列频率分布表,体会频率分布表的特点.2.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学过程:一、问题情境如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温:二、学生活动o)状况?问题:怎样通过上表中的数据,分析比较两时间段内的高温(33C三、建构数学一般地:当总体很大或不便获取时,用样本的频率分布去估计总体频率分布;把反映总体频率分布的表格称为频率分布表.四、数学运用例1 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.并估计身高不小于170的同学的所占的百分率.解:(1)在全部数据中找出最大值180与最小值151,它们相差(极差)29,确定全距为30,决定组距为3;(2)将区间[150.5,180.5]分成10组;分别是[150.5,153.5),[153.5,156.5),…,[177.5,180.5);(3)从第一组[150.5,153.5)开始分别统计各组的频数,再计算各组的频率,列频率分布表:根据频率分布表可以估计,估计身高不小于170的同学的所占的百分率为:171.5170[0.140.070.040.03]100%21%171.5168.5-⨯+++⨯=-.一般地编制频率分布表的步骤如下:(1)求全距,决定组数和组距;全距是指整个取值区间的长度,组距是指分成的区间的长度;(2)分组,通常对组内的数值所在的区间取左闭右开区间,最后一组取闭区间; (3)登记频数,计算频率,列出频率分布表.例2 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm)(1)列出样本频率分布表;(2)估计身高小于134cm的人数占总人数的百分比.分析根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的人数占总人数的19%.2.练习.(1)课本第55~56页练习第1,4题.五、要点归纳与方法小结本节课学习了以下内容1.总体分布的频率、频数的概念;2.绘制频率分布表的一般步骤.。
2.2.2 频率分布直方图与折线图整体设计教材分析这一节主要通过频率分布表来探究频率分布直方图直观意义、作图方法与作图步骤,并在此根底上使学生能画出频率分布折线图,总体密度曲线.由于作统计图表操作性很强,所以在教学中要使学生在明确图表含义前提下,让学生自己动手作图.关于总体密度曲线,需要使学生了解:总体在区间〔a,b〕内取值百分比就是教科书图2.23中阴影局部面积,通过思考栏目两个问题要使学生了解到,有总体没有密度曲线,例如总体是掷骰子试验所有可能出现结果;总体密度曲线与总体分布相互唯一确定.三维目标1.认识频率分布直方图、频率分布折线图与总体密度曲线特点.2.能正确画出频率分布直方图、频率分布折线图、总体密度曲线.3.通过组织学生观察频率分布直方图、频率分布折线图、总体密度曲线特点,用图形直观方法引出它们概念,有利于学生对概念了解.4.教学中引导学生自己动手作图,在作图过程中去体会概念、形成概念,培养学生用运动变化观点认识它们辩证关系,感受自然界辩证法,使学生体会知识之间有机联系,感受数学整体性,激发学生学习兴趣.重点难点教学重点:1.频率分布直方图、频率分布折线图、总体密度曲线概念以及它们之间辩证关系;2.画频率分布直方图、频率分布折线图、总体密度曲线.教学难点:1.体会分布意义与作用.2.对总体分布概念理解,统计思想初步形成.课时安排1课时教学过程导入新课分析数据一种根本方法是用图形将它们画出来,或者用紧凑表格改变数据排列方式.作图可以到达两个目,一是从数据中提取信息,二是利用图形传递信息.表格那么是改变数据构成形式,为我们提供解释数据新方式.这就是我们初中学过频数分布图与频数分布表,在此根底上我们从各个小组数据在样本容量中所占比例大小角度进一步研究频率分布直方图.推进新课新知探究频数分布表虽然能表达出数据分布规律,但它并不直观,为了直观地表达出数据分布规律,我们需要画频率分布直方图.在初中,已学过如何绘制频数直方图,它能直观地表达数据分布规律.同样我们可以用直方图来反映样本频率分布规律.可以利用直方图反映样本频率分布规律,这样直方图称为频率分布直方图,简称频率直方图.一般地,作频率分布直方图方法为:把横轴分成假设干段,每一线段对应一个组组距,然后以此线段为底作一矩形,它高等于该组,这样得出一系列矩形,每个矩形面积恰好是该组上频率.这些矩形就构成了频率分布直方图.频率分布直方图两种类型:用样本频率分布估计总体分布通常分为两种情况:〔1〕当总体中个体取不同数值很少时,其频率分布表由所取样本不同值及其相应频率表示,其几何表示就是相应条形图.条形图中纵轴表示是频率,条形图高为该组数据频率.但应注意“总体中个体取不同数值很少〞并不是指“总体中个数很少〞.〔2〕当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过整理样本数据知识,用频率分布直方图来表示相应样本频率分布.频率分布直方图优点与缺点:频率分布直方图比频率分布表更直观、形象地反映了样本分布规律;但绘制频率分布直方图过程比拟复杂,且它不能直接表达数据频数分布.将频率分布直方图中各相邻矩形上底边中点顺次连结起来,就得到频率分布折线图,简称频率折线图.如果将样本容量取得足够大,分组组距取得足够小,那么相应频率折线图将趋于一条光滑曲线,我们称这条光滑曲线为总体分布密度曲线.如以下图所示.总体密度曲线反映了总体在各个范围内取值百分比.根据这条曲线,可求出总体在区间(a,b)内取值概率等于总体密度曲线,直线x=a,x=b及x轴所围图形面积.说明:〔1〕有总体没有总体密度曲线.例如总体是抛掷硬币〔骰子〕大量重复试验所有可能出现结果.〔2〕总体密度曲线与总体分布是相互唯一确定.如果总体分布,就可以得到密度曲线函数表达式,从而用函数理论去研究它.〔3〕我们所面临情况是总体分布未知,因此可以通过样本频率折线近似,但不能够通过样本数据准确地画出总体密度曲线.应用例如例1 下表是某学校一个星期中收交来失物件数,请将5天中收交来失物数用条形图表示.分析:当总体中个体取不同数值很少时,可用频数条形图或频率条形图来表示.解:用Excel作条形图:〔1〕在Excel工作表中输入数据,光标停留在数据区中;〔2〕选择“插入/图表〞,在弹出对话框中点击“柱形图〞;〔3〕点击“完成〞.如以下图:点评:利用Excel画图很方便.例2 作出上面例1中数据频率分布直方图、频率折线图与密度曲线.分析:根据绘制频率分布直方图、频率折线图与密度曲线过程解题.解:频率分布直方图:〔1〕先制作频率分布表〔上面已完成〕,然后作直角坐标系,以横轴表示身高,纵轴表示;〔2〕在横轴上标上表示150.5,153.5,156.5,…,180.5点〔为方便起见,起始点可适当前移〕;〔3〕在上面标出各点中,分别以连接相邻两点线段为底作矩形,高等于该组.至此,就得到了这组数据频率分布直方图,如下图:频率分布折线图:取直方图中各相邻矩形上底边中点顺次连结,再将矩形边去除,得频率折线图如图.总体分布密度曲线:可近似地表示为:点评:〔1〕频率分布直方图比频率分布表更直观、形象地反映了样本分布规律,如在164附近到达“峰值〞,并具有一定对称性,这说明这批学生身高在164 cm附近较为集中.另外还可看出,特别高与特别矮学生较少.〔2〕在频率分布直方图根底上,取直方图中各小矩形上底边中点顺次连结起来时需注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.〔3〕频率分布折线图优点是它能反映数据变化趋势,但它不能直接表达数据分布规律.例3 以下图是某单位50名职工年龄〔取正整数〕频率分布直方图,各小长方形高AE∶BF∶CG∶DH=2∶4∶3∶1,由图中提供信息,答复以下问题〔直接写出答案〕:〔1〕第二小组频率与频数分别是多少?〔2〕不小于38岁但小于46岁职工频率是多少?〔3〕假设46岁职工有一人,那么46岁以上职工有几人? 分析:此题主要考察小矩形长、宽、面积含义.解:〔1〕设DH=x ,那么CG=3x,BF=4x,AE=2x.所以, (x+3x+4x+2x)×4=1.所以,x=401.所以第二小组频率:4×401×4=52,频数:25×50=20.〔2〕4×401×4+3×401×4=107=0.7. 〔3〕4×401×50-1=4. 点评:注意每个小矩形长与宽含义及小矩形面积=组距×=频率,各小矩形面积表示相应各组频率,频率分布直方图以面积形式反映了数据落在各小组频率大小.在频率分布直方图中,各小长方形面积总与等于1.例4 为了了解一大片经济林生长情况,随机测量其中100株树木底部周长,得到如下数据表〔单位:cm 〕:〔1〕编制频率分布表;〔3〕估计该片经济林中底部周长小于100 cm树木约占多少,底部周长不小于120 cm树木约占多少.解:〔1〕从表中可以看出,这组数据最大值为135,最小值为80,故全距为55,可将其分为11组,组距为5.从第一组[80,85〕开场,将各组频数、频率与填入下表中.(2)这组数据频率直方图如以下图所示.(3)从频率分布表可以看出,该样本中小于100频率为0.01+0.02+0.04+0.14=0.21,不小于120频率为0.11+0.06+0.02=0.19,故可估计该片经济树林中底部周长小于100 cm树木约占21%,底部周长不小于120 cm树木约占19%.知能训练1.在样本频率分布直方图中,共有11个小矩形,假设中间一个小矩形面积等于其它10个小矩形面积与1/4,且样本容量为160,那么中间一组频数为〔〕2.从一条生产线上每隔30分钟取一件产品,共取了n件,测得其尺寸后,画得其频率分布直方图如图,尺寸在[15,45]内频数为46,那么尺寸在[20,25]内产品个数为〔〕3.为了解各年龄段观众对某电视剧收视情况,某校一个研究性学习小组,调查了局部观众收视情况,并分成A、B、C、D、E、F六组进展整理,其频率分布直方图如下图,那么:〔1〕E组频率为_________________;〔3〕假设该村观众人数为1 200,估计该村50岁以上观众有_______________人.解答:1.A 2.B 3.〔1〕0.24 〔2〕略〔3〕432课堂小结〔1〕正确利用频率分布直方图、频率折线图与密度曲线三种分布描述方法,都能得到一些有关分布主要特点,如分布是否具有单峰性、是否具有对称性、样本点落在各分组中频率等,这些主要特点受样本随机性影响比拟小,更接近于总体分布相应特点.〔2〕频率分布表与频率分布直方图之间密切关系是显然,它们只不过是一样数据两种不同表达方式.〔3〕当总体中个体取不同数值很少〔并不是总体中个数很少〕时,其频率分布表由所取样本不同数值及其相应频率来表示,其几何表示就是相应条形图.作业1.课本习题2.2 2、3、4、5.2.请班上每个同学估计一下自己每天课外学习时间〔单位:分钟〕,然后作出课外学习时间频率分布表、频率分布直方图、频率分布折线图、总体密度曲线.你认为能否由这些估计出你们学校学生课外学习时间分布情况?可以用它来估计该地区学生课外学习时间分布情况吗?为什么?设计感想由于初中学过频数条形图,所以学生在刚接触画频率分布直方图时,学生很自然想法是以纵轴表示频率.教师应肯定学生想法,并按此想法操作,然后向学生说明这样做虽然直观与容易理解,但为了与后续学习内容中密度曲线、正态分布曲线〔理科〕等衔接,而频率分布直方图另一种画法,在以后学习中可充分表达其优点.这样做,既保护了学生学习积极性,也激发了学生对数学好奇心.。
2.2 总体分布的估计名师导航三点剖析一、频率分布表1.定义总体分布反映了总体在各个范围内取值的频率,由于总体很大或不便于获得,因此我们可以利用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.2.列频率分布表的步骤在初中我们所接触的频率表是通过历史上所做的抛硬币的大量重复试验得到的.在这个试验中,抛掷硬币试验的结果的全体构成一个总体,每次试验的结果是总体中的一个个体,如果我们从中抽取一个容量为72 088的样本,其中正面向上的结果数为36 124,反面向上的结果数为35 964,则我们就可以得到如下一个频率分布表:这类试验只有两种结果,比较简单,下面我们就通过实例来研究较为复杂的频率分布表的制作方法.例如:从规定尺寸为25.的一堆产品中任意抽取100件,测得它们的实际尺寸如下:25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35 25.41 25.43 25.4425.49 25.45 25.43 25.46 25.40 25.51 25.45 25.40 25.39 25.41 25.36 25.38 25.3125.56 25.43 25.40 25.38 25.37 25.44 25.33 25.46 25.40 25.39 25.34 25.42 25.5025.37 25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43 25.40 25.4325.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40 25.36 25.42 25.39 25.46 25.3825.35 25.31 25.34 25.40 25.36 25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.4125.49 25.35 25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33 25.4025.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39如果把这堆产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,它们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间长度为0.03,再统计出每个区间内的频数,并计算相应的频率,将结果填入下表:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一批数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第1组的下限略去或把第1组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.3.频率分布的优点和缺点频率分布表的优点是:能直接反映数据在各范围内的频数和频率;其缺点是:不能直观地反映数据的频率分布, 分布表是否正确.二、频率分布直方图1.定义频率分布表虽然能体现出数据的分布规律,但它并不直观,为了直观地体现数据数的分布规律,我们需要画频率分布直方图.在初中,我学过如何绘制频数直方图,它能直观地体现数据的分布规律.同样我们可以用直方图来反映样本的频率分布规律.这种反映样本的频率分布规律的直方图称为频率分布直方图,简称频率直方图.2.绘制频率分布直方图的步骤为了形象地说明绘制频率分布直方图的步骤,我们还以具体的实例来说明频率分布直方图的画法.例如:有一个容量为50的样本数据的分组及各组的频数如下:[12.5,15.5),3;[15.5,18.5),8;[18.5,21.5),9;[21.5,24.5),11;[24.5,27.5),10;[27.5,30.5),5;[30.5,33.5), 4.列出样本的频率分布表,画出频率分布直方图分析:本题主要考查频率分布表的编制和频率分布直方图的绘制及频率分布表的应用.由于题中数据已分组,所以在列频率分布表时,只要直接计算出每小组数据的频率填入表中即可.解:样本的频率分布表、频率分布直方图如下:频率分布表频率分布直方图(如图6-1所示):图6-1所以,要绘制此样本的频率分布直方图,有以下几步:频率;(1)先列出频率分布表,然后作出直角坐标系,以横轴表示身高,纵轴表示组距(2)在横轴上标上12.5,15.5,…,33.5表示的点(为了方便,第一个数据点可以前移);频率, (3)在上面标出的各点中,分别以相邻两点为端点的线段为底边作矩形,其高等于组距至此,就得到了这组数据的频率分布直方图.一般地,画频率分布直方图方法如下:把横轴分为若干段,每一段对应一组的组距,然后以线段为底,作一个矩形,它的高等频率,作出一系列的矩形;每个矩形的面积恰好是该组的频率,这些矩形就构成于该组的组距了频率分布直方图.在频率分布直方图中各个小矩形的面积和等于1.3.频率分布直方图的两种类型用样本频率分布估计总体分布通常分两种情况:(1)当总体中的个体取不同数值很少时,其频率分布表由所取的样本的不同值及其相应频率表示,其几何表示就是相应的条形图.条形图中,纵轴表示的是频率,条形图的高为该组数据的频率.但应注意:“总体中的个体取不同数值很少”并不是指“总体中的个数很少.”例如:前面所接触到的抛掷硬币的试验中,尽管样本的容量达到了72088,但试验结果只有两种,即正面向上和反面向上.如果记“正面向上”的结果为0,记“反面向上”为1,则样本中数据只有两个取值.此时,该样本的频率分布表的几何表示就为相应的条形图. (2)当总体中个体取不同值较多,甚至无限时,对其频率分布研究用到初中学过的整理样本数据的知识,用频率分布直方图来表示相应的样本的频率分布.4.频率分布直方图的优点和缺点频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布.三、频率折线图与总体的密度曲线1.频率折线图的定义将频率分布直方图中各相邻的矩形的上底边的中点顺次连结起来,就可以得到一条折线,这条折线就是本组数据的频率折线图.2.频率折线图的画法频率折线图是在频率分布直方图的基础上,取直方图中各小矩形的上底边的中点连结而成的.画频率折线图时还应注意:取值区间两端点需分别向外延伸半个组距,以使折线首尾分别与横轴相连.3.频率折线图的优点与缺点频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律. 4.总体的密度曲线在画频率折线图时,如果将样本容量取得足够大,分组的组距取得足够小,这条折线将趋于一条曲线,这一曲线为总体的密度曲线,它能反映出总体分布规律.例如:为了估计某产品寿命的分布,对产品进行抽样检验,记录如下(单位:小时):203 397 597 402 102 303 289 312 501 316 488 355 585 355413 316 197 479 384 278 522 363 234 432 357 566 111 333467 265 326 534 318 552 323 188 352 447 452 337 123 370399 445 365 549 248 316 459 331 176 554 368 412 374 251327 489 329 246 316 475 311 260 133 314 426 366 213 495335 540 338 407 586 331 290 368 410 167 320 510 364 276305 417 307 524 573 326 146 227 317 407 369 214 504 425153 214(1)作出频率分布表;(2)画出频率分布直方图和频率折线图;(3)估计产品寿命在200~500h以内的百分率;(4)估计产品寿命在400h以上的百分率.分析:此题中样本数据取不同的值较多,属于总体分布的第二种情况.将样本中数据适当分组统计各组中数据的频数,计算其频率即可.解:(1)该组数据中最小值为102,最大值为597,差为495,可分为5组.列表如下:(2)频率分布直方图和频率折线图如下(如图6-2所示):频率分布直方图频率折线图图6-2(3)200~500 h以内的百分率为1-15%=85%.(4)产品寿命在400h以上的百分率为20%+15%=35%.四、茎叶图1.平均数、中位数和众数一般地,对于n 个数x 1,x 2,…,x n ,我们把nx x x n+++ 21叫做这n 个数的算术平均数,简称平均数.平均数常用于表示一组数据的平均水平.计算平均数时,所有数据都参加运算,它能充分利用数据所描述的信息,因此在生活中较为常用,但它易受端点值的影响.例如:某公司职工月工资表如下:经计算,该公司职工月平均工资为2 000元,但除经理和副经理之外其他员工的工资均小于2 000元,这就是因为平均数受端点值6 000和500的影响.一般地,n 个数据根据大小顺序排列后,处于中间位置的一个数据(或中间两个数据的平均数)叫做这组数据的中位数.由中位数的定义可知,当数据的个数是奇数时最中间的一个数据是中位数;当数据的个数是偶数时,则最中间两个数据的平均数是中位数.中位数受端点值的影响小,但不能充分利用所有数据的信息.例如:在上面某公司职工月工资表中的中位数是1 300.众数则是一组数据中出现次数最多的那个数据.如在上面某公司职工月工资表中众数则是平均数、中位数和众数均能反映一组数据的平均水平,在一组数据中平均数和中位数只有一个,众数则可以有多个例如:在数据1.5,1.5,1.6,1.65,1和1.7,1.7,1.75,2.1中,平均数为1.7;中位数为1.675;众数则为1.5和1.7.2.茎叶图制作茎叶图的方法是:当所给数据为一位数时,可将0作为茎叶较长的茎,而它本身作为叶;当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”;当所给的数据为三位数时,可将百位和十位作为茎,而个位作为叶.茎相同的数据共用一个茎,茎按从小到大的顺序从上到下排列,共用茎的叶一般要按从大到小(也可以从小到大)的顺序同行排出.制作茎叶图时,一般用一个竖线将茎叶隔开,竖线的左边是茎,右边是叶.由茎叶图我们可以粗略地看出一组数据的平均数、中位数、众数的范围.茎叶图不但可以分析单组数据,也可以对两组数据进行对比.当列两组数据的茎叶图时,它们可以共同用一个茎.3.茎叶图的优点和缺点茎叶图的优点是:所有信息都可以从茎叶图中得到体现,而且茎叶图便于记录和表示;它既可以分析单组数据,也可以对两组数据进行比较.茎叶图的缺点是:茎叶图不方便表示位数在三位以上的数据.问题探究问题:为了了解一大片经济树林的生长情况,随机测量其中的100株的底部周长,得到如下数据(长度单位为cm):135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112109 124 87 131 97 102 123 104 104 128105 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108 该用什么样的方法来估计经济树林的生长情况?探究:用样本估计可用频率分布表、频率分布直方图和频率折线图.它们有着各自的特点:频率分布表编制比较简单且能体现出数据在各范围出现的次数和频率,但它不能直观地反映数据的频率分布;频率分布直方图虽然能直观体现数的分布规律,但要绘制频率分布直方图过程比较复杂,且它不能直接体现数据的频数分布;频率折线图的优点是它能反映数据的变化趋势,但它不能直接体现数据的分布规律.所以,本题采用何种方法来估计经济树林的生长情况,要视具体要求而定,例如:估计这片经济林中底部周长少于100cm的树木约占多少?不少于120cm的树木约占多少?我们可采用频率分布表,这是因为它能直接体现出数据在各范围内出现的次数和频率.如果要考查某一范围内数据的变化情况,则可采用频率折线图.精题精讲例1.为了了解某地区高三学生的身体发育情况,抽查了地区内100名年龄为17.5岁~18岁的男生的体重情况,结果如下表(单位:kg):试根据上述数据列出样本的频率分布表,并对相应的总体分布做出估计.思路解析该组数据中最小值为55,最大值为76,它们的差是76-55=21,可取区间[54.5,76.5],并将此区间分为11个区间,每个区间的长度为2,再统计每个区间内的频数并计算频率,列表即可.解析:按照下列步骤获得样本的频率分布:(1)求最大值与最小值的差.在上述数据中,最大值是76,最小值是55,它们的差(又称为极差)是76-55=21,所得的差告诉我们,这组数据的变动范围有多大.(2)确定组距与组数.如果将组距定为2,那么由21÷2=10.5,组数为11,这个组数是适合的.于是组距为2,组数为11.(3)决定分点.根据本例中数据的特点,第1小组的起点可取为54.5,第1小组的终点可取为56.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[54.5,56.5),[56.5,58.5),…,[74.5,76.5).(4)列频率分布表.频率分布表在得到了样本的频率后,就可以对相应的总体情况作出估计.例如可以估计体重在[64.5,66.5)kg的学生最多,约占学生总数的16%;体重小于58.5 kg的学生较少,约占8%等等.绿色通道一般地,列频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=全距/组数;(2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.频数累计是指本组数据及本组数据以前各组数据的和.频率分布表有两条较为明显的性质:①各组的频数和为样本中数据的个数;②各组的频率和为1.例2.下表给出了某校120名12岁男孩的身高资料(单位:cm):(1)列出样本的频率分布表; (2)画出频率分布直方图;(3)根据样本的频率分布图,估计身高小于134cm 的人数约占总人数的百分比;(4)如果该校所在的地区,12岁男孩有12万人,根据上面的统计结果,你能估计出身高在150 cm 以上的男孩大约有多少人?(5)如果样本容量再大一些,组距再小一些,请你想象一下,直方图中的小矩形会发生什么变化?思路解析由于题目中数据已分组,则可直接列频率分布表.由于频率分布图能直观地体现出样本的频率分布,则由图直接进行估计.由频率分布表可知身高在150cm 的频率为241201 ,所以,估计出身高在150cm 以上的男孩大约11 000人.如果样本容量再大一些,组距再小一些,频率分布直方图中的各个小矩形就会越来越细.当样本容量充分大时,图中的组距充分缩短,从而图中的小矩形的上底的连线就变成光滑的曲线. 答案:(1)列频率分布表如下:(2)频率分布直方图分布如下(如图6-3所示):图6-3(3)身高小于134cm的学生数约占总数的19%.(4)身高在150cm以上的男孩大约11 000人.(5)各个小矩形就会越来越细,当样本容量充分大时,图中的组距充分缩短,图中的小矩形的上底的连线就变成光滑的曲线.例3.为制定本市初中七、八、九年级学生校服的生产计划,有关部门准备对180名初中男生的身高作调查,现有三种调查方案:①测量少体校中180名男子篮球、排球队员的身高;②查阅有关外地180名男生身高的统计资料;③在本市的市区和郊县各任选一所完全中学、两所初级中学,在这六所学校有关的年级(1)班中,用抽签的方法分别选出10名男生,然后测量他们的身高.(1)为了达到估计本市初中这三个年级男生身高分布的目的,你认为采用上述哪一种调查方案比较合理,为什么?(2)下表中的数据是使用某种调查方法获得的:(注:每组可含最低值、不含最高值)根据表中的数据填写表中的空格.根据填写的数据绘制频数分布直方图.思路解析本题考查了抽样方法的选择和频数分布直方图的绘制,由于在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性,则宜用方案③.又所抽的数据中已分组,则可直接计算各组数据的频数分布和直接绘制频数分布直方图.解析:(1)在统计中收集数据必须用随机抽样的方法所抽取的数据才具有代表性.①中,少体校的男子篮球、排球的运动员的身高一定高于一般的情况,因此无法用测量的结果去估计总体的结果.②中,用外地学生的身高也不能准确地反映本地学生身高的实际情况.③中的抽样方法符合随机的抽样,因此用方案③比较合理.(2)①上表中的频数从上到下依次为15,33,96,33,3.②直方图如图6-4所示.绿色通道统计中数据的获得要合理、公平、具有代表性,这是解决问题的第一关.它直接影响着统计的结果,影响正确结论的得出,也就影响着正确决策的制定.例4.从某校参加初中毕业考试的学生的成绩中,抽取了30名学生的数学成绩,分数如下: 90,85,84,86,87,98,79,85,90,93,68,95,85,71,78,61,94,88,77,100,70,97,85,68,99,88,85,92,93,97.这个样本数据的频率分布表如下:填空(1)这个样本数据的众数是_________分.(2)列频率分布表时,所取的组距为_________分.(3)在这个频率分布表中,数据落在94.5~99.5分范围内的频数为_________.(4)在这个频率分布表中,数据落在74.5~79.5分范围内的频率为_________.(5)在这个频率分布表中,频率最大的一组数据的范围是_________分.(6)估计这个学校初中毕业考试的数学成绩在80分以上(含80分)的约占_________%.思路解析(1)众数是一组数据中出现次数最多的数,它的数量可以是多个.在本题中落在84.5~89.5分范围内的数据的个数最多,而这组数据的组中值为85分,则可以用85分来代表这组数据.(2)考查频率分布表制作过程中组距的划分,由于该组数据所取的区间为[59.5,104.5],最大值与最小值的差为45,又整个区间被分为9组,则组距为5.(3)考查识表能力,由所给的频率分布表可知,在94.5~99.5分的频率数为5.(4)考查识表能力,由所给的频率分布表可知,数据落在74.5~79.5分范围内的频数为3,则由频率的计算公式可得,数据落在74.5~79.5分范围内的频率为0.100.(5)考查识表能力,由所给的频率分布表可知,表中频数的最大值为9,它的分布范围为84.5~89.5分.(6)考查识表能力,当某一范围由几组数据组成时,则在这一范围内数据出现的频率为构成这一范围各组数据出现的频率的和.答案:(1)85 (2)5 (3)5 (4)0.100 (5)84.5~89.5 (6)73.3(7)频率分布直方图和折线图如图6-5所示:图6-5绿色通道一般地,将频率分布直方图中各个矩形上底的中点顺次连结起来,就得到一条折线,我们称之为本组数据的频率分布折线图.如果将样本的容量取得足够大,分组的组距取得足够小,则这条折线将趋近于一条曲线,我们称之为总体分布的密度曲线.例5.甲、乙两篮球运动员上一个赛季的得分如下:甲:21,25,31,31,14,34,32,41,50,23,8.乙:13,34,35,34,23,24,41,50,32,37,32.试比较两人的得分水平.思路解析当所给数据为两位数时,将所有两位数的十位数字作为“茎”,个位数字作为“叶”.当列两组数据的茎叶图时,它们可以共同用一个茎.解析:画茎叶图(如图6-6所示),由图可知,乙运动员的得分大致对称,其平均数、众数、中位数都是30多分,比甲稳定.图6-6绿色通道用茎叶图刻画数据有两个优点:一是所有信息从图中可以得到;二是茎叶图便于记录和表示,但茎叶图对于表示三位数以上的数据是不够方便的.。
第2章统计§2.1抽样方法2.1.1 简单随机抽样(教师用书独具)●三维目标1.知识与技能理解抽样的必要性,简单随机抽样的概念,掌握简单随机抽样的两种方法.2.过程与方法通过实例分析、解决,体验简单随机抽样的科学性及其方法的可靠性,培养分析问题、解决问题的能力.3.情感态度与价值观通过身边事例研究,体会抽样调查在生活中的应用.●重点难点重点:掌握简单随机抽样的特点及常见的两种方法(抽签法、随机数表法).难点:理解简单随机抽样的科学性,以及由此推断结论的可靠性.通过生活实例让学生知道在不适宜普查的情况下,如何进行抽样调查才是比较科学的,结论才是可靠的,通过学生的实际操作,逐步引导学生总结出随机抽样的概念,体会随机抽样在处理现实问题中的必要性和重要性,让学生在概念中找关键词使之加深对概念的理解,并归纳实施步骤从而强化重点.教学时充分让学生自己分析、判断,自主学习、合作交流.采用讨论发现法教学,通过抓阉等游戏尽可能的让学生动手操作,体验并激发学生积极思考,再利用多媒体中随机数生成器等进行随机抽样,让学生感受样本得到的随机性,从而化解难点.(教师用书独具)●教学建议结合本节课的教学内容和学生的认知水平,在教法上,建议教师采用“启发—探究—讨论”式教学模式,以促进学生发展为出发点,着眼于知识的形成和发展以及学生的学习体验,以问题链形式由浅入深、循序渐进,让不同层次的学生都能参与到课堂教学中,体验成功的喜悦.运用由浅入深的问题形式,给学生创造一种思维情境,一种动脑、动手、动口的机会,提高能力,增长才干.由于本节课内容实例多,信息容量大,文字多,采用多媒体辅助教学,节省时间,提高教学效率,另外采用这种形式也可强化学生感观刺激,从而大大提高学生的学习兴趣.●教学流程创设问题情境,引出问题:要判断一锅汤的味道需要把整锅汤都喝完吗?该怎样判断?⇒引导学生结合初中学习过的抽样知识,观察、比较、分析,得出简单随机抽样的概念.⇒通过引导学生回答所提问题理解简单随机抽样的条件、特征及讨论由简单抽样能够解决的问题.⇒通过例1及其变式训练,使学生理解简单随机抽样的概念与解决问题的方法.⇒通过例2及其变式训练,使学生掌握利用抽签法设计抽样方案问题的解题策略.⇒通过例3及其变式训练阐明随机数表法的原理,使学生明确用随机数表法解决问题的基本模式.⇒完成当堂双基达标,巩固所学知识并进行反馈矫正.⇒归纳整理,进行课堂小结,整体把握这两种抽样设计的优缺点及应用范围.课标解读1.理解简单随机抽样的概念.(重点) 2.学会两种简单随机抽样的方法.(重点) 3.能合理地从总体中抽取样本.(难点)简单随机抽样【问题导思】要判断一锅汤的味道需要把整锅汤都喝完吗?该怎样判断?【提示】不需要,只要将锅里的汤“搅拌均匀”品尝一小勺就知道汤的味道.假设你作为一名食品卫生工作人员,要对某食品店内的一批水果罐头进行卫生达标检验,你准备怎样做?【提示】从中抽取一定数量的罐头作为检验的样本.一般地,从个体数为N的总体中逐个不放回地抽取n个个体作为样本(n<N),如果每个个体都有相同的机会被取到,那么这样的抽样方法称为简单随机抽样.抽签法和随机数表法都是简单随机抽样.抽签法【问题导思】假设在你们班选派3个人参加学校的某项活动,为了体现选派的公平性,用什么方法确定具体人选?【提示】抽签法.抽签法的步骤(1)将总体中的N个个体编号;(2)将这N个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽取k次;(5)将总体中与抽到的号签的编号一致的k个个体取出.随机数表法【问题导思】当总体的个数较多时,怎么抽取质量比较高的样本?【提示】随机数表法随机数表法的步骤(1)将总体中的个体编号(每个号码位数一致);(2)在随机数表中任选一个数作为开始;(3)从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止;(4)根据选定的号码抽取样本.简单随机抽样的判断下列抽取样本的方式是否属于简单随机抽样,并说明理由.(1)从全班50名同学中,选出3名三好学生.(2)从无限多个个体中,选出100个个体作样本.(3)从100件产品中选5件检验质量,抽取一件检验后放回,再抽一件,共抽五次.(4)从全班同学中选两名参观世博会,将全班同学的学号写在大小相同的纸片上,放入箱子里搅拌均匀后,一次取出两张,由纸片上的学号确定人选.【思路探究】根据简单随机抽样的特点逐一判断即可.【自主解答】(1)不是简单随机抽样,选三好学生时,不是每位学生被选上的机会都相等.(2)不是简单随机抽样,因为总体N无限,不符合简单随机抽样的定义.(3)不是简单随机抽样,因为是有放回抽样.(4)不是简单随机抽样,因为一次取了两张纸片,不是逐个抽取.1.简单随机抽样的特点是:(1)总体有限;(2)不放回抽取;(3)逐个抽取;(4)机会均等,不满足其中任何一条都不是简单随机抽样.2.判断一种抽样是不是简单随机抽样,评判的惟一标准就是其特征,尤其是总体有限容易被忽视,如本例中的(4),容易误判为简单随机抽样.判断下列抽取样本的方法是否是简单随机抽样:(1)从8台电脑中不放回地逐个随机抽取2台进行质量检验(假设8台电脑已经编号,对编号随机抽取).(2)某班50名同学,指定年龄最小的5个人参加某项活动;(3)从20个零件中一次性抽出3个进行质量检测.【解】(1)是简单随机抽样,简单随机抽样就是从有限个个体中逐个不放回地抽取个体构成样本.(2)不是简单随机抽样,因为每个个体被抽到的机会不是均等的.(3)不是简单随机抽样,因为不是逐个抽取的.抽签法的应用从某班46名学生中随机选出5名参加某项活动.请用抽签法设计抽样方案.【思路探究】按抽签法的步骤进行抽样.【自主解答】第一步,编号.一般用正整数1,2,3,…,46来给总体中所有的个体编号;第二步,写号码标签.把号码写在形状、大小相同的号签上,号签形式可不限,如小球、卡片等;第三步,均匀搅拌.把上述号签放在同一个容器内均匀搅拌;第四步,抽取.从容器中逐个连续地抽取5次,得到一个容量为5的样本.1.一个抽样能否用抽签法关键看两点:一是制签方便,二是易被搅匀.这就要求总体中个体数量不多.2.采用抽签法最重要的是保证每个个体等可能的被抽取,这就要求把号签搅匀.3.若个体中已有编号如考号、学号、标签号码等,可不必重新编号.从40件产品中抽取10件进行质量检验,写出抽取样本的步骤.【解】第一步将40件产品按1,2,…,40进行编号;第二步将1~40这40个号码写在形状、大小均相同的号签上;第三步将号签放在同一箱中,并搅拌均匀;第四步依次从箱中抽取10个号签;第五步将抽到的10个号签上的号码对应的产品取出,即得样本.随机数表法有一批机器,编号为1,2,3, (112)请用随机数表法抽取10台入样,写出抽样过程.【思路探究】各机器的编号位数不一致,需将编号进行调整.【自主解答】第一步将原来的编号调整为001,002,003, (112)第二步在随机数表中,任选一数作为开始,任选一方向作为读数方向,比如,选第9行第7个数“3”向右读;第三步从数“3”开始,向右读,每次读三位,凡是不在001~112中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到074,100,094,052,080,003,105,107,083,092;第四步对应原来的编号74,100,94,52,80,3,105,107,83,92的机器便是要抽取的对象.1.随机数表的构成与特点:随机数表是由0,1,2,…,9这10个数字组成的数表,并且表中的每一位置出现各个数字的可能性相同.通常根据实际需要和方便使用的原则,将几个数组合成一组,然后通过随机数表抽取样本.2.随机数表的产生方法并不唯一,如抽签法、抛掷骰子法、计算机生成法,编号时号码的位数一定要一致.读数时,读取的每个数的位数与编号的位数也要一致.3.使用随机数表法时,选取开始读的数是随机的,读数的方向也是随机的.因选取开始读的数不同,读数方向不同,所以抽取的样本号码可能不一致,但均符合抽样的公平性、等可能性.只要按随机数表法的步骤抽取,都是符合要求的、正确的.某校有学生1 200人,为了调查某种情况,打算抽取一个样本容量为50的样本,问此样本若采用简单随机抽样将如何获得?【解】简单随机抽样分两种:抽签法和随机数表法.尽管此题总体中的个体数不算少,但依题意其操作过程却是等可能的.法一首先,把该校学生都编上号码:0 001,0 002,0 003,…,1 200.若用抽签法,则做1 200个形状、大小相同的号签(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌.抽签时,每次从中抽出1个号签,连续抽取50次,得到一个容量为50的样本.法二首先,把该校学生都编上号码:0 001,0 002,0 003,…,1 200.若用随机数表法,则在随机数表中任选一数作为开始,任选一方向作为读数方向,每次读取四位,凡不在0 001~1 200中的数跳过去不读,前面已经读过的也跳过去不读.一直到取够50个为止.忽视抽样方法步骤出错某单位支援西部开发,现从报名的20名志愿者中选取5人组成志愿小组到新疆工作,请用抽签法设计抽样方案.【错解】第一步,将20名志愿者编号,号码是01,02,03,…,20;第二步,将号码分成5份:{01,06,11,16},{02,07,12,17},{03,08,13,18},{04,09,14,19},{05,10,15,20},并将每一份中的号码写在一张纸条上,揉成团,制成号签,得5个号签;第三步,在5个号签中随机抽取1个号签,并记录上面的编号;第四步,所得号签对应的5位志愿者就是志愿小组的成员.【错因分析】设计方案时,没有按照抽签法的一般步骤进行方案设计,不符合简单随机抽样的特点.【防范措施】 1.设计方案时步骤要合理、正确.2.方案的设计要符合简单随机抽样的等可能性.3.正确掌握抽签法的步骤.【正解】第一步,将20名志愿者编号,号码是01,02,03,…,19,20;第二步,将号码分别写在一张纸条上,揉成团,制成号签;第三步,将得到的号签放入一个不透明的袋子中,并搅拌均匀;第四步,从袋子中逐个不放回地抽取5个号签,并记录上面的编号;第五步,所得号码对应的志愿者就是志愿小组的成员.1.抽签法与随机数表法都要求被抽取样本的总体的个体数有限,都是从总体中逐个地进行抽取,都是不放回抽样.2.当总体中的个体数较多,样本容量较小时,抽签法将总体的编号“搅拌均匀”比较困难,因此用此种方法产生的样本代表性差的可能性很大,而随机数表法中每个个体被抽到的可能性相等,用这种方法产生的样本代表性较好.3.简单随机抽样每个个体入样的可能性都相等.1.简单随机抽样的常用方法有________和________.随机地选定随机数表读数,选定开始读取的数后,读数的方向可以是________.【解析】根据简单随机抽样的分类及随机数表法的操作步骤可知.【答案】抽签法随机数表法任意的2.关于简单随机抽样的特点,有以下几种说法,其中不正确的是________.①要求总体的个数有限②从总体中逐个抽取③这是一种不放回抽样④每个个体被抽到的机会不一样,与先后顺序有关【解析】简单随机抽样除了具有特点①②③外,还具有等可能性,每个个体被抽到的机会相等,与先后顺序无关,故只有④不正确.【答案】④3.某校有教学班100个,每班50人,要求每班选派2人参加“学生代表大会”,在该问题中,样本容量是________.【解析】N=100×50=5 000,抽取比例250=1 25.∴n=5 000×125=200.【答案】2004.从20名学生中要抽取5名进行问卷调查,写出抽样的过程.【解】①先将20名学生进行编号,从1编到20;②把号码写在形状、大小均相同的号签上;③将号签放在某个箱子中进行充分搅拌;④依次从箱子中取出5个号签,按这5个号签上的号码抽取学生,即得样本.一、填空题1.为了了解参加运动会的2 000名运动员的年龄情况,从中抽取100名运动员抽查.就这个问题,下列说法中正确的是________.①2 000名运动员是总体;②每名运动员是个体;③所抽取的100名运动员是一个样本;④样本容量为100.【解析】 2 000名运动员的年龄是总体,每个运动员的年龄是个体,所抽取的100名运动员的年龄组成一个样本,样本容量为100.【答案】④2.下面的抽样方法是简单随机抽样的是________.①从某城市的流动人口中随机抽取100人作调查;②在某年明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方法确定号码的后四位为2 709的为三等奖;③在待检验的30件零件中随机逐个拿出5件进行检验.【解析】①中总体容量较大,不宜用简单随机抽样;②中抽取的个体的间隔是固定的,不是简单随机抽样.【答案】③3.从个体数为N的总体中抽取一个容量为k的样本,采用简单随机抽样,当总体的个数不多时,一般用______进行抽样.【解析】由抽签法特点知易采用抽签法.【答案】抽签法4.(2013·苏州高一检测)采用抽签法从含有3个个体的总体{1,3,8}中抽取一个容量为2的样本,则所有可能的样本是________.【解析】从三个总体中任取两个即可组成样本∴所有可能的样本为{1,3},{1,8},{3,8}.【答案】{1,3},{1,8},{3,8}5.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性、“第二次被抽到”的可能性分别是________.【解析】简单随机抽样中,每个个体被抽取的机会均等,都为110.【答案】110,1106.某工厂的质检人员对生产的100件产品,采用随机数法抽取10件检查,对100件产品采用下面的编号方法①1,2,3, (100)②001,002, (100)③00,01,02, (99)④01,02,03, (100)其中正确的序号是________.【解析】采用随机数表编号时,所编号码应位数相同,以保证每个号码被抽到的机率相等.【答案】②③7.某中学高一年级有1 400人,高二年级有1 320人,高三年级有1 280人,以每人被抽到的机会为0.02,从该中学学生中抽取一个容量为n的样本,则n=________.【解析】三个年级的总人数为1 400+1 320+1 280=4 000(人),每人被抽到的机会均为0.02,∴n=4 000×0.02=80.【答案】808.(2013·江西高考改编)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.7816657208026314070243699728019832049234493582003623486969387481 【解析】由随机数表法的随机抽样的过程可知选出的5个个体是08,02,14,07,01,所以第5个个体的编号是01.【答案】01二、解答题9.要从北京某中学文艺部30名学生中随机抽取3名参加国庆阅兵仪式,试写出利用抽签法抽样的过程.【解】第一步将30名学生编号为1,2,3, (30)第二步将这30个号码写到形状、大小相同的号签上;第三步将号签放在同一箱中,并搅拌均匀;第四步从箱中每次抽取1个号签,连续抽取3次;第五步抽到的3个号签上的号码对应的3名学生就是参加国庆阅兵仪式的学生.10.上海某中学从40名学生中选1名作为上海男篮拉拉队的成员,采用下面两种方法:方法一将这40名学生从1~40进行编号,相应的制作写有1~40的40个号签,把这40个号签放在一个暗箱中搅拌均匀,最后随机地从中抽取1个号签,与这个号签对应的学生幸运入选.方法二将39个白球与一个红球混合放在一个暗箱中搅拌均匀,让40名学生逐一从中摸取一个球,摸到红球的学生成为拉拉队的成员.试问这两种方法是否都是抽签法?为什么?这两种方法有何异同?【解】抽签法抽样时给总体中的N个个体编号各不相同,由此可知方法一是抽签法,方法二不是抽签法.因为抽签法要求所有的号签编号互不相同,而方法二中39个白球无法相互区分.这两种方法的相同之处在于每名学生被选中的机会都相等.11.某次数学竞赛中要求考生解答的12道题是这样产生的:从30道选择题中随机抽取3道,从50道填空题中随机抽取5道,从40道解答题中随机抽取4道,试确定某考生所要解答的12道题的序号.【解】法一:(抽签法)第一步:将选择题、填空题、解答题编号,号码是1,2,3, (120)第二步:将1~120这120个号码分别写在大小、形状都相同的号签上;第三步:将选择题、填空题、解答题的号签分别放入三个箱子中,都搅拌均匀;第四步:分别从装有选择题、填空题、解答题号签的箱子中逐个抽取3个、5个、4个号签,并且记录所得号签的号码,这就是所要解答的问题的序号.法二:(随机数表法)第一步:对题目编号,选择题编号为001,002,...,030;填空题编号为031,032,...,080;解答题编号为081,082, (120)第二步:在随机数表中任意选择一个数作为开始,任选一个方向作为读数方向,比如,选第15行第6列的数4作为开始,向右读;第三步:从数字4开始向右读下去,每次读三位,凡是不在001~120中的数跳过去不读,遇到已经读过的数也跳过去,从001~030中选3个号码,从031~080中选5个号码,从081~120中选4个号码,依次可以得到038,119,033,099,004,047,094,116,044,068,013,030.第四步:以上号码就是所要解答的问题序号,选择题的序号是4,13,30;填空题的序号是38,33,47,44,68;解答题的序号是119,99,94,116.(教师用书独具)中央电视台希望在春节联欢晚会播出一周内获得当年春节联欢晚会的收视率.下面是三名同学为电视台设计的调查方案.同学A:我把春节联欢晚会收视率调查表放在互联网上,只要上网登录该网址的人就可以看到这张表,他们填表的信息可以很快反馈到我的电脑中,这样,我就可以很快统计出收视率了.同学B:我给我们居民小区的每一个住户发一份是否在除夕那天晚上看中央电视台春节联欢晚会的调查表,只要一两天就可以统计出收视率.同学C:我在电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们是否收看了中央电视台春节联欢晚会,我不出家门就可以统计出中央电视台春节联欢晚会的收视率.请问:上述三名同学设计的调查方案是否能够获得比较准确的收视率?为什么?【思路点拨】判断的标准是所有可能看电视的人群是否有相同的的机会被抽中.【规范解答】调查的总体是所有可能看电视的人群.学生A的设计方案考虑的人群是上网而且登录该网址的人群,那些不能上网的人,或者不登录该网址的人就被排除在外了.因此A方案抽取的样本的代表性差.学生B的设计方案考虑的人群是小区的居民,有一定的片面性.因此B方案抽取的样本的代表性差.学生C的设计方案考虑的人群是那些有电话的人,也有一定的片面性.因此C方案抽取的样本的代表性差.所以,这三种方案都有一定的片面性,不能得到比较准确的收视率.1936年,美国进行总统选举.竞选的是民主党的罗斯福和共和党的兰登,罗斯福是在任的总统.美国权威的《文学摘要》杂志社,为了预测总统候选人中谁能当选,采用了大规模的模拟选举.他们以电话簿上的地址和俱乐部成员名单上的地址发出100万封信,收到回信20万封.在调查史上,样本容量这么大是少见的,杂志社花费了大量的人力和物力.他们相信自己的调查统计结果,即兰登将以57%对43%的比例获胜,并大力进行宣传.最后选举结果却是罗斯福以62%对38%的巨大优势获胜,连任总统.这个调查使《文学摘要》杂志社威信扫地,不久只得关门停刊.试分析这次调查失败的原因.【解】统计不当的原因,其中之一是选取了不适当的样本作为统计调查的基础,如果抽样时使用了不适当的方法,往往得到错误的结论.失败的原因:①抽样方法不正确.样本不是从总体(全体美国公民)中随机地抽取.1936年,美国有私人电话和参加俱乐部的家庭,都是比较富裕的家庭.1929~1933年的世界经济危机,使美国经济遭受沉重打击.“罗斯福新政”动用行政手段干预市场经济,损害了部分富人的利益,“喝了富人的血”,但广大的美国人民从中得到了好处.所以,从这部分富人中抽取的样本严重偏离了总体,导致样本不具有代表性.②样本容量相对太小也是导致估计出现偏差的一个原因,因为样本容量越大,估计才越准确,发出的信不少,但回收率太低.2.1.2 系统抽样(教师用书独具)●三维目标1.知识与技能(1)理解系统抽样的定义,特点及操作步骤.(2)理解科学、合理选用抽样方法的必要性.2.过程与方法(1)系统抽样的操作步骤.(2)通过生活实例的对比分析,让学生了解各种抽样方法的使用范围,能根据实际情况选择适当的抽样方法.3.情感态度与价值观:(1)将生活实例与数学进行结合,使学生感受到生活处处有数学;激发学生学习的兴趣,渗透“运用数学”解决实际问题的意识.(2)培养学生科学的探索精神,合作探讨、相互交流的能力,概括归纳的能力.●重点难点重点:系统抽样的定义及操作步骤;难点:系统抽样中的处理办法.(教师用书独具)●教学建议在探讨中总结定义,培养学生合作探讨,相互交流的能力.培养学生概括归纳的能力.让学生体会学数学的成就感.通过师生的互动,理解系统抽样概念.●教学流程创设问题情境,引出问题:从500名学生中抽取50名学生调查对老师的意见除了用简单随机抽样外还有其他方法吗?⇒引导学生结合前面学习过的简单随机抽样的知识,观察、比较、分析,得出系统抽样的概念.⇒通过引导学生回答所提问题,理解系统抽样的应用条件、应用范围及由系统抽样能够解决的问题.⇒通过例1及其变式训练,使学生掌握系统抽样概念问题的解题方法.⇒通过例2及其变式训练,使学生掌握简单的系统抽样的方案设计问题的解题策略.⇒通过例3及其变式训练阐明需剔除个体的系统抽样的方法,使学生明确抽样方法解决问题的基本模式.⇒完成当堂双基达标,巩固所学知识并进行反馈矫正.⇒归纳整理,进行课堂小结,整体认识本节课所学知识.。
第4课时 频率分布表【学习目标】1.了解频数、频率的概念,了解全距、组距的概念;2.能正确地编制频率分布表;会用样本频率分布去估计总体分布;3.通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法. 【问题情境】如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下两个样本(单位:0C ):怎样通过上表中的数据,分析比较两时间段内的高温天气(日最高气温33C o)状况呢?【合作探究】填写下列表格:【知识建构】1.频率分布表:______________________________________________________________.2.编制频率分布表的步骤:⑴⑵⑶【展示点拨】例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.例2.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm):(1)列出样本频率分布表;134的人数占总人数的百分比.(2)估计身高小于cm【学以致用】1.在用样本频率估计总体分布的过程中,下列说法中,正确的是()A.总体容量越大,估计越精确; B.总体容量越小,估计越精确;C.样本容量越大,估计越精确; D.样本容量越小,估计越精确.2.一个容量为20的数据样本,分组与频数为:[10,20], 2个;(20,30] ,3个;(30,40] ,4个; (40,50],5个;(50,60],4个;(60,70],2个.则样本数据在区间(-∞,50]上的可能性为()A.5% B.25% C.50% D.70%.0,那么该组样本的频数为3.一个容量为32的样本,已知某组样本的频率为125_______..0,则4.一个容量为n的样本,分成若干组,已知某数的频数和频率分别为50和25n______.5.在一本书中,分组统计100句中的字数,得出下列结果:字数1~5个15句,字数6~10个的27句,字数11~15个的32句,字数16~20个数的15句,字数21~25个的8句,字数26~30个的3句.请作出字数的频率分布表,并利用组中值对该书中平均每个句子的字数作出估计.第4课时频率分布表【基础训练】1.一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n=________.2.用样本频率分布估计总体频率分布的过程中,有下列说法①总体容量越大,估计越精确;②总体容量越小,估计越精确;③样本容量越大,估计越精确;④样本容量越小,估计越精确.其中的正确说法是_______.3.将容量为100的样本数据,按从小到大的顺序分为8个组,如下表所示:则第3组的频率和累积频率分别是_________,_________.4.在某次考试的学生成绩中随机抽取若干名学生的成绩,分组与分组的频数如下:估计本次考试的及格率为_______.5.将一批数据分成四组,列出频率分布表,其中第一组的频率是0.27,第二组与第四组的频率之和为0.54,那么第三组的频率是_______.6.为了分析某班的学生一次考试数学成绩,从中抽取了一个样本,已知不超过70分的人数8人,其累计频率为0.4,则这个样本的样本容量是_______.7.一个容量为20的样本数据,分组后组距与频数如下表则样本在区间(-∞,50)上的频率为 _______.8.容量为100的样本数据,按从小到大的顺序分为8组,如下表:第三组的频数和频率分别是_____、______.9. 将一个容量为100的样本数据,按照从小到大的顺序分为8个组,如下表:若第6组频率是第3组频率的2倍,则第6组的频率是_______.【思考应用】10.从某班级随机抽取了20名学生,测得他们的视力数据如下:4.7,4.2,5.0,4.1,4.0,4.9,5.1,4.5,4.8,5.2,5.0,4. 0,4.5,4.8,4.6,4.9,5.3,4.0.(1)请把数据分为5组,列出频率分布表;(2)估计该班学生的近视率(视力低于4.9).11.一个容量为100的样本,数据的分组和各组的一些相关信息如下,完成表中的空格.【拓展提升】12.从某年级210名学生中随机抽取一个30名学生的样本,样本中每个学生用于课外作业的时间(单位:min)依次为:75,80,85,65,95,100, 70,55,65,75, 85,110,120,80,85,80,75,90,90,95,70,60,60,75,90,95,65,75,80,80.估计该年级的学生中作业时间超过一个半小时(含一个半小时)的学生有多少人?第4课时 频率分布表答案1.120 2.③ 3.0.14,0.37 4.90% 5.0.19 6.20 7.0.7 8.14,0.14 9.由第6组频率是第3组频率的2倍可知两组频数之比也是2,易知这两组频数总和为100–(10+16+18+15+11+ 9)=21,所以第6组频数为21×32=14,即该组频率为0.14. 10.频率分布表略,该班学生近视率约为 55%11.[15,18)组的频率为0.3-0.06-0.12=0.12,同理可得[24,27)组的频率应为0.69-0.3-0.21=0.18, [27,30)组的累计频率应为1-0.1-0.05=0.85 因此[30,33)组的频率为0.85-0.69=0.16.根据频率计算公式可得表12.先统计30名同学的样本中学生中作业时间超过一个半小时(含 一个半小时)的学生有9人,因此,估计210名学生中大约 有210×309=63人.。
频率分布表
一览众山小
诱学·导入
材料:很多事例让我们感到了分析体育彩票规律重要性:通化一位彩民通过长期地投资终于中得500万大奖使很多彩民都感慨不已,长春市三位先生通过体彩数据具体分析后用1万元中出了500万体彩特等奖和50万体彩特别奖更是让彩民震惊,而他们成绩多是来源于长期关注与细致分析讨论,所以,要想中得大奖,数据分析应该是彩民捷径.
问题:每一期体彩信息原始状态往往散乱无序,带有一定随机性,那么彩民之所以能中大奖所用“推测〞方法有科学依据吗?
导入:体育彩票市场曾创造了无数神话,相当一局部中奖者在谈及自己中奖经历时都表示,他们能够中奖,是经过长期研究体育彩票走势、中奖号码分布特点后〔即作出频率分布表〕精心选号结果.所以说彩民之所以能中大奖“推测〞方法是科学,“推测〞结果是比拟可靠,以此为依据而作决策也是比拟正确.
温故·知新
1.抛掷一枚硬币假设干次,你能否列出它频率分布表?
2.我们通过随机抽样方法在总体中抽取样本就得到了一组数据,怎样从得到这组数据信息来研究总体信息呢?
用样本频率分布与数字特征来估计总体频率分布与数字特征.虽然我们每次抽样所获得样本数据各不一样,但总体频率分布与数字特征是不会改变.。
2.2.1 频率分布表整体设计教材分析“频率分布表”这一节主要通过探究“北京地区的气温分布状况问题”逐步引入频率分布表.用例题说明分布表的编制过程.在实际应用中,很多问题的解答需要总体分布的信息,而总体分布则需要用样本来估计,在“北京地区的气温分布状况问题”中,要解决的是怎样通过已知数据分析比较两时间段的高温状况.频率分布是总体分布的一种近似,频率分布表具有如下特性:(1)教科书中只给出了样本容量不超过100时,分组数k在5~12组之间的情形.(2)频率分布表中的数字与分组数(组距)有关.(3)通过样本的改变让学生体会频率分布表的随机性.(4)由于随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上,要让学生体会频率分布表的这种随样本容量增加的规律性.(5)由于频率分布表编制的工作量一般很大,课本介绍了利用Excel制作频率分布表的方法和步骤.三维目标1.通过实例体会分布的意义和作用;学会列频率分布表;体会频率分布表的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的概率分布估计总体分布.3.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.4.在教学过程中,通过学生的相互交流,来加深对频率分布表概念的理解,增强学生数学交流能力,培养学生倾听、接受别人意见的优良品质.5.通过引导学生欣赏蕴含在我们生活中与频率分布表有关的实际问题,使学生感受数学、走进数学.重点难点教学重点:用样本频率分布估计总体分布.教学难点:1.对总体分布概念的理解;2.频率分布表的编制.课时安排1课时教学过程导入新课设计思路一:(实例导入)教师出示投影胶片1:为了了解7月25日至8月24日北京地区的气温分布状况,我们对以往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.88月 828.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3日至8月24日怎样通过上表中的数据,分析比较两时间段的高温(≥33 ℃)状况呢?上面两样本中的高温天数的频率用下表表示:时间总天数高温天数(频数)频率7月25日至8月10日17 11 0.6478月 8日至8月24日17 2 0.118 由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月 8日至8月24日.上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.引入课题,板书课题——用样本频率分布估计总体分布.设计思路二:(情境导入)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某城市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准为a,用水量不超过a的部分按平价收费,超出部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出标准,需要做哪些工作?分析:如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须了解全市居民的日常用水量的分布情况.比如月均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市的居民较多,不可能也没有必要一一调查,那如何处理呢?可以采用随机抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民某年的月均用水量(单位:吨).推进新课新知探究(给出投影胶片2:100位居民的月均用水量)100位居民的月均用水量(单位:吨).分析:上面这些数字能告诉我们什么呢?可以看出居民月均用水量的最小值为0.2,最大值为4.3,其他在0.2到4.3之间. 除此以外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.分析研究:分析数据的一种基本方法是用紧凑的表格改变数据的排列方式.或者用图形将它们画出来.表格可以改变数据的构成形式,为我们提供了解释数据的新方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.这就是我们初中学过的频数分布图和频数分布表,在此基础上我们从各个小组数据在样本容量中所占比例大小的角度进一步研究频率分布表.1.首先求极差,如何求?是多少?求极差即一组数据中的最大值与最小值的差.4.3-0.2=4.1,说明样本数据的变化范围是4.1.2.如何选定适当的组距与组数?组数是越多越好吗?通常是就样本的量而定,抽取样本的量也要视实际问题的需要来确定,并非越多越好.本例样本量是100,组数为8~12组比较适当,组距力求取整.在此问题中,如果取组距为0.5,那么有:组数=2.85.01.4==组距极差 因此可以将数据分为9组.3.选定组距与组数后为进一步分析数据还需要确定分点,将数据分组.进行数据分组后可以详细地记录每组数据在所抽取的样本中占的频数及频率.组数少了,频数及频率就有可能相应的变大,因此,样本的频率分布表可随组数的变化而改变.第N 组的频率=样本容量组频数第N 上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表(frequency distribution table ).一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.其中,整个取值区间的长度称为全距;分成的区间的长度称为组距.频率分布表的优点是:能直接反映数据在各范围内的频率和频数;其缺点是:不能直观地反映数据的频率分布.应用示例例1 从规定尺寸为25.40 mm 的一堆产品中任意抽取100件,测得它们的实际尺寸如下:制作频率分布表.分析: 根据编制频率分布表的步骤完成.解:如果把这对产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,他们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间的长度为0.03,计出每个区间内的频数,并计算相应的频率,将结果填入下表:分组 频数累计 频数 频率[25.235,25.265) 1 1 0.01[25.265,25.295) 3 2 0.01[25.295,25.325) 8 5 0.05[25.325,25.355) 20 12 0.12[25.355,25.385) 38 18 0.18[25.385,25.415) 63 25 0.25[25.415,25.445) 79 16 0.16[25.445,25.475) 92 13 0.13[25.475,25.505) 96 4 0.04[25.505,25.535) 98 2 0.02[25.535,25.565]100 2 0.02合计100 1.00 点评:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值.由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一组数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第一组的下限略去或把第一组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.例2 在编制频率分布表时,①组距不变时,不同的起始点不影响分组数;②组距不变,分组数不变时,不同起始点对应的频率分布表中的各组频率一定是不同的;③分组数越多,频率分布表就越准确地反映总体的情况.以上结论中正确的共有()A.0个B.1个C.2个D.3个分析:①错,不同的起始点可能会引起组数的增加;②错,有可能相同;③错,只能是更准确地反映样本的情况,而不是总体.答案:A点评:使学生更好地理解频率分布表的制作.例3 有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)估计数据小于30.5的可能性是百分之几?分析:此题已给出了组距和组数,可以直接列出频率分布表.解:(1) 样本的频率分布表如下:分组频数频率[12.5,15.5) 6 0.06[15.5,18.5)16 0.16[18.5,21.5)18 0.18[21.5,24.5)22 0.22[24.5,27.5)20 0.20[27.5,30.5) 10 0.10[30.5,33.5] 8 0.08合计 100 1.00(2)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的可能性是92%.点评:解决总体分布估计问题的一般精简程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=组数频数). 例4 根据中国银行的外汇牌价,2005年1季度的60个工作日中,欧元的现汇买入价(100欧元的外汇可兑换的人民币)的分组与各组频数如下:[1 050,1 060),1;[1 060,1 070),7;[1 070,1 080),20;[1 080,1 090),11;[1 090,1 100),13;[1 100,1 110),6;[1 110,1 120],2.(1)列出欧元的现汇买入价的频率分布表;(2)估计欧元的现汇买入价在区间1 065~1 105内的频率;(3)如果欧元的现汇买入价不超过x 的频率的估计为0.95,求此x.分析:第1问学生已无障碍,下面两问要结合对频率分布表中分布意义的理解.解:(1)欧元的现汇买入价的频率分布表为分组 频数 频率[1 050,1 060) 1 0.017[1 060,1 070) 7 0.117[1 070,1 080) 20 0.333[1 080,1 090) 11 0.1830.2170.1000.0331.00~1 105内的频率的估计值为1100111011001105--=0.84. ,,所以x 在区间[1 100,1 110),所以x≈1 108.3.即欧元的现汇买入价不超过1 108.3的频率的估计为0.95.点评:通过对生活实例的分析,使学生更好地体会分布的意义和作用.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.知能训练对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30(1)列出频率分布表;(2)估计电子元件寿命在100 h~400 h以内的概率;(3)估计电子元件寿命在400 h以上的概率.解:(1)频率分布表:寿命频数频率100~200 20 0.1200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布表可以算出,寿命在100 h~400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100 h~400 h的概率为0.65.(3)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35 .点评:结合例题配套练习,让学生熟练掌握解题过程.课堂小结总体分布情况可以通过样本来估计,频率分布是总体分布的一种近似.频率分布表编制步骤:①求极差;②决定组距与组数;③将数据分组;④列频率分布表.频率分布表具有如下特性:①分组的变化可以引起频率分布表的结构的变化.②随机性:频率分布表是由样本决定的,因此它们会随样本的改变而改变,而样本是随机抽取的.③规律性:由于频率趋近于概率的原则,若固定分组,随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上.作业1.课本习题2.2 1.2.现实生活中,很多问题的解决需要总体分布的信息,而总体分布需要用样本来估计.如身高、体重、考试成绩、农作物产量、某种特定新产品的各种质量指标、股票价格等.请自己查阅资料做进一步的调查了解,作出分析判断,提出建议.要注意抽样的合理性与可操作性.设计感想研究分布规律的方法应在解决实际问题的过程中探索出来,所以制作频率分布表的过程或步骤应该是在结合实例的基础上,一边实践一边总结,因此一开始例题的解决过程应是探索过程.。
2.2.1 频率分布表整体设计教材分析“频率分布表”这一节主要通过探究“北京地区的气温分布状况问题”逐步引入频率分布表.用例题说明分布表的编制过程.在实际应用中,很多问题的解答需要总体分布的信息,而总体分布则需要用样本来估计,在“北京地区的气温分布状况问题”中,要解决的是怎样通过已知数据分析比较两时间段的高温状况.频率分布是总体分布的一种近似,频率分布表具有如下特性:(1)教科书中只给出了样本容量不超过100时,分组数k在5~12组之间的情形.(2)频率分布表中的数字与分组数(组距)有关.(3)通过样本的改变让学生体会频率分布表的随机性.(4)由于随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上,要让学生体会频率分布表的这种随样本容量增加的规律性.(5)由于频率分布表编制的工作量一般很大,课本介绍了利用Excel制作频率分布表的方法和步骤.三维目标1.通过实例体会分布的意义和作用;学会列频率分布表;体会频率分布表的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的概率分布估计总体分布.3.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.4.在教学过程中,通过学生的相互交流,来加深对频率分布表概念的理解,增强学生数学交流能力,培养学生倾听、接受别人意见的优良品质.5.通过引导学生欣赏蕴含在我们生活中与频率分布表有关的实际问题,使学生感受数学、走进数学.重点难点教学重点:用样本频率分布估计总体分布.教学难点:1.对总体分布概念的理解;2.频率分布表的编制.课时安排1课时教学过程导入新课设计思路一:(实例导入)教师出示投影胶片1:为了了解7月25日至8月24日北京地区的气温分布状况,我们对以往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.88月 828.6 31.5 28.8 33.2 32.5 30.3 30.2 29.8 33.132.8 29.4 25.6 24.7 30.0 30.1 29.5 30.3日至8月24日怎样通过上表中的数据,分析比较两时间段的高温(≥33 ℃)状况呢?上面两样本中的高温天数的频率用下表表示:时间总天数高温天数(频数)频率7月25日至8月10日17 11 0.6478月 8日至8月24日17 2 0.118 由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月 8日至8月24日.上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.引入课题,板书课题——用样本频率分布估计总体分布.设计思路二:(情境导入)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某城市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准为a,用水量不超过a的部分按平价收费,超出部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出标准,需要做哪些工作?分析:如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须了解全市居民的日常用水量的分布情况.比如月均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市的居民较多,不可能也没有必要一一调查,那如何处理呢?可以采用随机抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民某年的月均用水量(单位:吨).推进新课新知探究(给出投影胶片2:100位居民的月均用水量)100位居民的月均用水量(单位:吨).分析:上面这些数字能告诉我们什么呢?可以看出居民月均用水量的最小值为0.2,最大值为4.3,其他在0.2到4.3之间. 除此以外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.分析研究:分析数据的一种基本方法是用紧凑的表格改变数据的排列方式.或者用图形将它们画出来.表格可以改变数据的构成形式,为我们提供了解释数据的新方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.这就是我们初中学过的频数分布图和频数分布表,在此基础上我们从各个小组数据在样本容量中所占比例大小的角度进一步研究频率分布表.1.首先求极差,如何求?是多少?求极差即一组数据中的最大值与最小值的差.4.3-0.2=4.1,说明样本数据的变化范围是4.1.2.如何选定适当的组距与组数?组数是越多越好吗?通常是就样本的量而定,抽取样本的量也要视实际问题的需要来确定,并非越多越好.本例样本量是100,组数为8~12组比较适当,组距力求取整.在此问题中,如果取组距为0.5,那么有:组数=2.85.01.4==组距极差 因此可以将数据分为9组.3.选定组距与组数后为进一步分析数据还需要确定分点,将数据分组.进行数据分组后可以详细地记录每组数据在所抽取的样本中占的频数及频率.组数少了,频数及频率就有可能相应的变大,因此,样本的频率分布表可随组数的变化而改变.第N 组的频率=样本容量组频数第N 上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表(frequency distribution table ).一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.其中,整个取值区间的长度称为全距;分成的区间的长度称为组距.频率分布表的优点是:能直接反映数据在各范围内的频率和频数;其缺点是:不能直观地反映数据的频率分布.应用示例例1 从规定尺寸为25.40 mm 的一堆产品中任意抽取100件,测得它们的实际尺寸如下:制作频率分布表.分析: 根据编制频率分布表的步骤完成.解:如果把这对产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,他们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间的长度为0.03,计出每个区间内的频数,并计算相应的频率,将结果填入下表:分组 频数累计 频数 频率[25.235,25.265) 1 1 0.01[25.265,25.295) 3 2 0.01[25.295,25.325) 8 5 0.05[25.325,25.355) 20 12 0.12[25.355,25.385) 38 18 0.18[25.385,25.415) 63 25 0.25[25.415,25.445) 79 16 0.16[25.445,25.475) 92 13 0.13[25.475,25.505) 96 4 0.04[25.505,25.535) 98 2 0.02[25.535,25.565]100 2 0.02合计100 1.00 点评:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值.由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一组数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第一组的下限略去或把第一组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.例2 在编制频率分布表时,①组距不变时,不同的起始点不影响分组数;②组距不变,分组数不变时,不同起始点对应的频率分布表中的各组频率一定是不同的;③分组数越多,频率分布表就越准确地反映总体的情况.以上结论中正确的共有()A.0个B.1个C.2个D.3个分析:①错,不同的起始点可能会引起组数的增加;②错,有可能相同;③错,只能是更准确地反映样本的情况,而不是总体.答案:A点评:使学生更好地理解频率分布表的制作.例3 有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)估计数据小于30.5的可能性是百分之几?分析:此题已给出了组距和组数,可以直接列出频率分布表.解:(1) 样本的频率分布表如下:分组频数频率[12.5,15.5) 6 0.06[15.5,18.5)16 0.16[18.5,21.5)18 0.18[21.5,24.5)22 0.22[24.5,27.5)20 0.20[27.5,30.5) 10 0.10[30.5,33.5] 8 0.08合计 100 1.00(2)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的可能性是92%.点评:解决总体分布估计问题的一般精简程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=组数频数). 例4 根据中国银行的外汇牌价,2005年1季度的60个工作日中,欧元的现汇买入价(100欧元的外汇可兑换的人民币)的分组与各组频数如下:[1 050,1 060),1;[1 060,1 070),7;[1 070,1 080),20;[1 080,1 090),11;[1 090,1 100),13;[1 100,1 110),6;[1 110,1 120],2.(1)列出欧元的现汇买入价的频率分布表;(2)估计欧元的现汇买入价在区间1 065~1 105内的频率;(3)如果欧元的现汇买入价不超过x 的频率的估计为0.95,求此x.分析:第1问学生已无障碍,下面两问要结合对频率分布表中分布意义的理解.解:(1)欧元的现汇买入价的频率分布表为分组 频数 频率[1 050,1 060) 1 0.017[1 060,1 070) 7 0.117[1 070,1 080) 20 0.333[1 080,1 090) 11 0.183[1 090,1 100) 13 0.217[1 100,1 110) 6 0.100[1 110,1 120] 2 0.033合计 60 1.00(2)欧元的现汇买入价在区间1 065~1 105内的频率的估计值为 0.117×1060107010651070--+0.333+0.183+0.217+0.100×1100111011001105--=0.84. (3)因为0.017+0.117+0.333+0.183+0.217=0.867<0.95,0.017+0.117+0.333+0.183+0.217+0.100=0.967>0.95,所以x 在区间[1 100,1 110)内,且满足0.867+0.100×110011101100--x =0.95,所以x≈1 108.3.即欧元的现汇买入价不超过1 108.3的频率的估计为0.95.点评:通过对生活实例的分析,使学生更好地体会分布的意义和作用.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.知能训练对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30(1)列出频率分布表;(2)估计电子元件寿命在100 h~400 h以内的概率;(3)估计电子元件寿命在400 h以上的概率.解:(1)频率分布表:寿命频数频率100~200 20 0.1200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布表可以算出,寿命在100 h~400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100 h~400 h的概率为0.65.(3)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35 .点评:结合例题配套练习,让学生熟练掌握解题过程.课堂小结总体分布情况可以通过样本来估计,频率分布是总体分布的一种近似.频率分布表编制步骤:①求极差;②决定组距与组数;③将数据分组;④列频率分布表.频率分布表具有如下特性:①分组的变化可以引起频率分布表的结构的变化.②随机性:频率分布表是由样本决定的,因此它们会随样本的改变而改变,而样本是随机抽取的.③规律性:由于频率趋近于概率的原则,若固定分组,随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上.作业1.课本习题2.2 1.2.现实生活中,很多问题的解决需要总体分布的信息,而总体分布需要用样本来估计.如身高、体重、考试成绩、农作物产量、某种特定新产品的各种质量指标、股票价格等.请自己查阅资料做进一步的调查了解,作出分析判断,提出建议.要注意抽样的合理性与可操作性.设计感想研究分布规律的方法应在解决实际问题的过程中探索出来,所以制作频率分布表的过程或步骤应该是在结合实例的基础上,一边实践一边总结,因此一开始例题的解决过程应是探索过程.。
江苏省响水中学高中数学第2章《统计》频率分布表导学案苏教版必修3学习目标1.通过具体问题,复习用频率颁表表示总体分布这一内容,掌握列频率分布表的方法。
2.初步感受用样本频率分布估计总体频率分布规律的思想。
一、基础知识导学1.频数:___ ___________________ _频率:_____________________________________2.频率分布表的定义:3.全距: _____________________________组距:________________________________4.编制频率分布表的步骤:(1)(2)(3)二、基础学习交流从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.三、重点难点探究探究一张老师为了分析一次数学考试情况,全班抽了50人,将分数分为5组.第一组到第三组的频数分别是10,23,11,第四组的频率是0.08,那么落在第五组89.5——99.5的频数是多少?频率是多少?全校300人中分数在89.5——99.5中的约有多少人?探究二某文工团有演职人员共有100 人,其中乐队15人,歌队20人,曲艺队30人,舞队25人职员10人.(1)列出各队的频率分布表;(2)求曲艺队的频率.探究三一个容量为20的样本数据,分组后组距与频数如下:组距(20,30] (30,40] (40,50] ( 50,60] ( 60,70] (70,80] 频数 2 3 4 5 4 2-∞上的频率求样本在区间(,50]四、基础智能检测1.一个容量为20的数据样本,分组与频数为[10,20]2个、(20,30]3个、(30,40]4个、-∞上的可能性为(40,50] 5个、(50,60]4个、(60,70]2个,则样本数据在区间(,50]()A. 5%B. 25%C. 50%D. 70%2.下面是不同厂家生产的手提式电脑的重量,试列出其频率分布表:1.92.0 2.1 2.4 2.4 2.83.2 2.3 1.5 2.62.6 1.9 2.4 2.2 1.6 1.7 1.7 1.8 1.83.03.在进行分组分析时,每一组的频率是指( )A.这组的频数与组距的比值B.这组的频数与样本容量的比值C.组距与数据总和的比值D.平均数与这组的频数的比值。
第4课时频率分布表【学习目标】1. 了解频数、频率的概念,了解全距、组距的槪念;2. 能正确地编制频率分布表;会用样本频率分布去估计总体分布:3. 通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.【回題it境L如下样本是随机抽取近年来北京地区7月25 H至8月24日的日最髙气温,得到如下两个样本(单位:°C):>330呢?【合作探究]填写下列表格:L1 频率分布表2. 编制频率分布表的步骤:(1)(2)(3)【展示点拨】例1.从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身髙样本,数据如下(单位:cm).试作出该样本的频率分布表.例2・下表给出了某校500名12岁男孩中用随机抽样得出的120人的身髙(单位:伽):(1)列岀样本频率分布表: (2)估计身髙小于134<7;/的人数占总人数的百分比. 【学以致用】1. 在用样本频率估计总体分布的过程中,下列说法中,正确的是()A.总体容量越大,估计越精确:B.总体容量越小,估计越精确:C.样本容戢越大,估计越精确:D.样本容量越小,估计越精确.2. 一个容量为20的数据样本,分组与频数为:[10, 20], 2个;(20, 30] , 3个:(30,40] , 4 个;(40, 50], 5 个:(50, 60], 4 个;(60, 70], 2 个.则样本数据在区间(-8, 50]上的可能性为()A. 5% B・ 25% C・ 50% D・70%3. 一个容量为32的样本,已知某组样本的频率为0.125,那么该组样本的频数为4・一个容量为畀的样本,分成若干组,已知某数的频数和频率分别为50和0.25,则5. 在一本书中,分组统讣100句中的字数,得岀下列结果:字数广5个15句,字数6~10个的27句,字数11~15个的32句,字数16~20个数的15句,字数21~25个的8句,字数26~30个的3句.请作出字数的频率分布表,并利用组中值对该书中平均每个句子的字数作出估计.第4课时频率分布表【基础训练】1. 一个容量为n的样本分成若干组,已知某组的频数和频率分别是30和0.25,则n二______ ・2. 用样本频率分布估计总体频率分布的过程中,有下列说法①总体容量越大,估il•越精确:②总体容量越小,估计越精确:③样本容量越大,估计越精确;④样本容量越小•估计越精确•英中的正确说法是_________________ ・34・在某次考试的学生成绩中随机抽取若干名学生的成绩,分组与分组的频数如下:5. 将一批数据分成四组.列出频率分布表,其中第一组的频率是0. 27,第二组与第四组的频率之和为0.54,那么第三组的频率是 _________ .6. 为了分析某班的学生一次考试数学成绩,从中抽取了一个样本,已知不超过70分的人数8人,其累计频率为0・4,则这个样本的样本容量是_________ ・7.8, 50)8.9. 将一个容呈为100的样本数据,按照从小到大的顺序分为8个组.如下表:若第6326【思考应用】10. 从某班级随机抽取了20划学生,测得他们的视力数据如下:4.7, 4.2,5.0, 4. L 4.0, 4.9, 5.1, 4.5, 4.8, 5.2, 5.0, 4. 0, 4.5, 4.8, 4. 6, 4. 9, 5. 3, 4. 0.(1)请把数据分为5组,列出频率分布表:(2)估计该班学生的近视率(视力低于4.9).【拓展提升】12.从某年级210需学生中随机抽取一个30名学生的样本,样本中每个学生用于课外作 业的时间(单位:min )依次为:75, 80, 85, 65, 95, 100, 70, 55, 65, 75, 85, 110, 120, 80, 85, 80, 75, 90, 90,95, 70, 60, 60, 75, 90, 95, 65, 75, 80, 80.估计该年级的学生中作业时间超过一个半小时(含一个半小时)的学生有多少 人?11・一个容量为100的样本,数据的分组和各组的一些相关信息如下,完成表中的空格.第4课时频率分布表答案I. 120 2.③ 3. 0. 14, 0.37 4. 90% 5. 0. 19 6. 20 7. 0.7 8・ 14,0.149. 由第6组频率是第3组频率的2倍可知两组频数之比也是2,易知这两组频数总和为100 - (10+16+18+15+11+ 9)二21,所以第6组频数为21x2=14,即该组频率为0・14.310. 频率分布表略,该班学生近视率约为55%II. [15, 18)组的频率为0.3-0. 06-0. 12=0. 12,同理可得[24, 27)组的频率应为0. 69-0. 3-0. 21=0.18,[27, 30)组的累计频率应为1-0.1-0. 05=0.85因此[30, 33)组的频率为0. 85-0. 69=0. 16.根据频率计算公式可得表12.先统计30名同学的样本中学生中作业时间超过一个半小时(含一个半小时)的学生9有9人,因此,估计210名学生中大约有210X—=63人.30。
总课题总体分布的估计分课题频率分布表分课时第 1 课时教学目标了解频数、频率的概念,了解全距、组距的概念;通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.能正确地编制频率分布表;会用样本频率分布去估计总体分布.重点难点正确地编制频率分布表.引入新课1.情境:如下样本是随机抽取近年来北京地区7月25日至8月24日的日最高气温:7月25日至8月10日41.9 37.5 35.7 35.4 37.2 38.1 34.7 33.7 33.3 32.5 34.6 33.0 30.8 31.0 28.6 31.5 28.88月8日至8月24日28.6 31. 5 28.8 33.2 32.5 30.3 30.2 29.8 33.1 32.8 29.8 25.6 24.7 30.0 30.1 29.5 30.3问题:怎样通过上表中的数据,分析比较两时间段内的高温(33C)状况?2.____________________________________________________________称为频率分布表.例题剖析例 1 从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表.并估计身高不小于170的同学的所占的百分率.例 2 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm):(1)列出样本频率分布表;(2)估计身高小于cm134的人数占总人数的百分比.巩固练习1.有一个容量为45的样本数据,分组后各组的频数如下:(](](](](](]12.5,15.5,3;15.5,18.5,8;18.5,21.5,9;21.5,24.5,11;24.5,27.5,10;27.5,30.5,4..的数据约为总体的( )由此估计,不大于275A.91%B.92%C.95%D.30%2.已知样本10,8,6,10,8,13,11,10,12,7,8,9,11,9,11,12,9,10,11,12,那么频率为2.0的范围是______________________.3.列出情境中近年来北京地区7月25日至8月10日的气温的样本频率分布表.课堂小结总体分布的频率、频数的概念;编制频率分布表的一般步骤.。
江苏省响水中学高中数学第2章《统计》简单随机抽样导学案苏教版必修3学习目标:1.通过实例使学生能从实际问题中提出统计问题.2.通过案例分析,使学生理解随机抽样的必要性,理解样本的代表性与统计推断结论的可靠性之间的关系.3.了解随机抽样得到的样本的随机性,并会利用简单随机抽样抽取样本,掌握抽签法、随机数法抽取样本的步骤.一、基础知识导学:问题1:统计的基本概念一般把所考察对象的某一数值指标的全体构成的集合看作,构成总体的每一个元素作为,从总体中抽出的若干个个体所组成的集合叫作,样本中个体的个数叫作.问题2:简单随机抽样一般地,设一个总体含有N个,从中逐个地抽取n个个体作为(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都,就把这种抽样方法叫作简单随机抽样.实现简单随机抽样,常用和.问题3:抽签法一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个,连续抽取,就得到一个容量为n 的.抽签法的步骤:制签:先将总体中的所有个体编号(号码可以从1到N),并把号码写在形状、大小相同的号签上,号签可以用小球、卡片、纸条等制作,然后将这些号签放在同一个箱子里,进行;抽签:抽签时,每次从中抽出1个号签,连续抽取n次;成样:对应号签就得到一个容量为n的样本;抽签法简便易行,当总体的时,适宜采用这种方法.抽签法的优缺点:抽签法的优点是,缺点是当总体的容量时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平.问题4:随机数法利用随机数表、随机数骰子或计算机产生的进行抽样,叫随机数法,这里仅介绍随机数表法.随机数表法步骤:编号:对总体进行编号,保证每个个体号码的位数;取数:随机地选定开始读数的数后,读数的方向可以向右,也可以向左、向上、向下,等等.在读数过程中,得到一串数字号码,在去掉其中不合要求和与的号码后,其中依次出现的号码可以看成是依次从总体中抽取的各个个体的号码;成样:对应号签就得到一个容量为n的样本.随机数法的优缺点随机数法的优点与抽签法相同,缺点是当总体容量时,仍然不是很方便,但是比抽签法公平,这两种方法都只适用于总体容量的抽样类型.二、基础学习交流1.某校期末考试后,为了分析该校高一年级1000名学生的学习成绩,从中随机抽取了100名学生的成绩单,就这个问题来说,下面说法中正确的是().A.1000名学生是总体B.每名学生是个体C.每名学生的成绩是所抽取的一个样本D.样本的容量是1002.关于简单随机抽样的特点,有以下几种说法,其中不正确的是().A.要求总体中的个体数有限B.从总体中逐个抽取C.这是一种不放回抽样D.每个个体被抽到的机会不一样,与先后顺序有关3.高一(1)班有50名同学,现要从中抽取6名同学参加一个讨论会,每名同学的机会均等.我们可以把50名同学的学号写在小球上,放在一个不透明的袋子中,充分搅拌后,再从中逐个抽取6个小球,从而抽取6名参加讨论会的同学.这种抽样方法是简单随机抽样吗?(答是或不是).4.从30个足球中抽取10个进行质量检测,说明利用随机数法抽取这个样本的步骤及公平性.三、重点难点探究:探究三抽签法与随机数法的应用高一(1)班有学生60人,为了了解学生对目前高考制度的看法,现要从中抽取一个容量为10的样本,问此样本若采用简单随机抽样,将如何获得?试设计抽样方案.四、基础智能检测1.春节前夕,为了保证食品安全,质检部门检查一箱装有2500件包装食品的质量,抽查总量的2%,在这个问题中,下列说法正确的是().A.总体是指这箱2500件包装食品B.个体是一件包装食品C.样本是按2%抽取的50件包装食品D.样本容量是50教师个人研修总结在新课改的形式下,如何激发教师的教研热情,提升教师的教研能力和学校整体的教研实效,是摆在每一个学校面前的一项重要的“校本工程”。
江苏省响水中学高中数学第2章《统计》频率分布表导学案苏教版
必修3
学习目标
1.通过具体问题,复习用频率颁表表示总体分布这一内容,掌握列频率分布表的方法。
2.初步感受用样本频率分布估计总体频率分布规律的思想。
一、基础知识导学
1.频数:___ ___________________ _频率:_____________________________________
2.频率分布表的定义:
3.全距:_____________________________组距:________________________________
4.编制频率分布表的步骤:
(1)
(2)
(3)
二、基础学习交流
从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,数据如下(单位:cm).试作出该样本的频率分布表.
三、重点难点探究
探究一
张老师为了分析一次数学考试情况,全班抽了50人,将分数分为5组.第一组到第三组的频数分别是10,23,11,第四组的频率是0.08,那么落在第五组89.5——99.5的频数是多少?频率是多少?全校300人中分数在89.5——99.5中的约有多少人?
探究二
某文工团有演职人员共有100 人,其中乐队15人,歌队20人,曲艺队30人,舞队25人职员10人.
(1)列出各队的频率分布表;
(2)求曲艺队的频率.
探究三
一个容量为20的样本数据,分组后组距与频数如下:
组距(20,30] (30,40] (40,50] ( 50,60] ( 60,70] (70,80] 频数 2 3 4 5 4 2 -∞上的频率
求样本在区间(,50]
四、基础智能检测
1.一个容量为20的数据样本,分组与频数为[10,20]2个、(20,30]3个、(30,40]4个、
-∞上的可能性为(40,50] 5个、(50,60]4个、(60,70]2个,则样本数据在区间(,50]
()
A. 5%
B. 25%
C. 50%
D. 70%
2.下面是不同厂家生产的手提式电脑的重量,试列出其频率分布表:
1.9
2.0 2.1 2.4 2.4 2.8
3.2 2.3 1.5 2.6
2.6 1.9 2.4 2.2 1.6 1.7 1.7 1.8 1.8
3.0
3.在进行分组分析时,每一组的频率是指
( )
A.这组的频数与组距的比值
B.这组的频数与样本容量的比值
C.组距与数据总和的比值
D.平均数与这组的频数的比值
教师个人研修总结
在新课改的形式下,如何激发教师的教研热情,提升教师的教研能力和学校整体的教研实效,是摆在每一个学校面前的一项重要的“校本工程”。
所以在学习上级的精神下,本期个人的研修经历如下:
1.自主学习:我积极参加网课和网上直播课程.认真完成网课要求的各项工作.教师根据自己的专业发展阶段和自身面临的专业发展问题,自主选择和确定学习书目和学习内容,认真阅读,记好读书笔记;学校每学期要向教师推荐学习书目或文章,组织教师在自学的基础上开展交流研讨,分享提高。
2.观摩研讨:以年级组、教研组为单位,围绕一定的主题,定期组织教学观摩,开展以课例为载体的“说、做、评”系列校本研修活动。
3.师徒结对:充分挖掘本校优秀教师的示范和带动作用,发挥学校名师工作室的作用,加快新教师、年轻教师向合格教师和骨干教师转化的步伐。
4.实践反思:倡导反思性教学和教育叙事研究,引导教师定期撰写教学反思、教育叙事研究
报告,并通过组织论坛、优秀案例评选等活动,分享教育智慧,提升教育境界。
5.课题研究:立足自身发展实际,学校和骨干教师积极申报和参与各级教育科研课题的研究工作,认真落实研究过程,定期总结和交流阶段性研究成果,及时把研究成果转化为教师的教育教学实践,促进教育质量的提高和教师自身的成长。
6.专题讲座:结合教育教学改革的热点问题,针对学校发展中存在的共性问题和方向性问题,进行专题理论讲座。
7.校干引领:从学校领导开始,带头出示公开课、研讨课,参与本校的教学观摩活动,进行教学指导和引领。
8.网络研修:充分发挥现代信息技术,特别是网络技术的独特优势,借助教师教育博客等平台,促进自我反思、同伴互助和专家引领活动的深入、广泛开展。
我们认识到:一个学校的发展,将取决于教师观念的更新,人才的发挥和校本培训功能的提升。
多年来,我们学校始终坚持以全体师生的共同发展为本,走“科研兴校”的道路,坚持把校本培训作为推动学校建设和发展的重要力量,进而使整个学校的教育教学全面、持续、健康发展。
反思本学期的工作,还存在不少问题。
很多工作在程序上、形式上都做到了,但是如何把工作做细、做好,使之的目的性更加明确,是继续努力的方向。
另外,我校的研修工作压力较大,各学科缺少领头羊、研修氛围有待加强、师资缺乏等各类问题摆在我们面前。
缺乏专业人员的引领,各方面的工作开展得还不够规范。
相信随着课程改革的深入开展,在市教育教学研究院的领导和专家的亲临指导下,我校校本研修工作一定能得以规范而全面地展开。
“校本研修”这种可持续的、开放式的继续教育模式,一定能使我校的教育教学工作又上一个台阶。