频率分布表[下学期]--江苏教育出版社
- 格式:ppt
- 大小:364.00 KB
- 文档页数:10
2.2总体分布的估计2.2.1频率分布表整体设计教材分析“频率分布表”这一节主要通过探究“北京地区的气温分布状况问题”逐步引入频率分布表.用例题说明分布表的编制过程.在实际应用中,很多问题的解答需要总体分布的信息,而总体分布则需要用样本来估计,在“北京地区的气温分布状况问题”中,要解决的是怎样通过已知数据分析比较两时间段的高温状况.频率分布是总体分布的一种近似,频率分布表具有如下特性:(1)教科书中只给出了样本容量不超过100时,分组数k在5~12组之间的情形.(2)频率分布表中的数字与分组数(组距)有关.(3)通过样本的改变让学生体会频率分布表的随机性.(4)由于随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上,要让学生体会频率分布表的这种随样本容量增加的规律性.(5)由于频率分布表编制的工作量一般很大,课本介绍了利用Excel制作频率分布表的方法和步骤.三维目标1.通过实例体会分布的意义和作用;学会列频率分布表;体会频率分布表的特点.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的概率分布估计总体分布.3.能根据实际问题的需求合理地选取样本,并作出合理的解释,会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.4.在教学过程中,通过学生的相互交流,来加深对频率分布表概念的理解,增强学生数学交流能力,培养学生倾听、接受别人意见的优良品质.5.通过引导学生欣赏蕴含在我们生活中与频率分布表有关的实际问题,使学生感受数学、走进数学.重点难点教学重点:用样本频率分布估计总体分布.教学难点:1.对总体分布概念的理解;2.频率分布表的编制.课时安排1课时教学过程导入新课设计思路一:(实例导入)教师出示投影胶片1:为了了解7月25日至8月24日北京地区的气温分布状况,我们对以往年份这段时间的日最高气温进行抽样,并对得到的数据进行分析.我们随机抽取近年来北京地区7月25日至8月24日的日最高气温,得到如下样本(单位:℃):7月25日至8月10日41.937.535.735.437.238.134.733.733.3 32.534.633.030.831.028.631.528.88月828.631.528.833.232.530.330.229.833.132.829.425.624.730.030.129.530.3日至8月24日怎样通过上表中的数据,分析比较两时间段的高温(≥33 ℃)状况呢?上面两样本中的高温天数的频率用下表表示:时间总天数高温天数(频数)频率7月25日至8月10日17110.6478月8日至8月24日1720.118由此表可以发现,近年来,北京地区7月25日至8月10日的高温天气的频率明显高于8月8日至8月24日.上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.引入课题,板书课题——用样本频率分布估计总体分布.设计思路二:(情境导入)我国是世界上严重缺水的国家之一,城市缺水问题较为突出.某城市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准为a,用水量不超过a的部分按平价收费,超出部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出标准,需要做哪些工作?分析:如果标准太高,会影响居民的日常生活;如果标准太低,则不利于节水.为了确定一个较为合理的标准a,必须了解全市居民的日常用水量的分布情况.比如月均用水量在哪个范围内的居民最多,他们占全市居民的百分比情况等.由于城市的居民较多,不可能也没有必要一一调查,那如何处理呢?可以采用随机抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.假设通过抽样我们获得了100位居民某年的月均用水量(单位:吨).推进新课新知探究(给出投影胶片2:100位居民的月均用水量)100位居民的月均用水量(单位:吨).分析:上面这些数字能告诉我们什么呢?可以看出居民月均用水量的最小值为0.2,最大值为4.3,其他在0.2到4.3之间.除此以外,很难发现这100位居民的用水量的其他信息了.实际上,我们很难从随意记录下来的数据中直接看出规律.为此,我们需要对统计数据进行整理和分析.分析研究:分析数据的一种基本方法是用紧凑的表格改变数据的排列方式.或者用图形将它们画出来.表格可以改变数据的构成形式,为我们提供了解释数据的新方式.作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.这就是我们初中学过的频数分布图和频数分布表,在此基础上我们从各个小组数据在样本容量中所占比例大小的角度进一步研究频率分布表.1.首先求极差,如何求?是多少?求极差即一组数据中的最大值与最小值的差.4.3-0.2=4.1,说明样本数据的变化范围是4.1.2.如何选定适当的组距与组数?组数是越多越好吗?通常是就样本的量而定,抽取样本的量也要视实际问题的需要来确定,并非越多越好.本例样本量是100,组数为8~12组比较适当,组距力求取整.在此问题中,如果取组距为0.5,那么有:组数=2.85.01.4==组距极差 因此可以将数据分为9组.3.选定组距与组数后为进一步分析数据还需要确定分点,将数据分组.进行数据分组后可以详细地记录每组数据在所抽取的样本中占的频数及频率.组数少了,频数及频率就有可能相应的变大,因此,样本的频率分布表可随组数的变化而改变.第N 组的频率=样本容量组频数第N 上例说明,当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表(frequency distribution table ).一般地,编制频率分布表的步骤如下:(1)求全距,决定组数和组距,组距=组数全距; (2)分组,通常对组内数值所在区间取左闭右开区间,最后一组取闭区间;(3)登记频数,计算频率,列出频率分布表.其中,整个取值区间的长度称为全距;分成的区间的长度称为组距.频率分布表的优点是:能直接反映数据在各范围内的频率和频数;其缺点是:不能直观地反映数据的频率分布.应用示例例1 从规定尺寸为25.40 mm 的一堆产品中任意抽取100件,测得它们的实际尺寸如下:制作频率分布表.分析: 根据编制频率分布表的步骤完成.解:如果把这对产品的尺寸的全体看作一个总体,则上面数据就是从总体抽取的一个容量为100的样本.在这组数据中,最小值为25.24,最大值为25.56,他们相差0.32,可取区间[25.235,25.565].我们可将此区间分成11个区间,每个区间的长度为0.03,计出每个区间内的频数,并计算相应的频率,将结果填入下表:分组 频数累计 频数 频率[25.235,25.265) 1 1 0.01[25.265,25.295) 3 2 0.01[25.295,25.325) 8 5 0.05[25.325,25.355) 20 12 0.12[25.355,25.385) 38 18 0.18[25.385,25.415)63250.25[25.415,25.445)79160.16[25.445,25.475)92130.13[25.475,25.505)9640.04[25.505,25.535)9820.02[25.535,25.565]10020.02合计100 1.00点评:这张表给出了产品尺寸处于各个区间内的个数和频率,由此可估计这一堆产品的尺寸分布情况,这就是该样本的频率分布表.在表中频数是指落在各小组内的数据的个数.频率是各组的频数与数据总数的比值.由上面的制表过程可得编制频率分布表的步骤如下:(1)计算数据中最大值与最小值的差,算出了这个差就可以知道这组数据的变动范围有多大.(2)决定组数与组距.将这一组数据分组,目的是要描述数据的分布规律,要根据数据的多少来确定分组的数目.一般来说,数据越多,分的组也越多.(3)决定分点.要使分点比数据多一位小数,并且把第一组的下限略去或把第一组的起点稍减小一点.(4)列频率分布表.登记频数,计算频率,列出频率分布表.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.在编制频率分布表时,若题目已给出了组距和组数,可以直接列出频率分布表.例2 在编制频率分布表时,①组距不变时,不同的起始点不影响分组数;②组距不变,分组数不变时,不同起始点对应的频率分布表中的各组频率一定是不同的;③分组数越多,频率分布表就越准确地反映总体的情况.以上结论中正确的共有()A.0个B.1个C.2个D.3个分析:①错,不同的起始点可能会引起组数的增加;②错,有可能相同;③错,只能是更准确地反映样本的情况,而不是总体.答案:A点评:使学生更好地理解频率分布表的制作.例3 有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5],8.(1)列出样本的频率分布表;(2)估计数据小于30.5的可能性是百分之几?分析:此题已给出了组距和组数,可以直接列出频率分布表.解:(1) 样本的频率分布表如下:分组频数频率[12.5,15.5)60.06[15.5,18.5)160.16[18.5,21.5)180.18[21.5,24.5)220.22[24.5,27.5)200.20[27.5,30.5) 10 0.10[30.5,33.5] 8 0.08合计 1001.00 (2)数据大于等于30.5的频率是0.08,所以小于30.5的频率是0.92,所以数据小于30.5的可能性是92%.点评:解决总体分布估计问题的一般精简程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=组数频数). 例4 根据中国银行的外汇牌价,2005年1季度的60个工作日中,欧元的现汇买入价(100欧元的外汇可兑换的人民币)的分组与各组频数如下:[1 050,1 060),1;[1 060,1 070),7;[1 070,1 080),20;[1 080,1 090),11;[1 090,1 100),13;[1 100,1 110),6;[1 110,1 120],2.(1)列出欧元的现汇买入价的频率分布表;(2)估计欧元的现汇买入价在区间1 065~1 105内的频率;(3)如果欧元的现汇买入价不超过x 的频率的估计为0.95,求此x.分析:第1问学生已无障碍,下面两问要结合对频率分布表中分布意义的理解.解:(1)欧元的现汇买入价的频率分布表为分组 频数 频率[1 050,1 060) 1 0.017[1 060,1 070) 7 0.117[1 070,1 080) 20 0.333[1 080,1 090) 11 0.183[1 090,1 100) 13 0.217[1 100,1 110) 6 0.100[1 110,1 120] 2 0.033合计 601.00 (2)欧元的现汇买入价在区间1 065~1 105内的频率的估计值为 0.117×1060107010651070--+0.333+0.183+0.217+0.100×1100111011001105--=0.84. (3)因为0.017+0.117+0.333+0.183+0.217=0.867<0.95,0.017+0.117+0.333+0.183+0.217+0.100=0.967>0.95,所以x 在区间[1 100,1 110)内,且满足0.867+0.100×110011101100--x =0.95,所以x≈1 108.3.即欧元的现汇买入价不超过1 108.3的频率的估计为0.95.点评:通过对生活实例的分析,使学生更好地体会分布的意义和作用.频率分布表能反映数据在某一范围内出现的可能性.如果这一范围是由几组数据组成的,则其出现的可能性为这几组数据的频率之和.知能训练对某电子元件进行寿命追踪调查,情况如下:寿命(h ) 100~200 200~300 300~400 400~500 500~600 个数 20 30 80 40 30(1)列出频率分布表;(2)估计电子元件寿命在100 h ~400 h 以内的概率;(3)估计电子元件寿命在400 h以上的概率.解:(1)频率分布表:寿命频数频率100~200200.1200~300300.15300~400800.40400~500400.20500~600300.15合计2001(2)频率分布表可以算出,寿命在100 h~400 h的电子元件出现的频率为0.65,所以我们估计电子元件寿命在100 h~400 h的概率为0.65.(3)由频率分布表可知,寿命在400 h以上的电子元件出现的频率为0.20+0.15=0.35,故我们估计电子元件寿命在400 h以上的概率为0.35 .点评:结合例题配套练习,让学生熟练掌握解题过程.课堂小结总体分布情况可以通过样本来估计,频率分布是总体分布的一种近似.频率分布表编制步骤:①求极差;②决定组距与组数;③将数据分组;④列频率分布表.频率分布表具有如下特性:①分组的变化可以引起频率分布表的结构的变化.②随机性:频率分布表是由样本决定的,因此它们会随样本的改变而改变,而样本是随机抽取的.③规律性:由于频率趋近于概率的原则,若固定分组,随着样本容量的增加,频率分布表中的各个频率会稳定在总体相应分组的概率之上.作业1.课本习题2.2 1.2.现实生活中,很多问题的解决需要总体分布的信息,而总体分布需要用样本来估计.如身高、体重、考试成绩、农作物产量、某种特定新产品的各种质量指标、股票价格等.请自己查阅资料做进一步的调查了解,作出分析判断,提出建议.要注意抽样的合理性与可操作性.设计感想研究分布规律的方法应在解决实际问题的过程中探索出来,所以制作频率分布表的过程或步骤应该是在结合实例的基础上,一边实践一边总结,因此一开始例题的解决过程应是探索过程.。