用样本估计总体分布
- 格式:doc
- 大小:62.00 KB
- 文档页数:4
用样本估计总体一、用样本的频率分布估计总体分布(1)频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫做该组的频数。
每组数除以全体数据的个数的商叫做该组的频率。
频率反映数据在每组中所占比例的大小。
(2)样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况),就叫做样本的频率分布。
为了能直观地显示样本的频率分布情况,通常我们会将样本的容量、样本中出现该事件的频数以及计算所得的频率列在一张表中,叫做样本频率分布表。
(3)用样本频率分布估计总体的分布从一个总体得到一个包含大量数据的样本时,我们很难从一个个数字中直接看出样本所含的信息。
如果把这些数据形成频数分布或频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。
用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本的频率分布对它进行估计。
(4)频率分布直方图的特点从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容,所以,把数据表示成直方图后,原有的具体数据信息就被抹掉了。
(5)频率分布折线图把频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,如图所示。
为了方便看图,一般习惯于把频率分布折线图画成与横轴相连,所以横轴上的左右两端点没有实际意义。
(6)总体密度曲线①如果样本容量越大,所分组数越多,频率分布直方图中表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值的大小。
设想如果样本容量不断增大,分组的组距不断缩小,则频率分布直方图实际上是越来越接近于总体的分布,它可以用一条光滑曲线来描绘,这条光滑曲线就叫做总体密度曲线。
y f x()②总体密度曲线精确地反映了一个总体在各个区域内取值的百分比。
a b内的百分比就是图中带斜线部分的面积。
对本例来说,总体密度曲线呈产品尺寸落在(,)中间高两边低的“钟”形分布,总体的数据大致呈对称分布,并且大部分数据都集中在靠近中间的区间内。
2.2 用样本估计总体教案 A第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1. 通过实例体会分布的意义和作用.2. 在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境在NBA的2004赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?如何根据这些数据作出正确的判断呢?这就是我们这堂课要研究、学习的主要内容——用样本的频率分布估计总体分布.二、探究新知探究1:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,第 1 页为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值及最小值的差,即求极差;2.决定组距及组数;3.将数据分组;4.列频率分布表;5.画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.探究2:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图和形状也会不同.不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断,分别以0.1和1为组距重新作图,然后谈谈你对图的印象?(把学生分成两大组进行,分别作出两种组距的图,然后组织同学们对所作图的不同看法进行交流……)接下来请同学们思考下面这个问题:思考:如果当地政府希望使85%以上的居民每月的用水量不超出标准,根据频率分布表2-2和频率分布直方图2.2-1,(见教材P67)你能对制定月用水量标准提出建议吗?(让学生仔细观察表和图)(二)频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.思考:1.对于任何一个总体,它的密度曲线是不是一定存在?为什么?2.对于任何一个总体,它的密度曲线是否可以被非常准确地画出来?为什么?实际上,尽管有些总体密度曲线是客观存在的,但一般很难像函数图象那样准确地画出来,我们只能用样本的频率分布对它进行估计,一般来说,样本容量越大,这种估计就越精确.(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把第 3 页这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.三、例题精析例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134cm的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm 的人数占总人数的19%.cm )例2 为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++, 又因为频率=.第二小组频数样本容量所以,12150.0.08===第二小组频数样本容量第二小组频率 (2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、课堂小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、评价设计1.P81习题2.2 A组1、2.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征(板出课题).二、探究新知(一)众数、中位数、平均数探究(1)怎样将各个样本数据汇总为一个数值,并使它成为样本数据的“中心点”?(2)能否用一个数值来描写样本数据的离散程度?(让学生回忆初中所学的一些统计知识,思考后展开讨论)初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供第 5 页关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t (最高的矩形的中点)(图见教材第72页)它告诉我们,该市的月均用水量为2. 25t 的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.(图略见教材73页图2.2-6)思考:2.02这个中位数的估计值,及样本的中位数值2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)图2.2-6显示,大部分居民的月均用水量在中部(2.02t 左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)(二)标准差、方差1.标准差平均数为我们提供了样本数据的重要信息,可是,有时平均数也会使我们作出对总体的片面判断.某地区的统计显示,该地区的中学生的平均身高为176cm ,给我们的印象是该地区的中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,只有平均数难以概括样本数据的实际状态.例如,在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?如果你是教练,选哪位选手去参加正式比赛? 我们知道,77x x ==乙甲,.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差距呢?(观察P74图2.2-7)直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示.样本数据1,2,,n x x x 的标准差的算法:第 7 页(1) 算出样本数据的平均数x .(2) 算出每个样本数据及样本数据平均数的差:(1,2,)i x x i n -= (3) 算出(2)中(1,2,)i x x i n -=的平方.(4) 算出(3)中n 个平方数的平均数,即为样本方差.(5) 算出(4)中平均数的算术平方根,即为样本标准差.其计算公式为:显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.提问:标准差的取值范围是什么?标准差为0的样本数据有什么特点?从标准差的定义和计算公式都可以得出:s ≥0.当0s =时,意味着所有的样本数据都等于样本平均数.2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.三、例题精析例1 画出下列四组样本数据的直方图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5(2)4,4,4,5,5,5,6,6,6(3)3,3,4,4,5,6,6,7,7(4)2,2,2,2,5,8,8,8,8分析:先画出数据的直方图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即可算出每一组数据的标准差.解:(图见教材P76)四组数据的平均数都是5.0,标准差分别为:0.00,0.82,1.49,2.83.他们有相同的平均数,但他们有不同的标准差,说明数据的分散程度是不一样的.例2 甲乙两人同时生产内径为25.40mm 的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm ):甲 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.3825.42 25.39 25.43 25.39 25.40 25.44 25.40 25.4225.45 25.35 25.41 25.39乙 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.3625.34 25.49 25.33 25.43 25.43 25.32 25.47 25.3125.32 25.32 25.32 25.48从生产的零件内径的尺寸看,谁生产的质量较高?分析:比较两个人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数及标准差的大小即可,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本数据的平均数、标准差,以此作为两个总体之间的差异的估计值.解:四、课堂小结1. 用样本的数字特征估计总体的数字特征分两类:(1)用样本平均数估计总体平均数.(2)用样本标准差估计总体标准差.样本容量越大,估计就越精确.2. 平均数对数据有“取齐”的作用,代表一组数据的平均水平.3. 标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度.五、评价设计P81 习题 2.2 A组 3、4.教案 B第1课时教学内容§2.2.1 用样本的频率分布估计总体分布教学目标一、知识及技能1.通过实例体会分布的意义和作用.2.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.3.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.二、过程及方法通过对现实生活的探究,感知应用数学知识解决问题的方法,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观通过对样本分析和总体估计的过程,感受数学对实际生活的需要,认识到数学知识源于生活并指导生活的事实,体会数学知识及现实世界的联系.教学重点、难点教学重点:会列频率分布表,画频率分布直方图、频率折线图和茎叶图.教学难点:能通过样本的频率分布估计总体的分布.教学设想一、创设情境,导入新课我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?你认为,为了较为合理地确定出这个标准,需要做哪些工作?(让学生展开讨论)为了制定一个较为合理的标准a,必须先了解全市居民日常用水量的分布情况,比如月均用水量在哪个范围的居民最多,他们占全市居民的百分比情况等.因此采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况.分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息.表格则是通过改变数据的构成形式,为我们提供解释数据的新方式.下面我们学习的频率分布表和频率分布图,则是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.可以让我们更清楚的看到整个样本数据的频率分布情况.二、新课探知(一)频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1. 计算一组数据中最大值及最小值的差,即求极差;2. 决定组距及组数;第 9 页cm ) 3. 将数据分组;4. 列频率分布表;5. 画频率分布直方图.以教材P65制定居民用水标准问题为例,经过以上几个步骤画出频率分布直方图.(让学生自己动手作图)例1 下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位cm ):(1)列出样本频率分布表;(2)一画出频率分布直方图;(3)估计身高小于134C m的人数占总人数的百分比.分析:根据样本频率分布表、频率分布直方图的一般步骤解题.解:(1)样本频率分布表如下:(2)其频率分布直方图:(3134cm 的男孩出现的,所以我们估计身高小 (1趋势. (2把数据抹掉了.曲线 1.频率分布折线图连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(见教材P69)(三)茎叶图1.茎叶图的概念:当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.(见教材P70例子)2.茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录及表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.例2某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.用茎叶图表示,你能通过该图说明哪个运动员的发挥更稳定吗?解:“茎”指的是中间的一列数,表示得分的十位数;“叶”指的是从茎的旁边生长出来的数,分别表示两人得分的个位数.画这组数据的茎叶图的步骤如下第一步,将每个数据分为“茎”(高位)和“叶”(低位)两部分;第二步,茎是中间的一列数,按从小到大的顺序排列;第三步,将各个数据的叶按大小次序写在茎右(左)侧.甲乙8 04 6 3 1 2 53 6 8 2 5 43 8 9 3 1 6 1 6 7 94 4 91 5 0从图中可以看出,乙运动员的得分基本上是对称的,页的分布是“单峰”的,有的叶集中在茎2,3,4上,中位数为36;甲运动员的得分除一个特殊得分(51分)外,也大致对称,叶的分布也是“单峰”的,有的叶主要集中在茎1,2,3上,中位数是26.由此可以看出,乙运动员的成绩更好. 另外i,从叶在茎上的分布情况看,乙运动员的得分更集中于峰值附近,这说明乙运动员的发挥更稳定.练习:在NBA的2010赛季中,甲、乙两名篮球运动员每场比赛得分的原始记录如下﹕甲运动员得分﹕12,15,20,25,31,31,36,36,37,39,44,49,50乙运动员得分﹕8,13,14,16,23,26,28,38,39,51,31,29,33学生画出茎叶图(略)三、巩固练习为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数次测试,将所得数据整理后,画出频率分布直方图(见下页图示),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.第 11 页(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.分析:在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高及频数成正比,各组频数之和等于样本容量,频率之和等于1.解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:40.08 24171593=+++++,又因为频率=第二小组频数样本容量,所以,121500.08===第二小组频数样本容量第二小组频率.(2)由图可估计该学校高一学生的达标率约为(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.四、小结1. 总体分布指的是总体取值的频率分布规律,由于总体分布不易知道,因此我们往往用样本的频率分布去估计总体的分布.2. 总体的分布分两种情况:当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图.五、布置作业P71练习1、2、3.第2课时教学内容§2.2.2 用样本的数字特征估计总体的数字特征教学目标一、知识及技能1. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差.2. 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.3. 会用样本的基本数字特征估计总体的基本数字特征.4. 形成对数据处理过程进行初步评价的意识.二、过程及方法在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和逻辑推理的数学方法.三、情感、态度及价值观会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,认识统计的作用,能够辩证地理解数学知识及现实世界的联系.教学重点、难点教学重点:用样本平均数和标准差估计总体的平均数及标准差.教学难点:能应用相关知识解决简单的实际问题.教学设想一、创设情境导入新课在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下﹕甲运动员﹕7,8,6,8,6,5,8,10,7,4;乙运动员﹕9,5,7,8,7,6,8,6,7,7.请问从上面的数据中你能否看出甲,乙两名运动员哪一位发挥比较稳定?为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究——用样本的数字特征估计总体的数字特征.二、新课探究(一)众数、中位数、平均数初中我们曾经学过众数,中位数,平均数等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.例如前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t(最高的矩形的中点)(图略见教材第72页)它告诉我们,该市的月均用水量为2. 25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.提问:请大家翻回到教材第66页看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失的原因,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,第 13 页。
用样本估算总体
◎ 用样本估算总体的定义
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的知识扩展
用样本估计总体的两个手段:
(1)用样本的频率分布估计总体的分布;
(2)用样本的数字特征估计总体的数字特征,需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,且样本的容量越大,估计的结果也就越精确。
◎ 用样本估算总体的教学目标
1、通过实例,体会用样本估计总体的思想。
2、能够根据统计结果作出合理的判断和推测,能与同学进行交流,用清晰的语言表达自己的观点。
3、根据有关问题查找资料或调查,用随机抽样的方法选取样本,能用样本的平均数和方差,从而对总体有个体有个合理的估计和推测。
◎ 用样本估算总体的考试要求
能力要求:了解
课时要求:40
考试频率:选考
分值比重:2。
11.6 随机抽样 用样本估计总体 正态分布教材细梳理—-知识点 一.随机抽样 1.简单随机抽样(1).定义:一个总体含有N 个个体,从中逐个①_____地抽取n 个个体作为样本(n ≤N ),如果每次抽取时总体内的各个个体被抽到的机会_②_____,就把这种抽样方法叫做简单随机抽样.(2). 最常用的简单随机抽样方法有两种___③__法和_④_________法. (3). 适用于 ⑤ 的情况. 2.系统抽样(1).定义:将总体分成 ⑥ 的若干部分,然后按照预先制定的规则,从每一部分中抽取一个个体,得到所需要的样本,这样的抽样方法称为系统抽样 . (2).系统抽样步骤:假设要从容量为N 的总体中抽取容量为n 的样本. a. 先将总体的N 个个体⑧ .有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(编号的位数要一样) b. 确定⑨ ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n;c. 在第1段用_⑩_________确定第一个个体编号l (l ≤k );d. 按照一定的规则抽取样本.通常是将l ⑪ 得到第2个个体编号(l +k ),再加k 得到第3个个体编号(l +2k ) 依次进行下去,直到获取整个样本. (3).系统抽样适用于⑫ 的情况. 3.分层抽样(1).定义:当总体由⑬ 组成时,为了使抽取的样本更好地反映总体的情况,可将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占⑭ 进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.(2).分层抽样适用于总体由差别明显的几部分组成的情况. 二.样本估计总体有关概念和知识点1.通常我们对总体作出的估计一般分成两种.一种是用样本的①__________估计总体的分布.另一种是用样本的② 估计总体的数字特征. 2.频率分布直方图画法(1).求极差(最大值-最小值=极差). (2).决定组距与组数.(3).确定分点,将数据分组.5.茎叶图以数据的高位为茎,放中间,低位为叶放两边,它的优点是: (1)保留了原始数据,没有损失样本信息.(2)数据可以随时记录、添加或修改. (n x x ++-2(n x x ++-受极值影响较大。
授课主题用样本估计总体教学目标1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.3.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.4.会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题.教学内容1.频率分布直方图(1)列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数;③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
(2)频率分布直方图的特点:①==⨯频率小长方形的面积组距频率组距,②个小长方形的面积等于1,③1==频率小长方形的高,所有小长方形的高的和组距组距.(3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.(4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x=来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地n;n①众数、中位数、平均数都是描述一组数据集中趋势的量,平均数是最重要的量;x的平均数为x,则一组数,,n的平均数为用样本的标准差估计总体的标准差)数据的离散程度可以用极差、方差或标准差来描述;定义样本方差为222212()()()n x x x x x x s n-+-++-=;简化公式:22222121[()]n s x x x nx n=+++-=2222121()n x x x x n+++-(方差等于原数据平方的平均数减去平均数的平方)(4)样本的标准差是方差的算术平方根.样本标准差22212()()()0n x x x x x x s s n-+-++-=≥,.标准差越大数据离散程度越大,数据家分散;标准差越小,数据集中在平均数周围. (5)方差相关结论:①如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n x a x a x a +++的方差为2s ;②如果一组数12,,,n x x x 的方差为2s ,则一组数12,,,n kx kx kx 的方差为22k s 。
学科核心素养下高中数学教学设计———以“用样本估计总体”为例文|傅焕铭一、教材分析我们收集的原始数据往往多而杂,需要对原始数据进行分析、处理,找到数据背后蕴藏的信息。
对总体统计特征的刻画包括两个层面:一是总体统计特征的全面刻画,即刻画出总体中所有个体的取值规律,这个规律可以用总体的频率分布表和频率分布直方图描述或近似描述;二是总体部分统计特征的刻画,如平均数、众数、方差、标准差等数字特征。
二、教学目标(一)核心素养学生初步习得科学处理数据的能力。
(二)教学目标(1)学生用频率分布直方图估计样本的众数、中位数、平均数等数据特征。
(2)学生能自行独立计算样本数据的标准差、方差,并知道分别刻画统计的什么特征。
(3)学生会用样本的频率分布估计总体分布,会用样本特征估计总体特征,理解用样本估计总体的思想,并能利用所学知识解决生活中的一些现实问题。
三、教学重难点教学重点:学生能从频率分布直方图上估计出样本数据特征。
教学难点:学生理解总体分布的概念,形成统计思维。
四、教学过程师:同学们,前面我们已经研究过通过抽样调查来研究数据的方法,了解了提高样本代表性的一些具体方法,收集数据后,我们要从中找到数据背后包含的信息,方可达到用样本估计总体的目的。
今天我们就一起研究“用样本估计总体”。
(一)课前导学师:同学们,根据自学任务,思考下列问题并完成检测。
任务1:样本数字特征有哪些?如何求?这些特征在频率分布直方图上如何估计?任务2:样本数字特征是如何反映样本数据的集中趋势和离散程度的?(设计意图:通过出示自学任务,引导学生自学,相机进行自学效果检测。
学生根据自学情况,检测新知中还有哪些内容没有理解和掌握,从而有针对性地学习本节内容,实现高效学习。
同时也旨在培养学生良好的学习习惯,指导学生学会学习数学的方法。
)(二)课堂设计探究一:样本的数字特征11.探究:众数、中位数、平均数的概念。
师:请同学们根据概念解释,完成概念名词的填空,并揣摩这些概念的含义。
用样本的频率分布估计总体分布(第1课时)
教学目标:
1.通过实例体会分布的意义和作用,通过对现实生活的探究,感知应用数学知识解决问题的方法.
2.通过表示样本数据的过程,学会列频率分布表,画频率分布直方图,理解数形结合的数学思想.
3.通过对样本分析和总体估计的过程,感受数学在实际生活中的作用,认识数学知识源于生活并指导生活的事实.
教学重点:
会列频率分布表,画频率分布直方图,了解样本频率分布与总体分布之间的关系
教学难点:
掌握频率分布直方图的正确画法,体会分布的意义与作用
教学方法:引导——探究教学法
教学过程:
一、创设情境,呈现问题
问题情境:我国是世界上严重缺水的国家之一,城市缺水问题较为突出,武汉市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费. 如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?
二、操作讨论,构建新知
<知识探究1 改良频数分布表→频率分布表>
问题1:如果标准太低,会影响居民的日常生活;如果标准太高,则不利于节水.那么你认为,为了较合理地确定出这个标准,需要了解哪些相关信息,做哪些工作?
【学生活动1】探究讨论,得到结论:
①为了制定一个较为合理的标准a,需要知道每个家庭的用水量
②如何获得家庭用水量的有关信息?对家庭进行调查,采用抽样调查的方式
③抽样时,样本容量定为多少比较合适?武汉市1000万人口,抽样10000比较合适
课堂上为了处理数据的方便,我们理想化地抽取100个数据的样本,比如:
通过抽样调查,获得100户居民的月均用水量如下表(单位:t)
3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6
3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.4
3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8
3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6
4.1
3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8
4.3
3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0
2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.3
2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4
2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.4
2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2
问题2:从表中随意记录下的数据中很难直接看出规律,因此需要对统计数据进行整理分析. 回顾你看到全班的期末考试成绩单后是怎样分析的?
【学生活动2】探究讨论,得到结论:
①最高分,最低分
②自己得分名次,以及位于哪一个分数段
③及格率,优秀率
(类比考试成绩分析←→用水量分析,得到处理数据的方法之一——列表)
【学生活动3】动手操作,处理数据:
回顾初中学过的列频数分布表的步骤,并按照以上方法处理用水量问题中的数据.
①居民月均用水量的最大值为4.3,最小值为0.2,极差为4.1
②将上述100个数据按组距为0.5进行分组,共分9组
③各组数据的范围可设定为[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].
④统计上述100个数据在各组中的频数,并用表格表示(频数分布表)
问题3:用频数分布表研究问题有没有不足?比如想回答引例中的问题(85%左右居民月用水量不超过标准)可以怎么改良?
【学生活动4】动手操作,在学案中改良频数分布表→频率分布表,得到:
上表称为样本数据的频率分布表,通过频率数值体现各组数据在样本容量中所占比例的大小.
三、回归现实,解决问题
如果市政府希望85%左右的居民每月的用水量不超过标准,根据上述频率分布
表,你对制定居民月用水量标准(即a的取值)有何建议?
88%的居民月用水量在3t以下,可建议取a=3.
由此可以推测该市全体居民月均用水量分布的大致情况,给市政府确定居民月用水量标准提供参考依据,这里体现了一种用样本的频率分布估计总体分布的统计思想.
四、由表到图,升华直观
<知识探究2 改良频数分布直方图→频率分布直方图>
(类比线性规划等知识直观处理的方法,得到处理数据的方法之二——画图)
问题4:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的频率分布直方图表示. 类比频数分布表,也用频率表示小长方形的高好不好?可不可以改良,使之更直观?
【学生活动5】探究讨论,动手操作:
讨论结果:
①面积比高度更直观,故频率分布直方图中可以用面积表示频率
频率,小长方形的面积和=1
②小长方形的高=
组距
在学案中改良频数分布直方图→频率分布直方图,得到:
你能从图1中分析出样本的哪些信息?进而对武汉市用水量分布做出估计?
五、总结归纳,收获方法
问题5:你能概括出列频率分布表和画频率分布直方图的步骤吗?
频率分布表
Step1 求极差;
Step2 决定组距与组数;
Step3 确定分点,将数据分组;
Step4 列频率分布表.
频率分布直方图
Step1 画平面直角坐标系;
Step2 在横轴上均匀标出各组分点,在纵轴上标出单位长度;
Step3 以组距为底,各组的频率与组距的商为高,分别画出各组对应的小长方形. 六、理论迁徙,课堂小结
理论迁徙:下面数据是50位费尔兹奖得主获奖时的年龄:
29 39 35 33 39 28 33 35 31 31
37 32 38 36 31 39 32 38 37 34
29 34 38 32 35 36 33 29 32 35
36 37 39 38 40 38 37 39 38 34
33 40 36 36 37 40 31 38 38 40
(口答)你认为以下哪一种分组能更好地说明费尔兹奖得主获奖时的年龄分布()
A.组距是1,各组是[28,29), [29,30), [30,31)……
B.组距是2,各组是[28,30), [30,32), [32,34)……
C.组距是5,各组是[25,30), [30,35), [35,40]
D.组距是10,各组是[20,30),[30,40]
(课堂练习)请完成频率分布表并估计年龄小于34岁得奖者占总人数的百分比.
(课后作业)绘制频率分布直方图并估计总体分布有怎样的特点.
(注:费尔兹奖是国际上享有崇高荣誉的一个数学奖项,每4年评选一次,主要授予年轻的数学家. 美籍华人丘成桐(1949年出生)1982年获得费尔兹奖.)
解:样本频率分布表如下:
由样本频率分布表可知年龄小于34岁的获奖者出现的频率为0. 08+0. 08+0. 16=0. 32,所以我们估计年龄小于34岁的获奖者占总人数的32%.
课堂小结:
方法:列频率分布表,画频率分布直方图
思想:用样本估计总体的统计思想
附:(板书设计)。