5.1.4用样本估计总体
- 格式:pptx
- 大小:919.85 KB
- 文档页数:18
⽤样本估计总体教案2.2.1⽤样本的频率分布估计总体分布⼀、教学⽬标分析1.知识与技能⽬标(1)通过实例体会分布的意义和作⽤。
(2)在表⽰样本数据的过程中,学会列频率分布表,画频率分布直⽅图。
(3)通过实例体会频率分布直⽅图的特征,能准确地做出总体估计。
2、过程与⽅法⽬标:通过对现实⽣活的探究,感知应⽤数学知识解决问题的⽅法,理解数形结合的数学思想和逻辑推理的数学⽅法。
3、情感态度与价值观⽬标:通过对样本分析和总体估计的过程,感受数学对实际⽣活的需要,认识到数学知识源于⽣活并指导⽣活的事实,体会数学知识与现实世界的联系。
⼆、教学的重点和难点重点:会列频率分布表,画频率分布直⽅图。
难点:能通过样本的频率分布估计总体的分布。
三、教法与学法分析1、教法:遵循观察、探究、发现、总结式的教学模式。
重点以引导学⽣为主,让他们能积极、主动的进⾏探索,获取知识。
由于内容较繁琐,所以要借助多媒体辅助教学。
2、学法:根据本节知识的特点,由于学⽣已具备⼀定的基础知识,可采取研究性学习的学习⽅法。
四、教学过程(⼀)情境引⼊1.随机抽样有哪⼏种基本的抽样⽅法?简单随机抽样、系统抽样、分层抽样.2.随机抽样是收集数据的⽅法,如何通过样本数据所包含的信息,估计总体的基本特征,即⽤样本估计总体,是我们需要进⼀步学习的内容.3.⾼⼆某班有50名学⽣,在数学必修②结业考试后随机抽取10名,其考试成绩如下:82,75,61,93,62,55,70,68,85,78.如果要求我们根据上述抽样数据,估计该班对数学模块②的总体学习⽔平,就需要有相应的数学⽅法作为理论指导,本节课我们将学习⽤样本的频率分布估计总体分布.(⼆)新课讲解知识探究(⼀):频率分布表【问题】我国是世界上严重缺⽔的国家之⼀,城市缺⽔问题较为突出,某市政府为了节约⽣活⽤⽔,计划在本市试⾏居民⽣活⽤⽔定额管理,即确定⼀个居民⽉⽤⽔量标准a,⽤⽔量不超过a的部分按平价收费,超出a的部分按议价收费.通过抽样调查,获得100位居民2007年的⽉均⽤⽔量如下表(单位:t):3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.6 3.4 2.6 2.2 2.2 1.5 1.2 0.20.4 0.3 0.4 3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.21.7 1.3 3.6 1.7 0.6 4.1 3.22.9 2.4 2.3 1.8 1.43.5 1.9 0.84.3 3.02.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.60.9 2.3 2.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.4 2.5 2.6 2.3 2.1 1.61.0 1.0 1.7 0.82.4 2.8 2.5 2.2 2.0 1.5 1.0 1.2 1.8 0.6 2.2思考1:上述100个数据中的最⼤值和最⼩值分别是什么?由此说明样本数据的变化范围是什么?0.2~4.3思考2:样本数据中的最⼤值和最⼩值的差称为极差.如果将上述100个数据按组距为0.5进⾏分组,那么这些数据共分为多少组?(4.3-0.2)÷0.5=8.2思考3:以组距为0.5进⾏分组,上述100个数据共分为9组,各组数据的取值范围可以如何设定?[0,0.5),[0.5,1),[1,1.5),…,[4,4.5].思考4:如何统计上述100个数据在各组中的频数?如何计算样本数据在各组中的频率?你能将这些数据⽤表格反映出来吗?分组频数累计频数频率[0,0.5) 4 0.04[0.5,1)8 0.08[1,1.5)正正正15 0.15[1.5,2)正正正正22 0.22[2,2.5)正正正正正25 0.25[2.5,3)正正14 0.14[3,3.5)正⼀ 6 0.06[3.5,4) 4 0.04[4,4.5] 2 0.02合计100 1.00思考5:上表称为样本数据的频率分布表,由此可以推测该市全体居民⽉均⽤⽔量分布的⼤致情况,给市政府确定居民⽉⽤⽔量标准提供参考依据,这⾥体现了⼀种什么统计思想?⽤样本的频率分布估计总体分布.思考6:如果市政府希望85%左右的居民每⽉的⽤⽔量不超过标准,根据上述频率分布表,你对制定居民⽉⽤⽔量标准(即a 的取值)有何建议?88%的居民⽉⽤⽔量在3t以下,可建议取a=3思考7:在实际中,取a=3t⼀定能保证85%以上的居民⽤⽔不超标吗?哪些环节可能会导致结论出现偏差?分组时,组距的⼤⼩可能会导致结论出现偏差,实践中,对统计结论是需要进⾏评价的.思考8:对样本数据进⾏分组,其组数是由哪些因素确定的?思考9:对样本数据进⾏分组,组距的确定没有固定的标准,组数太多或太少,都会影响我们了解数据的分布情况.数据分组的组数与样本容量有关,⼀般样本容量越⼤,所分组数越多.按统计原理,若样本的容量为n,分组数⼀般在(1+3.3lg n)附近选取.当样本容量不超过100时,按照数据的多少,常分成5~12组.若以0.1或1.5为组距对上述100个样本数据分组合适吗?思考10:⼀般地,列出⼀组样本数据的频率分布表可以分哪⼏个步骤进⾏?第⼀步,求极差.(极差=样本数据中最⼤值与最⼩值的差)第⼆步,决定组距与组数.(设k=极差÷组距,若k为整数,则组数=k,否则,组数=k+1)第三步,确定分点,将数据分组.第四步,统计频数,计算频率,制成表格.(频数=样本数据落在各⼩组内的个数,频率=频数÷样本容量)知识探究(⼆):频率分布直⽅图思考1:为了直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息⽤下⾯的图形表⽰:上图称为频率分布直⽅图,其中横轴表⽰⽉均⽤⽔量,纵轴表⽰频率/组距. 频率分布直⽅图中各⼩长⽅形的和⾼度在数量上有何特点?思考2:频率分布直⽅图中各⼩长⽅形的⾯积表⽰什么?各⼩长⽅形的⾯积之和为多少?各⼩长⽅形的⾯积=频率各⼩长⽅形的⾯积之和=1思考3:频率分布直⽅图⾮常直观地表明了样本数据的分布情况,使我们能够看到频率分布表中看不太清楚的数据模式,但原始数据不能在图中表⽰出来.你能根据上述频率分布直⽅图指出居民⽉均⽤⽔量的⼀些数据特点吗?(1)居民⽉均⽤⽔量的分布是“⼭峰”状的,⽽且是“单峰”的;(2)⼤部分居民⽉均⽤⽔量集中在⼀个中间值附近,只有少数居民⽉均⽤⽔量很多或很少;(3)居民⽉均⽤⽔量的分布有⼀定的对称性等.思考4:样本数据的频率分布直⽅图是根据频率分布表画出来的,⼀般地,频率分布直⽅图的作图步骤如何?第⼀步,画平⾯直⾓坐标系.第⼆步,在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步,以组距为宽,各组的频率与组距的商为⾼,分别画出各组对应的⼩长⽅形.思考5:对⼀组给定的样本数据,频率分布直⽅图的外观形状与哪些因素有关?在居民⽉均⽤⽔量样本中,你能以1为组距画频率分布直⽅图吗?(三)例题讲解例1、某地区为了了解知识分⼦的年龄结构,随机抽样50名,其年龄分别如下:42,38,29,36,41,43,54,43,34,44,40,59,39,42,44,50,37,44,45,29,48,45,53,48,37,28,46,50,37,44,42,39,51,52,62,47,59,46,45,67,53,49,65,47,54,63,57,43,46,58.(1)列出样本频率分布表;(2)画出频率分布直⽅图;(3)估计年龄在32~52岁的知识分⼦所占的⽐例约是多少.(1)极差为67-28=39,取组距为5,分为8组.样本频率分布表:分组频数频率[27,32) 3 0.06[32,37) 3 0.06[37,42) 9 0.18[42,47) 16 0.32[47,52) 7 0.14[52,57) 5 0.10[57,62) 4 0.08[62,67) 3 0.06合计 50 1.00(2)样本频率分布直⽅图:频率(3)因为0.06+0.18+0.32+0.14=0.7,故年龄在32例 2、为了了解⼩学⽣的体能情况,抽取了某⼩学同年级部分学⽣进⾏跳绳测试,将所得的数据整理后画出频率分布直⽅图(如图),已知图中从左到右的前三个⼩组的频率分别是0.1,0.3,0.4。
5.1.4用样本估计总体【基础练习】一、单选题1.从某小区抽取100户居民进行月用电量调查,发现其月用电量都在50至350度之间,频率分布直方图如图所示,则这100户居民月用电量的中位数大约为()A.150B.177.8C.183.3D.2002.如图,这是某校高三年级甲、乙两班在上学期的5次数学测试的班级平均分的茎叶图,则下列说法不正确的是()A.甲班的数学成绩平均分的平均水平高于乙班B.甲班的数学成绩的平均分比乙班稳定C.甲班的数学成绩平均分的中位数高于乙班D.甲、乙两班这5次数学测试的总平均分是1033.有4万个不小于70的两位数,从中随机抽取了3000个数据,统计如下:请根据表格中的信息,估计这4万个数据的平均数为()A.92.16B.85.23C.84.73D.77.974.如图是某学校的教研处根据调查结果绘制的本校学生每天放学后的自学时间情况的频率分布直方图:根据频率分布直方图,求出自学时间的中位数和众数的估计值(精确到0.01)分别是()A .2.20,2.25B .2.29,2.20C .2.29,2.25D .2.25,2.255.某歌手大赛进行电视直播,比赛现场有6名特约嘉宾给每位参赛选手评分,场内外的观众可以通过网络平台给每位参赛选手评分.某选手参加比赛后,现场嘉宾的评分情况如下表,场内外共有数万名观众参与了评分,组织方将观众评分按照[)70,80,[)80,90,[]90,100分组,绘成频率分布直方图如下:嘉宾评分的平均数为1x ,场内外的观众评分的平均数为2x ,所有嘉宾与场内外的观众评分的平均数为x ,则下列选项正确的是( ) A .122x x x +=B .122x x x +>C .122x x x +<D .12122x x x x x +>>>二、填空题6.解放战争中,国民党军队拥有过多辆各型坦克,编成了1个装甲兵团(师级编制).我军为了知道这个装甲兵团的各型坦克的数量,釆用了两种方法:一种是传统的情报窃取,一种是用统计学的方法进行估计.统计学的方法最后被证实比传统的情报收集更精确.这个装甲兵团对各型坦克从1开始进行了连续编号,在解放战争期间我军把缴获的这些坦克的编号进行记录并计算出这些编号的平均值为112.5,假设缴获的坦克代表了所有坦克的一个随机样本,则利用你所学过的统计知识估计这个装甲兵团的各型坦克的数量大约有_______.7.为了解某市居民用水情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将该数据按照[0,0.5),[0.5,1),…[4.4.5]分成9组,绘制了如图所示的频率分布直方图,政府要试行居民用水定额管理,制定了一个用水量标准a,使85%的居民用水量不超过a(假设a为整数),按平价收水费,超出a的部分按议价收费,则a的最小值为_____.8.我国高铁发展迅速,技术先进,经统计在经停某站的高铁列车,有10个车次的正点率为0.97,有20个车次的正点率为0.99,有10个车次的正点率为0.98,则经停该站高铁列车的所有车次的平均正点率估计值为______.三、解答题9.某工厂为生产一种标准长度为40cm的精密器件,研发了一台生产该精密器件的车床,该精密器件的实际长度为acm,“长度误差”为40a cm,只要“长度误差”不超过0.03cm就认为合格.已知这台车床分昼、夜两个独立批次生产,每天每批次各生产1000件.已知每件产品的成本为5元,每件合格品的利润为10元.在昼、夜两个批次生产的产品中分别随机抽取20件,检测其长度并绘制了如下茎叶图:(1)分别估计在昼、夜两个批次的产品中随机抽取一件产品为合格品的概率;(2)以上述样本的频率作为概率,求这台车床一天的总利润的平均值.10.《中华人民共和国个人所得税法》规定,公民月收入总额(工资、薪金等)不超过免征额的部分不必纳税,超过免征额的部分为全月应纳税所得额,个人所得税税款按税率表分段累计计算.为了给公民合理减负,稳步提升公民的收入水平,自2018年10月1日起,个人所得税免征额和税率进行了调整,调整前后的个人所得税税率表如下:(1)已知小李2018年9月份上交的税费是295元,10月份工资、薪金等税前收入与9月份相同,请帮小李计算一下税率调整后小李10月份的税后实际收入是多少?(2)某税务部门在小李所在公司利用分层抽样方法抽取某月100位不同层次员工的税前收入,并制成下面的频率分布直方图.(i)请根据频率分布直方图估计该公司员工税前收入的中位数;(ii)同一组中的数据以这组数据所在区间中点的值作代表,按调整后税率表,试估计小李所在的公司员工该月平均纳税多少元?【提升练习】1.某校为了解高二年级学生某次数学考试成绩的分布情况,从该年级的1120名学生中随机抽取了100 名学生的数学成绩,发现都在[80,150]内现将这100名学生的成绩按照 [80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150]分组后,得到的频率 分布直方图如图所示则下列说法正确的是( )A .频率分布直方图中a 的值为 0.040B .样本数据低于130分的频率为 0.3C .总体的中位数(保留1位小数)估计为123.3分D .总体分布在[90,100)的频数一定不总体分布在[100,110)的频数相等2.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是( ) A .抽样表明,该校有一半学生为阅读霸 B .该校只有50名学生不喜欢阅读 C .该校只有50名学生喜欢阅读 D .抽样表明,该校有50名学生为阅读霸3.某次测试成绩满分是为150分,设n 名学生的得分分别为()12,,,1n i a a a a N i n ∈≤≤,()1150k b k ≤≤为n名学生中得分至少为k 分的人数.记M 为n 名学生的平均成绩,则( )A .12150b b b M n ++= B .12150150b b b M ++=C .12150b b b M n++>D .12150150b b b M ++>4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据被墨迹污损不清(如图1),但甲得分的折线图完好(如图2),则下列结论错误的是( )A .乙运动员得分的中位数是17,甲运动员得分的极差是19B .甲运动员发挥的稳定性比乙运动员发挥的稳定性差C .甲运动员得分有12的叶集中在茎1上 D .甲运动员得分的平均值一定比乙运动员得分的平均值低5.学校随机抽查了本校20个学生,调查他们平均每天进行体育锻炼的时间(单位:min ),根据所得数据的茎叶图,以5为组距将数据分为8组,分别是[0,5),[5,10),…,[35,40],作出频率分布直方图如图所示,则原始的茎叶图可能是( )A .B .C .D .6.在一次体育水平测试中,甲、乙两校均有100名学生参加,其中:甲校男生成绩的优秀率为70%,女生成绩的优秀率为50%;乙校男生成绩的优秀率为60%,女生成绩的优秀率为40%.对于此次测试,给出下列三个结论:①甲校学生成绩的优秀率大于乙校学生成绩的优秀率;②甲、乙两校所有男生成绩的优秀率大于甲、乙两校所有女生成绩的优秀率;③甲校学生成绩的优秀率与甲、乙两校所有学生成绩的优秀率的大小关系不确定.其中,所有正确结论的序号是____________.7.为了解本市居民的生活成本,甲、乙、丙三名同学利用假期分别对三个社区进行了“家庭每月日常消费额”的调查.他们将调查所得到的数据分别绘制成频率分布直方图(如图所示),记甲、乙、丙所调查数据的标准差分别为s 1、s 2、s 3,则它们的大小关系为 .(用“>”连接)8.2020年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续5天生产的口罩数依次为1x ,2x ,3x ,4x ,5x (单位:十万只),若这组数据1x ,2x ,3x ,4x ,5x 的方差为1.44,且21x ,22x ,23x ,24x ,25x 的平均数为4,则该工厂这5天平均每天生产口罩__________十万只.9.某市约有20万住户,为了节约能源,拟出台“阶梯电价”制度,即制定住户月用电量的临界值a ,若某住户某月用电量不超过a 度,则按平价(即原价)0.5(单位:元/度)计费;若某月用电量超过a 度,则超出部分按议价b (单位:元/度)计费,未超出部分按平价计费.为确定a 的值,随机调查了该市100户的月用电量,统计分析后得到如图所示的频率分布直方图.根据频率分布直方图解答以下问题(同一组数据用该区间的中点值作代表).(1)若该市计划让全市70%的住户在“阶梯电价”出台前后缴纳的电费不变,求临界值a;(2)在(1)的条件下,假定出台“阶梯电价”之后,月用电量未达a度的住户用电量保持不变;月用电量超过a度的住户节省“超出部分”的60%,试估计全市每月节约的电量.10.某校的3000名高三学生参加了天一大联考,为了分析此次联考数学学科的情况,现随机从中抽取15名学生的数学成绩(满分:150分),并绘制成如图所示的茎叶图.将成绩低于90分的称为“不及格”,不低于120分的称为“优秀”,其余的称为“良好”.根据样本的数字特征估计总体的情况.(1)估算此次联考该校高三学生的数学学科的平均成绩.(2)估算此次联考该校高三学生数学成绩“不及格”和“优秀”的人数各是多少.(3)在国家扶贫政策的倡导下,该地教育部门提出了教育扶贫活动,要求对此次数学成绩“不及格”的学生分两期进行学业辅导:一期由优秀学生进行一对一帮扶辅导,二期由老师进行集中辅导.根据实践总结,优秀学生进行一对一辅导的转化率为20%;老师集中辅导的转化率为30%,试估算经过两期辅导后,该校高三学生中数学成绩仍然不及格的人数.注:转化率=-辅导前不及格人数辅导后不及格人数辅导前不及格人数100%⨯。
5.1.4 用样本估计总体5.2 数学探究活动:由编号样本估计总数及其模拟(略)素养目标·定方向课程标准学法解读1.能用样本的数字特征估计总体的数字特征. 2.能用样本的分布估计总体的分布.通过用样本估计总体,提升学生的数据分析、数学运算和逻辑推理素养.必备知识·探新知知识点用样本估计总体(1)前提样本的容量恰当,抽样方法合理. (2)必要性①在容许一定误差存在的前提下,可以用样本估计总体,这样能节省人力和物力. ②有时候总体的数字特征不可能获得,只能用__样本__估计总体. (3)误差估计一般是有__误差__的.但是,大数定律可以保证,当样本的容量__越来越大__时,估计的误差很小的可能性将越来越大.思考:用样本估计总体出现误差的原因有哪些?提示:样本抽取的随机性;样本抽取的方法不合适,导致代表性差;样本容量偏少等. 知识点用样本的数字特征来估计总体的数字特征(1)一般来说,在估计总体的数字特征时,只需直接算出样本对应的__数字特征__即可. (2)样本是用分层抽样得到的,由每一层的数字特征估计总体的数字特征.以分两层抽样的情况为例.条件假设第一层有m 个数,分别为x 1,x 2,…,x m ,平均数为x -,方差为s 2;第二层有n 个数,分别为y 1,y 2,…,y n ,平均数为y -,方差为t 2 结论如果记样本的平均值为a ,样本方差为b ,则a -=m x -+n y-m +n,b 2=1m +n ×⎣⎡⎦⎤(ms 2+nt 2)+mn m +n (x --y -)2知识点用样本的分布来估计总体的分布如果总体在每一个分组的频率记为π1,π2,…,πn ,样本在第一组对应的频率记为p 1,p 2,…,p n ,一般来说,1n ∑i =1n(πi -p i )2不等于零.当样本的容量__越来越大__时,上式很小的可能性将越来越大.关键能力·攻重难题型探究题型用样本的特征数估计总体的特征数角度1 简单随机抽样的数字特征 ┃┃典例剖析__■典例1 甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为甲:99 100 98 100 100 103 乙:99 100 102 99 100 100 (1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. [解析] (1)x -甲=16(99+100+98+100+100+103)=100,x -乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73, s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定. 规律方法:(1)利用样本的原始数据求得的样本数字特征是准确值,可用以估计总体. (2)此类问题需计算样本的平均值和方差来估计总体. ┃┃对点训练__■1.为了快速了解某学校学生体重(单位:kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示.估计这个学校学生体重的平均数和方差.4 5 9 7 9 6 6 5 1 8 9 6[解析] 将样本中的每一个数都减去50,可得 -5,-1,-3,-1,-4,-4,1,8,9,10,这组数的平均数为-5-1-3-1-4-4+1+8+9+1010=1,方差为62+22+42+22+52+52+02+72+82+9210=30.4,因此可估计这个学校学生体重的平均数为51,方差为30.4. 角度2 分层抽样的数字特征 ┃┃典例剖析__■典例2 在对树人中学高一年级学生身高(单位:cm)的调查中,采用分层抽样的方法,抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62,你能由这些数据计算出样本的方差,并对高一年级全体学生身高的方差作出估计吗?[解析] 把样本中男生的身高记为x 1,x 2,…,x 23,其平均数记为x -,方差记为s 2x ;把样本中女生的身高记为y 1,y 2,…,y 27,其平均数记为y -,方差记为s 2y ,把样本的平均数记为a -,方差记为s 2.则a -=23×170.6+27×160.623+27=165.2,s 2=23×[s 2x +(x --a -)2]+27×[s 2y+(y --a -)2]23+27=23×[12.59+(170.6-165.2)2]+27×[38.62+(160.6-165.2)2]50=51.486 2,即样本的方差为51.486 2.因此估计高一年级全体学生身高的方差为51.486 2.规律方法:1.求分层随机抽样的平均数的步骤 (1)求样本中不同层的平均数;(2)应用分层随机抽样的平均数公式进行求解. 2.求分层随机抽样的方差的步骤 (1)求样本中不同层的平均数; (2)求样本中不同层的方差;(3)应用分层随机抽样的方差公式进行求解. ┃┃对点训练__■2.为了解某公司员工的身体情况,利用分层抽样的方法抽取了9名男员工的身高和体重数据,计算得到他们的体质指数的平均数为25.1,方差为6,抽取了5名女员工的身高和体重数据,计算得到她们的体质指数的平均数为20.3,方差为3.求样本平均数与方差.[解析] 样本平均数x -=9×25.1+5×20.39+5≈23.4,方差s 2=9×[6+(25.1-23.4)2]+5×[3+(20.3-23.4)2]9+5≈10.2. 题型用样本的分布估计总体的分布┃┃典例剖析__■典例3 我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨),一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (3)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由.[解析] (1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]中的频率分别为0.08,0.20,0.26,0.06,0.04,0.02.由0.04+0.08+0.5×a +0.20+0.26+0.5×a +0.06+0.04+0.02=1,解得a =0.30. (2)由(1)可知,100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率,可以估计全市30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)因为前6组的频率之和为0.04+0.08+0.15+0.20+0.26+0.15=0.88>0.85, 而前5组的频率之和为:0.04+0.08+0.15+0.20+0.26=0.73<0.85,所以2.5≤x <3, 由0.3×(x -2.5)=0.85-0.73, 所以x =2.9,所以估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.规律方法:(1)由于频率分布表、频率分布直方图丢失了样本的原始数据,以此求得数字特征都是样本数字特征的估计值.(2)可用样本的分布估计总体的分布. ┃┃对点训练__■3.某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层随机抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图所示的频率分布直方图:(1)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (2)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[解析] (1)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5. 所以总体中分数在区间[40,50)内的人数估计为400×5100=20.(2)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60,女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层随机抽样原理,总体中男生和女生人数的比例估计为3∶2.易错警示┃┃典例剖析__■典例4 在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如表所示:成绩/m 1.50 1.60 1.65 1.70 1.75 1.80 1.85 1.90 人数23234111[错解] 根据以上数据可得众数为1.75,中位数为1.70+1.752=1.725,平均数为1.69.[辨析] 所求数据要注意单位问题,另外中位数计算错误.[正解] 在17个数据中,1.75出现了4次,出现的次数最多,即这组数据的众数是1.75 m .表中的17个数据可看成是按从小到大的顺序排列的,其中第9个数据1.70是最中间的一个数据,即这组数据的中位数是 1.70 m ;这组数据的平均数是x -=117(1.50×2+1.60×3+…+1.90×1)=28.7517≈1.69(m).故17名运动员成绩的众数、中位数、平均数依次为1.75 m,1.70 m,1.69 m .。
高中必修二数学教案《用样本估计总体》教材分析义务教育阶段,学生学习了统计内容,对数据统计全过程有所体验。
高中阶段要求进一步培养学生的随机思想,发展学生的统计观念。
其中包括:统计意识、统计方法及对统计结果的正确认识。
本节课《用样本估计总体》是抽样方法及数据的数字特征内容后的又一重要内容,通过本节课的学习,学生进一步掌握了对样本数据处理的重要方法之一——画频率分布直方图,以及用样本估计总体的思想,同时为学生在后续学习统计案例和应用统计知识解决实际问题打下良好的基础。
学情分析学生在初中就知道了分布的初步概念,在前面也刚学习过概率及抽样的相关知识,对用样本估计总体有一定的认识,对用表和图来反映知识有很强的意识,具有一定的作图能力和较为周全的分析问题能力,而学生的理解能力不足,发现问题能力上可能很难满足本节课的要求。
但学生对新知识兴趣高,肯下功夫,思维活跃,会为本节课的顺利推进提供一定的保障。
教学目标1、通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。
2、进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。
教学重点用样本的数字特征估计总体的数字特征、通过频率分布或频率分布直方图对数据作出总体估计。
教学难点通过频率分布或频率分布直方图,对数据作出总体估计。
教学方法讲授法、讨论法、练习法教学过程一、情境导学以下是某学校高一年级98位学生的身高(单位:cm);已知这组数的总体平均数为163.5,总体方差为56.3。
用简单随机抽样的方法,从总体中抽取容量为10的样本3次,分别计算样本平均数与样本方差,并与总体对应的值进行比较。
二、学习新知1、用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。
特别地,样本平均值(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。
人教B版(2019)高中数学必修第二册课程目录与教学计划表教材课本目录是一本书的纲领,是教与学的路线图。
不管是做教学计划、实施教学活动,还是做学习计划、复习安排、工作总结,都离不开目录。
目录是一本书的知识框架,要做到心中有书、胸有成竹,就从目录开始吧!课程目录教学计划、进度、课时安排第四章指数函数、对数函数与幂函数4.1指数与指数函数4.1.1 实数指数幂及其运算4.1.2 指数函数的性质与图像本节综合与测试4.2对数与对数函数4.2.1对数运算4.2.2对数运算法则4.2.3对数函数的性质与图像本节综合与测试4.3指数函数与对数函数的关系4.4幂函数4.5增长速度的比较4.6函数的应用(二)4.7数学建模活动:生长规律的描述本章综合与测试第五章统计与概率5.1统计5.1.1 数据的收集5.1.2 数据的数字特征5.1.3 数据的直观表示5.1.4用样本估计总体本节综合与测试5.2数学探究活动:由编号样本估计总数及其模拟5.3概率5.3.1样本空间与事件5.3.2事件之间的关系与运算5.3.3古典概型5.3.4频率与概率5.3.5随机事件的独立性本节综合与测试5.4统计与概率的应用本章综合与测试第六章平面向量初步6.1平面向量及其线性运算6.1.1 向量的概念6.1.2向量的加法6.1.3向量的减法6.1.4 数乘向量6.1.5向量的线性运算本节综合与测试6.2向量基本定理与向量的坐标6.2.1 向量基本定理6.2.2 直线上向量的坐标及其运算6.2.3平面向量的坐标及其运算本节综合与测试6.3平面向量线性运算的应用本章综合与测试本册综合。
《用样本预计整体》教课设计(一)本课目标1.会用样本去预计整体.2.再次领会样本预计整体的合理性.3.经过活动让学生知道不同的样本可能对整体给出不同的预计值是正常现象.(二)教课流程1.情境导入序言:人类对环境保护愈来愈重视,它直接影响着地球人类的生计,电视中一些大城市天气预告都预报空气质量状况,此刻电脑查问出北京2002 年空气污介入数和空气质量状况(媒体出示).2.合作研究(1)整体感知从学生所熟知的城市空气污介入数下手,让学生亲身利用随机抽样选用出来的样本去预计整体,再和整体的有关特点量比较,让学生进一步明确抽样检查的合理性.并利用活动内容再次让学生领会到不同的样本可能对整体给出不同的预计值,但在某一范围内这是同意的.(2)四边互动互动 1师:此刻来用样本预计北京整年的均匀污介入数和空气质量,那么如何选用样本?生:利用简单的随机抽样方法.师:样本选多少天?生 1:10 天.生 2:不可以,样本容量太小,选200 天.生 3:太多,不方便计算,选60 天.师:我们知道样本容量太小,预计不精准,容量太大,计算不方便,此刻用电脑随机抽样30 天,记录在黑板上.明确如何选用样本是能较正确预计整体的重要前提.互动 2师:算出均匀污介入数,并画出对于空气质量级别直方图.生:计算、沟通、画图.师:(出示整年 365?天均匀空气污介入数及空气质量级别直方图)与整体比较,样本能否有差别?差别大不大?生:有差别,差别不大.明确这说明用样本去预计整体是靠谱的、合理的.互动 3师:你能不可以找出一个更能精准地预计整体的样本.生:能,只需将样本容量增添.师:对,样本容量越大,预计越精准,利用课余时间,选用一个容量大于 30 的样本研究它对整体的预计能否精准.明确跟着样本容量的增添由样本获得的均匀值、方差常常会更靠近整体均匀数.互动 4师:阅读教材活动内容.师:从文中香烟浸出液显示对绿豆、赤豆的抽芽有显然的影响,有如何的影响?生:香烟浸出液浓度越大,对抽芽的影响越大.师:若重复此实验,实验数据与文中一致吗?生:不必定同样,由于豆子抽芽还受许很多多要素的影响,如温度、天气等.师:对!若以100 粒种子的样本,它的抽芽率与以50?粒种子为样本的抽芽率能否同样?生:不同样.师:能否是同样,同学们能够利用业余时间做一做,比一比,也能够采用其余种子.明确生活中很多现象都能够用样本去预计整体的方法去研究,它是研究现实世界的重要思想方法.互动 5师:能够用简易方法计算均匀数吗?生:能够,它就是算术均匀数,不过运算较简易一点.师:对.一般来说,假如在 n 个数中, x1出现 f 1次, x2出现 f 2次,, x k出现 f k?次( f 1+f 2+ +f k=n)那么这n 个数的均匀数能够表示为x1 f1x2 f2x k f kx=n明确当某个整体或样本的数占有重复,计算均匀数时能够用以上公式能使计算过程简易.互动 6师:阅读思虑后,再分组沟通回答下列问题.生:思虑、沟通运算.生 1:正确.生 2:不正确,由于四个班级的人数不同样.师:本题如何求均匀数呢?161.223162.325160.825160.724生:232525 24师:对!那什么状况下用此公式呢?生:当四个班的人数同样时.明确从以上两个思虑题能够看出有多种方法求均匀数,要注意不同条件下能够有不同的求法.3.达标反应ma nb ( 1)某人打靶,有m次每次中靶 a 环,有 n 次中靶 b 环,则均匀每次中靶的环数是m n .( 2)某单位对办公用房的面积进行了统计,结果以下表:2面积( m)13.51414.820间数2662求均匀每间办公用房的面积.【答案】15.0(3)某养鸡厂今年年初孵出小鸡500 只,经过一段时间饲养后,从中抽取10 只称得质量以下(单位:千克)1.10 , 0.95 , 1.00 , 1.05 , 1.15 ,0.90 ,1.20 ,0.85 , 1.10 , 1.00 ,预计这家鸡厂鸡的总质量是多少?【答案】 457.54.学习小结不同的样本对整体预计是有差别的,若这个差别在某个预计值的范围内,都是正常预计.特别地当样本容量增添时,这类预计越精准.(二)拓展延长1.链接生活(1)采集你家 2003 年每个月的缴纳电费单,计算一年均匀每个月的电费;( 2)为了认识汽车在某一路口的某一时段的月流量,请你与同学合作,?检查此月10 天里这一时段的汽车流量,而后预计出这个月这一时段汽车的总流量.2.稳固练习(1)已知两组数 x1, x2,, x n和 y1, y2,, y n的均匀数分别是 x 和 y,求:① 3x1,3x2,, 3x n的均匀数;②x1+y1, x2+y2,, x n+y n的均匀数.【答案】( 1)① 3x② x+y(2)某生选修三门课程:信息技术每周 2 课时,数学每周 5 课时,语文每周 6 课时,期末考试成绩分别为85 分, 80 分, 75 分.①假如不考虑各科每周上课的课时数,计算该生三科的均匀成绩;②假如考虑各科每周上课课时数是多少,计算该生三科的均匀成绩;③两种计算方法所得结果能否同样?你以为哪一种计算结果更加合理.8078.51( 3)某养鱼场为了要预计鱼塘中鱼的总数目,第一次从中网出100 条, ?把这 100 条带有标记后所有放回.过 1~ 2 天,预计这群带标记的鱼已完整混淆到塘中,再从中网出200 条,假设在第二次网出的200条中,带有第一次做标记的20 条,这时能否能预计塘中有鱼多少条?【答案】能, 1000( 4)若是你想经过抽样检查认识多少初中生能够说出父亲母亲亲诞辰,?你以为如何抽样好?为何?【答案】略(四)板书设计用样本预计整体结论:均匀数:(学生练习)。
5.1.4用样本估计总体
学习目标
1.会用样本的数字特征估计总体的数字特征,提高数据运算的核心素养.
2.会用样本的分布估计总体的分布,提高数据分析的核心素养.
3.通过样本和总体的关系,体会部分和整体的辩证统一的关系,初步建立统计的概念,体会统计在生产和生活中的应用.
课堂练习
问题1:如何计算我班男生的平均体重?
问题2:已知我班男生平均体重为m,我班女生平均体重为n,如何估算我班学生平均体重?
问题3:某营养协会想调查某市所有高中学生的平均体重,你可以提供几种估算办法?
任务一阅读课本77~79页,完成下列问题.
(1)对“情景与问题”的98个数据,用简单随机抽样的方法进行抽样,样本为
169169163175163170164151155165
求样本的平均数和方差;
(2)样本的平均数和方差与总体的平均数和方差比较,你能得出什么结论?
(3)如果样本是用分层抽样的方法得到的,如何估计总体的数字特征?
在考察某中学学生身高时,如果用分层抽样的方法,得到男生身高平均数为170,方差为16,女生身高平均数为165,方差为25.
①如果没有其他信息,如何估计总体的平均数和方差?
②如果知道样本中男生20人,女生15人,如何估计总体的平均数和方差?
方法一:用男生或者女生身高的平均数与方差估计总体.
方法二:用每一次样本数字特征的算术平均数作为总体的估计,按照此种方法,估计总体的平均数为,方差为.
方法三:把各层数据集中在一起重新计算,按照此种方法,可以估计出总体的平均数
为,方差为.
以样本分两层为例,假设第一层有m个数,分别为x1,x2,…,x m,平均数为。
5.1.4 用样本估计总体[合格基础练] 一、选择题1.运动员参加体操比赛,当评委亮分后,往往是先去掉一个最高分和一个最低分,再计算剩下分数的平均值,这是为了( ) A .减少计算量 B .避免故障 C .剔除异常值D .活跃赛场气氛2.下列说法中,不正确的是( ) A .数据2,4,6,8的中位数是4,6 B .数据1,2,2,3,4,4的众数是2,4C .一组数据的平均数、众数、中位数有可能是同一个数据D .8个数据的平均数为5,另3个数据的平均数为7,则这11个数据的平均数是8×5+7×3113.一组样本数据a,3,5,7的平均数是b ,且a ,b 是方程x 2-5x +4=0的两根,则这个样本的方差是( ) A .3 B .4 C .5 D .64.下列说法中正确的个数为( )①数据的极差越小,样本数据分布越集中、稳定; ②数据的平均数越小,样本数据分布越集中、稳定; ③数据的标准差越小,样本数据分布越集中、稳定; ④数据的方差越小,样本数据分布越集中、稳定. A .1 B .2 C .3D .45.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其平均数和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为( )A.x -,s 2+1002 B.x -+100,s 2+1002 C.x -,s 2D.x -+100,s 2二、填空题6.用一组样本数据8,x,10,11,9来估计总体的标准差,若该组样本数据的平均数为10,则总体标准差s=________.7.在“争创美丽校园,争做文明学生”示范校评比活动中,10位评委给某校的评分情况如下表所示:评分/分80859095评委人数1252则这10位评委评分的平均数是________分.8.为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量得到频率分布直方图如图所示,则(1)这20名工人中一天生产该产品数量在[55,75)的人数是________.(2)这20名工人中一天生产该产品数量的中位数为________.(3)这20名工人中一天生产该产品数量的平均数为________.三、解答题9.某车间20名工人年龄数据如下表:(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,做出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.10.某地区100位居民的人均月用水量(单位:t)的分组及各组的频数如下:[0,0.5),4;[0.5,1),8;[1,1.5),15;[1.5,2),22;[2,2.5),25;[2.5,3),14;[3,3.5),6;[3.5,4),4;[4,4.5],2.(1)列出样本的频率分布表;(2)画出频率分布直方图,并根据直方图估计这组数据的平均数、中位数、众数;(3)当地政府制定了人均月用水量为3t 的标准,若超出标准加倍收费,当地政府说,85%以上的居民不超过这个标准,这个解释对吗?为什么?[等级过关练]1.x -是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,则下列各式正确的是( ) A.x -=a +b B.x -=60a +40b100C.x -=40a +60b100D.x -=a +b22.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )甲 乙A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差3.一组数据中的每一个数据都减去80,得一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是________、________.4.一定数量的汽车在通过某一段公路时的时速数据的频率分布直方图如图所示,时速在[50,70)内的汽车有160辆,则时速在[40,50)内的汽车有________辆.5.已知一个样本:30,29,26,24,25,27,26,22,24,25,26,28,25,21,23,25,27,29,25,28.(1)列出样本的频率分布表;(2)画出频率分布直方图和频率分布折线图;(3)根据频率分布直方图,估计总体出现在23~28内的频率是多少.【参考答案】[合格基础练] 一、选择题1.C [在体操比赛的评分中使用的是平均分.记分过程中采用“去掉一个最高分和一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或过低的分数,对选手的得分造成较大的影响,从而可以降低误差,使得比赛尽量公平.]2.A [数据2,4,6,8的中位数为4+62=5,A 错,B 、C 、D 都是正确的.]3.C [x 2-5x +4=0的两根为1,4,当a =1时,a,3,5,7的平均数是4;当a =4时,a,3,5,7的平均数不是1,所以a =1,b =4,s 2=5.]4.C [由数据的极差、标准差、方差的定义可知,它们都可以影响样本数据的分布和稳定性,而数据的平均数则与之无关,故②不正确,①③④正确.]5.D [法一:因为每个数据都加上100,所以平均数也增加100,而离散程度应保持不变,即方差不变.法二:由题意知x 1+x 2+…+x 10=10 x -,s 2=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2],则所求平均数y =110[(x 1+100)+(x 2+100)+…+(x 10+100)]=110(10x +10×100)=x +100, 所求方差为110[(x 1+100-y )2+(x 2+100-y )2+…+(x 10+100-y )2]=110[(x 1-x )2+(x 2-x )2+…+(x 10-x )2]=s 2.] 二、填空题6.2 [因为样本数据的平均数为10,由15(8+x +10+11+9)=10,得x =12,∴s 2=15(4+4+0+1+1)=2,∴s = 2.]7.89 [x -=80×1+85×2+90×5+95×210=89.]8.(1)13 (2)62.5 (3)64 [(1)在[55,75)的人数为(0.040×10+0.025×10)×20=13. (2)设中位数为x ,则0.2+(x -55)×0.04=0.5,x =62.5. (3)0.20×50+0.40×60+0.25×70+0.10×80+0.05×90=64.] 三、解答题9.[解] (1)这20名工人年龄的众数为:30,这20名工人年龄的极差为:40-19=21.(2)以十位数为茎,个位数为叶,做出这20名工人年龄的茎叶图如下:(3)这20名工人年龄的平均数为:(19+28×3+29×3+30×5+31×4+32×3+40)÷20=30;所以这20名工人年龄的方差为:120(30-19)2+320(30-28)2+320(30-29)2+520(30-30)2+420(30-31)2+320(30-32)2+120(30-40)2=12.6.10.[解](1)频率分布表分组频数频率[0,0.5)40.04[0.5,1)80.08[1,1.5)150.15[1.5,2)220.22[2,2.5)250.25[2.5,3)140.14[3,3.5)60.06[3.5,4)40.04[4,4.5]20.02合计100 1.00(2)频率分布直方图如图:众数:2.25;中位数:2.02;平均数:2.02.(3)人均月用水量在3t以上的居民所占的比例为6%+4%+2%=12%,即大约有12%的居民月用水量在3t 以上,88%的居民月用水量在3t 以下,因此政府的解释是正确的. [等级过关练]1. C [依题意可得100x -=x 1+x 2+…+x 100,40a =x 1+x 2+…+x 40,60b =x 41+x 42+…+x 100,故x -=40a +60b 100.]2.C [由条形统计图知:甲射靶5次的成绩分别为:4,5,6,7,8; 乙射靶5次的成绩分别为:5,5,5,6,9,所以x 甲=4+5+6+7+85=6;x 乙=5+5+5+6+95=6.所以x 甲=x乙.故A 不正确.甲的成绩的中位数为6,乙的成绩的中位数为5,故B 不正确.s 2甲=15[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=15×10=2,s 2乙=15[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=15×12=125,因为2<125,所以s 2甲<s 2乙.故C 正确.甲的成绩的极差为:8-4=4,乙的成绩的极差为:9-5=4,故D 不正确.故选C.]3.81.2 4.4 [设原数据的平均数为A ,方差为B ,则将原数据都减去80,得一组新数据的平均数为A -80,方差为B ,则A -80=1.2,∴A =81.2,B =4.4.] 4.20 [时速在[50,70)内的频率为0.03×10+0.05×10=0.8, ∴样本容量为160÷0.8=200,而时速在[40,50)内的频率为0.01×10=0.1, ∴时速在[40,50)的汽车有200×0.1=20(辆).] 5.[解] (1)计算极差:30-21=9. 决定组距和组数:取组距为2. ∵92=412,∴共分5组. 决定分点,使分点比数据多一位小数.并把第1小组的分点减小0.5,即分成如下5组: 20.5~22.5,22.5~24.5,24.5~26.5,26.5~28.5,28.5~30.5. 列出频率分布表如下:20.5~22.520.1022.5~24.530.1524.5~26.580.4026.5~28.540.2028.5~30.530.15合计2020 1.00(2)取各小长方形上的中点并用线段连接就构成了频率分布折线图,作出频率分布直方图.(3)由频率分布表和频率分布直方图观察得:样本值出现在23~28之间的频率为0.15+0.40+0.20=0.75,所以可以估计总体中出现在23~28之间的数的频率约为0.75.。