高中数学必修三第二章 2《用样本估计总体》学案+检测
- 格式:doc
- 大小:573.00 KB
- 文档页数:18
[教材习题研讨]P62探究方法点拨答案:(1)能.如:众数、中位数、平均数等,但它们各有特点,具体问题时应综合考虑.(2)可以.如:标准差、方差.P 63思考1正确理解每个数字特征的意义.答案:2.03这个中位数的估计值是由频率分布直方图中得来的,是在假设数据取值连续或均匀的基础上估计出的,但实际问题中数据的取值往往是不均匀的,出现偏差就不难理解.思考2体会“近似”“估计”答案:的确是这样.如:一个班级学生数学考试成绩的中位数不能反映班内“问题学生”与其他学生的具体差距.P64探究答案:我们必须问清所谓收入的平均水平具体指的是什么,若是中位数时,实际情况大体与我们从字面上的理解相符,若是平均数,则需要进一步了解企业各类岗位收入的离散情况,再作判断.P 64练习中位数对极端值不敏感.答案:(1)因为有的公路建设投资2200万元,属极端情况,大多数在20和100之间,此时平均数难以正确客观反映各项目投资的实际分布状况,不宜选用.而众数20万只说明投资20万的项目最多,不能反映其他项目的投资数额.中位数对极端值不敏感,能回避极端数额的影响,25万也较客观,故选中位数.(2)它的缺点是不能提供各项目投资金额的分布和离散情况.P 70练习深入问题,细致分析.1.答案:用科学计算器可得x甲=900,x乙=900,s甲=23.80<s乙=41.63,所以甲种水稻的产量稳定.2.答案:(1)用科学计算器可得x=496.86g,s=6.55g;(2)有14袋,所占百分比为66.7%.3.答案:(1)在上述数据中,最大值是50.1,最小值是1.5,极差是50.1-1.5=48.6.如果将组距定为7,那么由48.6÷7=6.94,组数为7,这个组数是适合的.于是组距为7,组数为7.根据本题中数据的特点,第1小组的起点可取为1.5,第1小组的终点可取为8.5,为了避免一个数据既是起点,又是终点从而造成重复计算,我们规定分组的区间是“左闭右开”的.这样,所得到的分组是[1.5,8.5),[8.5,15.5),…,[43.5,50.5).平均数、方差、标准差都可用科学计算器直接得出,但必须掌握笔算方法,因为有时科学计算器不许使用.列频率分布表如下表.(1)求最大值与最小值的差;(2)确定组距与组数;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.频率组距1.5,8.5)8.5,15.5)15.5,22.5)22.5,29.5)29.5,36.5)36.5,43.5)43.5,50.5)死亡率图2-2-13(2)x=19.25,s=12.50,如上图“1”位置即平均数是频率直方图的“重心”.死亡率在[6.75,31.75]内的国家有19个,所占比例63%,这说明该疾病死亡率地域性差异较大.P72习题2.2A组最后一行的合计不要遗忘,它可以及时检测你的过程有无错误.1.答案:(1)茎叶图如下.汞含量汞含量0.01.140096710482851.21.31.41.51.61.71.81.92.00.10.20.30.40.50.60.70.80.91.02.17494121522824881图2-2-14(2)分布比较分散,大多在0.8到1.6之间.(3)比1.00 ppm大.(4)x=1.08 ppm,s=0.45.(5)28条.2.答案:在数据中,最大值是385,最小值是25,极差是385-25=360.如果将组距定为40,那么由360÷40=9,组数为9,这个组数是适合的.于是组距为40,组数为9.根据本题中数据的特点,第1小组的起点可取为25,第1小组的终点可取为65,分组是[25,65),[65,105),…,[345,385].作茎叶图先确定中间数取数据的哪几位,填写数据时边读边填,无需按大小排列.列频率分布表如下表. 绘制频率分布直方图的一般步骤:(1)求最大值与最小值的差;(2)确定组距与组数;(3)决定分点;(4)列频率分布表;(5)绘制频率分布直方图.频率 分组[25,65)[65,105)[105,145)[145,185)[185,225)[225,265)[265,305)[305,345)[345,385]图2-2-15利用科学计算器得x=238,s=113.94.中位数、众数、平均数如上图所示.平均数是直方图的重心,众数在最高小矩形的中点处,中位数的左右矩形的面积应相等,它们虽都是常用统计量,但数学意义不同,各具特色.3.答案:可以查阅一下这所大学招生的其他信息,中位数是550分,只能说明有50%的学生高于此分数,仍有50%的录取学生的分数低于550分,该生分数520分仍有可能.该例反映了中位数对极端值不敏感这一特点.中位数对极端值不敏感.4.答案:四种说法都正确,一队的平均失球数少于二队,故第一句正确;二队标准差较小,说明技术水平稳定;一队平均失球数是1.5,而其标准差却是1.1,离散程度较大,由此可判断一队表现不稳定;平均失球数是2.1,标准差只有0.4,每场得失球数相差不多,可见二队的确很少不失球.5.答案:(1)难度较大.平均数是3.5万,共50人,所以他们的总收入是165万,而最高收入者一人收入100万,可推知其他人的收入不高.(2)不能.极差只能反映数据变化的最大范围,却不能体现数据的具体分布情况.(3)可以根据自身的情况作出选择,初聘人员的收入一般在较低档.(4)1.5万.均值受极端值影响很大.正确理解平均数、中位数、众数、方差、标准差等各统计量的意义.6.答案:利用科学计算器得x甲=1.5,s甲=1.28,x乙=1.2,s乙=0.87.因x甲=1.5>x乙=1.2,s甲=1.28<s乙=0.87,可知,机床乙先比较平均数,了解平均水平的差距情况,差距显著则可以结合实际情况做出判断选择.若差距不明显则需进一步比较方差或平均数.样本数的性能较好.7.答案:(1)x=199.75,s=95.26.(2)抽取一样本后得x=169.17,s=56.30.(3)再抽取一样本后得x=166.29,s=59.65.(4)获取一容量是10的样本得x=218.30,s=118.97.同一个总体,抽取的样本不同,平均数、标准差等都会发生改变,这会影响对总体的估计,对总体估计的偏差取决于样本的质量.实际应用时在许可的前提下,适当增加样本容量来提高样本代表性,减少估计偏差.B组据的选取应运用正确的样本抽取方法,如用抽签法,切忌挑选数据,使样本缺乏代表性,使所取样本失去研究价值.1.答案:(1)第一次好;(2)第一次;(3)G最强,E最弱;(4)运动员F、H最不一致,C、G、L、I看起来最一致.2.答案:略.了解总体的情况是检查样本的目的,因此要求样本应具有很好的代表性,选择恰当的抽样方法获取高质量的样本.样本的良好客观代表性,完全依赖于恰当的抽样方法.。
专题:用样本估计总体※知识要点1.频率分布直方图:横轴表示_____________,纵轴表示__________________,数据落在各小组内的频率用_____ ___________表示,所有长方形面积之和________. 2.作频率分布直方图的步骤(1)求极差(即一组数据中________与________的差);(2)决定________与________; (3)将数据________; (4)列________________; (5)画________________. 3.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的________,就得频率分布折线图.(2)总体密度曲线:随着__________的增加,作图时_________ 增加, 减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.4.茎叶图:即统计中还有一种被用来表示数据的图, 是指中间的一列数, 是从茎的旁边生长出来的数. 注:茎叶图一般用于表示两位有效数字的数据. 5.众数、中位数、平均数、标准差和方差(1)平均数:x -= ; (2)方差:s 2= ; 6.平均数与方差的重要结论:已知数据x 1,x 2,…,x n 的平均数为x -,方差为s 2,则:①x 1+a ,x 2+a ,…,x n +a 的平均数是 ,方差是 ; ②ax 1,ax 2,…,ax n 的平均数是 ,方差是 ; ③mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是 ,方差是 ;※题型讲练【例1】考察频率分布直方图 1.判断下列说法的正误:(1)在频率分布直方图中,小矩形的高表示频率( ) (2)频率分布直方图中各个长方形的面积之和为1( )2.为组织好“市九运会”,组委会征集了800名志愿者,现对他们的年龄抽样统计后,得到如图所示的频率分布直方图,但是年龄在[25,30)内的数据不慎丢失,依据此图可得:(1)年龄在[25,30)内对应小长方形的高度为________;(2)这800名志愿者中年龄在[25,35)内的人数为________; (3)分别指出改组数据中的众数、中位数和平均数.变式训练1:1.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在[5,9)内的频率和频数分别为____________. 2.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.下表是年龄的频率分布表.(1)求正整数a ,b ,N 的值;(2)该组数据的中位数是 ,平均年龄是 ; (3)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?【例2】考察茎叶图和统计指标 1.判断下列说法的正误:(1)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次( ) (2)茎叶图只适用数据为两位数字( )(3)频率分布直方图中最高长方形底边中点横坐标是众数( ) (4)频率分布直方图中,众数左边和右边的小长方形的面积和是相等的( ) (5)平均数、众数与中位数都描述了一组数据的集中趋势( ) (6)一组数据的方差越大,说明这组数据的波动越大( ) 2.随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm ),获得身高数据的茎叶图如图. (1)分别指出甲班的众数和乙班的中位数; (2)根据茎叶图通过计算判断哪个班的平均身高较高;(3)计算甲班的样本方差;(4)现从乙班这10名同学中随机抽取两名身高不低于173 cm 的同学,求身高为176 cm 的同学被抽中的概率.变式训练2:1.甲、乙两名射击运动员参加某大型运动会的预选赛,他们2.若一组样本数据2,3,7,8,a 的平均数为5,则该组数据的方差s 2=________.3.某班甲、乙两学生的高考备考成绩如下:甲:512 554 528 549 536 556 534 541 522 538 乙:515 558 521 543 532 559 536 548 527 531(1)用茎叶图表示两学生的成绩;(2)分别求两学生成绩的中位数和平均分.※课后练习1.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为( ) A .32B .0.2C .40D .0.252.某校100名学生期中考试数学成绩的频率分布直方图如下左图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 53.某班的全体学生参加英语测试,成绩的频率分布直方图如上右图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( ) A .45 B .50 C .55 D .60 4.如图是某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为( )A .85,84B .84,85C .86,84D .84,86 5.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其均值和方差分别为x -和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A .x -,s 2+1002 B .x -+100,s 2+1002 C .x -,s 2 D .x -+100,s 2 6.某中学高三年级从甲、乙两个班级各选出7名学生参加数学竞赛,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x +y 的值为________. 7.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a =__________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为____.8.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:从改四个人中选一人参加比赛,最佳人选是 。
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试C卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)某一网络公司为了调查一住宅区连接互联网情况,从该住宅区28000住户中随机抽取了210户进行调查,调查数据如右图,则估计该住宅区已接入互联网的住户数是()A . 90B . 1200C . 12000D . 140002. (2分)甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,,分别表示甲、乙两名运动员这项测试成绩的平均数,,分别表示甲、乙两名运动员这项测试成绩的标准差,则有()A .B .C .D .3. (2分)数据﹣5,3,2,﹣3,3的平均数,众数,中位数,方差分别是()A . 0,3,3,11.2B . 0,3,2,56C . 0,3,2,11.2D . 0,2,3,564. (2分)某比赛中,七位评委为某个节目打出的分数如右图茎叶统计图所示,去掉一个最高分和一个最低分后所剩数据的平均数和方差分别是()A . 84,4.84B . 84, 16C . 85, 1.6D . 85, 45. (2分)甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差如下表所示:甲乙丙丁平均环数8.48.78.78.3方差s2 3.6 3.6 2.2 5.4从这四个人中选择一人参加奥运会射击项目比赛,最佳人选是()A . 甲B . 乙C . 丙D . 丁6. (2分)(2020·鹤壁模拟) 中国铁路总公司相关负责人表示,到2018年底,全国铁路营业里程达到13.1万公里,其中高铁营业里程2.9万公里,超过世界高铁总里程的三分之二,下图是2014年到2018年铁路和高铁运营里程(单位:万公里)的折线图,以下结论不正确的是()A . 每相邻两年相比较,2014年到2015年铁路运营里程增加最显著B . 从2014年到2018年这5年,高铁运营里程与年价正相关C . 2018年高铁运营里程比2014年高铁运营里程增长80%以上D . 从2014年到2018年这5年,高铁运营里程数依次成等差数列7. (2分)(2017·海淀模拟) 北京市2016年12个月的PM2.5平均浓度指数如图所示.由图判断,四个季度中PM2.5的平均浓度指数方差最小的是()A . 第一季度C . 第三季度D . 第四季度8. (2分)右图实线是函数y=f(x)(0≤x≤2a)的图象,它关于点A(a,a)对称.如果它是一条总体密度曲线,则正数a的值为()A .B . 1C . 2D .9. (2分)对“小康县”的经济评价标准:①年人均收入不小于7000元;②年人均食品支出不大于收入的35%.某县有40万人,调查数据如下:年人均收入/元0200040006000800010 00012 00016 000人数/万人63556753则该县()B . 达到标准①,未达到标准②,不是小康县C . 达到标准②,未达到标准①,不是小康县D . 两个标准都未达到,不是小康县10. (2分)某人将一枚硬币连掷了10次,正面朝上出现了6次,若用A表示正面朝上这一事件,则A的频率为()A .B .C . 6D . 接近11. (2分) (2017高一下·中山期末) 从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为,,中位数分别为m甲, m乙,则()A . ,m甲>m乙B . ,m甲<m乙C . ,m甲>m乙D . ,m甲<m乙12. (2分)给出下列五个命题:①某班级一共有52名学生,现将该班学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知7号、33号、46号同学在样本中,那么样本中另一位同学的编号为23;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③一组数据为a,0,1,2,3,若该组数据的平均值为1,则样本标准差为2;④根据具有线性相关关系的两个变量的统计数据所得的回归直线方程为y=a+bx中,则a=1;⑤如图是根据抽样检测后得出的产品样本净重(单位:克)数据绘制的频率分布直方图,已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是90.其中真命题为()A . ①②④B . ②④⑤C . ②③④D . ③④⑤13. (2分)如图1是2013年某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为()A . 、B . 、C . 、D . 、14. (2分) (2019高三上·双鸭山月考) 为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为200的调查样本,其中城镇户籍与农村户籍各100人;男性120人,女性80人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A . 是否倾向选择生育二胎与户籍有关B . 是否倾向选择生育二胎与性别有关C . 倾向选择生育二胎的人群中,男性人数与女性人数相同D . 倾向选择不生育二胎的人群中,农村户籍人数少于城镇户籍人数15. (2分) (2019高二上·齐齐哈尔期末) 将甲、乙两名同学5次物理测验的成绩用茎叶图表示如图,若甲、乙两人成绩的中位数分别为,则下列说法正确的是()A . ;乙比甲成绩稳定B . ;甲比乙成绩稳定C . ;乙比甲成绩稳定D . ;甲比乙成绩稳定二、填空题 (共5题;共6分)16. (1分) (2017高二上·伊春月考) 数据,,…,平均数为6,标准差为2,则数据,,…,的方差为________.17. (1分)从某项综合能力测试中抽取100人的成绩,统计如下表,则这100人成绩的方差为________分数54321人数201030301018. (1分) (2016高二上·枣阳期中) 如图是某赛季甲乙两名篮球运动员每场比赛得分的茎叶图,则甲乙两人比赛得分的中位数之和是________19. (1分)统计的基本思想是:________ .20. (2分) (2016高一下·南市期末) 某公司13个部门接受的快递的数量如茎叶图所示,则这13个部门接收的快递的数量的中位数为________.三、解答题 (共5题;共25分)21. (5分)(2018·河北模拟) 某市政府为了引导居民合理用水,决定全面实施阶梯水价,阶梯水价原则上以住宅(一套住宅为一户)的月用水量为基准定价:若用水量不超过12吨时,按4元/吨计算水费;若用水量超过12吨且不超过14吨时,超过12吨部分按6.60元/吨计算水费;若用水量超过14吨时,超过14吨部分按7.8元/吨计算水费.为了了解全市居民月用水量的分布情况,通过抽样,获得了100户居民的月用水量(单位:吨),将数据按照分成8组,制成了如图1所示的频率分布直方图.(Ⅰ)假设用抽到的100户居民月用水量作为样本估计全市的居民用水情况.(ⅰ)现从全市居民中依次随机抽取5户,求这5户居民恰好3户居民的月用水量都超过12吨的概率;(ⅱ)试估计全市居民用水价格的期望(精确到0.01);(Ⅱ)如图2是该市居民李某2016年1~6月份的月用水费(元)与月份的散点图,其拟合的线性回归方程是.若李某2016年1~7月份水费总支出为294.6元,试估计李某7月份的用水吨数.22. (5分) (2018高一下·渭南期末) 从全校参加数学竞赛的学生的试卷中抽取一个样本,考察竞赛的成绩分布情况,将样本分成5组,绘成频率分布直方图,图中从左到右各小组的小长方形的高之比为1:3:6:4:2,最右边一组频数是6,请结合直方图提供的信息,解答下列问题:(1)样本的容量是多少?(2)列出频率分布表;(3)估计这次竞赛中,成绩高于60分的学生占总人数的百分比;(4)成绩落在哪个范围内的人数最多?并求出该小组的频数,频率.23. (5分) (2017高二下·黑龙江期末) “微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(1)若采用样本估计总体的方式,试估计小王的所有微信好友中每日走路步数超过5000步的概率;(2)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?附:,0.100.050.0250.0102.7063.8415.0246.63524. (5分)“中国人均读书4.3本(包括网络文学和教科书),比韩国的11本、法国的20本、日本的40本、犹太人的64本少得多,是世界上人均读书最少的国家.”这个论断被各种媒体反复引用.出现这样的统计结果无疑是令人尴尬的,而且和其他国家相比,我国国民的阅读量如此之低,也和我国是传统的文明古国、礼仪之邦的地位不相符.某小区为了提高小区内人员的读书兴趣,特举办读书活动,准备进一定量的书籍丰富小区图书站,由于不同年龄段需看不同类型的书籍,为了合理配备资源,现对小区内看书人员进行年龄调查,随机抽取了一天名读书者进行调查,将他们的年龄分成6段:,,,,,后得到如图所示的频率分布直方图.问:(1)估计在40名读书者中年龄分布在的人数;(2)求40名读书者年龄的平均数和中位数;(3)若从年龄在的读书者中任取2名,求这两名读书者年龄在的人数的分布列及数学期望.25. (5分) (2018高二下·衡阳期末) 某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)水量频数13249265使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)参考答案一、单选题 (共15题;共30分)1-1、2-1、3-1、4-1、5-1、6-1、7-1、8-1、9-1、10-1、11-1、12-1、13-1、14-1、15-1、二、填空题 (共5题;共6分)16-1、17-1、18-1、19-1、20-1、三、解答题 (共5题;共25分)21-1、22-1、22-2、22-3、22-4、23-1、23-2、24-1、24-2、24-3、25-1、25-2、25-3、。
用样本估计总体导学案2(高三数学)知识梳理:(必修3教材65-83)1.作频率分布直方图的步骤:(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图频率=频率。
注:频率分布直方图中小正方形的面积=组距×组距2.频率分布折线图和总体密度曲线折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.用茎叶图刻画数据的两个优点,(1)所有数据都可以从数据中得到;(2)茎叶图便于记录和表示,能够展示数据的分布情况,但当样本数据较多或数据较大时,茎叶图的效果就不是很好了.4.平均数、众数、中位数、标准差和方差(1)、平均数:平均数是用来表示数据的平均水平。
一般用来表示,计算公式:(2)、众数:一组数据中出现次数最多的数。
(3)、中位数:将数据从小到大的顺序排列,若有奇数个数,则最中间的数是中位数。
若有偶数个数,则中间两个数的平均数是中位数。
(4)、标准差:是样本数据到平均数的一种平均距离,用来刻画数据的分散程度,一般用s来表示,计算公式:,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。
(5)方差:方差是标准差的平方,它也可以用来刻画数据的分散程度,计算公式:。
5.有样本频率分布估计总体分布通常分为两种情况:(1)、当总体中的个体取不同值很少时,其频率分布表由所取样本的不同值及其相应频率表示,就是相应的条形图;(2)、当总体中的个体不同值很多时,就用频率分布直方图来表示相应的样本的频率分布。
6、利用频率分布直方图来估计众数、中位数、平均数在频率分布直方图中,众数的估计值......是其中最高矩形底边中点的横坐标;中.位数...的估计值等于频率分布直方图中每..的左边和右边的直方图面积相等;平均数个小矩形的面积乘以小矩形底边中点的横坐标之和。
高中数学人教新课标A版必修3 第二章统计 2.2.2用样本的数字特征估计总体的数字特征同步测试共 14 题一、选择题1、对于数据3,3,2,3,6,3,10,3,6,3,2.①这组数据的众数是3;②这组数据的众数与中位数的数值不相等;③这组数据的中位数与平均数的数值相等;④这组数据的平均数与众数的值相等.其中正确的结论的个数( )A.1B.2C.3D.42、若样本数据x1, x2, …,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为( )A.8B.15C.16D.323、为了稳定市场,确保农民增收,某农产品7个月份的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前6个月的市场收购价格,则前7个月该产品的市场收购价格的方差为( )月份123456价格(元/担)687867717270A. B.C.11D.4、某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是( )A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班男生成绩的平均数小于该班女生成绩的平均数5、某校高一、高二年级各有7个班参加歌咏比赛,他们的得分的茎叶图如图所示,对这组数据分析正确的是( )A.高一的中位数大,高二的平均数大B.高一的平均数大,高二的中位数大C.高一的平均数、中位数都大D.高二的平均数、中位数都大6、某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图所示,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数大约是( )A.31.6岁B.32.6岁C.33.6岁D.36.6岁7、将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x表示,则7个剩余分数的方差为( )A. B.C.36D.8、为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e,众数为m O,平均值为,则( )A.m e=m O=B.m e=m O<C.m e<m O<D.m O<m e<二、填空题9、某学员在一次射击测试中射靶6次,命中环数如下:9,5,8,4,6,10,则:平均命中环数为________;命中环数的方差为________.10、由正整数组成的一组数据x1, x2, x3, x4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列)11、如图是一次考试结果的频数分布直方图,根据该图可估计,这次考试的平均分数为________.三、解答题12、为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h).试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.93.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.9 0.8 0.9 2.4 1.2 2.6 1.3 1.41.6 0.5 1.8 0.62.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据绘制茎叶图,从茎叶图看,哪种药的疗效更好?13、某校初三(1)班、(2)班各有49名学生,两班在一次数学测验中的成绩统计如下表:(1)请你对下面的一段话给予简要分析:高一(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分为79分,得70分的人最多,我得了85分,在班里算上上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出建议.14、对某校高三年级学生参加社区服务次数进行统计,随机抽取M名学生作为样本,得到这M名学生参加社区服务的次数,根据此数据作出了频数与频率的统计表和频率分布直方图.分组频数频率[10,15)100.25[15,20)24n[20,25)m p[25,30]20.05合计M1(1)求出表中M,p及图中a的值;(2)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15)内的人数;(3)估计这次学生参加社区服务人数的众数、中位数以及平均数.参考答案一、选择题1、【答案】A【解析】【解答】在这11个数据中,数据3出现了6次,概率最高,故众数是3;将这11个数据按从小到大排列得2,2,3,3,3,3,3,3,6,6,10,中间的数据是3,故中位数是3;平均数 .故选A.【分析】根据众数、中位数、平均数的性质可以得出。
数学(高二上)导学案必修三第二章第二节课题:用样本估计总体二、合作探究归纳展示任务1 标准差问题平均数向我们提供了样本数据的重要信息,但是平均数有时也会使我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因此,只有平均数还难以概括样本数据的实际状态.如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:7879549107 4乙:9578768677如果你是教练,你应当如何对这次射击作出评价?思考1甲、乙两人本次射击的平均成绩分别为多少环?答经计算得:x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.思考2观察下图中两人成绩的频率分布条形图,你能说明其水平差异在哪里吗?答直观上看,还是有差异的.如:甲成绩比较分散,乙成绩相对集中.思考3对于甲乙的射击成绩除了画出频率分布条形图比较外,还有没有其它方法来说明两组数据的分散程度?答还经常用甲乙的极差与平均数一起比较说明数据的分散程度.甲的环数极差=10-4=6,乙的环数极差=9-5=4.它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.思考4 如何用数字去刻画这种分散程度呢?答 考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s 表示 . 思考5 所谓“平均距离”,其含义如何理解?答 假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.x i 到x 的距离是|x i -x |(i =1,2,…,n ).于是,样本数据是x 1,x 2,…,x n 到x 的“平均距离”是S =|x 1-x |+|x 2-x |+…+|x n -x |n .由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 思考6 标准差的取值范围如何?若s =0表示怎样的意义?答 从标准差的定义可以看出,标准差s ≥0,当s =0时,意味着所有的样本数据等于样本平均数. 任务2 方差思考1 方差的概念是怎样定义的?答 人们有时用标准差的平方s 2—方差来代替标准差,作为测量样本数据分散程度的工具,方差:s 2=1n ·[(x 1-x )2+(x 2-x )2+…+(x n -x )2].思考2 对于一个容量为2的样本:x 1,x 2(x 1<x 2),它们的平均数和标准差如果分别用x 和a 表示,那么x 和a 分别等于什么? 答 x =12(x 1+x 2),a =12(x 2-x 1).思考3 在数轴上,x 和a 有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?答 x 和a 的几何意义如下图所示.说明了标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围.思考4 现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?答 通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.例1求出问题中的甲乙两运动员射击成绩的标准差,并说明他们的成绩谁比较稳定?解x甲=110(7+8+7+9+5+4+9+10+7+4)=7,同理可得x乙=7.根据标准差的公式,s甲=110[(7-7)2+(8-7)2+…+(4-7)2]=2;同理可得s乙≈1.095.所以s甲>s乙.因此说明甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.跟踪训练1如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.答案 6.8任务3标准差及方差的应用例2画出下列四组样本数据的条形图,说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.解四组样本数据的条形图如下:四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.跟踪训练2从甲、乙两种玉米中各抽10株,分别测得它们的株高如下:甲:25、41、40、37、22、14、19、39、21、42;乙:27、16、44、27、44、16、40、40、16、40;(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解(1)x甲=110(25+41+40+37+22+14+19+39+21+42)=30,x乙=110(27+16+44+27+44+16+40+40+16+40)=31,x甲<x乙.即乙种玉米的苗长得高.(2)由方差公式得:s2甲=110[(25-30)2+(41-30)2+…+(42-30)2]=104.2,同理s2乙=128.8,∴s2甲<s2乙.即甲种玉米的苗长得齐.答乙种玉米苗长得高,甲种玉米苗长得齐.例3甲、乙两人同时生产内径为25.40 mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.44的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.四、作业布置 1、基础知识:1.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 答案 B2.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( )A.1169B.367C .36D.677答案 B3.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是x =2,方差是13,那么另一组数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数和方差分别为( )A .2,13B .2,1C .4,13D .4,3答案 D4.某学员在一次射击测试中射靶10次,命中环数如下:7,8,7,9,5,4,9,10,7,4.则:(1)平均命中环数为________; (2)命中环数的标准差为________.。
高中数学学习材料马鸣风萧萧*整理制作2.2 用样本估计总体一、选择题1、为了解一批数据在各个范围内所占的比例大小,将这批数据分组,落在各个小组里的数据个数叫做 ( )A 、频数B 、样本容量C 、频率D 、频数累计2、在频率分布直方图中,各个小长方形的面积表示 ( ) A 、落在相应各组的数据的频数 B 、相应各组的频率 C 、该样本所分成的组数 D 、该样本的容量3、为考察某种皮鞋的各种尺码的销售情况,以某天销售40双皮鞋为一个样本,把它按尺码分成5组,第3组的频率为0、25,第1,2,4组的频率分别为6,7,9,若第5组表示的是40—42码的皮鞋,则售出的200双皮鞋中含40—42码的皮鞋为( )A 、50B 、40C 、20D 、304、从一群学生中收取一个一定容量的样本对他们的学习成绩进行分析,前三组是不超过80分的人,其频数之和为20人,其频率之和(又称累积频率)为0、4,则所抽取的样本的容量是 ( )A 、100B 、80C 、40D 、505、一个容量为20的数据样本,分组后,组距与频数如下:(10,20]2个,(20,30]3个,(30,40]4个,(40,50]5个,(50,60]4个,(60,70 ]2个,则样本在区间(-∞,50]上的频率是 ( )A 、5%B 、25%C 、50%D 、70% 6、在10人中,有4个学生,2个干部,3个工人,1个农民,数52是学生占总体的( )A、频数B、概率C、频率D、累积频率7、列样本频率分布表时,决定组数的正确方法是()A、任意确定B、一般分为5—12组C、由组距和组数决定D、根据经验法则,灵活掌握8、下列叙述中正确的是()A、从频率分布表可以看出样本数据对于平均数的波动大小B、频数是指落在各个小组内的数据C、每小组的频数与样本容量之比是这个小组的频率D、组数是样本平均数除以组距9、频率分布直方图中,小长方形的面积等于()A、组距B、频率C、组数D、频数10、一个容量为n的样本,分成若干组,已知某组的频数和频率分别为40,0、125,则n 的值为()A、640B、320C、240D、16011、有一个数据为50的样本数据分组,以及各组的频数如下,根据累积频率分布,估计小于30的数据大约占多少()[12、5,15、5),3;[15、5,18、5),8;[18、5,21、5),9;[21、5,24、5),11;[24、5,27、5),10;[30、5,33、5),4A、10%B、92%C、5%D、30%二、填空题12、将一批数据分成5组列出频率分布表,其中第1组的频率是0、1,第4组与第5组的频率之和是0、3,那么第2组与第3组的频率之和是。
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试A卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)1. (2分)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93。
下列说法一定正确的是()A . 这种抽样方法是一种分层抽样。
B . 这种抽样方法是一种系统抽样。
C . 这五名男生成绩的方差大于这五名女生成绩的方差。
D . 该班级男生成绩的平均数小于该班女生成绩的平均数。
3. (2分)某设计运动员在一次测试中射击10次,其测试成绩如表:则该运动员测试成绩的中位数为()A . 2B . 8C . 8.5D . 94. (2分) (2018高二上·哈尔滨月考) 一组数据中的每一个数据都乘以2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是()A . 40.6,1.1B . 48.8,4.4C . 81.2,44.4D . 78.8,75.65. (2分) (2018高一下·枣庄期末) 已知数据,,,…,是枣强县普通职工(,)个人的年收入,设个数据的中位数为,平均数为,方差为,如果再加上世界首富的年收入,则这个数据中,下列说法正确的是()A . 年收入平均数大大增加,中位数一定变大,方差可能不变B . 年收入平均数大大增加,中位数可能不变,方差变大C . 年收入平均数大大增加,中位数可能不变,方差也不变D . 年收入平均数可能不变,中位数可能不变,方差可能不变6. (2分)(2020·鹤壁模拟) 中国铁路总公司相关负责人表示,到2018年底,全国铁路营业里程达到13.1万公里,其中高铁营业里程2.9万公里,超过世界高铁总里程的三分之二,下图是2014年到2018年铁路和高铁运营里程(单位:万公里)的折线图,以下结论不正确的是()A . 每相邻两年相比较,2014年到2015年铁路运营里程增加最显著B . 从2014年到2018年这5年,高铁运营里程与年价正相关C . 2018年高铁运营里程比2014年高铁运营里程增长80%以上D . 从2014年到2018年这5年,高铁运营里程数依次成等差数列7. (2分) (2016高一下·永年期末) 甲、乙两名选手参加歌手大赛时,5名评委打的分数,用茎叶图表示(如图)s1 , s2分别表示甲、乙选手分数的标准差,则s1与s2的关系是(填“>”、“<”或“=”)()A . s1>s2B . s1=s2C . s1<s2D . 不确定8. (2分)某高校进行自主招生,先从报名者筛选出400人参加考试,再按笔试成绩择优选出100人参加面试.现随机抽取24名笔试者的成绩,如下表所示:分数段[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人数234591据此估计参加面试的分数线大约是()A . 75B . 80C . 85D . 909. (2分)小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为()A . 30%B . 10%C . 3%D . 不能确定11. (2分)由正整数组成的一组数据x1 , x2 , x3 , x4 ,其平均数和中位数都是2,且标准差等于1,则这组数据的立方和为()A . 70B . 60C . 50D . 5612. (2分) (2019高三上·上海月考) 演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A . 中位数B . 平均数C . 方差D . 极差13. (2分) (2016高二上·昌吉期中) 甲、乙两名运动员的5次测试成绩如下图所示:甲茎乙5 716 88 8 22 3 6 7设s1 , s2分别表示甲、乙两名运动员测试成绩的标准差,分别表示甲、乙两名运动员测试成绩的平均数,则有()A . ,s1<s2B . ,s1>s2C . ,s1>s2D . ,s1=s215. (2分)(2017·浦东模拟) 若样本平均数为,总体平均数为μ,则()A . =μB . ≈μC . μ是的估计值D . 是μ的估计值二、填空题 (共5题;共6分)17. (1分) (2018高一下·河南月考) 已知一组样本数据按从小到大的顺序排列为-1,0,4. ,这组数据的平均数与中位数均为5,则其方差为________.20. (2分)若样本数据x1 , x2 ,…,x10的平均数为8,则数据2x1﹣1,2x2﹣1,…,2x10﹣1的平均数为________三、解答题 (共5题;共25分)21. (5分)要分析学生初中升学考试的数学成绩对高一年级数学学习有什么影响,在高一年级学生中随机抽取10名学生,分析他们入学的数学成绩(x)和高一年级期末数学考试成绩(y)(如下表):编号12345678910x63674588817152995876y65785285928973985675(1)画出散点图;(2)判断入学成绩(x)与高一期末考试成绩(y)是否有线性相关关系;(3)如果x与y具有线性相关关系,求出回归直线方程;23. (5分) (2018高一下·商丘期末) 有关部门要了解甲型H1N1流感预防知识在学校的普及情况,命制了一份有10道题的问卷到各个学校做问卷调查。
江西省吉安市井冈山大学附中高中数学《样本估计总体的数字特征》导学案(一)新人教版必修3(一)问题提出1、为什么要用样本估计总体?2、怎样用样本估计总体?3、什么是频率分布?什么是总体分布?4、频率分布直方图的特征是什么?5、你能不能画出给定数据的频率分布折线图?讨论结果:1、2问题的回答见课本32页第一段。
3、频率分布是指一个样本数据在各个小范围所占比例的大小;一般用频率分布直方图来反映样本的频率分布。
总体分布是指总体中个体所占比例。
4、频率分布直方图的特征:(1)从频率分布直方图可以清楚地看出数据分布的总体趋势,(2)从频率分布直方图得不出原始数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了,(3)同样一组数据,如果组距不同,横轴,纵轴的单位不同,得到的图形和形状也会不同,不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。
5、连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图。
(二)讲案1895年,在伦敦有106块男性头盖骨被挖掘出土。
经考证,头盖骨的主人死于1665---1666年之间的大瘟疫。
人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:mm)146 141 139 140 145 141 142 131 142 140 144 140 138 139 141 137 141 132 140 140 141 143 134 146 134 142 133 149 140 140 143 149 136 141 143 143 141 138 136 138 144 136 145 143 137 142 146 140 148 140 140 139 139 144 138 146 153 148 152 143 140 141 145 148 139 136 141 140 139 158 135 132 148 142 144 137 153 148 144 138 150 148 138 145 145 142 143 143 148 141 145 141 (见课本)请大家思考:用什么统计图可以直观表示上述数据的分布状况?你能根据上述数据估计在1665----1666年之间英国男性头盖骨宽度的分布情况吗?思考:1)分析数据的基本方法是什么?(作图或用紧凑的表格来改变数据的排列方式)2)频率分布直方图绘制的步骤?3)频率分布折线图的绘制?4)频率分布直方图的纵坐标是什么?小长方形的面积表示什么?小长方形的面积之和是多少?5)当数据的样本量发生变化的时候,会对频数分布直方图有什么样的影响?用什么方法能减少样本容量对数据分布的影响?6)当样本容量不断增大时频率分布折线图会发生什么趋势变化?(三)练案1.已知样本:10,8,6,13,8,10,12,11,7,8,9,11,9,12,9,10,11,11,12,那么频率为0.2的范围是( )A.5.5-7.5 B 、7.5-9.5 C 、9.5-11.5 D 、11.5-13.52.一个容量为20的样本数据,分组后组距与频数如下:(]20,10,2; (]30,20,3;(]40,30,4;(]50,40,5;(]60,50,4;(]70,60,2,则样本在区间(]50,50-上的频率为( )A . 5%B .25%C .50%D .70%3.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b )是其中的一组,抽查出的个体在该组上的频率为m ,该组上的直方图的高为h ,则b a -=______.4.有100名学生,每人只能参加一个运动队,其中参加足球的有30人,参加篮球队的有27人,参加排球队的有23人,参加乒乓球队的有20人。
高中数学必修三学案第二章统计2 用样本估计总体【学习目标】1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.2.理解样本数据标准差的意义和作用,会计算数据标准差.3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.【新知梳理·夯实知识基础】1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图的优点茎叶图的优点是不但可以记录所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.注意:茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.4.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为–x ,则这组数据的标准差和方差分别是s =1n ⎣⎡⎦⎤(x 1-–x )2+(x 2-–x )2+…+(x n -–x )2 s 2=1n ⎣⎡⎦⎤(x 1-–x )2+(x 2-–x )2+…+(x n -–x )2[常用结论]1.频率分布直方图的3个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距. 2.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为—x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m —x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.[学用结合]1.(思考辨析)判断下列结论的正误.(正确的打“√”,错误的打“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势. ( )(2)一组数据的方差越大,说明这组数据越集中. ( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高. ()(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次. ()[答案](1)√(2)×(3)√(4)×2.(教材改编)一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.16B[设频数为n,则n32=0.25,∴n=32×14=8.]3.(教材改编)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5 B.91.5和92C.91和91.5 D.92和92A[∵这组数据由小到大排列为87,89,90,91,92,93,94,96,∴中位数是91+922=91.5,平均数—x=87+89+90+91+92+93+94+968=91.5.]4.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.48[由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).]5.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.0.1 [5个数的平均数—x =4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s 2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.]【题型探究·突破重点难点】题型一 茎叶图的应用1.某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为 ( )A .117B .118C .118.5D .119.5B [22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.]2.(2019·泉州质检)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n -m 的值是 ( )A .5B .6C .7D .8 B [由甲组学生成绩的平均数是88,可得70+80×3+90×3+(8+4+6+8+2+m +5)7=88,解得m =3.由乙组学生成绩的中位数是89,可得n =9,所以n -m =6,故选B.]【解题规律与方法】茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.题型二样本的数字特征及应用1.2018年2月20日,摩拜单车在济南推出“做文明骑士,周一摩拜单车免费骑”活动.为了解单车使用情况,记者随机抽取了五个投放区域,统计了半小时内被骑走的单车数量,绘制了如图所示的茎叶图,则该组数据的方差为()A.9 B.4 C.3 D.2B[由茎叶图得该组数据的平均数—x=15(87+89+90+91+93)=90.∴方差为15[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4.]2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差C[甲的平均数是4+5+6+7+85=6,中位数是6,极差是4,方差是(-2)2+(-1)2+02+12+225=2;乙的平均数是5+5+5+6+95=6,中位数是5,极差是4,方差是(-1)2+(-1)2+(-1)2+02+325=125,故选C.] 3.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲 10 8 9 9 9乙 10 10 7 9 9如果甲、乙两人中只有________.甲 [—x 甲=—x 乙=9,s 2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定.]【解题规律与方法】(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述;②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)在计算平均数、方差时可利用平均数、方差的有关结论.题型三 频率分布直方图及应用►考法1 求样本的频率、频数【例1】 某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140D[由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.故选D.]►考法2频率分布直方图与样本的数字特征的综合【例2】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.[解](1)由频率分布直方图可知:月均用水量在[0,0.5)内的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5]等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,又前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.【解题规律与方法】1.频率、频数、样本容量的计算方法(1)频率组距×组距=频率;(2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.2.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.易错警示:1.频率分布直方图的纵坐标是频率组距,而不是频率,切莫与条形图混淆.2.制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.【跟踪练习】(1)为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在4.6到4.8之间的学生数为a,最大频率为0.32,则a的值为()A.64 B.54 C.48 D.27B[前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32的最大频数为0.32×100=32.所以a=22+32=54.](2)某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].①若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分;②若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90]之外的人数.分数段[50,60)[60,70)[70,80)[80,90]x∶y 1∶12∶13∶44∶5[解]①估计这次语文成绩的平均分x=55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100名学生语文成绩的平均分为73分.②分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90]的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90]的人数依次为5,20,40,25.所以数学成绩在[50,90]之外的人数有100-(5+20+40+25)=10(人).【连线真题·提升实战能力】1.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半A[设新农村建设前经济收入的总量为x,则新农村建设后经济收入的总量为2x.建设前种植收入为0.6x,建设后种植收入为0.74x,故A不正确;建设前其他收入为0.04x,建设后其他收入为0.1x,故B正确;建设前养殖收入为0.3x,建设后养殖收入为0.6x,故C正确;建设后养殖收入与第三产业收入的总和占建设后经济收入总量的58%,故D 正确.]2.(2017·全国卷Ⅰ)为评估一种农作物的种植效果,选了n块地作试验田.这n 块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数B[因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.]3.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了如图所示的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳A[对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.故选A.]4.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个D[对于选项A,由图易知各月的平均最低气温都在0 ℃以上,A正确;对于选项B,七月的平均最高气温点与平均最低气温点间的距离大于一月的平均最高气温点与平均最低气温点间的距离,所以七月的平均温差比一月的平均温差大,B正确;对于选项C,三月和十一月的平均最高气温均为10 ℃,所以C正确;对于选项D,平均最高气温高于20 ℃的月份有七月、八月,共2个月份,故D错误.]高中数学必修三第二章统计2《用样本估计总体》检测一、选择题1.某学校组织学生参加数学测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45 B.50C.55 D.60【答案】B【解析】∵[20,40),[40,60)的频率和为(0.005+0.01)×20=0.3,∴该班的学生人数是150.3=50.2.若数据x1,x2,x3,…,x n的平均数为x=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为()A.5,2 B.16,2C.16,18 D.16,9【答案】C【解析】∵x1,x2,x3,…,x n的平均数为5,∴x1+x2+x3+…+x nn=5.∴3x1+3x2+3x3+…+3x nn+1=3×5+1=16.∵x1,x2,x3,…,x n的方差为2,∴3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.故选C.3.某地区教育主管部门为了对该地区模拟考试成绩进行分析,抽取了总成绩在350分到650分之间的10 000名学生的成绩,并根据这10 000名学生的总成绩画了样本的频率分布直方图,则总成绩在[400,500)内的学生共有()A.5 000人B.4 500人C.3 250人D.2 500人【答案】B【解析】由频率分布直方图可求得a=0.005,故[400,500)对应的频率为(0.005+0.004)×50=0.45,故总成绩在[400,500)内的学生共有10 000×0.45=4 500(人).故选B.4.已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为()A.95,94 B.92,86C.99,86 D.95,91【答案】B【解析】由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B.5.某班50位学生期中考试数学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x 的值等于()A.0.12 B.0.012C.0.18 D.0.018【答案】D【解析】由题意知0.054×10+10×x+0.01×10+0.006×10×3=1,解得x =0.018.6.某项测试成绩满分为10分,现随机抽取30名学生参加测试,得分如图所示,假设得分值的中位数为m e,平均值为x,众数为m0,则()A.m e=m0=x B.m e=m0<xC.m e<m0<x D.m0<m e<x【答案】D【解析】由图可知m0=5.由中位数的定义知应该是第15个数与第16个数的平均值,由图知将数据从小到大排,第15个数是5,第16个数是6,所以m e=5+62=5.5.x=130(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)≈5.97>5.5,所以m0<m e<x.故选D.二、填空题7.在样本的频率分布直方图中,共有11个小长方形.若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为________.【答案】32【解析】由题意可设中间小长方形的面积为x,则其余小长方形的面积和为4x,所以5x=1,x=0.2,则中间一组的频数为160×0.2=32.8.若1,2,3,4,m这五个数的平均数为3,则这五个数的方差为________.【答案】2【解析】由1+2+3+4+m5=3,得m=5,所以这五个数的方差为15[(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2]=2.9.某学校共有教师300人,其中中级教师有192人,高级教师与初级教师的人数比为5∶4.为了解教师专业发展需求,现采用分层抽样的方法进行调查,在抽取的样本中有中级教师64人,则该样本中的高级教师人数为________.【答案】20【解析】由题意可知,高级教师有(300-192)×55+4=60(人),抽样比k=nN=64192=13.故该样本中高级教师的人数为60×13=20.10.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:【答案】2 5【解析】由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25. 三、解答题11.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248 256 232 243 188 268 278 266 289 312 274 296 288 302 295 228 287 217 329 283 (1)完成下面的频率分布表,并做出频率分布直方图;(2)估计8 280小时; (3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.【解】(1)频率分布表及频率分布直方图如下所示:(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.12.随着移动互联网的发展,与餐饮美食相关的手机应用软件层出不穷.现从使用A和B两款订餐软件的商家中分别随机抽取50个商家,对它们的“平均送达时间”进行统计,得到频率分布直方图如下:(1)试估计使用A款订餐软件的50个商家的“平均送达时间”的众数及平均数;(2)根据以上抽样调查数据,将频率视为概率,回答下列问题:①能否认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%?②如果你要从A和B两款订餐软件中选择一款订餐,你会选择哪款?说明理由.【解】(1)依题意可得,使用A款订餐软件的50个商家的“平均送达时间”的众数为55.使用A款订餐软件的50个商家的“平均送达时间”的平均数为15×0.06+25×0.34+35×0.12+45×0.04+55×0.4+65×0.04=40.(2)①使用B款订餐软件“平均送达时间”不超过40分钟的商家的比例估计值为0.04+0.20+0.56=0.80=80%>75%.故可以认为使用B款订餐软件“平均送达时间”不超过40分钟的商家达到75%.②使用B款订餐软件的50个商家的“平均送达时间”的平均数为15×0.04+25×0.2+35×0.56+45×0.14+55×0.04+65×0.02=35<40,所以选B款订餐软件.。