2019年人教版必修三高中数学配套习题第二章 统计 2.2.1 及答案
- 格式:docx
- 大小:320.51 KB
- 文档页数:12
(本栏目内容,在学生用书中以独立形式分册装订!)一、选择题(每小题5分,共20分)1.对于样本频率分布折线图与总体密度曲线的关系,下列说法中正确的是()A.频率分布折线图与总体密度曲线无关B.频率分布折线图就是总体密度曲线C.样本容量很大的频率分布折线图就是总体密度曲线D.如果样本容量无限增大、分组的组距无限减小,那么频率分布折线图就会无限接近总体密度曲线解析:总体密度曲线通常是用样本频率分布估计出来的.而频率分布折线图在样本容量无限增大,分组的组距无限减小的情况下会无限接近于一条光滑曲线,这条光滑曲线就是总体密度曲线.答案: D2.下面是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分解析:从茎叶图可以看出,甲运动员的成绩集中在大茎上的叶多,故成绩好.故选A.答案: A3.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( )A .45B .50C .55D .60解析: 设该班人数为n ,则20×(0.005+0.01)n =15,n =50,故选B. 答案: B4.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在[2 700,3 000)内的频率为( )A .0.001B .0.1C .0.2D .0.3解析: 由频率分布直方图的意义可知,各小长方形的面积=组距×频率组距=频率,即各小长方形的面积等于相应各组的频率.在区间[2 700,3 000)内频率的取值为(3 000-2 700)×0.001=0.3.故选D.答案: D二、填空题(每小题5分,共15分)5.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(元)月收入段应抽出________人.解析:由题意得在[2500,3000)(元)月收入段应抽出的人数为0.0005×500×100=25.答案:256.某省选拔运动员参加2015年的全运会,测得7名选手的身高(单位:cm)分布茎叶图如图所示,记录的平均身高为177 cm,其中有一名候选人的身高记录不清,其末位数为x,那么x的值为________.解析:依题意得180×2+1+170×5+3+x+8+9=177×7,x=8.答案:87.下面是某中学期末考试各分数段的考生人数分布表:则分数在[700,800)的人数为________人.解析:由于在分数段[400,500)内的频数是90,频率是0.075,则该中学共有考生900.075=1 200,则在分数段[600,700)内的频数是1 200×0.425=510,则分数在[700,800)内的频数,即人数为1 200-(5+90+499+510+8)=88.答案:88三、解答题(每小题10分,共20分)8.下表给出了某校500名12岁男孩中用随机抽样得出的120人的身高(单位:cm).(1)列出样本频率分布表;(2)画出频率分布直方图;(3)估计身高小于134 cm的人数占总人数的百分比.解析:(1)样本频率分布表如下:(2)其频率分布直方图如下:(3)由样本频率分布表可知身高小于134 cm 的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134 cm 的人数占总人数的19%.9.为了调查甲、乙两个交通站的车流量,随机选取了14天,统计每天上午8:00~12:00间各自的车流量(单位:百辆),得如图所示的统计图,试求:(1)甲、乙两个交通站的车流量的极差分别是多少? (2)甲交通站的车流量在[10,40]间的频率是多少? (3)甲、乙两个交通站哪个站更繁忙?并说明理由.解析: (1)甲交通站的车流量的极差为73-8=65(百辆),乙交通站的车流量的极差为71-5=66(百辆).(2)甲交通站的车流量在[10,40]间的频率为414=27.(3)甲交通站的车流量集中在茎叶图的下方,而乙交通站的车流量集中在茎叶图的上方,从数据的分布情况来看,甲交通站更繁忙.。
新课程标准数学必修3第二章课后习题解答第二章统计2.1随机抽样练习(P57)1、.之间有误差. 如抽取的部分个体不能很好地代表总体,那么我们分析出的结果就会有偏差.2、(1)抽签法:对高一年级全体学生450人进行编号,将学生的名字和对应的编号分别写在卡片上,并把450张卡片放入一个容器中,搅拌均匀后,每次不放回地从中抽取一张卡片,连续抽取50次,就得到参加这项活动的50名学生的编号.(2)随机数表法:第一步,先将450名学生编号,可以编为000,001, (449)第二步,在随机数表中任选一个数. 例如选出第7行第5列的数1(为了便于说明,下面摘取了附表的第6~10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 6484 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 5457 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28第三步,从选定的数1开始向右读,得到一个三位数175,由于175<450,说明号码175在总体内,将它取出;继续向右读,得到331,由于331<450,说明号码331在总体内,将它取出;继续向右读,得到572,由于572>450,将它去掉. 按照这种方法继续向右读,依次下去,直到样本的50个号码全部取出,这样我们就得到了参加这项活动的50名学生.3、用抽签法抽取样本的例子:为检查某班同学的学习情况,可用抽签法取出容量为5的样本. 用随机数表法抽取样本的例子:部分学生的心理调查等.抽签法能够保证总体中任何个体都以相同的机会被选到样本之中,因此保证了样本的代表性.4、与抽签法相比,随机数表法抽取样本的主要优点是节省人力、物力、财力和时间,缺点是所产生的样本不是真正的简单样本.练习(P59)1、系统抽样的优点是:(1)简便易行;(2)当对总体结构有一定了解时,充分利用已有信息对总体中的个体进行排队后再抽样,可提高抽样调查;(3)当总体中的个体存在一种自然编号(如生产线上产品的质量控制)时,便于施行系统抽样法.系统抽样的缺点是:在不了解样本总体的情况下,所抽出的样本可能有一定的偏差.2、(1)对这118名教师进行编号;(2)计算间隔1187.37516k==,由于k不是一个整数,我们从总体中随机剔除6个样本,再来进行系统抽样. 例如我们随机剔除了3,46,59,57,112,93这6名教师,然后再对剩余的112位教师进行编号,计算间隔7k=;(3)在1~7之间随机选取一个数字,例如选5,将5加上间隔7得到第2个个体编号12,再加7得到第3个个体编号19,依次进行下去,直到获取整个样本.3、由于身份证(18位)的倒数第二位表示性别,后三位是632的观众全部都是男性,所以这样获得的调查结果不能代表女性观众的意见,因此缺乏代表性. 练习(P62) 1、略2、这种说法有道理,因为一个好的抽样方法应该能够保证随着样本容量的增加,抽样调查结果会接近于普查的结果. 因此只要根据误差的要求取相应容量的样本进行调查,就可以节省人力、物力和财力.3、可以用分层抽样的方法进行抽样. 将麦田按照气候、土质、田间管理水平的不同而分成不同的层,然后按照各层麦田的面积比例及样本容量确定各层抽取的面积,再在各层中抽取个体(这里的个体是单位面积的一块地). 习题2.1 A 组(P63)1、产生随机样本的困难:(1)很难确定总体中所有个体的数目,例如调查对象是生产线上生产的产品.(2)成本高,要产生真正的简单随机样本,需要利用类似于抽签法中的抽签试验来产生非负整值随机数.(3)耗时多,产生非负整数值随机数和从总体中挑选出随机数所对的个体都需要时间. 2、调查的总体是所有可能看电视的人群.学生A 的设计方案考虑的人数是:上网而且登录某网址的人群,那些不能上网的人群,或者不登录某网址的人群就被排除在外了. 因此A 方案抽取的样本的代表性差.学生B 的设计方案考虑的人群是小区内的居民,有一定的片面性. 因此B 方案抽取的样本的代表性差.学生C 的设计方案考虑的人群是那些有电话的人群,也有一定的片面性. 因此C 方案抽取的样本的代表性.所以,这三种调查方案都有一定的片面性,不能得到比较准确的收视率. 3、(1)因为各个年级学习任务和学生年龄等因素的不同,影响各年级学生对学生活动的看法,所以按年级分层进行抽样调查,可以得到更有代表性的样本. (2)在抽样的过程中可能遇到的问题如敏感性问题:有些学生担心提出意见对自己不利;又如不响应问题:由于种种原因,有些学生不能发表意见;等等.(3)前面列举的两个问题都可能导致样本的统计推断结果的误差.(4)为解决敏感性问题,可以采用阅读与思考栏目“如何得到敏感性问题的诚实反应”中的方法设计调查问卷;为解决不响应问题,可以事先向全体学生宣传调查的意义,并安排专人负责发放和催收调查问卷,最大程度地回收有效调查问卷.4、将每一天看作一个个体,则总体由365天组成. 假设要抽取50个样本,将一年中的各天按先后次序编号为0~364天用简单随机抽样设计方案:制作365个号签,依次标上0~364. 将号签放到容器内充分搅拌均匀,从容器中任意不放回取出50个号签. 以签上的号码所对应的那些天构成样本,检测样本中所有个体的空气质量.用系统抽样设计抽样方案:先通过简单随机抽样方法从365天中随机抽出15天,再把剩下的350天重新按先后次序编号为0~349. 制作7个分别标有0~7的号签,放在容器中充分搅拌均匀. 从容器中任意取出一个号签,设取出的号签的编号为a ,则编号为7(050)a k k +≤<所对应的那些天构成样本,检测样本中所有个体的空气质量.显然,系统抽样方案抽出的样本中个体在一年中排列的次序更规律,因此更好实施,更受方案的实施者欢迎.5、田径队运动员的总人数是564298+=(人),要得到28人的样本,占总体的比例为27.于是,应该在男运动员中随机抽取256167⨯=(人),在女运动员中随机抽取281612-=(人).这样我们就可以得到一个容量为28的样本.6、以10为分段间隔,首先在1~10的编号中,随机地选取一个编号,如6,那么这个获奖者奖品的编号是:6,16,26,36,46.7、说明:可以按年级分层抽样的方法设计方案. 习题2.1 B 组(P64)1、说明:可以按年级分层抽样的方法设计方案,调查问卷由学生所关心的问题组成. 例如:(1)你最喜欢哪一门课程? (2)你每月的零花钱平均是多少? (3)你最喜欢看《新闻联播》吗? (4)你每天早上几点起床? (5)你每天晚上几点睡觉?要根据统计的结果和具体的情况解释结论,主要从引起结论的可能原因及结论本身含义来解释. 2、说明:这是一个开放性的题目,没有一个标准的答案. 2.2用样本估计总体 练习(P71)1、说明:由于样本的极差为364.41362.51 1.90-=,取组距为0.19,将样本分为10组. 可以按照书上的方法制作频率分布表、频率分布直观图和频率折线图.2、说明:此题目属于应用题,没有标准的答案.3、茎叶图为:由该图可以看出30名工人的日加工零件个数稳定在120件左右. 练习(P74)这里应该采用平均数来表示每一个国家项目的平均金额,因为它能反应所有项目的信息. 但平均数会受到极端数据2000万元的影响,所以大多数项目投资金额都和平均数相差比较大. 练习(P79)1、甲乙两种水稻6年平均产量的平均数都是900,但甲的标准差约等于23.8,乙的标准差约等于41.6,所以甲的产量比较稳定.2、(1)平均重量496.86x ≈,标准差 6.55s ≈.(2)重量位于(,)x s x s -+之间有14袋白糖,所占的百分比约为66.67%.3、(1)略. (2)平均分19.25x ≈,中位数为15.2,标准差12.50s ≈.这些数据表明这些国家男性患该病的平均死亡率约为19.25,有一半国家的死亡率不超过15.2,15.2x >说明存在大的异常数据,值得关注. 这些异常数据使标准差增大. 习题2.2 A 组(P81) 1、(1)茎叶图为:(2)汞含量分布偏向于大于1.00 ppm 的方向,即多数鱼的汞含量分布在大于1.00 ppm 的区域.(3)不一定. 因为我们不知道各批鱼的汞含量分布是否都和这批鱼相同. 即使各批鱼的汞含量分布相同,上面的数据只能为这个分布作出估计,不能保证平均汞含量大于1.00 ppm. (4)样本平均数 1.08x ≈,样本标准差0.45s ≈.(5)有28条鱼的汞含量在平均数与2倍标准差的和(差)的范围内.2较短,所以在这批棉花中混进了一些次品.3、说明:应该查阅一下这所大学的其他招生信息,例如平均数信息、最低录取分数线信息等. 尽管该校友的分数位于中位数之下,而中位数本身并不能提供更多录取分数分布的信息. 在已知最低录取分数线的情况下,很容易做出判断;在已知平均数小于中位数很多,则说明最低录取分数线较低,可以推荐该校友报考这所大学,否则还要获取其他的信息(如标准差的信息)来做出判断.4、说明:(1)对,从平均数的角度考虑; (2)对,从标准差的角度考虑;(3)对,从标准差的角度考虑; (4)对,从平均数和标准差的角度考虑; 5、(1)不能. 因为平均收入和最高收入相差太多,说明高收入的职工只占极少数. 现在已知知道至少有一个人的收入为50100x =万元,那么其他员工的收入之和为4913.55010075ii x==⨯-=∑(万元)每人平均只有1.53. 如果再有几个收入特别高者,那么初进公司的员工的收入将会很低. (2)不能,要看中位数是多少. (3)能,可以确定有75%的员工工资在1万元以上,其中25%的员工工资在3万元以上. (4)收入的中位数大约是2万. 因为有年收入100万这个极端值的影响,使得年平均收入比中位数高许多.6、甲机床的平均数=1.5x 甲,标准差=1.2845s 甲;乙机床的平均数 1.2z y =,标准差0.8718z s =. 比较发现乙机床的平均数小而且标准差也比较小,说明乙机床生产出的次品比甲机床少,而且更为稳定,所以乙机床的性能较好.7、(1)总体平均数为199.75,总体标准差为95.26.(2)可以使用抓阄法进行抽样. 样本平均数和标准差的计算结果和抽取到的样本有关. (3) (4)略习题2.2 B 组(P82)1、(1)由于测试1T 的标准差小,所以测试1T 结果更稳定,所以该测试做得更好一些. (2)由于2T 测出的值偏高,有利于增强队员的信心,所以应该选择测试2T . A B C D E F GH I J 1(20)2T -÷ 0.00 1.50 2.00 -1.00 -1.50 -2.00 2.50 2.000.50-0.502(35)3T -÷ -1.331.331.33-2-2.33 -1.331.67-1.67 -1.33 -1.67G E .2、说明:此题需要在本节开始的时候就布置,先让学生分头收集数据,汇总所收集的数据才能完成题目.2.3变量间的相关关系 练习(P85)1、从已经掌握的知识来看,吸烟会损害身体的健康. 但除了吸烟之外,还有许多其他的随机因素影响身体健康,人体健康是很多因素共同作用的结果. 我们可以找到长寿的吸烟者,也更容易发现由于吸烟而引发的患病者,所以吸烟不一定引起健康问题. 但吸烟引起健康问题的可能性大,因此“健康问题不一定是由吸烟引起的,所以可以吸烟”的说法是不对的.2、从现在我们掌握的知识来看,没有发现根据说明“天鹅能够带来孩子”,完全可能存在既能吸引天鹅和又使婴儿出生率高的第3个因素(例如独特的环境因素),即天鹅与婴儿出生率之间没有直接的关系,因此“天鹅能够带来孩子”的结论不可靠.而要证实此结论是否可靠,可以通过试验来进行. 相同的环境下将居民随机地分为两组,一组居民和天鹅一起生活(比如家中都饲养天鹅),而另一组居民的附近不让天鹅活动,对比两组居民的出生率是否相同. 练习(P92)1、当0x =时,$147.767y =,这个值与实际卖出的热饮杯数150不符,原因是:线性回归方程中的截距和斜率都是通过样本估计的,存在随机误差,这种误差可以导致预测结果的偏差;即使截距和斜率的估计没有误差,也不可能百分之百地保证对应于x ,预报值$y 能够等于实际值y . 事实上:y bx a e =++. (这里e 是随机变量,是引起预报值$y 与真实值y 之间的误差的原因之一,其大小取决于e 的方差.)2、数据的散点图为:从这个散点图中可以看出,鸟的种类数与海拔高度应该为正相关(事实上相关系数为0.793).(1)散点图如下:但是从散点图的分布特点来看,它们之间的线性相关性不强.习题2.3 A组(P94)1、教师的水平与学生的学习成绩呈正相关关系. 又如,“水涨船高”“登高望远”等.2、(3)基本成正相关关系,即食品所含热量越高,口味越好.(4)因为当回归直线上方的食品与下方的食品所含热量相同时,其口味更好.3、(1)散点图如下:(2)回归方程为:$0.66954.933y x=+.(3)加工零件的个数与所花费的时间呈正线性相关关系.4、(1)散点图为:(2)回归直线如下图所示:(2)回归方程为:$0.546876.425y x =+.(3)由回归方程知,城镇居民的消费水平和工资收入之间呈正线性相关关系,即工资收入水平越高,城镇居民的消费水平越高. 习题2.3 B 组(P95) 1、(1)散点图如下:(2)回归方程为:$1.44715.843y x =-.(3)如果这座城市居民的年收入达到40亿元,估计这种商品的销售额为$42.037y ≈(万元). 2、说明:本题是一个讨论题,按照教科书中的方法逐步展开即可.第二章 复习参考题A 组(P100)1、A .2、(1)该组的数据个数,该组的频数除以全体数据总数; (2)nmN. 3、(1)这个结果只能说明A 城市中光顾这家服务连锁店的人比其他人较少倾向于选择咖啡色,因为光顾连锁店的人使一种方便样本,不能代表A 城市其他人群的想法.(2)这两种调查的差异是由样本的代表性所引起的. 因为A 城市的调查结果来自于该市光顾这家服装连锁店的人群,这个样本不能很好地代表全国民众的观点.4、说明:这是一个敏感性问题,可以模仿阅读与思考栏目“如何得到敏感性问题的诚实反应”来设计提问方法.5、表略. 可以估计出句子中所含单词的分布,以及与该分布有关的数字特征,如平均数、标准差等.6、(1)可以用样本标准差来度量每一组成员的相似性,样本标准差越小,相似程度越高. (2)A 组的样本标准差为 3.730A S ≈,B 组的样本标准差为11.789B S ≈. 由于专业裁判给分更符合专业规则,相似程度应该高,因此A 组更像是由专业人士组成的.7、(1)中位数为182.5,平均数为217.1875.(2)这两种数字特征不同的主要原因是,430比其他的数据大得多,应该查找430是否由某种错误而产生的. 如果这个大数据的采集正确,用平均数更合适,因为它利用了所有数据的信息;如果这个大数据的采集不正确,用中位数更合适,因为它不受极端值的影响,稳定性好.8、(1)略. (2)系数0.42是回归直线的斜率,意味着:对于农村考生,每年的入学率平均增长0.42%. (3)城市的大学入学率年增长最快. 说明:(4)可以模仿(1)(2)(3)的方法分析数据.第二章 复习参考题B 组(P101)1、频率分布如下表:从表中看出当把 指标定为17.46千元时,月65%的推销员 经过努力才能完成销售指标.2、(1)数据的散点图如下:(2)用y 表示身高,x 表示年龄,则数据的回归方程为$ 6.31771.984y x =+. (3)在该例中,斜率6.317表示孩子在一年中增加的高度.(4)每年身高的增长数略. 3~16岁的身高年均增长约为6.323 cm. (5)斜率与每年平均增长的身高之间之间近似相等.分组频数 频率 累计频率 [12.34,13.62] 2 0.04 0.04 (13.62,14.9] 4 0.08 0.12 (14.9,16.18] 3 0.06 0.18 (16.18,17.46] 8 0.16 0.34 (17.46,18.74] 13 0.26 0.6 (18.74,20.02] 11 0.22 0.82 (20.02,21.3]3 0.06 0.88 (21.3,22.58]3 0.06 0.94 (22.58,23.86]1 0.02 0.96 (23.86,25.14]20.041。
2.2.2用样本的数字特征估计总体的数字特征课时过关·能力提升一、基础巩固1.甲、乙两台机床同时生产一种零件,现要检验它们的运行情况,统计10天中两台机床每天出的次品数.甲:0,1,0,2,2,0,3,1,2,4;乙:2,3,1,1,0,2,1,1,0,1.则从平均数考虑,甲、乙两台机床出次品数较少的为()A.甲B.乙C.相同D.不能比较=110(0+1+0+2+⋯+4)=1.5,x 乙=110(2+3+⋯+1)=1.2.x乙<x甲.2.如图是某篮球运动员在一个赛季的30场比赛中得分的茎叶图,则其得分的中位数与众数分别为()A.3与3B.23与3C.3与23D.23与23(或从大到小)的顺序依次排列,处在中间位置的一个数(或最中间两个数据的平均数),从茎叶图中可知中位数为23;众数是指一组数据中出现次数最多的数,从茎叶图中可知23出现了3次,次数最多,因此众数也是23,所以选D.3.在某项体育比赛中,七位裁判为一选手打出的分数如下:90899095939493去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为()A.92,2B.92,2.8C.93,2D.93,2.895与一个最低分89后,所得的5个数分别为90,90,93,94,93,所以x=90+90+93+94+935=4605=92,s2=2×(90-92)2+2×(93-92)2+(94-92)25=145=2.8,故选B.4.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91分.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示.则7个剩余分数的方差为( ) A .1169B.367C.36D.6√77模糊的数为x ,则90+x+87+94+91+90+90+91=91×7,x=4,∴7个数分别为90,90,91,91,94,94,87, 方差为s 2=2(90-91)2+2(91-91)2+2(94-91)2+(87-91)27=367.5.若数据x 1,x 2,…,x n 的平均数为x,方差为s2,则3x 1+5,3x 2+5,…,3xx +5的平均数和方差分别为( )A .x,s2B.3x +5,s2C.3x +5,9s2D.3x +5,9s2+30s +256.如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为x A 和x B ,样本标准差分别为sA 和sB,则( )A .x A >xB ,sA >sBB.x A <x B ,sA >sBC .x A >x B ,sA <sBD.x A <x B ,sA <sB由题图易得x A <x B ,又A 波动性大,B 波动性小,所以s A >s B . 7.某班50名学生右眼视力的检查结果如下表所示:则该班学生右眼视力的众数为 ,中位数为 ..2 0.88.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如下. 甲:6,8,9,9,8; 乙:10,7,7,7,9.则两人的射击成绩较稳定的是 .=x 乙=8,s 甲2=1.2,s 乙2=1.6,因为s 甲2<s 乙2,所以甲稳定.9.某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则x 2+y 2= .10,得(x+y+10+11+9)×15=10,则x+y=20; 又由于方差为2,则[(x-10)2+(y-10)2+(10-10)2+(11-10)2+(9-10)2]×15=2, 整理得x 2+y 2-20(x+y )=-192,则x 2+y 2=20(x+y )-192=20×20-192=208.10.某校高二年级在一次数学竞赛选拔赛中,由于甲、乙两人的成绩相同,从而决定根据平时在相同条件下进行的六次测试确定出最佳人选,这六次测试的成绩数据如下:求两人测试成绩的平均数以及方差,并且分析成绩的稳定性,从中选出一位参加数学竞赛. 设甲、乙两人成绩的平均数分别为x 甲,x 乙,则x 甲=130+16(−3+8+0+7+5+1)=133,x 乙=130+16(3−1+8+4−2+6)=133, s 甲2=16[(−6)2+52+(−3)2+42+22+(−2)2]=473, s 乙2=16[02+(−4)2+52+12+(−5)2+32]=383.因此,甲与乙的平均数相同,因为乙的方差较小,所以乙的成绩比甲的成绩稳定,应该选乙参加数学竞赛比较合适.二、能力提升1.某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45)岁之间,根据调查结果得出司机的年龄情况残缺的频率分布直方图如图,利用这个残缺的频率分布直方图估计该市出租车司机年龄的中位数是( )A.31.6岁B.32.6岁C.33.6岁D.36.6岁,在区间[25,30)上的数据的频率为1-(0.01+0.07+0.06+0.02)×5=0.2.故中位数在第3组,且中位数估计为30+(35-30)×57≈33.6(岁).2.甲、乙两个数学兴趣小组各有5名同学,在一次数学测试中,成绩统计用茎叶图表示,如图.若甲、乙小组的平均成绩分别是x甲,x乙,则下列结论正确的是()A.x甲>x乙,甲比乙成绩稳定B.x甲>x乙,乙比甲成绩稳定C.x甲<x乙,甲比乙成绩稳定D.x甲<x乙,乙比甲成绩稳定,甲组5名同学的成绩分别是88,89,90,91,92,乙组5名同学的成绩分别是83,84,88,89,91,可得x甲=90,x乙=87,s甲2=2,s乙2=9.2,故有x甲>x乙,s甲2<s乙2,所以甲比乙的成绩稳定,所以选A.3.如图是一次考试成绩的频数分布直方图,根据该图可估计,这次考试的平均分数为()A.46分B.36分C.56分D.60分,可估计有4人成绩在[0,20)之间,其考试分数之和为4×10=40;有8人成绩在[20,40)之间,其考试分数之和为8×30=240;有10人成绩在[40,60)之间,其考试分数之和为10×50=500;有6人成绩在[60,80)之间,其考试分数之和为6×70=420;有2人成绩在[80,100)之间,其考试分数之和为2×90=180,由此可知,考生总人数为4+8+10+6+2=30,考试总成绩为40+240+500+420+180=1380(分),平均分数为138030=46(分).4.某企业有3个分厂生产同一种电子产品,第一、二、三分厂的产量之比为1∶2∶1,用分层抽样方法(每个分厂的产品为一层)从3个分厂生产的电子产品中共抽取100件作使用寿命的测试,由所得的测试结果算得从第一、二、三分厂取出的产品的使用寿命的平均值分别为980 h,1 020 h,1 032 h,则抽取的100件产品的使用寿命的平均值为h.=1013.5.已知某同学的五次数学成绩分别是121,127,123,a ,125,若其平均成绩是124,则这组数据的方差是 .121+127+123+a+125=5×124,解得a=124,则这组数据的方差是s 2=15[(121−124)2+(127−124)2+(123−124)2+(124−124)2+(125−124)2]=4.★6.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为 . 由题中数据可得x 甲=90,x 乙=90.于是s 甲2=15[(87−90)2+(91−90)2+(90−90)2+(89−90)2+(93−90)2]=4,s 乙2=15[(89−90)2+(90−90)2+(91−90)2+(88−90)2+(92−90)2]=2, 由s 甲2>s 乙2,可知乙运动员成绩稳定.故成绩较为稳定的那位运动员的方差为2.7.对甲、乙两名同学的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:问:(1)甲、乙的平均成绩谁较好? (2)谁的各门功课发展较平衡?)x 甲=15(60+80+70+90+70)=74, x 乙=15(80+60+70+80+75)=73, 故甲的平均成绩较好.(2)s 甲2=15[(60−74)2+(80−74)2+(70−74)2+(90−74)2+(70−74)2]=104, s 乙2=15[(80−73)2+(60−73)2+(70−73)2+(80−73)2+(75−73)2]=56, 由s 甲2>s 乙2知乙的各门功课发展较平衡.★8.已知一组数据的分组和频数如下:[120.5,122.5),2;[122.5,124.5),3;[124.5,126.5),8;[126.5,128.5),4;[128.5,130.5],3.(1)作出频率分布直方图;(2)根据频率分布直方图求这组数据的众数和平均数.频率分布表如下:频率分布直方图如图:(2)在[124.5,126.5)中的数据最多,取这个区间的中点值作为众数的近似值,得众数为125.5.使用“组中值”求平均数:x=121.5×0.1+123.5×0.15+125.5×0.4+127.5×0.2+129.5×0.15=125.8.。
2.2.1用样本的频率分布估计总体分布课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.1.用样本估计总体的两种情况(1)用样本的____________估计总体的分布.(2)用样本的____________估计总体的数字特征.2.数据分析的基本方法(1)借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.(2)借助于表格分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.3.频率分布直方图在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.4.频率分布折线图和总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.(2)总体密度曲线随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.5.茎叶图(1)适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.(2)优点:它不但可以____________,而且可以__________,给数据的记录和表示都带来方便.(3)缺点:当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.一、选择题1.下列说法不正确的是()A.频率分布直方图中每个小矩形的高就是该组的频率B.频率分布直方图中各个小矩形的面积之和等于1C.频率分布直方图中各个小矩形的宽一样大D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的A.0.13 B.0.39 C.0.52 D.0.643.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[60,70)的汽车大约有()A.30辆B.40辆C.60辆D.80辆4.如图是总体密度曲线,下列说法正确的是()A.组距越大,频率分布折线图越接近于它B.样本容量越小,频率分布折线图越接近于它C.阴影部分的面积代表总体在(a,b)内取值的百分比D.阴影部分的平均高度代表总体在(a,b)内取值的百分比5.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为()A.20% B.69%C.31% D.27%6.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是()7.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.三、解答题10.抽查100袋洗衣粉,测得它们的重量如下(单位:g):494498493505496492485483508511495494483485511493505488 501491493509509512484509510 495497498504498483510503497 502511497500493509510493491 497515503515518510514509499 493499509492505489494501509 498502500508491509509499495 493509496509505499486491492 496499508485498496495496505 499505496501510496487511501496(1)列出样本的频率分布表:(2)画出频率分布直方图,频率分布折线图;(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.能力提升11.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,你会得到什么结论?12.某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.答案:2.2.1用样本的频率分布估计总体分布知识梳理1.(1)频率分布(2)数字特征 2.(1)提取信息传递(2)表格构成形式 3.频率/组距小长方形的面积1 4.(1)上端的中点(2)组数光滑曲线5.(2)保留所有信息随时记录(3)较多作业设计1.A2.C[样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.]3.B[时速在[60,70)的汽车的频率为:0.04×(70-60)=0.4,又因汽车的总辆数为100,所以时速在[60,70)的汽车大约有0.4×100=40(辆).]4.C5.C[由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为1135≈0.31.]6.A[∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为360.3=120.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.]7.60解析∵n·2+3+42+3+4+6+4+1=27,∴n=60.8.45,46解析由茎叶图及中位数的概念可知x甲中=45,x乙中=46.9.m h解析频率组距=h,故|a-b|=组距=频率h=mh.10.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=834,要分9组,组数合适,于是决定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下: [482.5,486.5),[486.5,490.5),…,[514.5,518.5). 分组 个数累计 频数 频率 累积频率 [482.5,486.5) 正 8 0.08 0.08 [486.5,490.5) 3 0.03 0.11 [490.5,494.5) 正正正 17 0.17 0.28 [494.5,498.5) 正正正正- 21 0.21 0.49 [498.5,502.5) 正正 14 0.14 0.63 [502.5,506.5) 正 9 0.09 0.72 [506.5,510.5) 正正正 19 0.19 0.91 [510.5,514.5) 正- 6 0.06 0.97 [514.5,518.5]3 0.03 1.00 合计100 1.00(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44. 设重量不足500 g 的频率为b ,根据频率分布表, b -0.49500-498.5≈0.63-0.48502.5-498.5,故b ≈0.55.因此重量不足500 g 的频率约为0.55.11.解 (1)(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明. 12.解 (1)分组 频数 频率[41,51) 2 230[51,61) 1 130[61,71) 4 430[71,81) 6 630(2)(3)答对下述两条中的一条即可:①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数为28,占当月天数的1415.说明该市空气质量基本良好.②轻微污染有2天,占当月天数的115;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730,超过50%;说明该市空气质量有待进一步改善.。
2019-2020学年高中数学必修三第2章《统计》测试题(时间:90分钟 满分:120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.下列给出的两个变量之间存在相关关系的为( )A.学生的座号与数学成绩B.学生的学号与身高C.曲线上的点与该点的坐标之间的关系210人,高二学生270人,高三学生300人,学校学生会用分层抽样的方法从这三个年级的学生中抽取n 个学生进行问卷调查,如果已知从高一学生中抽取的人数为7人,那么从高三学生中抽取的人数应为( ) B.9 C.8 D.7 由题意知抽取的比例为7210=130,故从高三学生中抽取的人数为300×130=10. 1.23,样本点中心(即(x,y ))为(4,5),则回归直线的方程是( )A.y ^=1.23x+4B.y ^=1.23x+5 ^.23x+0.08 D.y ^=0.08x+1.23,可设此回归直线的方程为y ^=1.23x+a ^.(x,y ),所以点(4,5)在直线y ^=1.23x+a ^上,所以5=1.23×4+a ^,即a ^=0.08,y ^=1.23x+0.08.,则甲、乙两人在这几场比赛中得分的中位数之和是( )A.63B.64D.6636和27,则中位数之和是36+27=63. 30个数据的平均数时,错将其中一个数据105输入为15,则由此求出的平均数与实际平均数的差是( )A.3.5B.-3D.-0.590,9030=3,平均数少3,求出的平均数与实际平均数的差是-3.6.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )C,D 一定不对;由茎叶图可知[0,5)有1人,[5,10)有1人,,频率分布直方图中矩形的高应相同,可排除B .故选A .100的样本的频率分布直方图如图,根据样本的频率分布直方图估计样本数据落在[6,10)内的频数为a ,样本数据落在[2,10)内的频率为b ,则a ,b 分别是 ( ) A.32,0.4B.8,0.1 .1 D.8,0.4[6,10)内的频率组距=0.08,得样本数据落在[6,10)内的频率为0.08×4=0.32,则×0.32=32. [2,6)内的频率=0.02×4=0.08,得样本数据落在[2,10)内的频率b=0.08+0.32=0.4.8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数的平均数为x ,方差为s 2,则( )A.x =5,s 2>3B.x =5,s 2<3C.x >5,s 2<3D.x >s 2>38个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数的平均数为x ,方差为s 2,则x =8×5+59=5,s 2=8×3+(5-5)29=83<3,故选B .14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;。
2.2.2 用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1.众数、中位数、平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,x n,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2.标准差、方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=________________________________________________________________________.(2)方差的求法:标准差的平方s2叫做方差.s2=________________________________________________________________________.一、选择题1.下列说法正确的是( )A.在两组数据中,平均值较大的一组方差较大B.平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C.方差的求法是求出各个数据与平均值的差的平方后再求和D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )A.a>b>c B.a>c>bC.c>a>b D.c>b>a3.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )A.甲B.乙C.甲、乙相同D.不能确定4.一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是( )A.13s2B.s2C.3s2D.9s25.如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为( )A.84,4.84 B.84,1.6C.85,1.6 D.85,0.46.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本标准差分别为s A和s B则( )A.x A>x B,s A>s BB.x A<x B,s A>s BC.x A>x B,s A<s BD.x A<x B,s A<s B题号 1 2 3 4 5 6答案7.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.8.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):甲10 8 9 9 9乙10 10 7 9 9如果甲、乙两人只能有9.若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a2,…,a20,x这21个数据的方差为________.三、解答题10.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:平均数方差中位数命中9环及9环以上的次数甲乙(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11总经理大厨二厨采购员杂工服务员会计3 000元450元350元400元320元320元410元(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12.统计量平均成绩标准差组别第一组90 6第二组80 41.平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3.极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2.2.2 用样本的数字特征估计总体的数字特征知识梳理1.(1)最多 (2)中间 ①中间位置的 ②平均数 (3)①x 1+x 2+…+x n n ②总体中 样本中 2.(1)1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2] (2)1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]作业设计1.B [A 中平均值和方差是数据的两个特征,不存在这种关系;C 中求和后还需取平均数;D 中方差越大,射击越不平稳,水平越低.]2.D [由题意a =110(16+18+15+11+16+18+18+17+15+13)=15710=15.7, 中位数为16,众数为18,即b =16,c =18,∴c>b>a.]3.B [方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B .]4.D [s 20=1n [9x 21+9x 22+…+9x 2n -n(3x )2]=9·1n(x 21+x 22+…+x 2n -n x 2)=9·s 2(s 20为新数据的方差).]5.C [由题意x =15(84+84+86+84+87)=85. s 2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.] 6.B [样本A 数据均小于或等于10,样本B 数据均大于或等于10,故x A <x B , 又样本B 波动范围较小,故s A >s B .]7.91解析 由题意得8.甲解析 x 甲=9,2S 甲=0.4,x 乙=9,2S 乙=1.2,故甲的成绩较稳定,选甲. 9.0.19解析 这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19. 10.解 由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为:2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x 甲=110×(5+6×2+7×4+8×2+9)=7010=7(环), x 乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s 2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2] =110×(4+2+0+2+4) =1.2,s 2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9) =5.4.(2)2S 甲<2S 乙,∴甲成绩比乙稳定.②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11.解 (1)平均工资即为该组数据的平均数x =17×(3 000+450+350+400+320+320+410) =17×5 250=750(元). (2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410)=16×2 250=375(元).这个平均工资能代表一般工作人员一周的收入水平.12.解设第一组20名学生的成绩为x i(i=1,2,…,20),第二组20名学生的成绩为y i(i=1,2,…,20),依题意有:x=120(x1+x2+…+x20)=90,y=120(y1+y2+…+y20)=80,故全班平均成绩为:140(x1+x2+…+x20+y1+y2+…+y20)=140(90×20+80×20)=85;又设第一组学生成绩的标准差为s1,第二组学生成绩的标准差为s2,则s21=120(x21+x22+…+x220-20x2),s22=120(y21+y22+…+y220-20y2)(此处,x=90,y=80),又设全班40名学生的标准差为s,平均成绩为z(z=85),故有s2=140(x21+x22+…+x220+y21+y22+…+y220-40z2)=140(20s21+20x2+20s22+20y2-40z2)=12(62+42+902+802-2×852)=51.s=51.所以全班同学的平均成绩为85分,标准差为51.。
第二章 统 计2.1.1 简单随机抽样课时目标 1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎪⎨⎪⎧ 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.一、选择题1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是( )A .200个表示发芽天数的数值B .200个球根C .无数个球根发芽天数的数值集合D .无法确定答案 A2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是( )A .40B .50C .120D .150答案 C解析 由于样本容量即样本的个数,抽取的样本的个数为40×3=120.3.抽签法中确保样本代表性的关键是( )A .制签B .搅拌均匀C .逐一抽取D .抽取不放回答案 B解析 由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B .4.下列抽样实验中,用抽签法方便的有( )A .从某厂生产的3 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D .从某厂生产的3 000件产品中抽取10件进行质量检验答案 B解析 A 总体容量较大,样本容量也较大不适宜用抽签法;B 总体容量较小,样本容量也较小可用抽签法;C 中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D 总体容量较大,不适宜用抽签法.5.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A .1 000名运动员是总体B .每个运动员是个体C .抽取的100名运动员是样本D .样本容量是100答案 D解析 此问题研究的是运动员的年龄情况,不是运动员,故A 、B 、C 错,故选D .6.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( ) A .110,110 B .310,15C .15,310D .310,310答案 A二、填空题7.要检查一个工厂产品的合格率,从1 000件产品中抽出50件进行检查,检查者在其中随意抽取了50件,这种抽样法可称为________.答案 简单随机抽样解析 由简单随机抽样的特点可知,该抽样方法是简单随机抽样.8.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.答案 抽签法9.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)答案 ①③②三、解答题10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.解 利用抽签法,步骤如下:(1)将30辆汽车编号,号码是01,02, (30)(2)将号码分别写在一张纸条上,揉成团,制成号签;(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;(4)从袋子中依次抽取3个号签,并记录上面的编号;(5)所得号码对应的3辆汽车就是要抽取的对象.11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?解 (1)将元件的编号调整为010,011,012,…,099,100,…600;(2)在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7列数“9”,向右读;(3)从数“9”开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263;(4)以上号码对应的6个元件就是要抽取的样本.能力提升12.在简单随机抽样中,某一个个体被抽到的可能性( )A .与第几次抽样有关,第一次抽到的可能性大一些B .与第几次抽样无关,每次抽到的可能性相等C .与第几次抽样有关,最后一次抽到的可能性大些D .与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同答案 B解析 由简单随机抽样的特点知与第n 次抽样无关,每次抽到的可能性相等.13.某车间工人已加工一种轴50件,为了了解这种轴的直径是否符合要求,要从中抽出5件在同一条件下测量,试用两种方法分别取样.解 方法一 抽签法.(1)将50个轴进行编号01,02, (50)(2)把编号写在大小、形状相同的纸片上作为号签;(3)把纸片揉成团,放在箱子里,并搅拌均匀;(4)依次不放回抽取5个号签,并记下编号;(5)把号签对应的轴组成样本.方法二 随机数法(1)将50个轴进行编号为00,01, (49)(2)在随机数表中任意选定一个数并按向右方向读取;(3)每次读两位,并记下在00~49之间的5个数,不能重复;(4)把与读数相对应的编号相同的5个轴取出组成样本1.判断所给的抽样是否为简单随机抽样的依据是随机抽样的特征:简单随机抽样⎩⎪⎨⎪⎧ 个体有限逐个抽取不放回等可能性如果四个特征有一个不满足就不是简单随机抽样.2.利用抽签法抽取样本时应注意以下问题:(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.(2)号签要求大小、形状完全相同.(3)号签要搅拌均匀.(4)要逐一不放回抽取.3.在利用随机数表法抽样的过程中注意:(1)编号要求数位相同.(2)第一个数字的抽取是随机的.(3)读数的方向是任意的,且事先定好的.。
课时目标掌握茎叶图的制做方法.D.62,乙的中位数为36,∴甲、乙比赛得分的中位数之和为64.A.4%与51 B.16%与15C.4%与15 D.28%与51答案:A6.如图所示茎叶图是甲乙两班各5名学生的数学竞赛成绩若甲的平均成绩不大于乙的平均成绩,且a2-b-28=)为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校名,调查他们上学期使用多媒体进行教学的次数,结果用茎叶图表示名教师中,使用多媒体进行教学的次数在20名教师使用多媒共有10人,∴该校200100..某校开展“爱我海南、爱我家乡”摄影比赛,9位评委为参赛作品茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为无法看清,若记分员计算无误,的x对应的分数为最高≈91.4≠91.,去掉最低分88,其平均分为91,+92+91=91,解得x=1..甲、乙两个班级各随机选出15名同学进行测验,成绩的茎叶图如图所示.则甲、乙两班的最高成绩各是________,从图中看,________班的平均成绩较高.答案:96,92 乙三、解答题10.甲、乙两篮球运动员上赛季每场比赛的得分如下:甲:12,15,24,25,31,31,36,36,37,39,44,49,50.乙:8,13,14,16,23,26,28,33,38,39,51.试比较这两位运动员的得分水平.解:画出两人得分的茎叶图,为便于对比分析,可将茎放在中间共用,叶分列左、右两侧,如图所示从这个茎叶图可以看出,甲运动员的得分大致对称,平均得分、众数及中位数都是30多分.乙运动员的得分除一个51分外,也大致对称,平均得分、众数及中位数都是20多分.因此甲运动员发挥比较稳定,总体得分情况比乙好.11.从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294295 301 303 303 307308 310 314 319 323 325 325 328331 334 337 352乙品种:284 292 295 304 306 307 312 313315 315 316 318 318320 322 322 324 327 329 331 333336 337 343 356由以上数据设计茎叶图,并根据茎叶图写出两个统计结论.解:茎叶图如图:统计结论如下(可从中选两个):1.乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度).2.甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度更大).3.甲品种棉花的纤维长度的中位数为307 mm,乙品种棉花的纤维长度的中位数为318 mm.4.乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.能力提升12.1901年扬基队外垒手马利斯打破了鲁斯的一个赛季打出60个全垒打的记录.如图是扬基队的历年比赛中的鲁斯和马利斯每年击出的全垒打的比较图,这个茎叶图可以表明________作为全垒打的总体优势.答案:鲁斯解析:由茎叶图性质可知鲁斯每年击出的全垒打的个数比马利斯多.13.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17;在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,哪一篇文章作为科普读物较好?解:(1)(2)因为电脑杂志每个句子字数较少所以把电脑杂志作为科普读物好.电脑杂志作为科普读物通俗易懂、简明.。
用样本的频率分布估计总体分布课时目标.理解用样本的频率分布估计总体分布的方法.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.能够利用图形解决实际问题..用样本估计总体的两种情况()用样本的估计总体的分布.()用样本的估计总体的数字特征..数据分析的基本方法()借助于图形分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中,二是利用图形信息.()借助于表格分析数据的另一方法是用紧凑的改变数据的排列方式,此法是通过改变数据的,为我们提供解释数据的新方式..频率分布直方图在频率分布直方图中,纵轴表示,数据落在各小组内的频率用来表示,各小长方形的面积的总和等于..频率分布折线图和总体密度曲线()频率分布折线图连接频率分布直方图中各小长方形,就得到了频率分布折线图.()总体密度曲线随着样本容量的增加,作图时所分的增加,组距减小,相应的频率分布折线图就会越来越接近于一条,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比..茎叶图()适用范围:当样本数据较少时,用茎叶图表示数据的效果较好.()优点:它不但可以,而且可以,给数据的记录和表示都带来方便.()缺点:当样本数据时,枝叶就会很长,茎叶图就显得不太方便.一、选择题.下列说法不正确的是().频率分布直方图中每个小矩形的高就是该组的频率.频率分布直方图中各个小矩形的面积之和等于.频率分布直方图中各个小矩形的宽一样大.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的.一个容量为的样本,其数据的分组与各组的频数如下:组别(] (] (] (] (] (] (]频数则样本数据落在(]上的频率为().....辆汽车通过某一段公路时的时速的频率分布直方图如下图所示,则时速在[)的汽车大约有().辆.辆.辆.辆.如图是总体密度曲线,下列说法正确的是().组距越大,频率分布折线图越接近于它.样本容量越小,频率分布折线图越接近于它。
(本栏目内容,在学生用书中以独立形式分册装订!)一、选择题(每小题5分,共20分)1.已知一组数据为20,30,40,50,50,60,70,80,其中平均数、中位数和众数的大小关系是( ) A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数解析:由所给数据知,众数为50,中位数为50,平均数为50,所以众数=中位数=平均数.故选D.答案:D2.(2015·青岛高一期中)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲、乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则( )A .x 甲<x 乙,m 甲>m 乙B .x 甲<x 乙,m 甲<m 乙C .x 甲>x 乙,m 甲>m 乙D .x 甲>x 乙,m 甲<m 乙解析: 由题中茎叶图知,甲的平均数为(5+6+8+10+10+14+18+18+22+25+27+30+30+38+41+43)÷16=21.5625,乙的平均数为(10+12+18+20+22+23+23+27+31+32+34+34+38+42+43+48)÷16=28.5625,所以x 甲<x乙.甲的中位数为(18+22)÷2=20, 乙的中位数为(27+31)÷2=29, 所以m 甲<m 乙.故选B. 答案: B3.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( )A. 3 C .3D.85解析: 因为x =100+40+90+60+10100=3.所以s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=1100(20×22+10×12+30×12+10×22)=160100=85,所以s =2105.故选B.答案: B4.(2015·潍坊高一期中)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:则7个剩余分数的方差为( ) A.1169B.367 C .36 D.677解析: 由题图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.故s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.故选B.答案: B二、填空题(每小题5分,共15分)5.某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段[40,50),[50,60),…,[90,100]后画出如下频率分布直方图.估计这次考试的平均分为________.解析: 利用组中值估算抽样学生的平均分.45·f 1+55·f 2+65·f 3+75·f 4+85·f 5+95·f 6=45×0.1+55×0.15+65×0.15+75×0.3+85×0.25+95×0.05=71,平均分是71分. 答案: 71分6.甲、乙两人在相同的条件下练习射击,每人打5发子弹,命中的环数如表: 甲:6,8,9,9,8; 乙:10,7,7,7,9.则两人的射击成绩较稳定的是________. 解析: 由题意求平均数可得x 甲=x 乙=8,s 2甲=1.2,s 2乙=1.6, s 2甲<s 2乙,所以甲稳定.答案: 甲7.若40个数据的平方和是56,平均数是22,则这组数据的方差是________,标准差是________. 解析: 设这40个数据为x 1,x 2,…,x 40, 则s 2=140⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫x 1-222+⎝ ⎛⎭⎪⎫x 2-222+…+⎝⎛⎭⎪⎫x 40-222=140⎣⎢⎡⎦⎥⎤(x 21+x 22+…+x 240)+40×⎝ ⎛⎭⎪⎫222-2×22(x 1+x 2+…+x 40) =140×⎝ ⎛⎭⎪⎫56+20-2×22×40 =3640=910, 所以s =31010.答案:910 31010三、解答题(每小题10分,共20分)8.如图所示的是甲、乙两人在一次射击比赛中中靶的情况(击中靶中心的圆面为10环,靶中各数字表示该数字所在圆环被击中时所得的环数),每人射击了6次.(1)请用列表法将甲、乙两人的射击成绩统计出来;(2)请用学过的统计知识,对甲、乙两人这次的射击情况进行比较. 解析: (1)甲、乙两人的射击成绩统计表如下:(2) x 甲=16×(8×2+9×2+10×2)=9(环),x 乙=16×(7×1+9×3+10×2)=9(环),s 2甲=16×[(8-9)2×2+(9-9)2×2+(10-9)2×2]=23,s 2乙=16×[(7-9)2+(9-9)2×3+(10-9)2×2]=1,因为x 甲=x 乙,s 2甲<s 2乙,所以甲与乙的平均成绩相同,但甲的发挥比乙稳定.9.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.解析:所以a=0.005.(2)55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以平均分为73分.(3)分别求出语文成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为:5,20,40,25.所以数学成绩在[50,90)之外的人数有100-(5+20+40+25)=10(人).。
2.2.1 用样本的频率分布估计总体分布
课时目标 1.理解用样本的频率分布估计总体分布的方法.2.会列频率分布表,画频率分布直方图、频率分布折线图、茎叶图.3.能够利用图形解决实际问题.
1.用样本估计总体的两种情况
(1)用样本的____________估计总体的分布.
(2)用样本的____________估计总体的数字特征.
2.数据分析的基本方法
(1)借助于图形
分析数据的一种基本方法是用图将它们画出来,此法可以达到两个目的,一是从数据中____________,二是利用图形________信息.
(2)借助于表格
分析数据的另一方法是用紧凑的________改变数据的排列方式,此法是通过改变数据的____________,为我们提供解释数据的新方式.
3.频率分布直方图
在频率分布直方图中,纵轴表示____________,数据落在各小组内的频率用________________来表示,各小长方形的面积的总和等于____.
4.频率分布折线图和总体密度曲线
(1)频率分布折线图
连接频率分布直方图中各小长方形__________,就得到了频率分布折线图.
(2)总体密度曲线
随着样本容量的增加,作图时所分的____增加,组距减小,相应的频率分布折线图就会越来越接近于一条________,统计中称之为总体密度曲线,它反映了总体在各个范围内取值的百分比.
5.茎叶图
(1)适用范围:
当样本数据较少时,用茎叶图表示数据的效果较好.
(2)优点:它不但可以____________,而且可以__________,给数
据的记录和表示都带来方便.
(3)缺点:
当样本数据______时,枝叶就会很长,茎叶图就显得不太方便.
一、选择题
1.下列说法不正确的是( )
A.频率分布直方图中每个小矩形的高就是该组的频率
B.频率分布直方图中各个小矩形的面积之和等于1
C.频率分布直方图中各个小矩形的宽一样大
D.频率分布折线图是依次连接频率分布直方图的每个小矩形上端中点得到的
2.一个容量为100的样本,其数据的分组与各组的频数如下:
A.0.13 B.0.39 C.0.52 D.0.64
3.100辆汽车通过某一段公路时的时速的频率分布直方图如下图所
示,则时速在[60,70)的汽车大约有( )
A.30辆B.40辆
C.60辆D.80辆
4.如图是总体密度曲线,下列说法正确的是( )
A.组距越大,频率分布折线图越接近于它
B.样本容量越小,频率分布折线图越接近于它
C.阴影部分的面积代表总体在(a,b)内取值的百分比
D.阴影部分的平均高度代表总体在(a,b)内取值的百分比
5.一个容量为35的样本数据,分组后,组距与频数如下:[5,10),5个;[10,15),12个;[15,20),7个;[20,25),5个;[25,30),4个;[30,35),2个.则样本在区间[20,+∞)上的频率为( ) A.20% B.69%
C.31% D.27%
6.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是
36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )
A.90 B.75 C.60 D.45
7.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.
8.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________.
9.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a,b)是其中的一组,抽查出的个体在各组上的频率为m,该组上直方图的高为h,则|a-b|=________.
三、解答题
10.抽查100袋洗衣粉,测得它们的重量如下(单位:g):
494 498 493 505 496 492 485 483 508
511 495 494 483 485 511 493 505 488
501 491 493 509 509 512 484 509 510
495 497 498 504 498 483 510 503 497
502 511 497 500 493 509 510 493 491
497 515 503 515 518 510 514 509 499
493 499 509 492 505 489 494 501 509
498 502 500 508 491 509 509 499 495
493 509 496 509 505 499 486 491 492
496 499 508 485 498 496 495 496 505
499 505 496 501 510 496 487 511 501
496
(1)列出样本的频率分布表:
(2)画出频率分布直方图,频率分布折线图;
(3)估计重量在[494.5,506.5]g的频率以及重量不足500 g的频率.
能力提升
11.在某电脑杂志的一篇文章中,每个句子的字数如下:
10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11, 24,27,17
在某报纸的一篇文章中,每个句子的字数如下:
27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18, 46,32,22
(1)将这两组数据用茎叶图表示;
(2)将这两组数据进行比较分析,你会得到什么结论?
12.某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,
95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表.
(2)作出频率分布直方图.
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在
51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.
请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.
答案:2.2.1 用样本的频率分布估计总体分布
知识梳理
1.(1)频率分布(2)数字特征 2.(1)提取信息传递(2)表格构成形式 3.频率/组距小长方形的面积 1 4.(1)上端的中点(2)组数光滑曲线
5.(2)保留所有信息随时记录(3)较多
作业设计
1.A
2.C [样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52
100
=0.52.]
3.B [时速在[60,70)的汽车的频率为: 0.04×(70-60)=0.4, 又因汽车的总辆数为100,
所以时速在[60,70)的汽车大约有0.4×100=40(辆).] 4.C
5.C [由题意,样本中落在[20,+∞)上的频数为5+4+2=11,∴在区间[20,+∞)上的频率为11
35
≈0.31.]
6.A [∵样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36, ∴样本总数为36
0.3
=120.
∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,
∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.] 7.60
解析 ∵n·2+3+4
2+3+4+6+4+1=27,
∴n=60. 8.45,46
解析 由茎叶图及中位数的概念可知 x 甲中=45,x 乙中=46.
9.m h
解析 频率组距=h ,故|a -b|=组距=频率h =m h
.
10.解 (1)在样本数据中,最大值是518,最小值是483,它们相差35,若取组距为4,由于354=83
4,要分9组,组数合适,于是决
定取组距为4 g ,分9组,使分点比数据多一位小数,且把第一组起点稍微减小一点,得分组如下:
[482.5,486.5),[486.5,490.5),…,[514.5,518.5). 列出频率分布表:
正
正正正 正正正 正正正
(3)重量在[494.5,506.5]g 的频率为:0.21+0.14+0.09=0.44. 设重量不足500 g 的频率为b ,根据频率分布表,
b -0.49500-498.5≈0.63-0.48
502.5-498.5,故b≈0.55.因此重量不足500 g 的频
率约为0.55. 11.解 (1)
(2)电脑杂志上每个句子的字数集中在10~30之间;而报纸上每个句子的字数集中在20~40之间.还可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为科普读物需要通俗易懂、简明. 12.解 (1)频率分布表:
(2)
(3)答对下述两条中的一条即可:
①该市有一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315
;处于优或良的天数为28,占当月天数的1415
.说明该市空气质量基本良好. ②轻微污染有2天,占当月天数的115
;污染指数在80以上的接近轻微污染的天数15,加上处于轻微污染的天数2,占当月天数的1730
,
超过50%;说明该市空气质量有待进一步改善.。