人教A版高中数学必修三新课标第二章统计高考真题
- 格式:doc
- 大小:378.00 KB
- 文档页数:5
高中数学学习材料马鸣风萧萧*整理制作2.1.3 分层抽样 课时目标 1.理解分层抽样的概念.2.掌握分层抽样的使用条件和操作步骤,会用分层抽样法进行抽样.1.分层抽样的概念在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.一、选择题1.有40件产品,其中一等品10件,二等品25件,次品5件,现从中抽出8件进行质量分析,问应采取何种抽样方法( )A .抽签法B .随机数表法C .系统抽样D .分层抽样 答案 D2.某城市有学校700所.其中大学20所,中学200所,小学480所,现用分层抽样方法从中抽取一个容量为70的样本,进行某项调查,则应抽取中学数为( )A .70B .20C .48D .2答案 B解析 由于70070=10,即每10所学校抽取一所, 又因中学200所,所以抽取200÷10=20(所).3.某工厂生产A 、B 、C 三种不同型号的产品,产品的数量之比依次为3∶4∶7,现在用分层抽样的方法抽出容量为n 的样本,样本中A 型号产品有15件,那么样本容量n 为( )A .50B .60C .70D .80答案 C解析 由分层抽样方法得:33+4+7×n =15, 解得n =70.4.下列问题中,最适合用分层抽样方法抽样的是( )A .某电影院有32排座位,每排有40个座位,座位号是1~40.有一次报告会坐满了听众,报告会结束以后为听取意见,要留下32名听众进行座谈B .从10台冰箱中抽出3台进行质量检查C .某乡农田有山地8 000亩,丘陵12 000亩,平地24 000亩,洼地4 000亩,现抽取农田480亩估计全乡农田平均产量D .从50个零件中抽取5个做质量检验答案 C解析 A 的总体容量较大,宜采用系统抽样方法;B 的总体容量较小,用简单随机抽样法比较方便;C 总体容量较大,且各类田地的产量差别很大,宜采用分层抽样方法;D 与B 类似.5.要从其中有50个红球的1 000个球中,采用按颜色分层抽样的方法抽取100个进行分析,则应抽取红球的个数为( )A .5个B .10个C .20个D .45个答案 A解析 由题意知每1000100=10(个)球中抽取一个,现有50个红球,应抽取5010=5(个). 6.某小学三个年级共有学生270人,其中一年级108人,二、三年级各81人,现要用抽样方法抽取10人形成样本,将学生按一、二、三年级依次统一编号为1,2,…,270,如果 抽得号码有下列四种情况:①5,9,100,107,111,121,180,195,200,265;②7,34,61,88,115,142,169,196,223,250;③30,57,84,111,138,165,192,219,246,270;④11,38,60,90,119,146,173,200,227,254;其中可能是由分层抽样得到,而不可能是由系统抽样得到的一组号码为( )A .①②B .②③C .①③D .①④答案 D解析 按照分层抽样的方法抽取样本,一、二、三年级抽取的人数分别为:10827,8127,8127,即4人,3人,3人;不是系统抽样即编号的间隔不同,观察①、②、③、④知:①④符合题意,②是系统抽样,③中三年级人数为4人,不是分层抽样.二、填空题7.某农场在三种地上种玉米,其中平地210亩,河沟地120亩,山坡地180亩,估计产量时要从中抽取17亩作为样本,则平地、河沟地、山坡地应抽取的亩数分别是________.答案 7,4,6解析 应抽取的亩数分别为210×17510=7,120×17510=4,180×17510=6. 8.将一个总体分为A 、B 、C 三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C 中抽取________个个体.答案 20解析 由题意可设A 、B 、C 中个体数分别为5k,3k,2k ,所以C 中抽取个体数为2k 5k +3k +2k×100=20.9.某工厂生产A 、B 、C 、D 四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号有16件,那么此样本的容量n 为________.答案 88解析 在分层抽样中,每一层所抽的个体数的比例与总体中各层个体数的比例是一致的.所以,样本容量n =2+3+5+12×16=88. 三、解答题10.某小学有1 800名学生,6个年级中每个年级的人数大致相同,男女生的比例也大致相同,要从中抽取48名学生,测试学生100米跑的成绩.你认为应该用什么样的方法?怎样抽样?为什么要用这个方法?解 应该用分层抽样的方法.因为小学的不同年级之间,男女生之间百米跑的成绩有较大差异,所以将1 800名学生按不同年级、性别分成12组,每组随机抽取4名,一共抽取48名学生.这样的抽样方法可使样本的结构与总体的结构保持一致.11.某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3 000件,4 000件,8 000件.若要用分层抽样的方法从中抽取一个容量为150件产品的样本,应该如何抽样?解 总体中的个体数N =3 000+4 000+8 000=15 000,样本容量n =150,抽样比例为n N =15015 000=1100,所以应该在第1条流水线生产的产品中随机抽取3 000×1100=30(件)产品,在第2条流水线生产的产品中随机抽取4 000×1100=40(件)产品,在第3条流水线生产的产品中随机抽取8 000×1100=80(件)产品.这里因为每条流水线所生产的产品数都较多,所以,在每条流水线的产品中抽取样品时,宜采用系统抽样方法. 能力提升12.某单位有技师18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量增加1,则在采用系统抽样时,需要在总体中剔除1个个体,求样本容量n.解 因为采用系统抽样和分层抽样时不用剔除个体,所以n 是36的约数,且36n是6的约数,即n 又是6的倍数,n =6,12,18或36,又n +1是35的约数,故n 只能是4,6,34,综合得n =6,即样本容量为6.13.选择合适的抽样方法抽样,写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取3个.(2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个.(3)有甲厂生产的300个篮球,抽取10个.(4)有甲厂生产的300个篮球,抽取30个.解 (1)总体容量较小,用抽签法.①将30个篮球编号,号码为00,01, (29)②将以上30个编号分别写在完全一样的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的袋子中,充分搅拌;④从袋子中逐个抽取3个号签,并记录上面的号码;⑤找出和所得号码对应的篮球即可得到样本.(2)总体由差异明显的两个层次组成,需选用分层抽样法.①确定抽取个数.因为3010=3,所以甲厂生产的应抽取213=7(个),乙厂生产的应抽取93=3(个);②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本.(3)总体容量较大,样本容量较小,宜用随机数法.①将300个篮球用随机方式编号,编号为000,001, (299)②在随机数表中随机的确定一个数作为开始,如第8行第29列的数“7”开始.任选一个方向作为读数方向,比如向右读;③从数“7”开始向右读,每次读三位,凡不在000~299中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大宜用系统抽样法.①将300个篮球用随机方式编号,编号为001,002,003,…,300,并分成30段,其中每一段包含30030=10(个)个体; ②在第一段001,002,003,…,010这十个编号中用简单随机抽样抽出一个(如002)作为起始号码;③将编号为002,012,022,…,292的个体抽出,组成样本1.分层抽样的概念和特点当总体由有明显差别的几部分组成时,为了使抽取的样本更好地反映总体的情况,常采用分层抽样.分层抽样的优点是使样本具有较强的代表性,而且在各层抽样时又可灵活地选用不同的抽样法.2.三种抽样方法的选择简单随机抽样、系统抽样及分层抽样的共同特点是在抽样过程中每一个个体被抽取的机会都相等,体现了抽样方法的公平性和客观性.其中简单随机抽样是最基本的抽样方法,在系统抽样和分层抽样中都要用到简单随机抽样.当总体中的个体数较少时,常采用简单随机抽样;当总体中的个体数较多时,常采用系统抽样;当已知总体是由差异明显的几部分组成时,常采用分层抽样.。
学业分层测评(十二) 用样本的频率分布估计总体分布(建议用时:45分钟)[学业达标]一、选择题1.下列命题正确的是( )A .频率分布直方图中每个小矩形的面积等于相应组的频数B .频率分布直方图的面积为对应数据的频率C .频率分布直方图中各小矩形高(平行于纵轴的边)表示频率与组距的比D .用茎叶图统计某运动员得分:13,51,23,8,26,38,16,33,14,28,39时,茎是指中位数26【解析】 在频率分布直方图中,横轴表示样本数据;纵轴表示频率组距,由于小矩形的面积=组距×频率组距=频率,所以各小矩形的面积等于相应各组的频率,因此各小矩形面积之和等于1.【答案】 C2.将容量为100的样本数据,按由小到大排列分成8个小组,如下表所示:组号12345678频数 10 13 14 14 15 13 12 9第3组的频率和累积频率为( )A.0.14和0.37B.114和1 27C.0.03和0.06 D.314和637【解析】由表可知,第三小组的频率为14100=0.14,累积频率为10+13+14100=0.37.【答案】 A3.如图2-2-8所示是一容量为100的样本的频率分布直方图,则由图形中的数据可知样本落在[15,20)内的频数为()图2-2-8A.20B.30C.40 D.50【解析】样本数据落在[15,20)内的频数为100×[1-5×(0.04+0.1)]=30.【答案】 B4.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图2-2-9所示),则该样本的中位数、众数、极差分别是()图2-2-9A.46,45,56 B.46,45,53C.47,45,56 D.45,47,53【解析】由题意知各数为12,15,20,22,23,23,31,32,34,34,38,39,45,45,45,47,47,48,48,49,50,50,51,51,54,57,59,61,67,68,中位数是46,众数是45,最大数为68,最小数为12,极差为68-12=56.【答案】 A5.某学校组织学生参加英语测试,成绩的频率分布直方图如图2-2-10,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15人,则该班的学生人数是()图2-2-10A.45B.50C.55 D.60【解析】根据频率分布直方图的特点可知,低于60分的频率是(0.005+0.01)×20=0.3,所以该班的学生人数是150.3=50.【答案】 B二、填空题6.200辆汽车通过某一段公路时的时速的频率分布直方图如图2-2-11所示,时速在[50,60)的汽车大约有______辆.图2-2-11【解析】在[50,60)的频率为0.03×10=0.3,∴汽车大约有200×0.3=60(辆).【答案】607.(2016·东营高一检测)从甲、乙两个班中各随机选出15名同学进行随堂测验,成绩的茎叶图如图2212所示,则甲、乙两组的最高成绩分别是________,________,从图中看,________班的平均成绩较高.图2-2-12【解析】由茎叶图可知,甲班的最高分是96,乙班的最高分是92.甲班的成绩集中在60~80之间,乙班成绩集中在70~90之间,故乙班的平均成绩较高.【答案】9692乙8.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50度至350度之间,频率分布直方图如图2-2-13所示:图2-2-13(1)直方图中x的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.【解析】由于(0.002 4+0.003 6+0.006 0+x+0.002 4+0.001 2)×50=1,解得x=0.004 4;数据落在[100,250)内的频率是(0.003 6+0.006 0+0.004 4)×50=0.7,所以月用电量在[100,250)内的用户数为100×0.7=70.【答案】(1)0.004 4(2)70三、解答题9.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),实验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.2 3.52.5 2.6 1.2 2.7 1.5 2.9 3.0 3.1 2.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.3 1.41.60.5 1.80.6 2.1 1.1 2.5 1.2 2.7 0.5(1)分别计算两种药的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?【导学号:28750037】图2-2-14【解】(1)设A药观测数据的平均数为-x,B药观测数据的平均数为-y.由观测结果可得-x=120(0.6+1.2+1.2+1.5+1.5+1.8+2.2+2.3+2.3+2.4+2.5+2.6+2.7+2.7+2.8+2.9+3.0+3.1+3.2+3.5)=2.3,-y=120(0.5+0.5+0.6+0.8+0.9+1.1+1.2+1.2+1.3+1.4+1.6+1.7+1.8+1.9+2.1+2.4+2.5+2.6+2.7+3.2)=1.6.由以上计算结果可得-x>-y,因此可看出A药的疗效更好.(2)由观测结果可绘制茎叶图如图:从以上茎叶图可以看出,A药疗效的试验结果有710的叶集中在茎“2.”,“3.”上,而B 药疗效的试验结果有710的叶集中在茎“0.”,“1.”上,由此可看出A 药的疗效更好.10.为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图2-2-15),图中从左到右各小长方形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.图2-2-15(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?【解】 (1)频率分布直方图是以面积的形式反映了数据落在各小组内的频率大小的,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由频率分布直方图可估计,该校高一年级学生的达标率为: 17+15+9+32+4+17+15+9+3×100%=88%.[能力提升]1.如图2-2-16是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知()图2-2-16A.甲运动员的成绩好于乙运动员B.乙运动员的成绩好于甲运动员C.甲、乙两名运动员的成绩没有明显的差异D.甲运动员的最低得分为0分【解析】由茎叶图可以看出甲运动员的成绩主要集中在30至40之间,比较稳定,而乙运动员均匀地分布在10至40之间,所以甲运动员成绩较好.故选A.【答案】 A2.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图2-2-17所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()图2-2-17【解析】 借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.法一 由题意知样本容量为20,组距为5. 列表如下:分组 频数 频率 频率组距 [0,5) 1 120 0.01 [5,10) 1 120 0.01 [10,15) 4 15 0.04 [15,20) 2 110 0.02 [20,25) 4 15 0.04 [25,30) 3 320 0.03 [30,35)33200.03[35,40]21100.02合计201观察各选择项的频率分布直方图知选A.法二由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率组距也分别相等,比较四个选项知A正确,故选A.【答案】 A图2-2-183.某校开展“爱我海西,爱我家乡”摄影比赛,9位评委为参赛作品A给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x应该是________.【解析】当x≤4时,89+89+92+93+(90+x)+92+917=91,解之得x=1.当x>4时,易证不合题意.【答案】 14.某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图:(如图2-2-19所示)分组频数频率一组0≤t<500二组5≤t<10100.10三组10≤t<1510②四组15≤t<20①0.50五组20≤t≤25300.30合计100 1.00图2-2-19解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?【解】(1)样本容量是100.(2)①50②0.10所补频率分布直方图如图中的阴影部分:(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t<5×0+10×10+15×10+20×50+25×30100,即15≤t<20.所以旅客购票用时的平均数可能落在第四组.小课堂:如何培养中学生的自主学习能力?自主学习是与传统的接受学习相对应的一种现代化学习方式。
第二章 统 计2.1.1 简单随机抽样课时目标 1.理解并掌握简单随机抽样的概念、特点和步骤.2.掌握简单随机抽样的两种方法.1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎪⎨⎪⎧抽签法随机数法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.一、选择题1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是( )A .200个表示发芽天数的数值B .200个球根C .无数个球根发芽天数的数值集合D .无法确定答案 A2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是( )A .40B .50C .120D .150答案 C解析 由于样本容量即样本的个数,抽取的样本的个数为40×3=120.3.抽签法中确保样本代表性的关键是( )A .制签B .搅拌均匀C .逐一抽取D .抽取不放回答案 B解析 由于此问题强调的是确保样本的代表性,即要求每个个体被抽到的可能性相等.所以选B .4.下列抽样实验中,用抽签法方便的有( )A .从某厂生产的3 000件产品中抽取600件进行质量检验B .从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C .从甲、乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D .从某厂生产的3 000件产品中抽取10件进行质量检验答案 B解析 A 总体容量较大,样本容量也较大不适宜用抽签法;B 总体容量较小,样本容量也较小可用抽签法;C 中甲、乙两厂生产的两箱产品有明显区别,不能用抽签法;D 总体容量较大,不适宜用抽签法.5.为调查参加运动会的1 000名运动员的年龄情况,从中抽查了100名运动员的年龄,就这个问题来说,下列说法正确的是( )A .1 000名运动员是总体B .每个运动员是个体C .抽取的100名运动员是样本D .样本容量是100答案 D解析 此问题研究的是运动员的年龄情况,不是运动员,故A 、B 、C 错,故选D .6.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a “第一次被抽到”的可能性,“第二次被抽到”的可能性分别是( )A .110,110B .310,15C .15,310D .310,310答案 A二、填空题7.要检查一个工厂产品的合格率,从1 000件产品中抽出50件进行检查,检查者在其中随意抽取了50件,这种抽样法可称为________.答案 简单随机抽样解析 由简单随机抽样的特点可知,该抽样方法是简单随机抽样.8.福利彩票的中奖号码是从1~36个号码中选出7个号码来按规则确定中奖情况,这种从36个号码中选7个号码的抽样方法是________.答案 抽签法9.用随机数表法进行抽样,有以下几个步骤:①将总体中的个体编号;②获取样本号码;③选定随机数表开始的数字,这些步骤的先后顺序应该是________.(填序号)答案 ①③②三、解答题10.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.解 利用抽签法,步骤如下:(1)将30辆汽车编号,号码是01,02, (30)(2)将号码分别写在一张纸条上,揉成团,制成号签;(3)将得到的号签放入一个不透明的袋子中,并搅拌均匀;(4)从袋子中依次抽取3个号签,并记录上面的编号;(5)所得号码对应的3辆汽车就是要抽取的对象.11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数表法设计抽样方案?解 (1)将元件的编号调整为010,011,012,…,099,100,…600;(2)在随机数表中任选一数作为开始,任选一方向作为读数方向.比如,选第6行第7列数“9”,向右读;(3)从数“9”开始,向右读,每次读取三位,凡不在010~600中的数跳过去不读,前面已经读过的也跳过去不读,依次可得到544,354,378,520,384,263;(4)以上号码对应的6个元件就是要抽取的样本.能力提升12.在简单随机抽样中,某一个个体被抽到的可能性( )A .与第几次抽样有关,第一次抽到的可能性大一些B .与第几次抽样无关,每次抽到的可能性相等C .与第几次抽样有关,最后一次抽到的可能性大些D .与第几次抽样无关,每次都是等可能的抽取,但各次抽取的可能性不同答案 B解析 由简单随机抽样的特点知与第n 次抽样无关,每次抽到的可能性相等.13.某车间工人已加工一种轴50件,为了了解这种轴的直径是否符合要求,要从中抽出5件在同一条件下测量,试用两种方法分别取样.解 方法一 抽签法.(1)将50个轴进行编号01,02, (50)(2)把编号写在大小、形状相同的纸片上作为号签;(3)把纸片揉成团,放在箱子里,并搅拌均匀;(4)依次不放回抽取5个号签,并记下编号;(5)把号签对应的轴组成样本.方法二 随机数法(1)将50个轴进行编号为00,01, (49)(2)在随机数表中任意选定一个数并按向右方向读取;(3)每次读两位,并记下在00~49之间的5个数,不能重复;(4)把与读数相对应的编号相同的5个轴取出组成样本1.判断所给的抽样是否为简单随机抽样的依据是随机抽样的特征:简单随机抽样⎩⎪⎨⎪⎧ 个体有限逐个抽取不放回等可能性如果四个特征有一个不满足就不是简单随机抽样.2.利用抽签法抽取样本时应注意以下问题:(1)编号时,如果已有编号(如学号、标号等)可不必重新编号.(2)号签要求大小、形状完全相同.(3)号签要搅拌均匀.(4)要逐一不放回抽取.3.在利用随机数表法抽样的过程中注意:(1)编号要求数位相同.(2)第一个数字的抽取是随机的.(3)读数的方向是任意的,且事先定好的......................................使用本文档删除后面的即可致力于打造全网一站式文档服务需求,为大家节约时间文档来源网络仅供参考欢迎您下载可以编辑的word文档谢谢你的下载本文档目的为企业和个人提供下载方便节省工作时间,提高工作效率,打造全网一站式精品需求!欢迎您的下载,资料仅供参考!(本文档收集于网络改编,由于文档太多,审核难免疏忽,如有侵权或雷同,告知本店马上删除)。
(本栏目内容,在学生用书中以独立形式分册装订)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.从某年级500名学生中抽取60名学生进行体重的统计分析,下列说法正确的是()A.500名学生是总体B.每个被抽查的学生是样本C.抽取的60名学生的体重是一个样本D.抽取的60名学生是样本容量解析:答案: C2.如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为()A.0.2 B.0.4C.0.5 D.0.6解析:利用频率及茎叶图的知识直接运算求解.由题意知,这10个数据落在区间[22,30)内的有22、22、27、29,共4个,所以其频率为410=0.4,故选B.答案: B3.对于数据3,3,2,3,6,3,10,3,6,3,2,有以下结论:①这组数据的众数是3.②这组数据的众数与中位数的数值不等.③这组数据的中位数与平均数的数值相等.④这组数据的平均数与众数的数值相等.其中正确的结论有()A.1个B.2个C.3个D.4个解析:由题意知,众数与中位数都是3,平均数为4.只有①正确,故选A.答案: A4.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.y ∧=-10x +200B.y ∧=10x +200C.y ∧=-10x -200 D.y ∧=10x -200解析: ∵商品销售量y (件)与销售价格x (元/件)负相关,∴b ∧<0,排除B ,D.又∵x =0时,y ∧>0,∴故选A. 答案: A5.(2015·青岛高一期中)某校共有学生2 000名,各年级男、女生人数如表所示:( ) A .24 B .18 C .16D .12解析: 一年级的学生人数为373+377=750, 二年级的学生人数为380+270=750,于是三年级的学生人数为2 000-750-750=500, 那么三年级应抽取的人数为500×642 000=16.故选C. 答案: C6.(2015·大连高一检测)某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如下图,则下面结论中错误的一个是( )A .甲的极差是29B .乙的众数是21C .甲罚球命中率比乙高D .甲的中位数是24解析: 甲的极差是37-8=29;乙的众数显然是21;甲的平均数显然高于乙,即C 成立;甲的中位数应该是23.答案: D7.(2014·山东卷)为研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .1B .8C .12D .18解析: 由图知,样本总数为N =200.16+0.24=50.设第三组中有疗效的人数为x ,则6+x 50=0.36,解得x=12.答案: C8.如果在一次实验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是( )A.y ∧=x +1.9B.y ∧=1.04x +1.9C.y ∧=0.95x +1.04 D.y ∧=1.05x -0.9解析: x =14(1+2+3+4)=2.5,y =14(3+3.8+5.2+6)=4.5.因为回归方程过点(x ,y ),代入验证知,应选B.答案: B9.(2015·宝鸡高一检测)10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析: 把10个数据从小到大排列为10,12,14,14,15,15,16,17,17,17. 所以中位数b =15,众数c =17,平均数a =110×(10+12+14×2+15×2+16+17×3)=14.7.所以a <b <c .答案: D10.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示.以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是( )解析: 借助已知茎叶图得出各小组的频数,再由频率=频数样本容量求出各小组的频率,进一步求出频率组距并得出答案.方法一:由题意知样本容量为20,组距为5. 列表如下:方法二:由茎叶图知落在区间[0,5)与[5,10)上的频数相等,故频率、频率组距也分别相等.比较四个选项知A 正确,故选A.答案: A二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中横线上)11.(2015·郑州高一检测)将一个容量为m 的样本分成3组,已知第一组频数为8,第二、三组的频率为0.15和0.45,则m =________.解析: 由题意知第一组的频率为 1-(0.15+0.45)=0.4, 所以8m =0.4,所以m =20.答案: 2012.将某班的60名学生编号为01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.解析: 由于从60个中抽取5个,故分组的间距为12,又第一组的号码为04,所以其他四个号码依次是16,28,40,52.答案: 16,28,40,5213.(2015·盐城高一检测)某企业五月中旬生产A ,B ,C 三种产品共3 000件,根据分层抽样的结果,企业统计员制作了如下的统计表格:C 产品的样本容量多10,请你根据以上信息补全表格中的数据:________,________,________,________.(从左到右依次填入)解析: 由产品B 的数据可知该分层抽样的抽样比k =1301 300=110,设产品C 的样本容量为x ,则产品A 的样本容量为(x +10),那么x +10+130+x =3 000×110,解之得x =80,所以产品A 的样本容量为90,产品A 的数量为90÷110=900,产品C 的数量为80÷110=800.答案: 900 800 90 8014.某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为________.解析: 由频率分布图知,设90~100分数段的人数为x ,则x 0.40=900.05,所以x =720.答案: 720三、解答题(本大题共4小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤) 15.(本小题满分12分)已知一组数据按从小到大的顺序排列为-1,0,4,x,7,14,中位数为5,求这组数据的平均数与方差.解析: 由于数据-1,0,4,x,7,14的中位数为5,所以4+x2=5,x =6. 设这组数据的平均数为x ,方差为s 2,由题意得 x =16×(-1+0+4+6+7+14)=5,s 2=16×[(-1-5)2+(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2]=743. 16.(本小题满分12分)(2015·武威高一检测)为了了解小学生的体能情况,抽取了某校一个年级的部分学生进行一分钟跳绳次数测试,将取得数据整理后,画出频率分布直方图(如图).已知图中从左到右前三个小组频率分别为0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率.(2)参加这次测试的学生有多少人.(3)若次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率是多少. 解析: (1)由累积频率为1知,第四小组的频率为1-0.1-0.3-0.4=0.2. (2)设参加这次测试的学生有x 人,则0.1x =5, 所以x =50.即参加这次测试的学生有50人. (3)达标率为0.3+0.4+0.2=90%,所以估计该年级学生跳绳测试的达标率为90%.17.(本小题满分12分)(2015·乌鲁木齐高一检测)某高中在校学生2 000人,高一年级与高二年级人数相同并且都比高三年级多1人.为了响应市教育局“阳光体育”号召,该校开展了跑步和跳绳两项比赛,要求每人都参加而且只参加其中一项,各年级参与项目人数情况如下表:其中a ∶b ∶c =2∶3∶5,全校参与跳绳的人数占总人数的25.为了了解学生对本次活动的满意度,采用分层抽样从中抽取一个200人的样本进行调查,则高二年级中参与跑步的同学应抽取多少人?解析: 全校参与跳绳的人数占总人数的25,则跳绳的人数为25×2 000=800,所以跑步的人数为35×2 000=1 200.则a ∶b ∶c =2∶3∶5,所以a =210×1 200=240,b =310×1 200=360,c =510×1 200=600.抽取样本为200人,即抽样比例为2002 000=110,则在抽取的样本中,应抽取的跑步的人数为110×1 200=120,则跑步的抽取率为1201 200=110,所以高二年级中参与跑步的同学应抽取360×110=36(人).18.(本小题满分14分)某部门为了了解用电量y (单位:度)与气温x (单位:℃)之间的关系,随机统计了某4天的用电量与当天气温,因某天统计的用电量数据丢失,用t 表示,如下表:(1)由以上数据,求这4(2)若用电量与气温之间具有较好的线性相关关系,回归直线方程为y ∧=-2x +b ,且预测气温为-4 ℃时,用电量为2t 度.求t ,b 的值.解析: (1)x =14(18+13+10-1)=10,s =14[(18-10)2+(13-10)2+(10-10)2+(-1-10)2]=1942. (2)y =14(24+t +38+64)=t +1264,∴t +1264=-2×10+b ,即4b -t =206.① 又2t =-2×(-4)+b ,即2t -b =8.② 由①②得,t =34,b =60.。
第二章 统 计本章归纳整合 高考真题1.(2012·四川高考)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查.假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人.若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为( ).A .101B .808C .1 212D .2 012解析 四个社区抽取的总人数为12+21+25+43=101,由分层抽样可知,9612=N101,解得N =808.故选B. 答案 B2.(2011·福建高考)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,现用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为 ( ). A .6B .8C .10D .12解析 分层抽样的原理是按照各部分所占的比例抽取样本,设从高二年级抽取的学生数为n ,则3040=6n ,得n =8. 答案 B3.(2012·江西高考)小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( ).图1图2A.30% B.10% C.3% D.不能确定解析由题图2知,小波一星期的食品开支为300元,其中鸡蛋开支为30元,占食品开支的10%,而食品开支占总开支的30%,所以小波一星期的鸡蛋开支占总开支的百分比为3%,故选C.答案 C4.(2012·湖北高考)容量为20的样本数据,分组后的频数如下表:分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70)频数23454 2则样本数据落在区间[10,40)的频率为().A.0.35 B.0.45 C.0.55 D.0.65解析样本数据落在区间[10,40)的频数为2+3+4=9,故所求的频率为9 20=0.45.答案 B5.(2012·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是().A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析 由茎叶图可知中位数为46,众数为45,极差为68-12=56.故选A. 答案 A6.(2012·山东高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( ).A .众数B .平均数C .中位数D .标准差解析 由s =(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2n,可知B 样本数据每个变量增加2,平均数也增加2,但(x n -x -)2不变,故选D. 答案 D7.(2011·江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为( ).A .y =x -1B .y =x +1C .y =88+12xD .y =176解析 本题考查了线性回归知识,以及回归直线y =bx +a 恒过定点(x -,y -),也考查了学生的计算能力以及分析问题、解决问题的能力. 因为x -=174+176+176+176+1785=176,y -=175+175+176+177+1775=176,又y 对x 的线性回归方程表示的直线恒过点(x -,y -),所以将(176,176)代入A 、B 、C 、D 中检验知选C.答案 C8.(2012·湖北高考)一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有________人.解析 设抽取的女运动员有x 人,由题意可得,856=x42,解之得,x =6. 答案 69.(2012·浙江高考)某个年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为280的样本,则此样本中男生人数为________.解析 根据分层抽样的特点,此样本中男生人数为560560+420×280=160.答案 16010.(2012·广东高考)由正整数组成的一组数据x 1,x 2,x 3,x 4,其平均数和中位数都是2,且标准差等于1,则这组数据为________.(从小到大排列) 解析 设该组数据依次为x 1≤x 2≤x 3≤x 4, 则x 1+x 2+x 3+x 44=2,x 2+x 32=2,∴x 1+x 4=4,x 2+x 3=4,∵x 1,x 2,x 3,x 4∈N +,∴⎩⎨⎧x 1=1,x 2=1,x 3=3,x 4=3或⎩⎨⎧x 1=2,x 2=2,x 3=2,x 4=2.又∵标准差为1,∴x 1=1,x 2=1,x 3=3,x 4=3. 答案 1,1,3,311.(2010·安徽高考)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表; (2)作出频率分布直方图;(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染. 请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.解 (1)频率分布表:分组 频数 频率 [41,51) 2 230 [51,61) 1 130 [61,71) 4 430 [71,81) 6 630 [81,91) 10 1030 [91,101) 5 530 [101,111)2230(2)(3)答对下述两条中的一条即可:(i)该市一个月中空气污染指数有2天处于优的水平,占当月天数的115;有26天处于良的水平,占当月天数的1315;处于优或良的天数共有28天,占当月天数的1415.说明该市空气质量基本良好.(ii)轻微污染有2天,占当月天数的115.污染指数在80以上的接近轻微污染的天数有15天,加上处于轻微污染的天数,共有17天,占当月天数的1730,超过50%.说明该市空气质量有待进一步改善.精心整理资料,感谢使用!。
2.2.1 用样本的频率分布估计总体分布A级基础巩固一、选择题1.没有信息的损失,所有的原始数据都可以从图中得到的统计图是( )A.总体密度曲线B.茎叶图C.频率分布折线图D.频率分布直方图答案:B2.下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为( )B.C.D.解析:数据总个数n=10,又落在区间[22,30)内的数据个数为4,故所求的频率为410=0.4.答案:B3.某雷达测速区规定:凡车速大于或等于70 km/h的汽车视为“超速”,并将受到处罚.下图是某路段的一个检测点对300辆汽车的车速进行检测所得结果的频率分布直方图,则从图中可得出将被处罚的汽车数为( )A.30辆B.40辆C.60辆D.80辆解析:车速大于或等于70 km/h的汽车数为×10×300=60(辆).答案:C4.一个社会调查机构就某地区居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如图),为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出100人作进一步调查,则在[2 500,3 000)(单位:元)月收入段应抽出的人数为( )A.5 B.25 C.50 D.2 500解析:组距=500,在[2 500,3 000)的频率=0.000 5×500=,样本数为100,则在[2 500,3 000)内应抽100×=25(人).答案:B5.为了了解某校高三学生的视力情况,随机抽查了该校100名高三学生的视力情况,得到频率分布直方图如图所示,由于不慎将部分数据丢失,仅知道后5组的频数和为62.设视力在到之间的学生数为a,最大频率为,则a的值为( )A.27 B.48 C.54 D.64解析:由已知,视力在到之间的学生数为100×=32,又视力在到之间的频率为1-+0.5)×-62100=,所以视力在到之间的学生数为100×=22,所以视力在到之间的学生数a =32+22=54.答案:C二、填空题6.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:分组/分频数频率[80,90)①②[90,100)[100,110)[110,120)36[120,130)[130,140)12③[140,150]合计④根据上面的频率分布表,可以①处的数值为________,②处的数值为________. 解析:由位于[110,120)的频数为36,频率=36n=,得样本容量n =120,所以[130,140)的频率=12120=,②处的数值=1------=; ①处的数值为×120=3. 答案:37.从某小学随机抽取100名同学,将他们的身高(单位:cm)数据绘制成频率分布直方图(如图).由图中数据可知a =________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[140,150]内的学生中抽取的人数应为________.解析:所有小矩形的面积和等于10×++0.020+a +0.035)=1,解得a =;100名同学中,身高在[120,130)内的学生数是10××100=30,身高在[130,140)内的学生数是10××100=20,身高在[140,150]内的学生数是10××100=10,则三组内的总学生数是30+20+10=60,抽样比是1860=310,所以身高在[140,150]内的学生中选取的人数应为10×310=3.答案: 38.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如下:据此可估计该校上学期200名教师中,使用多媒体进行教学次数在[15,25)内的人数为________.答案:60三、解答题9.为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00-10:00间各自的点击量,得到如图所示的茎叶图.(1)甲网站点击量在[10,40]间的频率是多少? (2)甲、乙两个网站哪个更受欢迎?请说明理由.解:(1)甲网站点击量在[10,40]内的有17,20,38,32,共有4天,则频率为414=27. (2)甲网站的点击量集中在茎叶图的下方,而乙网站的点击量集中在茎叶图的上方,从数据的分布情况来看,甲网站更受欢迎.10.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少? 解:(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本容量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由题意估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3×100%=88%.B 级 能力提升1.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为( )A .6B .8C .12D .18解析:志愿者的总人数为20(+)×1=50,所以第三组的人数为50×=18,有疗效的人数为18-6=12.答案:C2.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,则运动员人数为4.答案:43.从高一学生中抽取50名参加调研考试,成绩的分组及各组的频数如下(单位:分): [40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[70,80)分的学生所占总体的百分比.解:(1)频率分布表如下:成绩分组频数频率[40,50)2[50,60)3[60,70)10[70,80)15[80,90)12[90,100]8合计50(2)由题意知组距为10,取小矩形的高根据表格画出如下的频率分布直方图:(3)由频率分布直方图,可估计成绩在[70,80)分的学生所占总体的百分比是×10==30%.。
2.2.2 用样本的数字特征估计总体的数字特征课时目标 1.会求样本的众数、中位数、平均数、标准差、方差.2.理解用样本的数字特征来估计总体数字特征的方法.3.会应用相关知识解决简单的统计实际问题.1.众数、中位数、平均数(1)众数的定义:一组数据中重复出现次数________的数称为这组数的众数.(2)中位数的定义及求法把一组数据按从小到大的顺序排列,把处于最______位置的那个数称为这组数据的中位数.①当数据个数为奇数时,中位数是按从小到大顺序排列的__________那个数.②当数据个数为偶数时,中位数为排列的最中间的两个数的________.(3)平均数①平均数的定义:如果有n个数x1,x2,…,xn,那么x=____________,叫做这n个数的平均数.②平均数的分类:总体平均数:________所有个体的平均数叫总体平均数.样本平均数:________所有个体的平均数叫样本平均数.2.标准差、方差(1)标准差的求法:标准差是样本数据到平均数的一种平均距离,一般用s表示.s=______________________________________________________________________ __.(2)方差的求法:标准差的平方s2叫做方差.s2=______________________________________________________________________ __.一、选择题1.下列说法正确的是( )A.在两组数据中,平均值较大的一组方差较大B.平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小C.方差的求法是求出各个数据与平均值的差的平方后再求和D.在记录两个人射击环数的两组数据中,方差大的表示射击水平高2.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有( )A.a>b>c B.a>c>bC.c>a>b D.c>b>a3.甲、乙两位同学都参加了由学校举办的篮球比赛,他们都参加了全部的7场比赛,平均得分均为16分,标准差分别为5.09和3.72,则甲、乙两同学在这次篮球比赛活动中,发挥得更稳定的是( )A.甲B.乙C.甲、乙相同D.不能确定4.一组数据的方差为s2,将这组数据中的每个数据都扩大3倍,所得到的一组数据的方差是( )A.13s2B.s2C.3s2D.9s25.如图是2010年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出分数的茎叶统计图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为( )A.84,4.84 B.84,1.6C.85,1.6 D.85,0.46.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为xA和xB ,样本标准差分别为sA和sB则( )A.xA >xB,sA>sBB.xA<xB,sA>sBC.xA >xB,sA<sBD.xA<xB,sA<sB7.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________. 8.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):.9.若a1,a2,…,a20,这20个数据的平均数为x,方差为0.20,则数据a1,a 2,…,a20,x这21个数据的方差为________.三、解答题10.甲、乙两人在相同条件下各射靶10次,每次射靶的成绩情况如图所示:(1)请填写表:(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和中位数相结合看(分析谁的成绩好些);③从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);④从折线图上两人射击命中环数的走势看(分析谁更有潜力).能力提升11.下面是一家快餐店所有工作人员(共7人)一周的工资表:(2)计算出的平均工资能反映一般工作人员一周的收入水平吗?(3)去掉总经理的工资后,再计算剩余人员的平均工资,这能代表一般工作人员一周的收入水平吗?12.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:1.平均数、众数、中位数都是描述数据的集中趋势的,其中平均数是最重要的量.众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使得无法客观地反映总体特征;中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也成为缺点,因为这些极端值有时是不能忽视的.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低.2.在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.3.极差、方差、标准差是描述数据的离散程度的,即各数据与其平均数的离散程度.标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.答案:2.2.2 用样本的数字特征估计总体的数字特征知识梳理1.(1)最多(2)中间①中间位置的②平均数(3)①x1+x2+…+xnn②总体中样本中2.(1)1n[(x1-x)2+(x2-x)2+…+(xn-x)2] (2)1n[(x1-x)2+(x2-x)2+…+(xn-x)2]作业设计1.B[A中平均值和方差是数据的两个特征,不存在这种关系;C中求和后还需取平均数;D中方差越大,射击越不平稳,水平越低.]2.D[由题意a=110(16+18+15+11+16+18+18+17+15+13)=15710=15.7,中位数为16,众数为18,即b=16,c=18,∴c>b>a.]3.B[方差或标准差越小,数据的离散程度越小,表明发挥得越稳定.∵5.09>3.72,故选B.]4.D[s20=1n[9x21+9x22+…+9x2n-n(3x)2]=9·1n(x21+x22+…+x2n-n x2)=9·s2(s2为新数据的方差).]5.C[由题意x=15(84+84+86+84+87)=85.s2=15[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]=15(1+1+1+1+4)=85=1.6.]6.B[样本A数据均小于或等于10,样本B数据均大于或等于10,故x A<x B,又样本B波动范围较小,故sA >sB.]7.91解析由题意得8.甲解析x甲=9,2S甲=0.4,x乙=9,2S乙=1.2,故甲的成绩较稳定,选甲.9.0.19解析这21个数的平均数仍为20,从而方差为121×[20×0.2+(20-20)2]≈0.19.10.解由折线图,知甲射击10次中靶环数分别为:9,5,7,8,7,6,8,6,7,7.将它们由小到大重排为:5,6,6,7,7,7,7,8,8,9.乙射击10次中靶环数分别为:2,4,6,8,7,7,8,9,9,10.也将它们由小到大重排为:2,4,6,7,7,8,8,9,9,10.(1)x甲=110×(5+6×2+7×4+8×2+9)=7010=7(环),x乙=110×(2+4+6+7×2+8×2+9×2+10)=7010=7(环),s2甲=110×[(5-7)2+(6-7)2×2+(7-7)2×4+(8-7)2×2+(9-7)2]=110×(4+2+0+2+4)=1.2,s2乙=110×[(2-7)2+(4-7)2+(6-7)2+(7-7)2×2+(8-7)2×2+(9-7)2×2+(10-7)2]=110×(25+9+1+0+2+8+9)=5.4.根据以上的分析与计算填表如下:2 S 甲<2S乙,∴甲成绩比乙稳定.②∵平均数相同,甲的中位数<乙的中位数,∴乙的成绩比甲好些.③∵平均数相同,命中9环及9环以上的次数甲比乙少,∴乙成绩比甲好些.④甲成绩在平均数上下波动;而乙处于上升势头,从第四次以后就没有比甲少的情况发生,乙较有潜力.11.解 (1)平均工资即为该组数据的平均数 x =17×(3 000+450+350+400+320+320+410)=17×5 250=750(元). (2)由于总经理的工资明显偏高,所以该值为极端值,因此由(1)所得的平均工资不能反映一般工作人员一周的收入水平.(3)除去总经理的工资后,其他工作人员的平均工资为:x ′=16×(450+350+400+320+320+410) =16×2 250=375(元). 这个平均工资能代表一般工作人员一周的收入水平. 12.解 设第一组20名学生的成绩为x i (i =1,2,…,20), 第二组20名学生的成绩为y i (i =1,2,…,20), 依题意有:x =120(x 1+x 2+…+x 20)=90,y =120(y 1+y 2+…+y 20)=80,故全班平均成绩为:140(x 1+x 2+…+x 20+y 1+y 2+…+y 20) =140(90×20+80×20)=85; 又设第一组学生成绩的标准差为s 1,第二组学生成绩的标准差为s 2,则s 21=120(x 21+x 22+…+x 220-20x 2),s 22=120(y 21+y 22+…+y 220-20y 2) (此处,x =90,y =80),又设全班40名学生的标准差为s ,平均成绩为z (z =85),故有s2=140(x21+x22+…+x220+y21+y22+…+y220-40z2)=140(20s21+20x2+20s22+20y2-40z2)=12(62+42+902+802-2×852)=51.s=51.所以全班同学的平均成绩为85分,标准差为51.。
高中数学 人教A 版 必修3 第二章 统计 高考复习习题(选择题101-200)含答案解析学校:___________姓名:___________班级:___________考号:___________一、单选题1.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A .B .C .D . 2.如果n 个数123,,,,n x x x x 的平均数为1,则12321,21,21,,21n x x x x ++++的平均数为( ).A . 3B . 4C . 5D . 6 3.下列有关命题的说法中错误的是A . 在频率分布直方图中,中位数左边和右边的直方图的面积相等 .B . 总和等于60.C . 在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越差.D . 对于命题:p x R ∃∈使得21x x ++<0,则:p x R ⌝∀∈,使210x x ++≥.4. 是一组已知统计数据,其中 , 令, 当 ( )时, 取到最小值A .B .C .D .5.2014年5月,国家统计局公布了《2013年农民工监测调查报告》,报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.根据以上统计图来判断以下说法错误的是()A.2013年农民工人均月收入的增长率是.B.2011年农民工人均月收入是元.C.小明看了统计图后说:“农民工2012年的人均月收入比2011年的少了”.D.2009年到2013年这五年中2013年农民工人均月收入最高.6.如图的茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损,则甲的平均成绩超过乙的平均成绩的概率为()A.B.C.D.7.下列说法:①残差可用来判断模型拟合的效果;②设有一个回归方程,变量x增加一个单位时,y平均增加5个单位;③线性回归方程必过;④在一个2×2列联表中,由计算得=13.079,则有99%的把握确认这两个变量间有关系(其中);其中错误的个数是()A.0B.1C.2D.3.8.从甲、乙两个城市分别随机抽取台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示),设甲乙两组数据的平均数分别为甲,乙,中位数分别为甲,乙,则().A.甲乙,甲乙B.甲乙,甲乙C.甲乙,甲乙D.甲乙,甲乙9.随着人民生活水平的提高,对城市空气质量的关注度也逐步增大,图2是某城市1月至8月的空气质量检测情况,图中一、二、三、四级是空气质量等级,一级空气质量最好,一级和二级都是质量合格天气,下面四种说法正确的是()①1月至8月空气合格天数超过20天的月份有5个②第二季度与第一季度相比,空气达标天数的比重下降了③8月是空气质量最好的一个月④6月份的空气质量最差A.①②③B.①②④C.①③④D.②③④10.已知回归直线斜率的估计值为1.23,样本点的中心为点,,当时,估计的值为()A.6.46B.7.46C.2.54D.1.3911.如图是某班50名学生身高的频率分布直方图,那么该班身高在(170,190]区间内的学生人数为()A . 20B . 25C . 30D . 4512.已知回归方程 ,而试验得到一组数据是 , , ,则残差平方和是( )A . 0.01B . 0.02C . 0.03D . 0.0413.已知某产品的投入资产 与销售收入 的统计数据如下表:根据上表可得回归方程 中的 ,则当投入资产为120万元时,销售收入约为A . 142万元B . 152 万元C . 154 万元D . 156 万元14.某工厂生产,,A B C 三咱不同型号的产品,产品数量之比依次为:3:5x ,现用分层抽样的方法抽出一个容量为n 的样本,样本中A 型号产品有16件, C 型号产品有40件,则( )A . 2,24x n ==B . 16,24x n ==C . 2,80x n ==D . 16,80x n == 15.某产品的广告费用x 于销售额y 的统计数据如下表:根据上表可得线性回归方程ˆybx a =+中的b 为9.4,据此模型预报广告费用为6万元时销售额为( )A . 63.6万元B . 65.5万元C . 67.7万元D . 72.0万元16.某校为了解本校高三学生学习的心理状态,采用系统抽样方法从 人中抽取 人参加某种测试,为此将他们随机编号为 ,分组后在第一组采用简单随机抽样的方法抽到的号码为 ,抽到的 人中,编号落在区间 的人做试卷 ,编号落在 的人做试卷 ,其余的人做试卷 ,则做试卷 的人数为( ) A . B . C . D .17.将参加夏令营的600名学生编号为:001,002,…,600. 采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003. 这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从495到600在第Ⅲ营区,三个营区被抽中的人数依次为( )A.26,16,8B.25,17,8C.25,16,9D.24,17,918.供电部门对某社区1000位居民2017年12月份人均用电情况进行统计后,按人均0,10,10,20,20,30,30,40,40,50五组,整理得到如下的频率分布用电量分为[)[)[)[)[]直方图,则下列说法错误的是()A.12月份人均用电量人数最多的一组有400人B.12月份人均用电量不低于20度的有500人C.12月份人均用电量为25度30,40—组的概率D.在这1000位居民中任选1位协助收费,选到的居民用电量在[)19.某篮球队甲、乙两名运动员练习罚球,每人练习10组,每组罚球40个.命中个数的茎叶图如图,则下面结论中错误的一个是()A.甲的极差是29B.甲的中位数是24C.甲罚球命中率比乙高D.乙的众数是2120.某家庭连续五年收入与支出如下表,已知与线性相关,回归方程为:,其中,据此预计该家庭2017年收入15万元,则支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元21.某单位有若干名员工,现抽取人去体检,若老、中、青人数之比为2:1:2,已知抽到10位中年人,则样本为 ( )A.40B.100C.80D.5022.某企业有职工450人,其中高级职工45人,中级职工135人,一般职工270人,现抽30人进行分层抽样,则各职称人数分别为()A.5,10,15B.5,9,16C.3,10,17D.3,9,1823.某校高一(1)班共有54人,如图是该班期中考试数学成绩的频率分布直方图,则100,120内的学生人数为成绩在[]A.36B.27C.22D.1124.某中学有高一学生400人,高二学生300人,高三学生500人,现用分层抽样的方法在这三个年级中抽取120人进行体能测试,则从高三抽取的人数应为( )A.40B.48C.80D.5025.已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A . 92,94B . 92,86C . 99,86D . 95,91 26.下列四个命题中错误的是( )A . 在一次试卷分析中,从每个考室中抽取第5号考生的成绩进行统计,不是简单随机抽样B . 对一个样本容量为100的数据分组,各组的频数如下:估计小于29的数据大约占总体的58%C . 设产品产量与产品质量之间的线性相关系数为0.91-,这说明二者存在着高度相关D . 通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如表列联表.则有99%以上的把握认为“选择过马路方式与性别有关”27.为了了解某校高三400名学生的数学学业水平测试成绩,制成样本频率分布直方图如图,规定不低于60分为及格,不低于80分为优秀,则及格率与优秀人数分别是( )A.60%,60B.60%,80C.80%,80D.80%,6028.大双和小双两兄弟同时参加驾考,在进行科目一考试前,两兄弟在网上同时进行了5次模拟测试,他们每一次的成绩统计如下表:,分别表示大双和小双两兄弟模拟测试成绩的平均数,s12,s22分别表示大双和小双两兄弟模拟测试成绩的方差,则有A.= , s12﹥ s22B.=, s12﹥s22C.﹥ , s12 = s22D.﹥, s12﹥s2229.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积的和的,且样本容量为160,则中间一组有频数为()A.32B.0.2C.40D.0.2530.某初级中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…3 ;使用系统抽样时,将学生统一编号为1,2,…3 ,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:① ,37,67,97,127,157,187,217,247,277;② ,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,300关于上述样本的下列结论中,正确的是()A . ②③都不能为系统抽样B . ②④都不能为分层抽样C . ①④都可能为系统抽样D . ①③都可能为分层抽样31.佳木斯一中从高二年级甲、乙两个班中各选出7名学生参加2017年全国高中数学联赛(黑龙江初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a 、b 满足a , G , b 成等差数列且x , G , y 成等比数列,则a b)A .4 B . 2 C . 9D . 8 32.下列说法:①将一组数据中的每个数据都乘以同一个非零常数a 后,标准差也变为原来的a 倍; ②设有一个回归方程35y x =-,变量x 增加1个单位时, y 平均减少5个单位; ③线性相关系数r 越大,两个变量的线性相关性越强;反之,线性相关性越弱;④在某项测量中,测量结果ξ服从正态分布()()21,0N σσ>,若ξ位于区域()0,1的概率为0.4,则ξ位于区域()1,+∞内的概率为0.6⑤利用统计量2χ来判断“两个事件,X Y 的关系”时,算出的2χ值越大,判断“X 与Y 有关”的把握就越大其中正确的个数是A . 1B . 2C . 3D . 433.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为12,,,n x x x ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ) A . 12,,,n x x x 的平均数 B . 12,,,n x x x 的标准差 C . 12,,,n x x x 的最大值 D . 12,,,n x x x 的中位数34.某中学高一年级从甲、乙两个班各选出7名学生参加国防知识竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x y 的值为( )A . 8B . 168C . 9D . 16935.在一次对人体脂肪含量和年龄关系的研究中,研究人员获得了一组样本数据,并制作成如图所示的人体脂肪含量与年龄关系的散点图.根据该图,下列结论中正确的是( )A . 人体脂肪含量与年龄正相关,且脂肪含量的中位数等于20%B . 人体脂肪含量与年龄正相关,且脂肪含量的中位数小于20%C . 人体脂肪含量与年龄负相关,且脂肪含量的中位数等于20%D . 人体脂肪含量与年龄负相关,且脂肪含量的中位数小于20%36.长郡中学将参加摸底测试的1200名学生编号为1,2,3,…,1200,从中抽取一个容量为50的样本进行学习情况调查,按系统抽样的方法分为50组,如果第一组中抽出的学生编号为20,则第四组中抽取的学生编号为 A . 68 B . 92 C . 82 D . 17037.中国诗词大会节目是央视首档全民参与的诗词节目,节目以“赏中华诗词、寻文化基因、品生活之美”为基本宗旨,力求通过对诗词知识的比拼及赏析,带动全民重温那些曾经学过的古诗词,分享诗词之美,感受诗词之趣,从古人的智慧和情怀中汲取营养,涵养心灵.如图是2016年中国诗词大会中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为1a , 2a ,则一定有( )A . 12a a >B . 21a a >C . 12a a =D . 1a , 2a 的大小与m 的值有关38.下列命题中正确命题的个数是( )(1)对于命题:p x R ∃∈,使得210x x ++<,则:p x R ⌝∀∈,均有210x x ++>;(2)命题“已知,x y R ∈,若3x y +≠,则2x ≠或1y ≠”是真命题; (3)回归直线的斜率的估计值为1.23,样本点的中心为()4,5,则回归直线方程为 1.230.08y x ∧=+;(4)3m =是直线()320m x my ++-=与直线650mx y -+=互相垂直的充要条件.A . 1B . 2C . 3D . 439.近日,一种牛奶被查出含有致癌物质,国家质监局调查了这种牛奶的100个相关数据,绘制成如图所示的频率分布直方图,再对落在[6,11),[21,26]两组内的数据按分层抽样方法抽取8个数据,然后从这8个数据中抽取2个,则最后得到的2个数据分别来自两组的取法种数是( )A . 10B . 13C . 15D . 1840.某校举行演讲比赛,9位评委给选手 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的 )无法看清,若统计员计算无误,则数字 应该是( )A . 5B . 4C . 3D . 241.从N 个编号中要抽取n 个号码入样,若采用系统抽样方法抽取,则分段间隔应为) ( )A .B . nC .D . 42.某公司某件产品的定价 与销量 之间的统计数据表如下,根据数据,用最小二乘法得出 与 的线性回归直线方程为,则表格中 的值为( )A . 25B . 30C . 40D . 45 43.已知样本12,,,n x x x 的平均数为x ;样本12,,,n y y y 的平均数为y (x y ≠),若样本12,,,n x x x , 12,,,n y y y 的平均数为()1z ax a y =+-则()*,,n m n m N ∈的大小关系为( )A .n m < B . n m > C . n m = D . 不能确定44.某工厂甲,乙,丙三个车间生产了同一种产品,数量分别为600件,400件,300件,用分层抽样方法抽取容量为n 的样本,若从丙车间抽取6件,则n 的值为( ) A . 18 B . 20 C . 24 D . 2645.为了检查某超市货架上的奶粉是否含有三聚氰胺,要从编号依次为1到50的袋装奶粉中抽取5袋进行检验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的5袋奶粉的编号可能是( )A . 5,10,15,20,25B . 2,4,8,16,32C . 1,2,3,4,5D . 7,17,27,37,4746.甲、乙、丙三人投掷飞镖,他们的成绩(环数)如下面的频数条形统计图所示.则甲、乙、丙三人训练成绩方差 甲 , 乙 , 丙的大小关系是( )A . 丙 乙 甲B . 丙 甲 乙C . 乙 丙 甲D . 乙 甲 丙47.从某项综合能力测试中抽取100人的成绩,统计如下,则这100个成绩的平均数为( )A . 3B . 2.5C . 3.5D . 2.7548.某班级统计一次数学测试后的成绩,并制成了如下的频率分布表,根据该表估计该班级的数学测试平均分为( )A . 80B . 81C . 82D . 8349.甲、乙、丙三名运动员在某次比赛中各射击20次,三人成绩如下表用分别表示甲、乙、丙三人这次射击成绩的标准差,则下列关系正确的是()A.B.C.D.50.在班级40名学生中,依次抽取学号为5,10,15,20,25,30,35,40的学生进行作业检查,这种抽样方法最有可能是A.简单随机抽样B.系统抽样C.分层抽样D.以上答案都不对51.对变量,有观测数据,得散点图;对变量,有观测数据,得散点图.由这两个散点图可以判断().A.变量与正相关,与正相关B.变量与正相关,与负相关C.变量与负相关,与正相关D.变量与负相关,与负相关52.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程,其中=0.76,.据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元B.11.8万元C.12.0万元D.12.2万元53.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为k:5:3,现用分层抽样方法抽出一个容量为120的样本,已知A种型号产品共抽取了24件,则C种型号产品抽取的件数为()A.24B.30C.36D.4054.某公司现有职员160人,中级管理人员30人,高级管理人员10人,要从其中抽取20个人进行身体健康检查,如果采用分层抽样的方法,则职员、中级管理人员和高级管理人员各应该抽取( )人 A . 8,15,7 B . 16,2,2 C . 16,3,1 D . 12,3,555.样本1a , 2a , ⋅⋅⋅, 5a 的平均数为样本1b , 2b , ⋅⋅⋅, 10b 的平均数为则样本1a , 2a , ⋅⋅⋅, 5a , 1b , 2b , ⋅⋅⋅, 10b 的平均数为( )A .B .C .D . 56.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程,变量 增加一个单位时, 平均增加 个单位; ③线性回归方程必过 );④在一个 列联表中,由计算得 ,则有 以上的把握认为这两个变量间有关系.其中错误..的个数是( ) A . B . C . D .57.已知,x y 的取值如右表所示:如果y 与x 呈线性相关,且线性回归方程为ˆy13bx =+,则b =( )A . 12-B . 12C . 110- D . 110 58.58.58.下表是某小卖部统计出的五天中卖出热茶的杯数与当天气温的对比表:若卖出热茶的杯数y 与气温x 近似地满足线性关系,则其关系式最接近的是( )A . 6y x =+B . 42y x =-+C . 260y x =-+D . 378y x =-+59.已知一组数据 的平均数是2,方差是,那么另一组数据 的平均数和方差分别为( ) A . 2,B . 2,1C . 4,D . 4,360.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图. 根据该折线图,下列结论正确的是( )A . 月接待游客逐月增加B . 年接待游客量逐年减少C . 各年的月接待游客量高峰期大致在6、7月D . 各年1月至6月的月接待游客量相对于7月至12月,波动性较小,变化比较稳定 61.为了了解高一、高二、高三的身体状况,现用分层抽样的方法抽出一个容量为的样本,三个年级学生数之比依次为,已知高一年级共抽取了人,则高三年级抽取的人数为( ) A .B .C .D .62.设某大学的女生体重 (单位: )与身高 (单位: )具有线性相关关系,根据一组样本数据 ,用最小二乘法建立的回归方程为 ,则下列结论中不正确...的是( ) A . 与 具有正的线性相关关系 B . 回归直线过样本点的中心C . 若该大学某女生身高增加 ,则其体重约增加D . 若该大学某女生身高为 ,则可断定其体重必为63.某校食堂的原料费支出与销售额(单位:万元)之间有如下数据,22555根据表中提供的数据,用最小二乘法得出对的回归直线方程为8.5.5ˆ7yx =+,则表中m 的值为 ( ) A . 60 B . 50 C . 55 D . 6564.2014年5月12日,国家统计局公布了《2013年农民工监测调查报告》,报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.图1 图2 根据以上统计图来判断以下说法错误的是 A . 2013年农民工人均月收入的增长率是 B . 2011年农民工人均月收入是 元C . 小明看了统计图后说:“农民工2012年的人均月收入比2011年的少了”D . 2009年到2013年这五年中2013年农民工人均月收入最高65.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则与 之间的回归直线方程是 ( ) A .= +1.9 B . =1.04 +1.9 C .=1.9 +1.04 D . =1.05 -0.966.下列说法中正确的个数为()①若样本数据 的平均数 ,则样本数据 的平均数为10②将一组数据中的每个数据都减去同一个数后,平均数与方差均没有变化③采用系统抽样法从某班按学号抽取5名同学参加活动,学号为 的同学均被选出,则该班学生人数可能为60 A . 0 B . 1 C . 2 D . 367.已知一组数据m ,4,2,5,3的平均数为n ,且m 、n 是方程2430x x -+=的两根,则这组数据的方差为( )A .B . 2C .D . 1068.68.阅读如下程序框图,如果输出i =4,那么空白的判断框中应填入的条件是( ).A . S <8B . S <9C . S <10D . S <1169.宏伟公司有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该公司职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的中年职工为5人,则样本容量为( ) A . 7 B . 15 C . 25 D . 3570.对四组不同数据进行统计,分别获得以下散点图,如果对它们的相关系数进行比较,下列结论中正确的是( )A . r 2<r 4<0<r 3<r 1B . r 4<r 2<0<r 1<r 3C . r 4<r 2<0<r 3<r 1D . r 2<r 4<0<r 1<r 371.已知,x y 的取值如下表所示从散点图分析y 与x 的线性关系,且0.95ˆyx a =+,则a =( ) A . 2.2 B . 3.36 C . 2.6 D . 1.9572.根据下图给出的2011年至2016年某企业关于某产品的生产销售(单位:万元)的柱形图,以下结论不正确的是( )A . 逐年比较,2014年是销售额最多的一年B . 这几年的利润不是逐年提高(利润为销售额减去总成本)C . 2011年至2012年是销售额增长最快的一年D . 2014年以来的销售额与年份正相关73.从某企业生产的某种产品中随机抽取10件,测量这些产品的一项质量指标值,其频率分布表如下:则可估计这种产品质量指标值的方差为( )A.140B.142C.143D.14474.为了研究某药厂的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为、、、、,将其按从左到右的顺序分别编号为第一组、第二组、……、第五组,右图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.1875.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为:[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是()A.45 B.50C.55 D.6076.某工厂一年中各月份的收入、支出情况的统计如图所示,下列说法中错误的是()注:(结余=收入-支出)A.收入最高值与收入最低值的比是3:1B.结余最高的月份是7月份C.1至2月份的收入的变化率与4至5月份的收入的变化率相同D.前6个月的平均收入为40万元77.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为和,样本标准差分别为s A和s B,则( )(A)>,s A >s B (B)<,s A >s B (C)>,s A <s B (D)<,s A <s B78.下列判断错误的是( )A . 若随机变量ξ服从正态分布()()21,,40.79N P σξ≤=,则()20.21P ξ≤-=B . 若n 组数据()()11,,,,n n x y x y 的散点图都在21y x =-+上,则相关系数1r =-C . 若随机变量ξ服从二项分布: ,则1E ξ=D . “22am bm <”是“a b <”的必要不充分条件 79.已知x 与y 之间的一组数据则x 与y 的线性回归方程ˆˆˆybx a =+必过点( ) A . ()2,2 B . ()1.5,4 C . ()1.5,0 D . ()1,280.以下茎叶图记录了甲,乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( ) A . 2,5 B . 5,5 C . 5,8 D . 8,881.某考察团对全国10大城市进行职工人均工资水平x (千元)与居民人均消费水平y(千元)统计调查发现, y 与x 具有相关关系,回归方程为0.66.52ˆ16yx =+.若某城市居民人均消费水平为7.675 (千元),估计该城市人均消费额占人均工资收入的百分比约为( )A .B .C .D . 82.供电部门对某社区1000位居民2016年11月份人均用电情况进行统计后,按人均用电量分为[)010,, [)1020,, [)2030,, [)3040,, []4050,五组,整理得到如下的频率分布直方图,则下列说法错误的是( )A . 11月份人均用电量人数最多的一组有400人B . 11月份人均用电量不低于20度的有500人C . 11月份人均用电量为25度D . 在这1000位居民中任选1位协助收费,选到的居民用电量在[)3040,一组的概率83.某市对在职的91名高中数学教师就支持新的数学教材还是支持旧的数学教材做了调查,结果如表所示:附表:给出相关公式及数据: n a b c d =+++()212232234222784⨯-⨯=, 345746454011660⨯⨯⨯=.参照附表,得到的正确结论是( )A . 在犯错误的概率不超过0.001的前提下,认为“教龄的长短与支持新教材有关”B . 在犯错误的概率不超过0.050的前提下,认为“教龄的长短与支持新教材有关”C . 在犯错误的概率不超过0.010的前提下,认为“教龄的长短与支持新教材有关”D . 我们没有理由认为“教龄的长短与支持新教材有关”84.现用系统抽样方法从已编号(1-60)的60枚新型导弹中,随机抽取6枚进行试验,则所选取的6枚导弹的编号可能是( )A .5,10,15,20,25,30B .2,4,8,16,32,48C .5,15,25,35,45,55D .1,12,34,47,51,6085.设某中学的女生体重y (kg )与身高x (cm )具有线性相关关系,根据一组样本数(),i i x y ()1,2,3,,i n =,用最小二乘法建立的线性回归直线方程为ˆ0.8585.71yx =-,给出下列结论,则错误的是( ) A .y 与x 具有正的线性相关关系B .若该中学某女生身高增加1cm ,则其体重约增加0.85kgC .回归直线至少经过样本数据(),i i x y ()1,2,3,,i n =中的一个D 86.经统计,某地的财政收入x 与支出y 满足的线性回归模型是y bx a e =++ (单位:亿元).10亿元,则今年支出预计不超出( )A . 10亿元B . 11亿元C . 11.5亿元D . 12亿元87.样本点 的样本中心与回归直线的关系是( ) A . 在直线附近 B . 在直线左上方 C . 在直线右下方 D . 在直线上 88.以下四个命题,正确的是( )①从匀速传递的产品生产流水线上,质检员每10分钟从中抽取一件产品进行某项指标检测,这样的抽样是分层抽样;②两个随机变量相关性越强,则相关系数的绝对值越接近于1;③在回归直线方程中,当变量每增加一个单位时,变量一定增加0.2单位;④对于两分类变量与,求出其统计量,越小,我们认为“与有关系”的把握程度越小.A.①④ B.②③ C.①③ D.②④89.随机调查某校50个学生在“六一”儿童节的午餐费,结果如下表:这50个学生“六一”节午餐费的平均值和方差分别是()A. 4.2,0.56B. 4.2,C.4,0.6D.4,90.某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名,从这70人中用分层抽样的方法抽取容量为14的样本,则在高二年级学生中应该抽取的人数为()A.6B.8C.10D.1291.为支援西部教育事业,从某校118名教师中随机抽取16名教师组成暑期西部讲师团.若先用简单随机抽样从118名教师中剔除6名,剩下的112名再按系统抽样的方法进行,则每人入选的可能性()A.不全相等 BC.均不相等 D92.某学院有个饲养房,分别养有只白鼠供实验用.某项实验需抽取只白鼠,你认为最合适的抽样方法是()A.在每个饲养房各抽取只B.把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定只C.从个饲养房分别抽取只D . 先确定这个饲养房应分别抽取只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定93.某社区有800户家庭,其中高收入家庭200户,中等收入家庭480户,低收入家庭120户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本,记作①;某学校高一年级有12名音乐特长生,要从中选出3名调查学习训练情况,记作②.那么完成上述两项调查应采用的抽样方法是( )A . ①用简单随机抽样②用系统抽样B . ①用分层抽样②用简单随机抽样C . ①用系统抽样②用分层抽样D . ①用分层抽样②用系统抽样94.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量95.一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列{}n a ,若38a =,且137,,a a a 成等比数列,则此样本的平均数和中位数分别是 ( )A . 13,12B . 13,13C . 12,13D . 13,1496.北京市2016年12个月的 平均浓度指数如图所示.由图判断,四个季度中 的。
人教新课标A版高中数学必修3 第二章统计 2.2用样本估计总体 2.2.2用样本的数字特征估计总体同步测试B卷姓名:________ 班级:________ 成绩:________一、单选题 (共15题;共30分)3. (2分)若样本+2,+2,,+2的平均数为10,方差为3,则样本2+3,2+3,… ,2+3,的平均数、方差、标准差是()A . 19,12,B . 23,12,C . 23,18,D . 19,18,4. (2分)数据a1,a2,a3,...an的方差为,则数据2a1,2a2,2a3,...2an的方差为()A .B .C .D .6. (2分) (2019高三上·广州月考) 某同学用“随机模拟方法”计算曲线与直线所围成的曲边三角形的面积时,用计算机分别产生了10个在区间[1,e]上的均匀随机数xi和10个在区间[0,1]上的均匀随机数,其数据如下表的前两行.x 2.50 1.01 1.90 1.22 2.52 2.17 1.89 1.96 1.36 2.22y0.840.250.980.150.010.600.590.880.840.10lnx0.900.010.640.200.920.770.640.670.310.80由此可得这个曲边三角形面积的一个近似值为()A .B .C .D .7. (2分)某班级有50名学生,其中有30名男生和20名女生.随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A . 这种抽样方法是一种分层抽样B . 这种抽样方法是一种系统抽样C . 这五名男生成绩的方差大于这五名女生成绩的方差D . 该班男生成绩的平均数小于该班女生成绩的平均数10. (2分)用样本的频率分布来估计总体情况时,下列选项中正确的是()A . 估计准确与否值与所分组数有关B . 样本容量越大,估计结果越准确C . 估计准确与否值域总体容量有关D . 估计准确与否与样本容量无关11. (2分)如果两组数x1 , x2 ,…,xn和y1 , y2 ,…,yn的平均数分别为和,标准差分别为s1和s2 ,那么合为一组数x1 , x2 ,…,xn , y1 , y2 ,…,yn后的平均数和标准差分别是()A . + ,B . + ,C . ,D . ,12. (2分)(2017·青岛模拟) 一个公司有8名员工,其中6名员工的月工资分别为5200,5300,5500,6100,6500,6600,另两名员工数据不清楚,那么8位员工月工资的中位数不可能是()A . 5800B . 6000C . 6200D . 640015. (2分)数学测验中,某小组14名学生分别与全班的平均分85分的差是:2,3,-3,-5,12,12,8,2,-1,4,-10,-2,5,5,这个小组的平均分是()A . 97.2B . 87.29C . 92.32D . 82.86二、填空题 (共5题;共6分)16. (1分)已知样本2,3,x,6,8的平均数是5,则此样本的方差为________.17. (1分)已知一组数据x1 , x2 , x3 , x4 , x5的平均数是2,方差是,那么另一组数据3x1﹣2,3x2﹣2,3x3﹣2,3x4﹣2,3x5﹣2的平均数和方差分别是________.19. (1分) (2016高一下·湖南期中) 为了了解学生遵守《中华人民共和国交通安全法》的情况,调查部门在某学校进行了如下的随机调查:向被调查者提出两个问题:(1)你的学号是奇数吗?(2)在过路口的时候你是否闯过红灯?要求被调查者背对调查人抛掷一枚硬币,如果出现正面,就回答第(1)个问题;否则就回答第(2)个问题.被调查者不必告诉调查人员自己回答的是哪一个问题,只需要回答“是”或“不是”,因为只有被调查本人知道回答了哪个问题,所以都如实做了回答.如果被调查的600人(学号从1到600)中有180人回答了“是”,由此可以估计在这600人中闯过红灯的人数是________.20. (2分) (2020·随县模拟) 2020年年初,新冠肺炎疫情袭击全国.口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产.设该工厂连续5天生产的口罩数依次为,,,,(单位:十万只),若这组数据,,,,的方差为1.44,且,,,,的平均数为4,则该工厂这5天平均每天生产口罩________十万只.三、解答题 (共5题;共25分)25. (5分) (2017高二下·瓦房店期末) 为了研究家用轿车在高速公路上的车速情况,交通部门对100名家用轿车驾驶员进行调查,得到其在高速公路上行驶时的平均车速情况为:在55名男性驾驶员中,平均车速超过100km/h的有40人,不超过100km/h的有15人.在45名女性驾驶员中,平均车速超过100km/h的有20人,不超过100km/h的有25人.(1)完成下面的列联表,并判断是否有99.5%的把握认为平均车速超过100km/h的人与性别有关.平均车速超过100km/h人数平均车速不超过100km/h人数合计男性驾驶员人数女性驾驶员人数合计(2)以上述数据样本来估计总体,现从高速公路上行驶的大量家用轿车中随机抽取3辆,记这3辆车中驾驶员为男性且车速超过100km/h的车辆数为,若每次抽取的结果是相互独立的,求的分布列和数学期望.参考公式与数据:,其中0.1500.1000.0500.0250.0100.0050.0012.072 2.7063.841 5.024 6.6357.87910.828参考答案一、单选题 (共15题;共30分)3-1、4-1、6-1、7-1、10-1、11-1、12-1、15-1、二、填空题 (共5题;共6分)16-1、17-1、19-1、20-1、三、解答题 (共5题;共25分)25-1、25-2、。
第二章 统 计
本章归纳整合 高考真题
1.(2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率
分布直方图估计,样本数据落在区间[10,12)内的频数为 ( ).
A .18
B .36
C .54
D .72 解析 本题主要考查频率分布直方图的有关知识,考查了识图能力,属容易题.由0.02+0.05+0.15+0.19=0.41,
∴落在区间[2,10]内的频率为0.41×2=0.82. ∴落在区间[10,12)内的频率为1-0.82=0.18.
∴样本数据落在区间[10,12)内的频数为0.18×200=36. 答案 B
2.(2011·山东高考)某产品的广告费用x 与销售额y 的统计数据如下表:
根据上表可得回归方程y =b x +a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为
( ).
A .63.6万元
B .65.5万元
C .67.7万元
D .72.0万元
解析 本小题考查了对线性回归方程的理解及应用,求解的关键是明确线性回归方程必过样本中心点(x ,y ),同时考查计算能力. ∵x =4+2+3+54=72,y =49+26+39+54
4
=42,
又y ^
=b ^
x +a ^
必过(x ,y ),∴42=7
2
×9.4+a ^,∴a ^
=9.1.
∴线性回归方程为y ^
=9.4x +9.1.
∴当x =6时,y ^
=9.4×6+9.1=65.5(万元). 答案 B
3.(2011·福建高考)某校选修乒乓球课程的学生中,高一年级有30名,高二年级有40名.现
用分层抽样的方法在这70名学生中抽取一个样本,已知在高一年级的学生中抽取了6名,则在高二年级的学生中应抽取的人数为 ( ). A .6 B .8 C .10 D .12
解析 本题是随机抽样中的分层抽样,题目简单,考查基础知识.设样本容量为N ,则N ×3070=6,∴N =14,∴高二年级所抽人数为14×40
70=8.
答案 B
4.(2011·陕西高考)设(x
1,y 1),(x 2,y 2),…,(x n ,y n )是变量
x 和y 的n 个样本点,直线l 是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是
( ).
A .x 和y 的相关系数为直线l 的斜率
B .x 和y 的相关系数在0到1之间
C .当n 为偶数时,分布在l 两侧的样本点的个数一定相同
D .直线l 过点(x ,y )
解析 本题主要考查统计案例中线性回归直线方程的意义及对相关系数的理解.因为相关系数是表示两个变量是否具有线性相关关系的一个值,它的绝对值越接近1,两个变量的线性相关程度越强,所以A 、B 错误.C 中n 为偶数时,分布在l 两侧的样本点的个数可以不相同,所以C 错误.根据回归直线方程一定经过样本中心点可知D 正确. 答案 D
5.(2011·江西高考)为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知
识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则 ( ).
A .m e =m o =x
B .m e =m o <x
C .m e <m o <x
D .m o <m e <x
解析 本题考查了读图、识图能力以及对中位数、众数、平均数的理解.30个数中第15个数是5,第16个数是6,所以中位数为5+6
2=5.5,众数为5,
x =
3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=179
30
.
答案 D
6.(2011·江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:
则y 对x ( ).
A .y =x -1
B .y =x +1
C .y =88+1
2
x D .y =176
解析 本题考查了线性回归知识,以及回归直线y =bx +a 恒过定点(x ,y ),也考查了学生的计算能力以及分析问题、解决问题的能力. 因为x =174+176+176+176+178
5
=176,
y =
175+175+176+177+177
5
=176,
又y 对x 的线性回归方程表示的直线恒过点(x ,y ),所以将(176,176)代入A 、B 、C 、D 中检验知选C. 答案 C
7.(2011·天津高考)一支田径队有男运动员48人,女运动员36人.若用分层抽样的方法从该
队的全体运动员中抽取一个容量为21的样本,则抽取男运动员的人数为________. 解析 本小题考查分层抽样知识和处理信息的能力,难度很小.样本的抽取比例为
21
48+36
=14
, 所以应抽取男运动员48×1
4=12(人).
答案 12
8.(2011·浙江高考)某中学为了解学生数学课程的学习情况,在3 000名学生中随机抽取200
名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图).根据频率分布直方图推测,这 3 000名学生在该次数学考试中成绩小于60分的学生数是________.
解析 本题考查频率分布直方图的应用,难度较小.由直方图易得数学考试中成绩小于60分的频率为(0.002+0.006+0.012)×10=0.2,所以所求分数小于60分的学生数为3 000×0.2=600. 答案 600
9.(2010·安徽高考)某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污
染物为可吸入颗粒物):
61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.
(1)完成频率分布表; (2)作出频率分布直方图;
(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染. 请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价. 解 (1)频率分布表:
(2)
(3)答对下述两条中的一条即可:
(i)该市一个月中空气污染指数有2天处于优的水平,占当月天数的1
15;有26天处于良的
水平,占当月天数的1315;处于优或良的天数共有28天,占当月天数的14
15.说明该市空气质
量基本良好.
(ii)轻微污染有2天,占当月天数的1
15.污染指数在80以上的接近轻微污染的天数有15天,
加上处于轻微污染的天数,共有17天,占当月天数的17
30,超过50%.说明该市空气质量有
待进一步改善.。