第3讲统计
- 格式:doc
- 大小:514.43 KB
- 文档页数:13
专题八 概率与统计 第三讲 统计与统计案例——2023届高考理科数学大单元二轮复习练重点【新课标全国卷】1.在某次赛车中,50名参赛选手的成绩(单位:min )全部介于13到18之间(包括13和18).现将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18],其频率分布直方图如图所示.若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为( )A.11B.15C.35D.392.某学校组织学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[)20,40,[)40,60,[)60,80,[]80,100.若低于60分的人数是15人,则参加英语测试的学生人数是( )A.45B.50C.55D.603.我国是一个农业大国,从事农业工作的人员有5.4亿,如图为某县农村从业人员年龄结构图,为了解该县从业人员在从事农业工作中的实际困难,以推进县乡村振兴工作,某调查机构计划从某县的所有从业人员中随机抽取20人展开某项调研,则所抽取的20人中恰有2人的年龄在20岁以下的概率约为( ) (170.90.167≈,180.90.15≈,190.90.135≈,200.90.122≈)A.0.25B.0.29C.0.32D.0.354.某校高一年级在某次数学测验中成绩不低于80分的所有考生的成绩统计表如下:A.在[90,100]内B.在(100,110]内C.在(110,120]内D.在(120,130]内5.若某同学连续3次考试的名次(3次考试均没有出现并列名次的情况)不低于第3名,则称该同学为班级的尖子生.根据甲、乙、丙、丁四位同学过去连续3次考试名次的数据,推断一定是尖子生的是( )A.甲同学:平均数为2,众数为1B.乙同学:平均数为2,方差小于1C.丙同学:中位数为2,众数为2D.丁同学:众数为2,方差大于16.2021年某省高考体育百米测试中,成绩全部介于12秒与18秒之间,抽取其中100个样本,将测试结果按如下方式分成六组:第一组[12,13),第二组[13,14),…,第六组[17,18],得到如下的频率分布直方图.则该100考生的成绩的平均数和中位数(保留一位小数)分别是( )A.15.2 15.3B.15.1 15.4C.15.1 15.3D.15.2 15.37.设样本数据1x ,2x ,…,10x 的平均数和方差分别为1和4,若i i y x a =+(a 为非零常数,1,2,,10i =),则1y ,2y ,…,10y 的平均数和方差分别为( ) A.1a +,4B.1a +,4a +C.1,4D.1,4a +8.已知变量x ,y 之间的一组数据如下表:若y 关于x 的线性回归方程为0.7y x a =+,则a =( ) A.0.1B.0.2C.0.35D.0.459.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得经验回归直线方程0.6754.9y x =+,表中有一个数据模糊不清,请你推断出该数据的值为( )C.68 10.第24届冬季奥林匹克运动会将于2022年在北京举办.为了解某城市居民对冰雪运动的关注情况,随机抽取了该市100人进行调查统计,得到如下22⨯列联表.参考公式:()()()()2n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.附表:A.该市女性居民中大约有5%的人关注冰雪运动B.该市男性届民中大约有95%的人关注冰雪运动C.有95%的把握认为该市居民是否关注冰雪运动与性别有关D.有99%的把握认为该市居民是否关注冰雪运动与性别有关11.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为_______.12.经市场调查,某款热销品的销售量y(万件)与广告费用x(万元)之间满足回归直线方程 3.5=+.若样本点中心为(45,35),则当销售量为52.5万件时,可估计投入y bx的广告费用为_________________万元.13.某学校为了制订治理学校门口上学、放学期间家长接送孩子乱停车现象的措施,对全校学生家长进行了问卷调查.根据从中随机抽取的50份调查问卷,得到了如下的列联表:14.某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602.15.某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):1(优) (2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的22⨯列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.附:2()()()()K a b c d a c b d =++++,)2kk答案以及解析1.答案:A解析:由题意可得,成绩在[13,15)内的频率为10.080.320.380.22---=.又本次赛车中,共50名参赛选手,所以这50名选手中获奖的人数为500.2211⨯=.故选A. 2.答案:B解析:根据频率分布直方图的特点可知,低于60分的频率是(0.0050.01)200.3+⨯=,则所求学生人数是15500.3=. 3.答案:B解析:由频率分布直方图可得20岁以下的农村从业人员的概率为0.1,所以从所有从业人员中抽取20人,其中恰有2人的年龄在20岁以下的概率为221820C (0.1)(0.9)0.2850.29≈≈,故选B. 4.答案:B解析:由表可知,及格的考生共有401512105284+++++=人,在[90,100]内有40人,在(100,110]内有15人,故及格的所有考生成绩的中位数在(100,110]内.5.答案:B解析:甲同学:若平均数为2,众数为1,则有一次名次应为4,故排除A ;乙同学:平均数为2,设乙同学3次考试的名次分别为1x ,2x ,3x ,则方差()()()2222123122213s x x x ⎡⎤=-+-+-<⎣⎦,则()()()2221232223x x x -+-+-<,所以1x ,2x ,3x 均不大于3,符合题意;丙同学:中位数为2,众数为2,有可能是2,2,4,不符合题意;丁同学:众数为2,方差大于1,有可能是2,2,6,不符合题意.故选B. 6.答案:C解析:100名考生成绩的平均数12.50.1013.50.1514.50.15x =⨯+⨯+⨯+15.50.3016.50.2517.50.0515.1⨯+⨯+⨯=.因为前三组频率直方图面积和为0.100.150.150.4++=,前四组频率直方图面积和为0.100.150.150.300.7+++=,所以中位数位于第四组内,设中位数为a ,则(15)0.300.1a -⨯=,解得15.3a ≈,故选C.7.答案:A解析:由题意知i i y x a =+,即()1210110110y x x x a x a a =⨯++++=+=+,方差{}222212101()()()10x a x a x s a x a x a x a ⎡⎤⎡⎤⎡⎤=⨯+-+++-++++-+⎣⎦⎣⎦⎣⎦()()()22212101410x x x x x x ⎡⎤=⨯-+-++-=⎢⎥⎣⎦. 故选A. 8.答案:C解析:本题考查线性回归方程截距的求解.因为11(3456) 4.5,(2.534 4.5) 3.544x y =+++==+++=,所以0.7 3.50.7 4.50.35a y x =-=-⨯=,故选C. 9.答案:C解析:设表中模糊看不清的数据为m .由表中数据得30x =, 3075m y +=,将30730,5m x y +==代入经验回归方程0.6754.9y x =+,得68m =.故选C. 10.答案:C解析:由22⨯列联表中的数据可得()22352515251004.167 3.84160405050K ⨯-⨯⨯=≈>⨯⨯⨯,因此,有95%的把握认为该市居民是否关注冰雪运动与性别有关.故选:C.11.答案:88解析:根据题意,设剔除最高分、最低分之后的13个数据为1a ,2a ,3a ,…,13a ,由这13个数据的平均分为92,方差为16, 知()1231319213a a a a ++++=,()()()222121319292921613a a a ⎡⎤-+-++-=⎣⎦, 解得123131196a a a a ++++=,2221213110240a a a +++=,对于原始得分96,58,1a ,2a ,3a ,…,13a , 其平均数()12313196589015a a a a a =++++++=,其方差为()(()22222212131(9690)(5890)9090)908815s a a a ⎤⎡=-+-+-+-++-=⎣⎦. 12.答案:70解析:本题考查线性回归方程.依题意,将(45,35)代入回归直线方程 3.5y bx =+(提示:回归直线必过样本点中心),得3545 3.5b =⨯+,解得0.7b =,所以回归直线方程为0.7 3.5y x =+.令0.7 3.552.5y x =+=,得70x =. 13.答案:99.5%解析:因为2250(2015510)8.33325253020χ⨯⨯-⨯=≈⨯⨯⨯,又()27.8790.0050.5%P χ==≥,所以我们有99.5%的把握认为“是否同意限定区域停车与家长的性别有关”.14.答案:(1)产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%(2)平均数与标准差的估计值分别为30%,17%解析:(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=.产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为20%. (2)1(0.1020.10240.30530.50140.707)0.30100y =⨯-⨯+⨯+⨯+⨯+⨯=, ()52222111(0.40)2(0.20)100100i i i s n y y=⎡=-=⨯-⨯+-⨯⎣∑222240530.20140.4070.0296⎤+⨯+⨯+⨯=⎦,0.020.17s .所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.15.答案:(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得25.82055457030K =≈⨯⨯⨯. 由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.。
第3讲 统 计考情解读 (1)该部分常考内容:样本数字特征的计算、各种统计图表;有时也会在知识交汇点处命题,如概率与统计交汇等.(2)从考查形式上来看,大部分为填空题,重在考查基础知识、基本技能,有时在知识交汇点处命题,也会出现解答题,都属于中、低档题.错误!未找到引用源。
1.随机抽样(1)简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.(2)系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.(3)分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.2.常用的统计图表 (1)频率分布直方图 ①小长方形的面积=组距×频率组距=频率; ②各小长方形的面积之和等于1;③小长方形的高=频率组距,所有小长方形的高的和为1组距.(2)茎叶图在样本数据较少时,用茎叶图表示数据的效果较好. 3.用样本的数字特征估计总体的数字特征 (1)众数、中位数、平均数 数字特征 样本数据 频率分布直方图众数出现次数最多的数据 取最高的小长方形底边中点的横坐标 中位数将数据按大小依次排列,处在最中间位置的一个数据(或最中间两个数据的平均数)把频率分布直方图划分左右两个面积相等的分界线与x 轴交点的横坐标 平均数样本数据的算术平均数每个小矩形的面积乘以小矩形底边中点的横坐标之和(2)方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差:s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].热点一 抽样方法例1 (1)(2013·陕西)某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为________. (2)某学校共有师生3 200人,现用分层抽样的方法,从所有师生中抽取一个容量为160的样本,已知从学生中抽取的人数为150,那么该学校的教师人数是________.思维启迪 (1)系统抽样时需要抽取几个个体,样本就分成几组,且抽取号码的间隔相同;(2)分层抽样最重要的是各层的比例. 答案 (1)12 (2)200解析 (1)由84042=20,即每20人抽取1人,所以抽取编号落入区间[481,720]的人数为720-48020=24020=12. (2)本题属于分层抽样,设该学校的教师人数为x ,所以1603 200=160-150x,所以x =200. 思维升华 (1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.(1)某校高一、高二、高三分别有学生人数为495,493,482,现采用系统抽样方法,抽取49人做问卷调查,将高一、高二、高三学生依次随机按1,2,3,…,1 470编号,若第1组有简单随机抽样方法抽取的号码为23,则高二应抽取的学生人数为________.(2)(2014·广东)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________.答案 (1)17 (2)200,20解析 (1)由系统抽样方法,知按编号依次每30个编号作为一组,共分49组,高二学生的编号为496到988,在第17组到第33组内,第17组抽取的编号为16×30+23=503,为高二学生,第33组抽取的编号为32×30+23=983,为高二学生,故共抽取高二学生人数为33-16=17.(2)该地区中、小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20.热点二用样本估计总体例2(1)(2014·山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为___________________________________________________________________.错误!未找到引用源。
(2)PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,如图是根据某地某日早7点至晚8点甲、乙两个PM2.5监测点统计的数据(单位:毫克/每立方米)列出的茎叶图,则甲、乙两地浓度的方差较小的是________.甲乙20.04123 6930.0596210.06293310.079640.08770.09246思维启迪(1)根据第一组与第二组的人数和对应频率估计样本总数,然后利用第三组的频率和无疗效人数计算;(2)直接根据公式计算方差.答案(1)12(2)甲解析(1)志愿者的总人数为20(0.16+0.24)×1=50,所以第三组人数为50×0.36=18,有疗效的人数为18-6=12.(2)x甲=(0.042+0.053+0.059+0.061+0.062+0.066+0.071+0.073+0.073+0.084+0.086+0.097)÷12≈0.068 9,x乙=(0.041+0.042+0.043+0.046+0.059+0.062+0.069+0.079+0.087+0.092+0.094+0.096)÷12≈0.067 5,s 2=112[(0.042-0.068 9)2+(0.053-0.068 9)2+…+(0.097-0.068 9)2]≈0.000 212.s 2=112[(0.041-0.067 5)2+(0.042-0.067 5)2+…+(0.096-0.067 5)2]≈0.000 429.所以甲、乙两地浓度的方差较小的是甲地.思维升华 (1)反映样本数据分布的主要方式:频率分布表、频率分布直方图、茎叶图.关于频率分布直方图要明确每个小矩形的面积即为对应的频率,其高低能够描述频率的大小,高考中常常考查频率分布直方图的基本知识,同时考查借助频率分布直方图估计总体的概率分布和总体的特征数,具体问题中要能够根据公式求解数据的均值、众数和中位数、方差等. (2)由样本数据估计总体时,样本方差越小,数据越稳定,波动越小.(1)某商场在庆元宵促销活动中,对元宵节9时至14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为________万元.(2)(2014·陕西)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和方差分别为________. 答案 (1)10 (2)1+a,4解析 (1)由频率分布直方图可知: 0.100.40=2.5x,所以x =10. (2)x 1+x 2+…+x 1010=1,y i =x i +a ,所以y 1,y 2,…,y 10的均值为1+a ,方差不变仍为4. 热点三 概率与统计的综合应用例3 某高校组织自主招生考试,共有2 000名优秀同学参加笔试,成绩均介于195分到275分之间,从中随机抽取50名同学的成绩进行统计,将统计结果按如下方式分成8组:第1组[195,205),第2组[205,215),……,第8组[265,275].如图是按上述分组方法得到的频率分布直方图,且笔试成绩在260分(含260分)以上的同学进入面试.(1)估计所有参加笔试的2 000名同学中,参加面试的同学人数;(2)面试时,每位同学抽取两个问题,若两个问题全答错,则不能取得该校的自主招生资格;若两个问题均回答正确且笔试成绩在270分以上,则获A 类资格;其他情况下获B 类资格.现已知某中学有两人获得面试资格,且仅有一人笔试成绩为270分以上,在回答两个面试问题时,两人对每一个问题正确回答的概率均为12,求恰有一名同学获得该高校B 类资格的概率.思维启迪 (1)据频率分布直方图,先计算成绩在260分以上的同学的概率,再确定面试方面的人数;(2)列举两名同学的所有答题情况.解 (1)设第i (i =1,2,…,8)组的频率为f i ,则由频率分布直方图知f 7=1-(0.004+0.01+0.01+0.02+0.02+0.016+0.008)×10=0.12.所以成绩在260分以上的同学的概率P ≈f 72+f 8=0.14,2 000×0.14=280,故这2 000名同学中,取得面试资格的约为280人.(2)不妨设两名同学分别为M 、N ,且M 的笔试成绩在270分以上,则对于M ,答题的可能有M 11,M 10,M 01,M 00,对于N ,答题的可能有N 11,N 10,N 01,N 00,其中角标中的1表示正确,0表示错误,如N 10表示N 同学第一题正确,第二题错误. 将两名同学的答题情况列表如下:M 11 M 10 M 01 M 00 N 11 AB BB BB CB N 10 AB BB BB CB N 01 AB BB BB CB N 00ACBCBCCC表中AB 表示M 获A 类资格,N 获B 类资格; BC 表示M 获B 类资格,N 没有获得资格.所以恰有一名同学获得该高校B 类资格的概率为816=12.思维升华 解概率统计的综合问题的关键是从文字语言中提取数学信息,找出概率问题中的基本事件,列举基本事件总数,再利用古典概型的解法求解概率.某企业为了增强自身竞争力,计划对职工进行技术培训,以提高产品的质量,为了解某车间对技术培训的态度与性别的关系,对该车间所有职工进行了问卷调查得到了如下的列联表:赞成 不赞成 合计 男职工 22 8 30 女职工 8 12 20 合计302050(1)用分层抽样的方法在不赞成的职工中抽5人进行调查,其中男职工、女职工各抽取多少人? (2)在上述抽取的5人中选2人,求至少有一名男职工的概率. 解 (1)在不赞成的职工中抽5人, 则抽取比例为520=14,所以男职工应该抽取8×14=2(人),女职工应该抽取12×14=3(人).(2)上述抽取的5人中,男职工2人记为a ,b ,女职工3人记为c ,d ,e ,则从5人中选2人的所有情况为(a ,b ),(a ,c ),(a ,d ),(a ,e ),(b ,c ),(b ,d ),(b ,e ),(c ,d ),(c ,e ),(d ,e ),共10种情况.其中至少有一名男职工的情况有(a ,b ),(a ,c ),(a ,d ),(a ,e ),(b ,c ),(b ,d ),(b ,e ),共7种情况.故从上述抽取的5人中选2人,至少有一名男职工的概率为P =710.1.随机抽样的方法有三种,其中简单随机抽样适用于总体中的个体数量不多的情况,当总体中的个体数量明显较多时要使用系统抽样,当总体中的个体具有明显的层次时使用分层抽样.系统抽样最重要的特征是“等距”,分层抽样最重要的是各层的“比例”. 2.用样本估计总体(1)在频率分布直方图中,各小长方形的面积表示相应的频率,各小长方形的面积的和为1. (2)众数、中位数及平均数的异同:众数、中位数及平均数都是描述一组数据集中趋势的量,平均数是最重要的量.(3)当总体的个体数较少时,可直接分析总体取值的频率分布规律而得到总体分布;当总体容量很大时,通常从总体中抽取一个样本,分析它的频率分布,以此估计总体分布. ①总体期望的估计,计算样本平均值x =1n ∑n i =1x i .②总体方差(标准差)的估计:方差=1n ∑ni =1 (xi -x )2,标准差=方差,方差(标准差)较小者较稳定.真题感悟1.(2014·江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有________株树木的底部周长小于100 cm.答案24解析底部周长在[80,90)的频率为0.015×10=0.15,底部周长在[90,100)的频率为0.025×10=0.25,样本容量为60,所以树木的底部周长小于100 cm的株数为(0.15+0.25)×60=24. 2.(2014·重庆)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)甲组乙组909x 215y 8742 4已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为________.答案5,8解析由于甲组中有5个数,比中位数小的有两个数为9,12,比中位数大的也有两个数24,27,所以10+x=15,x=5.又因9+15+10+y+18+245=16.8,所以y=8.押题精练1.某教育出版社在高三期末考试结束后,从某市参与考试的考生中选取600名学生对在此期间购买教辅资料的情况进行调研,得到如下数据:购买图书情况只买试题类只买讲解类试题类和讲解类都买人数240200160若该教育出版社计划用分层抽样的方法从这600人中随机抽取60人进行座谈,则只买试题类的学生应抽取的人数为________.答案24解析 只买试题类的学生应抽取的人数为60×240600=24.2.某地区对某路段公路上行驶的汽车速度实施监控,从中抽取50辆汽车进行测速分析,得到如图所示的时速的频率分布直方图,根据该图,时速在70 km/h 以下的汽车有________辆.答案 20解析 时速在70 km/h 以下的汽车所占的频率为0.01×10+0.03×10=0.4,共有0.4×50=20(辆).3.如图是一次选秀节目上,七位评委为某选手打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数为85,则a 2+b 2的最小值是________.答案 32解析 方法一 根据题意,得4+a +6+b +75=5,得a +b =8,则b =8-a ,a 2+b 2=a 2+(8-a )2=2a 2-16a +64,其中a ,b 满足0≤a ≤9,0≤b ≤9,所以0≤a ≤9,0≤8-a ≤9,即0≤a ≤8且a 是整数.设函数f (a )=2a 2-16a +64,分析知当a =4时,f (a )取得最小值32,所以a 2+b 2的最小值是32.方法二 由a +b =8,且a ,b ≥0,得8≥2ab ,故ab ≤16,则a 2+b 2=(a +b )2-2ab ≥64-32=32,当且仅当a =b =4时等号成立,所以a 2+b 2的最小值是32.(推荐时间:50分钟)一、填空题1.(2014·湖南)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则p 1,p 2,p 3的大小关系是________. 答案 p 1=p 2=p 3解析 由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 2.某中学高中一年级有400人,高中二年级有320人,高中三年级有280人,现从中抽取一个容量为200人的样本,则高中二年级被抽取的人数为________. 答案 64解析 由已知,得样本容量为400+320+280=1 000, 所以,高中二年级被抽取的人数为2001 000×320=64.3.(2013·江西)总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为________.7816 6572 0802 6314 0702 4369 9728 0198 32049234493582003623486969387481答案 01解析 从第1行第5列、第6列组成的数65开始由左到右依次选出的数为:08,02,14,07,01,所以第5个个体编号为01.4.为了了解某城市今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为120,则抽取的学生人数是_____________________________________________.答案 480解析 由频率分布直方图知:学生的体重在65~75 kg 的频率为(0.012 5+0.037 5)×5=0.25, 则学生的体重在50~65 kg 的频率为1-0.25=0.75. 从左到右第2个小组的频率为0.75×26=0.25.所以抽取的学生人数是120÷0.25=480.5.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679以上两组数据的方差中较小的一个为s 2,则s 2=________________________________________________________________________. 答案 25解析 x 甲=7,s 2甲=15×[(6-7)2+(7-7)2+(7-7)2+(8-7)2+(7-7)2]=25,x 乙=7,s 2乙=15×[(6-7)2+(7-7)2+(6-7)2+(7-7)2+(9-7)2]=65, 所以s 2甲<s 2乙.由两组数据中方差较小的一个为s 2,即s 2=25.6.超速行驶已成为马路上最大杀手之一,已知某路段属于限速路段,规定通过该路段的汽车时速不超过70 km/h ,否则视为违规.某天,有1 000辆汽车经过了该路段,经过雷达测速得到这些汽车运行时速的频率分布直方图如图所示,则违规的汽车大约有________辆.答案 110解析 由题意,知时速超过70 km /h 的为违规汽车,由频率分布直方图可以得出超过70 km/h 的频率为0.011×10=0.11,所以违规的汽车大约有1 000×0.11=110(辆).7.某苗圃基地为了解基地内甲、乙两块地种植的同一种树苗的长势情况,从两块地各随机抽取了10株树苗,并用茎叶图表示出了两组数据,对两块地抽取树苗的高度的平均数x 甲,x乙和中位数y 甲,y 乙进行比较,结论是____________________.答案 x 甲<x 乙,y 甲<y 乙8.从某中学高一年级中随机抽取100名同学,将他们的成绩(单位:分)数据绘制成频率分布直方图(如图).则这100名学生成绩的平均数、中位数分别为________.答案 125,124解析 由图可知(a +a -0.005)×10=1-(0.010+0.015+0.030)×10,解得a =0.025,则x =105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.中位数在120~130之间,设为x ,则0.01×10+0.03×10+0.025×(x -120)=0.5,解得x =124.9.某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若记分员计算无误,则数字x 应该是__________.答案 1解析 当x ≥4时,89+89+92+93+92+91+947=6407≠91,∴x <4,∴89+89+92+93+92+91+x +907=91,∴x =1.10.(2013·辽宁)为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________. 答案 10解析 设5个班级中参加的人数分别为x 1,x 2,x 3,x 4,x 5,则由题意知x 1+x 2+x 3+x 4+x 55=7,(x 1-7)2+(x 2-7)2+(x 3-7)2+(x 4-7)2+(x 5-7)2=20, 五个整数的平方和为20,则必为0+1+1+9+9=20, 由|x -7|=3可得x =10或x =4. 由|x -7|=1可得x =8或x =6.由上可知参加的人数分别为4,6,7,8,10, 故最大值为10. 二、解答题11.为了了解2014年某校高三学生的视力情况,随机抽查了一部分学生的视力,将调查结果分组,分组区间为(3.9,4.2],(4.2,4.5],…,(5.1,5.4].经过数据处理,得到如下频率分布表:分组 频数 频率 (3.9,4.2] 3 0.06 (4.2,4.5] 6 0.12 (4.5,4.8] 25 x (4.8,5.1]yz(5.1,5.4] 2 0.04 合计n1.00(1)求频率分布表中未知量n ,x ,y ,z 的值;(2)从样本中视力在(3.9,4.2]和(5.1,5.4]的学生中随机抽取2人,求2人的视力差的绝对值低于0.5的概率.解 (1)由表,可知样本容量为n ,由2n =0.04,得n =50.所以x =2550=0.5,y =50-3-6-25-2=14,z =y n =1450=0.28.(2)设样本中视力在(3.9,4.2]的3人为a ,b ,c , 样本视力在(5.1,5.4]的2人为d ,e .由题意得从5人任取2人的所有基本事件有:(a ,d ),(a ,e ),(b ,d ),(b ,e ),(c ,d ),(c ,e ),(a ,b ),(a ,c ),(b ,c ),(d ,e )共10个. 设事件A 表示“抽取的2人视力差的绝对值低于0.5”,则事件A 包括4个基本事件. (a ,b ),(a ,c ),(b ,c ),(d ,e ).所以P (A )=410=25.故抽取的2人的视力差的绝对值低于0.5的概率为25.12.某驾校在招收新学员时,从一批报名者中随机抽取了10名,用对数视力表检查得到每个学员视力状况的茎叶图(小数点前一位的数字为茎,小数点后一位的数字为叶),如图所示.若视力不低于5.0,则称该学员“视力过关”.(1)若该组数据的平均数为4.82,求其中位数;(2)若从这10人中随机选取2人,求至少有1人视力过关的概率. 解 (1)由茎叶图,知该组数据的平均数为 x =4.2+4.5+4.6+4.8+4.8+(4+0.1x )+5.0+5.1+5.1+5.210=4.82.解得x =9.所以该组数据的中位数为4.8+4.92=4.85.(2)记视力不过关的人为1,2,3,4,5,6,视力过关的人为a ,b ,c ,d .则事件的总体结果为 (1,2),(1,3),(1,4),(1,5),(1,6),(1,a ),(1,b ),(1,c ),(1,d ),共9种(其中至少一人过关的有4种);(2,3),(2,4),(2,5),(2,6),(2,a ),(2,b ),(2,c ),(2,d ),共8种(其中至少一人过关的有4种); ……(a ,b ),(a ,c ),(a ,d ),共3种(其中至少一人过关的有3种); (b ,c ),(b ,d ),共2种(其中至少一人过关的有2种); (c ,d ),共1种(其中至少一人过关的有1种). 所以共有1+2+3+ (9)9(1+9)2=45(种)结果,其中至少有1人视力过关的结果有(4+4+4+4+4+4)+(3+2+1)=30(种). 故所求的概率为3045=23.。