2018年高考数学专题15统计与统计案例小题精练B卷(含解析)
- 格式:doc
- 大小:1.05 MB
- 文档页数:11
专题十五统计、统计案例卷Ⅰ卷Ⅱ卷Ⅲ2018统计图的识别与分析·T3折线图、线性回归方程模型问题·T18茎叶图的应用及独立性检验·T182017______- 频率分布直方图、独立性检验·T18折线图的识别与分析·T32016________ _______ 统计图表的识别与分析·T4折线图、相关性检验、线性回归方程及应用·T18纵向把握趋势卷Ⅰ3年1考,题型为选择题且难度较小,涉及统计图的识别与分析.预计2019年会以选择题的形式考查折线图、线性回归方程等问题,难度适中卷Ⅱ3年2考,题型均为解答题的第18题,涉及折线图、频率分布直方图、线性回归方程、独立性检验,难度适中.预计2019年仍会以解答题的形式考查独立性检验或线性回归模型的应用卷Ⅲ3年4考,既有选择题也有解答题,小题主要考查统计图表、折线图的识别与分析,解答题考查线性回归方程的应用及独立性检验.预计2019年会以解答题的形式考查线性回归模型的应用,同时以选择题的形式考查统计图表的识别与分析横向把握重点1.统计与统计案例在选择题或填空题中的命题热点主要集中在随机抽样、用样本估计总体以及变量间的相关性判断等,难度较低,常出现在3~4题的位置.2.统计与统计案例在解答题中多出现在18或19题,多考查直方图、茎叶图及数字特征计算、统计案例的应用.抽样方法1.(2018·石家庄模拟)某校高一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为( )A.80 B.120C.160 D.240解析:选A 因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该抽取男生的人数为140×44+3=80,故选A.2.(2018·南宁模拟)已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )A.100,20 B.200,20C.200,10 D.100,10解析:选B 由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是 2 000×2%=40,由题图乙可知高中生的近视率为50%,所以高中生的近视人数为40×50%=20,故选 B.3.从30个个体(编号为00~29)中抽取10个样本,现给出某随机数表的第11行到第15行(见下表),如果某人选取第12行的第6列和第7列中的数作为第一个数并且由此数向右读,则选取的前4个的号码分别为( )9264 4607 2021 3920 7766 3817 3256 16405858 7766 3170 0500 2593 0545 5370 78142889 6628 6757 8231 1589 0062 0047 38155131 8186 3709 4521 6665 5325 5383 27029055 7196 2172 3207 1114 1384 4359 4488A.76,63,17,00 B.16,00,02,30C.17,00,02,25 D.17,00,02,07解析:选D 在随机数表中,将处于00~29的号码选出,满足要求的前4个号码为17,00,02,07.4.(2019届高三·南昌调研)某校高三(2)班现有64名学生,随机编号为0,1,2,…,63,依编号顺序平均分成8组,组号依次为1,2,3,…,8.现用系统抽样方法抽取一个容量为8的样本,若在第1组中随机抽取的号码为5,则在第6组中抽取的号码为________.解析:由题知分组间隔为648=8,又第1组中抽取的号码为5,所以第6组中抽取的号码为5×8+5=45.答案:455.采用系统抽样方法从1 000人中抽取50人做问卷调查,将他们随机编号1,2,…,1 000.适当分组后在第一组采用简单随机抽样的方法抽到的号码为8.若抽到的50人中,编号落入区间[1,400]的人做问卷A ,编号落入区间[401,750]的人做问卷B ,其余的人做问卷C ,则抽到的人中,做问卷C 的人数为________.解析:根据系统抽样的特点可知,所有做问卷调查的人的编号构成首项为8,公差d =1 00050=20的等差数列{a n },∴通项公式a n =8+20(n -1)=20n -12,令751≤20n -12≤1 000,得76320≤n ≤2535,又∵n ∈N *,∴39≤n ≤50,∴做问卷C 的共有12人.答案:12[系统方法]解决抽样问题应关注的两点(1)解决此类题目的关键是深刻理解各种抽样方法的特点和适用范围.但无论哪种抽样方法,每一个个体被抽到的概率都是相等的,都等于样本容量与总体容量的比值.(2)在系统抽样的过程中,要注意分段间隔,需要抽取n 个个体,样本就需要分成n 个组,则分段间隔即为Nn(N 为样本容量),首先确定在第一组中抽取的个体的号码数,再从后面的每组中按规则抽取每个个体.用样本估计总体1.(2019届高三·贵阳模拟)在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是( )A .15B .18C .20D .25解析:选 A 根据频率分布直方图,得第二小组的频率是0.04×10=0.4,∵频数是40,∴样本容量是400.4=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,∴成绩在80~100分的学生人数是100×0.15=15.2.(2018·全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半解析:选A 设新农村建设前,农村的经济收入为a,则新农村建设后,农村经济收入为2a.新农村建设前后,各项收入的对比如下表:新农村建设前新农村建设后新农村建设后变化情况结论种植收入60%a 37%×2a=74%a 增加A错其他收入4%a 5%×2a=10%a 增加一倍以上B对养殖收入30%a 30%×2a=60%a 增加了一倍C对养殖收入+第三产业收入(30%+6%)a=36%a(30%+28%)×2a=116%a超过经济收入2a的一半D对3.(2018·长春质检)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( )A.95,94 B.92,86C.99,86 D.95,91解析:选 B 由茎叶图可知,此组数据由小到大排列依次为76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选 B.4.(2018·武汉调研)从某选手的7个得分中去掉1个最高分,去掉1个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为________.解析:去掉一个最高分99分,一个最低分87分,剩余的得分为93分,90分,(90+x )分,91分,87分,则93+90+90+x +91+875=91,解得x =4,所以这5个数的方差s 2=15[(91-93)2+(91-90)2+(91-94)2+(91-91)2+(91-87)2]=6.答案:6[系统方法]1.频率分布直方图的应用(1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据.(2)已知频率分布直方图,求某种范围内的数据.可利用图形及某范围结合求解.2.数字特征及其特点平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.平均数、中位数、众数描述数据的集中趋势,方差和标准差描述数据的波动大小.回归分析角度一 线性回归分析[例1] (2018·陕西质检)基于移动互联网技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,带给人们新的出行体验.某共享单车运营公司的市场研究人员为了解公司的经营状况,对该公司2018年6月~11月六个月内的市场占有率进行了统计,结果如下表:月份 6月 7月 8月 9月 10月 11月 月份代码x 1 2 3 4 5 6 市场占有率y (%)111316152021(1)请在给出的坐标纸中作出散点图,并用相关系数说明能否用线性回归模型拟合市场占有率y 与月份代码x 之间的关系;(2)求y 关于x 的线性回归方程,并预测该公司2019年3月份的市场占有率.参考数据:∑i =16(x i -x )2=17.5,∑i =16(x i -x )(y i -y )=35,1 330≈36.5.参考公式:相关系数r =∑i =1nx i -xy i -y∑i =1nx i -x2∑i =1ny i -y2;回归直线方程为y ^=b ^x +a ^,其中b ^=∑i =1nx i -xy i -y∑i =1nx i -x2,a ^=y -b ^x .[解] (1)作出散点图如下. ∵y =11+13+16+15+20+216=16,∴∑i =16(y i -y )2=76,∴r =∑i =16x i -xy i -y∑i =16x i -x2∑i =16y i -y2=3517.5×76=351 330≈3536.5≈0.96.∴两变量之间具有较强的线性相关关系,故可用线性回归模型拟合市场占有率y 与月份代码x 之间的关系.(2)由参考数据及(1)知b ^=∑i =16x i -xy i -y∑i =16x i -x2=3517.5=2,x =1+2+3+4+5+66=3.5,∴a ^=y -b ^x =16-2×3.5=9, ∴y 关于x 的线性回归方程为y ^=2x +9.2019年3月的月份代码为x =10,∴y ^=2×10+9=29,∴估计该公司2019年3月份的市场占有率为29%. [类题通法]1.求线性回归方程的步骤 (1)计算x ,y ;(2)计算∑i =1nx i y i ,∑i =1nx 2i ;(3)计算b ^=∑i =1n x i -xy i -y∑i =1nx i -x2=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2;a ^=y -b ^x ;(4)写出线性回归方程y ^=b ^x +a ^.[注意] 样本点的中心(x ,y )必在回归直线上. 2.相关系数r(1)当r >0时,表明两个变量正相关; 当r <0时,表明两个变量负相关.(2)r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r |大于0.75时,认为两个变量有很强的线性相关性.角度二 非线性回归分析[例2] 某机构为研究某种图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的关系,收集了一些数据并进行了初步处理,得到了下面的散点图及一些统计量的值.x y u∑i =18(x i -x )2∑i =18(x i -x )(y i -y )∑i =18(u i -u )2∑i =18(u i -u )(y i -y )15.253.630.2692 085.5-230.30.7877.049表中u i =1x i ,u =18∑i =18u i .(1)根据散点图判断:y =a +bx 与y =c +dx哪一个模型更适合作为该图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的回归方程?(只要求给出判断,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程(回归系数的结果精确到0.01).(3)若该图书每册的定价为10元,则至少应该印刷多少册才能使销售利润不低于78 840元?(假设能够全部售出.结果精确到1)附:对于一组数据(ω1,ν1),(ω2,ν2),…,(ωn ,νn ),其回归直线ν^=α^+β^ω的斜率和截距的最小二乘估计分别为β^=∑i =1nωi -ωνi -ν∑i =1nωi -ω2,α^=ν-β^ω.[解] (1)由散点图判断,y =c +dx更适合作为该图书每册的成本费y (单位:元)与印刷数量x (单位:千册)的回归方程.(2)令u =1x,先建立y 关于u 的线性回归方程,由于d ^=∑i =18u i -uy i -y∑i =18u i -u2=7.0490.787≈8.957≈8.96, ∴c ^=y -d ^·u =3.63-8.957×0.269≈1.22, ∴y 关于u 的线性回归方程为y ^=1.22+8.96u , ∴y 关于x 的回归方程为y ^=1.22+8.96x.(3)假设印刷x 千册,依题意得10x -⎝⎛⎭⎪⎫1.22+8.96x x ≥78.840, ∴x ≥10,∴至少印刷10 000册才能使销售利润不低于78 840元. [类题通法]解决非线性回归问题的关键是适当换元,将非线性回归分析转化为线性回归分析问题求解.[综合训练]1.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:y^=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.解:(1)利用模型①,可得该地区2018年的环境基础设施投资额的预测值为y^=-30.4+13.5×19=226.1(亿元).利用模型②,可得该地区2018年的环境基础设施投资额的预测值为y^=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=-30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.(以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分)2.某市春节期间7家超市的广告费支出x i (万元)和销售额y i (万元)数据如下:(1)x 的线性回归方程;(2)若用二次函数回归模型拟合y 与x 的关系,可得回归方程为y ^=-0.17x 2+5x +20,经计算二次函数回归模型和线性回归模型的R 2分别约为0.92和0.75,请用R 2说明选择哪个回归模型更合适,并用此模型预测A 超市广告费支出为3万元时的销售额.参数数据及公式:x =8,y =42,∑i =17x i y i =2 794,∑i =17x 2i =708,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解:(1)∵b ^=∑i =17x i y i -7x y∑i =17x 2i-7x 2=2 794-7×8×42708-7×82=1.7,∴a^=y-b^x=42-1.7×8=28.4.∴y关于x的线性回归方程是y^=1.7x+28.4.(2)∵0.75<0.92,∴二次函数回归模型更合适.当x=3万元时,y^=-0.17×9+5×3+20=33.47,∴预测A超市销售额为33.47万元.独立性检验[典例](2018·郑州质量预测)2018年10月份郑州市进行了高三学生的体育学业水平测试,为了考察高中学生的身体素质情况,现抽取了某校1 000名(男生800名,女生200名)学生的测试成绩,根据性别按分层抽样的方法抽取100名学生的测试成绩进行分析,得到如下统计表:男生测试情况:抽样情况病残免试不合格合格良好优秀人数5101547x抽样情况病残免试不合格合格良好优秀人数2310y 2(1)出2名学生,求选出的这2名学生恰好是一男一女的概率;(2)若测试等级为“良好”或“优秀”的学生为“体育达人”,其他等级(含病残免试)的学生为“非体育达人”,根据以上统计数据填写下面列联表,并回答能否在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关?”男性 女性 总计 体育达人 非体育达人 总计临界值表:P (K 2≥k 0)0.10 0.05 0.025 0.010 0.005 k 02.7063.8415.0246.6357.879附:K 2=a +bc +d a +cb +d,其中n =a +b+c +d.[解] (1)按分层抽样的方法男生应抽取80名,女生应抽取20名,∴x =80-(5+10+15+47)=3,y =20-(2+3+10+2)=3. 抽取的100名且测试等级为“优秀”的3名男生分别记为A ,B ,C,2名女生分别记为a , b.从5名学生中任选2名,总的基本事件有(A ,B ),(A ,C ),(A ,a ),(A ,b ),(B ,C ),(B ,a ),(B ,b ),(C ,a ),(C ,b ),(a ,b ),共10个.设“选出的2名学生恰好是一男一女”为事件M ,则事件M 包含的基本事件有(A ,a ),(A ,b ),(B ,a ),(B ,b ),(C ,a ),(C ,b ),共6个,∴P (A )=610=35.(2)2×2列联表如下:男生 女生 总计 体育达人 50 5 55 非体育达人301545总计8020100则K2=n ad-bc2a+b c+d a+c b+d=100×50×15-30×5280×20×55×45≈9.091.∵9.091>6.635且P(K2≥6.635)=0.010,∴能在犯错误的概率不超过0.010的前提下认为“是否为‘体育达人’与性别有关”.[类题通法] 独立性检验的关键(1)根据2×2列联表准确计算K2的观测值k,若2×2列联表没有列出来,要先列出此表.(2)K2的观测值k越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.[应用通关]2018年2月22日上午,山东省委、省政府在济南召开山东省全面展开新旧动能转换重大工程动员大会,会议动员各方力量,迅速全面展开新旧动能转换重大工程.某企业响应号召,对现有设备进行改造,为了分析设备改造前后的效果,现从设备改造前后生产的大量产品中各抽取了200件产品作为样本,检测一项质量指标值,若该项质量指标值落在[20,40)内的产品视为合格品,否则为不合格品.设备改造前的样本的频率分布直方图和设备改造后的样本的频数分布表如下所示.设备改造后样本的频数分布表:质量指标值[15,20)[20,25)[25,30)[30,35)[35,40)[40,45] 频数436962832 4(1)完成下面的2×2列联表,并判断是否有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关;设备改造前设备改造后总计 合格品 不合格品 总计(2)根据上述数据,试从产品合格率的角度对改造前后设备的优劣进行比较;(3)根据市场调查,设备改造后,每生产一件合格品企业可获利180元,一件不合格品亏损100元,用频率估计概率,求生产1 000件产品企业大约能获利多少元?附:P (K 2≥k 0)0.150 0.100 0.050 0.025 0.010 k 02.0722.7063.8415.0246.635K 2=n ad -bc 2a +bc +d a +cb +d,n =a +b +c +d.解:(1)根据题中图和表得到2×2列联表:设备改造前设备改造后总计 合格品 172 192 364 不合格品 28 8 36 总计200200400将2×2 K 2=400×172×8-28×1922200×200×364×36≈12.210.∵12.210>6.635,∴有99%的把握认为该企业生产的这种产品的质量指标值与设备改造有关.(2)由2×2列联表可知,设备改造后产品的合格率约为192200=0.96,设备改造前产品的合格率约为172200=0.86,即设备改造后产品的合格率更高,因此,设备改造后性能更好. (3)用频率估计概率,1 000件产品中大约有960件合格品,40件不合格品,则180×960-100×40=168 800,∴该企业大约能获利168 800元. [专题跟踪检测](对应配套卷P200)1.在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数是( )A .3B .4C .5D .6解析:选B 由系统抽样可知,35人分为7组,每组5人,最后一组成绩均大于151,前两组成绩均小于139,故成绩在区间[139,151]上的运动员人数为4.2.“双色球”彩票中红色球的号码由编号为01,02,…,33的33个个体组成,一位彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )C.02 D.17解析:选C 从随机数表第1行的第6列和第7列数字开始由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.故选C.3.(2018·昆明调研)下图是1951~2016年我国年平均气温变化图.根据上图,判断下列结论正确的是( )A.1951年以来,我国年平均气温逐年增高B.1951年以来,我国年平均气温在2016年再创新高C.2000年以来,我国年平均气温都高于1981~2010年的平均值D.2000年以来,我国年平均气温的平均值高于1981~2010年的平均值解析:选D 由1951~2016年我国年平均气温变化图可以看出,年平均气温有升高的也有降低的,所以选项A不正确;2016年的年平均气温不是最高的,所以选项B不正确;2012年的年平均气温低于1981~2010年的平均值,所以选项C不正确;2000年以来,只有2012年的年平均气温低于1981~2010年的平均值,所以2000年以来,我国年平均气温的平均值高于1981~2010年的平均值,故选项D正确,故选D.4.(2018·惠州模拟)某商场为了了解毛衣的月销售量y(件)与月平均气温x (℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x /℃ 17 13 8 2 月销售量y /件24334055由表中数据算出线性回归方程y =b x +a 中的b =-2,气象部门预测下个月的平均气温约为 6 ℃,据此估计该商场下个月毛衣销售量约为( )A .46件B .40件C .38件D .58件解析:选A 由题中数据,得x =10,y =38,回归直线y ^=b^x +a ^过点(x ,y ),且b ^=-2,代入得a ^=58,则回归方程y ^=-2x+58,所以当x =6时,y =46,故选A.5.(2018·郑州质量预测)我市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a ,b 满足a ,G ,b 成等差数列且x ,G ,y 成等比数列,则1a +4b的最小值为( )A.49 B .2 C.94D .9解析:选C 由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b=2G =4,所以1a +4b =14(a +b )⎝ ⎛⎭⎪⎫1a +4b =14⎝⎛⎭⎪⎫1+4a b +b a +4≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a +4b 的最小值为94,选C. 6.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据频率分布直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140解析:选D 由频率分布直方图可知,每周的自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,所以每周的自习时间不少于22.5小时的人数是200×0.7=140.7.空气质量指数(Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI 记录数据中,随机抽取10个,其茎叶图记录如图所示.根据该统计数据,估计此地该年AQI 大于100的天数约为__________.(该年为365天)解析:该样本中AQI 大于100的频数是4,频率为25,由此估计该地全年AQI 大于100的概率为25,估计此地该年AQI 大于100的天数约为365×25=146.答案:1468.某学校高二年级共有女生300人,现调查她们每天的课外运动时间,发现她们的课外运动时间介于30分钟到90分钟,如图是统计结果的频率分布直方图,则她们的平均运动时间大约是________分钟.解析:由题图得平均运动时间约为35×0.1+45×0.1+55×0.5+65×0.2+75×0.05+85×0.05=56.5(分钟).答案:56.59.如图所示的茎叶图记录了甲、乙两位射箭运动员的5次比赛成绩(单位:环),若两位运动员平均成绩相同,则成绩较为稳定(方差较小)的那位运动员成绩的方差为________.解析:由题意知87+89+90+91+935=90,则88+89+90+91+90+x 5=90,解得x =2,所以s 2甲=15×[(87-90)2+(89-90)2+(90-90)2+(91-90)2+(93-90)2]=4,s 2乙=15×[(88-90)2+(89-90)2+(90-90)2+(91-90)2+(92-90)2]=2,所以s 2甲>s 2乙,所以成绩较为稳定(方差较小)的那位运动员成绩的方差为2.答案:210.某公司为了解广告投入对销售收益的影响,在若干地区共投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图,计算图中各小矩形的宽度; (2)试估计该公司投入4万元广告费用之后,对应销售收益的平均值(以各组的区间中点值代表该组的取值);(3)该公司按照类似的研究方法,测得另外一些数据,并整理得到下表:(2)的结果填入空白栏,并求出y 关于x 的回归直线方程.附:b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解:(1)设各小矩形的宽度为m ,由频率分布直方图中各小矩形的面积和为1,可知(0.08+0.10+0.14+0.12+0.04+0.02)·m=1,解得m =2,故图中各小矩形的宽度为2.(2)由(1)知各分组依次是[0,2),[2,4),[4,6),[6,8),[8,10),[10,12],它们的中点的横坐标分别为1,3,5,7,9,11,各组对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04, 故可估计销售收益的平均值为1×0.16+3×0.20+5×0.28+7×0.24+9×0.08+11×0.04=5.(3)由(2)可知空白栏中填5,由题意可知,x =1+2+3+4+55=3,y =2+3+2+5+75=3.8,∑i =15x i y i =1×2+2×3+3×2+4×5+5×7=69,∑i =15x 2i =12+22+32+42+52=55,所以b ^=69-5×3×3.855-5×32=1.2, a ^=3.8-1.2×3=0.2,故所求的回归直线方程为y ^=1.2x +0.2.11.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:超过m 不超过m第一种生产方式第二种生产方式(3)根据(2)的效率有差异?附:K2=n ad-bc2a+b c+d a+c b+d,解:(1)第二种生产方式的效率更高.理由如下:(ⅰ)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80 min,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79 min.因此第二种生产方式的效率更高.(ⅱ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5 min,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5 min.因此第二种生产方式的效率更高.(ⅲ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需平均时间高于80 min;用第二种生产方式的工人完成生产任务所需平均时间低于80 min.因此第二种生产方式的效率更高.(ⅳ)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布.又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少.因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分)(2)由茎叶图知m =79+812=80.列联表如下:超过m 不超过m第一种生产方式 15 5 第二种生产方式515(3)因为K 2=220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.12.在一次抽样调查中测得样本的6组数据,得到一个变量y 关于x 的回归方程模型,其对应的数值如下表:x 2 3 4 5 6 7 y3.002.482.081.861.481.10(1)(当|r |>0.75时,说明y 与x 之间具有线性相关关系);(2)根据(1)的判断结果,建立y 关于x 的回归直线方程并预测当x =9时,对应的y ^值为多少(b ^精确到0.01).。
2018高考数学小题精练+B 卷及解析:专题(13)直线与圆及解析专题(13)直线与圆1.已知圆的方程为224240x y x y +-+-=,则圆的半径为( )A . 3B . 9C .D . 3±【答案】A2.已知圆C : ()()2224x a y -+-=(0a >)及直线: 30x y -+=,当直线被C 截得的弦长为a = ( )A .B . 2C . 1-D . 1+【答案】C【解析】由题意,24+=,解得1a =-,又因为0a >,所以1a =-;故选C .3.已知圆心,一条直径的两个端点恰好在两坐标轴上,则这个圆的方程是( )A .B .C .D .【答案】B 【解析】由题意可设圆的直径两端点坐标为,由圆心坐标可得,可求得,可得圆的方程为即.故选B . 4.过点,且倾斜角为的直线与圆相切于点,且,则的面积是( )A .B .C . 1D . 2 【答案】B【解析】在直角三角形AOB 中 ,选B . 5.若直线与圆有公共点,则实数的取值范围是 ( )A .B .C .D .【答案】C6.直线与圆相交于两点,则弦的长度等于( )A .B .C .D . 【答案】B 【解析】圆心到直线,的距离,由勾股定理可知,,即,故选B . 7.已知圆的圆心在直线上,且与直线平行,则的方程是( )A .B .C .D . 【答案】A 【解析】设直线为 ,代入点 得 .故选A .点睛:两条直线平行的设法,斜率相等,只需要截距不同.8.直线10x ky -+=(k R ∈)与圆224220x y x y ++-+=的位置关系为( )A . 相交B . 相切C . 相离D . 与k 的值有在【答案】A【解析】由于直线10x ky -+=恒过定点()1,0P -,且()1,0P -在圆224220x y x y ++-+=内,故圆与直线10x ky -+=的相交,应选答案A .9.曲线y =1+与直线y =k (x -2)+4有两个交点,则实数k 的取值范围是( )。
2018届高考数学(理)小题精练 专题18 统计与统计案例1.如图是2014年在某电视节目中七位评委为某民族舞蹈打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为A . 84,4.84B . 84,1.6C . 85,1.6D . 85,4 【答案】C2.某中学高一年级从甲、乙两个班各选出7名学生参加国防知识竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x y +的值为( )A . 8B . 168C . 9D . 169 【答案】C【解析】∵甲班学生成绩的平均分是85,∴79+78+80+80+x +85+92+95=85×7,即x =6. ∵乙班学生成绩的中位数是83,甲班学生成绩的中位数是80+x =83,得x =3; ∴若1≤y ,则中位数为81,不成立.若y >1,则中位数为80+y =83,解得y =3. ∴x +y =6+3=9,本题选择C 选项.点睛:茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据. 3.某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为()A. 6万元 B. 8万元 C. 10万元 D. 12万元【答案】C点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.4.如果个数的平均数为,则的平均数为( ) A.3 B.4 C.5 D.6【答案】A【解析】的平均数为1,,,的平均数为,故选A.【思路点睛】本题主要考查平均数的求法,属于中档题.要解答本题首先根据个数的平均数为得到,从而可得的平均数为.5.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A . 128B . 144C . 174D . 167 【答案】B【解析】女教师人数为: 120*0.7150*0.4144+=. 6.下列说法中正确的是( )①相关系数r 用来衡量两个变量之间线性关系的强弱, r 越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心(),x y ;③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度; ④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好. A . ①② B. ③④ C. ①④ D. ②③ 【答案】D7.下面是22⨯列联表:则表中a b ,的值分别为( )A . 84,60B . 42,64C . 42, 74D . 74, 42 【答案】B【解析】因2163a +=,故42a =,又22a b +=,则64b =,应选答案B .8.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( ) A .频率分布直方图 B .回归分析 C . 独立性检验 D . 用样本估计总体 【答案】C【解析】根据题意,结合题目中的数据,列出2×2列联表,求出观测值K 2,对照数表可得出概率结论,这种分析数据的方法是独立性检验.本题选择C 选项. 9.下列说法错误的是( )A . 10xy ≠是5x ≠或2y ≠的充分不必要条件B . 若命题2:,10p x R x x ∀∈++≠,则2:,10p x R x x ⌝∃∈++= C . 线性相关系数r 的绝对值越接近1,表示两变量的相关性越强D . 用频率分布直方图估计平均数,可以用每个小矩形的高乘以底边中点横坐标之和 【答案】D10.某公司为确定明年投入某产品的广告支出,对近5年的广告支出m 与销售额t (单位:百万元)进行了初步统计,得到下列表格中的数据:经测算,年广告支出m 与年销售额t 满足线性回归方程 6.517.5t m =+,则p 的值为( ) A .45 B .50 C .55 D .60 【答案】D考点:回归分析.11.当今人口政策受到人们的广泛关注,下表是某大学人口预测课题组通过研究预测的1564岁人口所占比例的结果:已知所占比例y 关于年份代号t 的线性回归方程为 1.7y t m =-+,则m =( )A .67.8B .68C .68.5D .68.7 【答案】D 【解析】试题分析:因6.6356162626568,3554321=++++==++++=y t ,故m +⨯-=37.16.63,即7.68=m ,应选D .考点:线性回归方程及运用. 12.下列命题中正确的有( )①设有一个回归方程ˆ23yx =-,变量x 增加一个单位时,y 平均增加3个单位; ②命题:p “0x R ∃∈,20010x x -->”的否定p ⌝“x R ∀∈,210x x --≤”;③“命题p 或q 为真”是“命题p 且q 为真”必要不充分条件;④在一个22⨯列联表中,由计算得26.679k =,则有99.9%的把握确认这两个变量间有关系.A .1个B .2个C .3个D .4个本题可以参考独立性检验临界值表【答案】B 【解析】考点:命题的真假.。
专题(01)集合1 •已知集合A : . / : 4:,集合F; - ■//.匚.亍,集合二一/■.门E,则集合的子集的个数为( )A. 1 B • 2 C • 3 D • 4【答案】D【解析】匚A={b 乙3, 4}, B-{3, 4, 5?6} fOAnB-{l, 2, 3, 4}np> 4,幻<5}={3, 4}.^集合C的子集为叭0打豁0, 4},共4个,.故选:D.2. 已知集合A={1 , 2, 3, 4} , B={y|y=3x - 2, x€ A},贝U An B=( )A {1}B • {4}C . {1 , 3}D . {1 , 4}【答案】D【解析】B={1,4,7,10} , A n B={1,4},故选 D.3 •若集合A —124,8?,B =「x|2x:::5?,则A B =( )A. {1} B • Q C • {1,2} D • {1,2,3}【答案】C【解析】B—x|2x::5? - -::,log25 A B 一1,2?,选B・4•集合A={-1,0,1} , A的子集中含有元素0的子集共有()A. 2个B •4个C • 6个D • 8个【答案】B【解析】含有元素0的子集有{0},{0,-1},{0,1},{0,-1,1}, 共4个.故选B,5. 已知集合A={x | x -1>0} , B={y | y 2-2y —3< 0},贝U A n B=( )A. (1, 3) B . [1 , 3) C . [1 , 3] D . (1 , 3]【答案】D【解析】A —x|x 2 0:-「x|x -2:, B 一y|y2— 2y— 3 乞0:' ={ y |-1 乞y 乞3},所以A n B= [1 , 3].故选D.26. 已知集合A={ - 2, 0, 2} , B={x|x - x—2=0},则A A B=(A. ? B . {0} C . {2} D . { - 2}【答案】C【解析】由集合U 0, 2}, B-{X|X2-X-2=0}={-1, 2},则AAB-{-2, 0, 2}0{-1, 2}={2}.故选:C.点睛:在进行集合的运算时要尽可能地借助Venn图和数轴使抽象问题直观化.一般地,集合元素离散时用Venn图表示;集合元素连续时用数轴表示,用数轴表示时要注意端点值的取舍7. 集合A={x| - K x w 2}, B={x|x V 1},则A A( CB)=( )A. {x|x > 1} B . {x|x > 1} C . {x|1 V x< 2} D . {x|1 w x< 2}【答案】D【解析】由A ={x—1 乞x 乞2}, B ={x|x ::: 1}得:C R B=1X|X_1?,则A ( C R B) -汉1乞x乞2匚故选D.&已知全集U 二{x Z |0 ::: x 乞8},集合A ={x Z | 2 ::: x ::: m}(2 ::: m ■: 8),若Cu A的元素的个数为4,则m的取值范围为( )A. 6,7 1 B . 6,7 C . 1.6,7 1 D . 6,7【答案】A【解析】若C U A的元素的个数为4,则G J A—1,2,7,8匚6:::m乞7.本题选择A选项.9. 设全集U =R,集合A "x 0 ::: x _2匚,B x ::: 1?,则集合A _• B =( )A. 2, ::B . 2 ::C . -::,21 D . -::,1 1【答案】C【解析】•••集合A=〔x0 :::x 乞2?,B=「xx :::1?,••• A _ B - -:-,2 1点睛:本题是道易错题,看清所问问题求并集而不是交集.10. 若函数y =log2(x2 -2x -3)的定义域,值域分别是M、N,则(C R M ) N =()A- [-1,3] B- (-1,3) C. (0,3] D. [3,…)【答案】A【解析】试题分析:定义域由* —2兀一3》0解得x<-Lx>3f值域为卫,故N = [l,3]・考点:一元二次不等式,集合交并补.【易错点晴】集合的三要素是:确定性、互异性和无序性.研究一个集合,我们首先要看清楚它的研究对象,是实数还是点的坐标还是其它的一些元素,这是很关键的一步.第二步常常是解一元二次不等式,我们首先用十字相乘法分解因式,求得不等式的解集.在解分式不等式的过程中,要注意分母不能为零.元素与集合之间是属于和不属于的关系,集合与集合间有包含关系.注意区间端点的取舍.11.设全集U是实数集R , M ={xx24}, N={x1:::x^3},则图中阴影部分所表示的集合是()A. {x -2 <x :: 1}B. {x—2 乞X E2}C. {x1 :x 乞2}D. {xx : 2}【答案】C【解析】试题分折:由韦恩團可以看出,阴影部分是N中去掉M剖分』即阴影咅阱的元素属于N不属于團中阴影所表示的集合是NI G血二k卜"兀兰2,故MI 选C.考点:集合的运算.12.已知集合A.x・N |x ::5?,则下列关系式错误的是()A. 5 AB. 1.5 ’AC. - V AD. 0 A【答案】A【解析】试题分析蛊因为2={兀巨N| X < 5},而1 5圧从一“ M二”5 42儿一冷4,即B M正确,又因为0 E N 且0<5,所以0巨即D正确,故选A.考点:集合与元素的关系.专题(1)集合1 •已知集合A J x|y =lg x 1 },B - (-2, -1,0,V:,则C R A - 8=^( )A. : -2, -1 8 . 1-21 C •1-1,0,11 D • 1.0,11【答案】A【解析】北+1〉0』JC >1,则* = 3同一1}, C R A = {x\x<-l}^i(C lt A)^B = {-i-l}2•设集合M 二{x Z | -4<X V2}, N 二{X|X2V4},则M - N 等于( )A. -1,1 B . -1,2 C • ;、-1,12? D . :-1,0,1;【答案】D【解析】M 3. x Z| 4 < 2 J 3 , -2 ,」1 , N 1 2<,x? 1 | 汝4 - ? x| 2 / • 2- 1,0,1故选D.3•设是全集,集合H ■■-都是其子集,则下图中的阴影部分表示的集合为(M n N) U (M n P)A —「「B L r :rn “C 罔门口「J「匸D【答案】B【解析】观察图形得:图中的阴影部分表示的集合为4.已知全集!“'■. 「甘={1 / 計,F = r 》紀,则.—;i;「i::=()A. H B . - C .■ 一D . I【答案】A【解析】由题意得,“ -7讥},所以:C/-;- ?= :?/■:,故选A.5•已知汽-雹|/-£:一:上〔:."「,》-;:];{::,贝打:"的真子集个数为()A. 2 B . 3 C . 7 D . 8【答案】B【解析】•/ A={x|x 2-3x- 4< 0, x € Z}={x| -1< x< 4, x€ Z}={ -1 , 0, 1,2, 3, 4}, B={x|2x 2-x-6>0 ,3 ox€ Z}={x|x< ,或x>2 , x€ Z} ,••• AA B={3, 4},则APB 的真子集个数为22-1=3,故选:B.2点睛:1.用描述法表示集合,首先要弄清集合中代表元素的含义,再看元素的限制条件,明确集合类型,是数集、点集还是其他的集合.2. 求集合的交、并、补时,一般先化简集合,再由交、并、补的定义求解.3. 在进行集合的运算时要尽可能地借助Venn图和数轴使抽象问题直观化.一般地,集合元素离散时用Venn图表示;集合元素连续时用数轴表示,用数轴表示时要注意端点值的取舍.6. 已知集合::-:::|:; T:门:小,贝则-―()A.:讣「一 B . •.十- I C . *|;—二 D . - ■:: | :- m【答案】A【解析】由题青得:P«(x|x威Q-{x|x>2}^ 故选:A点睛:1.用描述法表示集合,首先要弄清集合中代表元素的含义,再看元素的限制条件,明确集合类型,是数集、点集还是其他的集合.2. 求集合的交、并、补时,一般先化简集合,再由交、并、补的定义求解.3. 在进行集合的运算时要尽可能地借助Venn图和数轴使抽象问题直观化.一般地,集合元素离散时用Venn图表示;集合元素连续时用数轴表示,用数轴表示时要注意端点值的取舍.7. 已知集合即-:“:二;-.■: ■- ::: , I「打丄二、;;,则集合它[r<中元素的个数为()A. 1 B . 2 C . 3 D . 4【答案】C【解析】由题得,集合切-:C—二二,所以「八」乂再和.集合仆中元素的个数为3 .故选C.&已知A 二{x|x2 - 2x-3 乞0}, B 二{y| y「X2 3},则A「B 二()A. 1,、.2 B . 、2 .3 C . , 3,3 D . 2,、一3【答案】C【解析】x2 - 2x -3 三0 ,解得_ x _ 3 . A = :x | _ x _ 3』,,x23 _ 3 .B —y |y 八3? A - B 二3,3,故选 C9•设集合M 二{x Z | 一3 :: x ::: 2} , N ={x Z | 一仁x 乞3},则® N 等于( )A. {0,1} B • {-1,0,1,2} C •{0,1,2}D. {-1,0,1}【答案】D【解析】MPlg-W1},故选D考点:1、集合的表示;2、集合的交集.10•已知集合A二{x|x2:::16} ,B={x|x:::m},若网B二A,则实数m的取值范围是()A. [/, ::) B . [4, ::) C .(一匕,-4]D (-—4]【答案】B【解析】试题分析:所汰yj={x|x a<16}={x|-4<x<4}, 因此目嗾数跖的取值范围是[-4-HE),故选考点:1、集合的表示;2、集合的基本运算.11.设集合A」x(x 1)(2-x) 集合B J x1E x E3:,则A B=( )A. (-1,3] B . (-1,1] C • (1,2)D. (-1,3)【答案】A【解析】试题分析:因为A = (x • 1)(2-x)・0f x| -1 ::: x ::: 2』,B」・x1 ::: x 乞3:,所以,A B =「x -1 :: x 沁]- -1,31,故选A .考点:1、集合的表示方法;2、集合的并集.12 .已知集合M ={x| x2-5x 乞0}, N 二{x| p ::x 6},且M「N 二{x |2 :: x _ q},贝U P q 二( )A. 6 B . 7 C . 8 D . 9【答案】B【解析】■一-集合M - lx | x? -5x 込0, -〔x | 0 三x 込5? , N - \x | p ::x ::6f ,且M 一N 二「x|2 :::x <q ^ p =2,q =5,. p q =2 5=7,故选B.。
2018高考试题分类汇编-15.统计与概率1. 【全国1卷】3. 某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图: 则下列结论中不正确的是A. 新农村建设后,种植收入减少B. 新农村建设后,其他收入增加了一倍以上C. 新农村建设后,养殖收入增加了一倍D. 新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2. 【全国1卷】10.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AC AB ,.ABC ∆的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为321,,p p p ,则A. 21p p =B.31p p =C. 32p p =D. 321p p p +=3. 【全国1卷】(20)(本小题满分12分)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品。
检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为)10(<<p p ,且各件产品是否为不合格品相互独立。
(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值。
已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用。
(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用的期望值为决策依据,是否该对这箱余下的所有产品作检验? 4.【全国2卷】8、我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果。
重组十五 计数原理、概率与统计测试时间:120分钟满分:150分第Ⅰ卷 (选择题,共60分)一、选择题(本题共12小题,每小题5分,共60分,每小题只有一个选项符合题意) 1.[2016·济南教学调研]某校高一、高二、高三年级学生人数分别是400,320,280.采用分层抽样的方法抽取50人,参加学校举行的社会主义核心价值观知识竞赛,则样本中高三年级的人数是( )A .20B .16C .15D .14 答案 D解析 高三年级的人数是280400+320+280×50=14(人).故答案为D.2.[2016·河北重点中学联考]以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分)已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为( ) A .2,5 B .5,5 C .5,8 D .8,8 答案 C解析 ∵甲组数据的中位数为15, ∴x =5,乙组数据的平均数为16.8, ∴9+15+10+y +18+245=16.8,∴y =8,选C.3.[2016·山东中学模拟]下列叙述错误的是( ) A .若事件A 发生的概率为P (A ),则0≤P (A )≤1B .系统抽样是不放回抽样,每个个体被抽到的可能性相等C .线性回归直线y ^=b ^x +a ^必过点(x -,y -)D .对于任意两个事件A 和B ,都有P (A ∪B )=P (A )+P (B ) 答案 D解析 对于A ,根据概率的定义可得,若事件A 发生的概率为P (A ),则0≤P (A )≤1,故A 正确;对于B ,根据系统抽样的定义得,系统抽样是不放回抽样,每个个体被抽到的可能性相等,故B 正确;对于C ,线性回归直线y ^=b ^x +a ^必过点(x -,y -),故C 正确;对于D ,对于任意两个事件A 和B ,P (A ∪B )=P (A )+P (B )-P (A ∩B ),只有当事件A 和B 是互斥事件时,才有P (A ∪B )=P (A )+P (B ),故D 不正确.故选D.4.[2016·全国卷Ⅰ]某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( )A.13B.12C.23D.34 答案 B解析 由题意得图:由图得等车时间不超过10分钟的概率为12.5.[2016·吉大附中一模]两枚均匀的骰子一起投掷,记事件A ={至少有一枚骰子6点向上},B ={两枚骰子都是6点向上},则P (B |A )=( )A.16B.136C.112D.111 答案 D解析 至少有一枚骰子6点向上的概率为1-56×56=1136,两枚骰子都是6点向上的概率为16×16=136,故至少有一枚骰子6点向上的条件下,另一枚骰子也是6点向上的概率是1361136=111.故选D.6.[2016·全国卷Ⅱ]如图,小明从街道的E 处出发,先到F 处与小红会合,再一起到位于G 处的老年公寓参加志愿者活动,则小明到老年公寓可以选择的最短路径条数为()A .24B .18C .12D .9 答案 B解析 由题意可知E →F 共有6种走法,F →G 共有3种走法,由乘法计数原理知,共有6×3=18种走法,故选B.7.[2016·河北名校联考]菜市中心购物商场在“双11”开展的“买三免一”促销活动异常火爆,对当日8时至22时的销售额进行统计,以组距为2小时的频率分布直方图如图所示.已知12时至16时的销售额为90万元,则10时至12时的销售额为( )A .120万元B .100万元C .80万元D .60万元 答案 D解析 该商场11月11日8时至22时的总销售额为90+=200万元,所以10时至12时的销售额为200×(0.150×2)=60万元,故选D.8.[2017·四川巴中质检]正月十六登高是“中国石刻艺术之乡”“中国民间文化艺术之乡”四川省巴中市沿袭千年的独特民俗.登高节前夕,李大伯在家门前的树上挂了两串喜庆彩灯,这两串彩灯的第一次闪亮相互独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒为间隔闪亮.那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是( )A.14B.13C.12D.34 答案 D解析 设两串彩灯第一次闪亮的时刻分别为x ,y ,∴全部基本事件构成的区域为⎩⎪⎨⎪⎧0≤x ≤4,0≤y ≤4,符合题意的区域为⎩⎪⎨⎪⎧0≤x ≤4,0≤y ≤4,-2≤y -x ≤2,如右图所示,由几何概型可知,所求概率为P =1-2×12×2×216=34,故答案为D.9.[2016·浙江重点高中模拟](1-x 2)4⎝ ⎛⎭⎪⎫x +1x 5的展开式中1x 的系数为( )A .5B .11C .-21D .-29 答案 D 解析 (1-x 2)4⎝⎛⎭⎪⎫x +1x 5=(1-x 2)4⎝ ⎛⎭⎪⎫1+1x 5,(1-x 2)4⎝ ⎛⎭⎪⎫1+1x 5的展开式中的x -1的系数是以下几部分的和;(1-x 2)4的常数项与⎝⎛⎭⎪⎫1+1x 5的展开式中含x -1的系数的乘积;(1-x 2)4含x 2项的系数与⎝ ⎛⎭⎪⎫1+1x 5的展开式中含x -3的系数的乘积;(1-x 2)4含x 4项的系数与⎝⎛⎭⎪⎫1+1x 5的展开式中含x -5的系数的乘积. ∵(1-x 2)4、⎝⎛⎭⎪⎫1+1x 5的展开式的通项分别为T r +1=C r 4(-x 2)r ,T k +1=C k 5⎝ ⎛⎭⎪⎫1x k,∴(1-x 2)4⎝ ⎛⎭⎪⎫1+1x 5的展开式中x -1的系数为C 04C 15-C 14C 35+C 24C 55=-29.10.[2016·全国卷Ⅱ]从区间[0,1]随机抽取2n 个数x 1,x 2,…,x n ,y 1,y 2,…,y n ,构成n 个数对(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( )A.4n mB.2n mC.4m nD.2m n答案 C解析 设由⎩⎪⎨⎪⎧0≤x n ≤1,0≤y n ≤1构成的正方形的面积为S ,x 2n +y 2n <1构成的图形的面积为S ′,所以S ′S =14π1=m n ,所以π=4mn,故选C.11.[2016·河北模拟]袋内有8个白球和2个红球,每次从中随机取出一个球,然后放回1个白球,则第4次恰好取完所有红球的概率为( )A .0.0324B .0.0434C .0.0528D .0.0562 答案 B解析 第4次恰好取完所有红球有三种情形,红白白红,白红白红,白白红红,所以第4次恰好取完所有红球的概率为:210×⎝ ⎛⎭⎪⎫9102×110+810×210×910×110+⎝ ⎛⎭⎪⎫8102×210×110=0.0434,故选B.12.[2016·武邑中学强化训练]已知⎝ ⎛⎭⎪⎫1a+ax 5-⎝ ⎛⎭⎪⎫1b+bx 5的展开式中含x 2与x 3的项的系数的绝对值之比为1∶6,则a 2+b 2的最小值为( )A .6B .9C .12D .18 答案 C解析 ⎝ ⎛⎭⎪⎫1a +ax 5-⎝ ⎛⎭⎪⎫1b +bx 5 的展开式中含x 2项的系数为C 25⎝ ⎛⎭⎪⎫1a 3a 2-C 25⎝ ⎛⎭⎪⎫1b 3b 2=b -aab, 含x 3的项的系数为C 35⎝ ⎛⎭⎪⎫1a 2a 3-C 35⎝ ⎛⎭⎪⎫1b2b 3=10(a -b ),则由题意,得⎪⎪⎪⎪⎪⎪b -a ab a -b =16,即|ab |=6,则a 2+b 2=|a |2+|b |2≥2|ab |=12,故选C.第Ⅱ卷 (非选择题,共90分)二、填空题(本大题共4小题,每小题5分,共20分)13.[2017·山西四校联考]已知随机变量ξ服从正态分布,且方程x 2+2x +ξ=0有实数解的概率为12,若P (ξ≤2)=0.75,则P (0≤ξ≤2)________.答案 0.5解析 ∵方程x 2+2x +ξ=0有实数解的概率为12,∴P (Δ≥0)=12,即P (ξ≥1)=12,故正态曲线的对称轴是x =1,如图,∵P (ξ≤2)=0.75,∴P (ξ≤0)=0.25.∴P (0≤ξ≤2)=1-(0.25+0.25)=0.5.14.[2017·河南郑州质检]在区间[0,1]内任取三个数,则这三个数的平方和小于1的概率是________.答案π6解析 记这三个数分别为x ,y ,z ,则0≤x ≤1,0≤y ≤1,0≤z ≤1.在空间直角坐标系中点(x ,y ,z )构成在第一卦限的单位正方体,{(x ,y ,z )|x 2+y 2+z 2<1}表示的单位球体在第一卦限的部分的体积是18×43π=π6.故所求的概率是π6.15.[2016·安庆二模]将⎝⎛⎭⎪⎫x +4x-43展开后,常数项是________.答案 -160解析 展开后的通项是C m 3C n 3-m x m ·⎝ ⎛⎭⎪⎫4x n ·(-4)3-m -n,当m =n 时为常数.于是C m 3C n 3-m x m ·⎝ ⎛⎭⎪⎫4x n ·(-4)3-m -n =C m 3C m 3-m x m ·⎝ ⎛⎭⎪⎫4x m ·(-4)3-2m .若m =0,则(-4)3=-64;若m =1,则C 13C 12·4·(-4)=-96. 故常数项是-64-96=-160.或:⎝⎛⎭⎪⎫x +4x-43=⎝ ⎛⎭⎪⎫x -2x 6展开后的通项是C k 6(x )6-k·⎝⎛⎭⎪⎫-2x k=(-2)k C k 6(x )6-2k. 令6-2k =0,得k =3.所以常数项是C 36(-2)3=-160.16.[2017·安徽四校联考]甲与其四位朋友各有一辆私家车,车牌尾数分别是0,0,2,1,5,为遵守当地某月5日至9日5天的限行规定(奇数日车牌尾数为奇数的车通行,偶数日车牌尾数为偶数的车通行),五人商议拼车出行,每天任选一辆符合规定的车,但甲的车最多只能用一天,则不同的用车方案总数为________.答案 64解析 5日到9日,分别为5,6,7,8,9,有3天奇数日,2天偶数日.第一步安排奇数日出行,每天都有2种选择,共有23=8种.第二步安排偶数日出行分两类,第一类,先选1天安排甲的车,另外一天安排其它车,有2×2=4种.第二类不安排甲的车,每天都有2种选择,共有2×2=4种,共计4+4=8种.根据分步计数原理,不同的用车方案种数共有8×8=64种.故填64.三、解答题(共6小题,共70分,解答应写出文字说明、证明过程或演算步骤) 17.[2016·湖北八校联考](本小题满分10分)某中学为研究学生的身体素质与课外体育锻炼时间的关系,对该校200名高三学生的课外体育锻炼平均每天运动的时间进行调查,如下表:(平均每天锻炼的时间单位:分钟)将学生日均课外体育运动时间在[40,60)上的学生评价为“课外体育达标”. (1)请根据上述表格中的统计数据填写下面2×2列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“课外体育达标”与性别有关?(2)将上述调查所得到的频率视为概率.现在从该校高三学生中,抽取3名学生,记被抽取的3名学生中的“课外体育达标”学生人数为X ,若每次抽取的结果是相互独立的,求X 的数学期望和方差.参考公式:K 2=n ad -bc 2a +bc +d a +cb +d,其中n =a +b +c +d . 参考数据:解 (1)(3K 2=-2150×50×90×110=20033≈6.060<6.635, 所以在犯错误的概率不超过0.01的前提下不能判断“课外体育达标”与性别有关.(5分)(2)由表中数据可得,抽到“课外体育达标”学生的频率为0.25,将频率视为概率,∴X ~B ⎝ ⎛⎭⎪⎫3,14, ∴E (X )=3×14=34,D (X )=3×14×34=916.(10分)18.[2016·南开中学月考](本小题满分12分)某学校为了解高三年级学生寒假期间的学习情况,抽取甲、乙两班,调查这两个班的学生在寒假期间每天平均学习的时间(单位:小时),统计结果绘成频率分布直方图(如图).已知甲、乙两班学生人数相同,甲班学生每天平均学习时间在区间[2,4]的有8人.(1)图中a 的值为________;(2)用各组时间的组中值代替各组平均值,估算乙班学生每天学习的平均时间; (3)从甲、乙两个班每天平均学习时间大于10个小时的学生中任取4人参加测试,设4人中甲班学生的人数为ξ,求ξ的分布列和数学期望.解 (1)由频率分布直方图的性质得:(a +0.0875+0.1+0.125+0.15)×2=1,计算得a =0.0375.(2分)(2)由频率分布直方图估算乙班学生每天学习的平均时长为:x =3×0.05+5×0.15+7×0.35+9×0.35+11×0.1=7.6(小时).(6分)(3)因为甲班学习时间在区间[2,4]的有8人,所以甲班的学生人数为80.2=40(人),故甲、乙两班人数均为40人.所以甲班学习时间在区间(10,12]的人数为40×0.0375×2=3(人). 乙班学习时间在区间(10,12]的人数为40×0.05×2=4(人).(8分)在两班中学习时间大于10小时的同学共7人,ξ的所有可能取值为0,1,2,3. P (ξ=0)=C 03C 44C 47=135,P (ξ=1)=C 13C 34C 47=1235,P (ξ=2)=C 23C 24C 47=1835,P (ξ=3)=C 33C 14C 47=435.所以随机变量ξ的分布列为:∴E (ξ)=0×135+1×35+2×35+3×35=7.(12分)19.[2016·云南师大附中月考](本小题满分12分)某校准备从报名的7位教师(其中男教师4人,女教师3人)中选3人去边区支教.(1)设所选3人中女教师的人数为X ,求X 的分布列及数学期望;(2)若选派的三人依次到甲、乙、丙三个地方支教,求甲地是男教师的情况下,乙地为女教师的概率.解 (1)X 的所有可能取值为0,1,2,3,且P (X =0)=C 34C 37=435,P (X =1)=C 13C 24C 37=1835,P (X =2)=C 23C 14C 37=1235,P (X =3)=C 33C 37=135,所以X 的分布列为:(6分)故E (X )=0×435+1×1835+2×1235+3×135=97.(8分)(2)设事件A 为“甲地是男教师”,事件B 为“乙地是女教师”, 则P (A )=C 14A 26A 37=47,P (AB )=C 14C 13C 15A 37=27,所以P (B |A )=P AB P A =12.(12分)20.[2017·湖北黄冈期末](本小题满分12分)菜农定期使用低害杀虫农药对蔬菜进行喷洒,以防止害虫的危害,但采集上市时蔬菜仍存有少量的残留农药,食用时需要用清水清洗干净,下表是用清水x (单位:千克)清洗该蔬菜1千克后,蔬菜上残留的农药y (单位:微克)的统计表:(1)(2)若用解析式y ^=cx 2+d 作为蔬菜农药残量y ^与用水量x 的回归方程,令ω=x 2,计算平均值ω-和y -,完成以下表格,求出y ^与x 的回归方程.(c ,d 精确到0.1)(3)对于某种残留在蔬菜上的农药,当它的残留量低于20微克时对人体无害,为了放心食用该蔬菜,请估计需要用多少千克的清水清洗一千克蔬菜?(精确到0.1,参考数据5≈2.236)(附:线性回归方程y ^=b ^x +a ^中系数计算公式分别为: b ^=∑ni =1 x i -x -y i -y -x i -x-2,a ^=y --b ^x -.)解 (1)作出散点图如下图:由散点图可以知道变量x 与y 负相关;(3分)(2)ω-=1+4+9+16+255=11,y -=58+54+39+29+105=38c =-10×20+-+-+-+--2+-2+-2+52+142=-751374=- 2.008≈-2.0,d =y --c ω-=38+2.0×11=60.0,y ^=-2.0ω+60.0=-2.0x 2+60.0.(8分) (3)当y ^<20时,-2.0x 2+60.0<20,x >25≈4.5∴为了放心食用该蔬菜,估计需要用4.5千克的清水清洗一千克的蔬菜.(12分) 21.[2017·湖南长沙模拟](本小题满分12分)空气质量指数(Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士记录去年某地某月10天的AQI 的茎叶图(如图).(1)利用该样本估计该地本月空气质量优良(AQI≤100)的天数(按这个月总共30天计算);(2)将频率视为概率,从本月中随机抽取3天,记空气质量优良的天数为ξ,求ξ的概率分布列和数学期望.解 (1)从茎叶图中可发现该样本中空气质量优的天数为2,空气质量良的天数为4,故该样本中空气质量优良的频率为610=35,从而估计该月空气质量优良的天数为30×35=18.(4分)(2)由(1)估计某天空气质量优良的概率为35,ξ的所有可能取值为0,1,2,3.(5分)P (ξ=0)=⎝ ⎛⎭⎪⎫253=8125,P (ξ=1)=C 1335⎝ ⎛⎭⎪⎫252=36125, P (ξ=2)=C 23⎝ ⎛⎭⎪⎫35225=54125, P (ξ=3)=⎝ ⎛⎭⎪⎫353=27125,故ξ的分布列为:(9分)显然ξ~B ⎝ ⎛⎭⎪⎫3,35,(11分) E (ξ)=3×35=1.8.(12分)22.[2017·河南质监](本小题满分12分)小李参加一种红包接龙游戏:他在红包里塞了12元,然后发给朋友A ,如果A 猜中,A 将获得红包里的所有金额;如果A 未猜中,A 将当前的红包转发给朋友B ,如果B 猜中,A 、B 平分红包里的金额;如果B 未猜中,B 将当前的红包转发给朋友C ,如果C 猜中,A 、B 和C 平分红包里的金额;如果C 未猜中,红包里的钱将退回小李的帐户,设A 、B 、C 猜中的概率分别为13,12,13,且A 、B 、C 是否猜中互不影响.(1)求A 恰好获得4元的概率;(2)设A 获得的金额为X 元,求X 的分布列;(3)设B 获得的金额为Y 元,C 获得的金额为Z 元,判断A 所获得的金额的期望能否超过Y 的期望与Z 的期望之和.解 (1)A 恰好获得4元的概率为23×12×13=19.(2分)(2)X 的可能取值为0,4,6,12,P (X =4)=19,P (X =0)=23×12×23=29, P (X =6)=23×12=13,P (X =12)=13,(5分)所以X 的分布列为:(6分)(3)Y 的可能取值为0,4,6;Z 的可能取值为0,4. 因为P (Y =0)=13+23×12×23=59,P (Y =4)=23×12×13=19, P (Y =6)=23×12=13,(8分) P (Z =0)=13+23×12+23×12×23=89, P (Z =4)=23×12×13=19,(9分)所以E (Y )=0×59+4×19+6×13=229,E (Z )=0×89+4×19=49,所以E (Y )+E (Z )=269,又E (X )=0×29+4×19+6×13+12×13=589,(11分)由于E (X )>E (Y )+E (Z ),所以A 所获得的金额的期望能超过Y 的期望与Z 的期望之和.(12分)。
2018高考数学小题精练+B 卷及解析:专题(16)概率及解析 专题(16)概率1.甲从正方形四个顶点中任意选择两个顶点连成直线,乙也从该正方形四个顶点中任意选择两个顶点连成直线,则所得的两条直线相互垂直的概率是( ) A .318 B . 418 C . 518 D . 618【答案】C【解析】甲共得6条,乙共得6条,共有6×6=36(对),其中垂直的有10对,∴1053618P ==.本题选择C 选项.2.如图,大正方形的面积是34,四个全等直角三角形围成一个小正方形,直角三角形的较短边长为3,向大正方形内抛一枚幸运小花朵,则小花朵落在小正方形内的概率为( )A .117 B . 217 C . 317 D . 417【答案】B点睛:数形结合为几何概型问题的解决提供了简捷直观的解法.用图解题的关键:用图形准确表示出试验的全部结果所构成的区域,由题意将已知条件转化为事件A 满足的不等式,在图形中画出事件A 发生的区域,据此求解几何概型即可.3.在棱长为a 的正方体中随机地取一点P ,则点P 与正方体各表面的距离都大于3a的概率为 ( )A .127 B . 116 C . 19 D . 13【答案】A【解析】符合条件的点P 落在棱长为3a的正方体内,根据几何概型的概率计算公式得P =333a a ⎛⎫ ⎪⎝⎭=127. 故选A .4.现有10个数,它们能构成一个以1为首项, 3-为公比的等比数列,若从这10个数中随机抽取一个数,则它小于8的概率是( ) A .35 B . 45 C . 712 D . 12【答案】A【解析】由题意成等比数列的10个数为:1,−3,(−3)2,(−3)3…(−3)9,其中小于8的项有: 1,−3,(−3)3,(−3)5,(−3)7,(−3)9共6个数这10个数中随机抽取一个数,则它小于8的概率是63105p ==. 本题选择A 选项.5.用随机数法从100名学生(男生30人)中抽取10人,则某女生被抽到的可能性为( ) A .B .C .D .【答案】D【解析】按比例女生有可能抽到人,则女生被抽到的概率是,故选D .6.若正方形ABCD 边长为4,E 为四边上任意一点,则AE 的长度大于5的概率等于( ) A .132 B . 78 C . 38 D . 18【答案】D【方法点睛】本题題主要考查“长度型”的几何概型,属于中档题. 解决几何概型问题常见类型有:长度型、角度型、面积型、体积型,求与长度有关的几何概型问题关鍵是计算问题题的长度以及事件的长度;几何概型问题还有以下几点容易造成失分,在备考时要高度关注:(1)不能正确判断事件是古典概型还是几何概型导致错误;(2)基本裏件对应的区域测度把握不准导致错误 ;(3)利用几何概型的概率公式时 , 忽视验证事件是否等可能性导致错误.7.在区间 [-2,3]上任取一个数x ,则函数()f x =有意义的概率为A .25 B . 35 C . 45 D . 15【答案】D【解析】函数()f x =有意义的概率,即240x -≥, 24x ≥, x 2≥,又x ∈ [-2,3],所以x ∈ [2,3],所以函数()f x =有意义的概率为()321325-=--.故选:D8.已知一只蚂蚁在边长为4的正三角形内爬行,则此蚂蚁到三角形三个顶点的距离均超过1的概率为( ) A . 3112π-B . 3124π-C . 312πD . 324π 【答案】B点睛:对于几何概型的计算,首先确定事件类型为几何概型并确定其几何区域(长度、面积、体积或时间),其次计算基本事件区域的几何度量和事件A 区域的几何度量,最后计算()P A .9.先后抛掷三枚均匀的壹角、伍角、壹元硬币,则出现两枚正面,一枚反面的概率是( ) A .38 B . 58 C . 12 D . 13【答案】A【解析】先后抛掷三枚均匀硬币共有8中情况,其中两正一反共有3种情况,所求概率为38. 故选A .10.已知在数轴上0和3之间任取一实数x ,则使“2log 1x <”的概率为( ) A .14B .18C .23D .112【答案】C考点:几何概型.11.点P 在边长为1的正方形ABCD 内运动,则动点P 到顶点A 的距离1||<PA 的概率为( ) A .41 B .21C .4πD .π【答案】C 【解析】试题分析:如图可知41412ππ==R P .故正确选项为C .考点:几何概型.【思路点晴】本题主要考查的是几何概型求概率,属基础题.解几何概型的试题,一般先求出实验的基本事件构成的区域长度(或面积或体积或弧度),再求出事件A 构成的区域长度(或面积或体积或弧度),最后代入几何概型的概率公式即可,几何概型的概率公式为()积或弧度)的区域长度(面积或体试验的全部结果所构成面积或体积或弧度)构成事件的区域长度(=A P .12.取一根长度为5m 的绳子,拉直后在任意位置剪断,那么剪得两段的长度都不小于2m 的概率为( ) A .12B .13C .14D .15【答案】D 【解析】试题分析:两边各留下2m ,中间剩下1m ,所以两段的长度都不小于2m 的概率为15. 考点:几何概型.专题19 概率1.设,m n 分别是先后抛掷一枚骰子得到的点数,则方程20x mx n ++=有实根的概率为( ) A .1936 B . 1136 C . 712 D . 12【答案】A本题选择A 选项.2.市场调查发现,大约的人喜欢在网上购买家用小电器,其余的人则喜欢在实体店购买家用小电器。
专题11.2 统计与统计案例【三年高考】1. 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取▲ 件.【答案】18【解析】应从丙种型号的产品中抽取30060181000⨯=件,故答案为18.【考点】分层抽样【名师点睛】在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i∶N i=n∶N.2.【2016江苏】已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是 . 【答案】0.1【考点】方差【名师点睛】本题考查的是总体特征数的估计,重点考查了方差的计算,本题有一定的计算量,属于简单题.认真梳理统计学的基础理论,特别是系统抽样和分层抽样、频率分布直方图、方差等,针对训练近几年的江苏高考类似考题,直观了解本考点的考查方式,强化相关计算能力.3.【2015江苏高考,2】已知一组数据4,6,5,8,7,6,那么这组数据的平均数为________. 【答案】6【解析】46587666x+++++==【考点定位】平均数4. 【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A【解析】【考点】 折线图【名师点睛】将频率分布直方图中相邻的矩形的上底边的中点顺次连结起来,就得到一条折线,我们称这条折线为本组数据的频率折线图,频率分布折线图的的首、尾两端取值区间两端点须分别向外延伸半个组距,即折线图是频率分布直方图的近似,他们比频率分布表更直观、形象地反映了样本的分布规律.5. 【2017山东,理5】为了研究某班学生的脚长(单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170【答案】C【解析】试题分析:由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C.【考点】线性相关与线性回归方程的求法与应用.【名师点睛】(1)判断两个变量是否线性相关及相关程度通常有两种方法:(1)利用散点图直观判断;(2)将相关数据代入相关系数公式求出,然后根据的大小进行判断.求线性回归方程时在严格按照公式求解时,一定要注意计算的准确性.6. 【2017课标1,文2】为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A .x 1,x 2,…,x n 的平均数B .x 1,x 2,…,x n 的标准差C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】 试题分析:刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B【考点】样本特征数【名师点睛】众数:一组数据出现次数最多的数叫众数,众数反应一组数据的多数水平; 中位数:一组数据中间的数,(起到分水岭的作用)中位数反应一组数据的中间水平; 平均数:反应一组数据的平均水平;方差:方差是和中心偏离的程度,用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差.在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.标准差是方差的算术平方根,意义在于反映一个数据集的离散程度.7. 【2017山东,文8】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为A. 3,5B. 5,5C. 3,7D. 5,7【答案】A【解析】【考点】茎叶图、样本的数字特征【名师点睛】由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失,第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁琐. 利用茎叶图对样本进行估计是,要注意区分茎与叶,茎是指中间的一列数,叶是从茎的旁边生长出来的数.8.【2016高考新课标3理数改编】某旅游城市为向游客介绍本地的气温情况,绘制了一年中︒,B 月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15C︒.下面叙述不正确的是.点表示四月的平均最低气温约为5C︒以上②七月的平均温差比一月的平均温差大①各月的平均最低气温都在0C︒的月份有5个③三月和十一月的平均最高气温基本相同④平均气温高于20C【答案】④【解析】︒均在虚线框内,所以各月的平均最低气温都在0℃以上,①正确;由试题分析:由图可知0C图可在七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,所以七月的平均温差比一月的平均温差大,②正确;由图可知三月和十一月的平均最高气温都大约在5C ︒,基本相同,③正确;由图可知平均最高气温高于20℃的月份有3个或2个,所以④不正确. 考点:1、平均数;2、统计图.【易错警示】解答本题时易错可能有两种:(1)对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;(2)估计平均温差时易出现错误,错选②.9.【2016高考上海理数】某次体检,6位同学的身高(单位:米)分别为1.72,1.78,1.75,1.80,1.69,1.77则这组数据的中位数是_________(米).【答案】1.76【解析】试题分析:将这6位同学的身高按照从矮到高排列为:1.69,1.72,1.75,1.77,1.78,1.80,这六个数的中位数是1.75与1.77的平均数,显然为1.76.考点:中位数的概念.【名师点睛】本题主要考查中位数的概念,是一道基础题目.从历年高考题目看,涉及统计的题目,往往不难,主要考查考生的视图、用图能力,以及应用数学解决实际问题的能力. 10.2016高考北京文数】某网店统计了连续三天售出商品的种类情况:第一天售出19种商品,第二天售出13种商品,第三天售出18种商品;前两天都售出的商品有3种,后两天都售出的商品有4种,则该网店①第一天售出但第二天未售出的商品有______种;②这三天售出的商品最少有_______种.【答案】①16;②29C BA139142考点: 统计分析【名师点睛】本题将统计与实际情况结合,创新味十足,是能力立意的好题,关键在于分析商品出售的所有可能的情况,分类讨论做到不重复不遗漏,另外,注意数形结合思想的运用.11.【2015高考重庆,文4改编】重庆市2013年各月的平均气温(°C)数据的茎叶图如下 08 9 12 5 8 20 0 3 3 8 3 1 2则这组数据中的中位数是 .【答案】20【解析】由茎叶图可知总共12个数据,处在正中间的两个数是第六和第七个数,它们都是20,由中位数的定义可知:其中位数就是20.12.【2015高考陕西,文2改编】某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为 .(高中部)(初中部)男男女女60%70%【答案】137 【解析】由图可知该校女教师的人数为11070%150(160%)7760137⨯+⨯-=+=.13.【2015高考湖北,文2改编】我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为 石.【答案】169【解析】设这批米内夹谷的个数为x ,则由题意并结合简单随机抽样可知,282541534x =,即281534169254x =⨯≈. 14.【2015高考广东,文12】已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,所以样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为2125111x +=⨯+=,所以答案应填:11.15.【2015高考北京,文14】高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下图所示,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .【答案】乙;数学【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.16.【2015高考北京,文17】某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.(I )估计顾客同时购买乙和丙的概率;(II )估计顾客在甲、乙、丙、丁中同时购买中商品的概率;(III )如果顾客购买了甲,则该顾客同时购买乙、丙、丁中那种商品的可能性最大? (Ⅲ)与(Ⅰ)同理,可得:顾客同时购买甲和乙的概率可以估计为2000.21000=,顾客同时购买甲和丙的概率可以估计为1002003000.61000++=,顾客同时购买甲和丁的概率可以估计为1000.11000=,所以,如果顾客购买了甲,则该顾客同时购买丙的可能性最大. 16.【2015高考广东,文17】某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图2.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户?【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中x 的值是0.0075(2)月平均用电量的众数是2202402302+=,因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=户,月平均用电量为[)240,260的用户有0.00752010015⨯⨯=户,月平均用电量为[)260,280的用户有0.0052010010⨯⨯=户,月平均用电量为[]280,300的用户有0.0025201005⨯⨯=户,抽取比例11125151055==+++,所以月平均用电量在[)220,240的用户中应抽取12555⨯=户【2018年高考命题预测】概率统计试题在试卷中的题型仍是填空题型,纵观近几年高考数学试卷中,概率与统计是必考题,而且是基础题,有时以直方图或茎叶图提供问题的背景信息,预测2018年仍会出现此类题,因此掌握概率与统计的基础知识是学习的关键.【2018年高考考点定位】本知识点主要是:随机抽样常以选择、填空题考查分层抽样,难度较低.在用样本估计总体中,会读图、识图,会从频率分布直方图中分析样本的数字特征(众数、中位数、平均数等);重视茎叶图;要重视线性回归方程,不仅会利用公式求,还要能分析其特点(正相关、负相关、回归方程过样本点中心);重视独立性检验( 2×2列联表).【考点1】抽样方法、总体分布的估计【备考知识梳理】1.简单随机抽样:一般地,设一个总体的个体数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.2.分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.3.总体:在数理统计中,通常把被研究的对象的全体叫做总体.4.频率分布:用样本估计总体,是研究统计问题的基本思想方法,样本中所有数据(或数据组)的频数和样本容量的比,就是该数据的频率.所有数据(或数据组)的频率的分布变化规律叫做样本的频率分布.可以用样本频率表、样本频率分布条形图或频率分布直方图来表示.【规律方法技巧】分层抽样的步骤:(1)分层;(2)按比例确定每层抽取个体的个数;(3)各层抽样(方法可以不同);(4)汇合成样本.解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除以组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.【考点针对训练】1.某小区共有1000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为 ,平均数为 .【答案】155;156.8【解析】根据中位数的定义知中位数由200.005200.0150.0200.5m ⨯+⨯+⨯=,解得5m =,所以中位数为:1505155+=;平均数为:1200.0051400.0151600.0201800.0052000.0032200.002156.8⨯+⨯+⨯+⨯+⨯+⨯=,所以答案为:155;156.8.2.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[)220,240的用户中应抽取多少户? 【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=得:0.0075x =,所以直方图中的值是0.0075.(2)月平均用电量的众数是2202402302+=;因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=得:224a =,所以月平均用电量的中位数是224.【考点2】相关性、最小二乘估计与统计案例 【备考知识梳理】1.相关性(1)通常将变量所对应的点描出来,这些点就组成了变量之间的一个图,通常称这种图为变量之间的散点图.(2)从散点图上,如果变量之间存在某种关系,这些点会有一个集中的大致趋势,这种趋势通常可以用一条光滑的曲线来近似,这样近似的过程称为曲线拟合.(3)若两个变量x 和y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线性相关,若所有点看上去都在某条曲线(不是一条直线)附近波动,称此相关是非线性相关. 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. 2.回归方程 (1)最小二乘法如果有n 个点(x 1,y 1),(x 2,y 2),…,(x n ,y n ),可以用表达式[y 1-(a +bx 1)]2+[y 2-(a +bx 2)]2+…+[y n -(a +bx n )]2来刻画这些点与直线y =a +bx 的接近程度,使得上式达到最小值的直线y =a +bx 就是我们所要求的直线,这种方法称为最小二乘法. (2)回归方程方程y =bx +a 是两个具有线性相关关系的变量的一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n )的回归方程,其中a ,b 是待定参数.∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法. (2)样本点的中心对于一组具有线性相关关系的数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘法估计分别为:∑∑∑∑=-=--=--=-Λ--=---=ni ni i ni ii ni ixn xy x n yx x xy y x xb 12211121)())((,-Λ-Λ-=x b y a ).其中x =1n ∑i =1nx i ,y =1n ∑i =1ny i ,(x ,y )称为样本点的中心.(3)相关系数①1()()nniii x x y y x yn x yr -------==∑∑r >0时,表明两个变量正相关;当r <0时,表明两个变量负相关.r 的绝对值越接近于1,表明两个变量的线性相关性越强.r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系. 4.独立性检验(1)设A ,B 为两个变量,每一个变量都可以取两个值,变量A :A 1,A 2=A 1;变量B :B 1,B 2=B 1. 2×2列联表构造一个随机变量2()()()()()n ad bc K a b c d a c b d -=++++其中d c b a n +++=为样本容量.(2)独立性检验:利用随机变量来判断“两个变量有关联”的方法称为独立性检验. (3)当数据量较大时,在统计中,用以下结果对变量的独立性进行判断①当χ2≤2.706时,没有充分的证据判定变量A ,B 有关联,可以认为变量A ,B 是没有关联的;②当χ2>2.706时,有90%的把握判定变量A ,B 有关联; ③当χ2>3.841时,有95%的把握判定变量A ,B 有关联; ④当χ2>6.635时,有99%的把握判定变量A ,B 有关联.【规律方法技巧】1.“相关关系与函数关系”的区别:函数关系是一种确定性关系,体现的是因果关系;而相关关系是一种非确定性关系,体现的不一定是因果关系,可能是伴随关系.2.三点提醒: 一是回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义.二是根据回归方程进行预报,仅是一个预报值,而不是真实发生的值.三是独立性检验得出的结论是带有概率性质的,只能说结论成立的概率有多大,而不能完全肯定一个结论,因此才出现了临界值表,在分析问题时一定要注意这点,不可对某个问题下确定性结论,否则就可能对统计计算的结果作出错误的解释.3.正确理解计算b ,a 的公式和准确的计算是求线性回归方程的关键.回归直线方程y =bx +a 必过样本点中心(x ,y ).在分析两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程来估计和预测.4.利用独立性检验,能够帮助我们对日常生活中的实际问题作出合理的推断和预测.独立性检验就是考察两个分类变量是否有关系,并能较为准确地给出这种判断的可信度,具体做法是根据公式22()()()()()n ad bc K a b c d a c b d -=++++,计算2K 值,2K 值越大,说明“两个变量有关系”的可能性越大. 【考点针对训练】1.已知x 、y 的取值如下表所示,若y 与x 线性相关,且yˆ=0.95x +,则=____________.【答案】6.2 【解析】244310=+++=x ,5.447.68.43.42.2=+++=y ,样本中心点,在回归直线上,所以代入aˆ295.05.4+⨯=,所以6.2ˆ=a 2.为大力提倡“厉行节约,反对浪费”,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附:22n(ad bc )K (a b )(c d )(a c )(b d )-=++++参照附表,在如下结论:A .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过l %的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关” 中正确的是 . 【答案】C【解析】由表计算得:22100(45153010)==3.0355457525K ⨯-⨯⨯⨯⨯,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”,填C .【两年模拟详解析】1. 【苏北三市(连云港、徐州、宿迁)2017届高三年级第三次调研考试】已知一组数据3,6,9,8,4,则该组数据的方差是__________. 【答案】 (或5.2)【解析】2. 【2016-2017学年度苏锡常镇四市高三教学情况调研(二)】下表是一个容量为10的样本数据分组后的频数分布.若利用组中值近似计算本组数据的平均数x ,则x 的值为 .【答案】19.7 【解析】3. 【南京市、盐城市2017届高三年级第一次模拟】已知样本数据12345,,,,x x x x x 的方差23s =,则样本数据123452,2,2,2,2x x x x x 的方差为 ▲ . 【答案】12【解析】由题意得方差为2224312s =⨯=4. 【2017年第三次全国大联考江苏卷】已知样本7,8,9,,x y 的平均数为,且60xy =,则此样本的方差为_____________. 【答案】2 【解析】因为78985x y++++=,所以16x y +=,而60xy =,所以610x y =⎧⎨=⎩或106x y =⎧⎨=⎩,从而样本的方差为22221[(1)01(2)2]25⨯-+++-+=.5. 【2017年高考原创押题预测卷02(江苏卷)】某人次上班途中所花的时间(单位:分钟)分别为9,11,10,8,12,则这组数据的标准差为_______. 【答案】2【解析】因为这组数据的平均数是10591110812=++++=x ,所以其方差25)109()1011()1010()108()1012(222222=-+-+-+-+-=s ,故所求这组数据的标准差2=s .6. 【淮安、宿迁、连云港、徐州苏北四市2016届高三第二次调研】交通部门对某路段公路上行驶的汽车速度实施监控,从速度在h km /9050-的汽车中抽取150辆进行分析,得到数据的频率分布直方图如图所示,则速度在h km /70以下的汽车有 辆.)【答案】75【解析】由频率分布直方图得,速度在h km /70以下的汽车所占频率为(0.020.03)100.5+⨯=,则速度在h km /70以下的汽车有1500.575⨯=辆7.【江苏省清江中学数学模拟试卷】某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率分布直方图如图所示,则其抽样的100根中,有 根在棉花纤维的长度大于25mm.【答案】40【解析】(0.0550.0250.015)10040⨯+⨯+⨯⨯=.8.【扬州市2015—2016学年度第一学期期末检测试题】某学校从高三年级共800名男生中随机抽取50名测量身高. 据测量被测学生身高全部介于155cm 和195cm 之间,将测量结果按如下方式分成八组:第一组[)160155,、第二组[)165160,、……、第八组[]195190,. 按上述分组方式得到的频率分布直方图的一部分如图所示,估计这所学校高三年级全体男生身高180cm 以上(含180cm )的人数为 .【答案】144【解析】由图得,身高180cm 以上(含180cm )的频率为()150.0080.0160.0420.060.18-⨯++⨯+=,则人数为8000.18144⨯=9.【南京市、盐城市2016届高三年级第一次模拟考试数学】某校高一年级有学生400人,高二年级有学生360人,现采用分层抽样的方法从全校学生中抽出55人,其中从高一年级学生中抽出20人,则从高三年级学生中抽取的人数为 . 【答案】17【解析】高一高二人数之比为10:9,因此高二抽出的人数为18人,高三抽出的人数为55-20-18=17人10.【苏州市2016届高三年级第一次模拟考试】若一组样本数据9,8,x ,10,11的平均数为10,则该组样本数据的方差为 . 【答案】2【解析】由题意得12x =,因此方差为221(12201)25++++=11.【江苏省扬州中学2015—2016学年第二学期质量检测】在一段时间内有2000辆车通过高速公路上的某处,现随机抽取其中的200辆进行车速统计,统计结果如下面的频率分布直方图所示.若该处高速公路规定正常行驶速度为90km/h ~120km/h ,试估计2000辆车中,在这段时间内以正常速度通过该处的汽车约有________辆.【答案】1700【解析】2000(0.0350.030.02)101700⨯++⨯=12.【南京市、盐城市2016届高三年级第二次模拟考试】如图所示,一家面包销售店根据以往某种面包的销售记录,绘制了日销售量的频率分布直方图.若一个月以30天计算,估计这家面包店一个月内日销售量不少于150个的天数为 .【答案】【解析】950)002.0004.0(30=⨯+⨯13.【江苏省南京市2016届高三年级第三次学情调研适应性测试】一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本的频率分布直方图(如图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10000人中再用分层抽样方法抽出100人作进一步调查,则月收入在[2500,3000)范围内的应抽出人.【答案】25⨯⨯=【解析】由题意得:0.00055001002514.【南京市2016届高三年级第三次模拟考试】甲、乙两位选手参加射击选拔赛,其中连续5轮比赛的成绩(单位:环)如下表:则甲、乙两位选手中成绩最稳定的选手的方差是.【答案】0.02【一年原创真预测】1. 以下四个命题中:R的值判断模型的拟合效果, 2R越大,模型的拟合效果越①在回归分析中,可用相关指数2好;②两个随机变量的线性相关性越强,相关系数的绝对值越接近于1;③若数据123,,n x x x x 的方差为1,则1232,2,22n x x x x 的方差为2;④对分类变量与y 的随机变量2k 的观测值k 来说,k 越小,判断“x 与y 有关系”的把握程度越大.其中真命题的个数为 . 【答案】2【入选理由】本题考查特称命题真假的判断,回归分析,相关系数,独立性检验等基础知识,意在考查考生转化能力,分析问题解决问题的能力,运算求解能力.此类知识属于高考冷门问题,近年高考有所重视,应多注意,故选此题.2.某单位为了了解某办公楼用电量y (度)与气温x (oC)之间的关系,随机统计了四个工作日的用电量与当天平均气温,并制作了对照表:得到的回归方程为a bx y+=ˆ,则a 0,b 0. 【答案】>,<【解析】依题意,画散点图知,两个变量负相关,所以0<b ,0>a .【入选理由】本题考查考查散点图、线性回归方程等基础知识,意在考查考生分析问题解决问题的能力,运算求解能力.近年高考加强了对线性回归方程的考查,应多注意,故选此题. 3.2015国际滑联世界花样滑冰锦标赛于3月23日至29日在上海举行,为调查市民喜欢这项赛事是否与年龄有关,随机抽取了55名市民,得到如下数据表:。
2018届高考数学(理)小题精练 专题18 统计与统计案例1.如图是2014年在某电视节目中七位评委为某民族舞蹈打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为A . 84,4.84B . 84,1.6C . 85,1.6D . 85,4 【答案】C2.某中学高一年级从甲、乙两个班各选出7名学生参加国防知识竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则x y +的值为( )A . 8B . 168C . 9D . 169 【答案】C【解析】∵甲班学生成绩的平均分是85,∴79+78+80+80+x +85+92+95=85×7,即x =6. ∵乙班学生成绩的中位数是83,甲班学生成绩的中位数是80+x =83,得x =3; ∴若1≤y ,则中位数为81,不成立.若y >1,则中位数为80+y =83,解得y =3. ∴x +y =6+3=9,本题选择C 选项.点睛:茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据. 3.某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为()A. 6万元 B. 8万元 C. 10万元 D. 12万元【答案】C点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.4.如果个数的平均数为,则的平均数为( ) A.3 B.4 C.5 D.6【答案】A【解析】的平均数为1,,,的平均数为,故选A.【思路点睛】本题主要考查平均数的求法,属于中档题.要解答本题首先根据个数的平均数为得到,从而可得的平均数为.5.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A . 128B . 144C . 174D . 167 【答案】B【解析】女教师人数为: 120*0.7150*0.4144+=. 6.下列说法中正确的是( )①相关系数r 用来衡量两个变量之间线性关系的强弱,越接近于1,相关性越弱; ②回归直线y bx a =+一定经过样本点的中心③随机误差e 满足()0E e =,其方差()D e 的大小用来衡量预报的精确度; ④相关指数2R 用来刻画回归的效果, 2R 越小,说明模型的拟合效果越好. A . ①② B. ③④ C. ①④ D. ②③ 【答案】D7.下面是22⨯列联表:则表中a b ,的值分别为( )A . 84,60B . 42,64C . 42, 74D . 74, 42 【答案】B【解析】因2163a +=,故42a =,又22a b +=,则64b =,应选答案B .8.在某次飞行航程中遭遇恶劣气候,55名男乘客中有24名晕机,34名女乘客中有8名晕机,在检验这些乘客晕机是否与性别有关时,采用的数据分析方法应是( ) A .频率分布直方图 B .回归分析 C . 独立性检验 D . 用样本估计总体 【答案】C【解析】根据题意,结合题目中的数据,列出2×2列联表,求出观测值K 2,对照数表可得出概率结论,这种分析数据的方法是独立性检验.本题选择C 选项. 9.下列说法错误的是( )A . 10xy ≠是5x ≠或2y ≠的充分不必要条件B . 若命题2:,10p x R x x ∀∈++≠,则2:,10p x R x x ⌝∃∈++= C . 线性相关系数r 的绝对值越接近1,表示两变量的相关性越强D . 用频率分布直方图估计平均数,可以用每个小矩形的高乘以底边中点横坐标之和 【答案】D10.某公司为确定明年投入某产品的广告支出,对近5年的广告支出m 与销售额t (单位:百万元)进行了初步统计,得到下列表格中的数据:经测算,年广告支出m 与年销售额t 满足线性回归方程 6.517.5t m =+,则p 的值为( ) A .45 B .50 C .55 D .60 【答案】D考点:回归分析.11.当今人口政策受到人们的广泛关注,下表是某大学人口预测课题组通过研究预测的1564岁人口所占比例的结果:已知所占比例y 关于年份代号t 的线性回归方程为 1.7y t m =-+,则m =( )A .67.8B .68C .68.5D .68.7 【答案】D 【解析】试题分析:因,故m +⨯-=37.16.63,即7.68=m ,应选D .考点:线性回归方程及运用. 12.下列命题中正确的有( )①设有一个回归方程ˆ23yx =-,变量x 增加一个单位时,y 平均增加3个单位; ②命题:p “0x R ∃∈,20010x x -->”的否定p ⌝“x R ∀∈,210x x --≤”;③“命题p 或q 为真”是“命题p 且q 为真”必要不充分条件;④在一个22⨯列联表中,由计算得26.679k =,则有99.9%的把握确认这两个变量间有关系. A .1个 B .2个 C .3个 D .4个本题可以参考独立性检验临界值表【答案】B 【解析】考点:命题的真假.。
统计与统计案例【三年高考】1. 【2017课标3,理3】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳【答案】A【解析】观察折线图,每年7月到8月折线图呈下降趋势,月接待游客量减少,选项A 说法错误;折线图整体呈现出增长的趋势,年接待游客量逐年增加,选项B 说法正确;每年的接待游客量七八月份达到最高点,即各年的月接待游客量高峰期大致在7,8月,选项C 说法正确;每年1月至6月的月折线图平稳,月接待游客量波动性更小,7月至12月折线图不平稳,月接待游客量波动性大,选项D 说法正确;2. 【2017山东,理5】为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为(A )160 (B )163 (C )166 (D )170【答案】C【解析】由已知22.5,160,160422.570,42470166x y a y ==∴=-⨯==⨯+= ,选C.3.【2017江苏,3】 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 ▲ 件. 【答案】18【解析】所求人数为300601810000⨯=,故答案为18.4.【2017课标II ,理18】海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg )某频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A 表示事件:“旧养殖法的箱产量低于50kg, 新养殖法的箱产量不低于50kg”,估计A 的概率;(2) 填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:(3) 根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01) 附:22()()()()()n ad bc K a b c d a c b d -=++++(2)根据箱产量的频率分布直方图得列联表()222006266343815.70510010096104K ⨯⨯-⨯=≈⨯⨯⨯由于15.705 6.635>,故有99%的把握认为箱产量与养殖方法有关。
- 1 - 专题(15)统计与统计案例 1.已知样本789xy、、、、的平均数是8,标准差是2,则xy值为 A. 8 B. 32 C. 60 D. 80 【答案】C
【解析】由2222278982{ 17888988825xyxy得=60xy,故选C. 2.某校高一()班共有54人,如图是该班期中考试数学成绩的频率分布直方图,则成绩在100,120内的学生人数为
A. 36 B. 27 C. 22 D. 11 【答案】B
3.如图是2014年在某电视节目中七位评委为某民族舞蹈打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为
A. 84,4.84 B. 84,1.6 C. 85,1.6 D. 85,4 【答案】C 【解析】由茎叶图知,去掉一个最高分93和一个最低分79后, - 2 -
所剩数据84,84,86,84,87的平均数为=85, 方差为[(84-85)2+(84-85)2+(86-85)2+(84-85)2+(87-85)2]==1.6. 故选C. 4.某企业有职工450人,其中高级职工45人,中级职工135人,一般职工270人,现抽30人进行分层抽样,则各职称人数分别为( ) A.5,10,15 B. 5,9,16 C. 3,10,17 D. 3,9,18 【答案】D
点睛:进行分层抽样的相关计算时,常利用以下关系式巧解: (1) nN样本容量该层抽取的个体数总体个数该层的个体数; (2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比. 5.具有线性相关关系的两变量满足的一组数据如下表,若与的回归直线方程为,则的值为( )
A. 4 B. C. 5 D. 6 【答案】A
【解析】由表中数据得:,根据最小二乘法,将代入回归方程 - 3 -
,得,故选A. 6.某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( )
A. 6万元 B. 8万元 C. 10万元 D. 12万元 【答案】C
【解析】设11时到12时的销售额为万元,依题意有,,故选C. 点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 7.下面对相关系数r描述正确的是( ) A. 0r表明两个变量负相关 B. r 1表明两个变量正相关 C. r只能大于零 D. r越接近于0,两个变量相关关系越弱 【答案】D
8.下列说法错误的是( ) - 4 -
A. 在统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法 B. 在残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好 C. 线性回归方程对应的直线ˆˆˆybxa
至少经过其样本数据点中的一个点
D. 在回归分析中,相关指数2R越大,模拟的效果越好 【答案】C 【解析】对于A,统计学中,独立性检验是检验两个分类变量是否有关系的一种统计方法,正确;对于B,残差图中,残差分布的带状区域的宽度越狭窄,其模拟的效果越好,正确;对于C,线性回归方程对应的直线ˆˆˆybxa
过样本中心点,不一定过样本数据中的点,故C错误;
对于D,回归分析中,相关指数R2越大,其模拟的效果就越好,正确.故选C. 9.以下四个命题,其中正确的个数有( ) ①由独立性检验可知,有99%的把握认为物理成绩与数学成绩有关,某人数学成绩优秀,则他有99%的可能物理优秀. ②两个随机变量相关性越强,则相关系数的绝对值越接近于1; ③在线性回归方程0.212ˆyx中,当解释变量x每增加一个单位时,预报变量ˆy平均增加0.2个单位; ④对分类变量X与Y,它们的随机变量2K的观测值k来说, k越小,“X与Y有关系”的把握程度越大. A. 1 B. 2 C. 3 D. 4 【答案】B
10.下表是某工厂1—4月份用电量(单位:万度)的一组数据: 月份x 1 2 3 4 用电量y 4.5 4 3 2.5
由散点图可知,用电量y与月份x间有较好的线性相关关系,其线性回归直线方程是
0.7yxa,则a( ) - 5 -
A.10.5 B.5.25 C.5.2 D.5.15 【答案】B 【解析】 试题分析:因为12344.5432.52.5,3.544xy,所以2.5,3.5在归直线
方程0.7yxa上,即3.50.72.5,5.25aa,故选B. 考点:线性回归直线的性质和应用. 11.某高中共有学生1000名,其中高一年级共有学生380人,高二年级男生有180人.如果在全校学生中抽取1名学生,抽到高二年级女生的概率为19.0,先采用分层抽样(按年级分层)在全校抽取100人,则应在高三年级中抽取的人数等于 . 【答案】25
考点:分层抽样方法. 12.总体编号为01,02,…,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为_______.
【答案】01 【解析】 试题分析:从随机数表的第一行的第5列和第6列数字开始由左到右选取两个谁中小于20的编号依次为08,02,14,07,02,01,其中第二个和第四个都是02,重复,所以对应的数值为08,02,14,07,02,01.
考点:简单的随机抽样. - 6 -
专题18 统计与统计案例 1.如图是2014年在某电视节目中七位评委为某民族舞蹈打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为
A. 84,4.84 B. 84,1.6 C. 85,1.6 D. 85,4 【答案】C
2.某中学高一年级从甲、乙两个班各选出7名学生参加国防知识竞赛,他们取得的成绩(满分100分)的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83,则xy
的值为( )
A. 8 B. 168 C. 9 D. 169 【答案】C 【解析】∵甲班学生成绩的平均分是85,∴79+78+80+80+x+85+92+95=85×7,即x=6. ∵乙班学生成绩的中位数是83,甲班学生成绩的中位数是80+x=83,得x=3; ∴若1y,则中位数为81,不成立.若y>1,则中位数为80+y=83,解得y=3. ∴x+y=6+3=9,本题选择C选项. 点睛:茎叶图的绘制需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据. 3.某商场在国庆黄金周的促销活动中,对10月2日9时到14时的销售额进行统计,其频率- 7 -
分布直方图如图所示,已知9时至10时的销售额为2.5万元,则11时到12时的销售额为( )
A. 6万元 B. 8万元 C. 10万元 D. 12万元 【答案】C
点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的; (3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 4.如果个数的平均数为,则的平均数为( ) A.3 B.4 C.5 D.6 【答案】A
【解析】的平均数为1,,
, 的平均数为,故选A. 【思路点睛】本题主要考查平均数的求法,属于中档题.要解答本题首先根据个数的平均数为得到,从而可得的平均数为- 8 -
. 5.某中学初中部共有120名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )
A. 128 B. 144 C. 174 D. 167 【答案】B 【解析】女教师人数为: 120*0.7150*0.4144. 6.下列说法中正确的是( ) ①相关系数r用来衡量两个变量之间线性关系的强弱, r越接近于,相关性越弱; ②回归直线ybxa一定经过样本点的中心,xy; ③随机误差e满足0Ee,其方差De的大小用来衡量预报的精确度; ④相关指数2R用来刻画回归的效果, 2R越小,说明模型的拟合效果越好. A. ①② B. ③④ C. ①④ D. ②③ 【答案】D
7.下面是22列联表: 1y 2y 合计
1x a
21 63