2020年高考文科数学《概率与统计》题型归纳与训练
- 格式:doc
- 大小:1.03 MB
- 文档页数:20
高考文科数学概率与统计题型归纳与训练高考文科数学概率与统计题型归纳与训练近年来,随着高考评价重点的转变,我国高考数学概率与统计所占的比重越来越大,也极大地影响了学生的试题解答,特别是对文科类学生而言。
因此,归纳与训练概率与统计的题型对提升高考成绩非常有效。
一、高考概率与统计试题类型1、概率题:(1)概率概念题:要求判断某事件的可能性大小、求概率大小、比较概率大小,以及用中文描述概率大小等概念性问题。
(2)条件概率及贝叶斯公式:求两事件同时发生的条件概率,用贝叶斯公式求解概率问题。
(3)随机变量和概率分布:讨论正态分布、泊松分布等随机变量的概率分布。
2、统计学题:(1)数据的勘误析:把调查所得原始数据准确地归类编单,以便找出这些数据中蕴含的结论。
(2)图表分析:分析调查对象之间的关系,从折线图、饼形图、柱形图等图表中获取相应的数据。
二、概率与统计的训练方法1、理论思考训练:多看有关概率、统计的权威论文和教材,把基本概念牢牢掌握,把常见的概率公式及统计公式及推导式脱口而出。
2、示范练习:对常考的知识点补充示范练习,可以通过复现例题和大量习题来熟悉该知识点,从而深入理解,提高解题能力。
3、联系模拟考试:利用模拟考试把学过的知识点和技巧联系起来,在试题中能够驾轻就熟地掌握各试题技巧,大大提升实力。
4、强化记忆:记忆知识点、公式要选择相应的方法,通过反复记忆和熟习,把重点内容融会贯通,熟练记忆几个重点的式子和结论有助于考试的取得好成绩。
总之,学习概率与统计,除了要用心去理解之外,还需要不断的训练,把一些重点的知识点、公式强化记忆,加深理解,才能在考试中取得较好的成绩。
(文数)解答题强化专练——概率与统计一、解答题(本大题共10小题,共120.0分)1.党中央、国务院历来高度重视青少年的健康成长.“少年强则国强”,青少年身心健康、体魄强健、意志坚强、充满活力,是一个民族旺盛生命力的体现,是社会文明进步的标志,是国家综合实力的重要方面.全面实施《国家学生体质健康标准》,把健康素质作为评价学生全面健康发展的重要指标,是新时代的要求.《国家学生体质健康标准》有一项指标是学生体质指数(BMI),其计算公式为:,当BMI>23.5时认为“超重”,应加强锻炼以改善BMI.某高中高一、高二年级学生共2000人,人数分布如表(a).为了解这2000名学生的BMI指数情况,从中随机抽取容量为160的一个样本.性别男生女生合计年级高一年级5506501200高二年级425375800合计97510252000表(a)(1)为了使抽取的160个学生更具代表性,宜采取分层抽样,试给出一个合理的分层抽样方案,并确定每层应抽取出的学生人数;(2)分析这160个学生的BMI值,统计出“超重”的学生人数分布如表(b).性别男生女生年级高一年级46高二年级24表(b)(i)试估计这2000名学生中“超重”的学生数;(ii)对于该校的2000名学生,应用独立性检验的知识,可分析出性别变量比年级变量与“是否超重”关联性更强.应用卡方检验,可依次得到K2的观察值k1,k2,是判断k1和k2的大小关系.(只需写出结论)2.“公平正义”是社会主义和谐社会的重要特征,是社会主义法治理念的价值追求.“考试”作为一种公平公正选拔人才的有效途径,正被广泛采用.每次考试过后,考生最关心的问题是:自己的考试名次是多少?自已能否被录取?能获得什么样的职位?某单位准备通过考试(按照高分优先录取的原则)录用300名,其中275个高薪职位和25个普薪职位.实际报名人数为2000名,考试满分为400分.考试后对部分考生考试成绩进行抽样分析,得到频率分布直方图如下:试结合此频率分布直方图估计:(1)此次考试的中位数是多少分(保留为整数)?(2)若考生甲的成绩为280分,能否被录取?若能被录取,能否获得高薪职位?(分数精确到个位,概率精确到千分位)3.纪念币是一个国家为纪念国际或本国的政治、历史,文化等方面的重大事件、杰出人物、名胜古迹、珍稀动植物、体育赛事等而发行的法定货币.我国在1984年首次发行纪念币,目前已发行了115套纪念币,这些纪念币深受邮币爱好者的喜爱与收藏.2019年发行的第115套纪念币“双遗产之泰山币”是目前为止发行的第一套异形币,因为这套纪念币的多种特质,更加受到爱好者追捧.某机构为调查我国公民对纪念币的喜爱态度,随机选了某城市某小区的50位居民调查,调查结果统计如下:喜爱不喜爱合计年龄不大于40岁24年龄大于40岁20合计2250(Ⅰ)根据已有数据,把表格数据填写完整,判断能否在犯错误的概率不超过1%的前提下认为不同年龄与纪念币的喜爱无关?(Ⅱ)已知在被调查的年龄不大于40岁的喜爱者中有5名男性,其中3位是学生,现从这5名男性中随机抽取2人,求至多有1位学生的概率.附:,n=a+b+c+d.P(K2≥k)0.1000.0500.0250.010k 2.706 3.841 5.024 6.6354.某市一水电站的年发电量y(单位:亿千瓦时)与该市的年降雨量x(单位:毫米)有如下统计数据:2013年2014年2015年2016年2017年降雨量x (毫米) 1 500 1 400 1 900 1 600 2 100发电量y (亿千瓦7.4 7.0 9.2 7.9 10.0时)(1)若从统计的5年中任取2年,求这2年的发电量都高于7.5 亿千瓦时的概率;(2)由表中数据求得线性回归方程为=0.004x+,该水电站计划2019年的发电量不低于8.6 亿千瓦时,现由气象部门获悉2019年的降雨量约为1 800 毫米,请你预测2019年能否完成发电任务?5.2019年2月13日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数和中位数a(a的值精确到0.01);(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7,5),[7.5,8.5)的学生中抽取9名参加座谈会.(i)你认为9个名额应该怎么分配?并说明理由;(ii)座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?阅读时间不足8.5小时阅读时间超过8.5小时理工类专业4060非理工类专业附:.临界值表:P(K2≥k0)0.150.100.050.0250.0100.0050.001k0 2.072 2.706 3.841 5.024 6.6357.87910.8286.2017年3月郑州市被国务院确定为全国46个生活垃圾分类处理试点城市之一,此后由郑州市城市管理局起草公开征求意见,经专家论证,多次组织修改完善,数易其稿,最终形成《郑州市城市生活垃圾分类管理办法》(以下简称《办法》).《办法》已于2019年9月26日被郑州市人民政府第35次常务会议审议通过,并于2019年12月1日开始施行.《办法》中将郑州市生活垃圾分为厨余垃圾、可回收垃圾、有害垃圾和其他垃圾4类为了获悉高中学生对垃圾分类的了解情况,某中学设计了一份调查问卷,500名学生参加测试,从中随机抽取了100名学生问卷,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如图频率分布直方图:(Ⅰ)从总体的500名学生中随机抽取一人,估计其分数不低于60的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的学生人数;(Ⅲ)学校环保志愿者协会决定组织同学们利用课余时间分批参加“垃圾分类,我在实践”活动,以增强学生的环保意识.首次活动从样本中问卷成绩低于40分的学生中随机抽取2人参加,已知样本中分数小于40的5名学生中,男生3人,女生2人,求抽取的2人中男女同学各1人的概率是多少?7.某汽车公司生产新能源汽车,2019年3-9月份销售量(单位:万辆)数据如表所示:月份x3456789销售量y(万辆) 3.008 2.401 2.189 2.656 1.665 1.672 1.368(1)某企业响应国家号召,购买了6辆该公司生产的新能源汽车,其中四月份生产的4辆,五月份生产的2辆,6辆汽车随机地分配给A,B两个部门使用,其中A 部门用车4辆,B部门用车2辆.现了解该汽车公司今年四月份生产的所有新能源汽车均存在安全隐患,需要召回.求该企业B部门2辆车中至多有1辆车被召回的概率;(2)经分析可知,上述数据近似分布在一条直线附近.设y关于x的线性回归方程为,根据表中数据可计算出,试求出的值,并估计该厂10月份的销售量.8.某商家在某一天统计前5名顾客扫微信红包所得金额分别为5.9元,5.7元,4.7元,3.3元,2.1元,商家从这5名顾客中随机抽取3人赠送礼品.(Ⅰ)求获得礼品的3人中恰好有2人的红包超过5元的概率;(Ⅱ)商家统计一周内每天使用微信支付的人数x与每天的净利润y(单位:元),得到如表:x12162225262930y60100210240150270330根据表中数据用最小二乘法求y与x的回归方程=(,的计算结果精确到小数点后第二位)并估计使用微信支付的人数增加到36人时,商家当天的净利润为多少(计算结果精确到小数点后第二位)?参考数据及公式:①=22.86,=194.29;=268.86;=3484.29,②回归方程:=(其中=,=-)9.某医学院欲研究昼夜温差大小与患感冒人数多少之间的关系,该院派出研究小组分别到气象局与某医院,抄录了1到6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到数据资料见表:月份123456昼夜温差(℃)1011131286就诊人数(个)232630271713该研究小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻的两个月的概率;(2)已知选取的是1月与6月的两组数据.(i)请根据2到5月份的数据,求就诊人数y关于昼夜温差x的线性回归方程:(ii)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该研究小组所得的线性回归方程是否理想?(参考公式==,=-)10.某学校有40名高中生参加足球特长生初选,第一轮测身高和体重,第二轮足球基础知识问答,测试员把成绩(单位:分)分组如下:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100),得到频率分布直方图如图所示.(1)根据频率分布直方图估计成绩的平均值(同一组中的数据用该组区间的中点值作代表);(2)用分层抽样的方法从成绩在第3,4,5组的高中生中6名组成一个小组,若6人中随2人担任小组负责人,求这2人来自3,4组各1人的概率.答案和解析1.【答案】解:(1)考虑到BMI应与年龄或性别均有关,最合理的分层应为以下四层:高一男生、高一女生、高二男生、高二女生;则高一男生抽取×160=44(人),高一女生抽取×160=52(人),高二男生抽取×160=34(人),高二女生抽取×160=30(人);(2)(i)160人中,“超重”人数为4+6+2+4=16(人),“超重”发生的频率为0.1,用样本的频率估计总体的频率,估计这2000名学生中“超重”的学生数为2000×0.1=200(人);(ii)应用独立性检验的知识,分析出性别变量与年级变量哪一个与“是否超重”的关联性更强,得出K2的观察值k1,k2,则k1和k2的大小关系为k1>k2.【解析】(1)考虑到BMI与年龄或性别均有关,最合理的分层为高一男生、女生,高二男生、女生;分别求出每层所抽取的人数即可;(2)(i)计算样本中“超重”的人数和频率,用样本的频率估计总体的频率,计算即可;(ii)应用独立性检验的知识分析出性别变量与年级变量哪一个与“是否超重”的关联性更强,得出K2的观察值k1应大于k2.本题考查了分层抽样原理与独立性检验的问题,也考查了用样本估计总体的问题,是基础题.2.【答案】解:(1)设(0.002+0.0029+x)×100=0.5,解得:x=0.0001.∴可得其中位数为:200+×(300-200)≈202.(2)300~400分的人数为:0.001×100×2000=200.280~300分的人数为:0.0041×100×2000×=164.而164+200>300.∴考生甲的成绩为280分,不能被录取.【解析】(1)设(0.002+0.0029+x)×100=0.5,解得:x.可得其中位数.(2)300~400分的人数为:0.001×100×2000=200.280~300分的人数为:0.0041×100×2000×=164.进而判断出结论.本题考查了频率分布直方图的性质及其应用,考查了推理能力与计算能力,属于中档题.3.【答案】解:(1)根据题意,设表中数据为喜爱不喜爱合计年龄不大于40岁a b24年龄大于40岁20c d 合计e2250则有e+22=50,则e=28;24+d=50,则d=26,a+20=e=28,则a=8,a+b=24,则b=16,b+c=22,则c=6;故列联表为:喜爱不喜爱合计年龄不大于40岁81624年龄大于40岁20626合计282250则有≈9.623>6.635.故能在犯错误的概率不超过1%的条件下认为不同年龄与纪念币的喜爱无关.(2)根据题意,记不大于40岁的5位喜爱者中的3位学生记为a,b,c,非学生记为A,B,则从5人中任取2人,共有(a,b),(a,c),(a,A),(a,B),(b,c),(b,A),(b,B),(c,A),(c,B),(A,B)10种结果.其中至多有1位学生的有7种,∴至多有1位学生的概率.【解析】(1)根据题意,由列联表的结构分析可得其他数据,即可完善列联表,进而计算K2的值,据此分析可得答案;(2)根据题意,记不大于40岁的5位喜爱者中的3位学生记为a,b,c,非学生记为A,B;由列举法分析“从这5名男性中随机抽取2人”和“至多有1位学生”的情况数目,由古典概型公式计算可得答案.本题考查独立性检验的应用,涉及古典概型的计算,属于基础题.4.【答案】解:(1)从统计的5年发电量中任取2年,基本事件为:(7.4,7.0},{7.4,9.2},{7.4,7.9},{7.4,10.0},{7.0,9.2},{7.0,7.9},{7.0,10.0},{9.2,7.9},{9.2,10.0},{7.9,10.0},共10个;其中这2年的发电量都高于7.5亿千瓦时的基本事件为:{9.2,7.9},{9.2,10.0},{7.9,10.0},共3个.所以这2年的发电量都高于7.5亿千瓦时的概率为.(2)因为.,又直线过点,所以,解得,所以.当x=1800时,.所以预测该水电站2019年能完成发电任务.【解析】本题考查回归直线方程,概率中的基本事件,属于中档题.(1)确定从统计的5年发电量中任取2年的基本事件、2年发电量都低于8.0(亿千瓦时)的基本事件,即可求出这2年的发电量都低于8.0(亿千瓦时)的概率;(2)先求出线性回归方程,再令x=1800,即可得出结论.5.【答案】解:(1)该组数据的平均数因为0.03+0.1+0.2+0.35=0.68>0.5,所以中位数a∈[8.5,9.5),由0.03+0.1+0.2+(a-8.5)×0.35=0.5,解得;(2)(i)每周阅读时间为[6,5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6,5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配.(ii)由频率分布直方图可知,阅读时间不足8.5小时的学生共有200×(0.03+0.1+0.2)=66人,超过8.5小时的共有200-66=134人.于是列联表为:阅读时间不足8.5小时阅读时间超过8.5小时理工类专业4060非理工类专业2674K2的观测值,所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【解析】本题主要考查独立性检验的应用,根据数据计算出K2的观测值是解决本题的关键.考查学生的计算能力.(1)根据平均数,中位数的定义进行求解即可,(2)完成列联表,计算K2的观测值,结合独立性检验的性质进行判断即可.6.【答案】解:(Ⅰ)根据频率分布直方图可知,样本中分数高于60的频率为:(0.02+0.04+0.02)×10=0.8,所以样本中分数高于60的概率为0.8.故从总体的500名学生中随机抽取一人,其分数高于60的概率估计为0.8.(Ⅱ)根据题意,样本中分数不小于50的频率为:(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5,所以总体中分数在区间[40,50)内的人数估计为500×=25,(Ⅲ)设3名男生分别为A,B,C,2名女生分别为1,2,则从这5名同学中选取2人的结果为:{A,B},{A,C},{A,1},{A,2},{B,C},{B,1},{B,2},{C,1},{C,2},{1,2}共10种情况.其中2人中男女同学各1人包含结果为:{A,1},{A,2},{B,1},{B,2},{C,1},{C,2},共6种,设事件A={抽取的2人中男女同学各1人},则P(A)=,所以,抽取的2人中男女同学各1人的概率是.【解析】(1)由直方图求出分数高于60的频率,计算出分数高于60的概率,(2)先计算出分数不小于50的频率,再算出分数在区间[40,50)内的人数,再估算出总体中分数在区间[40,50)内的人数.(3)先计算出从这5名同学中选取2人的事件,再算出抽取的2人中男女同学各1人的事件,再求抽取的2人中男女同学各1人的概率.本题考查频率直方图,通过频率估算整体,以及求频率,属于基础题.7.【答案】解:(1)设某企业购买的6辆新能源汽车,4月份生产的4辆车为C1,C2,C3,C4;5月份生产的2辆车为D1,D2,6辆汽车随机地分配给A,B两个部门.B部门2辆车可能为(C1,C2),(C1,C3),(C1,C4),(C1,D1),(C1,D2),(C2,C3),(C2,C4),(C2,D1),(C2,D2),(C3,C4),(C3,D1),(C3,D2),(C4,D1,(C4,D2),(D1,D2)共15种情况;其中,至多有1辆车是四月份生产的情况有:(C1,D1),(C1,D2),(C2,D1),(C2,D2),(C3,D1),(C3,D2),(C4,D1),(C4,D2),(D1,D2)共9种,所以该企业B部门2辆车中至多有1辆车被召回的概率为;(2)由题意得,.因为线性回归方程过样本中心点,所以,解得.当x=10时,,即该厂10月份销售量估计为1.151万辆.【解析】(1)用列举法,求出个数,根据概率公式求出即可;(2)求出线性回归方程过样本中心点,代入求出a,再代入x=10即可.考查古典概型求概率,线性回归方程的性质及其应用,中档题.8.【答案】解:(Ⅰ)记“5名顾客扫微信红包所得金额超过5元的2人”为A1,A2,“不超过5元的3人”为B1,B2,B3,“获得礼品的3人中恰好有2人的红包超过5元”为事件M,则所有的基本事件有:A1A2B1,A1A2B2,A1A2B3,A1B1B2,A1B1B3,A1B2B3,A2B1B2,A2B1B3,A2B2B3,B1B2B3共10种,其中事件M包含的基本事件有共3种,为A1A2B1,A1A2B2,A1A2B3,∴P(M)=;(Ⅱ)∵==,∴=-=194.29-12.9622.86=-101.98.∴y与x的回归方程为=12.96x-101.98,当x=36时,.故估计使用微信支付的人数增加到36人时,商家当天的净利润约为364.58元.【解析】(Ⅰ)利用古典概型的概率公式求获得礼品的3人中恰好有2人的红包超过5元的概率;(Ⅱ)利用最小二乘法求y与x的回归方程为=12.96x-101.98,把x=36代入方程,即可得解.本题考查古典概型的概率的计算,考查线性回归方程的求法,考查利用回归方程进行预测,意在考查学生对这些知识的理解掌握水平和分析推理计算能力,是中档题.9.【答案】解:(1)设选取的2组数据恰好是相邻两个月为事件A,因为从6组数据中选取2组数据共有15种情况,每种情况都是等可能出现的,其中选取的2组数据恰好是相邻两个月的情况有5种,所以P(A)=,(2)=(11+13+12+8)=11,=(26+30+27+17)=25,===,=-=25-=,得到y关于x的回归直线方程为y=(2)当x=10时,y=同样,当x=6时,y=,估计数据与所选出的检验数据的误差均不超过2人,∴该小组所得线性回归方程是理想的.【解析】(1)本题是一个古典概型,试验发生包含的事件是从6组数据中选取2组数据共有15种情况,满足条件的事件是抽到相邻两个月的数据的情况有5种,根据古典概型的概率公式得到结果.(2)根据所给的数据,求出x,y的平均数,根据求线性回归方程系数的方法,求出系数a,b,写出线性回归方程;(3)将x的值代入回归方程检验即可.考查古典概型求概率,求线性回归方程和应用,考查运算能力,中档题.10.【答案】解:(1)因为(0.01+0.07+0.06+x+0.02)×5=1,所以x=0.04,所以成绩的平均值为+0.10×=87.25;(2)第3组学生人数为0.06×5×40=12,第4 组学生人数为0.04×5×40=8,第5组学生人数为0.02×5×40=4,所以抽取的6人中第3,4,5组的人数分别为3,2,1.第3组的3人分别记为A1,A2,A3,第4 组的2人分别记为B1,B2,第5 组的1 人记为C,则从中选出2人的基本事件为共15个,记“从这6人中随机选出2人担任小组负责人,这2人来自第3,4组各1人”为事件M ,则事件M包含的基本事件为(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),共6个,所以P(M)=.【解析】(1)根据频率分布直方图求出x的值,再利用同一组中的数据用该组区间的中点值作代表估计平均数即可;(2)先求出抽取的6人中第3,4,5组的人数,再利用古典概型的概率公式求解即可.本题考查由频数分布直方图,以及古典概型,属于基础题.。
热点10 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【考查题型】选择,填空,解答题【限时检测】(建议用时:45分钟)1.(2018·黑龙江哈尔滨三中高考模拟(文))从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图所示.根据茎叶图,下列描述正确的是( )A.甲种树苗的高度的中位数大于乙种树苗高度的中位数,且甲种树苗比乙种树苗长得整齐B.甲种树苗的高度的中位数大于乙种树苗高度的中位数,但乙种树苗比甲种树苗长得整齐C.乙种树苗的高度的中位数大于甲种树苗高度的中位数,且乙种树苗比甲种树苗长得整齐D.乙种树苗的高度的中位数大于甲种树苗高度的中位数,但甲种树苗比乙种树苗长得整齐【答案】D【解析】从茎叶图的数据可以看出甲种树苗的平均高度为27,乙种树苗的平均高度为30,因此乙种树苗的平均高度大于甲种树苗的平均高度.又从茎叶图分析知道,甲种树苗的高度集中在20到30之间,因此长势更集中.2.(2019·辽宁高考模拟(文))《九章算术》中有如下问题:“今有勾五步,股一十二步,问勾中容圆,径几何?”其大意:“已知直角三角形两直角边长分别为5步和12步,问其内切圆的直径为多少步?”现若向此三角形内随机投一粒豆子,则豆子落在其内切圆外的概率是( )A .215π B .320π C .2115π-D .3120π-【答案】C 【解析】 【分析】本题首先可以根据直角三角形的三边长求出三角形的内切圆半径,然后分别计算出内切圆和三角形的面积,最后通过几何概型的概率计算公式即可得出答案. 【详解】13=, 设内切圆的半径为r ,则51213r r -+-=,解得2r =. 所以内切圆的面积为24r ππ=,所以豆子落在内切圆外部的概率42P 111155122ππ=-=-⨯⨯,故选C.【名师点睛】本题主要考查“面积型”的几何概型,属于中档题. 解决几何概型问题常见类型有:长度型、角度型、面积型、体积型,求与面积有关的几何概型问题关鍵是计算问题的总面积以及事件的面积;几何概型问题还有以下几点容易造成失分,在备考时要高度关注:(1)不能正确判断事件是古典概型还是几何概型导致错误;(2)基本事件对应的区域测度把握不准导致错误 ;(3)利用几何概型的概率公式时 , 忽视验证事件是否等可能性导致错误. 3.(2019·安徽合肥一中高考模拟(文))甲、乙两名同学在 6 次数学考试中,所得成绩 用茎叶图表示如下,若甲、乙两人这 6 次考试的平均成绩分别用,x x 乙甲 表示,则下列结论正确的是( )A .x x >乙甲 ,且甲成绩比乙成绩稳定B .x x >乙甲 ,且乙成绩比甲成绩稳定C .x x <乙甲 ,且甲成绩比乙成绩稳定D .x x <乙甲,且乙成绩比甲成绩稳定【答案】C 【解析】 【分析】从茎叶图提取两个人的成绩,分别求出两个人的平均分,得到甲的平均数比乙的平均数要低,但甲数据比较集中,所以成绩比较稳定. 【详解】757782838590826x +++++==甲,727681869192836x +++++==乙,所以x x <乙甲,因为甲数据比较集中,所以成绩比较稳定. 【名师点睛】茎叶图保留了原始数据,所以可通过计算平均数来比较大小,再通过数据的集中与离散程度判断稳定性.4.(2018·天津南开中学高考模拟(文))在长为12cm 的线段AB 上任取一点C .现作一矩形,邻边长分别等于线段AC ,CB 的长,则该矩形面积大于20cm 2的概率为 A .16B .13C .23D .45【答案】C 【解析】试题分析:设AC=x ,则BC=12-x (0<x <12) 矩形的面积S=x (12-x )>20 ∴x 2-12x+20<0 ∴2<x <10由几何概率的求解公式可得,矩形面积大于20cm 2的概率10221203p -==-考点:几何概型5.(2019·新疆高考模拟(文))《史记》中讲述了田忌与齐王赛马的故事.“田忌的上等马优于齐王的中等马,劣于齐王的上等马;田忌的中等马优于齐王的下等马,劣于齐王的中等马;田忌的下等马劣于齐王的下等马.”双方从各自的马匹中随机选一匹进行一场比赛,则田忌的马获胜的概率为A .31 B .41 C .51 D .61 【答案】A 【解析】分析:由题意结合古典概型计算公式即可求得最终结果.详解:记田忌的上等马、中等马、下等马分别为a ,b ,c ,齐王的上等马、中等马、下等马分别为A ,B ,C ,由题意可知,可能的比赛为:Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,Ca ,Cb ,Cc ,共有9种,其中田忌可以获胜的事件为:Ba ,Ca ,Cb ,共有3种,则田忌马获胜的概率为p =39=13.本题选择A 选项.【名师点睛】:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.6.(2017·天津耀华中学高考模拟(文))某工厂甲,乙,丙三个车间生产了同一种产品,数量分别为600件,400件,300件,用分层抽样方法抽取容量为n 的样本,若从丙车间抽取6件,则n 的值为( ) A .18 B .20C .24D .26【答案】D 【解析】由分层抽样的定义可得:6300600400300n =++,解得:26n =. 本题选择D 选项.7.(2017·辽宁高考模拟(文))设样本数据1210,,,x x x L 的均值和方差分别为1和4,若(i i y x a a =+为非零常数,1,2,,10)i =L ,则1210,,,y y y L 的均值和方差分别为( )A .1,4a +B .1,4a a ++C .1,4D .1,4a +【答案】A 【解析】试题分析:因为样本数据1210,,,x x x L 的平均数是1,所以1210,,...y y y 的平均数是121012101210 (1101010)y y y x a x a x a x x x a a ++++++++++++==+=+;根据i i y x a =+(a 为非零常数,1,2,,10i =L ),以及数据1210,,,x x x L 的方差为4可知数据1210,,,y y y L 的方差为2144⨯=,综上故选A. 考点:样本数据的方差和平均数.8.(2017·陕西高考模拟(文))已知函数2()log ,[1,8]f x x x =∈,则不等式1()2f x ≤≤ 成立的概率是( ) A .17B .27C .37D .47【答案】B 【解析】由()12f x ≤≤,可知21log 2x ≤≤,解得24x ≤≤,由几何概型可知27P =,选B 二、填空题9.(2017·河南高考模拟(文))已知()0,0O ,()2,1A ,()1,2B -,31,55C ⎛⎫- ⎪⎝⎭,动点(),P x y 满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r≤⋅≤,则点P 到点C 的距离大于14的概率为______.【答案】5164π- 【解析】由题意得,因为()()()310,0,2,1,1,2,,55O A B C ⎛⎫-- ⎪⎝⎭,所以动点(,)P x y 满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r≤⋅≤,所以022{022x y x y ≤+≤≤-≤ ,则点P 到点C 的距离为22311()()5516z x y =-++≥ ,作出不等式组对应的平面区域,如图所示, 因为点P 到点C 的距离大于14,所以14PC >,则对应的部分为阴影部分,由2042,2055x y x y x y -==⎧⇒=+=⎨⎩ ,即点42(,)55E,则OE ==,所以正方形OEFG 的面积为45, 则阴影部分的面积为41516π- ,所以根据几何概型的概率公式可知所求的概率为41551614645ππ-=-.【名师点睛】:本题主要考查了几何概型及其概率的计算问题,其中解答中涉及到向量的数量积的运算,二元一次不等式组所表示的平面区域,简单的线性规划的应用,几何概型及其概率的计算公式等知识点的综合应用,着重考查了学生分析问题和解答问题的能力,以及推理与运算能力,本题的解答中利用向量的数量积的运算,转化为简单的线性规划求解是解答的关键.9.(2018·河南高考模拟(文))某班共有56名学生,现将所有学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知12号、26号、54号同学在样本中,则样本中还 有一名同学的编号是__________. 【答案】40【解析】【分析】先求出组距,然后根据已知的第二个样本的编号,求得第三个样本的编号.【详解】从56名学生中抽取4名,组距为56414÷=,由于抽取到第二个编号为26号,故第三个样本的编号为261440+=号.【名师点睛】本小题主要考查系统抽样的知识,先求得系统抽样的组距,然后根据已知来求得未知的样本编号,属于基础题.11.(2019·浠水县实验高级中学高三月考(文))设AB=6,在线段AB上任取两点(端点A,B除外),将线段AB分成了三条线段,若分成的三条线段长度均为正整数,则这三条线段可以构成三角形的概率是____________;若分成的三条线段的长度均为正实数,则这三条线段可以构成三角形的概率是_________.【答案】11014【解析】【分析】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;2,2,2共3种情况,其中只有三条线段为2,2,2时能构成三角形,由古典概型的概念,得到概率.三条线段的长度均为正实数时,则是几何概型,设出变量,写出全部结果所构成的区域,和满足条件的事件对应的区域,注意整理三条线段能组成三角形的条件,求出面积,作比值得到概率.【详解】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;1,3,2;1,4,1;2,1,3;2,2,2;2,3,1;3,1,2;3,2,1;4,1,1共10种情况,其中只有三条线段为2,2,2时能构成三角形则构成三角形的概率p1 10 =.(2)由题意知本题是一个几何概型设其中两条线段长度分别为x,y,则第三条线段长度为6﹣x﹣y,则全部结果所构成的区域为:0<x<6,0<y<6,0<6﹣x﹣y<6,即为0<x<6,0<y<6,0<x+y<6所表示的平面区域为三角形OAB;若三条线段x,y,6﹣x﹣y,能构成三角形,则还要满足666x y x yx x y yy x y x+--⎧⎪+--⎨⎪+--⎩>>>,即为333x yyx+⎧⎪⎨⎪⎩><<,所表示的平面区域为三角形DEF,由几何概型知所求的概率为:P14DEFAOBSS==VV【名师点睛】本题考查古典概型,考查几何概型,对于几何概型的问题,一般要通过把试验发生包含的事件同集合结合起来,根据集合对应的图形做出面积,用面积的比值得到结果. 三、解答题12.(2019·天津高考模拟(文))为预防H 1N 1病毒爆发,某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个流感样本分成三组,测试结果如下表:已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. (∴)求x 的值;(∴)现用分层抽样的方法在全体样本中抽取360个测试结果,问应在C 组抽取多少个? (∴)已知y ≥465,z ≥30,求不能通过测试的概率.【答案】(1)660;(2)90;(3)112.【解析】 【分析】(1)由古典概型概率公式列方程求解即可;(2)先求出C 组样本个数,再根据分层抽样方法可得结果;(3)利用列举法可得基本事件空间包含的基本事件有11个,测试不能通过事件包含基本事件2个,利用古典概型概率公式可得结果. 【详解】(1)∵在全体样本中随机抽取1个,抽到B 组疫苗有效的概率约为其频率 即x 2000=0.33, ∴ x =660;(2)C 组样本个数为y +z =2000-(673+77+660+90)=500,现用分层抽样的方法在全体样本中抽取360个测试结果,应在C 组抽取个数为3602000×500=90;(3)设测试不能通过事件为A,C 组疫苗有效与无效的可能的情况记为(y,z )由(2)知500=y+z ,且y,z ∈N ,基本事件空间包含的基本事件有:(465,35)、(466,34)、(467,33)、……(475,25)共11个 若测试不能通过,则77+90+z>200,即z>33事件A 包含的基本事件有:(465,35)、(466,34)共2个 ∴ P(A)=211故不能通过测试的概率为211.【名师点睛】本题主要考查分层抽样以及古典概型概率公式的应用,属于难题,利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有 (1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先(A 1,B 1),(A 1,B 2)….(A1,B n),再(A2,B1),(A2,B2)…..(A2,B n)依次(A3,B1)(A3,B2)….(A3,B n)… 这样才能避免多写、漏写现象的发生.13.(2019·山东高考模拟(文))2019年2月13日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X(单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数x和中位数a(a的值精确到0.01);(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i)你认为9个名额应该怎么分配?并说明理由;(ii)座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:【答案】(1)平均数9,中位数8.99;(2)(i )按照1:2进行名额分配;理由见详解; (ii )有. 【解析】 【分析】(1)根据平均数,中位数的定义进行求解即可(2)完成列联表,计算2K 的观测值,结合独立性检验的性质进行判断即可. 【详解】(1)该组数据的平均数60.0370.180.290.35100.19x =⨯+⨯+⨯+⨯+⨯110.09120.049+⨯+⨯=,因为0.030.10.20.350.680.5+++=>,所以中位数[8.5,9.5)a ∈,由0.030.10.2(8.5)0.350.5a +++-⨯=,解得0.50.338.58.990.35a -=+≈;(2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配.(ii)由频率分布直方图可知,阅读时间不足8.5小时的学生共有200(0.030.10.2)66⨯++=人,超过8.5小时的共有20066134-=人.于是列联表为:2K的观测值2200(40742660)4.432 3.84166134100100k⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【名师点睛】本题主要考查独立性检验的应用,根据数据计算出K2的观测值是解决本题的关键.考查学生的计算能力.14.(2019·江西高考模拟(文))某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区试点,得到试点地区加盟店个数分别为1,2,3,4,5时,单店日平均营业额y(万元)的数据如下:(1)求单店日平均营业额y(万元)与所在地区加盟店个数x(个)的线性回归方程;(2)根据试点调研结果,为保证规模和效益,在其他5个地区,该公司要求同一地区所有加盟店的日平均营业额预计值总和不低于35万元,求一个地区开设加盟店个数m 的所有可能取值;(3)小赵与小王都准备加入该公司的加盟店,根据公司规定,他们只能分别从其他五个地区(加盟店都不少于2个)中随机选一个地区加入,求他们选取的地区相同的概率.(参考数据及公式:51125i ii x y==∑,52155i i x ==∑,线性回归方程ˆybx a =+,其中1221ni ii nii x y nxyb xnx ==-=-∑∑,a y bx =-.)【答案】(1) ˆ12yx =-+ (2) 5,6,7 (3) 15P = 【解析】 【分析】(1)利用最小二乘法求线性回归方程;(2)解不等式()1235m m -≥得一个地区开设加盟店个数m 的所有可能取值;(3)利用古典概型的概率求选取的地区相同的概率. 【详解】(1)由题可得,3x =,9y =,设所求线性回归方程为ˆybx a =+, 则5152215125135155455i i i ii x y xy b x x ==--===---∑∑,将3x =,9y =代入,得()9312a =--=,故所求线性回归方程为ˆ12yx =-+. (2)根据题意,()1235m m -≥,解得:57m ≤≤,又m Z +∈,所以m 的所有可能取值为5,6,7.(3)设其他5个地区分别为,,,,A B C D E ,他们选择结果共有25种,具体如下:AA ,AB ,AC ,AD ,AE ,BA ,BB ,BC ,BD ,BE ,CA ,CB ,CC ,CD ,CE ,DA ,DB ,DC ,DD ,DE ,EA ,EB ,EC ,ED ,EE ,其中他们在同一个地区的有5种,所以他们选取的地区相同的概率51255P ==. 【名师点睛】本题主要考查线性回归方程的求法,考查古典概型的概率的计算,意在考查学生对这些知识的理解掌握水平和分析推理能力.15.(2018·天津南开中学高考模拟(文))某校从高一年级学生中随机抽取40名学生,将 他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,后得到如图的频率分布直方图.(1)求图中实数a 的值;(2)若该校高一年级共有学生640人,试估计该校高一年级 期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03a =. (2)544人. (3)()715P M =. 【解析】试题分析:(1)由于图中所有小矩形的面积之和等于1, 所以10(0.0050.010.02⨯++0.0250.01)1a +++=. ……2分解得0.03a =. ……3分(2)根据频率分布直方图,成绩不低于60分的频率 为110(0.0050.01)-⨯+0.85=. ……5分由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学成绩不低于60分的人数约为6400.85544⨯=人. ……6分 (3)成绩在[)40,50分数段内的人数为400.052⨯=人,分别记为A ,B . ……7分成绩在[]90,100分数段内的人数为400.14⨯=人,分别记为C ,D ,E ,F . ……8分若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生, 则所有的基本事件有:(),A B ,(),A C ,(),A D ,(),A E ,(),A F ,(),B C ,(),B D ,(),B E ,(),B F ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F , (),E F 共15种. ……10分如果两名学生的数学成绩都在[)40,50分数段内或都在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[)40,50分数段内,另一个成绩在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定大于10. 记“这两名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有:(),A B ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F ,(),E F 共7种. ……11分所以所求概率为()715P M =. ……12分 考点:本小题主要考查频率分布直方图的应用和古典概型概率的求解,考查学生识图、用图的能力和运算求解能力.【名师点睛】:解决与频率分布直方图有关的题目时,要注意到频率分布直方图中纵轴表示的是频率/组距,不是频率,图中小矩形的面积才表示频率.16.(2019·江西高考模拟(文))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:万元)对年销售量y (单位:吨)和年利润z (单位:万元)的影响.对近六年的年宣传费i x 和年销售量i y (1,2,3,4,5,6i =)的数据作了初步统计,得到如下数据:经电脑模拟,发现年宣传费x (万元)与年销售量y (吨)之间近似满足关系式b y a x =⋅(,0a b >).对上述数据作了初步处理,得到相关的值如表:(1)根据所给数据,求y 关于x 的回归方程; (2)已知这种产品的年利润z 与x ,y 的关系为e14zx =-若想在2019年达到年利润最大,请预测2019年的宣传费用是多少万元?附:对于一组数据()1,l u v ,()22,u v ,…,(),n n u v ,其回归直线v u a β=⋅+中的斜率和截距的最小二乘估计分别为()1221()()ni i i nii u v n uv un u β==-=-∑∑,v u αβ=-⋅【答案】(1)y e =(2)当2018年的宣传费用为98万元时,年利润有最大值. 【解析】 【分析】(1)转化方程by a x =⋅,结合线性回归方程参数计算公式,计算,即可.(2)将z 函数转化为二次函数,计算最值,即可. 【详解】(1)对by a x =⋅,(0a >,0b >),两边取对数得ln ln ln y a b x =+,令ln i i u x =,ln i i v y =,得ln v a b u =+⋅,由题目中的数据,计算24.6 4.16u ==,18.33.056v ==, 且()()6611ln ln i iiii i u v x y ====∑∑ 75.3,()6622111n 101.4ii i i u x ====∑∑; 则()6162216ˆ6i i i i i u v u v b u u ==-⋅=-⋅∑∑ 275.36 4.1 3.05101.46 4.1-⨯⨯=-⨯ 0.2710.542==, 1ln ln 3.05 4.112a v u =-=-⨯=, 得出ˆae =, 所以y 关于x的回归方程是ˆye = (2)由题意知这种产品的年利润z 的预测值为14ˆe z x e =-=1414e e x -=-(14e x -=-27e +,=98x =时,ˆz 取得最大值,即当2019年的年宣传费用是98万元时,年利润有最大值.【名师点睛】考查了线性回归方程求解,考查了二次函数计算最值问题,关键结合题意,得到回归方程,第二问关键转化为二次函数问题,难度中等.。
概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型等内容,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§10-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.【例题分析】例1 国家射击队的某队员射击一次,命中7-10环的概率如下表:求该队员射击一次,(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P (Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例4 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }. 所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.练习10-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题4.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.5.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.三、解答题6.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.§10-2 统 计【知识要点】1.随机抽样总体、个体、样本:把所考察对象的某一个数值指标的全体构成的集合看成总体,构成总体的每一个元素称为个体,从总体中抽出若干个体所组成的集合叫做样本.随机抽样:抽样时,保证每一个个体都可能被抽到,且每个个体被抽到的机会均等,满足这样条件的抽样为随机抽样.简单随机抽样:从元素个数为N 的总体中,不放回的抽取容量为n 的样本,如果每一次抽样时,总体中的各个个体有相同的可能性被抽到,这种抽样方法叫简单随机抽样.系统抽样:当总体个数很大时,可将总体分成均匀的若干部分,然后按照预先制定的规则从每一部分抽取一个个体得到所需要的样本,这种抽样的方式叫做系统抽样.分层抽样:当总体由有明显差异的几部分组成时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.三种抽样方法的比较常用频率分布表、频率分布直方图、频率分布折线图、茎叶图等统计图表来表示样本数据,观察样本数据的特征,从而估计总体的分布情况.频率分布(表)直方图的画法步骤:(1)计算极差(用样本数据的最大值减去最小值)(2)决定组数与组距(组数×组距=极差)(3)决定分点(4)列频率分布表(5)绘制频率分布直方图易见直方图中各个小长方形面积等于相应各组的频率,所有小长方形面积之和等于1. 频率分布折线图:连结频率分布直方图各个长方形上边的中点,就得到频率分布折线图. 总体密度曲线:随着样本容量的增加,分组的组距不断缩小,相应的频率分布折线图就会越来越接近于一条光滑曲线,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.茎叶图:茎指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少时,茎叶图表示数据的效果较好.它的突出优点是:统计图中没有原始数据的损失,所有的数据信息都可以从茎叶图中得到;茎叶图可随时记录,方便表示.3.用样本的数字特征估计总体的数字特征样本数据的平均数:如果有n 个数x 1,x 2,…,x n ,那么nx x x x n +++=Λ21叫做这n 个数的平均数.标准差:样本数据到平均数的一种平均距离,一般用s 表示,其中nx x x x x x s n 22221)()()(-++-+-=Λ.方差:标准差的平方s 2叫做方差.⋅-++-+-=n x x xx x x s Zn )()()(22212¬Λ 4.两个变量间的关系散点图:两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫做散点图.线性相关:若两个变量的散点图中所有点看上去都在一条直线附近波动,则这两个变量可近似看成具有线性相关关系.回归直线方程:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心一条直线附近,则这条直线叫做这些数据点的回归直线方程,记作yˆ=bx +a ,其中b 叫回归系数.最小二乘法:假设我们已经得到两个具有线性相关关系的变量的一组数组),(11y x ,),(22y x ,…,),(33y x ,求得,)()()(ˆ2211211x n x y x n y x x x y y x x b in i i i n i ini i in i --=---=∑∑∑∑====⋅⋅⋅ x b y a ˆˆ-=,这时离差211)(2i i bx a y n Q --==最小,所求回归直线方程是a x b y ˆˆˆ+=.这种求回归直线的方法称为最小二乘法.【复习要求】1.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算样本数据平均数、标准差,并给出合理解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.【例题分析】例1 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是______,若用分层抽样方法,则40岁以下年龄段应抽取______人.【分析】由已知系统抽样的组距为5,所以相邻组间的号码相差5;由饼形图可知200名职工中,50岁以上人数:40-50岁人数:40岁以下人数=2∶3∶5,总样本为40人,分层抽样抽取每层人数比例为2∶3∶5.解:37;20【评析】系统抽样的特征是等距,也就是只要在一组内选定号码,其余各组的号码随之选定,所选相邻号码的间隔为组距.分层抽样的特征是按比例抽取,也就是每一层所选人数占总选出人数的比例与每层人数占总人数的比例相等.抽样是统计分析的重要部分,最常用的抽样方法是简单随机抽样、系统抽样和分层抽样,抽样时每个个体被抽到的可能性相等.简单随机抽样常用抽签法和随机数表法.例2 对某电子元件进行寿命追踪调查,情况如下:寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600)个数(个) 20 30 80 40 30(2)画出频率分布直方图;(3)估计电子元件寿命在[100,400)以内的概率;(4)估计电子元件寿命在400h以上的概率.【分析】按要求列表、绘图,并用样本的分布估计总体的分布.解:(1)频率分布表(2)(画图);(3)P=0.10+0.15+0.40=0.65;(4)P=1-0.65=0.35.寿命(h) 频数频率[100,200) 20 0.10[200,300) 30 0.15[300,400) 80 0.40[400,500) 40 0.20[500,600) 30 0.15合计200 1.00【评析】频率分布表和频率分布直方图是用统计的方法对样本数据加以概括和总结.列频数分布表时,要区分频数和频率的意义,画频率分布直方图时要注意横、纵坐标代表的意义和单位.频率分布指的是一个样本数据在各拿小范围内所占比例的大小,常用样本数据落在某个范围的频率估计总体落在这个范围的概率.频率分布直方图中众数是最高矩形中点的横坐标,中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.例3 (海南)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①___________________________________________________________________________________________________________________________________________________;②___________________________________________________________________________________________________________________________________________________.【分析】抽样数据比较分散,很难观察数据的分布特征,通过茎叶图展现了样本数据的分布.通过茎叶图可观察出平均数、众数、中位数,数据分布的对称性等等,由于茎叶图保留了原始数据,还可计算平均数、方差、标准差.解:(可任选两个作答)(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度;(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中);(3)甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm;(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近),甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀;【评析】茎叶图是统计图表的一种,它具有统计图表的一般功能:通过样本的数据分布推断总体的分布,通过样本的数字特征估计总体的数字特征.本题中的统计结论,是指用样本的特征估计总体特征得到的结论.例4图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是______.图1 图2【分析】条形图的横坐标是身高,纵坐标为每个身高区间内的人数.条形图没有提供具体的数据信息.程序框图的算法含义是统计[160,180)内学生人数,即求A 4+A 5+A 6+A 7的和.解:i <8或i ≤7.【评析】设计算法利用计算机完成数据的统计工作,是实际统计工作中经常应用的.除了可以完成计数工作外,还可排序、求最值,利用公式进行各种计算等等.将算法和统计一起考查是新课程的一个特色.例5 甲乙两位运动员在相同的条件下分别射击10次,记录各次命中环数如下: 甲:8,8,6,8,6,5,9,10,7,4乙:9,5,7,8,7,6,8,6,8,7(1)分别计算他们射击环数的平均数及标准差;(2)判断他们设计水平谁高,谁的射击情况更稳定?【分析】平均数、标准差分别反映了两个选手的射击水平和稳定程度,平均数越高说明选手射击水平越高,标准差越小说明选手发挥越稳定.解:(1)甲的平均数为7.1,标准差为1.758;乙的平均数为7.1,标准差为1.136;(2)从平均值上看,两人的水平相当;从标准差上看,乙的情况更稳定.【评析】平均数反映的是平均水平的高低,方差和标准差反映的是数据的离散程度.如果样本数据中每个数都增加数a ,则它的平均数也增加a ,但是它的标准差不变,因为数据的离散程度没有变化.由于方差与原始数据的单位不同,而且可能夸大了偏离程度,实际解决问题中常采用标准差.例6 假定关于某设备的使用年限x 和所支出费用y (万元),有如下的统计资料 使用年限x2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0(1)请画出上表数据的散点图;(2)根据上表数据,用最小二乘法求出线性回归方程a x by ˆˆ+=; (3)估计使用10年时,维修费用是多少?【分析】利用描点法画出散点图,用公式x by axn x yx n yx bi n i ii ni ˆˆ,ˆ2211=-=--=∑∑=⋅⋅求得回归直线方程,取x =10求得结果. 解:(1)散点图如图(2)y =0.08+1.23x (3)12.38【评析】判断两个变量有无相关关系时,散点图直观简便,这是一道应用问题,通过回归直线方程分析使用年限和维修费用的关系.例7 某工厂有工人1000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B 类工人),现用分层抽样方法(按A 类、B 类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(Ⅰ)求甲、乙两工人都被抽到的概率,其中甲为A 类工人,乙为B 类工人; (Ⅱ)从A 类工人中的抽查结果和从B 类工人中的抽查结果分别如下表1和表2. 生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150)人数 48x 5 3表2生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y3618(i )先确定x ,y ,再在答题纸上完成下列频率分布直方图.就生产能力而言,A 类工人中个体间的差异程度与B 类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图(ii )分别估计A 类工人和B 类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).【分析】(1)相互独立事件同时发生的概率用乘法公式(2)画出直方图,从图中分析数据信息.解:(Ⅰ)甲乙被抽到的概率都是101,而且事件“甲工人被抽到”与“乙工人被抽到”相互独立,所以甲、乙两工人都被抽到的概率⋅=⨯=1001101101pA 类工人中和B 类工人中分别抽查25名和75名.(Ⅱ)(i)由4+8+x +5+3=25,得x =5;6+y +36+18=75,得y =15.频率分布直方图如下图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.,123145253135255125255115258105254)ii (=⨯+⨯+⨯⋅+⨯+⨯=A x ,8.133145751813575361257515115756=⨯+⨯+⨯+⨯=B x1.1318.1331007512310025=⨯+⨯=x . A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.【评析】本题是一道综合应用题,通过语言叙述和图表给出信息.频率分布直方图反映了数据分布的情况,数据的差异大小及数据的方差大小.练习10-3一、选择题1.(08重庆)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( ) A .简单随机抽样法 B .抽签法 C .随机数表法 D .分层抽样法2.从容量为N 的总体中抽取容量为n 的样本,若采用系统抽样法,则抽样间隔为( ) A .nN B .n C .][nN D .1][+nN3.(08山东)下图是根据《山东统计年整2007》中的资料做成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( )A .304.6B .303.6C .302.6D .301.6 4.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表甲的成绩乙的成绩丙的成绩环数 7 8 9 10 环数 7 8 9 10 环数 7 8 9 10 频数 55 5 5频数 6446频数 46641,2,3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ) A .s 3>s 1>s 2 B .s 2>s 1>s 3 C .s 1>s 2>s 3 D .s 2>s 3>s 1二、填空题 5.要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,将它们编号为001,002,……800,利用随机数表抽取样本,从第7行第1个数开始,依次向右,再到下一行,继续从左到右.请问选出的第七袋牛奶的标号是______. (为了便于说明,下面摘取了随机数表的第6行至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28。
2020年高考数学文科二轮《概率与统计》讲义案及中档题型精讲卷一、考纲解读1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3.掌握古典概型及其概率计算公式。
4.了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义。
二、命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下.三、知识点精讲(一).必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件;②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件。
(二).概率在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。
对于必然事件A ,;对于不可能事件A ,=0(三).两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件2、每个基本事件发生的可能性相同()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为A μ.()P A =AμμΩ。
(四).互斥事件1、互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A 与事件B 互斥,则()()()P A B P A P B =+ 。
2、对立事件事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。
()()1P A p A =-。
3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。
四、解答题总结1.某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为.2.从6男2女共8名学生中选出队长1人,副队长1人,普通队员2人组成4人服务队,要求服务队中至少有1名女生,共有种不同的选法.(用数字作答)3.记函数()f x =的定义域为D .在区间[4,5]-上随机取一个数x ,则x D ∈的概率是.4.有三张卡片,分别写有1和2,1和3,2和3.甲,乙,丙三人各取走一张卡片,甲看了乙的卡片后说:“我与乙的卡片上相同的数字不是2”,乙看了丙的卡片后说:“我与丙的卡片上相同的数字不是1”,丙说:“我的卡片上的数字之和不是5”,则甲的卡片上的数字是________________.5.将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为_____.6.甲、已两名运动员各自等可能地从红、白、蓝3种颜色的运动服中选择1种,则他们选择相同颜色运动服的概率为_______.7.在3张奖券中有一、二等奖各1张,另1张无奖,甲、乙两人各抽取1张,两人都中奖的概率是__________;8.在区间[2,4]-上随机地取一个数x ,若x 满足||x m ≤的概率为56,则m =.9.从1,2,3,4这四个数中一次随机取两个数,则其中一个数是另一个的两倍的概率为______答案:1.310【解析】记2名男生分别为A ,B ,3名女生分别为a ,b ,c ,则从中任选2名学生有AB ,Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,ab ,ac ,bc ,共10种情况,其中恰好选中2名女生有ab ,ac ,bc ,共3种情况,故所求概率为310.2.660【解析】由题意可得:总的选择方法为:411843C C C ⨯⨯种方法,其中不满足题意的选法有411643C C C ⨯⨯种方法,则满足题意的选法有:411411843643660C C C C C C ⨯⨯-⨯⨯=种.3.59【解析】由260x x +-≥,解得23x -≤≤,根据几何概型的计算公式得概率为3(2)55(4)9--=--.4.1和3【解析】为方便说明,不妨将分别写有1和2,1和3,2和3的卡片记为A ,B ,C 从丙出发,由于丙的卡片上的数字之和不是5,则丙只可能是卡片A 或B ,无论是哪一张,均含有数字1,再由乙与丙的卡片上相同的数字不是1可知,乙所拿的卡片必然是C ,最后由甲与乙的卡片上相同的数字不是2,知甲所拿的卡片为B ,此时丙所拿的卡片为A .5.23【解析】设2本数学书分别为A 、B ,语文书为G ,则所有的排放顺序有ABC 、ACB 、BAC 、BCA 、CAB 、CBA ,共6种情况,其中数学书相邻的有ABC 、BAC 、CAB 、CBA ,共4种情况,故2本数学书相邻的概率4263P ==.6.13【解析】甲、乙两名运动员各自等可能地从红、白、蓝3种颜色的运动服中选择1种的所有可能情况为(红,白),(白,红),(红,蓝),(蓝,红),(白,蓝),(蓝,白),(红,红),(白,白),(蓝,蓝),共9种,他们选择相同颜色运动服的所有可能情况为(红,红),(白,白),(蓝,蓝),共3种.故所求概率为13P =.7.13【解析】设3张奖券中一等奖、二等奖和无奖分别为,,a b c ,甲、乙两人各抽取一张的所有情况有,,,,,ab ac ba bc ca cb 共六种,其中两人都中奖的情况有,ab ba 共2种,所以概率为138.3【解析】由几何概型,得(2)54(2)6m --=--,解得3m =.9.13【解析】从1,2,3,4这四个数中一次随机取两个数,基本事件为:{1,2},{1,3},{1,4},{2,3},{2,4},{3,4},共6个,符合“一个数是另一个数的两倍”的基本事件为{1,2},{2,4}共2个,所以概率为13.统计与统计案例一、考纲解读1.理解随机抽样的必要性和重要性。
2020年高考文科数学一轮复习大题篇----概率统计题型一 概率与统计的综合应用【例】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 【解】 (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700. 所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ). (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000;若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.【思维升华】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.【训练】某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图.(1)求图中实数a的值;(2)若该校高一年级共有640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.【解】(1)由已知,得10×(0.005+0.010+0.020+a+0.025+0.010)=1,解得a=0.030. (2)根据频率分布直方图,可知成绩不低于60分的频率为1-10×(0.005+0.010)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级期中考试数学成绩不低于60分的人数为640×0.85=544.(3)易知成绩在[40,50)分数段内的人数为40×0.05=2,这2人分别记为A,B;成绩在[90,100]分数段内的人数为40×0.1=4,这4人分别记为C,D,E,F.若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,则所有的基本事件有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15个.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定大于10.记“这2名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有(A ,B ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F ),共7个,故所求概率P (M )=715.题型二 概率与统计案例的综合应用【例】某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2.【解】 (1)将2×2列联表中数据代入公式计算,得 χ2=100×60×10-20×10270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)设这5名数学系的学生喜欢甜品的为a 1,a 2,不喜欢甜品的为b 1,b 2,b 3,从5名数学系的学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)}. Ω由10个基本事件组成,且这些基本事件出现是等可能的.用A 表示“3人中至多有1人喜欢甜品”这一事件,则A ={(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)},A 由7个基本事件组成,因而P (A )=710.【思维升华】 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.【训练】某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;(2)根据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,其中n =a +b +c +d .【解】 (1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会科学类的频率为45105=37,女生选择社会科学类的频率为4575=35.由题意,知男生总数为1 200×105180=700,女生总数为1 200×75180=500,所以估计选择社会科学类的人数为 700×37+500×35=600.(2)根据统计数据,可得列联表如下:则χ2=180×60×45-30×452105×75×90×90=367≈5.142 9>5.024, 所以在犯错误的概率不超过0.025的前提下能认为科类的选择与性别有关.专题突破训练1.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80的为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=nn 11n 22-n 12n 212n 1+n 2+n +1n +2.【解】 (1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)组工人有60×0.005×10=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.005×10=2(人),记为B 1,B 2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×(0.02+0.005)×10=15(人),“25周岁以下组”中的生产能手有40×(0.032 5+0.005)×10=15(人),据此可得2×2列联表如下:所以得χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=100×15×25-15×45260×40×30×70=2514≈1.79. 因为1.79<2.706.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.2.某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损.(1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并绘制了如下对照表:根据表中数据,试求回归直线方程y ^=b ^x +a ^,并预测年龄为55岁的观众周均学习成语知识的时间.参考公式:b ^=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^ =y -b ^x .【解】 (1)设被污损的数字为a ,则a 有10种情况. 由88+89+90+91+92>83+83+87+90+a +99, 得a <8,∴有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数, 所求概率为810=45.(2)由表中数据,计算得x =35,y =3.5,b ^=∑4i =1x i y i -4x y∑4i =1x 2i -4x 2=525-4×35×3.55 400-4×352=0.07,a ^=y -b ^x =3.5-0.07×35=1.05.∴y ^=0.07x +1.05.当x =55时,y ^=4.9.即预测年龄为55岁的观众周均学习成语知识的时间为4.9小时.3.长沙某购物中心在开业之后,为了解消费者购物金额的分布情况,在当月的电脑消费小票中随机抽取n 张进行统计,将结果分成6组,分别是[0,100),[100,200),[200,300),[300,400),[400,500),[500,600],制成如图所示的频率分布直方图(假设消费金额均在[0,600]元的区间内). (1)若按分层抽样的方法在消费金额为[400,600]元区间内抽取6张电脑小票,再从中任选2张,求这2张小票均来自[400,500)元区间的概率;(2)为做好五一劳动节期间的商场促销活动,策划人员设计了两种不同的促销方案. 方案一:全场商品打八折.方案二:全场购物满100元减20元,满300元减80元,满500元减120元,以上减免只取最高优惠,不重复减免,利用直方图的信息分析:哪种方案优惠力度更大,并说明理由(直方图中每个小组取中间值作为该组数据的替代值).【解】 (1)由题意知,在[400,500)元区间内抽4张,分别记为a ,b ,c ,d ,在[500,600]元区间内抽2张,分别记为E ,F ,设“2张小票均来自[400,500)元区间”为事件A ,从中任选2张,有以下选法:ab ,ac ,ad ,aE ,aF ,bc ,bd ,bE ,bF ,cd ,cE ,cF ,dE ,dF ,EF ,共15种.其中,2张小票均来自[400,500)元区间的有ab ,ac ,ad ,bc ,bd ,cd ,共6种, ∴P (A )=25.(2)方法一 由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05.方案一:购物的平均费用为0.8×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+550×0.05)=0.8×275=220(元).方案二:购物的平均费用为50×0.1+130×0.2+230×0.25+270×0.3+370×0.1+430×0.05=228(元).∵220<228,∴方案一的优惠力度更大.方法二由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05,方案一:平均优惠金额为0.2×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+550×0.05)=0.2×275=55(元).方案二:平均优惠金额为20×(0.2+0.25)+80×(0.3+0.1)+120×0.05=47(元).∵55>47,∴方案一的优惠力度更大.4.某校高三期中考试后,数学教师对本次全部数学成绩按1∶30进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值大于10的概率.【解】(1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,∴a=0.1,b=3.成绩在[70,90)内的样本数为0.25×20=5.∴成绩在[90,110)内的样本数为20-2-5-5=8.估计这次考试全校高三学生数学成绩的及格率为P=1-0.1-0.25=0.65.(2)所有可能的结果为(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,取出的两个样本中数字之差的绝对值大于10的结果为(100,116),(100,118),(100,128),(102,116),(102,118),(102,128),(106,118),(106,128),(106,118),(106,128),(116,128),共11个,∴P(A)=1121.。
常考题型大通关:第19题统计概率1、2018年10月17日是我国第5个扶贫日,也是第26个国际消除贫困日。
射洪某企业员工共500人参加“精准扶贫”活动,按年龄分组:第一组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)下表是年龄的频数分布表,求正整数a,b的值;(2)根据频率分布直方图,估算该企业员工的平均年龄及年龄的中位数;(3)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.2、某高校在2014年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下左图所示.(1)请先求出频率分布表中①、②、③、④位置相应的数据,再在答题纸上完成下列频率分布直方图;(2)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?3、随着生活水平的提高,人们对空气质量的要求越来越高,某机构为了解公众对“车辆限行”的态度,随机抽查40人,并将调查情况进行整理后制成下表:年龄(岁) [15,25) [25,35) [35,45) [45,55) [55,60]频数 5 10 10 5 10赞成人数 4 6 8 4 91.完成被调查人员年龄的频率分布直方图,并求被调查人员中持赞成态度人员的平均年龄约为多少岁?15,25,45,55的被调查人员中各随机选取1人进行调查.请写出所有的基2.若从年龄在[)[)本亊件,并求选取2人中恰有1人持不赞成态度的概率.4、某中学为弘扬优良传统,展示80年来的办学成果,特举办“建校80周年教育成果展示月”活动。
现在需要招募活动开幕式的志愿者,在众多候选人中选取100名志愿者,为了在志愿者.组号分组频数频率160,165 5 0.05第1组[)第2组[165,170)0.35第3组[170,175)第4组[175,180)20 0.20第5组[180,185)10合计100 1.001.请补充频率分布表中空白位置相应数据,再完成下列频率分布直方图;2.为选拔出主持人,决定在第3、4、5组中用分层抽样抽取6人上台,求第3、4、5组每组各抽取多少人?3.在2的前提下,主持人会在上台的6人中随机抽取2人表演诗歌朗诵,求第3组至少有一人被抽取的概率?5、某中学组织了一次高三学生数学学业水平模拟测试,学校从测试合格的男、女生中各随机抽取100人的成绩进行统计分析,分别制成了如图所示的男生和女生数学成绩的频率分布直方图.1.若所得分数大于等于80分认定为优秀,求男、女生优秀人数各有多少人?2.在1中的优秀学生中用分层抽样的方法抽取5人,从这5人中任意选取2人,求至少有一名男生的概率.6、某乡镇根据中央文件精神,在2014年通过精准识别确定建档立卡的贫困户共有473户,结合当地实际情况采取多项精准扶贫措施,从2015年至2018年该乡镇每年脱贫户数见下表:年份2015 2016 2017 2018 年份代码x 1 2 3 4脱贫户数y55 69 71 85(1)根据2015-2018年的数据,求出y关于x的线性回归方程$$y bx a=+$;(2)利用(1)中求出的线性回归方程,试判断到2020年底该乡镇的473户贫困户能否全部脱贫.附:$$1221,ni iiniix y nxyb a y bxx nx==-==--∑∑$$7、某农科所对冬季昼夜温差大小与某反季节大豆新品种种子发芽数之间的关系进行分析研究,他们分别记录了12月1日至12月5日每天昼夜温差大小与实验室每天每100颗种子中的发芽数,得到如下数据:该农科所确定的研究方案是:先从这5组数据中随机选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验。
2020年高考文科数学《概率与统计》题型归纳与训练【题型归纳】题型一古典概型例1 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为().A. 15B. 25C. 825D.925【答案】B【解析】可设这5名学生分别是甲、乙、丙、丁、戊,从中随机选出2人的方法有:(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊),(丙,丁),(丙,戊),(丁,戊),共有10种选法,其中只有前4种是甲被选中,所以所求概率为42105=.故选B.例2 将2本不同的数学书和1本语文书在书架上随机排成一行,则2本数学书相邻的概率为________.【答案】23【解析】根据题意显然这是一个古典概型,其基本事件有:数1,数2,语; 数1,语,数2;数2,数1,语; 数2,语,数1;语,数2,数1; 语,数1,数2共有6种,其中2本数学书相邻的有4种,则其概率为:4263p==.【易错点】列举不全面或重复,就是不准确【思维点拨】直接列举,找出符合要求的事件个数. 题型二 几何概型例 1 如图所示,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( ).A.14 B. π8 C. 12 D. π4【答案】B【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为822122ππ=⎪⎭⎫⎝⎛⨯⨯a a .故选B.例2 在区间[0,5]上随机地选择一个数p ,则方程22320x px p 有两个负根的概率为________. 【答案】32【解析】方程22320x px p 有两个负根的充要条件是2121244(32)020320p p x x p x x p ⎧∆=--≥⎪+=-<⎨⎪=->⎩即21,3p <≤或2p ≥,又因为[0,5]p ∈,所以使方程22320x px p 有两个负根的p 的取值范围为2(,1][2,5]3,故所求的概率2(1)(52)23503-+-=-,故填:32.D【易错点】“有两个负根”这个条件不会转化.【思维点拨】“有两个负根”转化为函数图像与x 轴负半轴有两个交点.从而得到参数p 的范围.在利用几何概型的计算公式计算即可. 题型三 抽样与样本数据特征例1 某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取 ________件.【答案】18【解析】按照分层抽样的概念应从丙种型号的产品中抽取60300181000⨯=(件). 例2 已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为 .【答案】11【解析】 因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,又样本数据121x +,221x +,⋅⋅⋅,21n x +的和为()122n x x x n ++++,所以样本数据的均值为21x +=11.例3 某电子商务公司对10000名网络购物者2018年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.30.9],内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.50.9],内的购物者的人数为 .a/万元【答案】3⨯=a=人数为0.6100006000【解析】由频率分布直方图及频率和等于1,可得a=.⨯+⨯+⨯+⨯+⨯+⨯=,解之得30.20.10.80.1 1.50.120.1 2.50.10.11a于是消费金额在区间[]⨯+⨯+⨯+⨯=,0.50.9,内频率为0.20.10.80.120.130.10.6所以消费金额在区间[]⨯=.0.50.9,内的购物者的人数为0.6100006000例4 某城市100户居民的月平均用电量(单位:度),以[)180,200,160,180,[) [)280,300分组的频率分布直方图如图260,280,[]200,220,[)220,240,[)240,260,[)所示./度(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[)220,240的用户中应抽取多少户? 【答案】见解析【解析】(1)由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 得0.0075x =.(2)由图可知,月平均用电量的众数是2202402302+=. 因为()0.0020.00950.011200.450.5++⨯=<, 又()0.0020.00950.0110.0125200.70.5+++⨯=>, 所以月平均用电量的中位数在[)220,240内.设中位数为a ,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=, 得224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=(户); 月平均用电量为[)240,260的用户有0.00752010015⨯⨯=(户); 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=(户);月平均用电量为[]280,300的用户有0.0025201005⨯⨯=(户). 抽取比例为11125151055=+++,所以从月平均用电量在[)220,240的用户中应抽取12555⨯=(户). 【易错点】没有读懂题意,计算错误.不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式;2牵涉到策略问题,一般可以转化为比较两个指标的大小. 题型四 回归与分析例1下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图y年生活垃圾无害化处理量年份代码t(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明(2)建立y 关于t 的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.参考数据:719.32i i y ==∑,7140.17i i i t y ==∑0.55= 2.646≈.参考公式:相关系数()()niit t y y r --=∑ 回归方程y a bt =+中斜率和截距的最小二乘估计公式分别为:121()()()nii i nii tt y y b tt ==--=-∑∑,=.a y bt -【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得4t =,()27128i i t t =-=∑,0.55=,()()77711140.1749.32 2.89iii iii i i t t y y t y t y===--=-=-⨯=∑∑∑, 2.890.990.552 2.646r ≈≈⨯⨯.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(1)变量y 与t 的相关系数7777()()7iii i i it t y y t y t y r ---⋅==∑∑∑∑,又7128i i t ==∑,719.32i i y ==∑,7140.17i i i t y ==∑5.292==0.55=,所以740.17289.320.997 5.2920.55r ⨯-⨯=≈⨯⨯ ,故可用线性回归模型拟合变量y 与t 的关系.(2)4t=,y =7117i i y =∑,所以7172211740.17749.327ˆ0.10287i ii ii t y t yb tt ==-⋅-⨯⨯⨯===-∑∑, 1ˆˆ9.320.1040.937ay bx =-=⨯-⨯≈,所以线性回归方程为ˆ0.10.93y t =+. 当9t =时,ˆ0.190.93 1.83y=⨯+=.因此,我们可以预测2016年我国生活垃圾无害化处理1.83亿吨.【易错点】没有读懂题意,计算错误.【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据. 题型五 独立性检验例1 甲、乙、丙、丁四位同学各自对A 、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A 、B 两变量更强的线性相关性?( )A .甲B .乙C .丙D .丁 【答案】D【解析】 D 因为r>0且丁最接近1,残差平方和最小,所以丁相关性最高【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数r的绝对值越趋向于1,相关性越强.残差平方和m越小相关性越强【巩固训练】题型一古典概型1.将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.【答案】56【解析】将先后两次点数记为(),x y,则基本事件共有6636⨯=(个),其中点数之和大于等于10有()()()()()()4,6,5,5,5,6,6,4,6,5,6,6,共6种,则点数之和小于10共有30种,所以概率为305366=.2.我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是().A.112B.114C.115D.118【答案】C【解析】不超过30的素数有2、3、5、7、11、13、17、19、23、29,共10个,随机选取两数有45(种)情况,其中两数相加和为30的有7和23,11和19,13和17,共3种情况,根据古典概型得314515P==.故选C.3.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为 . 【答案】56P =【解析】1只白球设为a ,1只红球设为b ,2只黄球设为c ,d , 则摸球的所有情况为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,(),c d ,共6件, 满足题意的事件为(),a b ,(),a c ,(),a d ,(),b c ,(),b d ,共5件,故概率为56P =.题型二 几何概型1.某公司的班车在7:00,8:00,8:30发车,学.小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( ).A .13B .12C .23D .34【答案】B【解析】 如图所示,画出时间轴.D C A小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10分钟.根据几何概型,所求概率10101402P +==.故选B .2. 从区间[]0,1随机抽取2n 个数1x ,2x ,…,n x ,1y ,2y ,…,n y ,构成n 个数对()11,x y ,()22,x y ,…,(),n n x y ,其中两数的平方和小于1的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为( ).A .4n mB .2n mC .4m nD .2m n【答案】C【解析】由题意得:()()12i i x y i n =⋅⋅⋅,,,,在如图所示方格中,而平方和小于1的点均在如图所示的阴影中,由几何概型概率计算公式知π41m n=,所以4πmn =.故选C .3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC ,ABC △的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为1p ,2p ,3p ,则 A .12p p = B .13p p = C .23p p = D .123p p p =+【答案】A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可.设直角三角形ABC 的三个角A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ的面积为112S ab =,区域Ⅱ的面积为222211111111πππ22222222S c b ab a ab ⎛⎫⎛⎫⎛⎫=++-= ⎪ ⎪⎪⎝⎭⎝⎭⎝⎭, 区域Ⅲ的面积为22231111111πππ2222282S c b ab a ab ⎛⎫⎛⎫=+-=- ⎪ ⎪⎝⎭⎝⎭. 显然12p p =.故选A .题型三 抽样与样本的数据特征1.已知一组数据4,6,5,8,7,6,那么这组数据的平均数为 . 【答案】10【解析】平均数()146587666x =+++++=.2.某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示. (Ⅰ)直方图中的a =_________;(Ⅱ)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为_________.【答案】3;6000【解析】频率和等于1可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=,解之得3⨯+⨯+⨯+⨯=,a=.于是消费金额在区间[0.5,0.9]内频率为0.20.10.80.120.130.10.6所以消费金额在区间[0.5,0.9]内的购物者的人数为:0.6100006000⨯=,故应填3;6000.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x(吨)、一位居民的月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)4,4.5分成9组,制成了如图所示的频率分布直方图.0.5,1,⋅⋅⋅,[)0,0.5,[)(1)求直方图中a的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,请说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.【答案】见解析⨯=,【解析】(1)由频率分布直方图知,月均用水量在[),中的频率为0.080.50.0400.5同理,在[),,[),中的频率分别为0.08,33.544.53.54,,[),,[)0.5,1,[)1.5,2,[)22.50.20,0.26,0.06,0.04,0.02.a=.由0.04+0.08+0.50.200.260.50.060.040.021⨯+++⨯+++=,解得0.30a a(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计全市30万居民中月均用水量不低于3吨的人数为3000000.1236000⨯=.(3)因为前6组的频率之和为0.040.080.150.200.260.15=0.880.85----->, 而前5组的频率之和为0.04+0.08+0.150.200.26=0.730.85--<,所以2.5 3.x < 由()0.3 2.50.850.73x ⨯-=-,解得 2.9x =. 题型四 回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+ ,其中ˆˆˆ0.76,b a y bx ==- ,据此估计,该社区一户收入为15万元家庭年支出为( )A .11.4万元B .11.8万元C .12.0万元D .12.2万元 【答案】B【解析】由已知得8.28.610.011.311.9105x ++++==(万元),6.27.58.08.59.885y ++++==(万元),故ˆ80.76100.4a =-⨯=, 所以回归直线方程为ˆ0.760.4y x =+.当社区一户收入为15万元,家庭年支出为 ˆ0.7615y=⨯+0.411.8=(万元).故选B .2.为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为ˆˆˆybx a =+.已知101225i i x ==∑,1011600i i y ==∑,ˆ4b =.该班某学生的脚长为24,据此估计其身高为( ).A . 160B . 163C . 166D .170 【答案】C 【解析】 22.5x =,160y =,所以160422.570a =-⨯=,24x =时,42470166y =⨯+=.故选C .3.某公司为确定下一年投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量()1,2,,8i y i =⋅⋅⋅数据作了初步处理,得到下面的散点图及一些统计量的值.年宣传费/千元表中i w =8118i i w w ==∑,(1)根据散点图判断,y a bx =+与y c =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)? (2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系式为0.2z y x =-,根据(2)的结果回答下列问题:(ⅰ)年宣传费49x =时,年销售量及年利润的预报值是多少? (ⅱ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据()11,u v ()22,u v ,⋅⋅⋅,(),n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆv u αβ=-. 【答案】见解析【解析】(1)由散点图变化情况可知选择y c =+较为适宜.(2)由题意知()()()81821108.8681.6iii ii w w y y d w w ==--===-∑∑.又y c =+一定过点(),y ω,所以c y d ω=-=56368 6.8100.6-⨯=, 所以y 与x的回归方程为100.6y =+(3)(ⅰ)由(2)知,当49x =时,()100.668576.6t y =+=, 0.2576.649z =⨯-=66.32(千元), 所以当年宣传费为49x =时,年销售量为()576.6t ,利润预估为66.32千元. (ⅱ)由(2)知,(0.20.2100.6z y x x =-=+-=x +20.12=)226.8 6.820.12-++6.8时,年利润的预估值最大,即26.846.24x ==(千元). 题型五 独立性检验1.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H :“这种血清不能起到预防感冒的作用”,利用2×2列联表计算的K 2≈3.918,则下列表述中正确的是( )A .有95℅的把握认为“这种血清能起到预防感冒的作用”B .若有人未使用该血清,那么他一年中有95℅的可能性得感冒C .这种血清预防感冒的有效率为95℅D .这种血清预防感冒的有效率为5℅ 【答案】A【解析】由题可知,在假设H 成立情况下,)841.3(2≥K P 的概率约为0.05,即在犯错的概率不错过0.05的前提下认为“血清起预防感冒的作用”,即有95℅的把握认为“这种血清能起到预防感冒的作用”.这里的95℅是我们判断H 不成立的概率量度而非预测血清与感冒的几率的量度,故B 错误.C ,D 也犯有B 中的错误.故选A 2.观察下面频率等高条形图,其中两个分类变量x y ,之间关系最强的是( )A .B .C .D . 【答案】D【解析】在频率等高条形图中,a ab +与cc d+相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中12,x x 所占比例相差越大,则分类变量,x y 关系越强,故选D .3.淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg )的频率分布直方图如图所示.频率频率组距箱产量/kg新养殖法旧养殖法箱产量/kg(1)设两种养殖方法的箱产量相互独立,记A 表示事件:旧养殖法的箱产量低于50kg , 新养殖法的箱产量不低于50kg ,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01). 附:22()()()()()n ad bc K a b c d a c b d -=++++ .【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ” 为事件B ,“新养殖法的箱产量不低于50kg ”为事件C ,由题图并以频率作为概率得()0.04050.03450.02450.01450.0125P B =⨯+⨯+⨯+⨯+⨯0.62=,()0.06850.04650.01050.0085P C =⨯+⨯+⨯+⨯0.66=,()()()0.4092P A P B P C ==.(2)由计算可得2K 的观测值为()222006266383415.70510010096104k⨯⨯-⨯==⨯⨯⨯,因为15.705 6.635>,所以()2 6.6350.001P K ≈≥,从而有99%以上的把握认为箱产量与养殖方法有关.(3)150.2÷=,()0.10.0040.0200.0440.032-++=,80.0320.06817÷=,85 2.3517⨯≈,50 2.3552.35+=,所以中位数为52.35.。