22版:高考专题突破六 高考中的概率与统计问题(步步高)
- 格式:docx
- 大小:194.29 KB
- 文档页数:9
高考专题突破六高考中的概率与统计问题题型一随机事件的概率例1 (12分)(2019·北京)改革开放以来,人们的支付方式发生巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1 000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额支付方式不大于2 000元大于2 000元仅使用A27人3人仅使用B24人1人(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2 000元的人数有变化?说明理由.规范解答解(1)由题意知,样本中仅使用A的学生有27+3=30(人),仅使用B的学生有24+1=25(人),A,B两种支付方式都不使用的学生有5人,[2分]故样本中A,B两种支付方式都使用的学生有100-30-25-5=40(人).估计该校学生中上个月A,B两种支付方式都使用的人数为40100×1 000=400.[4分](2)记事件C为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”,则P(C)=125=0.04.[8分](3)记事件E为“从样本仅使用B的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.假设样本仅使用B的学生中,本月支付金额大于2 000元的人数没有变化,则由(2)知,P(E)=0.04.[10分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分] 答案示例2:无法确定有没有变化,理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母. 第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值. 第四步:作出判断得结论,依据题意,借助数表作出正确判断. 第五步:反思回顾,查看关键点、易错点和答题规范性.跟踪训练 1 疫情爆发以来,相关疫苗企业发挥专业优势与技术优势争分夺秒开展疫苗研发.为测试疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),选定 2 000个样本分成三组,测试结果如下表:A 组B 组C 组 疫苗有效 673 x y 疫苗无效7790z已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. (1)求x ,y +z 的值;(2)现用分层抽样的方法在全体样本中抽取360个测试结果,求C 组应抽取多少个? (3)已知y ≥465,z ≥30,求疫苗能通过测试的概率.解 (1)∵在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. ∴x2 000=0.33,∴x =660, y +z =2 000-(673+77+660+90)=500. (2)应在C 组抽取的个数为360×5002 000=90.(3)由题意知疫苗有效需满足77+90+z ≤2 000×10%, 即z ≤33,C 组疫苗有效与无效的可能情况有(465,35),(466,34),(467,33),(468,32),(469,31),(470,30), 共6种结果,有效的可能情况有(467,33),(468,32),(469,31),(470,30), 共4种结果, ∴疫苗能通过测试的概率P =46=23.题型二 用样本估计总体例2 (2020·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90. ①分别求5个年龄组和5个职业组成绩的平均数和方差;②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x =0.05,∴x =120.(2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5, ∴a =953≈32,则中位数为32.(3)①5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可). 思维升华 (1)注意频率分布直方图中平均数、中位数、众数的求法. (2)处理决策问题时,一般先比较平均数,若平均数相同,再比较方差.跟踪训练2 (2020·佛山模拟)寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种精品的销售数据.日期 2月14日2月15日2月16日2月17日2月18日销售量/件 白天35 32 43 39 51 晚上 4642505260已知摊位租金900元/档,售余精品可以进货价退回厂家. (1)求表中10个销售数据的中位数和平均数;(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的精品,其中甲、乙分别承包白天、晚上的精品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理? 解 (1)中位数为43+462=44.5,平均数为35+46+32+42+43+50+39+52+51+6010=45.(2)由题意知,今年花市期间该摊位所售精品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担. 今年白天的平均销售量为35+32+43+39+515=40(件/天),今年晚上的平均销售量为46+42+50+52+605=50(件/天),所以甲同学应分担的租金为900×4040+50=400(元), 乙同学应分担的租金为900×5040+50=500(元). (注:本小题也可直接按白天、晚上的总销售量比例分摊租金.)题型三 回归分析与独立性检验例3 近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:土地使用面积x (单位:亩) 1 2 3 4 5 管理时间y (单位:月)810132524并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民15050(1)求y 关于x 的线性回归方程;(计算结果保留两位小数)(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:b ^=∑ni =1 (x i -x )(y i -y )∑ni =1(x i -x )2,a ^=y -b ^x ,K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d . 临界值表:解 (1)依题意得,x =1+2+3+4+55=3,y =8+10+13+25+245=16,故∑5i =1(x i -x )(y i -y )=(-2)×(-8)+(-1)×(-6)+1×9+2×8=47, ∑5i =1(x i -x )2=4+1+1+4=10,则b ^=∑5i =1 (x i -x )(y i -y )∑5i =1(x i -x )2=4710=4.7, a ^=y -b ^x =16-4.7×3=1.9,所以y 关于x 的线性回归方程为y ^=4.7x +1.9. (2)依题意,女性不愿意参与管理的人数为50, 计算得K 2的观测值为k =300×(150×50-50×50)2200×100×200×100=300×5 000×5 000200×100×200×100=18.75>10.828,故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.思维升华 统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练3 (2020·济宁模拟)下面给出了根据我国2012年~2018年水果人均占有量y (单位:kg)和年份代码x 绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x 分别为1~7).(1)根据散点图分析y 与x 之间的相关关系;(2)根据散点图相应数据计算得∑i =17y i =1 074,∑i =17x i y i =4 517,求y 关于x 的线性回归方程;(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.(只写出结论) 附:线性回归方程y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解 (1)由散点图可以看出,点大致分布在某一直线的附近,且当x 由小变大时,y 也由小变大,从而y 与x 之间是正相关关系.(2)由题中数据可得x =17(1+2+3+4+5+6+7)=4,y =17×1 074=1 0747,从而b ^=∑i =17x i y i -7x ·y∑i =17x 2i -7x2= 4 517-7×1 0747×412+22+32+42+52+62+72-7×42=22128, a ^=y -b ^x =1 0747-22128×4=8537, 从而所求y 关于x 的线性回归方程为y ^=22128x +8537.(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.课时精练1.(2020·南宁适应性测试)某电子商务平台的管理员随机抽取了1 000位上网购物者,并对其年龄(在10岁到69岁之间)进行了调查,统计情况如表所示.年龄 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 人数100150a200b50已知[30,40),[40,50),[50,60)三个年龄段的上网购物的人数依次构成递减的等比数列. (1)求a ,b 的值;(2)若将年龄在[30,50)内的上网购物者定义为“消费主力军”,其他年龄段内的上网购物者定义为“消费潜力军”.现采用分层抽样的方式从参与调查的1 000位上网购物者中抽取5人,再从这5人中抽取2人,求这2人中至少有一人是消费潜力军的概率. 解 (1)由题意得⎩⎪⎨⎪⎧a +b =500,ab =40 000,a >b ,解得a =400,b =100.(2)由题意可知,在抽取的5人中,有3人是消费主力军,分别记为a 1,a 2,a 3,有2人是消费潜力军,分别记为b 1,b 2.记“这2人中至少有一人是消费潜力军”为事件A .从这5人中抽取2人所有可能的情况为(a 1,a 2),(a 1,a 3),(a 1,b 1),(a 1,b 2),(a 2,a 3),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),共10种.符合事件A 的有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),共7种. 故所求概率为P (A )=710.2.某中学高一年级从甲、乙两个班级各选出7名学生参加学科测试,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83.(1)求x 和y 的值,并计算甲班7位学生成绩的方差s 2;(2)从成绩在90分以上的学生中随机抽取两名学生,求至少有一名学生是甲班的概率. 解 (1)由题意知85×7=79+78+80+80+x +85+92+96,解得x =5. 又因为乙班学生成绩的中位数是83,所以y =3.s 2=17[(79-85)2+(78-85)2+(80-85)2+(85-85)2+(85-85)2+(92-85)2+(96-85)2]=40.(2)设甲班成绩在90分以上的学生为A ,B , 乙班成绩在90分以上的学生为C ,D ,E . 从成绩在90分以上的学生中随机抽取两名学生,共有AB ,AC ,AD ,AE ,BC ,BD ,BE ,CD ,CE ,DE,10种情况,其中至少有一名学生是甲班的学生共有7种情况,记“至少有一名学生是甲班的学生”为事件M ,则P (M )=710.3.(2019·全国Ⅲ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828解 (1)由调查数据,男顾客中对该商场服务满意的频率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的频率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K 2的观测值k =100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.4.(2020·内江模拟)基于移动网络技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,给人们带来新的出行体验,某共享单车运营公司的市场研究人员为了了解公司的经营状况,对公司最近6个月的市场占有率y %进行了统计,结果如下表:(1)请用相关系数说明能否用线性回归模型拟合y 与月份代码x 之间的关系.如果能,请计算出y 关于x 的线性回归方程;如果不能,请说明理由;(2)根据调研数据,公司决定再采购一批单车扩大市场,从成本1 000元/辆的A 型车和800元/辆的B 型车中选购一种,两款单车使用寿命频数如下表:经测算,平均每辆单车每年能为公司带来500元收入,不考虑除采购成本以外的其他成本,假设每辆单车的使用寿命都是整数年,用频率估计每辆车使用寿命的概率,以平均每辆单车所产生的利润的估计值为决策依据,如果你是公司负责人,会选择采购哪款车型? 参考数据:∑i =16(x i -x )(y i -y )=35,∑i =16(x i -x )2=17.5,∑i =16(y i -y )2=76, 1 330≈36.5.参考公式:相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .解 (1)由表格中数据可得,x =3.5,y =16.∵r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x)2∑i =1n(y i -y )2=3517.5×76=351 330≈0.96.∴y 与月份代码x 之间具有较强的相关关系,故可用线性回归模型拟合两变量之间的关系.b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=3517.5=2. ∴a ^=y -b ^x =16-2×3.5=9, ∴关于x 的线性回归方程为y ^=2x +9. (2)这100辆A 款单车平均每辆车的利润为1100(-500×10+0×30+500×40+1 000×20)=350(元), 这100辆B 款单车平均每辆车的利润为1100(-300×15+200×40+700×35+1 200×10)=400(元), ∴用频率估计概率,A 款单车与B 款单车平均每辆的利润估计值分别为350元、400元,应采购B 款车型.5.西尼罗河病毒(WNV)是一种脑炎病毒,WNV 通常是由鸟类携带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV 流行脑炎.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV 的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x (千克)和利巴韦林含片产量y (百盒)的统计数据如下:投入量x (千克) 1 2 3 4 5 产量y (百盒)1620232526由相关系数r 可以反映两个变量相关性的强弱,|r |∈[0.75,1],认为变量相关性很强;|r |∈[0.3,0.75),认为变量相关性一般;|r |∈[0,0.25],认为变量相关性较弱. (1)计算相关系数r ,并判断变量x ,y 相关性强弱;(2)根据上表中的数据,建立y 关于x 的线性回归方程y ^=b ^x +a ^;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林? 参考数据:660≈25.69.参考公式:相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n (x i -x )2∑i =1n (y i -y )2,线性回归方程y ^=b ^x +a ^中,b ^=∑n i =1(x i -x )(y i -y ) ∑n i =1(x i -x )2, a ^=y -b ^x .解 (1)x =15×(1+2+3+4+5)=3,y =15×(16+20+23+25+26)=22, ∑5i =1(x i -x )(y i -y )=(1-3)×(16-22)+(2-3)×(20-22)+(3-3)×(23-22)+(4-3)×(25-22)+(5-3)×(26-22)=25, ∑5i =1(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,∑5i =1(y i -y )2=(16-22)2+(20-22)2+(23-22)2+(25-22)2+(26-22)2=66,则r =∑5i =1(x i -x )(y i -y )∑5i =1(x i -x )2∑5i =1(y i -y )2=25660≈0.97, 所以x 与y 具有很强的相关性.(2)由(1)得,b ^=∑5i =1 (x i -x )(y i -y )∑5i =1(x i -x )2=2510=2.5, a ^=y -b ^x =22-2.5×3=14.5,所以y 关于x 的线性回归方程为y ^=2.5x +14.5.当y =150时,x =54.2.故要使某组利巴韦林含片产量达到150百盒,估计该组应投入54.2千克利巴韦林.。
高考专题突破六高考中的概率与统计问题概率与统计的综合应用例1(2020·四川双流中学检测)甲、乙两品牌计划入驻某商场,该商场批准两个品牌先进场试销5天.两品牌提供的返利方案如下:甲品牌无固定返利,卖出10件以内(含10件)的产品,每件产品返利5元,超出10件的部分每件返利7元;乙品牌每天固定返利20元,且每卖出一件产品再返利3元.经统计,两家品牌在试销期间的销售件数的茎叶图如图:(1)现从乙品牌试销的5天中随机抽取3天,求这3天的销售量中至少有一天低于10的概率;(2)若将频率视作概率,回答以下问题:①记甲品牌的日返利额为X(单位:元),求X的分布列和均值;②商场拟在甲、乙两品牌中选择一个长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由.解 (1)方法一 设A 为从乙品牌试销售的5天中抽取3天,这3天的销量中至少有一天低于10件的事件,则P (A )=C 12C 23+C 22C 13C 35=910. 方法二 设A 为从乙品牌试销售的5天中抽取3天,这3天的销售量中至少有一天低于10件的事件,则A 为从乙品牌试销售的5天中抽取3天,这3天的销售量都不低于10件的事件, 则P (A )=1-P (A )=1-C 33C 35=1-110=910.(2)①设甲品牌的日销售量为随机变量ξ, 则甲品牌的日返利额X (单位:元)与ξ的关系为:X =⎩⎪⎨⎪⎧5ξ,0≤ξ≤10,ξ∈N ,50+7(ξ-10),ξ≥11,ξ∈N .当ξ=6时,X =30; 当ξ=7时,X =35; 当ξ=10时,X =50; 当ξ=12时,X =64. 所以X 的分布列为E (X )=30×25+35×15+50×15+64×15=41.8(元).②方法一 设乙品牌的日销售量为随机变量η,乙品牌的日返利额Y (单位:元)与η的关系为Y =20+3η,且η的分布列为则E(η)=6×15+9×15+12×25+13×15=10.4(件),则E(Y)=E(3η+20)=3E(η)+20=3×10.4+20=51.2(元).因为乙品牌的日平均返利额大于甲品牌的日平均返利额,所以如果仅从日返利额的角度考虑,商场应选择乙品牌长期销售.方法二乙品牌的日返利额Y(单位:元)的取值集合为{38,47,56,59},分布列为则E(Y)=38×15+47×15+56×25+59×15=51.2(元).思维升华概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.跟踪训练1(2020·四川成都诊断性检测)某保险公司给年龄在20~70岁的民众提供某种疾病的一年期医疗保险,现从10 000名参保人员中随机抽取100名作为样本进行分析,按年龄段[20,30),[30,40),[40,50),[50,60),[60,70]分成了五组,其频率分布直方图如图所示;参保年龄(单位:岁)与每人每年应交纳的保费(单位:元)如表所示.据统计,该公司每年为这10 000名参保人员支出的各种费用为一百万元.(1)用样本的频率分布估计总体分布,为使公司不亏本,求x精确到整数时的最小值x0;(2)经调查,年龄在[60,70]的老人每50人中有1人患该种疾病(以此频率作为概率).该种疾病的治疗费为12 000元,如果参保,保险公司补贴治疗费10 000元.某老人年龄为66岁,若购买该项保险(x取(1)中的x0),针对此疾病所支付的费用为X元;若没有购买该项保险,针对此疾病所支付的费用为Y元.试比较X和Y的均值大小,并判断该老人购买此项保险是否划算?解(1)由(0.007+0.016+a+0.025+0.020)×10=1,解得a=0.032.该保险公司每年收取的保费为10 000(0.007×10x+0.016×10×2x+0.032×10×3x+0.025×10×4x+0.020×10×5x)=10 000×3.35x.要使公司不亏本,则10 000×3.35x≥1 000 000,即3.35x≥100,解得x≥1003.35≈29.85,∴x0=30.(2)①若该老人购买了此项保险,则X 的取值为150,2 150.P (X =150)=4950,P (X =2 150)=150,∴E (X )=150×4950+2 150×150=147+43=190(元).②若该老人没有购买此项保险,则Y 的取值为0,12 000. P (Y =0)=4950,P (X =12 000)=150,∴E (Y )=0×4950+12 000×150=240(元).∴E (Y )>E (X ),∴该老人购买此项保险比较划算.概率与统计案例的综合应用例2 (2020·蓉城名校联盟联考)成都市现在已是拥有1 400多万人口的城市,机动车保有量已达450多万辆,成年人中约40%拥有机动车驾驶证.为了解本市成年人的交通安全意识情况,某中学的同学利用国庆假期进行了一次全市成年人安全知识抽样调查.先根据是否拥有驾驶证,用分层抽样的方法抽取了200名成年人,然后对这200人进行问卷调查.这200人所得的分数都分布在[30,100]范围内,规定分数在80以上(含80)的为“具有很强安全意识”,所得分数的频率分布直方图如图所示.(1)补全上面的2×2列联表,并判断能否有超过95%的把握认为“‘具有很强安全意识’与拥有驾驶证”有关?(2)将上述调查所得的频率视为概率,现从全市成年人中随机抽取4人,记“具有很强安全意识”的人数为X,求X的分布列及均值.附表及公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解(1)200人中拥有驾驶证的占40%,有80人,没有驾驶证的有120人;具有很强安全意识的占20%,有40人,不具有很强安全意识的有160人.补全的2×2列联表如表所示:K 2的观测值k =200×(22×102-18×58)240×160×80×120=7516=4.687 5>3.841, 所以有超过95%的把握认为“‘具有很强安全意识’与拥有驾驶证”有关.(2)由频率分布直方图中数据可知,抽到的每个成年人“具有很强安全意识”的概率为15,所以X =0,1,2,3,4,且X ~B ⎝⎛⎭⎫4,15. P (X =k )=C k 4·⎝⎛⎭⎫15k ·⎝⎛⎭⎫454-k(k =0,1,2,3,4), X 的分布列为所以E (X )=4×15=45.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 (2020·四川成都检测)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“个税专项附加扣除”是指个人所得税法规定的子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人六项专项附加扣除,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部员工对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表:(1)根据列联表,能否有99%的把握认为满意程度与年龄有关?(2)为了帮助年龄在40岁及以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x (单位:分)给予相应的住房补贴y (单位:元),现有两种补贴方案,方案甲:y =1 000+700x ;方案乙:y =⎩⎪⎨⎪⎧3 000,0<x ≤5,5 600,5<x ≤10,9 000,x >10.已知这8名员工的贡献积分分别为2,3,6,7,7,11,12,12,将采用方案甲比采用方案乙获得更多补贴的员工记为“A 类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A 类员工”的概率. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d . 参考数据:解 (1)根据列联表可得K 2的观测值k =80×(25×30-10×15)235×45×40×40=807≈11.429.∵11.429>6.635,∴有99%的把握认为满意程度与年龄有关.(2)据题意,这8名员工的贡献积分及按甲、乙两种方案所获补贴情况为:由表可知,“A类员工”有5名.设从这8名员工中随机抽取4名进行面谈,恰好抽到3名“A类员工”的概率为P,则P=C35C13C48=37.均值与方差在决策中的应用例3(2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p),求f (p)的最大值点p0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验?解(1)20件产品中恰有2件不合格品的概率为f (p)=C220·p2(1-p)18.因此f′(p)=C220[2p(1-p)18-18p2(1-p)17]=2C220p(1-p)17(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f (p)的最大值点为p0=0.1.(2)由(1)知,p=0.1①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元.由于E(X)=490>400,故应该对余下的产品做检验.思维升华随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较均值,若均值相同,再由方差来决定.跟踪训练3有两种理财产品A和B,投资这两种理财产品一年后盈亏的情况如下(每种理财产品的不同投资结果之间相互独立):产品A产品B注:p >0,q >0.(1)若甲、乙两人分别选择了产品A ,B 投资,一年后他们中至少有一人获利的概率大于34,求实数p 的取值范围;(2)若丙要将20万元人民币投资其中一种产品,以一年后的投资收益的均值为决策依据,则丙选择哪种产品投资较为理想?解 (1)记事件C 为“甲选择产品A 投资且获利”,记事件D 为“乙选择产品B 投资且获利”,记事件E 为“一年后甲、乙两人中至少有一人投资获利”, 则P (C )=14,P (C )=34,P (D )=p ,p (D )=1-p ,P (E )=1-P (C D )=1-34(1-p )>34,∴p >23.又p +q =34,且q >0,∴p <34,∴23<p <34.即p 的取值范围是⎝⎛⎭⎫23,34. (2)假设丙选择A 产品投资,且记ξ为获利金额(单位:万元),则ξ的分布列为∴E (ξ)=10×14-6×13=12.假设丙选择B 产品投资,且记η为获利金额(单位:万元),则η的分布列为E (η)=8p -4q =8p -4⎝⎛⎭⎫34-p =12p -3⎝⎛⎭⎫0<p <34.∴当p =724时,E (ξ)=E (η),丙可在产品A 和产品B 中任选一种投资;当0<p <724时,E (ξ)>E (η),丙应选产品A 投资;当724<p <34时,E (ξ)<E (η),丙应选产品B 投资.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率; (2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人, 该学生上个月的支付金额大于1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.1.(2020·四川成都质检)2018年央视大型文化节目《经典咏流传》热播,在全民中掀起了诵读诗词的热潮.某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:min)将学生分成六个组:[0,20),[20,40),[40,60),[60,80),[80,100),[100,120],经统计得到了如图所示的频率分布直方图.(1)求频率分布直方图中a的值,并估计该校文学院的学生每天诵读诗词的平均时间;(2)若2名学生诵读诗词的时间分别为x,y.当x,y满足|x-y|>60时,这2名同学组成一个“Team”.已知从每天诵读时间小于20 min和大于或等于80 min的所有学生中用分层抽样的方法抽取5人,现从这5人中随机选取2人,求选取的2人能组成一个“Team”的概率.解(1)∵各组数据的频率之和为1,即所有小矩形的面积和为1,∴(a+a+6a+8a+3a+a)×20=1,解得a=0.002 5.∴该校文学院的学生每天诵读诗词的平均时间为10×0.05+30×0.05+50×0.3+70×0.4+90×0.15+110×0.05=64(min).(2)由频率分布直方图,知[0,20),[80,100),[100,120]内的学生人数的频率之比为1∶3∶1,故5人中[0,20),[80,100),[100,120]内的学生人数分别为1,3,1.方法一设[0,20)内的1名学生为A,[80,100)内的3名学生分别为B,C,D,[100,120]内的1名学生为E,则抽取2人的所有基本事件有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共10种.选取的2人能组成一个“Team”的情况有AB,AC,AD,AE,共4种,故选取的2人能组成一个“Team”的概率P=410=2 5.方法二由题意知,应从[0,20)内的学生抽取1人,从[80,120]内的学生抽取1人,故所求概率为C 11C 14C 25=25.2.(2020·贵州贵阳模拟)某大学毕业生准备到贵州非私营单位求职,为了了解工资待遇情况,他在贵州省统计局的官网上,查询到2008年至2017年非私营单位在岗职工的年平均工资近 似值(单位:万元),如下表:(1)请根据上表的数据,利用线性回归模型进行拟合,求y 关于x 的线性回归方程y ^=b ^x +a ^(a ^,b ^的计算结果根据四舍五入精确到小数点后第二位);(2)如果该大学生对年平均工资的期望值为9万元,请利用(1)的结论,预测2020年非私营单位在岗职工的年平均工资(单位:万元.计算结果根据四舍五入精确到小数点后第二位),并判断2020年平均工资能否达到他的期望.参考数据:∑i =110x i y i =311.5,∑i =110x 2i =385,∑i =110(x i -x )(y i -y )=47.5.附:对于一组具有线性相关的数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为b ^=∑i =1nx i y i -n x ·y∑i =1nx 2i -n x2=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .解 (1)由已知,得x =5.5,y =4.8.b ^=∑i =110(x i -x )(y i -y )∑i =110x 2i -n ·x2=47.5385-10×5.52≈0.58, 所以a ^=y -b ^x =4.8-0.58×5.5=1.61, 故y 关于x 的线性回归方程为y ^=0.58x +1.61. (2)由(1)知y ^=0.58x +1.61,当x =13时,y ^=0.58×13+1.61=9.15>9.所以,预测2020年非私营单位在岗职工的年平均工资为9.15万元,达到了他的期望. 3.(2020·贵州贵阳模拟)运动健康已成为大家越来越关心的话题,某公司开发的一个类似计步数据库的公众号,手机用户可以通过关注该公众号查看自己每天行走的步数,同时也可以和好友进行运动量的PK 和点赞.现从张华的好友中随机选取40人(男、女各20人),记录他们某一天行走的步数,并将数据整理如下表:(1)若某人一天行走的步数超过8 000被评定为“积极型”,否则被评定为“懈怠型”,根据题意完成下列2×2列联表,若有n %(n ∈Z )的把握认为男、女的“评定类型”有差异,参考现有公式与数据,则n 可能的最大值为多少?(2)在张华的这40位好友中,从该天行走的步数超过10 000的人中随机抽取3人,设抽取的女性有X 人,求X 的分布列及均值E (X ). 参考公式与数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 (1)由题意可得2×2列联表如下:K 2的观测值k =40×(13×12-7×8)220×20×21×19=1 000399≈2.506<2.706,所以85<n <90(n ∈Z ),因此n 可能的最大值为89. (2)该天行走步数超过10 000的有6男2女共8人,则X =0,1,2,P (X =0)=C 36C 38=514,P (X =1)=C 12C 26C 38=1528,P (X =2)=C 22C 16C 38=328,所以X 的分布列为所以E (X )=0×514+1×1528+2×328=34.4.东方商店欲购进某种食品(保质期两天),此商店每两天购进该食品一次(购进时,该食品为刚生产的).根据市场调查,该食品每份进价8元,售价12元,如果两天内无法售出,则食品过期作废,且两天内的销售情况互不影响,为了了解市场的需求情况,现统计该产品在本地区100天的销售量如表:(视样本频率为概率)(1)根据该产品100天的销售量统计表,记两天中一共销售该食品份数为ξ,求ξ的分布列与均值;(2)以两天内该产品所获得的利润均值为决策依据,东方商店一次性购进32或33份,哪一种得到的利润更大?解(1)ξ的可能取值有30,31,32,33,34,35,36,其中P(ξ=30)=0.2×0.2=0.04,P(ξ=31)=2×0.2×0.3=0.12,P(ξ=32)=0.3×0.3+2×0.2×0.4=0.25,P(ξ=33)=2×0.2×0.1+2×0.3×0.4=0.28,P(ξ=34)=0.4×0.4+2×0.3×0.1=0.22,P(ξ=35)=2×0.4×0.1=0.08,P(ξ=36)=0.1×0.1=0.01,∴ξ的分布列为∴E(ξ)=30×0.04+31×0.12+32×0.25+33×0.28+34×0.22+35×0.08+36×0.01=32.8.(2)当一次性购进32份食品时,设每两天的利润为X,则X的可能取值有104,116,128,且P(X=104)=0.04,P(X=116)=0.12,P(X=128)=1-0.04-0.12=0.84,∴E(X)=104×0.04+116×0.12+128×0.84=125.6.当一次性购进33份食品时,设每两天的利润为Y,则Y的可能取值有96,108,120,132.且P(Y=96)=0.04,P(Y=108)=0.12,P(Y=120)=0.25,P(Y=132)=1-0.04-0.12-0.25=0.59,∴E(Y)=96×0.04+108×0.12+120×0.25+132×0.59=124.68.∵E(X)>E(Y),∴东方商店一次性购进32份食品时得到的利润更大.5.为了解2019届高三毕业学生的复习备考情况,某省甲、乙两市组织了一次大联考.为比较两市本届高三毕业学生的数学优秀率,某教研机构从甲、乙两市参加大联考的数学高分段(数学成绩不低于100分)的学生中各随机抽取了100名学生,统计其数学成绩,得到甲市数学高分段学生成绩的频率分布直方图如图所示,乙市数学高分段学生成绩的频数分布表如下表所示(同一组数据用该组数据的区间中点值作代表,将频率视为概率).(1)现计算得甲市数学高分段学生成绩的平均分为123分,乙市数学高分段学生成绩的方差为111,试利用统计知识判断甲、乙两市哪一个市2019届高三毕业学生数学高分段成绩更突出;(2)由频率分布直方图可以认为,甲市这次大联考的数学高分段学生成绩Z(单位:分)近似地服从正态分布N (μ,σ2),其中μ近似为样本平均数,试利用该正态分布模型解决下列问题. ①若甲市恰有2万名学生这次大联考的数学成绩不低于100分,试估计甲市这次大联考的数学成绩Z 高于142.6分的学生人数;②现从甲市这次大联考的数学成绩不低于100分的学生中随机抽取1 000人,若抽到k 人的数学成绩在区间(123,142.6]内的可能性最大,试求整数k 的值. 附:若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)≈0.682 7, P (μ-2σ<X ≤μ+2σ)≈0.954 5, P (μ-3σ<X ≤μ+3σ)≈0.997 3.解 (1)由题意得甲市数学高分段学生成绩的方差为s 2甲=(105-123)2×0.05+(115-123)2×0.4+(125-123)2×0.3+(135-123)2×0.2+(145-123)2×0.05=96,乙市数学高分段学生成绩的平均分为 x乙=105×0.15+115×0.25+125×0.4+135×0.15+145×0.05=122(分). 又x 甲=123,s 2乙=111,所以x 甲>x 乙,s 2甲<s 2乙.故甲市数学高分段学生成绩的平均分更高,且方差更小,故甲市数学高分段学生成绩更稳定. 综上可知甲市的2019届高三毕业学生数学高分段成绩更为突出.(2)①P (Z >142.6)=P (Z >μ+2σ)=12[1-P (μ-2σ<Z ≤μ+2σ)]≈12(1-0.954 5)=0.022 75.因为20 000×0.022 75=455,所以可估计甲市这次大联考的数学成绩Z 高于142.6分的学生有455人.②记所抽取的1 000人中数学成绩在区间(123,142.6]内的人数为Y , 因为P (123<Z ≤142.6)=P (μ<Z ≤μ+2σ)=P (μ-2σ<Z ≤μ+2σ)2≈0.477 25,所以Y ~B (1 000,0.477 25),故P (Y =k )=C k 1 000×0.477 25k ×0.522 751 000-k . 设P (Y =k )最大,则⎩⎪⎨⎪⎧ P (Y =k )≥P (Y =k +1),P (Y =k )≥P (Y =k -1)即⎩⎪⎨⎪⎧0.522 751 000-k ≥0.477 25k +1,0.477 25k≥0.522 751 001-k,解得476.727 25≤k ≤477.727 25.因为k ∈N *,所以使P (Y =k )取得最大值的整数k 的值为477.。
高考专题突破六 高考中的概率与统计问题概率与统计的综合应用例1 (2020·汉中模拟)槟榔原产于马来西亚,在中国主要分布在云南、海南及台湾等热带地区.槟榔是重要的中药材,在南方一些少数民族还将果实作为一种咀嚼嗜好品,但其被世界卫生组织国际癌症研究机构列为致癌物清单Ⅰ类致癌物.云南某民族中学为了解A ,B 两个少数民族班的学生咀嚼槟榔的情况,分别从这两个班中随机抽取5名学生进行调查,将他们平均每周咀嚼槟榔的颗数作为样本,绘制成如图所示的茎叶图(图中的茎表示十位数字,叶表示个位数字).(1)你能否估计哪个班的学生平均每周咀嚼槟榔的颗数较多?(2)在被抽取的10名学生中,从平均每周咀嚼槟榔的颗数不低于20颗的学生中随机抽取3名学生,求抽取B 班学生人数X 的分布列和均值.解 (1)A 班样本数据的平均值为15(9+11+14+20+31)=17,由此估计A 班学生平均每周咀嚼槟榔的颗数为17,B 班样本数据的平均值为15(11+12+21+25+26)=19,由此估计B 班学生平均每周咀嚼槟榔的颗数为19, 故估计B 班学生平均每周咀嚼槟榔的颗数较多. (2)∵平均每周咀嚼槟榔的颗数不低于20颗的学生中, A 班有2人,B 班有3人,共有5人, ∴X 的可能取值为1,2,3,P (X =1)=C 13C 22C 35=310,P (X =2)=C 23C 12C 35=35,P (X =3)=C 33C 02C 35=110,∴X 的分布列为X 1 2 3 P31035110∴E (X )=1×310+2×35+3×110=95.思维升华概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.跟踪训练1(2020·西安八校联考)从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值,由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.(1)求这些产品的质量指标值落在区间[75,85]内的频率;(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于[45,75)内的产品件数为X,求X的分布列与均值.解(1)设落在区间[75,85]内的频率为x,则落在区间[55,65),[65,75)内的频率分别为4x和2x,依题意得(0.004+0.012+0.019+0.030)×10+4x+2x+x=1,解得x=0.05.所以落在区间[75,85]内的频率为0.05.(2)从该企业生产的该种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X服从二项分布B(n,p),其中n=3.由(1)得,落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p=0.6.因为X的所有可能取值为0,1,2,3,则P(X=0)=C03×0.60×0.43=0.064,P(X=1)=C13×0.61×0.42=0.288,P(X=2)=C23×0.62×0.41=0.432,P(X=3)=C33×0.63×0.40=0.216,所以X的分布列为X 012 3P 0.0640.2880.4320.216所以X的均值为E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8.(或直接根据二项分布的均值公式得到E(X)=np=3×0.6=1.8)概率与统计案例的综合应用例2(2020·华中师大附中模拟)中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中开设大学先修课程已有两年,两年共招收学生2 000人,其中有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有60人.这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试(满分100分),结果如表所示:分数a 95≤a≤10085≤a<9575≤a<8560≤a<75a<60人数20551057050 自招通过率0.90.80.60.50.4(1)填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?优等生非优等生总计学习大学先修课程没有学习大学先修课程总计(2)已知今年有150名学生报名学习大学先修课程,以前两年参加大学先修课程学习成绩的频率作为今年参加大学先修课程学习成绩的概率.①在今年参加大学先修课程的学生中任取一人,求他获得某高校自主招生通过的概率;②设今年全校参加大学先修课程的学生通过某高校自主招生考试人数为ξ,求E(ξ).参考数据:P(K2≥k0)0.150.100.050.0250.0100.005k0 2.072 2.706 3.841 5.024 6.6357.879参考公式:K 2=n (ad -bc )2(a +b )(c +b )(a +c )(b +d ),其中n =a +b +c +d解 (1)列联表如下:优等生 非优等生 总计 学习大学先修课程 60 240 300 没有学习大学先修课程140 1 560 1 700 总计2001 8002 000等高条形图如图:通过图形可判断学习先修课程与优等生有关系, 又K 2=2 000(60×1 560-140×240)2300×1 700×200×1 800≈39.216>6.635,因此在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系. (2)①P =20300×0.9+55300×0.8+105300×0.6+70300×0.5+50300×0.4=0.6.②设通过某高校自主招生考试的人数为ξ, 则ξ~B ⎝⎛⎭⎫150,35, P (x =k )=C k 150⎝⎛⎭⎫35k ⎝⎛⎭⎫25150-k ,k =0,1,2,…,150, 所以E (ξ)=150×35=90.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 (2019·洛阳模拟)某商场营销人员进行某商品M 市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到下表:返还点数t 1 2 3 4 5 销量(百件)/天0.50.611.41.7(1)经分析发现,可用线性回归模型拟合当地该商品销量y (百件)与返还点数t 之间的相关关系,请用最小二乘法求y 关于t 的线性回归方程y ^=b ^t +a ^,并预测若返还6个点时该商品每天的销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:①求这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);②将对返还点数的心理预期值在[1,3)和[11,13]的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望膨胀型”消费者的人数为随机变量X ,求X 的分布列及均值.参考公式及数据:b ^=∑i =1nt i y i -n t y∑i =1nt 2i -nt2,a ^=y -b ^t ;∑i =15t i y i =18.8. 解 (1)由题意知t =1+2+3+4+55=3,y =0.5+0.6+1+1.4+1.75=1.04,∑i =15t 2i =12+22+32+42+52=55, b ^=∑i =15t i y i -5t y∑i =15t 2i -5t2=18.8-5×3×1.0455-5×32=0.32,a ^=y -b ^t =1.04-0.32×3=0.08, 则y 关于t 的线性回归方程为y ^=0.32t +0.08,当t =6时,y ^=2.00,即返还6个点时该商品每天销量约为200件.(2)①根据题意,这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数x 为x =2×0.1+4×0.3+6×0.3+8×0.15+10×0.1+12×0.05=6, 中位数的估计值为5+2×100-20-6060=5+23≈5.7.②抽取的6名消费者中“欲望紧缩型”消费者人数为6×2030=4,“欲望膨胀型”消费者人数为6×1030=2.故X 的所有可能取值为0,1,2.P (X =2)=C 14C 22C 36=15,P (X =1)=C 24C 12C 36=35,P (X =0)=C 34C 02C 36=15,故随机变量X 的分布列为X 0 1 2 P153515E (X )=2×15+1×35+0×15=1.均值与方差在决策中的应用例3 (2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p (0<p <1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p 0作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X ,求E (X ); ②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验? 解 (1)20件产品中恰有2件不合格品的概率为 f (p )=C 220·p 2(1-p )18. 因此f ′(p )=C 220[2p (1-p )18-18p 2(1-p )17]=2C 220p (1-p )17(1-10p ).令f ′(p )=0,得p =0.1.当p ∈(0,0.1)时,f ′(p )>0;当p ∈(0.1,1)时,f ′(p )<0. 所以f (p )的最大值点为p 0=0.1. (2)由(1)知,p =0.1①令Y 表示余下的180件产品中的不合格品件数, 依题意知Y ~B (180,0.1), X =20×2+25Y ,即X =40+25Y .所以E (X )=E (40+25Y )=40+25E (Y )=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元. 由于E (X )=490>400,故应该对余下的产品做检验.思维升华 随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较均值,若均值相同,再由方差来决定.跟踪训练3 (2020·100所名校最新冲刺卷)某中学是走读中学,为了让学生更有效率的利用下午放学后的时间,学校在本学期第一次月考后设立了多间自习室,以便让学生在自习室自主学习、完成作业,同时每天派老师轮流值班.在本学期第二次月考后,高一某班数学老师统计了两次考试该班数学成绩优良人数和非优良人数,得到如下2×2列联表:(1)能否在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效? (2)设从该班第一次月考的所有数学成绩中任取两个,取到成绩优良数为X ;从该班第二次月考的所有数学成绩中任取两个,取到成绩优良数为Y ,求X 与Y 的均值并比较大小,请解释所得结论的实际含义. 下面的临界值表供参考:(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解(1)K 2=80(25×30-15×10)240×40×35×45≈11.43>7.879,所以能在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效. (2)X 的所有可能取值为0,1,2,则P (X =0)=C 225C 240=513,P (X =1)=C 125C 115C 240=2552,P (X =2)=C 215C 240=752,X 0 1 2 P5132552752所以E (X )=0×513+1×2552+2×752=34.Y 的所有可能取值为0,1,2,则P (Y =0)=C 210C 240=352,P (Y =1)=C 110C 130C 240=513,P (Y =2)=C 230C 240=2952,Y 0 1 2 P3525132952所以E (Y )=0×352+1×513+2×2952=32,即E (X )<E (Y ),其实际含义是设立自习室后学生的数学成绩提高,说明设立自习室对提高学生成绩有效.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:支付金额(元)支付方式(0,1 000] (1 000,2 000]大于2 000 仅使用A 18人 9人 3人 仅使用B10人14人1人(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A 的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.。
第三讲 统计、统计案例(推荐时间:50分钟)一、选择题1.在某超市的四类包装食品中,抽取一个容量为20的样本进行检测,已知四类包装食品中果脯类、火腿类、饼干类、蛋糕类分别有40种、10种、30种、20种,若采用分层抽样的方法抽取,则抽取果脯类、饼干类食品的种数之和为( )A .6B .9C .12D .142.(2012·安徽“江南十校”联考)已知一组正数x 1,x 2,x 3,x 4的方差为s 2=14(x 21+x 22+x 23+x 24-16),则数据x 1+2,x 2+2,x 3+2,x 4+2的平均数为( ) A .2B .3C .4D .63.从容量为102的总体中用系统抽样法随机抽取一个容量为9的样本,下列说法正确的是( )A .将总体分成11组,每组间隔为9B .将总体分成9组,每组间隔为11C .从总体中剔除2个个体后分成10组,每组间隔为10D .从总体中剔除3个个体后分成9组,每组间隔为114.某商品销售量y (件)与销售价格x (元/件)负相关,则其线性回归方程可能是( )A.y ^ =-10x +200B.y ^=10x +200C.y ^=-10x -200D.y ^=10x -2005.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A .甲地:总体均值为3,中位数为4B .乙地:总体均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为36.学校为了调查学生在课外读物方面的支出情况 ,抽取了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n 个人中抽取50个人,则在[50,60)之间应抽取的人数为( )A.10 B.15 C.25 D.30 7.(2012·陕西)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为m甲、m乙,则( )A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙二、填空题8.(2012·江苏)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取______名学生.9.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本.用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是________.若用分层抽样方法,则40岁以下年龄段应抽取________人.10.(2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.11.一个总体中有100个个体,随机编号0,1,2,…,99.依编号顺序平均分成10个小组,组号依次为1,2,3,…,10,现用系统抽样方法抽取一个容量为10的样本,规定如果在第一组随机抽取的号码为t,则在第k组中抽取的号码个位数字与t+k的个位数字相同,若t=7,则在第8组中抽取的号码应是________.12.2012年,各大品牌汽车继续在中国的汽车市场上相互博弈,汽车的配置与销售价格以及维修费用等成为人们购买汽车时需要考虑的因素,某汽车制造商为了进一步拓宽市场,统计了某种品牌的汽车的使用年限x 和所支出的维修费用y (万元),得到的统计资料如下表所示:若由资料,可知y 对x 呈线性相关关系,且线性回归方程为y ^=a ^+b ^x ,其中已知b ^=1.23,根据国家政策规定,轿车报废的年限最长为15年,若该品牌汽车在使用10.三、解答题13.为了了解一个小水库中养殖的鱼的有关情况,从这个水库中多个不同位置捕捞出100条鱼,称得每条鱼的质量(单位:kg),并将所得数据分组,画出频率分布直方图(如图所示).(1)(2)估计数据落在[)1.15,1.30中的概率为多少;(3)将上面捕捞的100条鱼分别作一记号后再放回水库.几天后再从水库的多处不同位置捕捞出120条鱼,其中带有记号的鱼有6条.请根据这一情况来估计该水库中鱼的总条数.14.某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?答案1.D 2.C 3.D 4.A 5.D 6.B 7.B 8.15 9.37 20 10.18 9 11.75 12.12.3813.解 (1)/组距),故可得下表:(2)因为0.30+0.15+0.02=0.47,所以数据落在[1.15,1.30)中的概率约为0.47. (3)120×1006=2 000,所以水库中鱼的总条数约为2 000.14.解 (1)设事件A 表示“选取的2组数据恰好是不相邻2天的数据”,则A 表示“选取的数据恰好是相邻2天的数据”.基本事件总数为10,事件A 包含的基本事件数为4.∴P (A )=410=25,∴P (A )=1-P (A )=35.(2)x =12,y =27,∑i =13x i y i =977,∑i =13x 2i =434,∴b ^=∑i =13x i y i -3x y∑i =13x 2i -3x 2=977-3×12×27434-3×122=2.5, a ^=y -b ^x =27-2.5×12=-3,∴y ^=2.5x -3.(3)由(2)知:当x =10时,y ^=22,误差不超过2颗;当x =8时,y ^=17,误差不超过2颗. 故所求得的线性回归方程是可靠的.。
第1讲 概 率【高考考情解读】 1.古典概型和几何概型的大体应用是高考的重点,填空题要紧以考查几何概型、古典概型为主,试题难度较小.2.解答题型中的古典概型问题常常与概率的大体运算性质,如互斥事件的概率加法公式、对立事件的减法公式等综合考查,试题难度不大. 1. 概率的五个大体性质(1)随机事件A 的概率:0≤P (A )≤1. (2)必然事件的概率为1. (3)不可能事件的概率为0.(4)若是事件A 与事件B 互斥,那么P (A ∪B )=P (A )+P (B ).(5)若是事件A 与事件B 互为对立事件,那么P (A ∪B )=P (A )+P (B )=1,即P (A )=1-P (B ). 2. 两种常见的概型(1)古典概型①特点:有限性,等可能性.②概率公式:P (A )=事件A 中所含的基本事件数试验的基本事件总数.(2)几何概型①特点:无穷性,等可能性. ②概率公式:P (A )=构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积.考点一 古典概型例1 (2021·山东)某小组共有A ,B ,C ,D ,E 五位同窗,他们的身高(单位:米)及体重指标(单位:千克/米2)如下表所示:ABCDE身高 1.69 1.73 1.75 1.79 1.82 体重指标19.225.118.523.320.9(1)从该小组身高低于(2)从该小组同窗中任选2人,求选到的2人的身高都在1.70以上且体重指标都在[18.5,23.9)中的概率.解 (1)从身高低于1.80的4名同窗中任选2人,其一切可能的结果组成的大体事件有:(A ,B ),(A ,C ),(A ,D ),(B ,C ),(B ,D ),(C ,D )共6个.设“选到的2人身高都在1.78以下”为事件M ,其包括的事件有3个,故P (M )=36=12.(2)从小组5名同窗中任选2人,其一切可能的结果组成的大体事件有:(A ,B ),(A ,C ),(A ,D ),(A ,E ),(B ,C ),(B ,D ),(B ,E ),(C ,D ),(C ,E ),(D ,E )共10个.设“选到的2人的身高都在1.70以上且体重指标都在[18.5,23.9)”为事件N ,且事件N 包括事件有:(C ,D ),(C ,E ),(D ,E )共3个.则P (N )=310.古典概型中大体事件数的计算方式(1)列举法:此法适合于较简单的实验;(2)树状图法:树状图是进行列举的一种经常使用方式,适合较复杂问题中大体事件数的探求; (3)列表法:关于表达形式有明显二维特点的事件采纳此法较为方便.盒中有6个小球,其中3个白球,记为a 1,a 2,a 3,2个红球,记为b 1,b 2,1个黑球,记为c 1,除颜色和编号外,球没有任何区别.(1)求从盒中取一球是红球的概率;(2)从盒中取一球,记下颜色后放回,再取一球,记下颜色,假设取白球得1分,取红球得2分,取黑球得3分,求两次取球得分之和为5分的概率.解 (1)所有大体事件为:a 1,a 2,a 3,b 1,b 2,c 1共计6种.记“从盒中取一球是红球”为事件A ,事件A 包括的大体事件为:b 1,b 2, ∴P (A )=26=13.∴从盒中取一球是红球的概率为13.(2)记“两次取球得分之和为5分”为事件B ,总事件包括的大体事件为:(a 1,a 1),(a 1,a 2),(a 1,a 3),(a 1,b 1),(a 1,b 2),(a 1,c 1),(a 2,a 1),(a 2,a 2),(a 2,a 3),(a 2,b 1),(a 2,b 2),(a 2,c 1),(a 3,a 1),(a 3,a 2),(a 3,a 3),(a 3,b 1),(a 3,b 2),(a 3,c 1),(b 1,a 1),(b 1,a 2),(b 1,a 3),(b 1,b 1),(b 1,b 2),(b 1,c 1),(b 2,a 1),(b 2,a 2),(b 2,a 3),(b 2,b 1),(b 2,b 2),(b 2,c 1),(c 1,a 1),(c 1,a 2),(c 1,a 3),(c 1,b 1),(c 1,b 2),(c 1,c 1),共计36种.而事件B 包括的大体事件为:(b 1,c 1),(b 2,c 1),(c 1,b 1),(c 1,b 2),共计4种. ∴P (B )=436=19.∴“两次取球得分之和为5分”的概率为19.考点二 几何概型例2 (2021·四川)节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮彼此独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒为距离闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是________. 答案 34解析 设在通电后的4秒钟内,甲串彩灯、乙串彩灯第一次亮的时刻为x 、y ,x 、y 彼此独立,由题意可知⎩⎪⎨⎪⎧0≤x ≤40≤y ≤4|x -y |≤2,如下图.∴两串彩灯第一次亮的时刻相差不超过2秒的概率为P (|x -y |≤2)=S 正方形-2S △ABC S 正方形=4×4-2×12×2×24×4=1216=34.当实验的结果组成的区域为长度、面积、体积、弧长、夹角等时,应考虑利用几何概型求解;利用几何概型求概率时,关键是实验的全数结果组成的区域和事件发生的区域的寻觅,有时需要设出变量,在座标系中表示所需要的区域.(1)在区间[0,2]上任取两个实数a ,b ,那么函数f (x )=x 3+ax -b 在区间[-1,1]上有且仅有一个零点的概率是________.(2)(2021·湖北)如图,在圆心角为直角的扇形OAB 中,别离以OA ,OB 为直径作两个半圆.在扇形OAB 内随机取一点,那么此点取自阴影部份的概率是________.答案 (1)78 (2)1-2π解析 (1)因为f ′(x )=3x 2+a ,由于a ≥0,故f ′(x )≥0恒成立,故函数f (x )在[-1,1]上单调递增,故函数f (x )在区间[-1,1]上有且只有一个零点的充要条件是⎩⎪⎨⎪⎧ f -1≤0,f 1≥0,即⎩⎪⎨⎪⎧a +b +1≥0,a -b +1≥0.设点(a ,b ),那么大体事件所在的区域是⎩⎪⎨⎪⎧0≤a ≤2,0≤b ≤2,画出平面区域,如下图,依照几何概型的意义,所求的概率是以图中阴影部份的面积和以2为边长的正方形的面积的比值,那个比值是78.(2)方式一 解题关键是求出空白部份的面积,用几何概型求解. 设别离以OA ,OB 为直径的两个半圆交于点C ,OA 的中点为D ,如 图,连结OC ,DC . 不妨令OA =OB =2, 则OD =DA =DC =1.在以OA 为直径的半圆中,空白部份面积S 1=π4+12×1×1-⎝ ⎛⎭⎪⎫π4-12×1×1=1, 因此整体图形中空白部份面积S 2=2. 又因为S 扇形OAB =14×π×22=π,因此阴影部份面积为S 3=π-2. 因此P =π-2π=1-2π.方式二 连结AB ,由S 弓形AC =S 弓形BC =S 弓形OC 可求出空白部份面积. 设别离以OA ,OB 为直径的两个半圆交于点C ,令OA =2.由题意知C ∈AB 且S 弓形AC =S 弓形BC =S 弓形OC , 因此S 空白=S △OAB =12×2×2=2.又因为S 扇形OAB =14×π×22=π,因此S 阴影=π-2.因此P =S 阴影S 扇形OAB =π-2π=1-2π.考点三 互斥事件与对立事件例3 某项活动的一组志愿者全数知晓中文,而且每一个志愿者还都知晓英语、日语和韩语中的一种(但无人知晓两种外语).已知从中任抽一人,其知晓中文和英语的概率为12,知晓中文和日语的概率为310.假设知晓中文和韩语的人数不超过3人. (1)求这组志愿者的人数;(2)此刻从这组志愿者当选出知晓英语的志愿者1名,知晓韩语的志愿者1名,假设甲知晓英语,乙知晓韩语,求甲和乙不全被选中的概率.解 (1)设知晓中文和英语的人数为x ,知晓中文和日语的人数为y ,知晓中文和韩语的人数为z ,且x ,y ,z ∈N *,那么⎩⎪⎨⎪⎧x x +y +z =12,y x +y +z =310,0<z ≤3,解得⎩⎪⎨⎪⎧x =5,y =3,z =2,因此这组志愿者的人数为5+3+2=10.(2)设知晓中文和英语的人为A 1,A 2,A 3,A 4,A 5,甲为A 1,知晓中文和韩语的人为B 1,B 2,乙为B 1,那么从这组志愿者当选出知晓英语和韩语的志愿者各1名的所有情形为(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(A 4,B 1),(A 4,B 2),(A 5,B 1),(A 5,B 2),共10种,同时选中甲、乙的只有(A 1,B 1)1种.因此甲和乙不全被选中的概率为1-110=910.求解互斥事件、对立事件的概率问题时,一要先利用条件判定所给的事件是互斥事件,仍是对立事件;二要将所求事件的概率转化为互斥事件、对立事件的概率;三要准确利用互斥事件、对立事件的概率公式去计算所求事件的概率.(2021·江西)小波以游戏方式决定是去打球、唱歌仍是去下棋.游戏规那么为:以O 为起点,再从A 1、A 2、A 3、A 4、A 5、A 6(如图)这6个点中任取两点别离为终点取得两个向量,记这两个向量的数量积为X .假设X >0就去打球,假设X =0就去唱歌,假设X <0就去下棋. (1)写出数量积X 的所有可能取值;(2)别离求小波去下棋的概率和不去唱歌的概率. 解 (1)X 的所有可能取值为-2,-1,0,1. (2)数量积为-2的有OA 2→·OA →5,共1种;数量积为-1的有OA 1→·OA 5→,OA 1→·OA 6→,OA 2→·OA 4→,OA 2→·OA 6→,OA 3→·OA 4→,OA 3→·OA 5→,共6种; 数量积为0的有OA 1→·OA 3→,OA 1→·OA 4→,OA 3→·OA 6→,OA 4→·OA 6→,共4种; 数量积为1的有OA 1→·OA 2→,OA 2→·OA 3→,OA 4→·OA 5→,OA 5→·OA 6→,共4种. 故所有可能的情形共有15种. 因此小波去下棋的概率为P 1=715;因为去唱歌的概率为P 2=415,因此小波不去唱歌的概率为P =1-P 2=1-415=1115.1.互斥事件与对立事件的关系(1)对立必然互斥,互斥未必对立;(2)可将所求事件化为互斥事件A 、B 的和,再利用公式P (A +B )=P (A )+P (B )来求,也可通过对立事件公式P (A )=1-P (A )来求P (A ).2. 古典概型与几何概型P (A )=构成事件A 的区域长度面积或体积试验的全部结果所构成的区域长度面积或体积1. 四个数字之和为23的概率为________. 答案1360 解析 因为时钟一分钟显示一次,故总的显示方式数为24×60=1 440(种),四个数字之和为23的有09:59,18:59,19:49,19:58四种情形,故所求概率为41 440=1360.2. 袋中装有大小相同且形状一样的四个球,四个球上别离标有“2”、“3”、“4”、“6”这四个数.现从中随机选取三个球,那么所选的三个球上的数恰好能组成一个等差数列的概率是________. 答案 12解析 从四个不同的数当选三个的情形有(2,3,4),(2,3,6),(2,4,6),(3,4,6),共四种,知足成等差数列的情形有(2,3,4)和(2,4,6),共两种.故所求概率为24=12.3. 某地域有小学21所,中学14所,大学7所,现采纳分层抽样的方式从这些学校中抽取6所学校对学生进行视力调查.(1)求应从小学、中学、大学中别离抽取的学校数量.(2)假设从抽取的6所学校中随机抽取2所学校做进一步数据分析, ①列出所有可能的抽取结果;②求抽取的2所学校均为小学的概率. 解 (1)由分层抽样概念知,从小学中抽取的学校数量为6×2121+14+7=3;从中学中抽取的学校数量为6×1421+14+7=2;从大学中抽取的学校数量为6×721+14+7=1.故从小学、中学、大学中别离抽取的学校数量为3,2,1.(2)①在抽取到的6所学校中,3所小学别离记为A 1,A 2,A 3,2所中学别离记为A 4,A 5,大学记为A 6,那么抽取2所学校的所有可能结果为{A 1,A 2},{A 1,A 3},{A 1,A 4},{A 1,A 5},{A 1,A 6},{A 2,A 3},{A 2,A 4},{A 2,A 5},{A 2,A 6},{A 3,A 4},{A 3,A 5},{A 3,A 6},{A 4,A 5},{A 4,A 6},{A 5,A 6},共15种.②从6所学校中抽取的2所学校均为小学(记为事件B )的所有可能结果为{A 1,A 2},{A 1,A 3},{A 2,A 3},共3种,因此P (B )=315=15.(推荐时刻:40分钟) 一、填空题1. (2021·课标全国Ⅰ改编)从1,2,3,4中任取2个不同的数,那么掏出的2个数之差的绝对值为2的概率是________. 答案 13解析 大体事件的总数为6,组成“掏出的2个数之差的绝对值为2”那个事件的大体事件的个数为2. 因此,所求概率P =26=13.2. (2021·安徽改编)假设某公司从五位大学毕业生甲、乙、丙、丁、戊中录用三人,这五人被录用的机遇均等,那么甲或乙被录用的概率为________. 答案910 解析 由题意,从五位大学毕业生中录用三人,所有不同的可能结果有(甲,乙,丙),(甲,乙,丁),(甲,乙,戊),(甲,丙,丁),(甲,丙,戊),(甲,丁,戊),(乙,丙,丁),(乙,丙,戊),(乙,丁,戊),(丙,丁,戊),共10种,其中“甲与乙均未被录用”的所有不同的可能结果只有(丙,丁,戊)这1种,故其对立事件“甲或乙被录用”的可能结果有9种,所求概率P =910.3. (2021·北京)设不等式组⎩⎪⎨⎪⎧0≤x ≤2,0≤y ≤2表示的平面区域为D ,在区域D 内随机取一个点,那么此点到坐标原点的距离大于2的概率是________. 答案 4-π4解析 如下图,正方形OABC 及其内部为不等式组表示的区域D , 且区域D 的面积为4,而阴影部份表示的是区域D 内到原点距离大 于2的区域,易知该阴影部份的面积为4-π,因此知足条件的概率 是4-π4.4. 第16届亚运会于2020年11月12日在中国广州举行,运动会期间有来自A 大学2名和B 大学4名的大学生志愿者,从这6名志愿者中随机抽取2人到体操竞赛场馆效劳,那么至少有一名A 大学志愿者的概率是________. 答案 35解析 假设这2名学生来自两所大学,那么P 1=2×415=815;假设这2名大学生来自A 大学,那么P 2=115.故至少有一名A 大学志愿者的概率是815+115=35.5. 一个袋中有3个黑球,2个白球共5个大小相同的球,每次摸出一球,放进袋里再摸第二次,那么两次摸出的球都是白球的概率为________. 答案425 解析 有放回地摸球,大体事件总数为25;两次都是白球所包括的大体事件为4.因此两次摸出的球都是白球的概率为425.6. 点A 为周长等于3的圆周上的一个定点.假设在该圆周上随机取一点B ,那么劣弧AB 的长度小于1的概率为________. 答案 23解析 如图,设A ,M ,N 为圆周的三等分点,当B 点取在优弧MAN 上时, 对劣弧AB 来讲,其长度小于1,故其概率为23.7. (2021·江苏)现有某类病毒记作X m Y n ,其中正整数m ,n (m ≤7,n ≤9)能够任意选取,那么m ,n 都取到奇数的概率为________. 答案 2063解析 P =4×57×9=2063.8. 抛掷甲、乙两枚质地均匀且四面上别离标有1,2,3,4的正四面体,其底面落于桌面,记所得的数字别离为x ,y ,那么xy为整数的概率是________.答案 12解析 将抛掷甲、乙两枚质地均匀的正四面体所得的数字x ,y 记作有序实数对(x ,y ),共包括16个大体事件,其中xy为整数的有(1,1),(2,2),(3,3),(4,4),(2,1),(3,1),(4,1),(4,2),共8个大体事件,故所求的概率为816=12.9. 已知区域Ω={(x ,y )|x +y ≤10,x ≥0,y ≥0},A ={(x ,y )|x -y ≥0,x ≤5,y ≥0},假设向区域Ω上随机投1个点,那么那个点落入区域A 的概率P (A )=________. 答案 14解析 作出如下图的可行域,易患区域Ω的面积为12×10×10=50, 区域A (阴影部份)的面积为12×5×5=252.故该点落在区域A 的概率 P (A )=25250=14. 10.假设利用运算机在区间(0,1)上产生两个不等的随机数a 和b ,那么方程x =22a -2b x 有不等实数根的概率为________.答案 12解析 方程x =22a -2b x,即x 2-22ax +2b =0,原方程有不等实数根,那么需知足Δ=(22a )2-4×2b >0,即a >b .在如下图的平面直角坐标系内,(a ,b )的所有可能结果是边长为1的正方形(不包括边界),而事件A “方程x =22a -2b x有不等实数 根”的可能结果为图中阴影部份(不包括边界).由几何概型公式可得P (A )=12×1×11×1=12. 二、解答题11.某学校的篮球队、羽毛球队、乒乓球队各有10名队员,某些队员不止参加了一支球队,具体情形如下图,现从中随机抽取一名队员,求:(1)该队员只属于一支球队的概率;(2)该队员最多属于两支球队的概率.解 从图中能够看出,3个球队共有20名队员.(1)记“随机抽取一名队员,该队员只属于一支球队”为事件A .因此P (A )=3+5+420=35.故随机抽取一名队员,只属于一支球队的概率为35.(2)记“随机抽取一名队员,该队员最多属于两支球队”为事件B .那么P (B )=1-P (B )=1-220=910. 故随机抽取一名队员,该队员最多属于两支球队的概率为910. 12.在一次“知识竞赛”活动中,有A 1,A 2,B ,C 四道题,其中A 1,A 2为难度相同的容易题,B 为中档题,C 为较难题.现甲、乙两位同窗均需从四道题目中随机抽取一题作答.(1)求甲、乙两位同窗所选的题目难度相同的概率;(2)求甲所选题目的难度大于乙所选题目的难度的概率.解 由题意可知,甲、乙两位同窗别离从四道题中随机抽取一题,所有可能的结果有16个,它们是:(A 1,A 1),(A 1,A 2),(A 1,B ),(A 1,C ),(A 2,A 1),(A 2,A 2),(A 2,B ),(A 2,C ),(B ,A 1),(B ,A 2),(B ,B ),(B ,C ),(C ,A 1),(C ,A 2),(C ,B ),(C ,C ).(1)用M 表示事件“甲、乙两位同窗所选的题目难度相同”,那么M 包括的大体事件有:(A 1,A 1),(A 1,A 2),(A 2,A 1),(A 2,A 2),(B ,B ),(C ,C ),共6个,因此P (M )=616=38. (2)用N 表示事件“甲所选题目的难度大于乙所选题目的难度”,那么N 包括的大体事件有:(B ,A 1),(B ,A 2),(C ,A 1),(C ,A 2),(C ,B ),共5个,因此P (N )=516. 13.现有8名数理化成绩优秀者,其中A 1,A 2,A 3数学成绩优秀,B 1,B 2,B 3物理成绩优秀,C 1,C 2化学成绩优秀.从当选出数学、物理、化学成绩优秀者各1名,组成一个小组代表学校参加竞赛.(1)求C 1被选中的概率;(2)求A 1和B 1不全被选中的概率.解 (1)从8人当选出数学、物理、化学成绩优秀者各1名,其一切可能的结果组成的大体事件空间为 Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)}.由18个大体事件组成.由于每一个大体事件被抽取的机遇均等.因此这些大体事件的发生是等可能的.用M 表示“C 1恰被选中”这一事件,那么M ={(A 1,B 1,C 1),(A 1,B 2,C 1),(A 1,B 3,C 1),(A 2,B 1,C 1),(A 2,B 2,C 1),(A 2,B 3,C 1),(A 3,B 1,C 1),(A 3,B 2,C 1),(A 3,B 3,C 1)}.事件M 由9个大体事件组成,因此P (M )=918=12. (2)用N 表示“A 1,B 1不全被选中”这一事件, 那么其对立事件N 表示“A 1,B 1全被选中”这一事件,由于N ={(A 1,B 1,C 1),(A 1,B 1,C 2)},事件N 由2个大体事件组成,因此P (N )=218=19. 由对立事件的概率公式得 P (N )=1-P (N )=1-19=89.。
训练15 概率与统计1.一个篮球运动员投篮一次得3分的概率为a ,得2分的概率为b ,不得分的概率为c (a 、b 、c ∈(0,1)),已知他投篮一次得分的数学期望为1(不计其他得分的情况),则ab 的最大值为________.2.已知某一随机变量X 的概率分布表如下,且E (X )=6.3,则a 的值为________.3.1、2、3、4、5、6),骰子朝上的面的点数分别为x 、y ,则log 2x y =1的概率为________.4.已知函数f (x )=x 2+bx +c ,其中0≤b ≤4,0≤c ≤4,记函数f (x )满足条件⎩⎪⎨⎪⎧f (2)≤12f (-2)≤4为事件A ,则事件A 发生的概率为________.5.甲、乙两人进行围棋比赛,比赛采取五局三胜制,无论哪一方先胜三局则比赛结束,假定甲每局比赛获胜的概率均为23,则甲以3∶1的比分获胜的概率为________. 6.如果ξ~B ⎝⎛⎭⎫15,14,则使P (ξ=k )取最大值的k 值为________. 7.(2011·锦州模拟)甲射击命中目标的概率是12,乙命中目标的概率是13,丙命中目标的概率是14.现在三人同时射击目标,则目标被击中的概率为________. 8.(2011·辽宁)从1,2,3,4,5中任取2个不同的数,事件A =“取到的2个数之和为偶数”,事件B =“取到的2个数均为偶数”,则P (B |A )=________.9.甲、乙两人进行5场比赛,每场甲获胜的概率为23,乙获胜的概率为13,如果有一人胜了三场,比赛即告结束,那么比赛以乙获胜3场负2场而结束的概率是________.10.(2010·福建)某次知识竞赛规则如下:在主办方预设的5个问题中,选手若能连续正确回答出两个问题,即停止答题,晋级下一轮.假设某选手正确回答每个问题的概率都是0.8,且每个问题的回答结果相互独立,则该选手恰好回答了4个问题就晋级下一轮的概率为________.11.已知样本容量为30,在样本频率分布直方图中,各小长方形的高的比从左到右依次为2∶4∶3∶1,则第2组的频率和频数分别是________.12.学校为了调查学生在课外读物方面的支出情况 ,抽取了一个容量为n 的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n 个人中抽取50个人,则在[50,60)之间应抽取的人数为________.13.在如图所示的“茎叶图”表示的数据中,众数和中位数分别为________________.14.(2010·福建)将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________.答案1.1242.7 3.112 4.12 5.8276.3或4 7.348.149.88110.0.12811.0.4,12 12.15 13.31,26 14.60。
专题六 高考中的概率与统计问题1.质点在数轴上的区间[0,2]上运动,假定质点出现在该区间各点处的概率相等,那么质点落在区间[0,1]上的概率为 ( )A.14B.13C.12 D .以上都不对 答案 C解析 区间[0,2]的长度为2,记“质点落在区间[0,1]上”为事件A .则事件A 的区间长度为1,则P (A )=12.2. 为了从甲、乙两名运动员中选拔一人参加某次运动会跳水项目,对甲、乙两名运动员进行培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得到茎叶图如图所示.从平均成绩及发挥稳定性的角度考虑,你认为选派________(填甲或乙)运动员合适. 答案 甲解析 根据茎叶图,可得x 甲=16×(78+79+81+84+93+95)=85,x 乙=16×(75+80+83+85+92+95)=85.s 2甲=16×[(78-85)2+(79-85)2+(81-85)2+(84-85)2+(93-85)2+(95-85)2]=1333, s 2乙=16×[(75-85)2+(80-85)2+(83-85)2+(85-85)2+(92-85)2+(95-85)2]=1393. 因为x甲=x 乙,s 2甲<s 2乙,所以甲运动员的成绩比较稳定,选派甲运动员参赛比较合适.3.设函数f (x )=x 2+bx +c ,其中b ,c 是某范围内的随机数,若随机数b ,c ∈{1,2,3,4},则事件“f (1)≤5且f (0)≤3”发生的概率为________.答案 38解析 由f (x )=x 2+bx +c 知,f (1)≤5且f (0)≤3,即⎩⎨⎧b +c ≤4c ≤3,因为随机数b ,c ∈{1,2,3,4}, 所以共等可能地产生16个数对(b ,c ),分别为(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4),事件⎩⎨⎧b +c ≤4c ≤3包含了其中6个数对(1,1),(1,2),(1,3),(2,1),(2,2),(3,1),所以所求事件发生的概率P =616=38.4.在边长为2的正方形ABCD 内部任取一点M ,则满足∠AMB >90°的概率为________.答案 π8解析 以AB 为直径作圆,当M 在圆与正方形重合形成的半圆内时,∠AMB >90°,所求概率为P =π24=π8.5.如图是某学校抽取的n 个学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第3小组的频数为18,则n 的值是________.答案 48解析 若第一组的频率记为x ,则第二、三组频率依次为2x,3x ,第四、第五组频率依次为0.187 5,0.062 5,从而6x +0.187 5+0.062 5=1,解得x =18,从而第三组的频率为38;从而18n =38,解得n =48.题型一 古典概型与几何概型的概率计算 例1 已知关于x 的二次函数f (x )=ax 2-4bx +1.(1)设集合P ={1,2,3}和Q ={-1,1,2,3,4},分别从集合P 和Q 中随机取一个数作为a 和b ,求函数y =f (x )在区间[1,+∞)上是增函数的概率; (2)设点(a ,b )是区域⎩⎪⎨⎪⎧x +y -8≤0,x >0,y >0内的一点,求函数y =f (x )在区间[1,+∞)上是增函数的概率.思维启迪 首先判断两个问题是什么概率模型:容易知道(1)是一个古典概型概率;(2)是一个几何概型概率,对于(1)将所有情况都列举出来即可,(2)要结合线性规划知识来解决.解 (1)∵函数f (x )=ax 2-4bx +1的图象的对称轴为直线x =2ba ,要使f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数,当且仅当a >0且2ba ≤1,即2b ≤a .若a =1,则b =-1; 若a =2,则b =-1或1;若a =3,则b =-1或1.∴事件包含基本事件的个数是1+2+2=5.∴所求事件的概率为515=13.(2)由(1),知当且仅当2b ≤a 且a >0时,函数f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数, 依条件可知事件的全部结果所构成的区域为⎩⎪⎨⎪⎧⎭⎪⎬⎪⎫(a ,b )⎪⎪⎪⎪⎩⎨⎧ a +b -8≤0,a >0,b >0,构成所求事件的区域为三角形部分. 由⎩⎪⎨⎪⎧a +b -8=0,b =a 2,得交点坐标为(163,83),∴所求事件的概率为P =12×8×8312×8×8=13.思维升华 几何概型与古典概型的本质区别在于试验结果的无限性,几何概型经常涉及的几何度量有长度、面积、体积等,解决几何概型的关键是找准几何测度;古典概型是命题的重点,对于较复杂的基本事件空间,列举时要按照一定的规律进行,做到不重不漏.(2012·天津)某地区有小学21所,中学14所,大学7所,现采用分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查. (1)求应从小学、中学、大学中分别抽取的学校数目.(2)若从抽取的6所学校中随机抽取2所学校做进一步数据分析, ①列出所有可能的抽取结果; ②求抽取的2所学校均为小学的概率. 解 (1)由分层抽样定义知,从小学中抽取的学校数目为6×2121+14+7=3;从中学中抽取的学校数目为6×1421+14+7=2;从大学中抽取的学校数目为6×721+14+7=1.故从小学、中学、大学中分别抽取的学校数目为3,2,1.(2)①在抽取的6所学校中,3所小学分别记为A 1,A 2,A 3,2所中学分别记为A 4,A 5,大学记为A 6,则抽取2所学校的所有可能结果为{A 1,A 2},{A 1,A 3},{A 1,A 4},{A 1,A 5},{A 1,A 6},{A 2,A 3},{A 2,A 4},{A 2,A 5},{A 2,A 6},{A 3,A 4},{A 3,A 5},{A 3,A 6},{A 4,A 5},{A 4,A 6},{A 5,A 6},共15种.②从6所学校中抽取的2所学校均为小学(记为事件B )的所有可能结果为{A 1,A 2},{A 1,A 3},{A 2,A 3},共3种,所以P (B )=315=15.题型二 概率与统计的综合应用例2 第12届全运会将于2013年8月31日在辽宁沈阳举行,组委会在沈阳某大学招募了12名男志愿者和18名女志愿者,将这30名志愿者的身高编成如图所示的茎叶图(单位:cm),身高在175 cm 以上(包括175 cm)定义为“高个子”,身高在175 cm 以下(不包括175 cm)定义为“非高个子”.(1)如果用分层抽样的方法从“高个子”和“非高个子”中共抽取5人,再从这5人中选2人,求至少有一人是“高个子”的概率;(2)若从身高180 cm 以上(包括180 cm)的志愿者中选出男、女各一人,求这2人身高相差5 cm 以上的概率.思维启迪 求“至少有……”的概率往往利用“正难则反”的方法简单. 解 (1)根据茎叶图知,“高个子”有12人,“非高个子”有18人,用分层抽样的方法,每个人被抽中的概率是530=16,所以抽取的5人中,“高个子”有12×16=2人,“非高个子”有18×16=3人.“高个子”用A ,B 表示,“非高个子”用a ,b ,c 表示,则从这5人中选2人的情况有(A ,B ),(A ,a ),(A ,b ),(A ,c ),(B ,a ),(B ,b ),(B ,c ),(a ,b ),(a ,c ),(b ,c ),共10种,至少有一名“高个子”被选中的情况有(A ,B ),(A ,a ),(A ,b ),(A ,c ),(B ,a ),(B ,b ),(B ,c ),共7种.因此,至少有一人是“高个子”的概率是P =710.(2)由茎叶图知,有5名男志愿者身高在180 cm 以上(包括180 cm),身高分别为181 cm,182 cm,184 cm,187 cm,191 cm ;有2名女志愿者身高为180 cm 以上(包括180 cm),身高分别为180 cm,181 cm.抽出的2人用身高表示,则有(181,180),(181,181),(182,180),(182,181),(184,180),(184,181),(187,180),(187,181),(191,180),(191,181),共10种情况, 身高相差5 cm 以上的有(187,180),(187,181),(191,180),(191,181),共4种情况,故这2人身高相差5 cm 以上的概率为410=25.思维升华 概率统计解答题的主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,因此在复习该部分时,要在这些图表上下功夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法.某中学生物兴趣小组在学校生物园地种植了一批名贵树苗,为了解树苗生长情况,从这批树苗中随机测量了50棵树苗的高度(单位:厘米).把这些高度列成了如下的(1)在这批树苗中任取一棵,其高度在85厘米以上的概率大约是多少?(2)这批树苗的平均高度大约是多少?(计算时可以用组中值代替各组数据的平均值) (3)为了进一步获得研究资料,现从[40,50)组中移出一棵树苗,从[90,100]组中移出两颗树苗进行试验研究,则[40,50)组中的树苗A 和[90,100]组中的树苗C 同时被移出的概率是多少?解 (1)由已知,得高度在85厘米以上的树苗大约有6+4=10棵,则所求的概率大约为1050=15=0.2.(2)树苗的平均高度x≈45×2+55×3+65×14+75×15+85×12+95×450=3 69050=73.8(厘米).(3)依题意,记[40,50)组中的树苗分别为A 、B ,[90,100]组中的树苗分别为C 、D 、E 、F ,则所有的基本事件为ACD 、ACE 、ACF 、ADE 、ADF 、AEF 、BCD 、BCE 、BCF 、BDE 、BDF 、BEF ,共12个,满足A 、C 同时被移出的基本事件为ACD 、ACE 、ACF ,共3个,所以树苗A 和树苗C 同时被移出的概率P =312=0.25.题型三 概率与统计案例的综合应用例3 为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25”的概率;(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?思维启迪 列举基本事件时,要按照一定的顺序,才能不重不漏;根据公式求出线性回归方程后可计算|y ^-y |判断是否可靠.解 (1)所有的基本事件为(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共10个.设“m ,n 均不小于25”为事件A ,则事件A 包含的基本事件为(25,30),(25,26),(30,26),共3个. 所以P (A )=310.(2)由数据得,另3天的平均数x =12,y =27,3x y =972, 3x 2=432,∑i =13x i y i =977,∑i =13x 2i =434,所以b ^=977-972434-432=52,a ^=27-52×12=-3,所以y 关于x 的线性回归方程为y ^=52x -3.(3)依题意得,当x =10时,y ^=22,|22-23|<2;当x =8时,y ^=17,|17-16|<2,所以(2)中所得到的线性回归方程是可靠的.思维升华 建立具有相关关系的两个变量之间的线性回归方程,一般来说,选取的具有典型性的样本数据越多,建立的线性回归方程越好,但在具体问题中不一定把所收集到的样本数据都用上,用其中的一部分建立回归直线方程,用剩余的数据检验建立的回归方程的拟合程度,也是一个很好的统计方法.为了解大学生观看湖南卫视综艺节目“快乐大本营”是否与性别有关,一所大若该教师采用分层抽样的方法从50份问卷调查中继续抽查了10份进行重点分析,知道其中喜欢看“快乐大本营”的有6人. (1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关?说明你的理由; (3)已知喜欢看“快乐大本营”的10位男生中,A 1,A 2,A 3,A 4,A 5还喜欢看新闻,B 1,B 2,B 3还喜欢看动画片,C 1,C 2还喜欢看韩剧,现再从喜欢看新闻、动画片和韩剧的男生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率.(参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解 (1)由分层抽样知识知,喜欢看“快乐大本营”的同学有50×610=30人,故不喜欢看“快乐大本营”的同学有50-30=20人,于是可将列联表补充如下:(2)∵K 2=50×(20×15-10×5)30×20×25×25≈8.333>7.879.∴有99.5%的把握认为喜欢看“快乐大本营”与性别有关.(3)从喜欢看的10位男生中选出喜欢看韩剧、喜欢看新闻、喜欢看动画片的各1名,其一切可能的结果组成的基本事件共有N =5×3×2=30个,用M 表示“B 1,C 1不全被选中”这一事件,则其对立事件M 表示“B 1,C 1全被选中”这一事件,由于M 由(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1),(A 4,B 1,C 1),(A 5,B 1,C 1)5个基本事件组成,所以P (M )=530=16. 由对立事件的概率公式得P (M )=1-P (M )=1-16=56.1.现有编号分别为1,2,3,4,5的五道不同的政治题和编号分别为6,7,8,9的四道不同的历史题.甲同学从这九道题中一次性随机抽取两道题,每道题被抽到的概率是相等的,用符号(x ,y )表示事件“抽到的两道题的编号分别为x 、y ,且x <y ”. (1)问有多少个基本事件,并列举出来;(2)求甲同学所抽取的两道题的编号之和小于17但不小于11的概率. 解 (1)共有36个等可能的基本事件,列举如下:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9),(3,4),(3,5),(3,6),(3,7),(3,8),(3,9),(4,5),(4,6),(4,7),(4,8),(4,9),(5,6),(5,7),(5,8),(5,9),(6,7),(6,8),(6,9),(7,8),(7,9),(8,9).(2)记“甲同学所抽取的两道题的编号之和小于17但不小于11”为事件A . 则事件A 为“x ,y ∈{1,2,3,4,5,6,7,8,9},且x +y ∈[11,17),其中x <y ”, 由(1)可知事件A 共包含15个基本事件,列举如下:(2,9),(3,8),(3,9),(4,7),(4,8),(4,9),(5,6),(5,7),(5,8),(5,9),(6,7),(6,8),(6,9),(7,8),(7,9),共15个,所以P (A )=1536=512.即甲同学所抽取的两道题的编号之和小于17但不小于11的概率为512.2.(2012·福建)在等差数列{a n }和等比数列{b n }中,a 1=b 1=1,b 4=8,{a n }的前10项和S 10=55.(1)求a n 和b n ;(2)现分别从{a n }和{b n }的前3项中各随机抽取一项,写出相应的基本事件,并求这两项的值相等的概率.解 (1)设数列{a n }的公差为d ,数列{b n }的公比为q .依题意得S 10=10+10×92d =55,b 4=q 3=8,解得d =1,q =2,所以a n =n ,b n =2n -1.(2)分别从{a n }和{b n }的前3项中各随机抽取一项,得到的基本事件有9个:(1,1),(1,2),(1,4),(2,1),(2,2),(2,4),(3,1),(3,2),(3,4). 符合题意的基本事件有2个:(1,1),(2,2).故所求的概率P =29.3.以下茎叶图记录了甲、乙两组各四名同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植数总棵数为19的概率.(注:方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x为x 1,x 2,…,x n 的平均数)解 (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10. 所以平均数为x =8+8+9+104=354;方差为s 2=14[(8-354)2+(8-354)2+(9-354)2+(10-354)2]=1116.(2)记甲组四名同学为A 1、A 2、A 3、A 4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B 1、B 2、B 3、B 4,他们植树的棵数依次为9、8、9、10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是 (A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4), (A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4), (A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4), (A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4).用C 表示“选出的两名同学的植树总棵数为19”这一事件,则C 中的结果有4个,它们是(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2),故所求概率为P (C )=416=14.4.(2013·课标全国Ⅱ)经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X (单位: t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率. 解 (1)当X ∈[100,130)时,T =500X -300(130-X )=800X -39 000. 当X ∈[130,150]时, T =500×130=65 000.所以T =⎩⎪⎨⎪⎧800X -39 000,100≤X <130,65 000,130≤X ≤150.(2)由(1)知利润T 不少于57 000元当且仅当120≤X ≤150.由直方图知需求量X ∈[120,150]的频率为0.7,所以下一个销售季度内的利润T 不少于57 000元的概率的估计值为0.7.5.某校高三某班的一次数学周练成绩(满分为100分)的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题:(1)求分数在[50,60)的频率及全班人数;(2)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高; (3)若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[90,100]之间的概率. 解 (1)分数在[50,60)的频率为0.008×10=0.08,由茎叶图知:分数在[50,60)之间的频数为2,=25.所以全班人数为20.08(2)分数在[80,90)之间的频数为25-2-7-10-2=4;频率分布直方图中[80,90)间的矩形的高为425÷10=0.016.(3)将[80,90)之间的4个分数编号为1,2,3,4,[90,100]之间的2个分数编号为5,6,在[80,100]之间的试卷中任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15个,其中,至少有一份在[90,100]之间的基本事件有9个,=0.6.故至少有一份分数在[90,100]之间的概率是9156.某班甲、乙两名同学参加100米达标训练,在相同条件下两人10次训练的成绩(单位:秒)(1)请画出茎叶图.如果从甲、乙两名同学中选一名参加学校的100米比赛,从成绩的稳定性方面考虑,选派谁参加比赛更好,并说明理由(不用计算,可通过统计图直接回答结论);(2)经过对甲、乙两位同学的若干次成绩的统计,甲、乙的成绩都均匀分布在[11.5,14.5]之间,现甲、乙比赛一次,求甲、乙成绩之差的绝对值小于0.8秒的概率.解(1)甲、乙两人10次训练的成绩的茎叶图:从统计图中可以看出,乙的成绩较为集中,差异程度较小,所以选派乙同学代表班级参加比赛更好.(2)设甲同学的成绩为x,乙同学的成绩为y,则|x-y|<0.8,得x-0.8<y<0.8+x,如图,阴影部分面积即为3×3-2.2×2.2=4.16,则P (|x -y |<0.8)=P(x -0.8<y<0.8+x)=4.163×3=104225.。
专题六 高考中的概率与统计问题1. (2021·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学考试中的成绩,五名男生的成绩别离为86,94,88,92,90,五名女生的成绩别离为88,93,93,88,93.以下说法必然正确的选项是( )A .这种抽样方式是一种分层抽样B .这种抽样方式是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数 答案 C 解析x 男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91,s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8, s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.2. 已知随机变量ξ服从正态散布N (2,σ2),且P (ξ<4)=0.8,那么P (0<ξ<2)等于( )A .0.6B .0.4C .0.3D .0.2 答案 C解析 ∵P (ξ<4)=0.8, ∴P (ξ>4)=0.2,由题意知图象的对称轴为直线x =2,P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.3. (2021·上海)设10≤x 1<x 2<x 3<x 4≤104,x 5=105.随机变量ξ1取值x 1、x 2、x 3、x 4、x 5的概率均为0.2,随机变量ξ2取值x 1+x 22、x 2+x 32、x 3+x 42、x 4+x 52、x 5+x 12的概率也均为0.2.假设记D (ξ1)、D (ξ2)别离为ξ1、ξ2的方差,那么( )A .D (ξ1)>D (ξ2)B .D (ξ1)=D (ξ2)C .D (ξ1)<D (ξ2)D .D (ξ1)与D (ξ2)的大小关系与x 1、x 2、x 3、x 4的取值有关 答案 A解析 E (ξ1)=0.2x 1+0.2x 2+0.2x 3+0.2x 4+0.2x 5 =0.2(x 1+x 2+x 3+x 4+x 5).E (ξ2)=0.2×x 1+x 22+0.2×x 2+x 32+…+0.2×x 5+x 12=0.2(x 1+x 2+x 3+x 4+x 5). ∴E (ξ1)=E (ξ2),记作x ,∴D (ξ1)=0.2[(x 1-x )2+(x 2-x )2+…+(x 5-x )2]=0.2[x 21+x 22+…+x 25+5x 2-2(x 1+x 2+…+x 5)x ]=0.2(x 21+x 22+…+x 25-5x 2).同理D (ξ2)=0.2⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫x 1+x 222+⎝ ⎛⎭⎪⎫x 2+x 322+…+⎝ ⎛⎭⎪⎫x 5+x 122-5x 2. ∵⎝ ⎛⎭⎪⎫x 1+x 222<x 21+x 222,…,⎝ ⎛⎭⎪⎫x 5+x 122<x 25+x 212. ∴⎝ ⎛⎭⎪⎫x 1+x 222+⎝ ⎛⎭⎪⎫x 2+x 322+…+⎝ ⎛⎭⎪⎫x 5+x 122<x 21+x 22+x 23+x 24+x 25.∴D (ξ1)>D ( ξ2).4. (2021·四川)节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮彼此独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒为距离闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是( )A.14B.12C.34D.78 答案 C解析 设在通电后的4秒钟内,甲串彩灯、乙串彩灯第一次亮的时刻为x 、y ,x 、y 彼此独立,由题意可知⎩⎪⎨⎪⎧0≤x ≤40≤y ≤4|x -y |≤2,如下图.∴两串彩灯第一次亮的时刻相差不超过2秒的概率为P (|x -y |≤2)=S 正方形-2S △ABC S 正方形=4×4-2×12×2×24×4=1216=34.5. (2021·重庆)某艺校在一天的6节课中随机安排语文、数学、外语三门文化课和其他三门艺术课各1节,那么在课表上的相邻两节文化课之间最多距离1节艺术课的概率为________(用数字作答). 答案 35解析 6节课随机安排,共有A 66=720(种)方式.课表上相邻两节文化课之间最多距离1节艺术课,分三类:第1类:文化课之间没有艺术课,有A 33·A 44=6×24=144(种).第2类:文化课之间有1节艺术课,有A 33·C 13·A 12·A 33=6×3×2×6=216(种). 第3类:文化课之间有2节艺术课,有A 33·A 23·A 22=6×6×2=72(种).共有144+216+72=432(种). 由古典概型概率公式得P =432720=35.题型一 求事件的概率例1 某项专业技术认证考试按科目A 和科目B 依次进行,只有当科目A 成绩合格时,才可继续参加科目B 的考试.已知每一个科目只许诺有一次补考机遇,两个科目成绩均合格方可取得证书,现某人参加这项考试,科目A 每次考试成绩合格的概率均为23,科目B 每次考试成绩合格的概率均为12,假设各次考试成绩合格与否互不阻碍.(1)求他不需要补考就可取得证书的概率.(2)在这项考试进程中,假设他不舍弃所有的考试机遇,求他别离参加2次、3次、4次考试的概率. 思维启发 准确地分析事件类型,正确地运用概率公式,是解决这种问题的关键.解 设“科目A 第一次考试合格”为事件A 1,“科目A 补考合格”为事件A 2,“科目B 第一次考试合格”为事件B 1,“科目B 补考合格”为事件B 2,那么A 1,A 2,B 1,B 2彼此独立. (1)设“不需要补考就可取得证书”为事件M , 则P (M )=P (A 1B 1)=P (A 1)P (B 1)=23×12=13.(2)设“参加考试次数为2次、3次、4次”别离为事件E ,C ,D .那么P (E )=P (A 1B 1+A 1 A 2) =P (A 1)P (B 1)+P (A 1)P (A 2)=23×12+13×13=49,P (C )=P (A 1B 1B 2+A 1B 1 B 2+A 1A 2B 1)=P (A 1)P (B 1)P (B 2)+P (A 1)P (B 1)P (B 2)+P (A 1)P (A 2)·P (B 1) =23×12×12+23×12×12+13×23×12=49, P (D )=P (A 1A 2B 1B 2+A 1A 2B 1 B 2)=P (A 1)P (A 2)P (B 1)P (B 2)+P (A 1)P (A 2)P (B 1)P (B 2) =13×23×12×12+13×23×12×12=19. (另解:P (D )=1-P (E ∪C )=1-P (E )-P (C )=1-49-49=19).思维升华 (1)一个复杂事件假设正面情形较多,反面情形较少,那么一样利用对立事件进行求解.尤其是涉及到“最多”、“至少”等问题时常经常使用这种方式求解.(2)求复杂事件的概率,要正确分析复杂事件的组成,看复杂事件是能转化为几个彼此互斥的事件的和事件仍是能转化为几个彼此独立事件同时发生的积事件,然后用概率公式求解.某校举行环保知识大奖赛,竞赛分初赛和决赛两部份,初赛采纳选手选一题答一题的方式进行,每位选手最多有5次选题答题的机遇,选手累计答对3题或答错3题即终止其初赛的竞赛,答对3题者直接进入决赛,答错3题者那么被淘汰.已知选手甲答题持续两次答错的概率为19(已知甲回答每一个问题的正确率相同,而且彼此之间没有阻碍). (1)求选手甲回答一个问题的正确率; (2)求选手甲可进入决赛的概率.解 (1)设选手甲答对一个问题的正确率为P 1, 那么(1-P 1)2=19, 应选手甲答对一个问题的正确率P 1=23.(2)选手甲答了3道题目进入决赛的概率为(23)3=827; 选手甲答了4道题目进入决赛的概率为C 23(23)2·13·23=827; 选手甲答了5道题目进入决赛的概率为C 24(23)2·(13)2·23=1681. ∴选手甲能够进入决赛的概率P =827+827+1681=6481.题型二 求离散型随机变量的均值与方差例2 李先生家在H 小区,他在C 科技园区工作,从家开车到公司上班有L 1,L 2两条线路(如图),线路L 1上有A 1,A 2,A 3三个路口,各路口碰到红灯的概率均为12;线路L 2上有B 1,B 2两个路口,各路口碰到红灯的概率依次为34,35.(1)假设走线路L 1,求最多碰到1次红灯的概率; (2)假设走线路L 2,求碰到红灯次数X 的数学期望;(3)依照“平均碰到红灯的次数最少”的要求,请你帮忙李先生分析上述两条线路中,选择哪条线路上班更好些,并说明理由.思维启发 走L 1或L 2碰到红灯的次数都是独立重复实验问题,可结合二项散布求其概率,选何条线路是要利用均值的大小判定.注意三个转化: (1)转化为P 3(1)+P 3(0)的值;(2)X 可取0,1,2转化为独立事件的积事件的概率; (3)转化为比较E (X )、E (Y )的大小.解 (1)设“走线路L 1最多碰到1次红灯”为事件A , 则P (A )=C 03×⎝ ⎛⎭⎪⎫123+C 13×12×⎝ ⎛⎭⎪⎫122=12.因此走线路L 1最多碰到1次红灯的概率为12.(2)依题意,知X 的可能取值为0,1,2.P (X =0)=⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-35=110,P (X =1)=34×⎝⎛⎭⎪⎫1-35+⎝ ⎛⎭⎪⎫1-34×35=920,P (X =2)=34×35=920.随机变量X 的散布列为X 0 1 2 P110920 920 因此E (X )=110×0+920×1+920×2=2720.(3)设选择线路L 1碰到红灯的次数为Y ,随机变量Y 服从二项散布,即Y ~B ⎝ ⎛⎭⎪⎫3,12,因此E (Y )=3×12=32.因为E (X )<E (Y ),因此选择线路L 2上班更好.思维升华 注意此题中独立重复实验与独立事件的区别,如走L 1是独立重复实验,而走L 2是一样地独立事件问题,不可按二项散布求均值.解决此类题目的关键是将实际问题转化为数学问题,正确明白得随机变量取每一个值所表示的具体事件,求得该事件发生的概率.(2021·福建)受轿车在保修期内维修费等因素的阻碍,企业生产每辆轿车的利润与该轿车第一次显现故障的时刻有关.某轿车制造厂生产甲、乙两种品牌轿车,保修期均为2年.现从该厂已售出的两种品牌轿车中各随机抽取50辆,统计数据如下:品牌甲 乙首次出现故障时间x (年) 0<x ≤1 1<x ≤2 x >20<x ≤2 x >2轿车数量(辆) 2 3 45 5 45 每辆利润(万元)1231.82.9将频率视为概率,解答以下问题:(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其第一次显现故障发生在保修期内的概率.(2)假设该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X 1,生产一辆乙品牌轿车的利润为X 2,别离求X 1,X 2的散布列.(3)该厂估量尔后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌的轿车.假设从经济效益的角度考虑,你以为应生产哪一种品牌的轿车?说明理由.解 (1)设“甲品牌轿车第一次显现故障发生在保修期内”为事件A ,那么P (A )=2+350=110.(2)依题意得,X 1的散布列为X 1 1 2 3 P125 350 910 X 2的散布列为X 2 1.8 2.9 P110 910 (3)由(2)得E (X 1)=1×125+2×350+3×910=14350=2.86(万元), E (X 2)=1.8×110+2.9×910=2.79(万元).因为E (X 1)>E (X 2),因此应生产甲品牌轿车. 题型三 概率与统计的综合应用例3 (2021·课标全国Ⅱ)经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.依照历史资料,取得销售季度内市场需求量的频率散布直方图,如下图.经销商为下一个销售季度购进了130 t 该农产品.以X (单位: t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润. (1)将T 表示为X 的函数;(2)依照直方图估量利润T 很多于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:假设需求量X ∈[100,110),那么取X =105,且X =105的概率等于需求量落入[100,110)的频率).求T 的数学期望.思维启发 利润T 是由两部份组成的,一个是取得利润,另一个是亏损,是不是亏损与x 的取值范围有关,因此,T 关于x 的函数要用分段函数表示. 解 (1)当X ∈[100,130)时,T =500X -300(130-X )=800X -39 000.当X ∈[130,150]时,T =500×130=65 000.因此T =⎩⎪⎨⎪⎧800X -39 000,100≤X <130,65 000,130≤X ≤150.(2)由(1)知利润T 很多于57 000元当且仅当120≤X ≤150.由直方图知需求量X ∈[120,150]的频率为0.7,因此下一个销售季度内的利润T 很多于57 000元的概率的估量值为0.7.(3)依题意可得T 的散布列为T 45 000 53 000 61 000 65 000 P0.10.20.30.4因此E (T )=45 000×0.1+53 000×0.2+61 000×0.3+65 000×0.4=59 400.思维升华 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分表现了概率与统计的工具性和交汇性.统计以考查抽样方式、样本的频率散布、样本特点数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意明白得实际问题的意义,使之和相应的概率计算对应起来,只有如此才能有效地解决问题.以下茎叶图记录了甲、乙两组各四名同窗的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)若是X =8,求乙组同窗植树棵数的平均数和方差;(2)若是X =9,别离从甲、乙两组中随机选取一名同窗,求这两名同窗的植树总棵树Y 的散布列和数学期望. (注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解 (1)当X =8时,由茎叶图可知,乙组同窗的植树棵数是8,8,9,10,因此平均数 x =8+8+9+104=354;方差s 2=14[(8-354)2+(8-354)2+(9-354)2+(10-354)2]=1116. (2)当X =9时,由茎叶图可知,甲组同窗的植树棵数是9,9,11,11;乙组同窗的植树棵数是9,8,9,10.别离从甲、乙两组中随机选取一名同窗,共有4×4=16(种)可能的结果,这两名同窗植树总棵数Y 的可能取值为17,18,19,20,21.事件“Y =17”等价于“甲组选出的同窗植树9棵,乙组选出的同窗植树8棵”,因此该事件有2种可能的结果,因此P (Y =17)=216=18.同理可得P (Y =18)=14,P (Y =19)=14,P (Y =20)=14,P (Y =21)=18.因此随机变量Y 的散布列为E (Y )=17×18+18×14+19×14+20×4+21×8=19.(时刻:80分钟)1. (2021·广东)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如下图,其中茎为十位数,叶为个位数.(1)依照茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.依照茎叶图推断该车间12名工人中有几名优秀工人? (3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率.解 (1)样本平均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人占的比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.(3)设事件A :“从该车间12名工人中,任取2人,恰有1名优秀工人”,那么P (A )=C 14C 18C 212=1633.2. 在10件产品中,有3件一等品,4件二等品,3件三等品.从这10件产品中任取3件,求:(1)掏出的3件产品中一等品件数X 的散布列和数学期望; (2)掏出的3件产品中一等品件数多于二等品件数的概率.解 (1)由于从10件产品中任取3件的结果数为C 310,从10件产品中任取3件,其中恰有k 件一等品的结果数为C k 3C 3-k 7(k =0,1,2,3),那么从10件产品中任取3件,其中恰有k 件一等品的概率为P (X =k )=C k 3C 3-k 7C 310,k =0,1,2,3.因此随机变量X 的散布列是X 的数学期望E (X )=0×724+1×40+2×40+3×120=10. (2)设“掏出的3件产品中一等品件数多于二等品件数”为事件A ,“恰好掏出1件一等品和2件三等品”为事件A 1,“恰好掏出2件一等品”为事件A 2,“恰好掏出3件一等品”为事件A 3,由于事件A 1,A 2,A 3彼此互斥,且A =A 1∪A 2∪A 3,而P (A 1)=C 13C 23C 310=340.P (A 2)=P (X =2)=740.P (A 3)=P (X =3)=1120,因此掏出的3件产品中一等品件数多于二等品件数的概率为P (A )=P (A 1)+P (A 2)+P (A 3)=340+740+1120=31120.3. 甲、乙两人参加某电视台举行的答题闯关游戏,依照规那么,甲先从6道备选题中一次性抽取3道题独立作答,然后由乙回答剩余3题,每人答对其中2题就停止答题,即闯关成功.已知在6道备选题中,甲能答对其中的4道题,乙答对每道题的概率都是23.(1)求甲、乙至少有一人闯关成功的概率; (2)设甲答对题目的个数为ξ,求ξ的散布列.解 (1)设甲、乙闯关成功别离为事件A ,B ,那么P (A )=C 14C 22C 36=420=15,P (B )=(1-23)3+C 23(1-23)2(23)1 =127+29=727, 那么甲、乙至少有一人闯关成功的概率是1-P (A B )=1-P (A )P (B )=1-15×727=128135.(2)由题意知ξ的可能取值是1,2.P (ξ=1)=C 14C 22C 36=15,P (ξ=2)=C 24C 12+C 34C 36=45,则ξ的散布列为4. )的频率散布直方图.(1)求直方图中x 的值;(2)假设将频率视为概率,从那个城市随机抽取3位居民(看做有放回的抽样),求月均用水量在3至4吨的居民数X 的散布列和数学期望.解 (1)依题意及频率散布直方图知1×(0.02+0.1+x +0.37+0.39)=1,解得x =0.12. (2)由题意知,X ~B (3,0.1).因此P (X =0)=C 03×0.93=0.729,P (X =1)=C 13×0.1×0.92=0.243,P (X =2)=C 23×0.12×0.9=0.027, P (X =3)=C 33×0.13=0.001.故随机变量X 的散布列为X 0 1 2 3 P0.7290.2430.0270.001X 的数学期望为E (X )=3×0.1=0.3.5. 某市公租房的房源位于A 、B 、C 三个片区.设每位申请人只申请其中一个片区的房源,且申请其中任一个片区的房源是等可能的,求该市的任4位申请人中: (1)恰有2人申请A 片区房源的概率;(2)申请的房源所在片区的个数ξ的散布列与期望.解 (1)方式一 所有可能的申请方式有34种,恰有2人申请A 片区房源的申请方式有C 24·22种,从而恰有2人申请A 片区房源的概率为C 24·2234=827.方式二 设对每位申请人的观看为一次实验,这是4次独立重复实验. 记“申请A 片区房源”为事件A ,那么P (A )=13.从而,由独立重复实验中事件A 恰发生k 次的概率计算公式知,恰有2人申请A 片区房源的概率为P 4(2)=C 24⎝ ⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827. (2)ξ的所有可能值为1,2,3.又P (ξ=1)=334=127,P (ξ=2)=C 23C 12C 34+C 24C 2234=1427⎝⎛⎭⎪⎫或P ξ=2=C 2324-234=1427, P (ξ=3)=C 13C 24C 1234=49⎝⎛⎭⎪⎫或P ξ=3=C 24A 3334=49.综上知,ξ的散布列为ξ 1 2 3 P127142749从而有E (ξ)=1×127+2×1427+3×49=27.6. 一次考试共有12道选择题,每道选择题都有4个选项,其中有且只有一个是正确的.评分标准规定:“每题只选一个选项,答对得5分,不答或答错得零分”.某考生已确信有8道题的答案是正确的,其余题中:有两道题都可判定两个选项是错误的,有一道题能够判定一个选项是错误的,还有一道题因不睬解题意只好乱猜.请求出该考生: (1)得60分的概率;(2)所得分数ξ的散布列和数学期望.解 (1)设“可判定两个选项是错误的”两道题之一选对为事件A ,“有一道题能够判定一个选项是错误的”选对为事件B ,“有一道题不睬解题意”选对为事件C , ∴P (A )=12,P (B )=13,P (C )=14,∴得60分的概率为P =12×12×13×14=148.(2)ξ可能的取值为40,45,50,55,60. P (ξ=40)=12×12×23×34=18;P (ξ=45)=C 12×12×12×23×34+12×12×13×34+12×12×23×14=1748; P (ξ=50)=12×12×23×34+C 12×12×12×13×34+C 12×12×12×23×14+12×12×13×14=1748;P (ξ=55)=C 12×12×12×13×14+12×12×23×14+12×12×13×34=748; P (ξ=60)=12×12×13×14=148.ξ的散布列为E (ξ)=40×18+45×1748+50×48+55×48+60×48=12.。
专题61统计与概率综合练习一、选择题:本题共8小题,每小题5分,共40分。
在每小题给出的四个选项中,只有一项是符合题目要求的。
1.小明在学校里学习了二十四节气歌后,打算在网上搜集一些与二十四节气有关的古诗,他准备在冬季的6个节气:立冬、小雪、大雪、冬至、小寒、大寒与春季的6个节气:立春、雨水、惊蛰、春分、清明、谷雨中一共选出4个节气,搜集与之相关的古诗,如果冬季节气和春季节气各至少被选出1个,那么小明选取节气的不同情况的种数是()。
A、345B、465C、1620D、1860【答案】B【解析】根据题意可知,小明可以选取1冬3春、2冬2春、3冬1春,故小明选取节气的不同情况有:+ + 465(种),故选B。
2.由(V3.X + V2)100展开所得的x的多项式中,系数为有理数的共有()。
A、50 项B、17 项C、16 项D、15 项【答案】B1【解析】(妊+扼)1。
=350x(1+年)1。
,32r r依题意只须宓与技同时为整数,且0 <r〈100, ... r为6的倍数,由r为6的倍数,[―]=16及r = 0, .I系数为有理数的共有17项,故选B。
63.已知p、q均为整数,且p、q G [-1,1],则方程x2 + px + ^ = 0有一正一负两根的概率为()o【答案】C【解析】P 、0 的组合有(-1,-1) > (—1,0)、(—1,1)、(0,-1) > (0,0)、(0,1)、(1,-1) > (1,0)、(1,1) 9 种可能,又方程/ + px + q =。
有一正一负两根的要求为△>()且q<0 , 满足这样的p 、q 的组合为(―1,—1)、(0,-1) > (1,-1)共3种,故选C 。
4.两枚均匀的骰子一起投掷,记事件A = {至少有一枚骰子6点向上}, 8 = {两枚骰子都是6点向上},则P(B|A) = ( )o【答案】B【解析】至少有一枚骰子6点向上的概率为l--x- = —,两枚骰子都是6点向上的概率为LxL =〕-,6 6 36 6 6 36上故至少有一枚骰子6点向上的条件下,另一枚骰子也是6点向上的概率是普=土,故选B 。
高考专题突破六 高考中的概率与统计问题题型一 随机事件的概率例1 某社区举办“环保我参与”有奖问答比赛活动,某场比赛中,甲、乙、丙三个家庭同时回答一道有关环保知识的问题.已知甲家庭回答正确这道题的概率是34,甲、丙两个家庭都回答错误的概率是112,乙、丙两个家庭都回答正确的概率是14.若各家庭回答是否正确互不影响.(1)求乙、丙两个家庭各自回答正确这道题的概率;(2)求甲、乙、丙三个家庭中不少于2个家庭回答正确这道题的概率.解 (1)记“甲家庭回答正确这道题”“乙家庭回答正确这道题”“丙家庭回答正确这道题”分别为事件A ,B ,C ,则P (A )=34,且有⎩⎨⎧P (A )·P (C )=112,P (B )·P (C )=14,即⎩⎨⎧[1-P (A )]·[1-P (C )]=112,P (B )·P (C )=14,所以P (B )=38,P (C )=23.(2)有0个家庭回答正确的概率为 P 0=P (A B C )=P (A )·P (B )·P (C ) =14×58×13=596, 有1个家庭回答正确的概率为 P 1=P (A B C +A B C +A B C ) =P (A B C )+P (A B C )+P (A B C )=P (A )·P (B )·P (C )+P (A )·P (B )·P (C )+P (A )·P (B )·P (C ) =34×58×13+14×38×13+14×58×23=724,所以不少于2个家庭回答正确这道题的概率为P=1-P0-P1=1-596-724=2132.思维升华随机事件的概率求解策略(1)对复杂的随机事件表示成互斥事件的和,独立事件的积;(2)利用概率的性质进行计算.跟踪训练1(1)(2020·上海市七宝中学模拟)通过手机验证码登录哈啰单车App,验证码由四位数字随机组成,如某人收到的验证码(a1,a2,a3,a4)满足a1<a2<a3<a4,则称该验证码为递增型验证码,某人收到一个验证码,那么是首位为2的递增型验证码的概率为________.答案1 6解析∵a1=2,2<a2<a3<a4,∴a2,a3,a4从3~9中选,只要选出3个数,让其按照从小到大的顺序排列,分别对应a2,a3,a4即可,∴P=C37C410=1 6.(2)(2020·福建省安溪一中、养正中学、惠安一中联考)世卫组织就新型冠状病毒感染的肺炎疫情称,新型病毒可能造成“持续人传人”.通俗点说就是存在A传B,B又传C,C又传D,这就是“持续人传人”.那么A,B,C就会被称为第一代、第二代、第三代传播者.假设一个身体健康的人被第一代、第二代、第三代传播者感染的概率分别为0.9,0.8,0.7,健康的小明参加了一次多人宴会,事后知道,参加宴会的人有5名第一代传播者,3名第二代传播者,2名第三代传播者,试计算,小明参加聚会,仅和感染的10个人其中一个接触,感染的概率为________.答案0.83解析设事件A,B,C为第一代、第二代、第三代传播者接触,事件D为小明被感染,由已知得:P(A)=0.5,P(B)=0.3,P(C)=0.2,P(D|A)=0.9,P(D|B)=0.8,P(D|C)=0.7,P(D)=P(D|A)P(A)+P(D|B)P(B)+P(D|C)P(C)=0.9×0.5+0.8×0.3+0.7×0.2=0.83.所以小明参加聚会,仅和感染的10个人其中一个接触,感染的概率为0.83.题型二 离散型随机变量及其分布列例2 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:支付金额(元)支付方式(0,1 000] (1 000,2 000]大于2 000 仅使用A 18人 9人 3人 仅使用B10人14人1人(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率; (2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于 1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D +C D )=P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为X 0 1 2 P0.240.520.24[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A 的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P (E )=1C 330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化. 答案示例2:无法确定有没有变化,理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母. 第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值. 第四步:作出判断得结论,依据题意,借助数表作出正确判断. 第五步:反思回顾,查看关键点、易错点和答题规范性.跟踪训练2 某项大型赛事需要从高校选拔青年志愿者,某大学学生实践中心积极参与,在8名学生会干部(其中男生5名,女生3名)中选3名参加志愿者服务活动.若所选3名学生中的女生人数为X ,求X 的分布列及均值.解 因为8名学生会干部中有5名男生,3名女生,所以X 服从参数N =8,M =3,n =3的超几何分布.X 的所有可能取值为0,1,2,3,其中P (X =i )=C i 3C 3-i5C 38(i =0,1,2,3).由公式可得P (X =0)=C 03C 35C 38=528,P (X =1)=C 13C 25C 38=1528,P (X =2)=C 23C 15C 38=1556,P (X =3)=C 33C 05C 38=156.所以X 的分布列为X 0 1 2 3 P52815281556156所以X 的均值为E (X )=0×528+1×1528+2×1556+3×156=6356=98.题型三 用样本估计总体例3 (2021·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90. ①分别求5个年龄组和5个职业组成绩的平均数和方差;②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x =0.05,∴x =120.(2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5, ∴a =953≈32,则中位数为32.(3)①5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可). 思维升华 用样本估计总体的类型 (1)总体取值规律、总体百分位数; (2)总体的集中趋势,总体的离散程度.跟踪训练3 (2021·佛山模拟)寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种精品的销售数据.已知摊位租金900元/档,售余精品可以进货价退回厂家. (1)求表中10个销售数据的中位数和平均数;(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的精品,其中甲、乙分别承包白天、晚上的精品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理? 解 (1)中位数为43+462=44.5,平均数为35+46+32+42+43+50+39+52+51+6010=45.(2)由题意知,今年花市期间该摊位所售精品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担. 今年白天的平均销售量为35+32+43+39+515=40(件/天),今年晚上的平均销售量为46+42+50+52+605=50(件/天),所以甲同学应分担的租金为900×4040+50=400(元), 乙同学应分担的租金为900×5040+50=500(元). (注:本小题也可直接按白天、晚上的总销售量比例分摊租金.)题型四 统计模型例4 (1)(2020·蚌埠质检)用模型y =c e kx 拟合一组数据时,为了求出经验回归方程,设z =ln y ,其变换后得到线性经验回归方程为z ^=0.3x +2,则c 等于( ) A .e 2 B .e 4 C .2 D .4 答案 A解析 z =ln y =ln(c e kx )=ln c +ln e kx =kx +ln c =0.3x +2, ∴ln c =2 即c =e 2.(2)(2020·新高考全国Ⅰ,改编)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和SO 2浓度(单位:μg/m 3),得下表:SO 2PM 2.5[0,50] (50,150] (150,475][0,35] 32 18 4 (35,75] 6 8 12 (75,115]3710①估计事件“该市一天空气中PM 2.5浓度不超过75,且SO 2浓度不超过150”的概率; ②根据所给数据,完成下面的2×2列联表:SO 2PM 2.5[0,150] (150,475][0,75] (75,115]③根据②中的列联表,判断在犯错误的概率不超过1%的前提下,能否认为该市一天空气中PM 2.5浓度与SO 2浓度有关? 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),α=P (χ2≥k )0.0500.0100.001k 3.841 6.63510.828解①由表格可知,该市100天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的天数为32+6+18+8=64,所以该市一天中,空气中的PM2.5浓度不超过75,且SO2浓度不超过150的概率的估计值为64100=0.64.②由所给数据,可得2×2列联表:SO2PM2.5[0,150](150,475][0,75]6416(75,115]1010③根据2×2列联表中的数据可得χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=100×(64×10-16×10)2 80×20×74×26≈7.484>6.635,故在犯错误的概率不超过1%的前提下,可以认为该市一天空气中PM2.5浓度与SO2浓度有关.思维升华成对数据的统计分析包括:(1)成对数据的相关性,主要是建立一元线性回归模型;(2)独立性检验:通过计算随机变量χ2的值,推断两个分类变量是否有关系.跟踪训练4(2020·济宁模拟)下面给出了根据我国2012年~2018年水果人均占有量y (单位:kg)和年份代码x绘制的散点图和线性经验回归方程的残差图(2012年~2018年的年份代码x 分别为1~7).(1)根据散点图分析y与x之间的相关关系;(2)根据散点图相应数据计算得∑i =17y i =1 074,∑i =17x i y i =4 517,求y 关于x 的回归直线方程;(3)根据线性回归方程的残差图,分析回归直线方程的拟合效果.(只写出结论) 附:回归直线方程y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x)2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解 (1)由散点图可以看出,点大致分布在某一直线的附近,且当x 由小变大时,y 也由小变大,从而y 与x 之间是正相关关系.(2)由题中数据可得x =17(1+2+3+4+5+6+7)=4,y =17×1 074=1 0747,从而b ^=∑i =17x i y i -7x ·y∑i =17x 2i -7x2= 4 517-7×17×1 074×412+22+32+42+52+62+72-7×42=22128, a ^=y -b ^x =1 0747-22128×4=8537, 从而所求y 关于x 的回归直线方程为y ^=22128x +8537.(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.。