21版:高考专题突破六 高考中的概率与统计问题(步步高)
- 格式:docx
- 大小:259.80 KB
- 文档页数:10
§5.4统计与概率的应用学习目标 1.能用随机模拟的方法进行估计.2.了解游戏的公平性和遗传性问题中的概率.3.能借助概率对实际问题进行决策.知识点概率的应用概率是描述随机事件发生可能性大小的度量,它已经渗透到人们的日常生活中,成为一个常用的词汇,任何事件的概率是0~1(包含0,1)之间的一个数,它度量该事件发生的可能性.小概率事件(概率接近0)很少发生,而大概率事件(概率接近1)则经常发生.1.事件A发生的概率很小时,该事件为不可能事件.(×)2.某医院治愈某种病的概率为0.8,则10个人去治疗,一定有8人能治愈.(×)3.平时的多次比赛中,小明获胜的次数比小华的高,所以这次比赛应选小明参加.(√)一、统计在实际问题中的应用例1某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2) [0.2,0.3) [0.3,0.4) [0.4,0.5) [0.5,0.6) [0.6,0.7) 频数1324926 5使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2) [0.2,0.3)[0.3,0.4) [0.4,0.5)[0.5,0.6)频数15131016 5(1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)解(1)如图所示.(2)根据以上数据,该家庭使用节水龙头后50天中日用水量小于0.35 m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后,日用水量小于0.35 m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为x1=150×(0.05×1+0.15×3+0.25×2+0.35×4+0.45×9+0.55×26+0.65×5)=0.48.该家庭使用了节水龙头50天日用水量的平均数为x2=150×(0.05×1+0.15×5+0.25×13+0.35×10+0.45×16+0.55×5)=0.35.估计使用节水龙头后,一年可节省水(0.48-0.35)×365=47.45(m3).反思感悟频率分布直方图是考查数据收集和整理的常用依据,掌握频率分布直方图中常见数据的提取方法是解决此类问题的关键.跟踪训练1某销售公司为了解员工的月工资水平,从1 000位员工中随机抽取100位员工进行调查,得到如下的频率分布直方图:(1)试由此图估计该公司员工的月平均工资;(2)该公司的工资发放是以员工的营销水平为重要依据确定的,一般认为,工资低于4 500元的员工属于学徒阶段,没有营销经验,若进行营销将会失败;高于4 500元的员工属于成熟员工,进行营销将会成功.现将该样本按照“学徒阶段工资”“成熟员工工资”分成两层,进行分层抽样,从中抽出5人,在这5人中任选2人进行营销活动.活动中,每位员工若营销成功,将为公司赚得3万元,否则公司将损失1万元.在此次活动中公司收入多少万元的可能性最大?解 (1)估计该公司员工的月平均工资为0.000 1×1 000×2 000+0.000 1×1 000×3 000+0.000 2×1 000×4 000+0.000 3×1 000×5 000+0.000 2×1 000×6 000+0.000 1×1 000×7 000=4 700(元). (2)抽取比为5100=120,从工资在[1 500,4 500)内的员工中抽出100×(0.1+0.1+0.2)×120=2(人),设这两位员工分别为1,2;从工资在[4 500,7 500]内的员工中抽出100×(0.3+0.2+0.1)×120=3人,设这三位员工分别为A ,B ,C .从中任选2人,共有以下10种不同的等可能结果:(1,2),(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),(A ,B ),(A ,C ),(B ,C ).两人营销都成功,公司收入6万元,有以下3种不同的等可能结果:(A ,B ),(A ,C ),(B ,C ),概率为310;其中一人营销成功,一人营销失败,公司收入为2万元,有以下6种不同的等可能结果:(1,A ),(1,B ),(1,C ),(2,A ),(2,B ),(2,C ),概率为610=35; 两人营销都失败,公司损失2万元,有1种结果:(1,2),概率为110.∵110<310<35,∴公司收入2万元的可能性最大. 二、概率在整体估计中的应用例2 为了调查某野生动物保护区内某种野生动物的数量,调查人员某天逮到1 200只这种动物并做好标记后放回,经过一星期后,又逮到这种动物1 000只,其中做过标记的有100只,按概率的方法估算,保护区内约有多少只该种动物.解 设保护区内这种野生动物有x 只,假定每只动物被逮到的可能性是相同的,那么从这种野生动物中任逮一只,设事件A ={带有记号的动物},则由古典概型可知,P (A )=1 200x .第二次被逮到的1 000只中,有100只带有记号,即事件A 发生的频数m =100,由概率的统计定义可知P (A )≈1001 000=110,故1 200x ≈110,解得x ≈12 000.所以保护区内约有12 000只该种动物.(学生留)反思感悟 利用频率与概率的关系求未知量的步骤 (1)抽出m 个样本进行标记,设总体为未知量n ,则标记概率为mn .(2)随机抽取n 1个个体,出现其中m 1个被标记,则标记频率为m 1n 1.(3)用频率近似等于概率,建立等式m n ≈m 1n 1.(4)求得n ≈m ·n 1m 1.跟踪训练2 若10个鸡蛋能孵化出8只小鸡,根据此情况,估计某小鸡孵化厂20 000个鸡蛋大约能孵化出多少只小鸡?解 假定每个鸡蛋能孵化出小鸡的可能性是相等的,从中任选一个,记事件A ={鸡蛋能孵化出小鸡},此试验为古典概型,则P (A )=45.①设20 000个鸡蛋能孵化出小鸡m 只, 则P (A )≈m20 000,②由①②得m 20 000≈45,解得m ≈16 000.所以20 000个鸡蛋大约能孵化出16 000只小鸡. 三、概率在决策中的应用例3 A 地到火车站共有两条路径L 1和L 2,现随机抽取100位从A 地到火车站的人进行调查,调查结果如下:(1)试估计40分钟内不能赶到火车站的概率;(2)分别求通过路径L 1和L 2所用时间落在上表中各时间段内的频率;(3)现甲、乙两人分别有40分钟和50分钟时间用于赶往火车站,为了尽最大可能在允许的时间内赶到火车站,试通过计算说明,他们应如何选择各自的路径.解 (1)共调查了100人,其中40分钟内不能赶到火车站的有12+12+16+4=44(人), 用频率估计概率,可得所求概率为44100=0.44.(2)选择L 1的有60人,选择L 2的有40人,故由调查结果得所求各频率为(3)记事件A 1,A 2分别表示甲选择L 1和L 2时,在40分钟内赶到火车站; 记事件B 1,B 2分别表示乙选择L 1和L 2时,在50分钟内赶到火车站. 由(2)知P (A 1)=0.1+0.2+0.3=0.6,P (A 2)=0.1+0.4=0.5,P (A 1)>P (A 2), ∴甲应选择L 1;P (B 1)=0.1+0.2+0.3+0.2=0.8, P (B 2)=0.1+0.4+0.4=0.9, P (B 2)>P (B 1), ∴乙应选择L 2.反思感悟 概率在决策问题中的应用(1)由于概率反映了随机事件发生的可能性的大小,概率是频率的近似值与稳定值,所以可以用样本出现的频率近似地估计总体中该结果出现的概率.(2)实际生活与生产中常常用随机事件发生的概率来做出更有利的决策.跟踪训练3 某地政府准备对当地的农村产业结构进行调整,为此政府进行了一次民意调查.100个人接受了调查,要求他们在赞成调整、反对调整、对这次调整不发表看法中任选一项.调查结果如下表所示:男 女 总计 赞成 18 9 27 反对 12 25 37 不发表看法20 16 36 总计5050100随机选取一个被调查者,他对这次调整表示反对或不发表看法的概率是多少? 解 用A 表示事件“对这次调整表示反对”,B 表示“对这次调整不发表看法”, 由互斥事件的概率加法公式,得P (A +B )=P (A )+P (B )=37100+36100=73100=0.73,因此随机选取一个被调查者,他对这次调整表示反对或不发表看法的概率是0.73.1.从某批零件中随机抽出40个检查,发现合格产品有36个,则该批产品的合格率为( ) A .36% B .72% C .90% D .25% 答案 C解析 用样本的合格率近似代替总体的合格率为3640×100%=90%.2.从甲、乙、丙、丁4名选手中选取2人组队参加奥林匹克竞赛,其中甲被选中的概率为( ) A.13 B.12 C.23 D.35答案 B解析 这个试验的样本空间Ω={(甲,乙),(甲,丙),(甲,丁),(乙,丙),(乙,丁),(丙,丁)},其中甲被选中包含3个样本点, 故甲被选中的概率为12.3.为了了解我国机动车的所有人缴纳车船使用税的情况,调查部门在某大型停车场对机动车的所有人进行了如下的随机调查:向被调查者提出三个问题:(1)你的车牌号码的最后一位是奇数吗?(2)你缴纳了本年度的车船使用税吗?(3)你的家庭电话号码的倒数第二位是偶数吗?调查人员给被调查者准备了一枚质地均匀的骰子,让被调查者背对调查人员掷一次骰子.如果出现一点或二点则回答第一个问题;如果出现三点或四点则回答第二个问题;如果出现五点或六点则回答第三个问题(被调查者不必告诉调查人员自己回答的是哪一个问题,只需回答“是”或“否”,所有人都如实做了回答).结果被调查的3 000人中1 200人回答了“否”,由此估计这3 000人中没有缴纳车船使用税的人数为( ) A .600 B .200 C .400 D .300 答案 A解析 因为骰子出现一点或二点、三点或四点、五点或六点的概率相等,都等于13,所以应有1 000人回答了第一个问题.因为车牌号码的最后一位数是奇数还是偶数的概率也是相等的,所以在这1 000人中应有500人的车牌号码是偶数,这500人都回答了“否”;同理也有1 000人回答了第三个问题,在这1 000人中有500人回答了“否”.因此在回答“否”的1 200人中约有200人是对第二个问题回答了“否”,根据用样本特征估计总体特征知识可知,在这3 000人中约有600人没有缴纳车船使用税.4.乘客在某电车站等候26路或16路电车,在该站停靠的有16,22,26,31四路电车,若各路电车先停靠的概率相等,则乘客等候的电车首先停靠的概率等于( ) A.12 B.13 C.23 D.34 答案 A解析 因为各路电车先停靠的概率都等于14,所以乘客等候的电车首先停靠的概率为14+14=12.5.鱼池中共有N 条鱼,从中捕出n 条并标上记号后放回池中,经过一段时间后,再从池中捕出M 条,其中有记号的有m 条,则估计鱼池中共有鱼N =________条. 答案nM m解析 由题意得n N ≈m M ,∴N ≈nMm.1.知识清单:(1)概率在决策问题中的作用. (2)概率在游戏公平中的作用.(3)概率在科学试验和日常生活中的应用. 2.方法归纳:数学建模.3.易错误区:不能将实际问题转化为统计与概率问题求解致误.。
高考专题突破六高考中的概率与统计问题题型一随机事件的概率例1 (12分)(2019·北京)改革开放以来,人们的支付方式发生巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校所有的1 000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:支付金额支付方式不大于2 000元大于2 000元仅使用A27人3人仅使用B24人1人(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2 000元的人数有变化?说明理由.规范解答解(1)由题意知,样本中仅使用A的学生有27+3=30(人),仅使用B的学生有24+1=25(人),A,B两种支付方式都不使用的学生有5人,[2分]故样本中A,B两种支付方式都使用的学生有100-30-25-5=40(人).估计该校学生中上个月A,B两种支付方式都使用的人数为40100×1 000=400.[4分](2)记事件C为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”,则P(C)=125=0.04.[8分](3)记事件E为“从样本仅使用B的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.假设样本仅使用B的学生中,本月支付金额大于2 000元的人数没有变化,则由(2)知,P(E)=0.04.[10分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分] 答案示例2:无法确定有没有变化,理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母. 第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值. 第四步:作出判断得结论,依据题意,借助数表作出正确判断. 第五步:反思回顾,查看关键点、易错点和答题规范性.跟踪训练 1 疫情爆发以来,相关疫苗企业发挥专业优势与技术优势争分夺秒开展疫苗研发.为测试疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),选定 2 000个样本分成三组,测试结果如下表:A 组B 组C 组 疫苗有效 673 x y 疫苗无效7790z已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. (1)求x ,y +z 的值;(2)现用分层抽样的方法在全体样本中抽取360个测试结果,求C 组应抽取多少个? (3)已知y ≥465,z ≥30,求疫苗能通过测试的概率.解 (1)∵在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. ∴x2 000=0.33,∴x =660, y +z =2 000-(673+77+660+90)=500. (2)应在C 组抽取的个数为360×5002 000=90.(3)由题意知疫苗有效需满足77+90+z ≤2 000×10%, 即z ≤33,C 组疫苗有效与无效的可能情况有(465,35),(466,34),(467,33),(468,32),(469,31),(470,30), 共6种结果,有效的可能情况有(467,33),(468,32),(469,31),(470,30), 共4种结果, ∴疫苗能通过测试的概率P =46=23.题型二 用样本估计总体例2 (2020·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.(1)求x ;(2)求抽取的x 人的年龄的中位数(结果保留整数);(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加“一带一路”知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90. ①分别求5个年龄组和5个职业组成绩的平均数和方差;②以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.解 (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,∴6x =0.05,∴x =120.(2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5, ∴a =953≈32,则中位数为32.(3)①5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15×[(-1)2+22+32+02+(-4)2]=6.5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15×[(-1)2+42+02+12+(-4)2]=6.8.②从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可). 思维升华 (1)注意频率分布直方图中平均数、中位数、众数的求法. (2)处理决策问题时,一般先比较平均数,若平均数相同,再比较方差.跟踪训练2 (2020·佛山模拟)寒假期间,很多同学都喜欢参加“迎春花市摆档口”的社会实践活动,下表是今年某个档口某种精品的销售数据.日期 2月14日2月15日2月16日2月17日2月18日销售量/件 白天35 32 43 39 51 晚上 4642505260已知摊位租金900元/档,售余精品可以进货价退回厂家. (1)求表中10个销售数据的中位数和平均数;(2)明年花市期间甲、乙两位同学想合租一个摊位销售同样的精品,其中甲、乙分别承包白天、晚上的精品销售,承包时间段内销售所获利润归承包者所有.如果其他条件不变,以今年的数据为依据,甲、乙两位同学应如何分担租金才较为合理? 解 (1)中位数为43+462=44.5,平均数为35+46+32+42+43+50+39+52+51+6010=45.(2)由题意知,今年花市期间该摊位所售精品的销售量与时间段有关,明年合租摊位的租金较为合理的分摊方法是根据今年的平均销售量按比例分担. 今年白天的平均销售量为35+32+43+39+515=40(件/天),今年晚上的平均销售量为46+42+50+52+605=50(件/天),所以甲同学应分担的租金为900×4040+50=400(元), 乙同学应分担的租金为900×5040+50=500(元). (注:本小题也可直接按白天、晚上的总销售量比例分摊租金.)题型三 回归分析与独立性检验例3 近年来,国资委、党委高度重视扶贫开发工作,坚决贯彻落实中央扶贫工作重大决策部署,在各个贫困县全力推进定点扶贫各项工作,取得了积极成效,某贫困县为了响应国家精准扶贫的号召,特地承包了一块土地,已知土地的使用面积以及相应的管理时间的关系如下表所示:土地使用面积x (单位:亩) 1 2 3 4 5 管理时间y (单位:月)810132524并调查了某村300名村民参与管理的意愿,得到的部分数据如下表所示:愿意参与管理不愿意参与管理男性村民15050(1)求y 关于x 的线性回归方程;(计算结果保留两位小数)(2)是否有99.9%的把握认为村民的性别与参与管理的意愿具有相关性?参考公式:b ^=∑ni =1 (x i -x )(y i -y )∑ni =1(x i -x )2,a ^=y -b ^x ,K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d . 临界值表:解 (1)依题意得,x =1+2+3+4+55=3,y =8+10+13+25+245=16,故∑5i =1(x i -x )(y i -y )=(-2)×(-8)+(-1)×(-6)+1×9+2×8=47, ∑5i =1(x i -x )2=4+1+1+4=10,则b ^=∑5i =1 (x i -x )(y i -y )∑5i =1(x i -x )2=4710=4.7, a ^=y -b ^x =16-4.7×3=1.9,所以y 关于x 的线性回归方程为y ^=4.7x +1.9. (2)依题意,女性不愿意参与管理的人数为50, 计算得K 2的观测值为k =300×(150×50-50×50)2200×100×200×100=300×5 000×5 000200×100×200×100=18.75>10.828,故有99.9%的把握认为村民的性别与参与管理的意愿具有相关性.思维升华 统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练3 (2020·济宁模拟)下面给出了根据我国2012年~2018年水果人均占有量y (单位:kg)和年份代码x 绘制的散点图和线性回归方程的残差图(2012年~2018年的年份代码x 分别为1~7).(1)根据散点图分析y 与x 之间的相关关系;(2)根据散点图相应数据计算得∑i =17y i =1 074,∑i =17x i y i =4 517,求y 关于x 的线性回归方程;(3)根据线性回归方程的残差图,分析线性回归方程的拟合效果.(只写出结论) 附:线性回归方程y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n (x i -x )(y i -y )∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x .解 (1)由散点图可以看出,点大致分布在某一直线的附近,且当x 由小变大时,y 也由小变大,从而y 与x 之间是正相关关系.(2)由题中数据可得x =17(1+2+3+4+5+6+7)=4,y =17×1 074=1 0747,从而b ^=∑i =17x i y i -7x ·y∑i =17x 2i -7x2= 4 517-7×1 0747×412+22+32+42+52+62+72-7×42=22128, a ^=y -b ^x =1 0747-22128×4=8537, 从而所求y 关于x 的线性回归方程为y ^=22128x +8537.(3)由残差图可以看出,残差对应的点均匀地落在水平带状区域内,且宽度较窄,说明拟合效果较好.课时精练1.(2020·南宁适应性测试)某电子商务平台的管理员随机抽取了1 000位上网购物者,并对其年龄(在10岁到69岁之间)进行了调查,统计情况如表所示.年龄 [10,20) [20,30) [30,40) [40,50) [50,60) [60,70) 人数100150a200b50已知[30,40),[40,50),[50,60)三个年龄段的上网购物的人数依次构成递减的等比数列. (1)求a ,b 的值;(2)若将年龄在[30,50)内的上网购物者定义为“消费主力军”,其他年龄段内的上网购物者定义为“消费潜力军”.现采用分层抽样的方式从参与调查的1 000位上网购物者中抽取5人,再从这5人中抽取2人,求这2人中至少有一人是消费潜力军的概率. 解 (1)由题意得⎩⎪⎨⎪⎧a +b =500,ab =40 000,a >b ,解得a =400,b =100.(2)由题意可知,在抽取的5人中,有3人是消费主力军,分别记为a 1,a 2,a 3,有2人是消费潜力军,分别记为b 1,b 2.记“这2人中至少有一人是消费潜力军”为事件A .从这5人中抽取2人所有可能的情况为(a 1,a 2),(a 1,a 3),(a 1,b 1),(a 1,b 2),(a 2,a 3),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),共10种.符合事件A 的有(a 1,b 1),(a 1,b 2),(a 2,b 1),(a 2,b 2),(a 3,b 1),(a 3,b 2),(b 1,b 2),共7种. 故所求概率为P (A )=710.2.某中学高一年级从甲、乙两个班级各选出7名学生参加学科测试,他们取得的成绩的茎叶图如图,其中甲班学生的平均分是85,乙班学生成绩的中位数是83.(1)求x 和y 的值,并计算甲班7位学生成绩的方差s 2;(2)从成绩在90分以上的学生中随机抽取两名学生,求至少有一名学生是甲班的概率. 解 (1)由题意知85×7=79+78+80+80+x +85+92+96,解得x =5. 又因为乙班学生成绩的中位数是83,所以y =3.s 2=17[(79-85)2+(78-85)2+(80-85)2+(85-85)2+(85-85)2+(92-85)2+(96-85)2]=40.(2)设甲班成绩在90分以上的学生为A ,B , 乙班成绩在90分以上的学生为C ,D ,E . 从成绩在90分以上的学生中随机抽取两名学生,共有AB ,AC ,AD ,AE ,BC ,BD ,BE ,CD ,CE ,DE,10种情况,其中至少有一名学生是甲班的学生共有7种情况,记“至少有一名学生是甲班的学生”为事件M ,则P (M )=710.3.(2019·全国Ⅲ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意 不满意 男顾客 40 10 女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).P (K 2≥k )0.050 0.010 0.001 k3.8416.63510.828解 (1)由调查数据,男顾客中对该商场服务满意的频率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的频率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6. (2)K 2的观测值k =100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.4.(2020·内江模拟)基于移动网络技术的共享单车被称为“新四大发明”之一,短时间内就风靡全国,给人们带来新的出行体验,某共享单车运营公司的市场研究人员为了了解公司的经营状况,对公司最近6个月的市场占有率y %进行了统计,结果如下表:(1)请用相关系数说明能否用线性回归模型拟合y 与月份代码x 之间的关系.如果能,请计算出y 关于x 的线性回归方程;如果不能,请说明理由;(2)根据调研数据,公司决定再采购一批单车扩大市场,从成本1 000元/辆的A 型车和800元/辆的B 型车中选购一种,两款单车使用寿命频数如下表:经测算,平均每辆单车每年能为公司带来500元收入,不考虑除采购成本以外的其他成本,假设每辆单车的使用寿命都是整数年,用频率估计每辆车使用寿命的概率,以平均每辆单车所产生的利润的估计值为决策依据,如果你是公司负责人,会选择采购哪款车型? 参考数据:∑i =16(x i -x )(y i -y )=35,∑i =16(x i -x )2=17.5,∑i =16(y i -y )2=76, 1 330≈36.5.参考公式:相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2,b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .解 (1)由表格中数据可得,x =3.5,y =16.∵r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x)2∑i =1n(y i -y )2=3517.5×76=351 330≈0.96.∴y 与月份代码x 之间具有较强的相关关系,故可用线性回归模型拟合两变量之间的关系.b ^=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=3517.5=2. ∴a ^=y -b ^x =16-2×3.5=9, ∴关于x 的线性回归方程为y ^=2x +9. (2)这100辆A 款单车平均每辆车的利润为1100(-500×10+0×30+500×40+1 000×20)=350(元), 这100辆B 款单车平均每辆车的利润为1100(-300×15+200×40+700×35+1 200×10)=400(元), ∴用频率估计概率,A 款单车与B 款单车平均每辆的利润估计值分别为350元、400元,应采购B 款车型.5.西尼罗河病毒(WNV)是一种脑炎病毒,WNV 通常是由鸟类携带,经蚊子传播给人类.1999年8-10月,美国纽约首次爆发了WNV 流行脑炎.在治疗上目前尚未有什么特效药可用,感染者需要采取输液及呼吸系统支持性疗法,有研究表明,大剂量的利巴韦林含片可抑制WNV 的复制,抑制其对细胞的致病作用.现某药企加大了利巴韦林含片的生产,为了提高生产效率,该药企负责人收集了5组实验数据,得到利巴韦林的投入量x (千克)和利巴韦林含片产量y (百盒)的统计数据如下:投入量x (千克) 1 2 3 4 5 产量y (百盒)1620232526由相关系数r 可以反映两个变量相关性的强弱,|r |∈[0.75,1],认为变量相关性很强;|r |∈[0.3,0.75),认为变量相关性一般;|r |∈[0,0.25],认为变量相关性较弱. (1)计算相关系数r ,并判断变量x ,y 相关性强弱;(2)根据上表中的数据,建立y 关于x 的线性回归方程y ^=b ^x +a ^;为了使某组利巴韦林含片产量达到150百盒,估计该组应投入多少利巴韦林? 参考数据:660≈25.69.参考公式:相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n (x i -x )2∑i =1n (y i -y )2,线性回归方程y ^=b ^x +a ^中,b ^=∑n i =1(x i -x )(y i -y ) ∑n i =1(x i -x )2, a ^=y -b ^x .解 (1)x =15×(1+2+3+4+5)=3,y =15×(16+20+23+25+26)=22, ∑5i =1(x i -x )(y i -y )=(1-3)×(16-22)+(2-3)×(20-22)+(3-3)×(23-22)+(4-3)×(25-22)+(5-3)×(26-22)=25, ∑5i =1(x i -x )2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,∑5i =1(y i -y )2=(16-22)2+(20-22)2+(23-22)2+(25-22)2+(26-22)2=66,则r =∑5i =1(x i -x )(y i -y )∑5i =1(x i -x )2∑5i =1(y i -y )2=25660≈0.97, 所以x 与y 具有很强的相关性.(2)由(1)得,b ^=∑5i =1 (x i -x )(y i -y )∑5i =1(x i -x )2=2510=2.5, a ^=y -b ^x =22-2.5×3=14.5,所以y 关于x 的线性回归方程为y ^=2.5x +14.5.当y =150时,x =54.2.故要使某组利巴韦林含片产量达到150百盒,估计该组应投入54.2千克利巴韦林.。
高考专题突破六高考中的概率与统计问题概率与统计的综合应用例1(2020·四川双流中学检测)甲、乙两品牌计划入驻某商场,该商场批准两个品牌先进场试销5天.两品牌提供的返利方案如下:甲品牌无固定返利,卖出10件以内(含10件)的产品,每件产品返利5元,超出10件的部分每件返利7元;乙品牌每天固定返利20元,且每卖出一件产品再返利3元.经统计,两家品牌在试销期间的销售件数的茎叶图如图:(1)现从乙品牌试销的5天中随机抽取3天,求这3天的销售量中至少有一天低于10的概率;(2)若将频率视作概率,回答以下问题:①记甲品牌的日返利额为X(单位:元),求X的分布列和均值;②商场拟在甲、乙两品牌中选择一个长期销售,如果仅从日返利额的角度考虑,请利用所学的统计学知识为商场作出选择,并说明理由.解 (1)方法一 设A 为从乙品牌试销售的5天中抽取3天,这3天的销量中至少有一天低于10件的事件,则P (A )=C 12C 23+C 22C 13C 35=910. 方法二 设A 为从乙品牌试销售的5天中抽取3天,这3天的销售量中至少有一天低于10件的事件,则A 为从乙品牌试销售的5天中抽取3天,这3天的销售量都不低于10件的事件, 则P (A )=1-P (A )=1-C 33C 35=1-110=910.(2)①设甲品牌的日销售量为随机变量ξ, 则甲品牌的日返利额X (单位:元)与ξ的关系为:X =⎩⎪⎨⎪⎧5ξ,0≤ξ≤10,ξ∈N ,50+7(ξ-10),ξ≥11,ξ∈N .当ξ=6时,X =30; 当ξ=7时,X =35; 当ξ=10时,X =50; 当ξ=12时,X =64. 所以X 的分布列为E (X )=30×25+35×15+50×15+64×15=41.8(元).②方法一 设乙品牌的日销售量为随机变量η,乙品牌的日返利额Y (单位:元)与η的关系为Y =20+3η,且η的分布列为则E(η)=6×15+9×15+12×25+13×15=10.4(件),则E(Y)=E(3η+20)=3E(η)+20=3×10.4+20=51.2(元).因为乙品牌的日平均返利额大于甲品牌的日平均返利额,所以如果仅从日返利额的角度考虑,商场应选择乙品牌长期销售.方法二乙品牌的日返利额Y(单位:元)的取值集合为{38,47,56,59},分布列为则E(Y)=38×15+47×15+56×25+59×15=51.2(元).思维升华概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.跟踪训练1(2020·四川成都诊断性检测)某保险公司给年龄在20~70岁的民众提供某种疾病的一年期医疗保险,现从10 000名参保人员中随机抽取100名作为样本进行分析,按年龄段[20,30),[30,40),[40,50),[50,60),[60,70]分成了五组,其频率分布直方图如图所示;参保年龄(单位:岁)与每人每年应交纳的保费(单位:元)如表所示.据统计,该公司每年为这10 000名参保人员支出的各种费用为一百万元.(1)用样本的频率分布估计总体分布,为使公司不亏本,求x精确到整数时的最小值x0;(2)经调查,年龄在[60,70]的老人每50人中有1人患该种疾病(以此频率作为概率).该种疾病的治疗费为12 000元,如果参保,保险公司补贴治疗费10 000元.某老人年龄为66岁,若购买该项保险(x取(1)中的x0),针对此疾病所支付的费用为X元;若没有购买该项保险,针对此疾病所支付的费用为Y元.试比较X和Y的均值大小,并判断该老人购买此项保险是否划算?解(1)由(0.007+0.016+a+0.025+0.020)×10=1,解得a=0.032.该保险公司每年收取的保费为10 000(0.007×10x+0.016×10×2x+0.032×10×3x+0.025×10×4x+0.020×10×5x)=10 000×3.35x.要使公司不亏本,则10 000×3.35x≥1 000 000,即3.35x≥100,解得x≥1003.35≈29.85,∴x0=30.(2)①若该老人购买了此项保险,则X 的取值为150,2 150.P (X =150)=4950,P (X =2 150)=150,∴E (X )=150×4950+2 150×150=147+43=190(元).②若该老人没有购买此项保险,则Y 的取值为0,12 000. P (Y =0)=4950,P (X =12 000)=150,∴E (Y )=0×4950+12 000×150=240(元).∴E (Y )>E (X ),∴该老人购买此项保险比较划算.概率与统计案例的综合应用例2 (2020·蓉城名校联盟联考)成都市现在已是拥有1 400多万人口的城市,机动车保有量已达450多万辆,成年人中约40%拥有机动车驾驶证.为了解本市成年人的交通安全意识情况,某中学的同学利用国庆假期进行了一次全市成年人安全知识抽样调查.先根据是否拥有驾驶证,用分层抽样的方法抽取了200名成年人,然后对这200人进行问卷调查.这200人所得的分数都分布在[30,100]范围内,规定分数在80以上(含80)的为“具有很强安全意识”,所得分数的频率分布直方图如图所示.(1)补全上面的2×2列联表,并判断能否有超过95%的把握认为“‘具有很强安全意识’与拥有驾驶证”有关?(2)将上述调查所得的频率视为概率,现从全市成年人中随机抽取4人,记“具有很强安全意识”的人数为X,求X的分布列及均值.附表及公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.解(1)200人中拥有驾驶证的占40%,有80人,没有驾驶证的有120人;具有很强安全意识的占20%,有40人,不具有很强安全意识的有160人.补全的2×2列联表如表所示:K 2的观测值k =200×(22×102-18×58)240×160×80×120=7516=4.687 5>3.841, 所以有超过95%的把握认为“‘具有很强安全意识’与拥有驾驶证”有关.(2)由频率分布直方图中数据可知,抽到的每个成年人“具有很强安全意识”的概率为15,所以X =0,1,2,3,4,且X ~B ⎝⎛⎭⎫4,15. P (X =k )=C k 4·⎝⎛⎭⎫15k ·⎝⎛⎭⎫454-k(k =0,1,2,3,4), X 的分布列为所以E (X )=4×15=45.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 (2020·四川成都检测)为了让税收政策更好地为社会发展服务,国家在修订《中华人民共和国个人所得税法》之后,发布了《个人所得税专项附加扣除暂行办法》,明确“个税专项附加扣除”是指个人所得税法规定的子女教育、继续教育、大病医疗、住房贷款利息、住房租金、赡养老人六项专项附加扣除,并公布了相应的定额扣除标准,决定自2019年1月1日起施行.某企业为了调查内部员工对新个税方案的满意程度与年龄的关系,通过问卷调查,整理数据得如下2×2列联表:(1)根据列联表,能否有99%的把握认为满意程度与年龄有关?(2)为了帮助年龄在40岁及以下的未购房的8名员工解决实际困难,该企业拟按员工贡献积分x (单位:分)给予相应的住房补贴y (单位:元),现有两种补贴方案,方案甲:y =1 000+700x ;方案乙:y =⎩⎪⎨⎪⎧3 000,0<x ≤5,5 600,5<x ≤10,9 000,x >10.已知这8名员工的贡献积分分别为2,3,6,7,7,11,12,12,将采用方案甲比采用方案乙获得更多补贴的员工记为“A 类员工”.为了解员工对补贴方案的认可度,现从这8名员工中随机抽取4名进行面谈,求恰好抽到3名“A 类员工”的概率. 附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d . 参考数据:解 (1)根据列联表可得K 2的观测值k =80×(25×30-10×15)235×45×40×40=807≈11.429.∵11.429>6.635,∴有99%的把握认为满意程度与年龄有关.(2)据题意,这8名员工的贡献积分及按甲、乙两种方案所获补贴情况为:由表可知,“A类员工”有5名.设从这8名员工中随机抽取4名进行面谈,恰好抽到3名“A类员工”的概率为P,则P=C35C13C48=37.均值与方差在决策中的应用例3(2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p),求f (p)的最大值点p0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验?解(1)20件产品中恰有2件不合格品的概率为f (p)=C220·p2(1-p)18.因此f′(p)=C220[2p(1-p)18-18p2(1-p)17]=2C220p(1-p)17(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f (p)的最大值点为p0=0.1.(2)由(1)知,p=0.1①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元.由于E(X)=490>400,故应该对余下的产品做检验.思维升华随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较均值,若均值相同,再由方差来决定.跟踪训练3有两种理财产品A和B,投资这两种理财产品一年后盈亏的情况如下(每种理财产品的不同投资结果之间相互独立):产品A产品B注:p >0,q >0.(1)若甲、乙两人分别选择了产品A ,B 投资,一年后他们中至少有一人获利的概率大于34,求实数p 的取值范围;(2)若丙要将20万元人民币投资其中一种产品,以一年后的投资收益的均值为决策依据,则丙选择哪种产品投资较为理想?解 (1)记事件C 为“甲选择产品A 投资且获利”,记事件D 为“乙选择产品B 投资且获利”,记事件E 为“一年后甲、乙两人中至少有一人投资获利”, 则P (C )=14,P (C )=34,P (D )=p ,p (D )=1-p ,P (E )=1-P (C D )=1-34(1-p )>34,∴p >23.又p +q =34,且q >0,∴p <34,∴23<p <34.即p 的取值范围是⎝⎛⎭⎫23,34. (2)假设丙选择A 产品投资,且记ξ为获利金额(单位:万元),则ξ的分布列为∴E (ξ)=10×14-6×13=12.假设丙选择B 产品投资,且记η为获利金额(单位:万元),则η的分布列为E (η)=8p -4q =8p -4⎝⎛⎭⎫34-p =12p -3⎝⎛⎭⎫0<p <34.∴当p =724时,E (ξ)=E (η),丙可在产品A 和产品B 中任选一种投资;当0<p <724时,E (ξ)>E (η),丙应选产品A 投资;当724<p <34时,E (ξ)<E (η),丙应选产品B 投资.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率; (2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人, 该学生上个月的支付金额大于1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.1.(2020·四川成都质检)2018年央视大型文化节目《经典咏流传》热播,在全民中掀起了诵读诗词的热潮.某大学社团调查了该校文学院300名学生每天诵读诗词的时间(所有学生诵读时间都在两小时内),并按时间(单位:min)将学生分成六个组:[0,20),[20,40),[40,60),[60,80),[80,100),[100,120],经统计得到了如图所示的频率分布直方图.(1)求频率分布直方图中a的值,并估计该校文学院的学生每天诵读诗词的平均时间;(2)若2名学生诵读诗词的时间分别为x,y.当x,y满足|x-y|>60时,这2名同学组成一个“Team”.已知从每天诵读时间小于20 min和大于或等于80 min的所有学生中用分层抽样的方法抽取5人,现从这5人中随机选取2人,求选取的2人能组成一个“Team”的概率.解(1)∵各组数据的频率之和为1,即所有小矩形的面积和为1,∴(a+a+6a+8a+3a+a)×20=1,解得a=0.002 5.∴该校文学院的学生每天诵读诗词的平均时间为10×0.05+30×0.05+50×0.3+70×0.4+90×0.15+110×0.05=64(min).(2)由频率分布直方图,知[0,20),[80,100),[100,120]内的学生人数的频率之比为1∶3∶1,故5人中[0,20),[80,100),[100,120]内的学生人数分别为1,3,1.方法一设[0,20)内的1名学生为A,[80,100)内的3名学生分别为B,C,D,[100,120]内的1名学生为E,则抽取2人的所有基本事件有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共10种.选取的2人能组成一个“Team”的情况有AB,AC,AD,AE,共4种,故选取的2人能组成一个“Team”的概率P=410=2 5.方法二由题意知,应从[0,20)内的学生抽取1人,从[80,120]内的学生抽取1人,故所求概率为C 11C 14C 25=25.2.(2020·贵州贵阳模拟)某大学毕业生准备到贵州非私营单位求职,为了了解工资待遇情况,他在贵州省统计局的官网上,查询到2008年至2017年非私营单位在岗职工的年平均工资近 似值(单位:万元),如下表:(1)请根据上表的数据,利用线性回归模型进行拟合,求y 关于x 的线性回归方程y ^=b ^x +a ^(a ^,b ^的计算结果根据四舍五入精确到小数点后第二位);(2)如果该大学生对年平均工资的期望值为9万元,请利用(1)的结论,预测2020年非私营单位在岗职工的年平均工资(单位:万元.计算结果根据四舍五入精确到小数点后第二位),并判断2020年平均工资能否达到他的期望.参考数据:∑i =110x i y i =311.5,∑i =110x 2i =385,∑i =110(x i -x )(y i -y )=47.5.附:对于一组具有线性相关的数据:(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b ^x +a ^的斜率和截距的最小二乘估计分别为b ^=∑i =1nx i y i -n x ·y∑i =1nx 2i -n x2=∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2,a ^=y -b ^x .解 (1)由已知,得x =5.5,y =4.8.b ^=∑i =110(x i -x )(y i -y )∑i =110x 2i -n ·x2=47.5385-10×5.52≈0.58, 所以a ^=y -b ^x =4.8-0.58×5.5=1.61, 故y 关于x 的线性回归方程为y ^=0.58x +1.61. (2)由(1)知y ^=0.58x +1.61,当x =13时,y ^=0.58×13+1.61=9.15>9.所以,预测2020年非私营单位在岗职工的年平均工资为9.15万元,达到了他的期望. 3.(2020·贵州贵阳模拟)运动健康已成为大家越来越关心的话题,某公司开发的一个类似计步数据库的公众号,手机用户可以通过关注该公众号查看自己每天行走的步数,同时也可以和好友进行运动量的PK 和点赞.现从张华的好友中随机选取40人(男、女各20人),记录他们某一天行走的步数,并将数据整理如下表:(1)若某人一天行走的步数超过8 000被评定为“积极型”,否则被评定为“懈怠型”,根据题意完成下列2×2列联表,若有n %(n ∈Z )的把握认为男、女的“评定类型”有差异,参考现有公式与数据,则n 可能的最大值为多少?(2)在张华的这40位好友中,从该天行走的步数超过10 000的人中随机抽取3人,设抽取的女性有X 人,求X 的分布列及均值E (X ). 参考公式与数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解 (1)由题意可得2×2列联表如下:K 2的观测值k =40×(13×12-7×8)220×20×21×19=1 000399≈2.506<2.706,所以85<n <90(n ∈Z ),因此n 可能的最大值为89. (2)该天行走步数超过10 000的有6男2女共8人,则X =0,1,2,P (X =0)=C 36C 38=514,P (X =1)=C 12C 26C 38=1528,P (X =2)=C 22C 16C 38=328,所以X 的分布列为所以E (X )=0×514+1×1528+2×328=34.4.东方商店欲购进某种食品(保质期两天),此商店每两天购进该食品一次(购进时,该食品为刚生产的).根据市场调查,该食品每份进价8元,售价12元,如果两天内无法售出,则食品过期作废,且两天内的销售情况互不影响,为了了解市场的需求情况,现统计该产品在本地区100天的销售量如表:(视样本频率为概率)(1)根据该产品100天的销售量统计表,记两天中一共销售该食品份数为ξ,求ξ的分布列与均值;(2)以两天内该产品所获得的利润均值为决策依据,东方商店一次性购进32或33份,哪一种得到的利润更大?解(1)ξ的可能取值有30,31,32,33,34,35,36,其中P(ξ=30)=0.2×0.2=0.04,P(ξ=31)=2×0.2×0.3=0.12,P(ξ=32)=0.3×0.3+2×0.2×0.4=0.25,P(ξ=33)=2×0.2×0.1+2×0.3×0.4=0.28,P(ξ=34)=0.4×0.4+2×0.3×0.1=0.22,P(ξ=35)=2×0.4×0.1=0.08,P(ξ=36)=0.1×0.1=0.01,∴ξ的分布列为∴E(ξ)=30×0.04+31×0.12+32×0.25+33×0.28+34×0.22+35×0.08+36×0.01=32.8.(2)当一次性购进32份食品时,设每两天的利润为X,则X的可能取值有104,116,128,且P(X=104)=0.04,P(X=116)=0.12,P(X=128)=1-0.04-0.12=0.84,∴E(X)=104×0.04+116×0.12+128×0.84=125.6.当一次性购进33份食品时,设每两天的利润为Y,则Y的可能取值有96,108,120,132.且P(Y=96)=0.04,P(Y=108)=0.12,P(Y=120)=0.25,P(Y=132)=1-0.04-0.12-0.25=0.59,∴E(Y)=96×0.04+108×0.12+120×0.25+132×0.59=124.68.∵E(X)>E(Y),∴东方商店一次性购进32份食品时得到的利润更大.5.为了解2019届高三毕业学生的复习备考情况,某省甲、乙两市组织了一次大联考.为比较两市本届高三毕业学生的数学优秀率,某教研机构从甲、乙两市参加大联考的数学高分段(数学成绩不低于100分)的学生中各随机抽取了100名学生,统计其数学成绩,得到甲市数学高分段学生成绩的频率分布直方图如图所示,乙市数学高分段学生成绩的频数分布表如下表所示(同一组数据用该组数据的区间中点值作代表,将频率视为概率).(1)现计算得甲市数学高分段学生成绩的平均分为123分,乙市数学高分段学生成绩的方差为111,试利用统计知识判断甲、乙两市哪一个市2019届高三毕业学生数学高分段成绩更突出;(2)由频率分布直方图可以认为,甲市这次大联考的数学高分段学生成绩Z(单位:分)近似地服从正态分布N (μ,σ2),其中μ近似为样本平均数,试利用该正态分布模型解决下列问题. ①若甲市恰有2万名学生这次大联考的数学成绩不低于100分,试估计甲市这次大联考的数学成绩Z 高于142.6分的学生人数;②现从甲市这次大联考的数学成绩不低于100分的学生中随机抽取1 000人,若抽到k 人的数学成绩在区间(123,142.6]内的可能性最大,试求整数k 的值. 附:若X ~N (μ,σ2),则P (μ-σ<X ≤μ+σ)≈0.682 7, P (μ-2σ<X ≤μ+2σ)≈0.954 5, P (μ-3σ<X ≤μ+3σ)≈0.997 3.解 (1)由题意得甲市数学高分段学生成绩的方差为s 2甲=(105-123)2×0.05+(115-123)2×0.4+(125-123)2×0.3+(135-123)2×0.2+(145-123)2×0.05=96,乙市数学高分段学生成绩的平均分为 x乙=105×0.15+115×0.25+125×0.4+135×0.15+145×0.05=122(分). 又x 甲=123,s 2乙=111,所以x 甲>x 乙,s 2甲<s 2乙.故甲市数学高分段学生成绩的平均分更高,且方差更小,故甲市数学高分段学生成绩更稳定. 综上可知甲市的2019届高三毕业学生数学高分段成绩更为突出.(2)①P (Z >142.6)=P (Z >μ+2σ)=12[1-P (μ-2σ<Z ≤μ+2σ)]≈12(1-0.954 5)=0.022 75.因为20 000×0.022 75=455,所以可估计甲市这次大联考的数学成绩Z 高于142.6分的学生有455人.②记所抽取的1 000人中数学成绩在区间(123,142.6]内的人数为Y , 因为P (123<Z ≤142.6)=P (μ<Z ≤μ+2σ)=P (μ-2σ<Z ≤μ+2σ)2≈0.477 25,所以Y ~B (1 000,0.477 25),故P (Y =k )=C k 1 000×0.477 25k ×0.522 751 000-k . 设P (Y =k )最大,则⎩⎪⎨⎪⎧ P (Y =k )≥P (Y =k +1),P (Y =k )≥P (Y =k -1)即⎩⎪⎨⎪⎧0.522 751 000-k ≥0.477 25k +1,0.477 25k≥0.522 751 001-k,解得476.727 25≤k ≤477.727 25.因为k ∈N *,所以使P (Y =k )取得最大值的整数k 的值为477.。
高考专题突破六 高考中的概率与统计问题概率与统计的综合应用例1 (2020·汉中模拟)槟榔原产于马来西亚,在中国主要分布在云南、海南及台湾等热带地区.槟榔是重要的中药材,在南方一些少数民族还将果实作为一种咀嚼嗜好品,但其被世界卫生组织国际癌症研究机构列为致癌物清单Ⅰ类致癌物.云南某民族中学为了解A ,B 两个少数民族班的学生咀嚼槟榔的情况,分别从这两个班中随机抽取5名学生进行调查,将他们平均每周咀嚼槟榔的颗数作为样本,绘制成如图所示的茎叶图(图中的茎表示十位数字,叶表示个位数字).(1)你能否估计哪个班的学生平均每周咀嚼槟榔的颗数较多?(2)在被抽取的10名学生中,从平均每周咀嚼槟榔的颗数不低于20颗的学生中随机抽取3名学生,求抽取B 班学生人数X 的分布列和均值.解 (1)A 班样本数据的平均值为15(9+11+14+20+31)=17,由此估计A 班学生平均每周咀嚼槟榔的颗数为17,B 班样本数据的平均值为15(11+12+21+25+26)=19,由此估计B 班学生平均每周咀嚼槟榔的颗数为19, 故估计B 班学生平均每周咀嚼槟榔的颗数较多. (2)∵平均每周咀嚼槟榔的颗数不低于20颗的学生中, A 班有2人,B 班有3人,共有5人, ∴X 的可能取值为1,2,3,P (X =1)=C 13C 22C 35=310,P (X =2)=C 23C 12C 35=35,P (X =3)=C 33C 02C 35=110,∴X 的分布列为X 1 2 3 P31035110∴E (X )=1×310+2×35+3×110=95.思维升华概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.跟踪训练1(2020·西安八校联考)从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值,由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.(1)求这些产品的质量指标值落在区间[75,85]内的频率;(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于[45,75)内的产品件数为X,求X的分布列与均值.解(1)设落在区间[75,85]内的频率为x,则落在区间[55,65),[65,75)内的频率分别为4x和2x,依题意得(0.004+0.012+0.019+0.030)×10+4x+2x+x=1,解得x=0.05.所以落在区间[75,85]内的频率为0.05.(2)从该企业生产的该种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X服从二项分布B(n,p),其中n=3.由(1)得,落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p=0.6.因为X的所有可能取值为0,1,2,3,则P(X=0)=C03×0.60×0.43=0.064,P(X=1)=C13×0.61×0.42=0.288,P(X=2)=C23×0.62×0.41=0.432,P(X=3)=C33×0.63×0.40=0.216,所以X的分布列为X 012 3P 0.0640.2880.4320.216所以X的均值为E(X)=0×0.064+1×0.288+2×0.432+3×0.216=1.8.(或直接根据二项分布的均值公式得到E(X)=np=3×0.6=1.8)概率与统计案例的综合应用例2(2020·华中师大附中模拟)中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中开设大学先修课程已有两年,两年共招收学生2 000人,其中有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有60人.这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试(满分100分),结果如表所示:分数a 95≤a≤10085≤a<9575≤a<8560≤a<75a<60人数20551057050 自招通过率0.90.80.60.50.4(1)填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?优等生非优等生总计学习大学先修课程没有学习大学先修课程总计(2)已知今年有150名学生报名学习大学先修课程,以前两年参加大学先修课程学习成绩的频率作为今年参加大学先修课程学习成绩的概率.①在今年参加大学先修课程的学生中任取一人,求他获得某高校自主招生通过的概率;②设今年全校参加大学先修课程的学生通过某高校自主招生考试人数为ξ,求E(ξ).参考数据:P(K2≥k0)0.150.100.050.0250.0100.005k0 2.072 2.706 3.841 5.024 6.6357.879参考公式:K 2=n (ad -bc )2(a +b )(c +b )(a +c )(b +d ),其中n =a +b +c +d解 (1)列联表如下:优等生 非优等生 总计 学习大学先修课程 60 240 300 没有学习大学先修课程140 1 560 1 700 总计2001 8002 000等高条形图如图:通过图形可判断学习先修课程与优等生有关系, 又K 2=2 000(60×1 560-140×240)2300×1 700×200×1 800≈39.216>6.635,因此在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系. (2)①P =20300×0.9+55300×0.8+105300×0.6+70300×0.5+50300×0.4=0.6.②设通过某高校自主招生考试的人数为ξ, 则ξ~B ⎝⎛⎭⎫150,35, P (x =k )=C k 150⎝⎛⎭⎫35k ⎝⎛⎭⎫25150-k ,k =0,1,2,…,150, 所以E (ξ)=150×35=90.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 (2019·洛阳模拟)某商场营销人员进行某商品M 市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到下表:返还点数t 1 2 3 4 5 销量(百件)/天0.50.611.41.7(1)经分析发现,可用线性回归模型拟合当地该商品销量y (百件)与返还点数t 之间的相关关系,请用最小二乘法求y 关于t 的线性回归方程y ^=b ^t +a ^,并预测若返还6个点时该商品每天的销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:①求这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);②将对返还点数的心理预期值在[1,3)和[11,13]的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望膨胀型”消费者的人数为随机变量X ,求X 的分布列及均值.参考公式及数据:b ^=∑i =1nt i y i -n t y∑i =1nt 2i -nt2,a ^=y -b ^t ;∑i =15t i y i =18.8. 解 (1)由题意知t =1+2+3+4+55=3,y =0.5+0.6+1+1.4+1.75=1.04,∑i =15t 2i =12+22+32+42+52=55, b ^=∑i =15t i y i -5t y∑i =15t 2i -5t2=18.8-5×3×1.0455-5×32=0.32,a ^=y -b ^t =1.04-0.32×3=0.08, 则y 关于t 的线性回归方程为y ^=0.32t +0.08,当t =6时,y ^=2.00,即返还6个点时该商品每天销量约为200件.(2)①根据题意,这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数x 为x =2×0.1+4×0.3+6×0.3+8×0.15+10×0.1+12×0.05=6, 中位数的估计值为5+2×100-20-6060=5+23≈5.7.②抽取的6名消费者中“欲望紧缩型”消费者人数为6×2030=4,“欲望膨胀型”消费者人数为6×1030=2.故X 的所有可能取值为0,1,2.P (X =2)=C 14C 22C 36=15,P (X =1)=C 24C 12C 36=35,P (X =0)=C 34C 02C 36=15,故随机变量X 的分布列为X 0 1 2 P153515E (X )=2×15+1×35+0×15=1.均值与方差在决策中的应用例3 (2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p (0<p <1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p 0作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X ,求E (X ); ②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验? 解 (1)20件产品中恰有2件不合格品的概率为 f (p )=C 220·p 2(1-p )18. 因此f ′(p )=C 220[2p (1-p )18-18p 2(1-p )17]=2C 220p (1-p )17(1-10p ).令f ′(p )=0,得p =0.1.当p ∈(0,0.1)时,f ′(p )>0;当p ∈(0.1,1)时,f ′(p )<0. 所以f (p )的最大值点为p 0=0.1. (2)由(1)知,p =0.1①令Y 表示余下的180件产品中的不合格品件数, 依题意知Y ~B (180,0.1), X =20×2+25Y ,即X =40+25Y .所以E (X )=E (40+25Y )=40+25E (Y )=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元. 由于E (X )=490>400,故应该对余下的产品做检验.思维升华 随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较均值,若均值相同,再由方差来决定.跟踪训练3 (2020·100所名校最新冲刺卷)某中学是走读中学,为了让学生更有效率的利用下午放学后的时间,学校在本学期第一次月考后设立了多间自习室,以便让学生在自习室自主学习、完成作业,同时每天派老师轮流值班.在本学期第二次月考后,高一某班数学老师统计了两次考试该班数学成绩优良人数和非优良人数,得到如下2×2列联表:(1)能否在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效? (2)设从该班第一次月考的所有数学成绩中任取两个,取到成绩优良数为X ;从该班第二次月考的所有数学成绩中任取两个,取到成绩优良数为Y ,求X 与Y 的均值并比较大小,请解释所得结论的实际含义. 下面的临界值表供参考:(参考公式:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解(1)K 2=80(25×30-15×10)240×40×35×45≈11.43>7.879,所以能在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效. (2)X 的所有可能取值为0,1,2,则P (X =0)=C 225C 240=513,P (X =1)=C 125C 115C 240=2552,P (X =2)=C 215C 240=752,X 0 1 2 P5132552752所以E (X )=0×513+1×2552+2×752=34.Y 的所有可能取值为0,1,2,则P (Y =0)=C 210C 240=352,P (Y =1)=C 110C 130C 240=513,P (Y =2)=C 230C 240=2952,Y 0 1 2 P3525132952所以E (Y )=0×352+1×513+2×2952=32,即E (X )<E (Y ),其实际含义是设立自习室后学生的数学成绩提高,说明设立自习室对提高学生成绩有效.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:支付金额(元)支付方式(0,1 000] (1 000,2 000]大于2 000 仅使用A 18人 9人 3人 仅使用B10人14人1人(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和均值;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分] 所以X 的分布列为[8分]故X 的均值E (X )=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A 的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.。
专题六 高考中的概率与统计问题1.质点在数轴上的区间[0,2]上运动,假定质点出现在该区间各点处的概率相等,那么质点落在区间[0,1]上的概率为 ( )A.14B.13C.12 D .以上都不对 答案 C解析 区间[0,2]的长度为2,记“质点落在区间[0,1]上”为事件A .则事件A 的区间长度为1,则P (A )=12.2. 为了从甲、乙两名运动员中选拔一人参加某次运动会跳水项目,对甲、乙两名运动员进行培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得到茎叶图如图所示.从平均成绩及发挥稳定性的角度考虑,你认为选派________(填甲或乙)运动员合适. 答案 甲解析 根据茎叶图,可得x 甲=16×(78+79+81+84+93+95)=85,x 乙=16×(75+80+83+85+92+95)=85.s 2甲=16×[(78-85)2+(79-85)2+(81-85)2+(84-85)2+(93-85)2+(95-85)2]=1333, s 2乙=16×[(75-85)2+(80-85)2+(83-85)2+(85-85)2+(92-85)2+(95-85)2]=1393. 因为x甲=x 乙,s 2甲<s 2乙,所以甲运动员的成绩比较稳定,选派甲运动员参赛比较合适.3.设函数f (x )=x 2+bx +c ,其中b ,c 是某范围内的随机数,若随机数b ,c ∈{1,2,3,4},则事件“f (1)≤5且f (0)≤3”发生的概率为________.答案 38解析 由f (x )=x 2+bx +c 知,f (1)≤5且f (0)≤3,即⎩⎨⎧b +c ≤4c ≤3,因为随机数b ,c ∈{1,2,3,4}, 所以共等可能地产生16个数对(b ,c ),分别为(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4),事件⎩⎨⎧b +c ≤4c ≤3包含了其中6个数对(1,1),(1,2),(1,3),(2,1),(2,2),(3,1),所以所求事件发生的概率P =616=38.4.在边长为2的正方形ABCD 内部任取一点M ,则满足∠AMB >90°的概率为________.答案 π8解析 以AB 为直径作圆,当M 在圆与正方形重合形成的半圆内时,∠AMB >90°,所求概率为P =π24=π8.5.如图是某学校抽取的n 个学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第3小组的频数为18,则n 的值是________.答案 48解析 若第一组的频率记为x ,则第二、三组频率依次为2x,3x ,第四、第五组频率依次为0.187 5,0.062 5,从而6x +0.187 5+0.062 5=1,解得x =18,从而第三组的频率为38;从而18n =38,解得n =48.题型一 古典概型与几何概型的概率计算 例1 已知关于x 的二次函数f (x )=ax 2-4bx +1.(1)设集合P ={1,2,3}和Q ={-1,1,2,3,4},分别从集合P 和Q 中随机取一个数作为a 和b ,求函数y =f (x )在区间[1,+∞)上是增函数的概率; (2)设点(a ,b )是区域⎩⎪⎨⎪⎧x +y -8≤0,x >0,y >0内的一点,求函数y =f (x )在区间[1,+∞)上是增函数的概率.思维启迪 首先判断两个问题是什么概率模型:容易知道(1)是一个古典概型概率;(2)是一个几何概型概率,对于(1)将所有情况都列举出来即可,(2)要结合线性规划知识来解决.解 (1)∵函数f (x )=ax 2-4bx +1的图象的对称轴为直线x =2ba ,要使f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数,当且仅当a >0且2ba ≤1,即2b ≤a .若a =1,则b =-1; 若a =2,则b =-1或1;若a =3,则b =-1或1.∴事件包含基本事件的个数是1+2+2=5.∴所求事件的概率为515=13.(2)由(1),知当且仅当2b ≤a 且a >0时,函数f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数, 依条件可知事件的全部结果所构成的区域为⎩⎪⎨⎪⎧⎭⎪⎬⎪⎫(a ,b )⎪⎪⎪⎪⎩⎨⎧ a +b -8≤0,a >0,b >0,构成所求事件的区域为三角形部分. 由⎩⎪⎨⎪⎧a +b -8=0,b =a 2,得交点坐标为(163,83),∴所求事件的概率为P =12×8×8312×8×8=13.思维升华 几何概型与古典概型的本质区别在于试验结果的无限性,几何概型经常涉及的几何度量有长度、面积、体积等,解决几何概型的关键是找准几何测度;古典概型是命题的重点,对于较复杂的基本事件空间,列举时要按照一定的规律进行,做到不重不漏.(2012·天津)某地区有小学21所,中学14所,大学7所,现采用分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查. (1)求应从小学、中学、大学中分别抽取的学校数目.(2)若从抽取的6所学校中随机抽取2所学校做进一步数据分析, ①列出所有可能的抽取结果; ②求抽取的2所学校均为小学的概率. 解 (1)由分层抽样定义知,从小学中抽取的学校数目为6×2121+14+7=3;从中学中抽取的学校数目为6×1421+14+7=2;从大学中抽取的学校数目为6×721+14+7=1.故从小学、中学、大学中分别抽取的学校数目为3,2,1.(2)①在抽取的6所学校中,3所小学分别记为A 1,A 2,A 3,2所中学分别记为A 4,A 5,大学记为A 6,则抽取2所学校的所有可能结果为{A 1,A 2},{A 1,A 3},{A 1,A 4},{A 1,A 5},{A 1,A 6},{A 2,A 3},{A 2,A 4},{A 2,A 5},{A 2,A 6},{A 3,A 4},{A 3,A 5},{A 3,A 6},{A 4,A 5},{A 4,A 6},{A 5,A 6},共15种.②从6所学校中抽取的2所学校均为小学(记为事件B )的所有可能结果为{A 1,A 2},{A 1,A 3},{A 2,A 3},共3种,所以P (B )=315=15.题型二 概率与统计的综合应用例2 第12届全运会将于2013年8月31日在辽宁沈阳举行,组委会在沈阳某大学招募了12名男志愿者和18名女志愿者,将这30名志愿者的身高编成如图所示的茎叶图(单位:cm),身高在175 cm 以上(包括175 cm)定义为“高个子”,身高在175 cm 以下(不包括175 cm)定义为“非高个子”.(1)如果用分层抽样的方法从“高个子”和“非高个子”中共抽取5人,再从这5人中选2人,求至少有一人是“高个子”的概率;(2)若从身高180 cm 以上(包括180 cm)的志愿者中选出男、女各一人,求这2人身高相差5 cm 以上的概率.思维启迪 求“至少有……”的概率往往利用“正难则反”的方法简单. 解 (1)根据茎叶图知,“高个子”有12人,“非高个子”有18人,用分层抽样的方法,每个人被抽中的概率是530=16,所以抽取的5人中,“高个子”有12×16=2人,“非高个子”有18×16=3人.“高个子”用A ,B 表示,“非高个子”用a ,b ,c 表示,则从这5人中选2人的情况有(A ,B ),(A ,a ),(A ,b ),(A ,c ),(B ,a ),(B ,b ),(B ,c ),(a ,b ),(a ,c ),(b ,c ),共10种,至少有一名“高个子”被选中的情况有(A ,B ),(A ,a ),(A ,b ),(A ,c ),(B ,a ),(B ,b ),(B ,c ),共7种.因此,至少有一人是“高个子”的概率是P =710.(2)由茎叶图知,有5名男志愿者身高在180 cm 以上(包括180 cm),身高分别为181 cm,182 cm,184 cm,187 cm,191 cm ;有2名女志愿者身高为180 cm 以上(包括180 cm),身高分别为180 cm,181 cm.抽出的2人用身高表示,则有(181,180),(181,181),(182,180),(182,181),(184,180),(184,181),(187,180),(187,181),(191,180),(191,181),共10种情况, 身高相差5 cm 以上的有(187,180),(187,181),(191,180),(191,181),共4种情况,故这2人身高相差5 cm 以上的概率为410=25.思维升华 概率统计解答题的主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键,因此在复习该部分时,要在这些图表上下功夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法.某中学生物兴趣小组在学校生物园地种植了一批名贵树苗,为了解树苗生长情况,从这批树苗中随机测量了50棵树苗的高度(单位:厘米).把这些高度列成了如下的(1)在这批树苗中任取一棵,其高度在85厘米以上的概率大约是多少?(2)这批树苗的平均高度大约是多少?(计算时可以用组中值代替各组数据的平均值) (3)为了进一步获得研究资料,现从[40,50)组中移出一棵树苗,从[90,100]组中移出两颗树苗进行试验研究,则[40,50)组中的树苗A 和[90,100]组中的树苗C 同时被移出的概率是多少?解 (1)由已知,得高度在85厘米以上的树苗大约有6+4=10棵,则所求的概率大约为1050=15=0.2.(2)树苗的平均高度x≈45×2+55×3+65×14+75×15+85×12+95×450=3 69050=73.8(厘米).(3)依题意,记[40,50)组中的树苗分别为A 、B ,[90,100]组中的树苗分别为C 、D 、E 、F ,则所有的基本事件为ACD 、ACE 、ACF 、ADE 、ADF 、AEF 、BCD 、BCE 、BCF 、BDE 、BDF 、BEF ,共12个,满足A 、C 同时被移出的基本事件为ACD 、ACE 、ACF ,共3个,所以树苗A 和树苗C 同时被移出的概率P =312=0.25.题型三 概率与统计案例的综合应用例3 为了解春季昼夜温差大小与某种子发芽多少之间的关系,现在从4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天100颗种子浸泡后的发芽数,(1)从这5天中任选2天,记发芽的种子数分别为m ,n ,求事件“m ,n 均不小于25”的概率;(2)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另3天的数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?思维启迪 列举基本事件时,要按照一定的顺序,才能不重不漏;根据公式求出线性回归方程后可计算|y ^-y |判断是否可靠.解 (1)所有的基本事件为(23,25),(23,30),(23,26),(23,16),(25,30),(25,26),(25,16),(30,26),(30,16),(26,16),共10个.设“m ,n 均不小于25”为事件A ,则事件A 包含的基本事件为(25,30),(25,26),(30,26),共3个. 所以P (A )=310.(2)由数据得,另3天的平均数x =12,y =27,3x y =972, 3x 2=432,∑i =13x i y i =977,∑i =13x 2i =434,所以b ^=977-972434-432=52,a ^=27-52×12=-3,所以y 关于x 的线性回归方程为y ^=52x -3.(3)依题意得,当x =10时,y ^=22,|22-23|<2;当x =8时,y ^=17,|17-16|<2,所以(2)中所得到的线性回归方程是可靠的.思维升华 建立具有相关关系的两个变量之间的线性回归方程,一般来说,选取的具有典型性的样本数据越多,建立的线性回归方程越好,但在具体问题中不一定把所收集到的样本数据都用上,用其中的一部分建立回归直线方程,用剩余的数据检验建立的回归方程的拟合程度,也是一个很好的统计方法.为了解大学生观看湖南卫视综艺节目“快乐大本营”是否与性别有关,一所大若该教师采用分层抽样的方法从50份问卷调查中继续抽查了10份进行重点分析,知道其中喜欢看“快乐大本营”的有6人. (1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关?说明你的理由; (3)已知喜欢看“快乐大本营”的10位男生中,A 1,A 2,A 3,A 4,A 5还喜欢看新闻,B 1,B 2,B 3还喜欢看动画片,C 1,C 2还喜欢看韩剧,现再从喜欢看新闻、动画片和韩剧的男生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率.(参考公式:K 2=n (ad -bc )(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解 (1)由分层抽样知识知,喜欢看“快乐大本营”的同学有50×610=30人,故不喜欢看“快乐大本营”的同学有50-30=20人,于是可将列联表补充如下:(2)∵K 2=50×(20×15-10×5)30×20×25×25≈8.333>7.879.∴有99.5%的把握认为喜欢看“快乐大本营”与性别有关.(3)从喜欢看的10位男生中选出喜欢看韩剧、喜欢看新闻、喜欢看动画片的各1名,其一切可能的结果组成的基本事件共有N =5×3×2=30个,用M 表示“B 1,C 1不全被选中”这一事件,则其对立事件M 表示“B 1,C 1全被选中”这一事件,由于M 由(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1),(A 4,B 1,C 1),(A 5,B 1,C 1)5个基本事件组成,所以P (M )=530=16. 由对立事件的概率公式得P (M )=1-P (M )=1-16=56.1.现有编号分别为1,2,3,4,5的五道不同的政治题和编号分别为6,7,8,9的四道不同的历史题.甲同学从这九道题中一次性随机抽取两道题,每道题被抽到的概率是相等的,用符号(x ,y )表示事件“抽到的两道题的编号分别为x 、y ,且x <y ”. (1)问有多少个基本事件,并列举出来;(2)求甲同学所抽取的两道题的编号之和小于17但不小于11的概率. 解 (1)共有36个等可能的基本事件,列举如下:(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(1,8),(1,9),(2,3),(2,4),(2,5),(2,6),(2,7),(2,8),(2,9),(3,4),(3,5),(3,6),(3,7),(3,8),(3,9),(4,5),(4,6),(4,7),(4,8),(4,9),(5,6),(5,7),(5,8),(5,9),(6,7),(6,8),(6,9),(7,8),(7,9),(8,9).(2)记“甲同学所抽取的两道题的编号之和小于17但不小于11”为事件A . 则事件A 为“x ,y ∈{1,2,3,4,5,6,7,8,9},且x +y ∈[11,17),其中x <y ”, 由(1)可知事件A 共包含15个基本事件,列举如下:(2,9),(3,8),(3,9),(4,7),(4,8),(4,9),(5,6),(5,7),(5,8),(5,9),(6,7),(6,8),(6,9),(7,8),(7,9),共15个,所以P (A )=1536=512.即甲同学所抽取的两道题的编号之和小于17但不小于11的概率为512.2.(2012·福建)在等差数列{a n }和等比数列{b n }中,a 1=b 1=1,b 4=8,{a n }的前10项和S 10=55.(1)求a n 和b n ;(2)现分别从{a n }和{b n }的前3项中各随机抽取一项,写出相应的基本事件,并求这两项的值相等的概率.解 (1)设数列{a n }的公差为d ,数列{b n }的公比为q .依题意得S 10=10+10×92d =55,b 4=q 3=8,解得d =1,q =2,所以a n =n ,b n =2n -1.(2)分别从{a n }和{b n }的前3项中各随机抽取一项,得到的基本事件有9个:(1,1),(1,2),(1,4),(2,1),(2,2),(2,4),(3,1),(3,2),(3,4). 符合题意的基本事件有2个:(1,1),(2,2).故所求的概率P =29.3.以下茎叶图记录了甲、乙两组各四名同学的植树棵数,乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植数总棵数为19的概率.(注:方差:s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x为x 1,x 2,…,x n 的平均数)解 (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10. 所以平均数为x =8+8+9+104=354;方差为s 2=14[(8-354)2+(8-354)2+(9-354)2+(10-354)2]=1116.(2)记甲组四名同学为A 1、A 2、A 3、A 4,他们植树的棵数依次为9,9,11,11;乙组四名同学为B 1、B 2、B 3、B 4,他们植树的棵数依次为9、8、9、10.分别从甲、乙两组中随机选取一名同学,所有可能的结果有16个,它们是 (A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,B 4), (A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,B 4), (A 3,B 1),(A 3,B 2),(A 3,B 3),(A 3,B 4), (A 4,B 1),(A 4,B 2),(A 4,B 3),(A 4,B 4).用C 表示“选出的两名同学的植树总棵数为19”这一事件,则C 中的结果有4个,它们是(A 1,B 4),(A 2,B 4),(A 3,B 2),(A 4,B 2),故所求概率为P (C )=416=14.4.(2013·课标全国Ⅱ)经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X (单位: t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率. 解 (1)当X ∈[100,130)时,T =500X -300(130-X )=800X -39 000. 当X ∈[130,150]时, T =500×130=65 000.所以T =⎩⎪⎨⎪⎧800X -39 000,100≤X <130,65 000,130≤X ≤150.(2)由(1)知利润T 不少于57 000元当且仅当120≤X ≤150.由直方图知需求量X ∈[120,150]的频率为0.7,所以下一个销售季度内的利润T 不少于57 000元的概率的估计值为0.7.5.某校高三某班的一次数学周练成绩(满分为100分)的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题:(1)求分数在[50,60)的频率及全班人数;(2)求分数在[80,90)之间的频数,并计算频率分布直方图中[80,90)间的矩形的高; (3)若要从分数在[80,100]之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[90,100]之间的概率. 解 (1)分数在[50,60)的频率为0.008×10=0.08,由茎叶图知:分数在[50,60)之间的频数为2,=25.所以全班人数为20.08(2)分数在[80,90)之间的频数为25-2-7-10-2=4;频率分布直方图中[80,90)间的矩形的高为425÷10=0.016.(3)将[80,90)之间的4个分数编号为1,2,3,4,[90,100]之间的2个分数编号为5,6,在[80,100]之间的试卷中任取两份的基本事件为(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3,4),(3,5),(3,6),(4,5),(4,6),(5,6)共15个,其中,至少有一份在[90,100]之间的基本事件有9个,=0.6.故至少有一份分数在[90,100]之间的概率是9156.某班甲、乙两名同学参加100米达标训练,在相同条件下两人10次训练的成绩(单位:秒)(1)请画出茎叶图.如果从甲、乙两名同学中选一名参加学校的100米比赛,从成绩的稳定性方面考虑,选派谁参加比赛更好,并说明理由(不用计算,可通过统计图直接回答结论);(2)经过对甲、乙两位同学的若干次成绩的统计,甲、乙的成绩都均匀分布在[11.5,14.5]之间,现甲、乙比赛一次,求甲、乙成绩之差的绝对值小于0.8秒的概率.解(1)甲、乙两人10次训练的成绩的茎叶图:从统计图中可以看出,乙的成绩较为集中,差异程度较小,所以选派乙同学代表班级参加比赛更好.(2)设甲同学的成绩为x,乙同学的成绩为y,则|x-y|<0.8,得x-0.8<y<0.8+x,如图,阴影部分面积即为3×3-2.2×2.2=4.16,则P (|x -y |<0.8)=P(x -0.8<y<0.8+x)=4.163×3=104225.。
专题六 高考中的概率与统计问题1. (2021·安徽)某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学考试中的成绩,五名男生的成绩别离为86,94,88,92,90,五名女生的成绩别离为88,93,93,88,93.以下说法必然正确的选项是( )A .这种抽样方式是一种分层抽样B .这种抽样方式是一种系统抽样C .这五名男生成绩的方差大于这五名女生成绩的方差D .该班男生成绩的平均数小于该班女生成绩的平均数 答案 C 解析x 男=15(86+94+88+92+90)=90,x 女=15(88+93+93+88+93)=91,s 2男=15[(86-90)2+(94-90)2+(88-90)2+(92-90)2+(90-90)2]=8, s 2女=15[(88-91)2+(93-91)2+(93-91)2+(88-91)2+(93-91)2]=6.2. 已知随机变量ξ服从正态散布N (2,σ2),且P (ξ<4)=0.8,那么P (0<ξ<2)等于 ( )A .0.6B .0.4C .0.3D .0.2答案 C解析 ∵P (ξ<4)=0.8, ∴P (ξ>4)=0.2,由题意知图像的对称轴为直线x =2,P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.3. (2021·上海)设10≤x 1<x 2<x 3<x 4≤104,x 5=105.随机变量ξ1取值x 1、x 2、x 3、x 4、x 5的概率均为0.2,随机变量ξ2取值x 1+x 22、x 2+x 32、x 3+x 42、x 4+x 52、x 5+x 12的概率也均为0.2.假设记Dξ1、Dξ2别离为ξ1、ξ2的方差,那么( )A .Dξ1>Dξ2B .Dξ1=Dξ2C .Dξ1<Dξ2D .Dξ1与Dξ2的大小关系与x 1、x 2、x 3、x 4的取值有关 答案 A解析 Eξ1=0.2x 1+0.2x 2+0.2x 3+0.2x 4+0.2x 5 =0.2(x 1+x 2+x 3+x 4+x 5).Eξ2=0.2×x 1+x 22+0.2×x 2+x 32+…+0.2×x 5+x 12=0.2(x 1+x 2+x 3+x 4+x 5). ∴Eξ1=Eξ2,记作x ,∴Dξ1=0.2[(x 1-x )2+(x 2-x )2+…+(x 5-x )2]=0.2[x 21+x 22+…+x 25+5x 2-2(x 1+x 2+…+x 5)x ]=0.2(x 21+x 22+…+x 25-5x 2).同理Dξ2=0.2⎣⎢⎡⎦⎥⎤⎝ ⎛⎭⎪⎫x 1+x 222+⎝ ⎛⎭⎪⎫x 2+x 322+…+⎝ ⎛⎭⎪⎫x 5+x 122-5x 2. ∵⎝ ⎛⎭⎪⎫x 1+x 222<x 21+x 222,…,⎝ ⎛⎭⎪⎫x 5+x 122<x 25+x 212. ∴⎝ ⎛⎭⎪⎫x 1+x 222+⎝ ⎛⎭⎪⎫x 2+x 322+…+⎝ ⎛⎭⎪⎫x 5+x 122<x 21+x 22+x 23+x 24+x 25.∴Dξ1>Dξ2.4. (2021·四川)节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮彼此独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒为距离闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是( )A.14B.12C.34D.78答案 C解析 设在通电后的4秒钟内,甲串彩灯、乙串彩灯第一次亮的时刻为x 、y ,x 、y 彼此独立,由题意可知⎩⎪⎨⎪⎧0≤x ≤40≤y ≤4|x -y |≤2,如下图.∴两串彩灯第一次亮的时刻相差不超过2秒的概率为P (|x -y |≤2)=S 正方形-2S △ABCS 正方形=4×4-2×12×2×24×4=1216=34. 5. (2021·重庆)某艺校在一天的6节课中随机安排语文、数学、外语三门文化课和其他三门艺术课各1节,那么在课表上的相邻两节文化课之间最多距离1节艺术课的概率为________(用数字作答). 答案35解析 6节课随机安排,共有A 66=720(种)方式.课表上相邻两节文化课之间最多距离1节艺术课,分三类:第1类:文化课之间没有艺术课,有A 33·A 44=6×24=144(种).第2类:文化课之间有1节艺术课,有A 33·C 13·A 12·A 33=6×3×2×6=216(种). 第3类:文化课之间有2节艺术课,有A 33·A 23·A 22=6×6×2=72(种).共有144+216+72=432(种). 由古典概型概率公式得P =432720=35. 题型一 求事件的概率例1 某项专业技术认证考试按科目A 和科目B 依次进行,只有当科目A 成绩合格时,才可继续参加科目B 的考试.已知每一个科目只许诺有一次补考机遇,两个科目成绩均合格方可取得证书,现某人参加这项考试,科目A 每次考试成绩合格的概率均为23,科目B 每次考试成绩合格的概率均为12,假设各次考试成绩合格与否互不阻碍.(1)求他不需要补考就可取得证书的概率.(2)在这项考试进程中,假设他不舍弃所有的考试机遇,求他别离参加2次、3次、4次考试的概率. 思维启发 准确地分析事件类型,正确地运用概率公式,是解决这种问题的关键.解 设“科目A 第一次考试合格”为事件A 1,“科目A 补考合格”为事件A 2,“科目B 第一次考试合格”为事件B 1,“科目B 补考合格”为事件B 2,那么A 1,A 2,B 1,B 2彼此独立. (1)设“不需要补考就可取得证书”为事件M , 则P (M )=P (A 1B 1)=P (A 1)P (B 1)=23×12=13.(2)设“参加考试次数为2次、3次、4次”别离为事件E ,C ,D .那么P (E )=P (A 1B 1+A 1 A 2) =P (A 1)P (B 1)+P (A 1)P (A 2)=23×12+13×13=49,P (C )=P (A 1B 1B 2+A 1B 1 B 2+A 1A 2B 1)=P (A 1)P (B 1)P (B 2)+P (A 1)P (B 1)P (B 2)+P (A 1)P (A 2)·P (B 1) =23×12×12+23×12×12+13×23×12=49, P (D )=P (A 1A 2B 1B 2+A 1A 2B 1 B 2)=P (A 1)P (A 2)P (B 1)P (B 2)+P (A 1)P (A 2)P (B 1)P (B 2) =13×23×12×12+13×23×12×12=19. (另解:P (D )=1-P (E ∪C )=1-P (E )-P (C )=1-49-49=19).思维升华 (1)一个复杂事件假设正面情形较多,反面情形较少,那么一样利用对立事件进行求解.尤其是涉及到“最多”、“至少”等问题时常经常使用这种方式求解.(2)求复杂事件的概率,要正确分析复杂事件的组成,看复杂事件是能转化为几个彼此互斥的事件的和事件仍是能转化为几个彼此独立事件同时发生的积事件,然后用概率公式求解.某校举行环保知识大奖赛,竞赛分初赛和决赛两部份,初赛采纳选手选一题答一题的方式进行,每位选手最多有5次选题答题的机遇,选手累计答对3题或答错3题即终止其初赛的竞赛,答对3题者直接进入决赛,答错3题者那么被淘汰.已知选手甲答题持续两次答错的概率为19(已知甲回答每一个问题的正确率相同,而且彼此之间没有阻碍). (1)求选手甲回答一个问题的正确率; (2)求选手甲可进入决赛的概率.解 (1)设选手甲答对一个问题的正确率为P 1, 那么(1-P 1)2=19, 应选手甲答对一个问题的正确率P 1=23.(2)选手甲答了3道题目进入决赛的概率为(23)3=827; 选手甲答了4道题目进入决赛的概率为C 23(23)2·13·23=827;选手甲答了5道题目进入决赛的概率为 C 24(23)2·(13)2·23=1681. ∴选手甲能够进入决赛的概率P =827+827+1681=6481.题型二 求离散型随机变量的均值与方差例2 李先生家在H 小区,他在C 科技园区工作,从家开车到公司上班有L 1,L 2两条线路(如图),线路L 1上有A 1,A 2,A 3三个路口,各路口碰到红灯的概率均为12;线路L 2上有B 1,B 2两个路口,各路口碰到红灯的概率依次为34,35.(1)假设走线路L 1,求最多碰到1次红灯的概率; (2)假设走线路L 2,求碰到红灯次数X 的数学期望;(3)依照“平均碰到红灯的次数最少”的要求,请你帮忙李先生分析上述两条线路中,选择哪条线路上班更好些,并说明理由.思维启发 走L 1或L 2碰到红灯的次数都是独立重复实验问题,可结合二项散布求其概率,选何条线路是要利用均值的大小判定.注意三个转化:(1)转化为P 3(1)+P 3(0)的值;(2)X 可取0,1,2转化为独立事件的积事件的概率; (3)转化为比较EX 、EY 的大小.解 (1)设“走线路L 1最多碰到1次红灯”为事件A , 则P (A )=C 03×⎝ ⎛⎭⎪⎫123+C 13×12×⎝ ⎛⎭⎪⎫122=12.因此走线路L 1最多碰到1次红灯的概率为12.(2)依题意,知X 的可能取值为0,1,2.P (X =0)=⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-35=110,P (X =1)=34×⎝ ⎛⎭⎪⎫1-35+⎝ ⎛⎭⎪⎫1-34×35=920,P (X =2)=34×35=920.随机变量X 的散布列为X 0 1 2 P110920 920 因此EX =110×0+920×1+920×2=2720.(3)设选择线路L 1碰到红灯的次数为Y ,随机变量Y 服从二项散布,即Y ~B ⎝ ⎛⎭⎪⎫3,12,因此EY =3×12=32.因为EX <EY ,因此选择线路L 2上班更好.思维升华 解决此类题目的关键是将实际问题转化为数学问题,正确明白得随机变量取每一个值所表示的具体事件,求得该事件发生的概率.(2021·福建)受轿车在保修期内维修费等因素的阻碍,企业生产每辆轿车的利润与该轿车第一次显现故障的时刻有关.某轿车制造厂生产甲、乙两种品牌轿车,保修期均为2年.现从该厂已售出的两种品牌轿车中各随机抽取50辆,统计数据如下:品牌甲乙(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其第一次显现故障发生在保修期内的概率.(2)假设该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X 1,生产一辆乙品牌轿车的利润为X 2,别离求X 1,X 2的散布列.(3)该厂估量尔后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌的轿车.假设从经济效益的角度考虑,你以为应生产哪一种品牌的轿车?说明理由.解 (1)设“甲品牌轿车第一次显现故障发生在保修期内”为事件A ,那么P (A )=2+350=110.(2)依题意得,X 1的散布列为X 2的散布列为(3)由(2)得EX 1=1×125+2×350+3×910=14350=2.86(万元), EX 2=1.8×110+2.9×910=2.79(万元).因为EX 1>EX 2,因此应生产甲品牌轿车.题型三 概率与统计的综合应用例3 (2021·课标全国Ⅱ)经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.依照历史资料,取得销售季度内市场需求量的频率散布直方图,如下图.经销商为下一个销售季度购进了130 t 该农产品.以X (单位: t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润. (1)将T 表示为X 的函数;(2)依照直方图估量利润T 很多于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:假设需求量X ∈[100,110),那么取X =105,且X =105的概率等于需求量落入[100,110)的频率).求T 的数学期望.思维启发 利润T 是由两部份组成的,一个是取得利润,另一个是亏损,是不是亏损与x 的取值范围有关,因此,T 关于x 的函数要用分段函数表示. 解 (1)当X ∈[100,130)时,T =500X -300(130-X )=800X -39 000.当X ∈[130,150]时,T =500×130=65 000.因此T =⎩⎪⎨⎪⎧800X -39 000,100≤X <130,65 000,130≤X ≤150.(2)由(1)知利润T 很多于57 000元当且仅当120≤X ≤150.由直方图知需求量X ∈[120,150]的频率为0.7,因此下一个销售季度内的利润T 很多于57 000元的概率的估量值为0.7.(3)依题意可得T 的散布列为T 45 000 53 000 61 000 65 000 P0.10.20.30.4因此ET思维升华 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分表现了概率与统计的工具性和交汇性.统计以考查抽样方式、样本的频率散布、样本特点数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意明白得实际问题的意义,使之和相应的概率计算对应起来,只有如此才能有效地解决问题.以下茎叶图记录了甲、乙两组各四名同窗的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.(1)若是X =8,求乙组同窗植树棵数的平均数和方差;(2)若是X =9,别离从甲、乙两组中随机选取一名同窗,求这两名同窗的植树总棵树Y 的散布列和数学期望. (注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解 (1)当X =8时,由茎叶图可知,乙组同窗的植树棵数是8,8,9,10,因此平均数x =8+8+9+104=354;方差s 2=14[(8-354)2+(8-354)2+(9-354)2+(10-354)2]=1116.(2)当X =9时,由茎叶图可知,甲组同窗的植树棵数是9,9,11,11;乙组同窗的植树棵数是9,8,9,10.别离从甲、乙两组中随机选取一名同窗,共有4×4=16(种)可能的结果,这两名同窗植树总棵数Y 的可能取值为17,18,19,20,21.事件“Y =17”等价于“甲组选出的同窗植树9棵,乙组选出的同窗植树8棵”,因此该事件有2种可能的结果,因此P (Y =17)=216=18.同理可得P (Y =18)=14,P (Y =19)=14,P (Y =20)=14,P (Y=21)=18.因此随机变量Y 的散布列为Y 17 18 19 20 21 P1814141418EY =17×18+18×14+19×14+20×4+21×8=19.(时刻:80分钟)1. (2021·广东)某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如下图,其中茎为十位数,叶为个位数.(1)依照茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.依照茎叶图推断该车间12名工人中有几名优秀工人? (3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率. 解 (1)样本平均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人占的比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.(3)设事件A :“从该车间12名工人中,任取2人,恰有1名优秀工人”,那么P (A )=C 14C 18C 212=1633.2. 在10件产品中,有3件一等品,4件二等品,3件三等品.从这10件产品中任取3件,求:(1)掏出的3件产品中一等品件数X 的散布列和数学期望; (2)掏出的3件产品中一等品件数多于二等品件数的概率.解 (1)由于从10件产品中任取3件的结果数为C 310,从10件产品中任取3件,其中恰有k 件一等品的结果数为C k 3C 3-k 7(k =0,1,2,3),那么从10件产品中任取3件,其中恰有k 件一等品的概率为P (X =k )=C k 3C 3-k 7C 310,k =0,1,2,3.因此随机变量X 的散布列是X 的数学期望EX =0×724+1×40+2×40+3×120=10.(2)设“掏出的3件产品中一等品件数多于二等品件数”为事件A ,“恰好掏出1件一等品和2件三等品”为事件A 1,“恰好掏出2件一等品”为事件A 2,“恰好掏出3件一等品”为事件A 3,由于事件A 1,A 2,A 3彼此互斥,且A =A 1∪A 2∪A 3,而P (A 1)=C 13C 23C 310=340.P (A 2)=P (X =2)=740.P (A 3)=P (X =3)=1120,因此掏出的3件产品中一等品件数多于二等品件数的概率为P (A )=P (A 1)+P (A 2)+P (A 3)=340+740+1120=31120.3. 甲、乙两人参加某电视台举行的答题闯关游戏,依照规那么,甲先从6道备选题中一次性抽取3道题独立作答,然后由乙回答剩余3题,每人答对其中2题就停止答题,即闯关成功.已知在6道备选题中,甲能答对其中的4道题,乙答对每道题的概率都是23.(1)求甲、乙至少有一人闯关成功的概率; (2)设甲答对题目的个数为ξ,求ξ的散布列. 解 (1)设甲、乙闯关成功别离为事件A ,B , 则P (A )=C 14C 22C 36=420=15,P (B )=(1-23)3+C 23(1-23)2(23)1=127+29=727, 那么甲、乙至少有一人闯关成功的概率是1-P (A B )=1-P (A )P (B )=1-15×727=128135.(2)由题意知ξ的可能取值是1,2.P (ξ=1)=C 14C 22C 36=15,P (ξ=2)=C 24C 12+C 34C 36=45,则ξ的散布列为4. )的频率散布直方图.(1)求直方图中x 的值;(2)假设将频率视为概率,从那个城市随机抽取3位居民(看做有放回的抽样),求月均用水量在3至4吨的居民数X 的散布列和数学期望.解 (1)依题意及频率散布直方图知1×(0.02+0.1+x +0.37+0.39)=1,解得x =0.12.(2)由题意知,X ~B (3,0.1).因此P (X =0)=C 03×0.93=0.729,P (X =1)=C 13×0.1×0.92=0.243,P (X =2)=C 23×0.12×0.9=0.027, P (X =3)=C 33×0.13=0.001.故随机变量X 的散布列为X 0 1 2 3 P0.7290.2430.0270.001X 的数学期望为EX =3×0.1=0.3.5. 某市公租房的房源位于A 、B 、C 三个片区.设每位申请人只申请其中一个片区的房源,且申请其中任一个片区的房源是等可能的,求该市的任4位申请人中: (1)恰有2人申请A 片区房源的概率;(2)申请的房源所在片区的个数ξ的散布列与期望.解 (1)方式一 所有可能的申请方式有34种,恰有2人申请A 片区房源的申请方式有C 24·22种,从而恰有2人申请A 片区房源的概率为C 24·2234=827.方式二 设对每位申请人的观看为一次实验,这是4次独立重复实验. 记“申请A 片区房源”为事件A ,那么P (A )=13.从而,由独立重复实验中事件A 恰发生k 次的概率计算公式知,恰有2人申请A 片区房源的概率为P 4(2)=C 24⎝ ⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827. (2)ξ的所有可能值为1,2,3. 又P (ξ=1)=334=127,P (ξ=2)=C 23C 12C 34+C 24C 2234=1427⎝⎛⎭⎪⎫或P ξ=2=C 2324-234=1427, P (ξ=3)=C 13C 24C 1234=49⎝⎛⎭⎪⎫或P ξ=3=C 24A 3334=49.综上知,ξ的散布列为从而有Eξ=1×127+2×1427+3×49=27.6. 一次考试共有12道选择题,每道选择题都有4个选项,其中有且只有一个是正确的.评分标准规定:“每题只选一个选项,答对得5分,不答或答错得零分”.某考生已确信有8道题的答案是正确的,其余题中:有两道题都可判定两个选项是错误的,有一道题能够判定一个选项是错误的,还有一道题因不睬解题意只好乱猜.请求出该考生: (1)得60分的概率;(2)所得分数ξ的散布列和数学期望.解 (1)设“可判定两个选项是错误的”两道题之一选对为事件A ,“有一道题能够判定一个选项是错误的”选对为事件B ,“有一道题不睬解题意”选对为事件C , ∴P (A )=12,P (B )=13,P (C )=14,∴得60分的概率为P =12×12×13×14=148.(2)ξ可能的取值为40,45,50,55,60. P (ξ=40)=12×12×23×34=18;P (ξ=45)=C 12×12×12×23×34+12×12×13×34+12×12×23×14=1748; P (ξ=50)=12×12×23×34+C 12×12×12×13×34+C 12×12×12×23×14+12×12×13×14=1748;P (ξ=55)=C 12×12×12×13×14+12×12×23×14+12×12×13×34=748; P (ξ=60)=12×12×13×14=148.ξ的散布列为Eξ=40×18+45×1748+50×48+55×48+60×48=12.。
高考专题突破六 高考中的概率与统计问题概率与统计的综合应用例1 槟榔原产于马来西亚,在中国主要分布在云南、海南及台湾等热带地区.槟榔是重要的中药材,在南方一些少数民族还将果实作为一种咀嚼嗜好品,但其被世界卫生组织国际癌症研究机构列为致癌物清单Ⅰ类致癌物.云南某民族中学为了解A ,B 两个少数民族班的学生咀嚼槟榔的情况,分别从这两个班中随机抽取5名学生进行调查,将他们平均每周咀嚼槟榔的颗数作为样本,绘制成如图所示的茎叶图(图中的茎表示十位数字,叶表示个位数字).(1)你能否估计哪个班的学生平均每周咀嚼槟榔的颗数较多?(2)在被抽取的10名学生中,从平均每周咀嚼槟榔的颗数不低于20颗的学生中随机抽取3名学生,求抽取B 班学生人数X 的分布列和期望.解 (1)A 班样本数据的平均值为15×(9+11+14+20+31)=17,由此估计A 班学生平均每周咀嚼槟榔的颗数为17,B 班样本数据的平均值为15×(11+12+21+25+26)=19,由此估计B 班学生平均每周咀嚼槟榔的颗数为19, 故估计B 班学生平均每周咀嚼槟榔的颗数较多. (2)∵平均每周咀嚼槟榔的颗数不低于20颗的学生中, A 班有2人,B 班有3人,共有5人, ∴X 的可能取值为1,2,3,P (X =1)=C 13C 22C 35=310,P (X =2)=C 23C 12C 35=35,P (X =3)=C 33C 02C 35=110,∴X 的分布列为X 1 2 3 P31035110∴E (X )=1×310+2×35+3×110=95.思维升华 概率与统计作为考查学生应用意识的重要载体,已成为近几年高考一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性. 跟踪训练1 从某企业生产的某种产品中抽取100件,测量这些产品的质量指标值,由测量结果得到如图所示的频率分布直方图,质量指标值落在区间[55,65),[65,75),[75,85]内的频率之比为4∶2∶1.(1)求这些产品的质量指标值落在区间[75,85]内的频率;(2)若将频率视为概率,从该企业生产的这种产品中随机抽取3件,记这3件产品中质量指标值位于[45,75)内的产品件数为X ,求X 的分布列与期望.解 (1)设落在区间[75,85]内的频率为x ,则落在区间[55,65),[65,75)内的频率分别为4x 和2x , 依题意得(0.004+0.012+0.019+0.030)×10+4x +2x +x =1, 解得x =0.05.所以落在区间[75,85]内的频率为0.05.(2)从该企业生产的该种产品中随机抽取3件,相当于进行了3次独立重复试验,所以X 服从二项分布B (n ,p ),其中n =3.由(1)得,落在区间[45,75)内的频率为0.3+0.2+0.1=0.6,将频率视为概率得p =0.6. 因为X 的所有可能取值为0,1,2,3, 则P (X =0)=C03×0.60×0.43=0.064, P (X =1)=C13×0.61×0.42=0.288, P (X =2)=C23×0.62×0.41=0.432, P (X =3)=C33×0.63×0.40=0.216, 所以X 的分布列为X 0 1 2 3 P0.0640.2880.4320.216所以X 的期望为E (X )=0×0.064+1×0.288+2×0.432+3×0.216=1.8. (或直接根据二项分布的期望公式得到E (X )=np =3×0.6=1.8)概率与统计案例的综合应用例2(2020·华中师大附中模拟)中国大学先修课程,是在高中开设的具有大学水平的课程,旨在让学有余力的高中生早接受大学思维方式、学习方法的训练,为大学学习乃至未来的职业生涯做好准备.某高中开设大学先修课程已有两年,两年共招收学生2 000人,其中有300人参与学习先修课程,两年全校共有优等生200人,学习先修课程的优等生有60人.这两年学习先修课程的学生都参加了考试,并且都参加了某高校的自主招生考试(满分100分),结果如表所示:分数a 95≤a≤10085≤a<9575≤a<8560≤a<75a<60人数20551057050自招通0.90.80.60.50.4过率(1)填写列联表,并画出列联表的等高条形图,并通过图形判断学习先修课程与优等生是否有关系,根据列联表的独立性检验,能否在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系?优等生非优等生总计学习大学先修课程没有学习大学先修课程总计(2)已知今年有150名学生报名学习大学先修课程,以前两年参加大学先修课程学习成绩的频率作为今年参加大学先修课程学习成绩的概率.①在今年参加大学先修课程的学生中任取一人,求他获得某高校自主招生通过的概率;②设今年全校参加大学先修课程的学生通过某高校自主招生考试人数为ξ,求E(ξ).参考数据:P(χ2≥k0)0.150.100.050.0250.0100.005k 02.072 2.7063.841 5.024 6.635 7.879参考公式:χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2.解 (1)列联表如下:优等生 非优等生 总计 学习大学先修课程 60 240 300 没有学习大学先修课程140 1 560 1 700 总计2001 8002 000等高条形图如图:通过图形可判断学习先修课程与优等生有关系,又 χ2=2 000(60×1 560-140×240)2300×1 700×200×1 800≈39.216>6.635,因此在犯错误的概率不超过0.01的前提下认为学习先修课程与优等生有关系. (2)①P =20300×0.9+55300×0.8+105300×0.6+70300×0.5+50300×0.4=0.6.②设通过某高校自主招生考试的人数为ξ, 则ξ~B ⎝⎛⎭⎫150,35, P (x =k )=C k 150⎝⎛⎭⎫35k ⎝⎛⎭⎫25150-k ,k =0,1,2,…,150, 所以E (ξ)=150×35=90.思维升华 概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、独立重复实验、超几何分布、二项分布、独立性检验、线性回归等知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.跟踪训练2 某商场营销人员进行某商品M 市场营销调查发现,每回馈消费者一定的点数,该商品每天的销量就会发生一定的变化,经过试点统计得到下表:(1)经分析发现,可用线性回归模型拟合当地该商品销量y (百件)与返还点数t 之间的相关关系,请用最小二乘法求y 关于t 的回归直线方程y ^=b ^t +a ^,并预测若返还6个点时该商品每天的销量;(2)若节日期间营销部对商品进行新一轮调整.已知某地拟购买该商品的消费群体十分庞大,经营销调研机构对其中的200名消费者的返点数额的心理预期值进行了一个抽样调查,得到如下一份频数表:①求这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数及中位数的估计值(同一区间的预期值可用该区间的中点值代替;估计值精确到0.1);②将对返还点数的心理预期值在[1,3)和[11,13]的消费者分别定义为“欲望紧缩型”消费者和“欲望膨胀型”消费者,现采用分层抽样的方法从位于这两个区间的30名消费者中随机抽取6名,再从这6人中随机抽取3名进行跟踪调查,设抽出的3人中“欲望膨胀型”消费者的人数为随机变量X ,求X 的分布列及期望.参考公式及数据:b ^=∑i =1nt i y i -n t y∑i =1nt 2i -n t 2,a ^=y -b ^t ;∑i =15tiyi =18.8.解 (1)由题意知t =1+2+3+4+55=3,y =0.5+0.6+1+1.4+1.75=1.04,∑i =15t 2i =12+22+32+42+52=55,b ^=∑i =15t i yi -5t y∑i =15t 2i -5t2=18.8-5×3×1.0455-5×32=0.32,a ^=y -b ^t =1.04-0.32×3=0.08, 则y 关于t 的回归直线方程为y ^=0.32t +0.08,当t =6时,y ^=2.00,即返还6个点时该商品每天销量约为200件.(2)①根据题意,这200位拟购买该商品的消费者对返还点数的心理预期值X 的样本平均数x 为x =2×0.1+4×0.3+6×0.3+8×0.15+10×0.1+12×0.05=6, 中位数的估计值为5+2×100-20-6060=5+23≈5.7.②抽取的6名消费者中“欲望紧缩型”消费者人数为6×2030=4,“欲望膨胀型”消费者人数为6×1030=2.故X 的所有可能取值为0,1,2.P (X =2)=C 14C 22C 36=15,P (X =1)=C 24C 12C 36=35,P (X =0)=C 34C 02C 36=15,故随机变量X 的分布列为X 0 1 2 P153515E (X )=2×15+1×35+0×15=1.期望与方差在决策中的应用例3 (2018·全国Ⅰ)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品做检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件做检验,再根据检验结果决定是否对余下的所有新产品做检验.设每件产品为不合格品的概率都为p (0<p <1),且各件产品为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f (p ),求f (p )的最大值点p 0;(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.①若不对该箱余下的产品做出检验,这一箱产品的检验费用与赔偿费用的和记为X,求E(X);②以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品做检验?解(1)20件产品中恰有2件不合格品的概率为f(p)=C220·p2(1-p)18.因此f′(p)=C220[2p(1-p)18-18p2(1-p)17]=2C220p(1-p)17(1-10p).令f′(p)=0,得p=0.1.当p∈(0,0.1)时,f′(p)>0;当p∈(0.1,1)时,f′(p)<0.所以f(p)的最大值点为p0=0.1.(2)由(1)知,p=0.1①令Y表示余下的180件产品中的不合格品件数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y.所以E(X)=E(40+25Y)=40+25E(Y)=490.②如果对余下的产品做检验,则这一箱产品所需要的检验费为400元.由于E(X)=490>400,故应该对余下的产品做检验.思维升华随机变量的期望反映了随机变量取值的平均水平,方差反映了随机变量偏离均值的程度,它们从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要依据,一般先比较期望,若期望相同,再由方差来决定.跟踪训练3(2020·100所名校最新冲刺卷)某中学是走读中学,为了让学生更有效率的利用下午放学后的时间,学校在本学期第一次月考后设立了多间自习室,以便让学生在自习室自主学习、完成作业,同时每天派老师轮流值班.在本学期第二次月考后,高一某班数学老师统计了两次考试该班数学成绩优良人数和非优良人数,得到如下2×2列联表:(1)能否在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效?(2)设从该班第一次月考的所有数学成绩中任取两个,取到成绩优良数为X;从该班第二次月考的所有数学成绩中任取两个,取到成绩优良数为Y,求X与Y的期望并比较大小,请解释所得结论的实际含义. 下面的临界值表供参考:P (χ2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828(参考公式:χ2=n (n 11n 22-n 12n 21)2n 1+n 2+n +1n +2.解(1) χ2=80(25×30-15×10)240×40×35×45≈11.43>7.879,所以能在犯错的概率不超过0.005的前提下认为设立自习室对提高学生成绩有效. (2)X 的所有可能取值为0,1,2,则P (X =0)=C 225C 240=513,P (X =1)=C 125C 115C 240=2552,P (X =2)=C 215C 240=752,X 0 1 2 P5132552752所以E (X )=0×513+1×2552+2×752=34.Y 的所有可能取值为0,1,2,则P (Y =0)=C 210C 240=352,P (Y =1)=C 110C 130C 240=513,P (Y =2)=C 230C 240=2952,Y 0 1 2 P3525132952所以E (Y )=0×352+1×513+2×2952=32,即E (X )<E (Y ),其实际含义是设立自习室后学生的数学成绩提高,说明设立自习室对提高学生成绩有效.例 (12分)(2019·北京)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率; (2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1 000元的人数,求X 的分布列和期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2 000元的人数有变化?说明理由. 规范解答解 (1)由题意知,样本中仅使用A 的学生有18+9+3=30(人),仅使用B 的学生有10+14+1=25(人),A ,B 两种支付方式都不使用的学生有5人,故样本中A ,B 两种支付方式都使用的学生有100-30-25-5=40(人).[1分]所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率为40100=0.4.[2分](2)X 的所有可能值为0,1,2.[3分]记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于 1 000元”.由题设知,事件C ,D 相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6,[4分]所以P (X =2)=P (CD )=P (C )P (D )=0.24.[5分] P (X =1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D ) =0.4×(1-0.6)+(1-0.4)×0.6 =0.52,[6分]P (X =0)=P (C D )=P (C )P (D )=0.24.[7分]所以X的分布列为X 01 2P 0.240.520.24[8分]故X的期望E(X)=0×0.24+1×0.52+2×0.24=1.0.[9分](3)记事件E为“从样本仅使用A的学生中随机抽查3人,他们本月的支付金额大于2 000元”.假设样本仅使用A的学生中,本月支付金额大于2 000元的人数没有变化,则由上个月的样本数据得P(E)=1C330=14 060.[11分]答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化,所以可以认为有变化.[12分]答案示例2:无法确定有没有变化,理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.[12分]第一步:审清题意,理清条件和结论,找到关键数量关系.第二步:找数量关系,把图表语言转化为数字,将图表中的数字转化为公式中的字母.第三步:建立解决方案,找准公式,根据图表数据代入公式计算数值.第四步:作出判断得结论,依据题意,借助数表作出正确判断.第五步:反思回顾,查看关键点、易错点和答题规范性.。