2020高考理科数学大题专项练习:统计与概率问题
- 格式:docx
- 大小:59.58 KB
- 文档页数:7
2020年高考数学试题分项版——统计概率(原卷版)一、选择题1.(2020·全国Ⅰ理,5)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y =a +bx B .y =a +bx 2 C .y =a +b e xD .y =a +b ln x2.(2020·全国Ⅰ理,8)⎝⎛⎭⎫x +y2x (x +y )5的展开式中x 3y 3的系数为( ) A .5 B .10 C .15 D .203.(2020·全国Ⅱ理,3)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1 200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1 600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( ) A .10名 B .18名 C .24名 D .32名4.(2020·全国Ⅲ理,3)在一组样本数据中,1,2,3,4出现的频率分别为p 1,p 2,p 3,p 4,且∑i =14pi =1,则下面四种情形中,对应样本的标准差最大的一组是()A .p 1=p 4=0.1,p 2=p 3=0.4B .p 1=p 4=0.4,p 2=p 3=0.1C .p 1=p 4=0.2,p 2=p 3=0.3D .p 1=p 4=0.3,p 2=p 3=0.25.(2020·新高考全国Ⅰ,3)6名同学到甲、乙、丙三个场馆做志愿者,每名同学只去1个场馆,甲场馆安排1名,乙场馆安排2名,丙场馆安排3名,则不同的安排方法共有( ) A .120种 B .90种 C .60种 D .30种6.(2020·新高考全国Ⅰ,12)信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,…,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑( )A .若n =1,则H (X )=0B .若n =2,则H (X )随着p i 的增大而增大C .若p i =1n(i =1,2,…,n ),则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,…,m ,且P (Y =j )=p j +p 2m +1-j (j =1,2,…,m ),则H (X )≤H (Y )7.(2020·北京,3)在(x -2)5的展开式中,x 2的系数为( ) A .-5 B .5 C .-10 D .108.(2020·新高考全国Ⅱ,6)3名大学生利用假期到2个山村参加扶贫工作,每名大学生只去1个村,每个村至少1人,则不同的分配方案共有( ) A .4种 B .5种 C .6种 D .8种9.(2020·新高考全国Ⅱ,9)我国新冠肺炎疫情防控进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是( )A .这11天复工指数和复产指数均逐日增加B .这11天期间,复产指数增量大于复工指数的增量C .第3天至第11天复工复产指数均增大都超过80%D .第9天至第11天复产指数增量大于复工指数的增量10.(2020·天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47]内的个数为( )A .10B .18C .20D .3611.(2020·全国Ⅰ文,4)设O 为正方形ABCD 的中心,在O ,A ,B ,C ,D 中任取3点,则取到的3点共线的概率为( ) A.15 B.25 C.12 D.4512.(2020·全国Ⅰ文,5)某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i ,y i )(i =1,2,…,20)得到下面的散点图:由此散点图,在10℃至40℃之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是( ) A .y =a +bx B .y =a +bx 2 C .y =a +b e xD .y =a +b ln x13.(2020·全国Ⅱ文,3)如图,将钢琴上的12个键依次记为a 1,a 2,…,a 12.设1≤i <j <k ≤12.若k -j =3且j -i =4,则称a i ,a j ,a k 为原位大三和弦;若k -j =4且j -i =3,则称a i ,a j ,a k 为原位小三和弦.用这12个键可以构成的原位大三和弦与原位小三和弦的个数之和为( )A .5B .8C .10D .1514.(2020·全国Ⅱ文,4)在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1 200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05.志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者( ) A .10名 B .18名 C .24名 D .32名15.(2020·全国Ⅲ文,3)设一组样本数据x 1,x 2,…,x n 的方差为0.01,则数据10x 1,10x 2,…,10x n 的方差为( )A .0.01B .0.1C .1D .10 二、填空题1.(2020·全国Ⅱ理,14)4名同学到3个小区参加垃圾分类宣传活动,每名同学只去1个小区,每个小区至少安排1名同学,则不同的安排方法共有________种. 2.(2020·全国Ⅲ理,14)⎝⎛⎭⎫x 2+2x 6的展开式中常数项是________.(用数字作答) 3.(2020·天津,11)在⎝⎛⎭⎫x +2x 25的展开式中,x 2的系数是________. 4.(2020·天津,13)已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为________;甲、乙两球至少有一个落入盒子的概率为________.5.(2020·江苏,3)已知一组数据4,2a,3-a,5,6的平均数为4,则a 的值是________. 6.(2020·江苏,4)将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是________.7.(2020·浙江,12)二项展开式(1+2x )5=a 0+a 1x +a 2x 2+a 3x 3+a 4x 4+a 5x 5,则a 4=________,a 1+a 3+a 5=________.8.(2020·浙江,16)盒中有4个球,其中1个红球,1个绿球,2 个黄球,从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为ξ,则P (ξ=0)=________,E (ξ)=________. 三、解答题1.(2020·全国Ⅰ理,19)甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12.(1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率.2.(2020·全国Ⅱ理,18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)80i ix x =-=∑(,2021)9000i iy y =-=∑(,201))800ii ix y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r))niix y x y --∑((,2≈1.414.3.(2020·全国Ⅲ理,18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),4.(2020·新高考全国Ⅰ,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),5.(2020·新高考全国Ⅱ,19)为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和SO2浓度(单位:μg/m3),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且SO2浓度不超过150”的概率;(2)根据所给数据,完成下面的2×2列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与SO2浓度有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),6.(2020·北京,18)某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(1)分别估计该校男生支持方案一的概率,该校女生支持方案一的概率;(2)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(3)将该校学生支持方案二的概率估计值记为p0,假设该校一年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为p1,试比较p0与p1的大小.(结论不要求证明)7.(2020·江苏,23)甲口袋中装有2个黑球和1个白球,乙口袋中装有3个白球.现从甲、乙两口袋中各任取一个球交换放入另一口袋,重复n次这样的操作,记甲口袋中黑球个数为X n,恰有2个黑球的概率为p n,恰有1个黑球的概率为q n.(1)求p1,q1和p2,q2;(2)求2p n+q n与2p n-1+q n-1的递推关系式和X n的数学期望E(X n)(用n表示).8.(2020·全国Ⅰ文,17)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?9.(2020·全国Ⅱ文,18)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i =1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)80i ix x =-=∑(,2021)9000i iy y =-=∑(,201))800ii ix y x y =--=∑((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r))niix y x y --∑((,2≈1.414.10.(2020·全国Ⅲ文,18)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),。
全国一卷真题分析---概率统计
1.(2011年)根据以往统计资料,某地车主购买甲种保险的概率为0.5,购买乙种保险但不购买甲种保险的
概率为0.3,设各车主购买保险相互独立.
(Ⅰ)求该地1位车主至少购买甲、乙两种保险中的l种的概率;
(Ⅱ)X表示该地的l00位车主中,甲、乙两种保险都不购买的车主数.求X的期望.
2.(2012年)某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果
当天卖不完,剩下的玫瑰花作垃圾处理.(Ⅰ)若花店一天购进16朵玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,N
n )的函数解析式;(Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:
以100天记录的各需求量的频率作为
各需求量发生的概率.
(ⅰ)若花店一天购进16枝玫瑰花,X表示当天的利润(单位:元),求X的分布列、数学期望及方差;
(ⅱ)若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝?请说明理由.
3.(2013年)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中
优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,
这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的产品是优质品的概率都为1 2,
且各件产品是否为优质品相互独立.
(1)求这批产品通过检验的概率;
(2)已知每件产品检验费用为100元,凡抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.
1。
2020年高考试题数学(理科)概率、选择题1.(2020年高考浙江卷理科9)有5本不同的书,其中语文书2本,数学书2本,物理书1本.若将其随机的并排摆放到书架的同一层上,则同一科目的书都不相邻的概率(A) 1(B) 2(C) 3(D )45 5 5 5【答案】B一2A2 AnA^ A^A^A: 2【解析】由古典概型的概率公式得P 1 A3A2 A22.A55 52.(2020年高考辽宁卷理科5)从1, 2, 3, 4, 5中任取2各不同的数,事件A= "取到的2 个数之和为偶数”,事件B= "取到的2个数均为偶数”,则P (Bl A)=(A) 1 (B) 1 (C) 2(D) 18 4 5 2Ci 2 cl 1 u , 1解析:由题意nP(A)= —―5―, P(AB) = —= 一P(B I At=--------- =—.耳5 弓10 , PA 4小组,每位同学参加各个小组的可能性相则这两位同学参加同一个兴趣小组的概率为同,(A) 1(B) 1(C) - (D)-3 2 3 4解析:因为甲乙两位同学参加同一个小组有3种方法,两位同学个参加一个小组共有3 13 3 9种方法;所以,甲乙两位同学参加同一个小组的概率为- -9 3点评:本题考查排列组合、概率的概念及其运算和分析问题、解决问题的能力。
4.(2011年高考广东卷理科6)甲、乙两队断排球决赛.现在的憧&是甲队只要再忘一局就获冠军,乙队初再高两局才能得国军.若两队胜每扃的概率相同.则甲队获谆冠军的概率为()金太阳新课标资源网【解析】D.由题得甲队获得冠军有两种情况,第一局胜或第一局输第二局胜,所以甲队获 (1113)3 (2020年高考全国新课标卷理科4)有3个兴趣小组,甲、乙两位同学各自参加其中一个得冠军的概率p ————.所以选D.2 2 2 45.(2020年高考湖北卷理科7)如图,用K、A、A2三类不同的元件连成一个系统 .当K正常工作且A i 、A 2至少有一个正常工作时,系统正常工作 .已知K 、A 、A 2正常工作的概率依次为0.9、0.8、0.8 ,则系统正常工作的概率为B.0.864C.0.720D.0.576[-S]~~-in ———---- j L -----答案:B解析:系统正常工作概率为 C 2 0.9 0.8 (1 0.8) 0.9 0.8 0.8 0.864 ,所以选B.6. (2020年高考陕西卷理科 10)甲乙两人一起去“ 2020西安世园会”,他们约定,各自独立 地从1到6号景点中任选4个进行游览,每个景点参观1小时,则最后一小时他们同在一个景点的概率是(A) — (B) 1 (Q 9(D) 1369 36 6【答案】D1到6号景点中任选4个进行游览有C 6c 6c 5c 5c 4c 4c 1c 3种,且等可能,最后一小时他们同在一个景点有 C 6c 5c 5c 4c 4c 30种,则最后一小时他们同在一个7. (2020年高考四川卷理科 12)在集合1,2,3,4,5中任取一个偶数a 和一个奇数b 构成以原点为起点的向量 a= (a,b ).从所有得到的以原点为起点的向量中任取两个向量为邻边作 平行四边形.记所有作成的平行四边形的个数为 n ,其中面积不超过.4的平行四边形的个数为m ,则m () n(A) —(B) 1(C) 2(D)-15 3 5 3答案:B2解析:基本事件:从(2,1),(2,3),(2,5),(4,1),(4,5),(4,3)选取 2个,n C 6 3 5 15 .其中面积为2的平行四边形的个数(2,3)(4,5);(2,1)(4,3);(2,1)(4,1);其中面积为4的平行四 边形的为(2,3)(2,5);(2,1)(2,3) ; m=3+2=5 故 m — 1.n 15 3A.0.960【解析】:各自独立地从 景点的概率是p1111111C111111101C6 C6c5c5 C4c4c3c38. (2020年高考福建卷理科 4)如图,矩形 ABCN,点E 为边CD 的中点,若在矩形 ABCD内部随机取一个点 Q,则点Q 取自△ ABE 内部的概率等于8.12D.—3二、填空题:1 .(2020年高考浙江卷理科15)某毕业生参加人才招聘会,分别向甲、乙、丙三个公司投递2 .....................................、,了个人简历,假定该毕业生得到甲公司面试的概率为 上,得到乙、丙两公司面试的概率为3〜 C 、 1 J 、口…… P ( 0) 一,则随机变量的数学期望12 5【答案】53 2 . (2020年高考江西卷理科 12)小波通过做游戏的方式来确定周末活动,他随机地往单位圆内投掷一点,若此点到圆心白^距离大于。
概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型,学习某些离散型随机变量分布列及其期望、方差等内容,初步学会利用离散型随机变量思想描述和分析某些随机现象的方法,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§11-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.6.条件概率与事件的独立性条件概率:一般的,设A 、B 为两个事件,且P (A )>0,称P (B |A )=)()(A P B A P I 为在事件A 发生的条件下,事件B 发生的概率.一般把P (B |A )读作“A 发生的条件下B 发生的概率”.在古典概型中,用n (A )表示事件A 中基本事件的个数,则有P (B |A )=)()(A n B A n I .事件的独立性:设A 、B 为两个事件,如果P (B |A )=P (B ),则称事件A 与事件B 相互独立,并称事件A 、B 为相互独立事件.若A 、B 为两个相互独立事件,则A 与A 、A 与B 、A 与B 也都相互独立.若事件A 与事件B 相互独立,则P (A ∩B )=P (A )·P (B ).【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.5.在具体情境中,了解条件概率,了解两个事件相互独立的概念及独立事件的概率乘法公式,并能解决一些简单的实际问题.【例题分析】例1(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)} 由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P(Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 一个口袋中装有大小相同的2个红球,3个黑球和4个白球,从口袋中一次摸出一个球,摸出的球不再放回.(1)连续摸球2次,求第一次摸出黑球,第二次摸出白球的概率;(2)连续摸球2次,在第一次摸到黑球的条件下,求第二次摸到白球的概率;(3)如果摸出红球,则停止摸球,求摸球次数不超过3次的概率.【分析】本题是一个古典概型问题,因为基本事件空间中所含基本事件的个数较多,宜用排列组合公式计算,当然也可利用两个计数原理计数.本题第二问是条件概率问题.做第三问时,要分为三个事件:“第一次摸到红球”,“第一次摸到不是红球,第二次摸到红球”,“前两次摸到不是红球,第三次摸到红球”,显然三个事件是互斥事件.解:(1)从袋中依次摸出2个球共有29A 种结果,第一次摸出黑球、第二次摸出白球有3×4=12种结果,则所求概率6112291==A P (或6184931=⨯=P ). (2)设“第一次摸到黑球”为事件A ,“第二次摸到白球”为事件B ,则“第一次摸到黑球,且第二次摸到白球”为事件A ∩B ,又31)(=A P ,P (A ∩B )61=,所以或⋅==213161)|(A B P (或2184)|(==A B P ). (3)第一次摸出红球的概率为1912A A ,第二次摸出红球的概率为291217A A A ,第三次摸出红球的概率为391227A A A ,则摸球次数不超过3次的概率为⋅=++=12739122729121719122A A A A A A A A P 【评析】利用古典概型求解时,求基本事件的个数和事件发生的总数时求法要一致,若无序则都无序,若有序则都有序,分子和分母的标准要相同.在求事件个数时常用列举法(画树状图、列表、坐标系法),有时也与排列组合联系紧密,计算时灵活多变,但要注意分类讨论,做到不重不漏.要正确识别条件概率问题,理解P (A),P (A ∩B ),P (B |A )的含义.例4 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例5 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }.所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.例6 如图,用A 、B 、C 三类不同的元件连结成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,已知元件A 、B 、C 正常工作的概率为0.80、0.90、0.90,分别求系统N 1、N 2正常工作的概率.【分析】三个元件能否正常工作相互独立.当元件A 、B 、C 同时正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,而B 、C 至少有一个正常工作的概率可通过其对立事件计算.解:设元件A 、B 、C 正常工作为事件A 、B 、C ,则P (A )=0.8,P (B)=0.9,P (C)=0.9,且事件A 、B 、C 相互独立.(1)系统N 1正常工作的概率为p 1=P (A ·B ·C )=P (A )·P (B )·P (C )=0.80×0.90×0.90=0.648.(2)元件B 、C 至少有一个正常工作的概率为1-P (B ·C )=1-P (B )·P (C )=1-0.1×0.1=0.99,所以系统N 2正常工作的概率为p 2=P (A )·(1-P (B ·C ))=0.80×0.99=0.792.【评析】本题以串、并联为背景,重点在正确理解题意.在计算几个事件同时发生的概率时,要先判断各个事件之间是否相互独立.独立事件、互斥事件、对立事件的概率各有要求,要依据题目特点,巧妙地选用相关方法.例7 每次抛掷一枚质地均匀的骰子(六个面上分别标以数字1,2,3,4,5,6).(1)连续抛掷3次,求向上的点数之和为3的倍数的概率;(2)连续抛掷6次,求向上的点数为奇数且恰好出现4次的概率.【分析】向上点数之和为3的倍数共有6种情况,计数时要不重不漏;向上点数为奇数的概率为21,连续抛掷6次是独立重复试验. 解:(1)向上的点数之和为3的结果有1种情况,为6的结果共10种情况,为9的结果共25种情况,为12的结果共25种情况,为15的结果共10种情况,为18的结果共1种情况.所以⋅=⨯⨯+++++=3166611025251012P(2)因为每次抛掷骰子,向上的点数为奇数的概率为P =21, 根据独立重复试验概率公式有⋅==⋅⋅6415)21()21(24463C P 【评析】独立重复试验是一类重要的概率问题,要善于分析模型的特点,正确合理的解题.例8 某学校进行交通安全教育,设计了如下游戏,如图,一辆车模要直行通过十字路口,此时前方交通灯为红灯,且该车模前面已有4辆车模依次在同一车道上排队等候(该车道只可以直行或左转行驶).已知每辆车模直行的概率是53,左转行驶的概率是52,该路口红绿灯转换间隔时间均为1分钟.假设该车道上一辆直行去东向的车模驶出停车线需要10秒钟,一辆左转去北向的车模驶出停车线需要20秒钟,求:(1)前4辆车模中恰有2辆车左转行驶的概率;(2)该车模在第一次绿灯亮起时的1分钟内通过该路口的概率(汽车驶出停车线就算通过路口).【分析】该车模1分钟内通过路口包含2种情况:4辆车都直行,3辆车直行1辆车左转.解:(1)设前4辆车模中恰有2辆左转行驶为事件A ,则⋅=⨯=625216)52()53()(2224C A P (2)设该车在第一次绿灯亮起时的1分钟内通过该路口为事件B ,其中4辆车模均 直行通过路口为事件B 1,3辆直行1辆左转为事件B 2,则事件B 1、B 2互斥.=+=+=)()()()(2121B B P B B P B P ⋅=⨯+62529752)53()53(334444C C 【评析】善于从复杂的背景中发现线索,体会其实质.善于转化问题的叙述,恰当的分类.练习11-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.独立工作的两套报警系统遇危险报警的概率均为0.4,则遇危险时至少有一套报警系统报警的概率是( )A .0.16B .0.36C .0.48D .0.644.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题5.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.6.设每门高射炮命中飞机的概率都是0.6.今有一敌机来犯,要有99%的把握击中敌机,至少需要______门高射炮.7.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.8.一个口袋中有4个白球,2个黑球.有放回的取出3个球,如果第一次取出的是白球,则第三次取出的是黑球的概率为______;不放回的取出3个球,在第一次取出的是白球的条件下,第二次取出的是黑球的概率为______.三、解答题9.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.10.某个高中研究性学习小组共有9名学生,其中有3名男生和6名女生.在研究学习过程中,要进行两次汇报活动(即开题汇报和结题汇报),每次汇报都从这9名学生中随机选1人作为代表发言.设每人每次被选中与否均互不影响;(1)求两次汇报活动都是由小组成员甲发言的概率;(2)求男生发言次数不少于女生发言次数的概率.11.3名志愿者在10月1日至10月5日期间参加社区服务工作,若每名志愿者在这5天中任选两天参加社区服务工作,且各名志愿者的选择互不影响.求(1)这3名志愿者中在10月1日都参加社区服务工作的概率;(2)这3名志愿者中在10月1日至多有1人参加社区服务工作的概率.§11-2 概率(二)【知识要点】1.离散型随机变量及其分布列随机变量:如果随机试验的可能结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化的,我们把这样的变量X 叫做一个随机变量.如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量.离散型随机变量的分布列:设离散型随机变量X 的可能取值为x 1,x 2,…,x n ,X 取到i i ii 12+…+p n =1.离散型随机变量在某个范围取值的概率等于它取这个范围内各个值的概率和.其中0<p <1,q =1-,则称离散型随机变量服从参数为p 的二点分布.二项分布:一般的,在相同条件下重复地做n 次试验,各次试验的结果相互独立,称为n 次独立重复试验.在n 次独立重复试验中,事件A 恰好发生k 次的概率为==)(k X P k n k k n q p C -(其中p 为在一次试验中事件A 发生的概率,q =1-p ,k =0,1,…,n ).若将n次独立重复试验中事件A 发生的次数设为X ,则X 的分布列为超几何分布:一般的,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件(n ≤N ),这n 件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为m C C C m X P n Nm n M N m M ≤==--0()(≤l ,其中l 为n 和M中较小的一个).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N 、M 、n 的超几何分布.2.随机变量的数字特征及正态分布1122i i n n 了离散型随机变量的平均取值水平.称i i n i p X E xX D ⋅-=∑=21))(()(为随机变量X 的方差,它反映了离散型随机变量X 相对于期望的平均波动大小(或说离散程度),其算数平方根)(X D 为随机变量X 的标准差,记作σ (X ),方差(或标准差)越小表明X 的取值相对于期望越集中,否则越分散.均值与方差的性质:①E (aX +b )=aE (X )+b ②D (aX +b )=a 2D (X )若X 服从两点分布,则E (X )=p ,D (X )=pq ;若X ~B (n ,p ),则E (X )=np ,D (X )=npq . 正态曲线:函数),((21)(222)(+∞∝-∈=--x e x x σμσπϕ,其中μ ∈R ,σ >0)的图象为正态分布密度曲线,简称正态曲线.其特点有:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,关于x =μ 对称;③曲线在x =μ 处达到峰值σ2π1;④曲线与x 轴之间的面积为1;⑤当σ 一定时,曲线随着μ 的变化而沿x 轴平移;⑥当μ 一定时,曲线的形状由σ 决定.σ 越小,曲线越“瘦高”,表示总体的分布越集中;σ 越大,曲线越“矮胖”,表示总体的分布越分散.正态分布:如果对于任意实数a <b ,随机变量X 满足=≤<)(b X a P dx x ba )(ϕ⎰,则称X 的分布为正态分布;随机变量X 服从参数μ 、σ 的正态分布,记作N ~(μ ,σ 2).正态分布的三个常用数据:①P (μ -σ <X <μ +σ )=68.3%;②P (μ -2σ <X <μ +2σ )=95.4%;③P (μ -3σ <X <μ +3σ )=99.7%.【复习要求】①在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性.②通过实例,理解超几何分布及其导出过程,并能进行简单的应用.③通过实例,理解n 次独立重复试验的模型及二项分布,并能解决一些简单的实际问题. ④通过实例,理解取有限值的离散型随机变量期望、方差的概念,能计算简单离散型随机变量的期望、方差,并能解决一些实际问题.⑤通过实际问题,认识正态分布曲线的特点及曲线所表示的意义.【例题分析】例1 一袋中装有编号为1、2、3、4、5、6的6个大小相同的小球,现从中随机取出3个球,以X 表示取出球的最大号码,(1)求X 的分布列;(2)求X >4的概率;(3)求E (X ).【分析】随机变量X 可能取的值为3、4、5、6,应用古典概型求得X 取每一个值的概率,就可以写出分布列.解:(1)随机变量X 可能取的值为3、4、5、6,且,203)4(,2011)3(362336======C C X P C X P 3624)5(C C X P ==103206==,212010)6(3625====C C X P ,所求X 的分布列为(2)==+==>)6()5()4(X P X P X P ⋅54 (3).25.5216103520342013)(=⨯+⨯+⨯+⨯=X E 【评析】离散型随机变量的分布列反映了一次试验的所有可能结果(X 的所有可能取值),以及取得每个结果(X 的每一个值)的概率.书写分布列首先要根据具体情况正确分析X 可取的所有值,然后利用排列组合及概率的有关知识求得每个x i 所对应的概率p i ,最后列成表格.要注意不同的X 值所对应的事件之间是互斥的,求离散型随机变量在某一范围的概率等于它取这个范围内各个值的概率和.例2 袋中装有大小相同的5个红球、5个白球,现从中任取4个球,其中所含红球的个数为X ,写出X 的分布列,并求X 的期望.【分析】袋中共有10个球,从中任取4个,所含红球的个数为0、1、2、3、4,每个事件的概率可以利用古典概型求解.解:随机变量X 可取的值有0、1、2、3、4,)0(=X P =,42121054104505==⋅C C C )1(=X P =215210504103515==⋅C C C ,)2(=X P 21102101004102525===⋅C C C ,===⋅4101535)3(C C C X P 21050 215=,4212105)4(4100545==⋅==C C C X P , 分布列为2424213212211420)(=⨯+⨯-+⨯+⨯+⨯=X E 【评析】本题的随机变量X 服从参数为N ,M ,n 的超几何分布,其中N =10,M =5,n =4.例3 某人练习射击,每次击中目标的概率为31. (1)用X 表示击中目标的次数.①若射击1次,求X 的分布列和期望;②若射击6次,求X 的分布列和期望;(2)若他连续射击6次,设ξ为他第一次击中目标前没有击中目标的次数,求ξ的分布列;(3)他一共只有6发子弹,若击中目标,则不再射击,否则子弹打完为止,求他射击次数η 的分布列.【分析】射击问题常被看做是独立重复试验.ξ的取值为0到6,η 的取值为1到6. 解:(1)①X 服从二点分布⋅=31)(X E ②X 服从二项分布)6,,1,0()2()1()(),1,6(~66Λ===-k C k X P B k k k ,分布列为.236)(=⨯=X E (2)ξ的取值为0到6,ξ=k (k =0,1,…,5)表示第k +1次击中目标,前k 次都没击中目标,则P (ξ=k )=)5,,1,0(31)32(.Λ=k k ,ξ=6表示射击6次都未击中目标,==)6(ξP6)2(.ξ的分布列为(3)η 的取值为1到6.η =k (k =1,2,…,5)表示第k 次时第一次击中目标,==)(k P η 6;1)2(.1=-ηk 表示前5次都没有击中目标,5)2()6(==ξP .η 的分布列为“X =k ”.在计算满足二点分布和二项分布的随机变量的期望和方差时,可直接应用公式计算.例4 甲乙两名射手在一次射击中的得分为两个相互独立的随机变量X 和Y ,且X 和Y 的分布列为计算X 和Y 【分析】先由分布列所提供的数据用期望和方差公式计算,再根据实际意义作出分析. 解:E (X )=8.85,D (X )=2.2275;E (Y )=5.6,D (Y )=10.24.由于E (X )>E (Y ),说明甲射击的平均水平比乙高;由于D (X )<D (Y ),说明甲射击的环数比较集中,发挥比较稳定,乙射击的环数比较分散,技术波动较大,不稳定,由此可以看出甲比乙的技术好.【评析】正确记忆期望和方差的公式,在分布列中,期望是每个变量乘以它所对应的概率再相加,求方差要先求期望,再作差、平方、乘以相应概率再相加.科学对待计算结果,正确分析数据所表达的实际意义.例5 设b 和c 分别是先后抛掷一枚骰子得到的点数,用随机变量ξ表示方程x 2+bx +c =0实根的个数(重根按一个计).(1)求方程x 2+bx +c =0有实根的概率;(2)求在先后两次出现的点数中有5的条件下,方程x 2+bx +c =0有实根的概率;(3)若η =2ξ+1,求ξ、η 的数学期望和方差;【分析】本题概率问题是古典概型,要分别求出事件中所含元素的个数,第一问事件“二次方程有实根”等价于“∆=b 2-4c ≥0”,b 、c 的值都取自{1,2,3,4,5,6};第二问是条件概率问题;第三问先求ξ的期望和方差,再由公式求η 的期望和方差.解:(1)由题意知:设基本事件空间为Ω,记“方程x 2+bx +c =0没有实根”为事件A ,“方程x 2+bx +c =0有且仅有一个实根”为事件B ,“方程x 2+bx +c =0有两个相异实数”为事件C ,Ω中基本事件总数为36个,A 中的基本事件总数为17个,B 中的基本事件总数为2个,C 中的基本事件总数为17个.又因为B ,C 是互斥事件,故所求概率⋅=+=+=36193617362)()(C B B P P (2)记“先后两次出现的点数中有5”为事件D ,“方程x 2+bx +c =0有实数”为事件E ,由上面分析得D P D P (,3611)(=∩367)=E ,∴⋅==117)()()|(D P E D P D E P I (Ⅱ)由题意ξ的可能取值为0,1,2,则,3617}2{,181}1{,3617}0{======&ξξξP P P 故ξ的分布列为:所以.18173617·)12(181·)11(3617·(0-0-,136172181136170222=-+-+==⨯+⨯+⨯=ξξD E 9342)12(,312)12(2==+==+=+=ξξξξηηD D D E E E 【评析】本题是一道概率的综合题,由07山东卷改编而得.在古典概型中解决条件概率问题时,概率公式是=)|(A B P )()()()(A n B A n A P B A P I I =.具有线性关系的两个随机变量的期望和方差之间的关系是b X aE b aX E +=+)()(,)()(2X D a b aX D =+.例6 (1)设两个正态分布N (μ 1,21σ)(σ 1>0)和N (μ 2,22σ)(σ 2>0)的密度函数图象如图所示.则有( )。
专题15 概率与统计(解答题)1.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率.2.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,2021)8(0ii x x =-=∑,2021)9000(i i y y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)()(iinx y r x y --=∑1.414≈.3.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 24.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO浓度有关?附:22()()()()()n ad bcKa b c d a c b d-=++++,5.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p,试比较0p与1p的大小.(结论不要求证明)6.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).7.【2019年高考全国Ⅱ卷理数】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.8.【2019年高考天津卷理数】设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X的分布列和数学期望;(2)设M为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M发生的概率.9.【2019年高考北京卷理数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.10.【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i =表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i =,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i =为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.11.【2018年高考全国Ⅰ卷理数】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为)10(<<p p ,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p . (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ; (ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?12.【2018年高考全国Ⅱ卷理数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.13.【2018年高考全国Ⅲ卷理数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bc K a b c d a c b d -=++++,14.【2018年高考北京卷理数】电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.15.【2018年高考天津卷理数】已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查. (1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i )用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;(ii )设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率.。
(2020江西省上饶市一模)在贯彻中共中央、国务院关于精准扶贫政策的过程中,某单位在某市定点帮扶某村100户贫困户.为了做到精准帮扶,工作组对这100户村民的年收入情况、危旧房情况、患病情况等进行调查,并把调查结果转化为各户的贫困指标x .将指标x 按照[)0,0.2,[)0.2,0.4,[)0.4,0.6,[)0.6,0.8,[]0.8,1.0分成五组,得到如图所示的频率分布直方图.规定若00.6x ≤<,则认定该户为“绝对贫困户”,否则认定该户为“相对贫困户”;当00.2x ≤<时,认定该户为“亟待帮住户”.工作组又对这100户家庭的受教育水平进行评测,家庭受教育水平记为“良好”与“不好”两种.(1)完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:受教育水平良好受教育水平不好 总计 绝对贫困户 2相对贫困户 52总计100(2)上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.15 0.10 0.05 0.025 0k2.072 2.7063.8415.024专题 概率与统计大题肢解一统计案例与数学期望【肢解1】完成下面的列联表,并判断是否有95%的把握认为绝对贫困户数与受教育水平不好有关:受教育水平良好受教育水平不好 总计 绝对贫困户 2相对贫困户 52总计100【肢解2】上级部门为了调查这个村的特困户分布情况,在贫困指标处于[)00.4,的贫困户中,随机选取两户,用X 表示所选两户中“亟待帮助户”的户数,求X 的分布列和数学期望()E X .【解析】(1)由题意可知,绝对贫困户有()0.250.500.75++0.210030⨯⨯=(户),可得出如列联表:受教育水平良好受教育水平不好总计绝对贫困户 2 28 30 相对贫困户 18 5270总计2080 100()22100182825230702080K ⨯⨯-⨯=⨯⨯⨯ 4.762 3.841≈>. 故有95%的把握认为绝对贫困户数与受教育水平不好有关.(2)贫困指标在[)00.4,的贫困户共有()0.250.50.210015+⨯⨯=(户), “亟待帮助户”共有0. 250.21005⨯⨯=(户), 依题意X 的可能值为0,1,2,()210215307C P X C ===,()1110521510121C C P X C ===,()252152221C P X C ===, 则X 的分布列为X0 12P371021221故31022()012721213E X =⨯+⨯+⨯=.1.独立性检验的一般步骤:(1)根据样本数据制成2×2列联表; (2)根据公式K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )计算K 2的值;(3)查表比较K 2与临界值的大小关系,作统计判断. 2.求离散型随机变量ξ的均值与方差的方法:(1)理解ξ的意义,写出ξ可能取的全部值; (2)求ξ取每个值的概率; (3)写出ξ的分布列; (4)由均值的定义求E (ξ); (5)由方差的定义求D (ξ).【拓展1】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)年龄段[15,25) [25,35) [35,45) [45,55) [55,65) [65,75]频率 0.1 0.32 0.28 0.22 0.05 0.03 使用人数828241221若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?年龄低于45岁 年龄不低于45岁 使用手机支付 不使用手机支付参考数据:)(02k K P ≥ 0.0250.010 0.005 0.0010k3.841 6.635 7.879 10.828参考公式:()()()()22()n ad bc K a b c d a c b d -=++++.【解析】(1)由统计表可得,低于45岁人数为70人,不低于45岁人数为30人, 可得列联表如下:年龄低于45岁 年龄不低于45岁 使用手机支付 60 15 不使用手机支付1015于是有K2的观测值2100(60151510)14.28610.82875257030k ⨯⨯-⨯=≈⨯⨯⨯>. 故可以在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关.【拓展2】(2020届辽宁省沈阳市东北育才学校高三上学期第三次模拟)手机支付也称为移动支付,是指允许用户使用其移动终端(通常是手机)对所消费的商品或服务进行账务支付的一种服务方式.随着信息技术的发展,手机支付越来越成为人们喜欢的支付方式.某机构对某地区年龄在15到75岁的人群“是否使用手机支付”的情况进行了调查,随机抽取了100人,其年龄频率分布表和使用手机支付的人数如下所示:(年龄单位:岁)年龄段 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75] 频率 0.1 0.32 0.28 0.22 0.05 0.03 使用人数828241221(1)若以45岁为分界点,根据以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.001的前提下认为“使用手机支付”与年龄有关?年龄低于45岁 年龄不低于45岁 使用手机支付 不使用手机支付(2)若从年龄在[55,65),[65,75]的样本中各随机选取2人进行座谈,记选中的4人中“使用手机支付”的人数为X ,求随机变量X 的分布列和数学期望.【解析】由题意可知,X 的所有可能取值为0,1,2,3,相应的概率为:()223222531010C C P X C C ===,()112213223222225353215C C C C C P X C C C C ==+=,()11122322222222535313230C C C C C P X C C C C ==+=,()212222531315C C P X C C ===, 于是X 的分布列为:X 0 1 2 3P110 25 1330 115所以1213122()0123105301515E X =⨯+⨯+⨯+⨯=.1.(2019年湖北模拟)通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:男女总计爱好402060不爱好152540总计5545100(1)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由.(2)利用分层抽样的方法从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派2人参加某项校际挑战赛,求选出的2人中恰有1名女大学生的概率.附:P(K2≥k0)0.0500.0100.001k0 3.841 6.63510.828K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解析】(1)因为K2=100×(40×25-20×15)255×45×60×40≈8.249>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(2)由题意,抽取的6人中,有男生4名,分别记为a,b,c,d;女生2名,分别记为m,n.则抽取的结果共有15种:(a,b),(a,c),(a,d),(a,m),(a,n),(b,c),(b,d),(b,m),(b,n),(c,d),(c,m),(c,n),(d,m),(d,n),(m,n),设“选出的2人中恰有1名女大学生”为事件A,事件A所包含的基本事件有8种:(a,m),(a,n),(b,m),(b,n),(c,m),(c,n),(d,m),(d,n).则P(A)=815.故选出的2人中恰有1名女大学生的概率为815.2.(2019年湖北省宜昌模拟)某公司招收大学毕业生,经过综合测试录用了14名男生和6名女生,这20名毕业生的测试成绩如茎叶图所示(单位:分).公司规定:成绩在180分以上者到甲部门工作,在180分以下者到乙部门工作,另外只有成绩高于180分的男生才能担任助理工作.变式训练一(1)现用分层抽样的方法从甲、乙两部门中选取8人.若从这8人中再选3人,求至少有一人来自甲部门的概率;(2)若从甲部门中随机选取3人,用X表示所选人员中能担任助理工作的人数,求X的分布列及数学期望.【解析】(1)根据茎叶图可知,甲、乙两部门各有10人,用分层抽样的方法,应从甲、乙两部门中各选取21045⨯=人.记“至少有一人来自甲部门”为事件A,则()3 4 3 813114CP AC=-=.故至少有一人来自甲部门的概率为1314.(2)由题意可知,X的可能取值为0,1,2,3.()()()()03122130646464643333101010101311 0,1,2,3301026C C C C C C C CP X P X P X P XC C C C============,所以X的分布列为X0 1 2 3P1303101216所以()1311901233010265E X=⨯+⨯+⨯+⨯=.(2019河南洛阳市模拟)雾霾天气对人体健康有伤害,应对雾霾污染、改善空气质量的首要任务是控制PM 2.5,要从压减燃煤、严格控车、调整产业、强化管理、联防联控、依法治理等方面采取重大举措,聚焦重点领域,严格考核指标.某省环保部门为加强环境执法监管,派遣四个不同的专家组对A、B、C三个城市进行治霾落实情况抽查.(1)若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;(2)每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.大题肢解二二项分布【肢解1】若每个专家组随机选取一个城市,四个专家组选取的城市可以相同,也可以不同,求恰有一个城市没有专家组选取的概率;【肢解2】每一个城市都要由四个专家组分别对抽查情况进行评价,并对所选取的城市进行评价,每个专家组给检查到的城市评价为优的概率为12,若四个专家组均评价为优则检查通过不用复检,否则需进行复检.设需进行复检的城市的个数为X,求X的分布列和期望.【解析】(1)随机选取,共有34=81种不同方法,恰有一个城市没有专家组选取的有C13(C14A22+C24)=42种不同方法,故恰有一个城市没有专家组选取的概率为4281=1427.(2)设事件A:“一个城市需复检”,则P(A)=1-4)21(=1516,X的所有可能取值为0,1,2,3,P(X=0)=C03·3)161(=14 096,P(X=1)=C13·3)161(·1)1615(=454 096,P(X=2)=C23·1)161(·2)1615(=6754 096,P(X=3)=C33·3)1615(=3 3754 096.所以X的分布列为X 0123P14 096454 0966754 0963 3754 096由题意知X~B)1615,3(,所以E(X)=3×1516=4516.二项分布的期望与方差如果ξ~B(n,p),则用公式E(ξ)=np;D(ξ)=np(1-p)求解,可大大减少计算量.1.(2019四川成都诊断)某部门为了解一企业在生产过程中的用水量情况,对其每天的用水量做了记录,得到了大量该企业的日用水量的统计数据,从这些统计数据中随机抽取12天的数据作为样本,得到变式训练二如图所示的茎叶图(单位:吨).若用水量不低于95吨,则称这一天的用水量超标.(1)从这12天的数据中随机抽取3个,求至多有1天的 用水量超标的概率;(2)以这12天的样本数据中用水量超标的频率作为概率,估计该企业未来3天中用水量超标的天数,记随机变量X 为未来这3天中用水量超标的天数,求X 的分布列、数学期望和方差. 【解析】(1)记“从这12天的数据中随机抽取3个,至多有1天的用水量超标”为事件A ,则P (A )=C 14C 28C 312+C 38C 312=168220=4255.(2)以这12天的样本数据中用水量超标的频率作为概率,易知用水量超标的概率为31. X 的所有可能取值为0,1,2,3, 易知X ~B )31,3(,P (X =k )=C k 3kk-⋅⋅3)32()31(,k =0,1,2,3,则P (X =0)=827,P (X =1)=49,P (X =2)=29,P (X =3)=127.所以随机变量X 的分布列为X 0 1 2 3 P8274929127所以数学期望E (X )=3×13=1,D (X )=3×13×)311(-=23.2.(2020湖南师范大学附属中学高三上学期第二次月考)某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表:从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(1)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?(2)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X近似满足~(218,140)X N,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?【解析】(1)根据抽样调查数据,一、二等品所占比例的估计值为0.2000.3000.2600.0900.0250.875++++=,由于该估计值小于0.92,故不能认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定.(2)由频率分布直方图知,一、二、三等品的频率分别为0.375、0.5、0.125,故在样本中用分层抽样方法抽取的8件产品中,一等品3件,二等品4件,三等品1件,再从这8件产品中随机抽取4件,一、二、三等品都有的情况有2种:①一等品2件,二等品1件,三等品1件;②一等品1件,二等品2件,三等品1件,故所求的概率211121 3413414837C C C C C CPC+==.(3)“质量提升月”活动前,该企业这种产品的质量指标值的均值约为1700.0251800.11900.22000.32100.262200.092300.025⨯+⨯+⨯+⨯+⨯+⨯+⨯200.4=“质量提升月”活动后,产品质量指标值X近似满足()~218,140X N,则()218E X=. 所以,“质量提升月”活动后的质量指标值的均值比活动前大约提升了17.6.1.(2019云南省高考模拟)一个口袋中装有大小形状完全相同的红色球1个、黄色球2个、蓝色球*()n n N ∈个,现进行从口袋中摸球的游戏:摸到红球得1分、摸到黄球得2分、摸到蓝球得3分.若从这个口袋中随机的摸出2个球,恰有一个是黄色球的概率是158. (1)求n 的值;(2)从口袋中随机摸出2个球,设ξ表示所摸2球的得分之和,求ξ的分布列和数学期望()E ξ.【解析】(1)由题意有158231211=++n n C C C ,即03522=--n n ,解得3=n ; (2)ξ取值为3,4,5,6.则1112262(3)15C C P C ξ===,11213222664(4)15C C C P C C ξ==+=, 1123262(5)5C C P C ξ===,23261(6)5C P C ξ===, ξ的分布列为:ξ 34 5 6P215 415 25 15故242114()34561515553E ξ=⨯+⨯+⨯+⨯=. 2.(2020福建省厦门外国语学校高三上学期12月月考)自由购是通过自助结算方式购物的一种形式.某大型超市为调查顾客使用自由购的情况,随机抽取了100人,统计结果整理如下:20以下 [20,30) [30,40) [40,50) [50,60) [60,70] 70以上 使用人数312 17 6 4 2 0 未使用人数 0314363(1)现随机抽取1名顾客,试估计该顾客年龄在[30,50)且未使用自由购的概率;(2)从被抽取的年龄在BF 使用自由购的顾客中,随机抽取3人进一步了解情况,用X 表示这3人中年龄在[50,60)的人数,求随机变量X 的分布列及数学期望;(3)为鼓励顾客使用自由购,该超市拟对使用自由购的顾客赠送1个环保购物袋.若某日该超市预计有5000人购物,试估计该超市当天至少应准备多少个环保购物袋. 【解析】(1)在随机抽取的100名顾客中, 年龄在[30,50)且未使用自由购的共有3+14=17人,所以,随机抽取1名顾客,估计该顾客年龄在[30,50)且未使用自由购的概率为17100P =. (2)X 所有的可能取值为1,2,3,()124236115C C P X C ===,()214236325C C P X C ===,()304236135C C P X C ===. 所以X 的分布列为X1 2 3P1553 15所以X 的数学期望为131()1232555E X =⨯+⨯+⨯=. (3)在随机抽取的100名顾客中,使用自由购的共有3121764244+++++=人, 所以该超市当天至少应准备环保购物袋的个数估计为4450002200100⨯=.3.(2020广东省惠州市高三第三次调研)为发挥体育核心素养的独特育人价值,越来越多的中学将某些体育项目纳入到学生的必修课程.惠州市某中学计划在高一年级开设游泳课程,为了解学生对游泳的兴趣,某数学研究学习小组随机从该校高一年级学生中抽取了100人进行调查.(1)已知在被抽取的学生中高一(1)班学生有6名,其中3名对游泳感兴趣,现在从这6名学生中随机抽取3人,求至少有2人对游泳感兴趣的概率;(2)该研究性学习小组在调查中发现,对游泳感兴趣的学生中有部分曾在市级或市级以上游泳比赛中获奖,具体获奖人数如下表所示.若从高一(8)班和高一(9)班获奖学生中随机各抽取2人进行跟踪调查,记选中的4人中市级以上游泳比赛获奖的人数为ξ,求随机变量ξ的分布列及数学期望.班级一)1(一)2( 一)3( 一)4( 一)5( 一)6( 一)7( 一(8) 一(9) 一(10)⋯市级2233443342⋯比赛获奖人数 市级以上比赛获奖人数22 1 0 23 3 2 1 2⋯【解析】(1)记事件i A {=从6名学生抽取的3人中恰好有i 人有兴趣,i 0=,1,2,3}; 则2A 与3A 互斥,故所求概率为()()()()2323P 2P A A P A P A =+=+至少人感兴趣 213033333366C C C C C C ⋅⋅=+101202==; (2)由题意知,随机变量ξ的所有可能取值有0,1,2,3;()22342255C C 9P ξ0C C 50⋅===⋅,()11221234342255C C C C C 12P ξ1C C 25⋅⋅+⋅===⋅,()22111243242255C C C C C 3P ξ2C C 10⋅+⋅⋅===⋅ ()21242255C C 1P ξ3C C 25⋅===⋅. 则ξ的分布列为:ξ0 1 2 3p950 1225 310 125数学期望为()9241526E ξ0123505050505=⨯+⨯+⨯+⨯=. 4.(2019·河北高考模拟)某次招聘分为笔试和面试两个环节,且只有笔试过关者方可进入面试环节,笔试与面试都过关才会被录用.笔试需考完全部三科,且至少有两科优秀才算笔试过关,面试需考完全部两科且两科均为优秀才算面试过关.假设某考生笔试三科每科优秀的概率均为23,面试两科每科优秀的概率均为34. (1)求该考生被录用的概率;(2)设该考生在此次招聘活动中考试的科目总数为ξ,求ξ的分布列与数学期望. 【解析】(1)该考生被录用,说明该考生笔试与面试均得以过关.所以=P 3223221335[()+()]=3334412C ⨯⨯⨯. (2)易得ξ的可能取值为3 ,5 ,所以(=3)=1P ξ-3223221207[()+()]=1-=3332727C ⨯, 或(=3)=P ξ31231127()+()=33327C ⨯ ,所以20(=5)=1-(=3)=27P P ξξ,或(=5)=P ξ322322120()+()=33327C ⨯ ,ξ的分布列为:ξ3 5P727 2027所以720121()=3+5=272727E ξ⨯⨯. 5.(2019江西省新八校联考)某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:等级 标准果 优质果 精品果 礼品果 个数10304020(1)若将频率是为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;(结果用分数表示)(2)用样本估计总体,果园老板提出两种购销方案给采购商参考, 方案1:不分类卖出,单价为20元/kg . 方案2:分类卖出,分类后的水果售价如下:等级标准果优质果 精品果 礼品果 售价(元/kg ) 16182224从采购单的角度考虑,应该采用哪种方案?(3)用分层抽样的方法从这100个水果中抽取10个,再从抽取的10个水果中随机抽取3个,X 表示抽取的是精品果的数量,求X 的分布列及数学期望()E X .【解析】(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A ,则201()1005P A ==, 现有放回地随机抽取4个,设抽到礼品果的个数为X ,则1~(4,)5X B ,所以恰好抽到2个礼品果的概率为22244196(2)C ()()55625P X ===, (2)设方案2的单价为ξ,则单价的期望值为134216548848()1618222420.61010101010E ξ+++=⨯+⨯+⨯+⨯==, 因为()20E ξ>,所以从采购商的角度考虑,应该采用第一种方案. (3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个, 现从中抽取3个,则精品果的数量X 服从超几何分布,所有可能的取值为0,1,2,3,则36310C 1(0)C 6P X ===;2164310C C 1(1)C 2P X ===; 1264310C C 3(2)C 10P X ===;34310C 1(3)C 30P X ===, 所以X 的分布列如下:X0 1 2 3P1612 310 130所以11316()01236210305E X =⨯+⨯+⨯+⨯=.6.(2020山西省晋城市高三第一次模拟)“绿水青山就是金山银山”的生态文明发展理念已经深入人心,这将推动新能源汽车产业的迅速发展.下表是近几年我国某地区新能源乘用车的年销售量与年份的统计表:年份2014 20152016 2017 2018 销量(万台) 810132524某机构调查了该地区30位购车车主的性别与购车种类情况,得到的部分数据如下表所示:购置传统燃油车购置新能源车总计男性车主 6 24 女性车主 2 总计30(1)求新能源乘用车的销量y 关于年份x 的线性相关系数r ,并判断y 与x 是否线性相关; (2)请将上述22⨯列联表补充完整,并判断是否有90%的把握认为购车车主是否购置新能源乘用车与性别有关;(3)若以这30名购车车主中购置新能源乘用车的车主性别比例作为该地区购置新能源乘用车的车主性别比例,从该地区购置新能源乘用车的车主中随机选取50人,记选到女性车主的人数为X,求X 的数学期望与方差.参考公式:12211()()()()niii n niii i x x y y r x x y y ===--=--∑∑∑,22()()()()()n ad bc k a b c d a c b d -=++++,其中n a b c d =+++.63525≈,若0.9r >,则可判断y 与x 线性相关. 附表:20()P K k ≥0.10 0.05 0.025 0.010 0.001k2.7063.841 5.024 6.635 10.828【解析】(1)依题意,2014201520162017201820165x ++++==,810132524165y ++++==,故51()()(2)(8)(1)(6)192847iii x x y y =--=-⨯-+-⨯-+⨯+⨯=∑,521()411410ii x x =-=+++=∑,521()643698164254i i y y =-=++++=∑,则51552211()()47470.940.9102542635()()iii iii i x x y y r x x y y ===--===≈>⨯--∑∑∑故y 与x 线性相关.(2)依题意,完善表格如下:购置传统燃油车 购置新能源车 总计 男性车主 18 6 24 女性车主 2 4 6 总计2010302230(18426)15 3.75 2.70620102464K ⨯⨯-⨯===>⨯⨯⨯故有90%的把握认为购车车主是否购置新能源乘用车与性别有关. (3)依题意,该地区购置新能源车的车主中女性车主的概率为42105=, 则2(50,)5X B :, 所以2()50205E X =⨯=,22()50(1)1255D X =⨯⨯-=. 7.(2020云南省昆明市第一中学高三一轮检测)某城市为鼓励人们乘坐地铁出行,地铁公司决定按照乘客经过地铁站的数量实施分段优惠政策,不超过30站的地铁票价如下表:乘坐站数x 100≤<x2010≤<x2030x <≤票价(元)369现有甲、乙两位乘客同时从起点乘坐同一辆地铁,已知他们乘坐地铁都不超过30站,甲、乙乘坐不超过10站的概率分别为14,13;甲、乙乘坐超过20站的概率分别为12,13. (1)求甲、乙两人付费相同的概率;(2)设甲、乙两人所付费用之和为随机变量X ,求X 的分布列和数学期望. 【解析】(1)由题意知甲乘坐超过10站且不超过20站的概率为1111424--=,乙乘坐超过10站且不超过20站的概率为1111333--=, 设“甲、乙两人付费相同”为事件A ,则()11114343P A =⨯+⨯ 111233+⨯=,所以甲、乙两人付费相同的概率是13.(2)由题意可知X 的所有可能取值为:6,9,12,15,18.()11164312P X ==⨯=,()11943P X ==⨯ 111436+⨯=,()11112432P X ==⨯+ 11113433⨯+⨯=,()11112432P X ==⨯+ 1134⨯=,()11118236P X ==⨯=.因此X 的分布列如下:X6912 1518P11216131416所以X 的数学期望()1169126E X =⨯+⨯ 11121534+⨯+⨯ 1511864+⨯=. 8.(2020东北三省三校联合模拟)“移动支付、高铁、网购、共享单车”被称为中国的“新四大发明”.为了帮助50岁以上的中老年人更快地适应“移动支付”,某机构通过网络组织50岁以上的中老年人学习移动支付相关知识.学习结束后,每人都进行限时答卷,得分都在[]50,100内.在这些答卷(有大量答卷)中,随机抽出200份,统计得分绘出频率分布直方图如图.(1)求出图中a 的值,并求样本中,答卷成绩在[)80,90上的人数;(2)以样本的频率为概率,从参加这次答卷的人群中,随机抽取4名,记成绩在80分以上(含80分)的人数为X ,求X 的分布列和期望.【解析】(1)依题意,()2 376 2101,a a a a a ⨯++++=故0.005a =, 故成绩在[)80,90上的频率为600.3,a = 答卷成绩在[)80,90上的人数为2000.360; ⨯=(2)由样本的频率分布直方图知成绩在80分以上(含80分)的频率为2805a =, 依题意,24,5X B ⎛⎫- ⎪⎝⎭,故()04042381055625P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭,()31423216155625P X C ⎛⎫⎛⎫=== ⎪⎪⎝⎭⎝⎭, ()()22423442321623962,35562555625P X C P X C ⎛⎫⎛⎫⎛⎫⎛⎫====== ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭, ()4442316455625P X C α⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, 所以X 的分布列为X0 1 2 34P816252166252166259662516625所以X 的数学期望为()28455E X =⨯=.。
概率与统计(选择题、填空题)1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是()A.y a bx =+B.2y a bx =+C.e xy a b =+ D.ln y a b x=+2.【2020年高考全国II 卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A.10名B.18名C.24名D.32名3.【2020年高考全国Ⅲ理数】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是()A.14230.1,0.4p p p p ====B.14230.4,0.1p p p p ====C.14230.2,0.3p p p p ==== D.14230.3,0.2p p p p ====4.【2019年高考全国Ⅲ卷理数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为A .0.5B .0.6C .0.7D .0.85.【2019年高考全国Ⅱ卷理数】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差6.【2018年高考全国Ⅱ卷理数】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .112B .114C .115D .1187.【2018年高考全国Ⅰ卷理数】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例建设后经济收入构成比例则下面结论中不正确的是A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半8.【2018年高考全国Ⅲ卷理数】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,(4)(6)P X P X =<=,则p =A.0.7B.0.6C.0.4D.0.39.【2018年高考全国Ⅰ卷理数】下图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构△的三边所围成的区域记成,三个半圆的直径分别为直角三角形ABC的斜边BC,直角边AB,AC.ABC为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,p2,p3,则A.p1=p2B.p1=p3C.p2=p3D.p1=p2+p310.【2017年高考全国Ⅲ卷理数】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳11.【2017年高考全国Ⅰ卷理数】如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A.14B.π8C.12D.π412.【2019年高考全国Ⅱ卷理数】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为______________.13.【2019年高考全国Ⅰ卷理数】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是______________.14.【2017年高考全国Ⅱ卷理数】一批产品的二等品率为0.02,从这批产品中每次随机取一件,有放回地抽取100次,X表示抽到的二等品件数,则DX ______________.[。
专题15 概率与统计(解答题)1.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116.(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684 ---=.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为11117 8168816+++=.2.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i,y i)(i=1,2,…,20),其中x i和y i分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160iix ==∑,2011200iiy ==∑,2021)8(0ii x x =-=∑,2021)9000(i i y y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)()(iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000. (2)样本(,)i i x y (1,2,,20)i =的相关系数20)()0.943(iix y y x r --===≈∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.3.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 2【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 4.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=. (2)根据抽查数据,可得22⨯列联表:(3)根据(2)的列联表得2100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯.由于7.484 6.635>,故有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关.5.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明) 【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313()(1)()(1)3433436C -+-=; (Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题. 6.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)a=0.35,b=0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.7.【2019年高考全国Ⅱ卷理数】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【答案】(1)0.5;(2)0.1.【解析】(1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1–0.5)×(1–0.4)=0.5.(2)X=4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1–0.4)+(1–0.5)×0.4]×0.5×0.4=0.1.8.【2019年高考天津卷理数】设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望; (2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率. 【答案】(1)分布列见解析,()2E X =;(2)20243. 【分析】本小题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.【解析】(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故2~(3,)3X B ,从而3321()C ()(),0,1,2,333kkkP X k k -===.所以,随机变量X 的分布列为随机变量X 的数学期望()323E X =⨯=.(2)设乙同学上学期间的三天中7:30之前到校的天数为Y , 则2~(3,)3Y B ,且{3,1}{2,0}M X Y X Y =====. 由题意知事件{3,1}X Y ==与{2,0}X Y ==互斥,且事件{3}X =与{1}Y =,事件{2}X =与{0}Y =均相互独立, 从而由(1)知()({3,1}{2,0})P M P X Y X Y =====(3,1)(2,0)P X Y P X Y ===+== (3)(1)(2)(0)P X P Y P X P Y ===+== 824120279927243=⨯+⨯=. 9.【2019年高考北京卷理数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(1)0.4;(2)分布列见解析,E (X )=1;(3)见解析.【解析】(1)由题意知,样本中仅使用A 的学生有18+9+3=30人,仅使用B 的学生有10+14+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100−30−25−5=40人.所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率估计为400.4100=. (2)X 的所有可能值为0,1,2.记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”. 由题设知,事件C ,D 相互独立,且93141()0.4,()0.63025P C P D ++====. 所以(2)()()()0.24P X P CD P C P D ====,(1)()P X P CD CD == ()()()()P C P D P C P D =+0.4(10.6)(10.4)0.6=⨯-+-⨯0.52=,(0)()()()0.24P X P CD P C P D ====.所以X 的分布列为故X 的数学期望()00.2410.5220.241E X =⨯+⨯+⨯=.(3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额都大于2000元”. 假设样本仅使用A 的学生中,本月支付金额大于2000元的人数没有变化, 则由上个月的样本数据得33011()C 4060P E ==. 答案示例1:可以认为有变化. 理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2000元的人数发生了变化,所以可以认为有变化. 答案示例2:无法确定有没有变化.理由如下: 事件E 是随机事件,P (E )比较小,一般不容易发生, 但还是有可能发生的,所以无法确定有没有变化.10.【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i =表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i =,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i =为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.【答案】(1)分布列见解析;(2)(i)证明见解析,(ii)45 127p =,解释见解析. 【解析】X 的所有可能取值为1,0,1-.(1)(1)P X αβ=-=-,(0)(1)(1)P X αβαβ==+--, (1)(1)P X αβ==-,所以X 的分布列为(2)(i )由(1)得0.4,0.5,0.1a b c ===.因此110.40.5 0.1i i i i p p p p -+=++,故110.1()0.4()i i i i p p p p +--=-, 即114()i i i i p p p p +--=-. 又因为1010p p p -=≠, 所以1{}(0,1,2,,7)i i p p i +-=为公比为4,首项为1p 的等比数列.(ii )由(i )可得88776100p p p p p p p p =-+-++-+877610()()()p p p p p p =-+-++-81413p -=.由于8=1p ,故18341p =-, 所以44433221101( 411()327)(5())p p p p p p p p p p -=-+-+-+=-=. 4p 表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时, 认为甲药更有效的概率为410.0039257p =≈, 此时得出错误结论的概率非常小,说明这种试验方案合理.11.【2018年高考全国Ⅰ卷理数】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为)10(<<p p ,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p . (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用. (i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ; (ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 【答案】(1)0.1;(2)(i )490,(ii )应该对余下的产品作检验.【解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-. 因此2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =,当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数, 依题意知(180,0.1)YB ,20225X Y =⨯+,即4025X Y =+.所以(4025)4025490EX E Y EY =+=+=.(ii )如果对余下的产品作检验,则这一箱产品所需要的检验费为400元. 由于400EX >,故应该对余下的产品作检验.12.【2018年高考全国Ⅱ卷理数】下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1217,,…,)建立模型①:ˆ30.413.5y t =-+;根据2010年至2016年的数据(时间变量t 的值依次为127,,…,)建立模型②:ˆ9917.5y t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案】(1)模型①:226.1亿元,模型②:256.5亿元;(2)利用模型②得到的预测值更可靠,理由见解析.【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为ˆ30.413.519226.1y=-+⨯=(亿元). 利用模型②,该地区2018年的环境基础设施投资额的预测值为ˆ9917.59256.5y=+⨯=(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:(Ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线30.413.5y t =-+上下.这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型ˆ9917.5yt =+可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(Ⅰ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理.说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.13.【2018年高考全国Ⅲ卷理数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:()()()()()22n ad bcKa b c d a c b d-=++++,【答案】(1)第二种生产方式的效率更高,理由见解析;(2)列联表见解析;(3)有99%的把握认为两种生产方式的效率有差异.【解析】(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高. (iii )由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv )由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知7981802m +==. 列联表如下:(3)由于2240(151555)10 6.63520202020K ⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异. 14.【2018年高考北京卷理数】电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.【答案】(1)0.025;(2)0.35;(3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.【解析】(1)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数是200×0.25=50. 故所求概率为500.0252000=. (2)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评”. 故所求概率为P (AB AB +)=P (AB )+P (AB ) =P (A )(1–P (B ))+(1–P (A ))P (B ). 由题意知:P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (3)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ.15.【2018年高考天津卷理数】已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查. (1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i )用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;(ii )设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率.【答案】(1)分别抽取3人,2人,2人;(2)(i )分布列见解析,12()7E X =,(ii )67. 【解析】(1)由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2, 由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人. (2)(i )随机变量X 的所有可能取值为0,1,2,3.P (X =k )=34337C C C k k-⋅(k =0,1,2,3).所以,随机变量X 的分布列为随机变量X的数学期望11218412 ()0123353535357E X=⨯+⨯+⨯+⨯=.(ii)设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(i)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=67.所以,事件A发生的概率为67.。
(12)概率与统计1、用随机数表法从100名学生(其中男生40名)中抽取20名参加一项文体活动,某男生被抽到的可能性是( )A.110B.12C.15D.252、某学校为了解1000名新生的近视情况,将这些学生编号为000,001,002, (999)从这些新生中用系统抽样的方法抽取100名学生进行检查,若036号学生被抽到,则下面4名学生中被抽到的是()A. 008号学生B. 200号学生C. 616号学生D. 815号学生3、根据新高考改革方案,某地高考由文理分科考试变为“3+3”模式考试.某学校为了解高一年级425名学生选课情况,在高一年级下学期进行模拟选课,统计得到选课组合排名前4种如下表所示,其中物理、化学、生物为理科,政治、历史、地理为文科,“√”表示选择该科,“×”表示未选择该科,根据统计数据,下列判断错误..的是()A.前4种组合中,选择生物学科的学生更倾向选择两理一文组合B.前4种组合中,选择两理一文的人数多于选择两文一理的人数C.整个高一年段,选择地理学科的人数多于选择其他任一学科的人数D.整个高一年段,选择物理学科的人数多于选择生物学科的人数4、已知一组数据的频率分布直方图如图所示则众数、中位数、平均数分别为( )A.63、64、66B.65、65、67C.65、64、66D.64、65、645、为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l和2l,两人计算知x相同, y也相同,下列正确的是( )A. 1l与2l重合B. 1l与2l一定平行C. 1l与2l相交于点(),x yD.无法判断1l和2l是否相交6、从一箱产品中随机地抽取一件,设事件A={抽到一等品},事件B={抽到二等品},事件C={抽到三等品},且已知()0.65P A=,()0.2P B=,()0.1P C=,则事件“抽到的产品不是一等品”的概率为( )A. 0.7B. 0.65C. 0.35D. 0.37、《西游记》《三国演义》《水浒传》《红楼梦》我国古典小说四大名著,若在这四大名著中任取2种进行阅读,则取到《红楼梦》的概率为()A. 23B.12C.13D.148、如图是一个中心对称的几何图形,已知大圆半径为2,以半径为直径画出两个半圆,在大圆内随机取一点,则此点取自阴影部分的概率为( )A.18B.π8C.14D.129、甲、乙两人参加“社会主义价值观”知识竞赛,甲、乙两人能荣获一等奖的概率分別为2 3和34,甲、乙两人是否获得一等奖相互独立,则这两个人中恰有一人获得一等奖的概率为( ) A.34B.23C.57D.51210、设随机变量,X Y 满足:31Y X =-,()2,X B p ~,若()519P X ≥=,则()D Y =( )A .4B .5C .6D .711、某药厂选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:Pa k )的分组区间为12,1313,1414,1515,16[),[),[),[),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组.如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,则第三组的人数为__________.12、一个骰子连续投2次,点数积大于21的概率__________.13、如图,在一个边长为1的正方形中随机撒入100粒豆子,恰有60粒落在阴影区域内,则该阴影区域的面积约为___。
专题09 概率与统计1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是 A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.【2020年高考全国II 卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者 A .10名 B .18名C .24名D .32名【答案】B【解析】由题意,第二天新增订单数为50016001200900+-=,设需要志愿者x 名,500.95900x≥,17.1x ≥,故需要志愿者18名. 故选:B【点晴】本题主要考查函数模型的简单应用,属于基础题.3.【2020年高考全国III 卷理数】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是 A .14230.1,0.4p p p p ==== B .14230.4,0.1p p p p ==== C .14230.2,0.3p p p p ==== D .14230.3,0.2p p p p ====【答案】B【解析】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65A s =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85B s =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05C s =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45D s =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组标准差最大. 故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是 A .62% B .56% C .46%D .42%【答案】C【解析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅, 则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-= 所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%. 故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.5.【2020年高考山东】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y ) 【答案】AC【解析】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确. 对于B 选项,若2n =,则1,2i =,211p p =-, 所以()()()121121log 1log 1H X p p p p =-⋅+-⋅-⎡⎤⎣⎦, 当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误. 对于C 选项,若()11,2,,i p i n n==,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m jP Y j p p +-==+(1,2,,j m =).()2222111log log mmi i i i i iH X p p p p ===-⋅=⋅∑∑ 122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅. ()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅++⋅+++⋅+++12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++由于()01,2,,2i p i m >=,所以2111i i m i p p p +->+,所以222111log log i i m ip p p +->+, 所以222111log log i i i i m ip p p p p +-⋅>⋅+, 所以()()H X H Y >,所以D 选项错误. 故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.6.【2020年高考江苏】已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是 ▲ . 【答案】2【解析】∵数据4,2,3,5,6a a -的平均数为4 ∴4235620a a ++-++=,即2a =. 故答案为:2.【点睛】本题主要考查平均数的计算和应用,比较基础.7.【2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____. 【答案】19【解析】根据题意可得基本事件数总为6636⨯=个.点数和为5的基本事件有()1,4,()4,1,()2,3,()3,2共4个. ∴出现向上的点数和为5的概率为41369P ==. 故答案为:19. 【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题. 8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为A .10B .18C .20D .36【答案】B【解析】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=, 则区间[)5.43,5.47内零件的个数为:800.22518⨯=. 故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题. 9.【2020年高考天津】已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________. 【答案】16 23【解析】甲、乙两球落入盒子的概率分别为11,23, 且两球是否落入盒子互不影响, 所以甲、乙都落入盒子概率为111236⨯=, 甲、乙两球都不落入盒子的概率为111(1)(1)233-⨯-=, 所以甲、乙两球至少有一个落入盒子的概率为23. 故答案为:16;23. 【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础题.10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为ξ,则(0)P ξ==_______,()E ξ=_______. 【答案】13,1 【解析】因为0ξ=对应事件为第一次拿红球或第一次拿绿球,第二次拿红球, 所以1111(0)4433P ξ==+⨯=, 随机变量0,1,2ξ=,212111211(1)434324323P ξ==⨯+⨯⨯+⨯⨯=,111(2)1333P ξ==--=,所以111()0121333E ξ=⨯+⨯+⨯=.故答案为:1;13.【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求解能力,属基础题.的11.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率. 【解析】(1)甲连胜四场的概率为116. (2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛. 比赛四场结束,共有三种情况: 甲连胜四场的概率为116; 乙连胜四场的概率为116; 丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684---=. (3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18. 因此丙最终获胜的概率为111178168816+++=.12.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,2021)8(0ii x x =-=∑,2021)9000(i i y y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)()(iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000. (2)样本(,)i i x y (1,2,,20)i =的相关系数20)()0.943(iix y y x r --===≈∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.13.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 2【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 14.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=. (2)根据抽查数据,可得22⨯列联表:(3)根据(2)的列联表得22100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯. 由于7.484 6.635>,故有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关.15.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明) 【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313()(1)()(1)3433436C -+-=; (Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.2020模拟篇1.【2020·广东省高三二模】高二某班共有45人,学号依次为1、2、3、…、45,现按学号用系统抽样的办法抽取一个容量为5的样本,已知学号为6、24、33的同学在样本中,那么样本中还有两个同学的学号应为 A .15,43 B .15,42C .14,43D .14,42【答案】B【解析】由题可知,该班共有45人,按学号用系统抽样的办法抽取一个容量为5的样本, 则抽到的每个同学的学号之间的间隔为:4595=, 而已知学号为6、24、33的同学在样本中,即抽到的第一个学号为6,则第二个学号为:6+9=15, 第三个学号为:15+9=24,则第四个学号为:24+9=33, 第五个学号为:33+9=42,所以样本中还有两个同学的学号应为:15,42. 故选:B.2.【2020·黑龙江省大庆实验中学高三月考(理)】设不等式组00x y x +≥⎧⎪⎨-≤⎪⎩表示的平面区域为Ω,若从圆C :224x y +=的内部随机选取一点P ,则P 取自Ω的概率为A .524B .724C .1124D .1724【答案】B【解析】作出Ω中在圆C 内部的区域,如图所示,因为直线0x y +=,0x -=的倾斜角分别为34π,6π, 所以由图可得P 取自Ω的概率为3746224πππ-=.故选:B【点睛】本小题主要考查几何概型的计算,考查线性可行域的画法,属于基础题.3.【2020·河南省高三三模】“二进制”来源于我国古代的《易经》,该书中有两类最基本的符号:“─”和“﹣﹣”,其中“─”在二进制中记作“1”,“﹣﹣”在二进制中记作“0”.如符号“☱”对应的二进制数011(2)化为十进制的计算如下:011(2)=0×22+1×21+1×20=3(10).若从两类符号中任取2个符号进行排列,则得到的二进制数所对应的十进制数大于2的概率为A .12 B .13C .23D .14【答案】D【解析】根据题意,不同符号可分为三类:第一类:由两个“─”组成,其二进制为:11(2)=3(10); 第二类:由两个“﹣﹣“组成,其二进制为:00(2)=0(10);第三类:由一个“─”和一个“﹣﹣”组成,其二进制为:10(2)=2(10),01(2)=1(10), 所以从两类符号中任取2个符号排列,则组成不同的十进制数为0,1,2,3, 则得到的二进制数所对应的十进制数大于2的概率P 14=. 故选:D .【点睛】本题主要考查了古典概型及其概率的计算,以及转化的应用,意在考查学生的计算能力和应用能力,属于中档试题.4.【2020·河南省高三三模】随着2022年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.下面是2012年至2018年中国雪场滑雪人次(万人次)与同比增长率的统计图,则下面结论中不正确的是A .2013年至2018年,中国雪场滑雪人次逐年增加B .2013年至2015年,中国雪场滑雪人次和同比增长率均逐年增加C .2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等D .2018年与2016年相比,中国雪场滑雪人次增长率约为30.5% 【答案】C【解析】由2012年至2018年中国雪场滑雪人次(万人次)与同比增长率的统计图,得:对于A ,2013年至2018年,中国雪场滑雪人次逐年增加,故A 正确;对于B ,2013年至2015年,中国雪场滑雪人次和同比增长率均逐年增加,故B 正确; 对于C ,2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等, 但是同比增长人数也不相等,2018年比2013年增长人数多,故C 错误; 对于D ,2018年与2016年相比,中国雪场滑雪人次增长率约为:19701510100%30.5%1510-⨯≈.故D 正确.故选:C .【点睛】本题考查统计图表的应用,考查学生的数据分析能力,属于基础题.5.【2020·山东省邹城市第一中学高三其他】2020年初,新型冠状病毒(19COVID -)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:由表格可得y 关于x 的二次回归方程为2ˆ6y x a =+,则此回归模型第4周的残差(实际值与预报值之差)为 A .5 B .4C .1D .0【答案】A【解析】设2t x =,则()11491625115t =++++=,()12173693142585y =++++= 586118a =-⨯=-,所以2ˆ68yx =-.令4x =,得2444936485ˆe y y =-=-⨯+=. 故选:A6.【2020·四川省绵阳南山中学高三一模】从标号分别为1、2、3、4、5的5张标签中随机抽取一张,放回后再随机抽取一张,则抽得的第一张标签的标号与第二张标签的标号恰好相差1的概率为 A .45 B .25C .425D .825【答案】D【解析】从标号分别为1、2、3、4、5的5张标签中随机抽取一张,放回后再随机抽取一张, 所有的基本事件数为2525=,其中,事件“抽得的第一张标签的标号与第二张标签的标号恰好相差1”所包含的基本事件有:()1,2、()2,1、()2,3、()3,2、()3,4、()4,3、()4,5、()5,4,共8种情况,因此,所求事件的概率为825P =. 故选:D.【点睛】本题考查利用古典概型的概率公式求事件的概率,一般利用列举法列举出基本事件,考查计算能力,属于基础题.7.【2020·四川省阆中中学高三其他】中国古代十进制的算筹计数法,在数学史上是一个伟大的创造,算筹实际上是一根根同长短的小木棍.如图,是利用算筹表示数1-9的一种方法.例如:3可表示为“≡”,26可表示为“=⊥”,现有6根算筹,据此表示方法,若算筹不能剩余,则可以用1-9这9个数字表示两位数中,能被3整除的概率是A .518B .718C .716D .516【答案】D【解析】1根算筹只能表示1,2根根算筹可以表示2和6,3根算筹可以表示3和7,4根算筹可以表示4和8,5根算筹可以表示5和9,因此6根算筹表示的两位数有15,19,51,91,24,28,64,68,42,82,46,86,37,33,73,77共16个,其中15,51,24,42,33共5个可以被3整除, 所以所求概率为516P =. 故选:D .【点睛】本题考查古典概型,考查中国古代数学文化,解题关键是用列举法写出6根算筹所能表示的两位数.8.【2020·山西省高三月考】勒洛三角形是具有类似圆的“定宽性”的曲线,它是由德国机械工程专家、机构运动学家勒洛首先发现,其作法是:以等边三角形每个顶点为圆心,以边长为半径,在另两个顶点间作一段弧,三段弧围成的曲边三角形就是勒洛三角形.如图中的两个勒洛三角形,它们所对应的等边三角形的边长比为1:3,若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率是A .13BC .19D 【答案】C【解析】设图中的小的勒洛三角形所对应的等边三角形的边长为a ,则小勒洛三角形的面积2221(32642a a S a ππ=⨯-⨯=, 因为大小两个勒洛三角形,它们所对应的等边三角形的边长比为1:3,所以在勒洛三角形的面积为2S ==若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率为1219S S P ==, 故选:C【点睛】此题考查概率与几何概型、平面图形等知识,考查阅读能力和数学计算能力,属于中档题. 9.【2020·山东省邹城市第一中学高三其他】下列命题中假命题是 A .若随机变量ξ服从正态分布()21,N σ,()40.79P ξ≤=,则()20.21P ξ≤-=;B .已知直线l ⊥平面α,直线//m 平面β,则“//αβ”是“l m ⊥”的必要不充分条件;C .若//a b ,则a 在b 方向上的正射影的数量为aD .命题:0,1∃<->x p x e x 的否定:0,1⌝∀≥-≤x p x e x 【答案】BCD【解析】对于A ,随机变量ξ服从正态分布()21,N σ,所以图像关于1x =对称,根据()40.79P ξ≤=, 可得()()4140.21p p ξξ≥=-≤=,所以()()240.21P p ξξ≤-=≥=,故A 正确; 对于B ,直线l ⊥平面α,直线//m 平面β,若//αβ,则l m ⊥是真命题;若l m ⊥,则//αβ是假命题, 所以“//αβ”是“l m ⊥”的充分不必要条件,故B 错误;对于C ,若//a b ,则a 在b 方向上的正射影的数量为a 或a -,故C 错误; 对于D ,命题:0,1∃<->xp x e x 的否定:0,1xp x e x ⌝∀<-≤,故D 错误; 故选:BCD【点睛】本题主要考查了正态分布概率的性质、充分性与必要性的定义、向量数量积的几何意义、特称命题的否定变换原则,属于基础题.10.【2020·上海高三二模】某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.【答案】56【解析】该社区共有14028080500++=户,利用分层抽样的方法, 中等收入家庭应选28010056 500⨯=户,故答案为:56.【点睛】本题考查分层抽样,注意抽取比例是解决问题的关键,属于基础题.11.【2020·辽河油田第三高级中学高三三模】辊子是客家传统农具,南方农民犁开田地后,仍有大的土块.农人便用六片叶齿组成辊轴,两侧装上木板,人跨开两脚站立,既能掌握平衡,又能增加重量,让牛拉动辊轴前进,压碎土块,以利于耕种.这六片叶齿又对应着菩萨六度,即布施、持戒、忍辱、精进、禅定与般若.若甲、乙每人依次有放回地从这六片叶齿中随机取一片,则这两人选的叶齿对应的“度”相同的概率为______.【答案】1 6【解析】记布施,持戒,忍辱,精进,禅定,般若分别为a,b,c,d,e,f,则基本事件有(),a a,(),a b,(),a c,(),a d,(),a e,(),a f,(),b a,(),b b,(),b c,(),b d,(),b e,(),b f,(),c a,(),c b,(),c c,(),c d,(),c e,(),c f,(),d a,(),d b,(),d c,(),d d,(),d e,(),d f,(),e a,(),e b,(),e c,(),e d,(),e e,(),e f,(),f a,(),f b,(),f c,(),f d,(),f e,(),f f,共36个,其中符合条件的有6个,故所求概率61366P==.故答案为1 6 .12.【2020·辽宁省沈阳二中高三其他】为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记X 表示学生的考核成绩,并规定85X ≥为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:(Ⅰ)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核优秀的概率; (Ⅰ)从图中考核成绩满足[]80,89X ∈的学生中任取2人,求至少有一人考核优秀的概率; (Ⅰ)记()P a X b ≤≤表示学生的考核成绩在区间[],a b 的概率,根据以往培训数据,规定当8510.510x P ⎛-⎫≤≥ ⎪⎝⎭时培训有效.请根据图中数据,判断此次中学生冰雪培训活动是否有效,并说明理由. 【答案】(Ⅰ)730(Ⅰ)35(Ⅰ)见解析【解析】(Ⅰ)设这名学生考核优秀为事件A ,由茎叶图中的数据可以知道,30名同学中,有7名同学考核优秀, 所以所求概率()P A 约为730(Ⅰ)设从图中考核成绩满足[]80,89X ∈的学生中任取2人, 至少有一人考核成绩优秀为事件B ,因为表中成绩在[]80,89的6人中有2个人考核为优,所以基本事件空间Ω包含15个基本事件,事件B 包含9个基本事件, 所以93()155P B == (Ⅰ)根据表格中的数据,满足85110x -≤的成绩有16个, 所以8516810.5103015x P ⎛-⎫≤==>⎪⎝⎭所以可以认为此次冰雪培训活动有效.13.【2020·重庆高三月考】某市积极贯彻落实国务院《“十三五”节能减排综合工作方案》,空气质量明显改善.该市生态环境局统计了某月(30天)空气质量指数,绘制成如下频率分布直方图.已知空气质量等级与空气质量指数对照如下表:(1)根据频率分布直方图估计,在这30天中,空气质量等级为优或良的天数;(2)根据体质检查情况,医生建议:当空气质量指数高于90时,市民甲不宜进行户外体育运动;当空气质量指数高于70时,市民乙不宜进行户外体育运动(两人是否进行户外体育运动互不影响).①从这30天中随机选取2天,记乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数为X,求X的分布列和数学期望;②以该月空气质量指数分布的频率作为以后每天空气质量指数分布的概率(假定每天空气质量指数互不影响),甲、乙两人后面分别随机选择3天和2天进行户外体育运动,求甲恰有2天,且乙恰有1天不宜进行户外体育运动的概率.【答案】(1)28天;(2)①分布列见解析,25;②56750000.【解析】(1)由频率分布直方图可得,空气质量指数在(]90,110的天数为2天,所以估计空气质量指数在(]90,100的天数为1天,故在这30天中空气质量等级属于优或良的天数为28天.(2)①在这30天中,乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数共6天,∴()224230920145C P X C ===,()11624230481145C C P X C ⋅===,()262301229C P X C ===, ∴X 的分布列为∴9248()012145145295E X =⨯+⨯+⨯=. ②甲不宜进行户外体育运动的概率为110,乙不宜进行户外体育运动的概率为310,∴2223219375671010101050000P C C ⎛⎫=⋅⋅⋅⋅⋅=⎪⎝⎭. 【点睛】此题考查离散型随机变量的分布列及期望的求法,频率分布表的应用,属于中档题.14.【2020·东莞市光明中学高三月考】某土特产超市为预估2020年元旦期间游客购买土特产的情况,对2019年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.(1)根据以上数据完成22⨯列联表,并判断是否有95%的把握认为购买金额是否少于60元与性别有关.(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为p (每次抽奖互不影响,且p 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数X (元)的分布列并求其数学期望.附:参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.附表:【答案】(1)见解析,有95%的把握认为购买金额是否少于60元与性别有关.(2)分布列见解析,数学期望75【解析】(1)22⨯列联表如下:()22901220401814405 3.84130605238247K ⨯⨯-⨯==>>⨯⨯⨯,因此有95%的把握认为购买金额是否少于60元与性别有关. (2)X 可能取值为65,70,75,80,且10201903p +==. ()3331165327P X C ⎛⎫=== ⎪⎝⎭,()22312270339P X C ⎛⎫==⨯= ⎪⎝⎭, ()21312475339P X C ⎛⎫==⨯⨯= ⎪⎝⎭,()3032880327P X C ⎛⎫=== ⎪⎝⎭, 所以X 的分布列为6570758075279927EX =⨯+⨯+⨯+⨯=. 15.【2020·山东省邹城市第一中学高三其他】为了提高生产线的运行效率,工厂对生产线的设备进行了技术。
2020年高考理科数学《概率与统计》题型归纳与训练【题型归纳】题型一 古典概型与几何概型例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为. 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示:(1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同;(2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2)2011. 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为7564, ∵527564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高.(2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有5840155408-=),(),,(),,(),,(),,(),,(),,(),,(),,(),,(),,(1514433323423222413121b a b a b a b a b a b a b a b a b a b a b a 共11个,∴抽取的两个人恰好对该措施一个赞成一个不赞成的概率2011=P . 【易错点】求解古典概型问题的关键:先求出基本事件的总数,再确定所求目标事件包含基本事件的个数,结合古典概型概率公式求解.一般涉及“至多”“至少”等事件的概率计算问题时,可以考虑其对立事件的概率,从而简化运算. 【思维点拨】1. 求复杂互斥事件概率的方法一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是间接法,先求此事件的对立事件的概率,再用公式()()1P A P A =-,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.2.求古典概型的概率的基本步骤:算出所有基本事件的个数;求出事件A 包含的基本事件个数;代入公式,求出()P A ;几何概型的概率是几何度量之比,主要使用面积、体积之比与长度之比. 题型二 统计与统计案例例1、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:],90,80[,),40,30[),30,20[Λ并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间)50,40[内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(Ⅰ)4.0;(Ⅱ)20;(Ⅲ)2:3.【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为6.010)04.002.0(=⨯+,所以样本中分数小于70的频率为4.06.01=-.(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.所以总体中分数在区间内的人数估计为. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为6010010)04.002.0(=⨯⨯+,所以样本中分数不小于70的男生人数为302160=⨯.所以样本中的男生人数为60230=⨯,女生人数为4060100=-,男生和女生人数的比例为2:340:60=,所以根据分层抽样的原理,总体中男生和女生人数的比例估计为2:3. 【易错点】求解统计图表问题,重要的是认真观察图表,发现有用信息和数据.对于频率分布直方图,应注意图中的每一个小矩形的面积是落在该区间上的频率,所有小矩形的面积和为1,当小矩形等高时,说明频率相等,计算时不要漏掉其中一个. 【思维点拨】1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 4.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.求回归直线方程的关键①正确理解计算^^,a b 的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关(0.010.020.040.02)100.9+++⨯=[40,50)1001000.955-⨯-=[40,50)540020100⨯=系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 6.独立性检验的关键①根据22⨯列联表准确计算2K ,若22⨯列联表没有列出来,要先列出此表. ②2K 的观测值k 越大,对应假设事件0H 成立的概率越小,0H 不成立的概率越大. 题型三 概率、随机变量及其分布例1、“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕, 市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求落在内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为; ②若,则, .【答案】(1) (2) (3)的分布列为;.【解析】(1)所抽取的100包速冻水饺该项质量指标值的样本平均数为A x Z ()2,N μσZ ()14.55,38.45()10,30X X 11.95σ=≈()2~,Z N μσ()0.6826P Z μσμσ-<≤+=(22)0.9544P Z μσμσ-<≤+=26.5x =0.6826X ()2E X =x.(2)①∵服从正态分布,且, ,∴, ∴落在内的概率是. ②根据题意得, ; ; ; ; . ∴的分布列为∴. 50.1150.2250.3350.25450.1526.5x =⨯+⨯+⨯+⨯+⨯=Z ()2,N μσ26.5μ=11.95σ≈(14.5538.45)(26.511.9526.511.95)0.6826P Z P Z <<=-<<+=Z ()14.55,38.450.68261~4,2X B ⎛⎫ ⎪⎝⎭()404110216P X C ⎛⎫=== ⎪⎝⎭()41411124P X C ⎛⎫=== ⎪⎝⎭()42413228P X C ⎛⎫=== ⎪⎝⎭()43411324P X C ⎛⎫=== ⎪⎝⎭()444114216P X C ⎛⎫=== ⎪⎝⎭X ()1422E X =⨯=【思维点拨】1.条件概率的两种求解方法: (2)基本事件法,借助古典概型概率公式,先求事件A 包含的基本事件数)(A n ,再求事件AB 所包含的基本事件数()AB n ,得)()()|(A n AB n A B P =. 2.判断相互独立事件的三种常用方法:(1)利用定义,事件B A ,相互独立⇔)()()(B P A P AB P ⋅=.(2)利用性质,A 与B 相互独立,则A 与A B ,与B ,B A 与也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.3. 求离散型随机变量的分布列,首先要根据具体情况确定X 的取值情况,然后利用排列、组合与概率知识求出X 取各个值的概率.4. 利用独立重复试验概率公式可以简化求概率的过程,但需要注意检验该概率模型是否满足公式k n k k n p p C k X P --==)1()(的三个条件:(1)在一次试验中某事件A 发生的概率是一个常数p ;(2)n 次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n 次试验中事件A 恰好发生了k 次的概率.5. 求离散型随机变量的均值与方差的基本方法有:(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;(2)已知随机变量X 的均值、方差,求X 的线性函数b aX Y +=的均值、方差,可直接用均值、方差的性质求解,即b X aE b aX E +=+)()(,)()(2X D a b aX D =+(b a ,为常数).(3)如能分析所给随机变量服从常用的分布,可直接利用它们的均值、方差公式求解,即若X 服从两点分布,则p X E =)(,)1()(p p X D -=;若),(~p n B X ,则np X E =)(,)1()(p np X D -=.【巩固训练】题型一 古典概型与几何概型1.已知,,则函数在区间上为增函数的概率是( )A .B .C .D . {}0 1 2a ∈,,{}1 1 3 5b ∈-,,,()22f x ax bx =-()1 +∞,512131416【答案】A【解析】①当时,,情况为符合要求的只有一种; ②当时,则讨论二次函数的对称轴要满足题意则产生的情况表示: ,8种情况满足的只有4种; 综上所述得:使得函数在区间为增函数的概率为:1251214=+=P .2.在区间上任取一数,则的概率是( )A .B .C .D . 【答案】C【解析】由题设可得,即;所以,则由几何概型的概率公式.故应选C .(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.【答案】(1) 0.4;(2) 45;(3)74. 【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为0a =()2f x bx =- 1 1 3 5b =-,,,1b =-0a ≠22b b x a a -=-=1ba≤() a b ,()()()1 1 1 1 1 3-,,,,,()()()()()1 5 2 1 2 1 2 3 2 5-,,,,,,,,,()22f x ax bx =-()1 +∞,()0,4x 1224x -<<12131434211<-<x 32<<x 4,1==D d 41=P考向二 统计与统计案例1.为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只, (Ⅰ)求列联表中的数据,,,的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效?22⨯x y A B【答案】(Ⅰ),,,;(Ⅱ)详见解析;(Ⅲ)至少有%9.99的把握认为疫苗有效.【解析】(Ⅰ)设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件A, 由已知得,所以,,,.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.10y =40B =40x =60A =302()1005y P A +==10y =40B =40x =60A =未注射 注射. 所以至少有%9.99的把握认为疫苗有效.2.在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在市的区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记表示在各区开设分店的个数, 表示这个分店的年收入之和.(Ⅰ)该公司已经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程; (Ⅱ)假设该公司在区获得的总年利润(单位:百万元)与之间的关系为,请结合(Ⅰ)中的线性回归方程,估算该公司应在区开设多少个分店,才能使区平均每个分店的年利润最大? 参考公式:, , .【答案】(1);(2)公司应在区开设4个分店,才能使区平均每个分店的年利润最大.【解析】(1)10085)())(()(,4,42112121^=---=--===∑∑∑∑====x x y yx x x n xyx n yx b y x ni ini iini ini iiΘ,6.0^^=-=x b y a , ∴y 关于x 的线性回归方程6.085.0+=x y .(2) ,区平均每个分店的年利润 ,∴时, 取得最大值,故该公司应在区开设4个分店,才能使区平均每个分店的年利润最大.10000005016.6710.8285020603=≈>⨯⨯S A x y x y x y x A z ,x y 20.05 1.4z y x =--A A y b x a ∧∧∧=+1221ni i i nii x y nxyb x nx ∧==-==-∑∑()()()121niii n ii x x y y x x ==---∑∑a y b x ∧∧=-0.850.6y x =+A A 20.05 1.4z y x =--=20.050.850.8x x -+-A 0.80.050.85z t x x x ==--+800.0150.85x x ⎛⎫=-++ ⎪⎝⎭4x =t A A3. 某商场对商品30天的日销售量y (件)与时间t (天)的销售情况进行整理,得到如下数据,经统计分析,日销售量y (件)与时间t (天)之间具有线性相关关系.(1)请根据表中提供的数据,用最小二乘法求出y 关于t 的线性回归方程a t b y +=. (2)已知商品30天内的销售价格z (元)与时间t(天)的关系为,),200(,20),3020(,100⎩⎨⎧∈<<+∈≤≤+-=N t t t N t t t z 根据(1)中求出的线性回归方程,预测t 为何值时,商品的日销售额最大.参考公式:2121^)(t n tyt n yt b ni ini ii--=∑∑==,t b y a ^^-=.【答案】(1)40^+-=t y ;(2)预测当20=t 时,商品的日销售额最大,最大值为1600元. 【解析】(1)根据题意,6)108642(51=++++⨯=t ,34)3033323738(51=++++⨯=y , 980301033832637438251=⨯+⨯+⨯+⨯+⨯=∑=i i i y t ,22010864222222512=++++=∑=i i t ,所以回归系数为1652203465980)(22121^-=⨯-⨯⨯-=--=∑∑==t n tyt n yt b ni ini ii,406)1(34^^=⨯--=-=t b y a ,故所求的线性回归方程为40^+-=t y . (2)由题意得日销售额为,,3020),40)(100(,200),40)(20(⎩⎨⎧∈≤≤+-+-∈<<+-+=Nt t t t Nt t t t L当N t t ∈<<,200时,900)10(80020)40)(20(22+--=++-=+-+=t t t t t L , 所以当;90010max ==L t 时,当N t t ∈≤≤,3020时,900)70(4000140)40)(100(22--=+-=+-+-=t t t t t L , 所以当.160020max ==L t 时,综上所述,预测当20=t 时,A 商品的日销售额最大,最大值为1600元. 题型三 概率、随机变量及其分布A A A A1.在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者654321,,,,,A A A A A A 和4名女志愿者4321,,,B B B B ,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(I )求接受甲种心理暗示的志愿者中包含1A 但不包含的频率。
重难点05 概率与统计【高考考试趋势】统计主要考查抽样的统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算.试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,几何概型解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差.概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活.取代了传统意义上的应用题,成为高考中的亮点.解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注【知识点分析以及满分技巧】1抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【常见题型限时检测】(建议用时:35分钟)一、单选题1.(2019·广西高考模拟(理))中国古代的五经是指:《诗经》、《尚书》、《礼记》、《周易》、《春秋》,甲、乙、丙、丁、戊5名同学分别选取了其中一本不同的书作为课外兴趣研读,若甲乙都没有选《诗经》,乙也没选《春秋》,则5名同学所有可能的选择有()A.18种B.24种C.36种D.54种【答案】D【分析】分两类求解:(1)甲选《春秋》;(2)甲不选《春秋》;分别求出可能的选择情况,再求和即可得出结果.【详解】(1)若甲选《春秋》,则有133318C A=种情况;(2)若甲不选《春秋》,则有233336A A=种情况;+=种情况.所以5名同学所有可能的选择有183654故选D【点睛】本题主要考查计数原理,熟记排列组合的概念等即可,属于常考题型. 2.(2020·重庆巴蜀中学高三月考(理))新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为A、B、C、D、E五个等级.某试点高中2018年参加“选择考”总人数是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年和2018年“选择考”成绩等级结果,得到如下图表:针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是()A.获得A等级的人数减少了B.获得B等级的人数增加了1.5倍C.获得D等级的人数减少了一半D.获得E等级的人数相同【答案】B【分析】设出两年参加考试的人数,然后根据图表计算两年等级为A,B,C,D,E的人数,由此判断出正确选项.【详解】设2016年参加考试x人,则2018年参加考试2x人,根据图表得出两年各个等级的人数如下图所示:由图可知A,C,D 选项错误,B 选项正确,故本小题选B. 【点睛】本小题主要考查图表分析,考查数据分析与处理能力,属于基础题.3.(2019·广东高考模拟(理))己知某产品的销售额y 与广告费用x 之间的关系如下表:若求得其线性回归方程为 6.5ˆyx a =+,则预计当广告费用为6万元时的销售额为 A .42万元 B .45万元C .48万元D .51万元【答案】C 【分析】根据上表中的数据,求得样本点中心(),x y ,代入回归直线的方程,求得a 的值,得到回归直线的方程,即可求解. 【详解】由题意,根据上表中的数据,可得2x =,22y =,即回归方程经过样本点中心(),x y ,又由线性回归方程为 6.5ˆyx a =+,所以22 6.52a =⨯+,解得9a =, 所以 6.59ˆyx =+,当6x =时,ˆ48y =,故选C. 【点睛】本题主要考查了回归直线方程的应用问题,其中解答中熟记回归直线方程的性质,求得归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.4.(2019·横峰中学高考模拟(理))已知(1)n x λ+展开式中第三项的二项式系数与第四项的二项式系数相同,且01(1)n x a a x λ+=++22nn a x a x +⋯+,若12242n a a a ++⋯+=,则4()x xλ+展开式中常数项( )A .32B .24C .4D .8【答案】B 【分析】先由二项展开式中第三项的二项式系数与第四项的二项式系数相同,求出n ;再由2012(1)n n n x a a x a x a x λ+=+++⋯+求出λ,由二项展开式的通项公式,即可求出结果.【详解】因为(1)nx λ+展开式中第三项的二项式系数与第四项的二项式系数相同, 所以23n n C C =,因此5n =,又5205125(1)x a a x a x a x λ+=+++⋯+,所以01a =, 令1x =,则01525(1)a a a a λ+=+++⋯+,又125242a a a ++⋯+=,所以55(3)3124λ+==,因此2λ=, 所以42()x x +展开式的通项公式为44214422k k k k k k k k T C x x C x ---+==,由420k -=得2k =,因此42()x x+展开式中常数项为2234224T C ==.故选B【点睛】本题主要考查求指定项的系数,熟记二项式定理即可,属于常考题型. 5.(2019·山东高三月考)2521(2)(1)x x+-的展开式的常数项是( ) A .3- B .2-C .2D .3【答案】D 【详解】的展开式通项为:,由2100r -=得=5r ,所以的常数项系数为;由2102r -=-得4r =,所以的 项系数为,所以的展开式的常数项是,故选D.6.(2019·安徽高考模拟(理))2019年5月22日具有“国家战略”意义的“长三角一体化”会议在芜湖举行;长三角城市群包括:上海市以及江苏省、浙江省、安徽省三省部分城市,简称“三省一市”. 现有4 名高三学生准备高考后到上海市、江苏省、浙江省、安徽省四个地方旅游,假设每名同学均从这四个地方中任意选取一个去旅游, 则恰有一个地方未被选中的概率为()A.2764B.916C.81256D.716【答案】B【分析】根据排列组合的知识分别求解出恰有一个地方未被选中的情况和所有情况,利用古典概型计算可得结果.【详解】4名同学去旅游的所有情况有:44256=种恰有一个地方未被选中共有:2113424322144C CC AA⋅⋅=种情况∴恰有一个地方未被选中的概率:144925616 p==本题正确选项:B【点睛】本题考查古典概型计算概率的问题、排列组合中的分组分配问题;关键是能够利用排列组合的知识准确求解出恰有一个地方未被选中的情况种数;易错点是忽略了分组分配中的平均分配问题.二、解答题7.(2020·四川高三期末(理))随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;①将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X ,求随机变量X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(①)详见解析;(①)①4960;①数学期望为6,方差为2.4. 【分析】(1)完成列联表,由列联表,得2258.333 6.6353K =≈>,由此能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关.(2)① 由题意所抽取的10名女市民中,经常网购的有70107100⨯=人,偶尔或不用网购的有30103100⨯=人,由此能选取的3人中至少有2人经常网购的概率. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=,由题意100.6X B :(,),由此能求出随机变量X 的数学期望()E X 和方差()D X . 【详解】解:(1)完成列联表(单位:人):由列联表,得: ()2220050305070258.333 6.635120801001003K ⨯⨯-⨯==≈>⨯⨯⨯, ①能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关. (2)①由题意所抽取的10名女市民中,经常网购的有70107100⨯=人, 偶尔或不用网购的有30103100⨯=人, ①选取的3人中至少有2人经常网购的概率为:2137373104960c c c P c +==. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=, 将频率视为概率,①从我市市民中任意抽取一人,恰好抽到经常网购市民的概率为0.6, 由题意()100.6X B :,, ①随机变量X 的数学期望()100.66E X =⨯=, 方差D (X )=()100.60.4 2.4D X =⨯⨯=. 【点睛】本题考查独立检验的应用,考查概率、离散型随机变量的分布列、数学期望、方差的求法,考查古典概型、二项分布等基础知识,考查运算求解能力,是中档题.8.(2020·四川高三期末(理))某市教育部门为了了解全市高一学生的身高发育情况,从本市全体高一学生中随机抽取了100人的身高数据进行统计分析.经数据处理后,得到了如下图1所示的频事分布直方图,并发现这100名学生中,身不低于1.69米的学生只有16 名,其身高茎叶图如下图2所示,用样本的身高频率估计该市高一学生的身高概率.(I)求该市高一学生身高高于1.70米的概率,并求图1中a b c 、、的值.(II)若从该市高一学生中随机选取3名学生,记ξ为身高在(]1.501.70,的学生人数,求ξ 的分布列和数学期望;(①)若变量S 满足-<+)>0.6826PS (μσμσ≤且22)0.9544P S μσμσ-≤+(,则称变量S 满足近似于正态分布2(,)N μσ的概率分布.如果该市高一学生的身高满足近似于正态分布(1.6,0.01)N 的概率分布,则认为该市高一学生的身高发育总体是正常的.试判断该市高一学生的身高发育总体是否正常,并说明理由. 【答案】(I) 见解析;(①)见解析;(①) 见解析. 【解析】分析: (I)先求出身高高于1.70米的人数,再利用概率公式求这批学生的身高高于1.70 的概率.分别利用面积相等求出a 、b 、c 的值. (II)先求出从这批学生中随机选取1名,身高在[]1.501.70,的概率,再利用二项分布写出ξ的分布列和数学期望. (①)先分别计算出-<X +P μσμσ≤()和22)PS μσμσ-<≤+(,再看是否满足-<+)>0.6826P S μσμσ≤(且22)0.9544P S μσμσ-<≤+>(,给出判断.详解: (I)由图2 可知,100名样本学生中身高高于1.70米共有15 名,以样本的频率估计总体的概率,可得这批学生的身高高于1.70 的概率为0.15. 记X 为学生的身高,结合图1可得:2(1.30 1.40)(1.80 1.90)0.02100f X f X <≤=<≤==, 13(1.40 1.50)(1.70 1.80)0.13100f X f X <≤=<≤==,1(1.50 1.60)(1.60 1.70)(120.0220.13)0.352f X f X <≤=<≤=-⨯-⨯=,又由于组距为0.1,所以0.2a =, 1.3 3.5b c ==, (①)以样本的频率估计总体的概率,可得: 从这批学生中随机选取1名,身高在[]1.501.70,的概率 (1.50 1.70)(1.50 1.60)+(1.60 1.70)0.7P X f X f X <≤=<≤<≤=.因为从这批学生中随机选取3 名,相当于三次重复独立试验, 所以随机变量ξ服从二项分布(3,0.7)B ,故ξ的分布列为:()3()?0.3?0.70,1,2,33n nn P n C n ξ-====00.027+10.189+20.441+30.343=2.1E ξ⨯⨯⨯⨯()(或=30.7=2.1E ())ξ⨯(①)由 1.60.01N (,),取=1.60=0.1μσ, 由(①)可知,-<X += 1.50 1.70)0.70.6826PP X μσμσ≤<≤=>()(, 又结合(I),可得:-2<X +2= 1.40 1.80)PP X μσμσ≤<≤()( =2 1.70<X 1.80 1.50 1.70)0.960.544f P X ⨯≤+<≤=>()(,所以这批学生的身高满足近似于正态分布(1.60.01N ,)的概率分布,应该认为该市高一学生的身高发育总体是正常的.【点睛】:(1)本题不难,但是题目的设计比较新颖,有的同学可能不能适应. 遇到这样的问题,首先是认真审题,理解题意,再解答就容易了. (2)在本题的解答过程中,要灵活利用频率分布图计算概率.9.(2019·陕西西北工业大学附属中学高考模拟(理))2017年3月智能共享单车项目正式登陆某市,两种车型(“小绿车”、“小黄车”)采用分时段计费的方式,“小绿车”每30分钟收费0.5元(不足30分钟的部分按30分钟计算);“小黄车”每30分钟收费1元(不足30分钟的部分按30分钟计算).有甲、乙、丙三人相互独立的到租车点租车骑行(各租一车一次).设甲、乙、丙不超过30分钟还车的概率分别为34,23,12,三人租车时间都不会超过60分钟.甲、乙均租用“小绿车”,丙租用“小黄车”.()1求甲、乙两人所付的费用之和等于丙所付的费用的概率;(2)设甲、乙、丙三人所付的费用之和为随机变量ξ,求ξ的分布列和数学期望.【答案】(1)724;(2)见解析.【解析】【分析】(1)利用相互独立事件的概率公式,分两种情况计算概率即可;(2)根据相互独立事件的概率公式求出各种情况下的概率,得出分布列,利用公式求解数学期望.【详解】(I)由题意得,甲乙丙在30分钟以上且不超过60分钟还车的概率分别为.记甲、乙两人所付的费用之和等于丙所付的费用为事件A.则,答:甲、乙两人所付的费用之和等于丙所付的费用的概率为,(①)ξ可能取值有2,2.5,3,3.5,4,①;;;,.甲、乙、丙三人所付的租车费用之和ξ的分布列为:①.【点睛】本题主要考查了相互对立事件的概率的计算,以及离散型随机变量的分布列、数学期望的求解,其中正确理解题意,利用相互独立事件的概率计算公式求解相应的概率是解答的关键,着重考查了分析问题和解答问题的能力,能很好的考查考生数学应用意识、基本运算求解能力等.10.(2019·江西高三月考(理))据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:(1)已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05,现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.【答案】(1)72;(2)2 .【解析】【分析】(1)由题意得持“应该保留”态度的人为120x+,占总人数3600的0.05,列出对应的概率等式即可算得60x=,再利用分层抽样的方法求解在持“无所谓”态度的人中抽取多少人即可.(2)由分层抽样可求得在校学生为4人,社会人士为2人,再利用超几何分布的方法列出分布列求解期望即可.【详解】(1)因为抽到持“应该保留”态度的人的概率为0.05,所以1200.053600x+=,所以60x=.所以持“无所谓”态度的人数共有3600210012060060720----=,所以应在“无所谓”态度抽取360720723600⨯=人. (2)解:由(①)知持“应该保留”态度的一共有180人, 所以在所抽取的6人中,在校学生为12064180⨯=人, 社会人士为6062180⨯=人, 则第一组在校学生人数1,2,3ξ=1242361(1)5C C P C ξ===,2142363(2)5C C P C ξ===,3042361(3)5C C P C ξ===, 即ξ的分布列为:所以1311232555E ξ=⨯+⨯+⨯=. 【点睛】本题主要考查分层抽样的一般方法与超几何分布的一般方法.同时也考查了分布列与数学期望的方法,属于中等题型.11.(2019·深圳市高级中学高考模拟(理))某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:该景点为了预测2021年的旅游人数,建立了y 与x 的两个回归模型:模型①:由最小二乘法公式求得y 与x 的线性回归方程$50.8169.7y x =+;模型①:由散点图的样本点分布,可以认为样本点集中在曲线bxy ae =的附近.(1)根据表中数据,求模型①的回归方程$bx y ae =.(a 精确到个位,b 精确到0.01). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据()()()1122,,,,,,n n v w v w v w L ,其回归直线µµµwv αβ=+的斜率和截距的最小二乘法估计分别为µµµ121()(),()niii nii w w v v w v v v βαβ==--==--∑∑. ①刻画回归效果的相关指数µ22121()1()nii i n ii yy R yy ==-=--∑∑ .①参考数据: 5.46235e ≈, 1.43 4.2e ≈.表中1011ln ,10i i i i u y u u ===∑. 【答案】(1) $0.11235x y e = (2)见解析 【解析】 【分析】(1)对bxy ae =取对数,得ln ln y bx a =+, 设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,进而可得结果;(2)由表格中的数据, 30407>14607,可得101022113040714607()()iii i y y y y ==>--∑∑,从而得2212R R < ,进而可得结果.【详解】(1)对bxy ae =取对数,得ln ln y bx a =+,设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,()()()10110219.000.10883iii ii x x u u bx x ==--==≈-∑∑$, 6.050.108 5.5 5.456 5.46cu bx =-≈-⨯=≈$$ $ 5.46235c a e e =≈≈$∴模型①的回归方程为$0.11235x y e =(2)由表格中的数据,有30407>14607,即101022113040714607()()iii i y y y y ==>--∑∑,即10102211304071460711()()iii i y y y y ==-<---∑∑,2212R R <模型①的相关指数21R 小于模型①的22R ,说明回归模型①的拟合效果更好.2021年时,13x =,预测旅游人数为$0.1113 1.43235235235 4.2987y e e ⨯==≈⨯=(万人) 【点睛】本题考查了非线性拟合及非线性回归方程的求解与应用,是源于课本的试题类型,解答非线性拟合问题,先作出散点图,再根据散点图选择合适的函数类型,设出回归方程,利用换元法将非线性回归方程化为线性回归方程,求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.12.(2019·湖南高考模拟(理))在全国第五个“扶贫日”到来之前,某省开展“精准扶贫,携手同行”的主题活动,某贫困县调查基层干部走访贫困户数量.A 镇有基层干部60人,B 镇有基层干部60人,C 镇有基层干部80人,每人都走访了若干贫困户,按照分层抽样,从,,A B C 三镇共选40名基层干部,统计他们走访贫困户的数量,并将走访数量分成5组,[)[)[)[)[]5,15,15,25,25,35,35,45,45,55,绘制成如图所示的频率分布直方图.(1) 求这40人中有多少人来自C 镇,并估计,,A B C 三镇的基层干部平均每人走访多少 贫困户;(同一组中的数据用该组区间的中点值作代表)(2)如果把走访贫困户达到或超过25户视为工作出色,以频率估计概率,从,,A B C 三镇的所有基层干部中随机选取3人,记这3人中工作出色的人数为X ,求X 的分布列及数学期望.【答案】(1)40人中有16人来自C 镇,28.5户(2)见解析 【分析】(1)先确定抽样比,再由C 镇有基层干部80人即可求出结果;求平均数时,只需每组的中间值乘以该组的频率再求和即可;(2)先确定从三镇的所有基层干部中随机选出1人,其工作出色的概率,由题意可知X 服从二项分布,进而可求出结果. 【详解】解:(1)因为,,A B C 三镇分别有基层干部60人,60人,80人,共200人, 利用分层抽样的方法选40人,则C 镇应选取408016200⨯=(人), 所以这40人中有16人来自C 镇因为100.15200.25300.3x =⨯+⨯+⨯ 400.2500.128.5+⨯+⨯=, 所以三镇基层干部平均每人走访贫困户28.5户(2)由直方图得,从三镇的所有基层干部中随机选出1人,其工作出色的概率为35显然X 可取0,1,2,3,且33,5X B ⎛⎫~ ⎪⎝⎭,则()32805125P X ⎛⎫=== ⎪⎝⎭, ()12133236155125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()21233254255125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()332735125P X ⎛⎫=== ⎪⎝⎭ 所以X 的分布列为所以数学期望()8365427901231251251251255E X =⨯+⨯+⨯+⨯= 【点睛】本题主要考查频率分布直方图,以及二项分布,由频率分布直方图求平均数,只需每组的中间值乘以该组频率再求和即可,对于二项分布的问题,熟记二项分布即可求解,属于常考题型.。
全国通用2020_2022三年高考数学真题分项汇编:15 概率与统计(解答题)(理科专用)1.【2022年全国甲卷】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立.(1)求甲学校获得冠军的概率;(2)用X表示乙学校的总得分,求X的分布列与期望.【答案】(1)0.6;(2)分布列见解析,E(X)=13.【解析】【分析】(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即可求出期望.(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为P=P(ABC)+P(A BC)+P(AB̅C)+P(ABC)=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.16+0.16+0.24+0.04=0.6.(2)依题可知,X的可能取值为0,10,20,30,所以,P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,P(X=30)=0.5×0.6×0.2=0.06.即X的分布列为2.【2022年新高考1卷】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.P(B|A)P(B ̅|A)与P(B|A )P(B ̅|A )的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R . (ⅰ)证明:R =P(A|B)P(A |B)⋅P(A |B̅)P(A|B ̅);(ⅱ)利用该调查数据,给出P(A|B),P(A|B ̅)的估计值,并利用(ⅰ)的结果给出R 的估计值.附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),【答案】(1)答案见解析(2)(i )证明见解析;(ii)R =6; 【解析】 【分析】(1)由所给数据结合公式求出K 2的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i )结合已知数据求R . (1)由已知K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,又P(K 2≥6.635)=0.01,24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异. (2)(i)因为R =P(B|A)P(B ̅|A)⋅P(B̅|A )P(B|A )=P(AB)P(A)⋅P(A)P(AB ̅)⋅P(A B̅)P(A )⋅P(A )P(A B ), 所以R =P(AB)P(B)⋅P(B)P(A B )⋅P(A B̅)P(B̅)⋅P(B ̅)P(AB ̅) 所以R =P(A|B)P(A |B)⋅P(A |B̅)P(A|B ̅), (ii)由已知P(A|B)=40100,P(A|B̅)=10100,又P(A|B)=60100,P(A|B̅)=90100,所以R=P(A|B)P(A|B)⋅P(A|B̅)P(A|B̅)=63.【2022年新高考2卷】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)44.65岁;(2)0.89;(3)0.0014.【解析】【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1−P (A)即可解出;(3)根据条件概率公式即可求出.(1)平均年龄x̅=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023+55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).(2)设A={一人患这种疾病的年龄在区间[20,70)},所以P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式可得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.4.【2021年新高考1卷】某学校组织“一带一路”知识竞赛,有A,B两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A类问题中的每个问题回答正确得20分,否则得0分;B类问题中的每个问题回答正确得80分,否则得0分,已知小明能正确回答A类问题的概率为0.8,能正确回答B 类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A类问题,记X为小明的累计得分,求X的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.【答案】(1)见解析;(2)B类.【解析】【分析】(1)通过题意分析出小明累计得分X的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答B类问题的数学期望,比较两个期望的大小即可.【详解】(1)由题可知,X的所有可能取值为0,20,100.()010.80.2P X==-=;()()200.810.60.32P X==-=;()1000.80.60.48P X==⨯=.所以X的分布列为(2)由(1)知,()00.2200.321000.4854.4E X=⨯+⨯+⨯=.若小明先回答B问题,记Y为小明的累计得分,则Y的所有可能取值为0,80,100.()010.60.4P Y==-=;()()800.610.80.12P Y==-=;()1000.80.60.48P X==⨯=.所以()00.4800.121000.4857.6E Y =⨯+⨯+⨯=. 因为54.457.6<,所以小明应选择先回答B 类问题.5.【2021年新高考2卷】一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X 表示1个微生物个体繁殖下一代的个数,()(0,1,2,3)i P X i p i ===.(1)已知01230.4,0.3,0.2,0.1p p p p ====,求()E X ;(2)设p 表示该种微生物经过多代繁殖后临近灭绝的概率,p 是关于x 的方程:230123p p x p x p x x +++=的一个最小正实根,求证:当()1E X ≤时,1p =,当()1E X >时,1p <;(3)根据你的理解说明(2)问结论的实际含义. 【答案】(1)1;(2)见解析;(3)见解析. 【解析】 【分析】(1)利用公式计算可得()E X .(2)利用导数讨论函数的单调性,结合()10f =及极值点的范围可得()f x 的最小正零点. (3)利用期望的意义及根的范围可得相应的理解说明. 【详解】(1)()00.410.320.230.11E X =⨯+⨯+⨯+⨯=.(2)设()()3232101f x p x p x p x p =++-+,因为32101p p p p +++=,故()()32322030f x p x p x p p p x p =+-+++,若()1E X ≤,则123231p p p ++≤,故2302p p p +≤.()()23220332f x p x p x p p p '=+-++,因为()()20300f p p p '=-++<,()230120f p p p '=+-≤, 故()f x '有两个不同零点12,x x ,且1201x x <<≤,且()()12,,x x x ∈-∞⋃+∞时,()0f x '>;()12,x x x ∈时,()0f x '<; 故()f x 在()1,x -∞,()2,x +∞上为增函数,在()12,x x 上为减函数, 若21x =,因为()f x 在()2,x +∞为增函数且()10f =,而当()20,x x ∈时,因为()f x 在()12,x x 上为减函数,故()()()210f x f x f >==,故1为230123p p x p x p x x +++=的一个最小正实根,若21>x ,因为()10f =且在()20,x 上为减函数,故1为230123p p x p x p x x +++=的一个最小正实根,综上,若()1E X ≤,则1p =.若()1E X >,则123231p p p ++>,故2302p p p +>. 此时()()20300f p p p '=-++<,()230120f p p p '=+->, 故()f x '有两个不同零点34,x x ,且3401x x <<<, 且()()34,,x x x ∈-∞+∞时,()0f x '>;()34,x x x ∈时,()0f x '<;故()f x 在()3,x -∞,()4,x +∞上为增函数,在()34,x x 上为减函数, 而()10f =,故()40f x <,又()000f p =>,故()f x 在()40,x 存在一个零点p ,且1p <.所以p 为230123p p x p x p x x +++=的一个最小正实根,此时1p <,故当()1E X >时,1p <.(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.6.【2020年新课标1卷理科】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12, (1)求甲连胜四场的概率; (2)求需要进行第五场比赛的概率; (3)求丙最终获胜的概率. 【答案】(1)116;(2)34;(3)716. 【解析】 【分析】(1)根据独立事件的概率乘法公式可求得事件“甲连胜四场”的概率;(2)计算出四局以内结束比赛的概率,然后利用对立事件的概率公式可求得所求事件的概率;(3)列举出甲赢的基本事件,结合独立事件的概率乘法公式计算出甲赢的概率,由对称性可知乙赢的概率和甲赢的概率相等,再利用对立事件的概率可求得丙赢的概率. 【详解】(1)记事件:M 甲连胜四场,则()411216P M ⎛⎫== ⎪⎝⎭;(2)记事件A 为甲输,事件B 为乙输,事件C 为丙输, 则四局内结束比赛的概率为()()()()411424P P ABAB P ACAC P BCBC P BABA ⎛⎫'=+++=⨯= ⎪⎝⎭,所以,需要进行第五场比赛的概率为314P P '=-=; (3)记事件A 为甲输,事件B 为乙输,事件C 为丙输, 记事件:M 甲赢,记事件:N 丙赢,则甲赢的基本事件包括:BCBC 、ABCBC 、ACBCB 、 BABCC 、BACBC 、BCACB 、BCABC 、BCBAC ,所以,甲赢的概率为()4511972232P M ⎛⎫⎛⎫=+⨯= ⎪ ⎪⎝⎭⎝⎭.由对称性可知,乙赢的概率和甲赢的概率相等, 所以丙赢的概率为()97123216P N =-⨯=. 【点睛】本题考查独立事件概率的计算,解答的关键就是列举出符合条件的基本事件,考查计算能力,属于中等题.7.【2020年新课标2卷理科】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi ,yi )(i =1,2,…,20),其中xi 和yi 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,2021)80i i x x =-=∑(,2021)9000i i y y =-=∑(,201))800ii ix y x y =--=∑((. (1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi ,yi )(i =1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=12211))))ni iiiin ni i x y x x y y y x ===----∑∑∑((((,≈1.414.【答案】(1)12000;(2)0.94;(3)详见解析 【解析】 【分析】(1)利用野生动物数量的估计值等于样区野生动物平均数乘以地块数,代入数据即可;(2)利用公式20()()iix x y y r --=∑计算即可;(3)各地块间植物覆盖面积差异较大,为提高样本数据的代表性,应采用分层抽样. 【详解】(1)样区野生动物平均数为201111200602020i i y ==⨯=∑, 地块数为200,该地区这种野生动物的估计值为2006012000⨯= (2)样本(,)i i x y (i =1,2,…,20)的相关系数为20()()0.94iix x y y r --===≈∑(3)由(2)知各样区的这种野生动物的数量与植物覆盖面积有很强的正相关性, 由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大, 采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性, 从而可以获得该地区这种野生动物数量更准确的估计. 【点晴】本题主要考查平均数的估计值、相关系数的计算以及抽样方法的选取,考查学生数学运算能力,是一道容易题.8.【2020年新课标3卷理科】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:2()()()()()n ad bc K a b c d a c b d -=++++,【答案】(1)0.43、0.27、0.21、0.09;(2)350;(3)有,理由见解析.【解析】 【分析】(1)根据频数分布表可计算出该市一天的空气质量等级分别为1、2、3、4的概率; (2)利用每组的中点值乘以频数,相加后除以100可得结果;(3)根据表格中的数据完善22⨯列联表,计算出2K 的观测值,再结合临界值表可得结论. 【详解】(1)由频数分布表可知,该市一天的空气质量等级为1的概率为216250.43100++=,等级为2的概率为510120.27100++=,等级为3的概率为6780.21100++=,等级为4的概率为7200.09100++=; (2)由频数分布表可知,一天中到该公园锻炼的人次的平均数为100203003550045350100⨯+⨯+⨯=(3)22⨯列联表如下:()21003383722 5.820 3.84155457030K ⨯⨯-⨯=≈>⨯⨯⨯,因此,有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关. 【点睛】本题考查利用频数分布表计算频率和平均数,同时也考查了独立性检验的应用,考查数据处理能力,属于基础题.9.【2020年新高考1卷(山东卷)】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:11 (3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关? 附:22()()()()()n ad bc K a b c d a c b d -=++++,【答案】(1)0.64;(2)答案见解析;(3)有.【解析】【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据可得22⨯列联表;(3)计算出2K ,结合临界值表可得结论.【详解】(1)由表格可知,该市100天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的天数有32618864+++=天,所以该市一天中,空气中的 2.5PM 浓度不超过75,且2SO 浓度不超过150的概率为640.64100=; (2)由所给数据,可得22⨯列联表为:22⨯222()100(64101610)()()()()80207426n ad bc K a b c d a c b d -⨯⨯-⨯==++++⨯⨯⨯36007.4844 6.635481=≈>, 因为根据临界值表可知,有99%的把握认为该市一天空气中 2.5PM 浓度与2SO 浓度有关.【点睛】本题考查了古典概型的概率公式,考查了完善22⨯列联表,考查了独立性检验,属于中档题.。
概率与统计热点一 常见概率模型的概率几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件,互斥事件常作为解答题的一问考查,也是进一步求分布列,期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】现有4个人去参加某娱乐活动,该活动有甲、乙两个游戏可供参加者选择.为增加趣味性,约定:每个人通过掷一枚质地均匀的骰子决定自己去参加哪个游戏,掷出点数为1或2的人去参加甲游戏,掷出点数大于2的人去参加乙游戏. (1)求这4个人中恰有2人去参加甲游戏的概率;(2)求这4个人中去参加甲游戏的人数大于去参加乙游戏的人数的概率; (3)用X ,Y 分别表示这4个人中去参加甲、乙游戏的人数,记ξ=|X -Y |,求随机变量ξ的分布列.解 依题意,这4个人中,每个人去参加甲游戏的概率为13,去参加乙游戏的概率为23. 设“这4个人中恰有i 人去参加甲游戏”为事件A i (i =0,1,2,3,4). 则P (A i )=C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i.(1)这4个人中恰有2人去参加甲游戏的概率 P (A 2)=C 24⎝ ⎛⎭⎪⎫132⎝ ⎛⎭⎪⎫232=827.(2)设“这4个人中去参加甲游戏的人数大于去参加乙游戏的人数”为事件B ,则B =A 3+A 4,且A 3与A 4互斥,∴P (B )=P (A 3+A 4)=P (A 3)+P (A 4)=C 34⎝ ⎛⎭⎪⎫133×23+C 44⎝ ⎛⎭⎪⎫134=19.(3)依题设,ξ的所有可能取值为0,2,4.且A 1与A 3互斥,A 0与A 4互斥. 则P (ξ=0)=P (A 2)=827, P (ξ=2)=P (A 1+A 3)=P (A 1)+P (A 3) =C 14⎝ ⎛⎭⎪⎫131·⎝ ⎛⎭⎪⎫233+C 34⎝ ⎛⎭⎪⎫133×23=4081,P (ξ=4)=P (A 0+A 4)=P (A 0)+P (A 4) =C 04⎝ ⎛⎭⎪⎫234+C 44⎝ ⎛⎭⎪⎫134=1781.所以ξ的分布列是【类题通法】(1)本题4由独立重复试验,4人中恰有i 人参加甲游戏的概率P =C i 4⎝ ⎛⎭⎪⎫13i ⎝ ⎛⎭⎪⎫234-i ,这是本题求解的关键.(2)解题中常见的错误是不能分清事件间的关系,选错概率模型,特别是在第(3)问中,不能把ξ=0,2,4的事件转化为相应的互斥事件A i 的概率和. 【对点训练】甲、乙两班进行消防安全知识竞赛,每班出3人组成甲乙两支代表队,首轮比赛每人一道必答题,答对则为本队得1分,答错或不答都得0分,已知甲队3人每人答对的概率分别为34,23,12,乙队每人答对的概率都是23,设每人回答正确与否相互之间没有影响,用ξ表示甲队总得分. (1)求ξ=2的概率;(2)求在甲队和乙队得分之和为4的条件下,甲队比乙队得分高的概率. 解 (1)ξ=2,则甲队有两人答对,一人答错,故P (ξ=2)=34×23×⎝⎛⎭⎪⎫1-12+34×⎝ ⎛⎭⎪⎫1-23×12+⎝ ⎛⎭⎪⎫1-34×23×12=1124;(2)设甲队和乙队得分之和为4为事件A ,甲队比乙队得分高为事件B .设乙队得分为η,则η~B ⎝⎛⎭⎪⎫3,23.P (ξ=1)=34×⎝ ⎛⎭⎪⎫1-23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×23×⎝ ⎛⎭⎪⎫1-12+⎝ ⎛⎭⎪⎫1-34×⎝ ⎛⎭⎪⎫1-23×12=14,P (ξ=3)=34×23×12=14,P (η=1)=C 13·23·⎝ ⎛⎭⎪⎫132=29,P (η=2)=C 23·⎝ ⎛⎭⎪⎫232·13=49,P (η=3)=C 33⎝ ⎛⎭⎪⎫233=827,∴P (A )=P (ξ=1)P (η=3)+P (ξ=2)P (η=2)+P (ξ=3)·P (η=1) =14×827+1124×49+14×29=13, P (AB )=P (ξ=3)·P (η=1)=14×29=118, ∴所求概率为P (B|A )=P (AB )P (A )=11813=16.热点二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,每年均有解答题的考查,属于中档题.复习中应强化应用题目的理解与掌握,弄清随机变量的所有取值是正确列随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中强化解答题的规范性训练.【例2】甲乙两人进行围棋比赛,约定先连胜两局者直接赢得比赛,若赛完5局仍未出现连胜,则判定获胜局数多者赢得比赛.假设每局甲获胜的概率为23,乙获胜的概率为13,各局比赛结果相互独立.(1)求甲在4局以内(含4局)赢得比赛的概率;(2)记X 为比赛决出胜负时的总局数,求X 的分布列和均值(数学期望).解 用A 表示“甲在4局以内(含4局)赢得比赛”,A k 表示“第k 局甲获胜”,B k 表示“第k 局乙获胜”,则P (A k )=23,P (B k )=13,k =1,2,3,4,5. (1)P (A )=P (A 1A 2)+P (B 1A 2A 3)+P (A 1B 2A 3A 4) =P (A 1)P (A 2)+P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)·P (A 3)P (A 4)=⎝ ⎛⎭⎪⎫232+13×⎝ ⎛⎭⎪⎫232+23×13×⎝ ⎛⎭⎪⎫232=5681.(2)X 的可能取值为2,3,4,5.P (X =2)=P (A 1A 2)+P (B 1B 2)=P (A 1)P (A 2)+P (B 1)·P (B 2)=59,P (X =3)=P (B 1A 2A 3)+P (A 1B 2B 3)=P (B 1)P (A 2)P (A 3)+P (A 1)P (B 2)P (B 3)=29,P (X =4)=P (A 1B 2A 3A 4)+P (B 1A 2B 3B 4)=P (A 1)P (B 2)P (A 3)P (A 4)+P (B 1)P (A 2)P (B 3)P (B 4)=1081, P (X =5)=1-P (X =2)-P (X =3)-P (X =4)=881. 故X 的分布列为E (X )=2×59+3×29+4×81+5×81=81. 【类题通法】求离散型随机变量的均值和方差问题的一般步骤 第一步:确定随机变量的所有可能值; 第二步:求每一个可能值所对应的概率; 第三步:列出离散型随机变量的分布列; 第四步:求均值和方差;第五步:反思回顾.查看关键点、易错点和答题规范.【对点训练】为回馈顾客,某商场拟通过摸球兑奖的方式对1 000位顾客进行奖励,规定:每位顾客从一个装有4个标有面值的球的袋中一次性随机摸出2个球,球上所标的面值之和为该顾客所获的奖励额.(1)若袋中所装的4个球中有1个所标的面值为50元,其余3个均为10元.求:①顾客所获的奖励额为60元的概率;②顾客所获的奖励额的分布列及数学期望;(2)商场对奖励总额的预算是60 000元,并规定袋中的4个球只能由标有面值10元和50元的两种球组成,或标有面值20元和40元的两种球组成.为了使顾客得到的奖励总额尽可能符合商场的预算且每位顾客所获的奖励额相对均衡,请对袋中的4个球的面值给出一个合适的设计,并说明理由.解(1)设顾客所获的奖励额为X.①依题意,得P(X=60)=C11C13C24=12,即顾客所获的奖励额为60元的概率为1 2 .②依题意,得X的所有可能取值为20,60.P(X=60)=12,P(X=20)=C23C24=12,即X的分布列为所以顾客所获的奖励额的数学期望为E(X)=20×2+60×12=40(元).(2)根据商场的预算,每个顾客的平均奖励额为60元.所以,先寻找期望为60元的可能方案.对于面值由10元和50元组成的情况,如果选择(10,10,10,50)的方案,因为60元是面值之和的最大值,所以期望不可能为60元;如果选择(50,50,50,10)的方案,因为60元是面值之和的最小值,所以期望也不可能为60元,因此可能的方案是(10,10,50,50),记为方案1.对于面值由20元和40元组成的情况,同理,可排除(20,20,20,40)和(40,40,40,20)的方案,所以可能的方案是(20,20,40,40),记为方案2.以下是对两个方案的分析:对于方案1,即方案(10,10,50,50),设顾客所获的奖励额为X1,则X1的分布列为X 1的数学期望为E(X1)=20×6+60×3+100×6=60(元),X 1的方差为D(X1)=(20-60)2×16+(60-60)2×23+(100-60)2×16=1 6003.对于方案2,即方案(20,20,40,40),设顾客所获的奖励额为X2,则X2的分布列为X 2的数学期望为E(X2)=40×6+60×3+80×6=60(元),X 2的方差为D(X2)=(40-60)2×16+(60-60)2×23+(80-60)2×16=4003.由于两种方案的奖励额的数学期望都符合要求,但方案2奖励额的方差比方案1的小,所以应该选择方案2.热点三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】2018年6月14日至7月15日,第21届世界杯足球赛将于俄罗斯举行,某大学为世界杯组委会招收志愿者,被招收的志愿者需参加笔试和面试,把参加笔试的40名大学生的成绩分组:第1组[75,80),第2组[80,85),第3组[85,90),第4组[90,95),第5组[95,100],得到的频率分布直方图如图所示:(1)分别求出成绩在第3,4,5组的人数;(2)现决定在笔试成绩较高的第3,4,5组中用分层抽样抽取6人进行面试.①已知甲和乙的成绩均在第3组,求甲或乙进入面试的概率;②若从这6名学生中随机抽取2名学生接受考官D的面试,设第4组中有X名学生被考官D面试,求X的分布列和数学期望.解(1)由频率分布直方图知:第3组的人数为5×0.06×40=12.第4组的人数为5×0.04×40=8.第5组的人数为5×0.02×40=4.(2)利用分层抽样,在第3组,第4组,第5组中分别抽取3人,2人,1人.①设“甲或乙进入第二轮面试”为事件A,则P(A)=1-C310C312=511,所以甲或乙进入第二轮面试的概率为5 11 .②X的所有可能取值为0,1,2,P(X=0)=C24C26=25,P(X=1)=C12C14C26=815,P(X=2)=C22C26=115.所以X的分布列为X 01 2P 25815115E(X)=0×25+1×815+2×15=15=3.【类题通法】本题将传统的频率分布直方图与分布列、数学期望相结合,立意新颖、构思巧妙.求解离散型随机变量的期望与频率分布直方图交汇题的“两步曲”:一是看图说话,即看懂频率分布直方图中每一个小矩形面积表示这一组的频率;二是活用公式,本题中X服从超几何分布.【对点训练】某公司为了解用户对某产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意记事件C区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C的概率.解(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散.(2)记C A1表示事件:“A地区用户的满意度等级为满意或非常满意”;CA2表示事件:“A地区用户的满意度等级为非常满意”;CB1表示事件:“B地区用户的满意度等级为不满意”;CB2表示事件:“B地区用户的满意度等级为满意”,则C A1与C B1独立,C A2与C B2独立,C B1与C B2互斥,C=CB1CA1∪C B2C A2.P(C)=P(CB1CA1∪C B2C A2)=P(C B1C A1)+P(C B2C A2)=P(C B1)P(C A1)+P(C B2)P(C A2).由所给数据得C A1,C A2,C B1,C B2发生的频率分别为1620,420,1020,820,即P(C A1)=1620,P(CA2)=420,P(C B1)=1020,P(C B2)=820,故P(C)=1020×1620+820×420=0.48.热点四统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差)的考查,解答题中也有所考查.【例4】从某居民区随机抽取10个家庭,获得第i个家庭的月收入x i(单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑10i =1x i =80,∑10i =1y i =20,∑10i =1x i y i =184,∑10i =1x 2i =720. (1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄. 附:线性回归方程y ^=b ^x +a ^中,b ^=,a ^=y -b ^ x ,其中x ,y 为样本平均值.解 (1)由题意知n =10,x =1n∑ni =1x i =8010=8, y =1n ∑ni =1y i =2010=2,又l xx =∑ni =1x 2i -n x 2=720-10×82=80, l xy =∑ni =1x i y i -n x y =184-10×8×2=24, 由此得b ^=l xy l xx =2480=0.3,a ^=y -b ^x =2-0.3×8=-0.4, 故所求线性回归方程为y ^=0.3x -0.4.(2)由于变量y 的值随x 值的增加而增加(b ^=0.3>0),故x 与y 之间是正相关. (3)将x =7代入回归方程可以预测该家庭的月储蓄为y ^=0.3×7-0.4=1.7(千元).【类题通法】(1)分析两个变量的线性相关性,可通过计算相关系数r 来确定,r 的绝对值越接近于1,表明两个变量的线性相关性越强,r 的绝对值越接近于0,表明两变量线性相关性越弱.(2)求线性回归方程的关键是正确运用b ^,a ^的公式进行准确的计算.【对点训练】4月23日是“世界读书日”,某中学在此期间开展了一系列的读书教育活动.为了解本校学生课外阅读情况,学校随机抽取了100名学生对其课外阅读时间进行调查.下面是根据调查结果绘制的学生日均课外阅读时间(单位:分钟)的频率分布直方图.若将日均课外阅读时间不低于60分钟的学生称为“读书迷”,低于60分钟的学生称为“非读书迷”.(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为“读书迷”与性别有关?(2)1人,共抽取3次,记被抽取的3人中的“读书迷”的人数为X.若每次抽取的结果是相互独立的,求X的分布列、期望E(X)和方差D(X).解(1)完成2×2列联表如下:K 2=100×(40×25-15×20)260×40×55×45≈8.249>6.635,故有99%的把握认为“读书迷”与性别有关.(2)将频率视为概率.则从该校学生中任意抽取1名学生恰为读书迷的概率P =25.由题意可知X ~B ⎝ ⎛⎭⎪⎫3,25,P (X =i )=C i 3⎝ ⎛⎭⎪⎫25i ⎝ ⎛⎭⎪⎫353-i(i =0,1,2,3).X 的分布列为均值E (X )=np =3×5=5,方差D (X )=np (1-p )=3×25×⎝⎛⎭⎪⎫1-25=1825。
大题专项:统计与概率问题一、解答题1.为推动乒乓球运动的发展,某乒乓球比赛允许不同协会的运动员组队参加.现有来自甲协会的运动员3名,其中种子选手2名;乙协会的运动员5名,其中种子选手3名.从这8名运动员中随机选择4人参加比赛.(1)设A 为事件“选出的4人中恰有2名种子选手,且这2名种子选手来自同一个协会”,求事件A 发生的概率;(2)设X 为选出的4人中种子选手的人数,求随机变量X 的分布列和数学期望. 解:(1)由已知,有P (A )=C 22C 32+C 32C 32C 84=635.所以,事件A 发生的概率为635.(2)随机变量X 的所有可能取值为1,2,3,4. P (X=k )=C 5k C 34-k C 84(k=1,2,3,4).所以,随机变量X 的分布列为随机变量X 的数学期望E (X )=1×114+2×37+3×37+4×114=52.好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率; (3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk =1”表示第k 类电影得到人们喜欢,用“ξk =0”表示第k 类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差D (ξ1),D (ξ2),D (ξ3),D (ξ4),D (ξ5),D (ξ6)的大小关系.解:(1)设“从电影公司收集的电影中随机选取1部,这部电影是获得好评的第四类电影”为事件A ,第四类电影中获得好评的电影为200×0.25=50(部). P (A )=50140+50+300+200+800+510=502 000=0.025.(2)设“从第四类电影和第五类电影中各随机选取1部,恰有1部获得好评”为事件B,P(B)=0.25×0.8+0.75×0.2=0.35.(3)由题意可知,定义随机变量如下:ξk={0,第k类电影没有得到人们喜欢, 1,第k类电影得到人们喜欢,则ξk显然服从两点分布,则六类电影的分布列及方差计算如下:第一类电影:ξ110P0.40.6D(ξ1)=0.4×0.6=0.24;第二类电影:ξ210P0.20.8D(ξ2)=0.2×0.8=0.16;第三类电影:ξ310P0.150.85D(ξ3)=0.15×0.85=0.127 5;第四类电影:ξ410P0.250.75D(ξ4)=0.25×0.75=0.187 5;第五类电影:ξ510P0.20.8D(ξ5)=0.2×0.8=0.16;第六类电影:ξ610P0.10.9D(ξ6)=0.1×0.9=0.09.综上所述,D(ξ1)>D(ξ4)>D(ξ2)=D(ξ5)>D(ξ3)>D(ξ6).3.某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:设该险种一续保人一年内出险次数与相应概率如下:(1)求一续保人本年度的保费高于基本保费的概率;(2)若一续保人本年度的保费高于基本保费,求其保费比基本保费高出60%的概率;(3)求续保人本年度的平均保费与基本保费的比值.解:(1)设A表示事件:“一续保人本年度的保费高于基本保费”,则事件A发生当且仅当一年内出险次数大于1,故P(A)=0.2+0.2+0.1+0.05=0.55.(2)设B表示事件:“一续保人本年度的保费比基本保费高出60%”,则事件B发生当且仅当一年内出险次数大于3,故P(B)=0.1+0.05=0.15.又P(AB)=P(B),故P(B|A)=P(AB)P(A)=P(B)P(A)=0.150.55=311.因此所求概率为311.(3)记续保人本年度的保费为X,则X的分布列为E(X)=0.85a×0.30+a×0.15+1.25a×0.20+1.5a×0.20+1.75a×0.10+2a×0.05=1.23a.因此续保人本年度的平均保费与基本保费的比值为1.23.4.(2019北京,理17)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率;(2)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1 000元的人数,求X的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2 000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2 000 元的人数有变化?说明理由.解:(1)由题意知,样本中仅使用A的学生有18+9+3=30人,仅使用B的学生有10+14+1=25人,A,B两种支付方式都不使用的学生有5人.故样本中A,B两种支付方式都使用的学生有100-30-25-5=40人.所以从全校学生中随机抽取1人,该学生上个月A,B两种支付方式都使用的概率估计为40100=0.4.(2)X的所有可能值为0,1,2.记事件C为“从样本仅使用A的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”,事件D为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于1 000元”.由题设知,事件C,D相互独立,且P (C )=9+330=0.4,P (D )=14+125=0.6.所以P (X=2)=P (CD )=P (C )P (D )=0.24, P (X=1)=P (C D ∪C D ) =P (C )P (D )+P (C )P (D )=0.4×(1-0.6)+(1-0.4)×0.6=0.52, P (X=0)=P (C D )=P (C )P (D )=0.24. 所以X 的分布列为故X 的数学期望E (X )=0×0.24+1×0.52+2×0.24=1.(3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额都大于2 000元”.假设样本仅使用A 的学生中,本月支付金额大于2 000 元的人数没有变化,则由上个月的样本数据得P (E )=1C 303=14 060.答案示例1:可以认为有变化.理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2 000元的人数发生了变化.所以可以认为有变化. 答案示例2:无法确定有没有变化.理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.5.一款击鼓小游戏的规则如下:每盘游戏都需击鼓三次,每次击鼓要么出现一次音乐,要么不出现音乐;每盘游戏击鼓三次后,出现一次音乐获得10分,出现两次音乐获得20分,出现三次音乐获得100分,没有出现音乐则扣除200分(即获得-200分).设每次击鼓出现音乐的概率为12,且各次击鼓出现音乐相互独立.(1)设每盘游戏获得的分数为X ,求X 的分布列;(2)玩三盘游戏,至少有一盘出现音乐的概率是多少?(3)玩过这款游戏的许多人都发现,若干盘游戏后,与最初的分数相比,分数没有增加反而减少了.请运用概率统计的相关知识分析分数减少的原因. 解:(1)X 可能的取值为10,20,100,-200. 根据题意,P (X=10)=C 31×(12)1×(1-12)2=38; P (X=20)=C 32×(12)2×(1-12)1=38; P (X=100)=C 33×(12)3×(1-12)0=18;P (X=-200)=C 3×(12)0×(1-12)3=18.所以X 的分布列为(2)设“第i 盘游戏没有出现音乐”为事件A i (i=1,2,3),则P (A 1)=P (A 2)=P (A 3)=P (X=-200)=18. 所以,“三盘游戏中至少有一盘出现音乐”的概率为 1-P (A 1A 2A 3)=1-(18)3=1-1512=511512.因此,玩三盘游戏至少有一盘出现音乐的概率是511512. (3)X 的数学期望为E (X )=10×38+20×38+100×18-200×18=-54.这表明,获得分数X 的均值为负,因此,多次游戏之后分数减少的可能性更大.6.某汽车公司拟对甲款高端汽车发动机进行科技改造,根据市场调研与模拟,得到科技改造投入x (单位:亿元)与科技改造直接收益y (单位:亿元)的数据统计如下:当0<x ≤17时,建立了y 与x 的两个回归模型:模型①:y ^=4.1x+11.8;模型②:y ^=21.3√x -14.4;当x>17时,确定y 与x 满足的线性回归方程为y ^=-0.7x+a.(1)根据下列表格中的数据,比较当0<x ≤17时模型①、②的相关指数R 2,并选择拟合精度更高、更可靠的模型,预测对甲款汽车发动机科技改造的投入为17亿元时的直接收益.( 附:相关指数R 2=1-∑i=1n(y i -y ^i )2∑i=1n(y i -y )2,√17≈4.1)(2)为鼓励科技创新,当科技改造投入不少于20亿元时,国家给予公司补贴收益10亿元,以回归方程为预测依据,比较科技改造投入17亿元与20亿元时公司实际收益的大小.附:用最小二乘法求线性回归方程y ^=b^x+a^的系数公式b ^=∑i=1nx i y i -nx ·y ∑i=1nx i 2-nx2=∑i=1n(x i -x )(y i -y )∑i=1n (x i -x )2;a^=y −b ^x (3)科技改造后,甲款汽车发动机的热效率X 大幅提高,X 服从正态分布N (0.52,0.012),公司对科技改造团队的奖励方案如下:若发动机的热效率不超过50%,则不予奖励;若发动机的热效率超过50%但不超过53%,则每台发动机奖励2万元;若发动机的热效率超过53%,则每台发动机奖励5万元.求每台发动机获得奖励的数学期望.(附:随机变量ξ服从正态分布N (μ,σ2),则P (μ-σ<ξ<μ+σ)≈0.682 7,P (μ-2σ<ξ<μ+2σ)≈0.954 5) 解:(1)由表格中的数据,可知182.4∑i=17(y i -y )2>79.2∑i=17(y i -y )2.所以模型①的R 2小于模型②的R 2,说明回归模型②拟合的效果更好.所以当x=17亿元时,科技改造直接收益的预测值为y ^=21.3×√17-14.4=21.3×4.1-14.4=72.93(亿元). (2)由已知可得x -20=1+2+3+4+55=3,所以x =23.又y -60=8.5+8+7.5+6+65=7.2,所以y =67.2.b ^=∑i=15x i y i -5x y∑i=15x i2-5x 2=7 721-5×23×67.22 655-5×23×23=-710=-0.7,故a ^=y +0.7x =67.2+0.7×23=83.3.当x>17亿元时,y 与x 满足的线性回归方程为y ^=-0.7x+83.3. 当x=20亿元时,科技改造直接收益的预测值y ^=-0.7×20+83.3=69.3. 当x=20亿元时,实际收益的预测值为69.3+10=79.3亿元>72.93亿元.所以科技改造投入20亿元时,公司的实际收益更大. (3)因为P (0.52-0.02<X<0.52+0.02)≈0.954 5, 所以P (X>0.50)≈1+0.954 52=0.977 25,P (X ≤0.50)≈1-0.954 52=0.022 75,因为P (0.52-0.01<X<0.52+0.01)≈0.682 7,所以P (X>0.53)≈1-0.682 72=0.158 65,则P(0.50<X≤0.53)≈0.977 25-0.158 65=0.818 6.设每台发动机获得的奖励为Y万元,则Y的分布列为:所以每台发动机获得奖励的数学期望为E(Y)=0×0.022 8+2×0.818 6+5×0.158 65=2.430 45(万元).。