统计概率高考试题(答案)
- 格式:doc
- 大小:1.08 MB
- 文档页数:14
高考数学复习专题训练—统计与概率解答题1.(2021·广东广州二模改编)根据相关统计,2010年以后中国贫困人口规模呈逐年下降趋势,2011~2019年全国农村贫困发生率的散点图如下:注:年份代码1~9分别对应年份2011年~2019年.(1)求y 关于t 的经验回归方程(系数精确到0.01);(2)已知某贫困地区的农民人均年纯收入X (单位:万元)满足正态分布N (1.6,0.36),若该地区约有97.72%的农民人均纯收入高于该地区最低人均年纯收入标准,则该地区最低人均年纯收入标准大约为多少万元?参考数据与公式:∑i=19y i =54.2,∑i=19t i y i =183.6. 经验回归直线y ^=b ^t+a ^的斜率和截距的最小二乘估计分别为b ^=∑i=1n t i y i -nt y ∑i=1n (t i -t )2 ,a ^=y −b ^t . 若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ≤X ≤μ+σ)≈0.682 7,P (μ-2σ≤X ≤μ+2σ)≈0.954 5,P (μ-3σ≤X ≤μ+3σ)≈0.997 3.2.(2021·湖北黄冈适应性考试改编)产品质量是企业的生命线.为提高产品质量,企业非常重视产品生产线的质量.某企业引进了生产同一种产品的A,B 两条生产线,为比较两条生产线的质量,从A,B 生产线生产的产品中各自随机抽取了100件产品进行检测,把产品等级结果和频数制成了如图的统计图.(1)依据小概率值α=0.025的独立性检验,分析数据,能否据此推断是否为一级品与生产线有关.(2)生产一件一级品可盈利100元,生产一件二级品可盈利50元,生产一件三级品则亏损20元,以频率估计概率.①分别估计A,B生产线生产一件产品的平均利润;②你认为哪条生产线的利润较为稳定?并说明理由.附:①参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.②临界值表:3.(2021·福建宁德模拟改编)某工厂为了检测一批新生产的零件是否合格,从中随机抽测100个零件的长度d(单位:mm).该样本数据分组如下:[57,58),[58,59),[59,60),[60,61),[61,62),[62,63],得到如图所示的频率分布直方图.经检测,样本中d大于61的零件有13个,长度分别为61.1,61.1,61.2,61.2,61.3,61.5,61.6,61.6,61.8,61.9,62.1,62.2,62.6.(1)求频率分布直方图中a,b,c的值及该样本的平均长度x(结果精确到1 mm,同一组数据用该区间的中点值作代表);(2)视该批次样本的频率为总体的概率,从工厂生产的这批新零件中随机选取3个,记ξ为抽取的零件长度在[59,61)的个数,求ξ的分布列和数学期望;(3)若变量X满足|P(μ-σ≤X≤μ+σ)-0.682 7|<0.03且|P(μ-2σ≤X≤μ+2σ)-0.954 5|≤0.03,则称变量X满足近似于正态分布N(μ,σ2)的概率分布.如果这批样本的长度d满足近似于正态分布N(x,12)的概率分布,则认为这批零件是合格的,将顺利出厂;否则不能出厂.请问,能否让该批零件出厂?4.(2021·山东潍坊期末)在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.设三台设备的可靠度均为r(0<r<1),它们之间相互不影响.(1)要使系统的可靠度不低于0.992,求r的最小值;(2)当r=0.9时,求能正常工作的设备数X的分布列;(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可能给该产业园带来约50万元的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.9,更新设备硬件总费用为8万元; 方案2:对系统的设备进行维护,使得设备可靠度维持在0.8,设备维护总费用为5万元.请从期望损失最小的角度判断决策部门该如何决策?答案及解析1.解 (1)t =1+2+3+4+5+6+7+8+99=5, y =12.7+10.2+8.5+7.2+5.7+4.5+3.1+1.7+0.69≈6.02, b ^=∑i=19t i y i -9t y∑i=19(t i -5)2=183.6-270.960≈-1.46,a ^=y −b ^t =6.02-(-1.46)×5=13.32.故y 关于t 的经验回归方程为y ^=-1.46t+13.32.(2)因为P (μ-2σ≤X ≤μ+2σ)≈0.954 5,所以P (X>μ-2σ)=0.954 5+1-0.954 52=0.977 25. 因为某贫困地区的农民人均年纯收入X 满足正态分布N (1.6,0.36),所以μ=1.6,σ=0.6,μ-2σ=0.4,P (X>0.4)=0.977 25,故该地区最低人均年纯收入标准大约为0.4万元.2.解 (1)根据已知数据可建立列联表如下:零假设为H 0:是否为一级品与生产线无关.χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )=200×(20×65-35×80)255×145×100×100≈5.643>5.024=x 0.025,依据小概率值α=0.025的独立性检验,推断H 0不成立,即认为是否为一级品与生产线有关.(2)A 生产线生产一件产品为一、二、三级品的概率分别为15,35,15.记A 生产线生产一件产品的利润为X ,则X 的取值为100,50,-20,其分布列为B生产线生产一件产品为一、二、三级品的概率分别为720,25 ,14.记B生产线生产一件产品的利润为Y,则Y的取值为100,50,-20, 其分布列为①E(X)=100×15+50×35+(-20)×15=46,E(Y)=100×720+50×25+(-20)×14=50.故A,B生产线生产一件产品的平均利润分别为46元、50元.②D(X)=(100-46)2×15+(50-46)2×35+(-20-46)2×15=1 464.D(Y)=(100-50)2×720+(50-50)2×25+(-20-50)2×14=2 100.因为D(X)<D(Y),所以A生产线的利润更为稳定.3.解(1)由题意可得P(61≤d<62)=10100=0.1,P(62≤d≤63)=3100=0.03,P(59≤d<60)=P(60≤d<61)=12(1-2×0.03-0.14-0.1)=0.35,所以a=0.031=0.03,b=0.11=0.1,c=0.351=0.35.x=(57.5+62.5)×0.03+58.5×0.14+(59.5+60.5)×0.35+61.5×0.1=59.94≈60.(2)由(1)可知从该工厂生产的新零件中随机选取1件,长度d在(59,61]的概率P=2×0.35=0.7,且随机变量ξ服从二项分布ξ~B(3,0.7),所以P(ξ=0)=C30×(1-0.7)3=0.027,P(ξ=1)=C31×0.7×(1-0.7)2=0.189,P(ξ=2)=C32×0.72×(1-0.7)=0.441,P(ξ=3)=C33×0.73=0.343,所以随机变量ξ的分布列为E(ξ)=0×0.027+1×0.189+2×0.441+3×0.343=2.1.(3)由(1)及题意可知x=60,σ=1.所以P(x-σ≤X≤x-σ)=P(59≤X≤61)=0.7.|P(x-σ≤X≤x+σ)-0.682 7|=|0.7-0.682 7|=0.017 3≤0.03,P(x-2σ≤X≤x-2σ)=P(58≤X≤62)=0.14+0.35+0.35+0.1=0.94,|P(x-2σ≤X≤x+2σ)-0.954 5|=|0.94-0.954 5|=0.014 5≤0.03.所以这批新零件的长度d满足近似于正态分布N(x,12)的概率分布.所以能让该批零件出厂.4.解(1)要使系统的可靠度不低于0.992,则P(X≥1)=1-P(X<1)=1-P(X=0)=1-(1-r)3≥0.992,解得r≥0.8,故r的最小值为0.8.(2)X为正常工作的设备数,由题意可知,X~B(3,r),P(X=0)=C30×0.90×(1-0.9)3=0.001,P(X=1)=C31×0.91×(1-0.9)2=0.027,P(X=2)=C32×0.92×(1-0.9)1=0.243,P(X=3)=C33×0.93×(1-0.9)0=0.729,从而X的分布列为(3)设方案1、方案2的总损失分别为X1,X2,采用方案1,更换部分设备的硬件,使得设备可靠度达到0.9,由(2)可知计算机网络断掉的概率为0.001,不断掉的概率为0.999,故E(X1)=80000+0.001×500 000=80 500元.采用方案2,对系统的设备进行维护,使得设备可靠度维持在0.8,由(1)可知计算机网络断掉的概率为0.008,故E(X2)=50 000+0.008×500 000=54 000元,因此,从期望损失最小的角度,决策部门应选择方案2.。
大题概率统计(精选30题)1(2024·浙江绍兴·二模)盒中有标记数字1,2的小球各2个.(1)若有放回地随机取出2个小球,求取出的2个小球上的数字不同的概率;(2)若不放回地依次随机取出4个小球,记相邻小球上的数字相同的对数为X(如1122,则X=2),求X的分布列及数学期望E X.【答案】(1)1 2;(2)分布列见解析,1.【分析】(1)根据组合知识求得取球的方法数,然后由概率公式计算概率;(2)确定X的所有可能取值为0,1,2,然后分别计算概率得分布列,再由期望公式计算出期望.【详解】(1)设事件A=“取出的2个小球上的数字不同”,则P A=C12C12+C12C12C14C14=12.(2)X的所有可能取值为0,1,2.①当相邻小球上的数字都不同时,如1212,有2×A22×A22种,则P X=0=2×A22×A22A44=13.②当相邻小球上的数字只有1对相同时,如1221,有2×A22×A22种,则P X=1=2×A22×A22A44=13.③当相邻小球上的数字有2对相同时,如1122,有2×A22×A22种,则P X=2=2×A22×A22A44=13.所以X的分布列为X012P 131313所以X的数学期望E X=0×13+1×13+2×13=1.2(2024·江苏扬州·模拟预测)甲、乙两人进行某棋类比赛,每局比赛时,若决出输赢则获胜方得2分,负方得0分;若平局则各得1分.已知甲在每局中获胜、平局、负的概率均为13,且各局比赛结果相互独立.(1)若比赛共进行了三局,求甲共得3分的概率;(2)规定比赛最多进行五局,若一方比另一方多得4分,则停止比赛,求比赛局数X的分布列与数学期望.【答案】(1)7 27;(2)分布列见解析,31781.【分析】(1)写出所有可能情形,利用互斥事件的概率和公式即可求出;(2)算出X为不同值时对应的概率并填写分布列,之后求出数学期望即可.【详解】(1)设“三局比赛后,甲得3分”为事件A,甲得3分包含以下情形:三局均为平局,三局中甲一胜一平一负,所以P A=133+A3313 3=727,故三局比赛甲得3分的概率为7 27 .(2)依题意知X的可能取值为2,3,4,5,P X=2=2×132=29,P X=3=2×C12133=427,P X=4=2×C12134+C1313 4=1081,P X=5=1-P X=2-P X=3-P X=4=1-29-427-1081=4181,故其分布列为:X2345P2942710814181期望E X=2×29+3×427+4×1081+5×4181=31781.3(2024·江苏南通·二模)某班组建了一支8人的篮球队,其中甲、乙、丙、丁四位同学入选,该班体育老师担任教练.(1)从甲、乙、丙、丁中任选两人担任队长和副队长,甲不担任队长,共有多少种选法?(2)某次传球基本功训练,体育老师与甲、乙、丙、丁进行传球训练,老师传给每位学生的概率都相等,每位学生传球给同学的概率也相等,学生传给老师的概率为17.传球从老师开始,记为第一次传球,前三次传球中,甲同学恰好有一次接到球且第三次传球后球回到老师手中的概率是多少?【答案】(1)9种(2)349.【分析】(1)法一,利用分步乘法计数原理集合组合数的计算,即可求得答案;法二,利用间接法,即用不考虑队长人选对甲的限制的所有选法,减去甲担任队长的选法,即可得答案;(2)考虑第一次传球,老师传给了甲还是传给乙、丙、丁中的任一位,继而确定第二次以及第三次传球后球回到老师手中的情况,结合乘法公式以及互斥事件的概率求法,即可求得答案.【详解】(1)法一,先选出队长,由于甲不担任队长,方法数为C13;再选出副队长,方法数也是C13,故共有方法数为C13×C13=9(种).方法二先不考虑队长人选对甲的限制,共有方法数为A 24=4×3=12(种);若甲任队长,方法数为C 13,故甲不担任队长的选法种数为12-3=9(种)答:从甲、乙、丙、丁中任选两人分别担任队长和副队长,甲不担任队长的选法共有9种.(2)①若第一次传球,老师传给了甲,其概率为14;第二次传球甲只能传给乙、丙、丁中的任一位同学,其概率为67;第三次传球,乙、丙、丁中的一位传球给老师,其概率为17,故这种传球方式,三次传球后球回到老师手中的概率为:14×67×17=398.②若第一次传球,老师传给乙、丙、丁中的任一位,其概率为34,第二次传球,乙、丙、丁中的一位传球给甲,其概率为27,第三次传球,甲将球传给老师,其概率为17,这种传球方式,三次传球后球回到老师手中的概率为34×27×17=398,所以,前三次传球中满足题意的概率为:398+398=349.答:前三次传球中,甲同学恰好有一次接到球且第三次传球后球回到老师手中的概率是349.4(2024·重庆·模拟预测)中国在第75届联合国大会上承诺,努力争取2060年之前实现碳中和(简称“双碳目标”).新能源电动汽车作为战略新兴产业,对于实现“双碳目标”具有重要的作用.赛力斯汽车有限公司为了调查客户对旗下AITO 问界M 7的满意程度,对所有的意向客户发起了满意度问卷调查,将打分在80分以上的客户称为“问界粉”.现将参与调查的客户打分(满分100分)进行了统计,得到如下的频率分布直方图:(1)估计本次调查客户打分的中位数(结果保留一位小数);(2)按是否为“问界粉”比例采用分层抽样的方法抽取10名客户前往重庆赛力斯两江智慧工厂参观,在10名参观的客户中随机抽取2名客户赠送价值2万元的购车抵用券.记获赠购车券的“问界粉”人数为ξ,求ξ的分布列和数学期望E ξ .【答案】(1)73.3分(2)分布列见解析;期望为35【分析】(1)根据频率分布直方图求解中位数的方法可得答案;(2)确定抽取的“问界粉”人数,再确定ξ的取值,求解分布列,利用期望公式求解期望.【详解】(1)由频率分布直方图可知:打分低于70分的客户所占比例为40%,打分低于80分的客户的所占比例为70%,所以本次调查客户打分的中位数在[70,80)内,由70+10×0.50-0.400.70-0.40=2203≈73.3,所以本次调查客户打分的中位数约为73.3分;(2)根据按比例的分层抽样:抽取的“问界粉”客户3人,“非问界粉”客户7人,则ξ的所有可能取值分别为0,1,2,其中:P (ξ=0)=C 03C 27C 210=715,P (ξ=1)=C 13C 17C 210=715,P (ξ=2)=C 23C 07C 210=115,所以ξ的分布列为:ξ012P715715115所以数学期望E (ξ)=0×715+1×715+2×115=35.5(2024·福建三明·三模)某校开设劳动教育课程,为了有效推动课程实施,学校开展劳动课程知识问答竞赛,现有家政、园艺、民族工艺三类问题海量题库,其中家政类占14,园艺类占14,民族工艺类占12.根据以往答题经验,选手甲答对家政类、园艺类、民族工艺类题目的概率分别为25,25,45,选手乙答对这三类题目的概率均为12.(1)求随机任选1题,甲答对的概率;(2)现进行甲、乙双人对抗赛,规则如下:两位选手进行三轮答题比赛,每轮只出1道题目,比赛时两位选手同时回答这道题,若一人答对且另一人答错,则答对者得1分,答错者得-1分,若两人都答对或都答错,则两人均得0分,累计得分为正者将获得奖品,且两位选手答对与否互不影响,每次答题的结果也互不影响,求甲获得奖品的概率.【答案】(1)35(2)4411000【分析】(1)利用全概率公式,即可求得答案;(2)求出乙答对的概率,设每一轮比赛中甲得分为X ,求出X 的每个值对应的概率,即可求得三轮比赛后,甲总得分为Y 的每个值相应的概率,即可得答案.【详解】(1)记随机任选1题为家政、园艺、民族工艺试题分别为事件A i i =1,2,3 ,记随机任选1题,甲答对为事件B ,则P A 1 =14,P A 2 =14,P A 3 =12,P B |A 1 =25,P B |A 2 =25,P B |A 3 =45,则P B =P A1 P B |A 1 +P A2 P B |A 2 +P A3 P B |A 3=14×25+14×25+12×45=35;(2)设乙答对记为事件C ,则P C =P A 1 P C |A 1 +P A 2 P C |A 2 +P A 3 P C |A 3 =14×12+14×12+12×12=12,设每一轮比赛中甲得分为X ,则P X =1 =P BC =P B P C =35×1-12 =310,P X =0 =P BC ∪BC =P BC +P CB=35×12+1-35 ×1-12 =12,P (X =-1)=P B C =1-35 ×12=15,三轮比赛后,设甲总得分为Y ,则P Y =3 =3103=271000,P Y =2 =C 23310 2×12=27200,P Y =1 =C 13×310×122+C 23×3102×15=2791000,所以甲最终获得奖品的概率为P =P Y =3 +P Y =2 +P Y =1 =271000+27200+2791000=4411000.6(2024·江苏南京·二模)某地5家超市春节期间的广告支出x (万元)与销售额y (万元)的数据如下:超市A B C D E 广告支出x 24568销售额y3040606070(1)从A ,B ,C ,D ,E 这5家超市中随机抽取3家,记销售额不少于60万元的超市个数为X ,求随机变量X 的分布列及期望E (X );(2)利用最小二乘法求y 关于x 的线性回归方程,并预测广告支出为10万元时的销售额.附:线性回归方程y =b x +a中斜率和截距的最小二乘估计公式分别为:b =ni =1x i y i -nx yni =1x 2i -nx2,a =y -b x .【答案】(1)X 的分布列见解析,期望E (X )=95(2)y=7x +17;预测广告费支出10万元时的销售额为87万元.【分析】(1)根据超几何分布的概率公式求解分布列,进而可求解期望,(2)利用最小二乘法求解线性回归方程即可.【详解】(1)从A ,B ,C ,D ,E 这5家超市中随机抽取3家,记销售额不少于60万元的超市有C ,D ,E 这3家超市,则随机变量X 的可能取值为1,2,3P (X =1)=C 13C 22C 35=310,P (X =2)=C 23C 12C 35=35,P (X =3)=C 33C 35=110,∴X 的分布列为:X123P31035110数学期望E (X )=1×310+2×35+3×110=95.(2)x =2+4+5+6+85=5,y =30+40+60+60+705=52,b=ni =1x i y i -nx yni =1x 2i -nx2=60+160+300+360+560-5×5×524+16+25+36+64-5×52=7,a=52-7×5=17.∴y 关于x 的线性回归方程为y=7x +17;在y =7x +17中,取x =10,得y =7×10+17=87.∴预测广告费支出10万元时的销售额为87万元.7(2024·重庆·三模)甲、乙、丙三人进行羽毛球练习赛,其中两人比赛,另一人当裁判,每局比赛结束时,负的一方在下一局当裁判,设各局中双方获胜的概率均为12,各局比赛的结果都相互独立,第1局甲当裁判.记随机变量X i =1,第i 局乙当裁判0,第i 局甲或丙当裁判, i =1,2,⋅⋅⋅,n ,p i =P X i =1 ,X 表示前n 局中乙当裁判的次数.(1)求事件“n =3且X =1”的概率;(2)求p i ;(3)求E X ,并根据你的理解,说明当n 充分大时E X 的实际含义.附:设X ,Y 都是离散型随机变量,则E X +Y =E X +E Y .【答案】(1)34;(2)p i =-13 ×-12i -1+13;(3)p i ,答案见解析。
【经典例题】【例 1】( 2012 湖北) 如图,在圆心角为直角的扇形 OAB 中,分别以 OA , OB 为直径作两个半圆.在扇形OAB 内随机取一点,则此点取自阴影部分的概率是21 121 A .1- πB . 2 - πC . πD . π【答案】 A【解析】 令 OA=1,扇形 OAB 为对称图形, ACBD 围成面积为 S 1,围成 OC 为 S 2,作对称轴 OD ,则过 C 点. S 2 即为以 OA2 π 1 2 111 π -2 S2(2)-2×2×2=1为直径的半圆面积减去三角形OAC 的面积, S =8 .在扇形 OAD 中 2 为扇形面积减去三角S 2 S 1 1 21 S 2π -2 π -2π形 OAC 面积和 2 , 2 = 8 π×1 - 8 - 2 =16 , S 1+S 2= 4 ,扇形 OAB 面积 S= 4 ,选 A .【例 2】( 2013 湖北) 如图所示,将一个各面都涂了油漆的正方体,切割为 125 个同样大小的小正方体,经过搅拌后, 从中随机取一个小正方体,记它的涂漆面数为X ,则 X 的均值 E(X) = ( )1266 1687 A. 125B. 5C.125D. 5【答案】 B27 54 36 8 27【解析】 X 的取值为 0,1, 2,3 且 P(X = 0) =125,P(X = 1) =125,P(X = 2) = 125,P(X = 3) = 125,故 E(X) =0× 125+1× 54 36 8 6+2× +3× =,选B.125 125 125 5【例 3】( 2012 四川) 节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮相互独立,且都在通 电后的 4 秒内任一时刻等可能发生,然后每串彩灯以 4 秒为间隔闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过 2 秒的概率是 ()1 1 3 7 A. 4B. 2C. 4D. 8【答案】 C【解析】 设第一串彩灯在通电后第 x 秒闪亮, 第二串彩灯在通电后第 y 秒闪亮,由题意 0≤ x ≤ 4,满足条件的关系式0≤y ≤4,根据几何概型可知, 事件全体的测度 ( 面积 ) 为 16 平方单位,而满足条件的事件测度( 阴影部分面积 ) 为 12 平方单位,123故概率为 16= 4.【例 4】( 2009 江苏) 现有 5 根竹竿,它们的长度(单位: m )分别为 2.5,2.6,2.7,2.8,2.9,若从中一次随机抽取2 根竹竿,则它们的长度恰好相差 0.3m 的概率为 .【答案】 0.2 【解析】 从 5 根竹竿中一次随机抽取 2 根的可能的事件总数为 10,它们的长度恰好相差 0.3m 的事件数为 2,分别是:2.5 和 2.8 , 2.6 和 2.9 ,所求概率为 0.2【例 5】( 2013 江苏) 现有某类病毒记作 X m Y n ,其中正整数 m , n(m ≤7, n ≤ 9)可以任意选取,则 m , n 都取到奇数的概率为 ________.20【答案】【解析】 基本事件共有 7×9= 63 种, m 可以取 1, 3, 5,7, n 可以取 1, 3,5, 7, 9. 所以 m ,n 都取到奇数共有 2020种,故所求概率为63.【例 6】( 2013 山东) 在区间 [- 3,3] 上随机取一个数 x ,使得 |x + 1|- |x - 2| ≥1成立的概率为 ________.【答案】13【解析】 当 x<- 1 时,不等式化为- x - 1+ x -2≥1,此时无解;当- 1≤x ≤2 时,不等式化为 x +1+ x -2≥1,解之得 x ≥1;当 x>2 时,不等式化为 x + 1- x +2≥1,此时恒成立, ∴|x + 1| - |x -2| ≥1的解集为 [ 1,+∞ ) . 在 [ -3, 3]上使不等式有解的区间为 [ 1,3] ,由几何概型的概率公式得 P = 3- 1 1 .3-(- 3) =3【例 7】( 2013 北京)下图是某市 3 月 1 日至 14 日的空气质量指数趋势图, 空气质量指数小于 100 表示空气质量优良, 空气质量指数大于 200 表示空气重度污染. 某人随机选择 3 月 1 日至 3 月 13 日中的某一天到达该市, 并停留 2 天.( 1)求此人到达当日空气重度污染的概率;( 2)设 X 是此人停留 期间空气质量优良的天数,求 X 的分布列与数学期望;( 3)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明 )【答案】 132; 1213; 3 月 5 日【解析】 设 Ai 表示事件“此人于3 月 i 日到达该市” (i = 1, 2, , 13) .1(i ≠j) .根据题意, P(Ai) = ,且 Ai ∩Aj =13( 1)设 B 为事件“此人到达当日空气重度污染”,则B =A5∪A8.2所以 P(B) =P(A5∪A8)= P(A5) + P(A8) = .13( 2)由题意可知, X 的所有可能取值为 0,1, 2,且P(X= 1) =P(A3∪A6∪A7 ∪A11)4=P(A3) + P(A6) + P(A7) + P(A11) =13,P(X= 2) =P(A1∪A2∪A12∪A13)4=P(A1) + P(A2) + P(A12) + P(A13) =13,5P(X= 0) = 1- P(X= 1) - P(X= 2) =13.所以 X 的分布列为X 0 1 2P 5 4 4 13 13 135 4 4 12故 X 的期望 E(X) =0×+1×+2×= .13 13 13 13( 3)从 3 月 5 日开始连续三天的空气质量指数方差最大.【例 8】(2013 福建)某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为2,中奖可以3 获得 2 分;方案乙的中奖率为2,中奖可以获得 3 分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中5奖与否互不影响,晚会结束后凭分数兑换奖品.( 1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X ,求 X≤3的概率;(2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的数学期望较大?【答案】1115;方案甲.2 2【解析】方法一:( 1)由已知得,小明中奖的概率为3,小红中奖的概率为5,且两人中奖与否互不影响.记“这2 人的累计得分X≤3”的事件为A,则事件 A 的对立事件为“ X=5”,2 2 411因为 P(X=5) =×=,所以P(A)=1-P(X=5)=,3 5 151511即这两人的累计得分X≤3的概率为15.( 2)设小明、小红都选择方案甲抽奖中奖次数为X1,都选择方案乙抽奖中奖次数为X2,则这两人选择方案甲抽奖累计得分的数学期望为E(2X1) ,选择方案乙抽奖累计得分的数学期望为E(3X2) .2 2由已知可得,X1~ B 2,3, X2~ B 2,5,2 42 4所以 E(X1) =2×3=3, E(X2) =2×5=5,812从而 E(2X1) = 2E(X1) =, E(3X2) = 3E(X2) =.3 5因为 E(2X1)>E(3X2) ,所以他们都选择方案甲进行抽奖时,累计得分的数学期望较大.方法二:( 1)由已知得,小明中奖的概率为2,小红中奖的概率为2,且两人中奖与否互不影响.35记“这两人的累计得分 X ≤3”的事件为 A ,则事件 A 包含有“ X =0”“ X =2”“ X =3”三个两两互斥的事件,2 2 1 2 2 22 22, 因为 P(X = 0) = 1-× 1- = ,P(X = 2) = × 1-= ,P(X =3) = 1- × = 15 355355 3 511所以 P(A) = P(X = 0) + P(X = 2) + P(X = 3) =15,11即这两人的累计得分 X ≤3的概率为 15.( 2)设小明、小红都选择方案甲所获得的累计得分为 X1,都选择方案乙所获得的累计得分为X2,则 X1, X2 的分布列如下:X1 0 2 4 X2 0 3 6 P14 4 P912 4 9 9 9 2525251448所以 E(X1) =0× 9+2× 9+4× 9= 3,E(X2) =0× 9 +3× 12+6× 4 = 12.25 25 25 5因为 E(X1)>E(X2) ,所以他们都选择方案甲进行抽奖时,累计得分的数学期望较大.【例 9】( 2013 浙江) 设袋子中装有 a 个红球, b 个黄球, c 个蓝球,且规定:取出一个红球得1 分,取出一个黄球得2 分,取出一个蓝球得3 分.( 1)当 a = 3, b = 2,c = 1 时,从该袋子中任取 (有放回,且每球取到的机会均等 )2 个球,记随机变量 ξ为取出此 2球所得分数之和,求 ξ的分布列;( 2)从该袋子中任取 (每球取到的机会均等 )1 个球,记随机变量 η为取出此球所得分数. 若 E η= 5,D η=5,求 a ∶ b ∶ c.3 9【答案】 3∶ 2∶ 1【解析】( 1)由题意得,ξ= 2, 3, 4, 5, 6.P(ξ= 2) = 3×3 1= ,6×6 4 P(ξ= 3) =2×3×2= 1,6×6 32×3×1+2×2 5 P(ξ= 4) = 6×6 = 18. P(ξ= 5) = 2×2×1 16×6= 9,P(ξ= 6) = 1×1 1,= 366×6 所以 ξ 的分布列为ξ 2 3 4 5 6 P1 1 5 1 1 4318936( 2)由题意知 η 的分布列为η 1 2 3Pa b ca +b +c a + b + ca +b +ca 2b3c5所以 E η= a + b + c + a +b + c + a +b + c = 3,5 a 5 b 5c5D η= 1- 32· a + b + c +2- 32· a + b + c +3- 32· a + b + c = 9, 2a - b - 4c = 0,解得 a = 3c , b = 2c , 化简得a + 4b -11c = 0,故 a ∶b ∶c =3∶2∶1.【例 10】( 2009 北京理) 某学生在上学路上要经过 4 个路口, 假设在各路口是否遇到红灯是相互独立的,遇到红灯的 概率都是 1,遇到红灯时停留的时间都是2min.3( 1)求这名学生在上学路上到第三个路口时首次遇到红灯的概率; ( 2)求这名学生在上学路上因遇到红灯停留的总时间的分布列及期望 .【答案】4;327 8【解析】 本题主要考查随机事件、互斥事件、相互独立事件等概率知识、考查离散型随机变量的分布列和期望等基础 知识,考查运用概率与统计知识解决实际问题的能力.( 1)设这名学生在上学路上到第三个路口时首次遇到红灯为事件 A ,因为事件 A 等于事件“这名学生在第一和第二个路口没有遇到红灯,在第三个路口遇到红灯”,所以事件A 的概率为PA11111 4 .333 27( 2)由题意,可得可能取的值为 0,2, 4, 6,8(单位: min ) .事件“2k ”等价于事件“该学生在路上遇到k 次红灯”( k 0, 1, 2,3, 4),k 4 k∴ P2kC k412k 0,1,2,3,4,33∴即 的分布列是0 246 8P16 32 8818181278181∴ 的期望是 E16 32 88 1 82468.818127 81813【课堂练习】1.( 2013 广东) 已知离散型随机变量X 的分布列为X 1 2 3P3 3 151010则 X 的数学期望 E(X) = () 35A. 2B . 2 C. 2 D . 32.( 2013 陕西) 如图,在矩形区域 ABCD 的 A ,C 两点处各有一个通信基站,假设其信号的覆盖范围分别是扇形区 域 ADE 和扇形区域 CBF( 该矩形区域内无其他信号来源,基站工作正常 ).若在该矩形区域内随机地选一地点,则该地点无 信号的概率是 ( ).A .1- π π π D . π4 B . -1 B .2- 42 23.在棱长分别为 1, 2, 3 的长方体上随机选取两个相异顶点,若每个顶点被选的概率相同,则选到两个顶点的距离 大于 3的概率为 ()4 3 2 3A .7B . 7C . 7D . 144.( 2009 安徽理) 考察正方体 6 个面的中心,甲从这 6 个点中任意选两个点连成直线,乙也从这6 个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于12 34?BA .B .C .D .75757575?F?C?D? E? A5.( 2009 江西理) 为了庆祝六一儿童节,某食品厂制作了3 种不同的精美卡片,每袋食品随机装入一张卡片,集齐3种卡片可获奖,现购买该种食品5 袋,能获奖的概率为()3133 C .4850A .B .81D ..8181816.( 2009 辽宁文) ABCD 为长方形, AB = 2, BC =1,O 为 AB 的中点,在长方形ABCD 内随机取一点,取到的点到O 的距离大于 1 的概率为A .B . 1C .8D . 18447.( 2009 上海理) 若事件 E 与 F 相互独立,且 P EP F1 的值等于,则P EI F4A . 01 C .11B .4D .1628.( 2013 广州) 在区间 [1,5] 和[2, 4]上分别取一个数,记为a ,b ,则方程 x 2 y 22+b 2= 1 表示焦点在 x 轴上且离心率小a于 3的椭圆的概率为 ()2C .1711531A .2B . 3232D . 321, 2,3,9.已知数列 {a } 满足 a = a+ n - 1(n ≥2,n ∈ N),一颗质地均匀的正方体骰子,其六个面上的点数分别为nnn -14, 5, 6,将这颗骰子连续抛掷三次,得到的点数分别记为 a , b , c ,则满足集合 {a ,b , c} = {a 1, a 2, a 3}(1 ≤a i ≤6,i = 1, 2, 3)的概率是 ()1B . 1C . 1D . 1A .72 36 24 1210.( 2009 湖北文) 甲、乙、丙三人将参加某项测试,他们能达标的概率分别是0.8、 0.6、 0.5,则三人都达标的概率是,三人中至少有一人达标的概率是 。
2023年高考数学试题分项版——统计概率(原卷版)一、选择题1.(多选)(2023·新高考Ⅰ卷,9)有一组样本数据126,,,x x x ⋅⋅⋅,其中1x 是最小值,6x 是最大值,则()A.2345,,,x x x x 的平均数等于126,,,x x x ⋅⋅⋅的平均数B.2345,,,x x x x 的中位数等于126,,,x x x ⋅⋅⋅的中位数C.2345,,,x x x x 的标准差不小于126,,,x x x ⋅⋅⋅的标准差D.2345,,,x x x x 的极差不大于126,,,x x x ⋅⋅⋅的极差2.(2023·新高考Ⅱ卷,3)某学校为了解学生参加体育运动的情况,用比例分配的分层随机抽样方法作抽样调查,拟从初中部和高中部两层共抽取60名学生,已知该校初中部和高中部分别有400名和200名学生,则不同的抽样结果共有().A.4515400200C C ⋅种 B.2040400200C C ⋅种C .3030400200C C ⋅种D.4020400200C C ⋅种3.(多选)(2023·新高考Ⅱ卷,12)在信道内传输0,1信号,信号的传输相互独立.发送0时,收到1的概率为(01)αα<<,收到0的概率为1α-;发送1时,收到0的概率为(01)ββ<<,收到1的概率为1β-.考虑两种传输方案:单次传输和三次传输.单次传输是指每个信号只发送1次,三次传输是指每个信号重复发送3次.收到的信号需要译码,译码规则如下:单次传输时,收到的信号即为译码;三次传输时,收到的信号中出现次数多的即为译码(例如,若依次收到1,0,1,则译码为1).A.采用单次传输方案,若依次发送1,0,1,则依次收到l ,0,1的概率为2(1)(1)αβ--B.采用三次传输方案,若发送1,则依次收到1,0,1的概率为2(1)ββ-C.采用三次传输方案,若发送1,则译码为1的概率为23(1)(1)βββ-+-D.当00.5α<<时,若发送0,则采用三次传输方案译码为0的概率大于采用单次传输方案译码为0的概率4.(2023·全国甲卷理,6)有50人报名足球俱乐部,60人报名乒乓球俱乐部,70人报名足球或乒乓球俱乐部,若已知某人报足球俱乐部,则其报乒乓球俱乐部的概率为()A.0.8B.0.4C.0.2D.0.15.(2023·全国甲卷理,9)有五名志愿者参加社区服务,共服务星期六、星期天两天,每天从中任选两人参加服务,则恰有1人连续参加两天服务的选择种数为()A.120B.60C.40D.306.(2023·全国甲卷文,4)某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为()A.16B.13C.12D.237.(2023·全国乙卷理,5)设O 为平面坐标系的坐标原点,在区域(){}22,14x y xy ≤+≤内随机取一点,记该点为A ,则直线OA 的倾斜角不大于π4的概率为()A.18B.16C.14D.128.(2023·全国乙卷理,7)甲乙两位同学从6种课外读物中各自选读2种,则这两人选读的课外读物中恰有1种相同的选法共有()A.30种B.60种C.120种D.240种9.(2023·全国乙卷文,7)设O 为平面坐标系的坐标原点,在区域(){}22,14x y xy ≤+≤内随机取一点A ,则直线OA 的倾斜角不大于π4的概率为()A.18B.16 C.14D.1210.(2023·全国乙卷文,9)某学校举办作文比赛,共6个主题,每位参赛同学从中随机抽取一个主题准备作文,则甲、乙两位参赛同学抽到不同主题概率为()A.56B.23C.12D.1311.(2023·北京卷,5)512x x ⎛⎫- ⎪⎝⎭的展开式中x 的系数为().A.80- B.40- C.40D.8012.(2023·天津卷,7)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数0.8245r =,下列说法正确的是()A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245二、填空题1.(2023·新高考Ⅰ卷,13)某学校开设了4门体育类选修课和4门艺术类选修课,学生需从这8门课中选修2门或3门课,并且每类选修课至少选修1门,则不同的选课方案共有________种(用数字作答).2.(2023·天津卷,11)在6312x x ⎛⎫- ⎪⎝⎭的展开式中,2x 项的系数为_________.3.(2023·天津卷,13)甲乙丙三个盒子中装有一定数量的黑球和白球,其总数之比为5:4:6.这三个盒子中黑球占总数的比例分别为40%,25%,50%.现从三个盒子中各取一个球,取到的三个球都是黑球的概率为_________;将三个盒子混合后任取一个球,是白球的概率为_________.三、解答题1.(2023·新高考Ⅰ卷,21)甲、乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投籃,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.(1)求第2次投篮的人是乙的概率;(2)求第i 次投篮的人是甲的概率;(3)已知:若随机变量i X 服从两点分布,且()()110,1,2,,i i i P X P X q i n ==-===⋅⋅⋅,则11n ni i i i E X q ==⎛⎫= ⎪⎝⎭∑∑.记前n 次(即从第1次到第n 次投篮)中甲投篮的次数为Y ,求()E Y .2.(2023·新高考Ⅱ卷,19)某研究小组经过研究发现某种疾病的患病者与未患病者的某项医学指标有明显差异,经过大量调查,得到如下的患病者和未患病者该指标的频率分布直方图:利用该指标制定一个检测标准,需要确定临界值c ,将该指标大于c 的人判定为阳性,小于或等于c 的人判定为阴性.此检测标准的漏诊率是将患病者判定为阴性的概率,记为()p c ;误诊率是将未患病者判定为阳性的概率,记为()q c .假设数据在组内均匀分布,以事件发生的频率作为相应事件发生的概率.(1)当漏诊率()0.5p c =%时,求临界值c 和误诊率()q c ;(2)设函数()()()f c p c q c =+,当[]95,105c ∈时,求()f c 的解析式,并求()f c 在区间[]95,105的最小值.3.(2023·全国甲卷理,19)为探究某药物对小鼠的生长抑制作用,将40只小鼠均分为两组,分别为对照组(不加药物)和实验组(加药物).(1)设其中两只小鼠中对照组小鼠数目为X,求X的分布列和数学期望;(2)测得40只小鼠体重如下(单位:g):(已按从小到大排好)对照组:17.318.420.120.421.523.224.624.825.025.426.126.326.426.526.827.027.427.527.628.3实验组:5.4 6.6 6.8 6.97.88.29.410.010.411.214.417.319.220.223.623.824.525.125.226.0(i)求40只小鼠体重的中位数m,并完成下面2×2列联表:<mm≥对照组实验组(ii)根据2×2列联表,能否有95%的把握认为药物对小鼠生长有抑制作用.参考数据:k0.100.050.010()2P k k≥ 2.706 3.841 6.6354.(2023·全国甲卷文,19)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g ).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m ,再分别统计两样本中小于m 与不小于m 的数据的个数,完成如下列联表m<m≥对照组试验组(ⅱ)根据(i )中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:()()()()22()n ad bc K a b c d a c b d -=++++,()2P K k ≥0.1000.0500.010k2.7063.8416.6355.(2023·全国乙卷理,17)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为i x ,i y (1,2,10i =⋅⋅⋅),试验结果如下试验序号i 12345678910伸缩率i x 545533551522575544541568596548伸缩率iy 536527543530560533522550576536记(1,2,,10)i i i z x y i =-= ,记1z ,2z ,…,10z 的样本平均数为z ,样本方差为2s ,(1)求z ,2s ;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z ≥产品的伸缩率有显著提高,否则不认为有显著提高).6.(2023·全国乙卷文,17)某厂为比较甲乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率.甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为i x ,()1,2,,10i y i =⋅⋅⋅.试验结果如下:试验序号i 12345678910伸缩率i x 545533551522575544541568596548伸缩率iy 536527543530560533522550576536记()1,2,,10i i i z x y i =-=⋅⋅⋅,记1210,,,z z z ⋅⋅⋅的样本平均数为z ,样本方差为2s .(1)求z,2s;(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果z产品的伸缩率有显著提高,否则不认为有显著提高)7.(2023·北京卷,18)为研究某种农产品价格变化的规律,收集得到了该农产品连续40天的价格变化数据,如下表所示.在描述价格变化时,用“+”表示“上涨”,即当天价格比前一天价格高;用“-”表示“下跌”,即当天价格比前一天价格低;用“0”表示“不变”,即当天价格与前一天价格相同.时段价格变化第1天到第20-++0---++0+0--+-+00+天第21天到第400++0---++0+0+---+0-+天用频率估计概率.(1)试估计该农产品价格“上涨”的概率;(2)假设该农产品每天的价格变化是相互独立的.在未来的日子里任取4天,试估计该农产品价格在这4天中2天“上涨”、1天“下跌”、1天“不变”的概率;(3)假设该农产品每天的价格变化只受前一天价格变化的影响.判断第41天该农产品价格“上涨”“下跌”和“不变”的概率估计值哪个最大.(结论不要求证明)。
专题16 概率与统计(解答题)(文科专用)1.【2022年全国甲卷】甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d), P (K 2⩾k )0.100 0.050 0.010 k 2.7063.8416.6352.【2022年全国乙卷】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m 2)和材积量(单位:m 3),得到如下数据:并计算得∑x i 210i=1=0.038,∑y i 210i=1=1.6158,∑x i y i10i=1=0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数r =i n i=1i √∑(x i −x̅)2ni=1∑(y i−y ̅)2ni=1√1.896≈1.377.3.【2021年甲卷文科】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++4.【2021年乙卷文科】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为21s和22s.(1)求x,y,21s,22s;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x-≥认为有显著提高).5.【2020年新课标1卷文科】某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务6.【2019年新课标1卷文科】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.7.【2019年新课标2卷文科】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602.8.【2018年新课标1卷文科】某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)。
专题15概率与统计(选择题、填空题)(理科专用)1.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为1,2,3,且3>2>1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率;该棋手在第二盘与乙比赛且连胜两盘的概率乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为甲则甲=2(1−2)13+221(1−3)=21(2+3)−4123记该棋手在第二盘与乙比赛,且连胜两盘的概率为乙则乙=2(1−1)23+212(1−3)=22(1+3)−4123记该棋手在第二盘与丙比赛,且连胜两盘的概率为丙则丙=2(1−1)32+213(1−2)=23(1+2)−4123则甲−乙=21(2+3)−4123−22(1+3)−4123=21−23<0乙−丙=22(1+3)−4123−23(1+2)−4123=22−31<0即甲<乙,乙<丙,则该棋手在第二盘与丙比赛,最大.选项D判断正确;选项BC判断错误;与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D2.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C 72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率=21−721=23.故选:D.3.【2021年甲卷理科】已知12,F F 是双曲线C 的两个焦点,P 为C 上一点,且121260,3F PF PF PF ∠=︒=,则C 的离心率为()A 72B .132C D 【答案】A 【解析】【分析】根据双曲线的定义及条件,表示出12,PF PF ,结合余弦定理可得答案.【详解】因为213PF PF =,由双曲线的定义可得12222PF PF PF a -==,所以2PF a =,13PF a =;因为1260F PF ∠=︒,由余弦定理可得2224923cos60c a a a a =+-⨯⋅⋅︒,整理可得2247c a =,所以22274a c e ==,即2e =.故选:A 【点睛】关键点睛:双曲线的定义是入手点,利用余弦定理建立,a c 间的等量关系是求解的关键.4.【2021年甲卷理科】将4个1和2个0随机排成一行,则2个0不相邻的概率为()A .13B .25C .23D .45【答案】C 【解析】【分析】采用插空法,4个1产生5个空,分2个0相邻和2个0不相邻进行求解.【详解】将4个1和2个0随机排成一行,可利用插空法,4个1产生5个空,若2个0相邻,则有155C =种排法,若2个0不相邻,则有2510C =种排法,所以2个0不相邻的概率为1025103=+.故选:C.5.【2021年乙卷理科】在区间(0,1)与(1,2)中各随机取1个数,则两数之和大于74的概率为()A .79B .2332C .932D .29【答案】B 【解析】【分析】设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,分别求出,A Ω对应的区域面积,根据几何概型的的概率公式即可解出.【详解】如图所示:设从区间()()0,1,1,2中随机取出的数分别为,x y ,则实验的所有结果构成区域为(){},01,12x y x y Ω=<<<<,其面积为111SΩ=⨯=.设事件A 表示两数之和大于74,则构成的区域为()7,01,12,4A x y x y x y ⎧⎫=<<<+⎨⎬⎩⎭,即图中的阴影部分,其面积为13323124432A S =-⨯⨯=,所以()2332A S P A S Ω==.故选:B.【点睛】本题主要考查利用线性规划解决几何概型中的面积问题,解题关键是准确求出事件,A Ω对应的区域面积,即可顺利解出.6.【2021年新高考1卷】有6个相同的球,分别标有数字1,2,3,4,5,6,从中有放回的随机取两次,每次取1个球,甲表示事件“第一次取出的球的数字是1”,乙表示事件“第二次取出的球的数字是2”,丙表示事件“两次取出的球的数字之和是8”,丁表示事件“两次取出的球的数字之和是7”,则()A .甲与丙相互独立B .甲与丁相互独立C .乙与丙相互独立D .丙与丁相互独立【答案】B 【解析】【分析】根据独立事件概率关系逐一判断【详解】11561()()()()6636366P P P P =====甲,乙,丙丁,1()0()()()()()36P P P P P P =≠==甲丙甲丙,甲丁甲丁,1()()()()0()()36P P P P P P =≠=≠乙丙乙丙,丙丁丁丙,故选:B 【点睛】判断事件,A B 是否独立,先计算对应概率,再判断()()()P A P B P AB =是否成立7.【2021年新高考2卷】某物理量的测量结果服从正态分布()210,N σ,下列结论中不正确的是()A .σ越小,该物理量在一次测量中在(9.9,10.1)的概率越大B .该物理量在一次测量中大于10的概率为0.5C .该物理量在一次测量中小于9.99与大于10.01的概率相等D .该物理量在一次测量中落在(9.9,10.2)与落在(10,10.3)的概率相等【答案】D 【解析】【分析】由正态分布密度曲线的特征逐项判断即可得解.【详解】对于A ,2σ为数据的方差,所以σ越小,数据在10μ=附近越集中,所以测量结果落在()9.9,10.1内的概率越大,故A 正确;对于B ,由正态分布密度曲线的对称性可知该物理量一次测量大于10的概率为0.5,故B正确;对于C ,由正态分布密度曲线的对称性可知该物理量一次测量结果大于10.01的概率与小于9.99的概率相等,故C 正确;对于D ,因为该物理量一次测量结果落在()9.9,10.0的概率与落在()10.2,10.3的概率不同,所以一次测量结果落在()9.9,10.2的概率与落在()10,10.3的概率不同,故D 错误.故选:D.8.【2020年新课标1卷理科】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C )的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i = 得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是()A .y a bx =+B .2y a bx =+C .e x y a b =+D .ln y a b x=+【答案】D 【解析】【分析】根据散点图的分布可选择合适的函数模型.【详解】由散点图分布可知,散点图分布在一个对数函数的图象附近,因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+.故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.9.【2020年新课标2卷理科】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者()A .10名B .18名C .24名D .32名【答案】B 【解析】【分析】算出第二天订单数,除以志愿者每天能完成的订单配货数即可.【详解】由题意,第二天新增订单数为50016001200900+-=,9001850=,故至少需要志愿者18名.故选:B 【点晴】本题主要考查函数模型的简单应用,属于基础题.10.【2020年新课标3卷理科】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是()A .14230.1,0.4p p p p ====B .14230.4,0.1p p p p ====C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【答案】B 【解析】【分析】计算出四个选项中对应数据的平均数和方差,由此可得出标准差最大的一组.【详解】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65As =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85Bs =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05Cs =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45Ds =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组的标准差最大.故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.11.【2020年新高考1卷(山东卷)】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是()A .62%B .56%C .46%D .42%【答案】C 【解析】【分析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,然后根据积事件的概率公式()P A B ⋅=()()()P A P B P A B +-+可得结果.【详解】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅,则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-=所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%.故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.12.【2019年新课标1卷理科】我国古代典籍《周易》用“卦”描述万物的变化.每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“——”和阴爻“——”,如图就是一重卦.在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是A .516B .1132C .2132D .1116【答案】A【分析】本题主要考查利用两个计数原理与排列组合计算古典概型问题,渗透了传统文化、数学计算等数学素养,“重卦”中每一爻有两种情况,基本事件计算是住店问题,该重卦恰有3个阳爻是相同元素的排列问题,利用直接法即可计算.【详解】由题知,每一爻有2种情况,一重卦的6爻有62情况,其中6爻中恰有3个阳爻情况有36C ,所以该重卦恰有3个阳爻的概率为3662C =516,故选A .【点睛】对利用排列组合计算古典概型问题,首先要分析元素是否可重复,其次要分析是排列问题还是组合问题.本题是重复元素的排列问题,所以基本事件的计算是“住店”问题,满足条件事件的计算是相同元素的排列问题即为组合问题.13.【2019年新课标2卷理科】演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差【答案】A 【解析】【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案.【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤ .则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤ ,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++ ,后来平均数234817x x x x x '=+++ ()平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦ ()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦ 由②易知,C 不正确.④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确.本题旨在考查学生对中位数、平均数、方差、极差本质的理解.14.【2019年新课标3卷理科】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为A.0.5B.0.6C.0.7D.0.8【答案】C【解析】根据题先求出阅读过西游记的人数,进而得解.【详解】由题意得,阅读过《西游记》的学生人数为90-80+60=70,则其与该校学生人数之比为70÷100=0.7.故选C.【点睛】本题考查容斥原理,渗透了数据处理和数学运算素养.采取去重法,利用转化与化归思想解题.15.【2018年新课标1卷理科】某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】【分析】首先设出新农村建设前的经济收入为M ,根据题意,得到新农村建设后的经济收入为2M ,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【详解】设新农村建设前的收入为M ,而新农村建设后的收入为2M ,则新农村建设前种植收入为0.6M ,而新农村建设后的种植收入为0.74M ,所以种植收入增加了,所以A 项不正确;新农村建设前其他收入我0.04M ,新农村建设后其他收入为0.1M ,故增加了一倍以上,所以B 项正确;新农村建设前,养殖收入为0.3M ,新农村建设后为0.6M ,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的30%28%58%50%+=>,所以超过了经济收入的一半,所以D 正确;故选A.点睛:该题考查的是有关新农村建设前后的经济收入的构成比例的饼形图,要会从图中读出相应的信息即可得结果.16.【2018年新课标1卷理科】如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I ,II ,III 的概率分别记为p 1,p 2,p 3,则A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 3【答案】A 【解析】【分析】首先设出直角三角形三条边的长度,根据其为直角三角形,从而得到三边的关系,然后应用相应的面积公式求得各个区域的面积,根据其数值大小,确定其关系,再利用面积型几何概型的概率公式确定出p 1,p 2,p 3的关系,从而求得结果.【详解】设,,AC b AB c BC a ===,则有222b c a +=,从而可以求得ABC ∆的面积为112=S bc ,黑色部分的面积为22221()()[()]2222c b a S bc πππ=⋅+⋅-⋅-2221(4442c b a bc π=+-+22211422c b a bc bc π+-=⋅+=,其余部分的面积为22311122282a a S bc bc ππ⎛⎫=⋅-=- ⎪⎝⎭,所以有12S S =,根据面积型几何概型的概率公式,可以得到12p p =,故选A.点睛:该题考查的是面积型几何概型的有关问题,题中需要解决的是概率的大小,根据面积型几何概型的概率公式,将比较概率的大小问题转化为比较区域的面积的大小,利用相关图形的面积公式求得结果.17.【2018年新课标2卷理科】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .112B .114C .115D .118【答案】C【解析】【详解】分析:先确定不超过30的素数,再确定两个不同的数的和等于30的取法,最后根据古典概型概率公式求概率.详解:不超过30的素数有2,3,5,7,11,13,17,19,23,29,共10个,随机选取两个不同的数,共有21045C =种方法,因为7+23=11+19=13+17=30,所以随机选取两个不同的数,其和等于30的有3种方法,故概率为31=4515,选C.点睛:古典概型中基本事件数的探求方法:(1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.(4)排列组合法:适用于限制条件较多且元素数目较多的题目.18.【2018年新课标3卷理科】某群体中的每位成员使用移动支付的概率都为p ,各成员的支付方式相互独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,()()46P X P X =<=,则p =A .0.7B .0.6C .0.4D .0.3【答案】B【解析】【详解】分析:判断出为二项分布,利用公式()()D X np 1p =-进行计算即可.()()D X np 1p =- p 0.4∴=或p 0.6=()()()()6444661010P X 41P X 61C p p C p p ==-<==-,()221p p ∴-<,可知p 0.5>故答案选B.点睛:本题主要考查二项分布相关知识,属于中档题.19.【2021年新高考1卷】有一组样本数据1x ,2x ,…,n x ,由这组数据得到新样本数据1y ,2y ,…,n y ,其中i i y x c =+(1,2,,),i n c =⋅⋅⋅为非零常数,则()A .两组样本数据的样本平均数相同B .两组样本数据的样本中位数相同C .两组样本数据的样本标准差相同D .两组样本数据的样本极差相同【答案】CD【解析】【分析】A 、C 利用两组数据的线性关系有()()E y E x c =+、()()D y D x =,即可判断正误;根据中位数、极差的定义,结合已知线性关系可判断B 、D 的正误.【详解】A :()()()E y E x c E x c =+=+且0c ≠,故平均数不相同,错误;B :若第一组中位数为i x ,则第二组的中位数为i i y x c =+,显然不相同,错误;C :()()()()D y D x D c D x =+=,故方差相同,正确;D :由极差的定义知:若第一组的极差为max min x x -,则第二组的极差为max min max min max min ()()y y x c x c x x -=+-+=-,故极差相同,正确;故选:CD20.【2021年新高考2卷】下列统计量中,能度量样本12,,,n x x x 的离散程度的是()A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【解析】【分析】考查所给的选项哪些是考查数据的离散程度,哪些是考查数据的集中趋势即可确定正确选项.【详解】由标准差的定义可知,标准差考查的是数据的离散程度;由中位数的定义可知,中位数考查的是数据的集中趋势;由极差的定义可知,极差考查的是数据的离散程度;由平均数的定义可知,平均数考查的是数据的集中趋势;故选:AC.21.【2020年新高考1卷(山东卷)】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑ ,定义X 的信息熵21()log n i i i H X p p ==-∑.()A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n == ,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+= ,则H (X )≤H (Y )【答案】AC【解析】【分析】对于A 选项,求得()H X ,由此判断出A 选项;对于B 选项,利用特殊值法进行排除;对于C 选项,计算出()H X ,利用对数函数的性质可判断出C 选项;对于D 选项,计算出()(),H X H Y ,利用基本不等式和对数函数的性质判断出D 选项.【详解】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确.对于B 选项,若2n =,则1,2i =,211p p =-,所以()()()121121X log 1log 1H p p p p =-⋅+-⋅-⎡⎤⎣⎦,当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误.对于C 选项,若()11,2,,i p i n n== ,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m j P Y j p p +-==+(1,2,,j m = ).()2222111log log m m i i i i i iH X p p p p ===-⋅=⋅∑∑122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅ .()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅+⋅+++⋅+++ 12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++ 由于()01,2,,2i p i m >= ,所以2111i i m i p p p +->+,所以222111log log i i m i p p p +->+,所以222111log log i i i i m ip p p p p +-⋅>⋅+,所以()()H X H Y >,所以D 选项错误.故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.22.【2020年新高考2卷(海南卷)】我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,下列说法正确的是A .这11天复工指数和复产指数均逐日增加;B .这11天期间,复产指数增量大于复工指数的增量;C.第3天至第11天复工复产指数均超过80%;D.第9天至第11天复产指数增量大于复工指数的增量;【答案】CD【解析】【分析】注意到折线图中有递减部分,可判定A错误;注意考查第1天和第11天的复工复产指数的差的大小,可判定B错误;根据图象,结合复工复产指数的意义和增量的意义可以判定CD 正确.【详解】由图可知,第1天到第2天复工指数减少,第7天到第8天复工指数减少,第10天到第11复工指数减少,第8天到第9天复产指数减少,故A错误;由图可知,第一天的复产指标与复工指标的差大于第11天的复产指标与复工指标的差,所以这11天期间,复产指数增量小于复工指数的增量,故B错误;由图可知,第3天至第11天复工复产指数均超过80%,故C正确;由图可知,第9天至第11天复产指数增量大于复工指数的增量,故D正确;【点睛】本题考查折线图表示的函数的认知与理解,考查理解能力,识图能力,推理能力,难点在于指数增量的理解与观测,属中档题.23.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有=C84=70个结果,这4个点在同一个平面的有= 6+6=12个,故所求概率==1270=635.故答案为:635.24.【2022年新高考2卷】已知随机变量X服从正态分布2,2,且o2<≤2.5)=0.36,则o>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为∼2,2,所以<2=>2=0.5,因此>2.5=>2−2<≤2.5=0.5−0.36=0.14.故答案为:0.14.25.【2019年新课标1卷理科】甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是____________.【答案】0.18【解析】【分析】本题应注意分情况讨论,即前五场甲队获胜的两种情况,应用独立事件的概率的计算公式求解.题目有一定的难度,注重了基础知识、基本计算能力及分类讨论思想的考查.【详解】前四场中有一场客场输,第五场赢时,甲队以4:1获胜的概率是30.60.50.520.108,⨯⨯⨯=前四场中有一场主场输,第五场赢时,甲队以4:1获胜的概率是220.40.60.520.072,⨯⨯⨯=综上所述,甲队以4:1获胜的概率是0.1080.0720.18.q =+=【点睛】由于本题题干较长,所以,易错点之一就是能否静心读题,正确理解题意;易错点之二是思维的全面性是否具备,要考虑甲队以4:1获胜的两种情况;易错点之三是是否能够准确计算.26.【2019年新课标2卷理科】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为___________.【答案】0.98.【解析】【分析】本题考查通过统计数据进行概率的估计,采取估算法,利用概率思想解题.【详解】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10+20+10=40,所以该站所有高铁平均正点率约为39.20.9840=.【点睛】本题考点为概率统计,渗透了数据处理和数学运算素养.侧重统计数据的概率估算,难度不大.易忽视概率的估算值不是精确值而失误,根据分类抽样的统计数据,估算出正点列车数量与列车总数的比值.。
【答案】解: (Ⅰ) 由图知,三角形中共有15个格点,与周围格点的距离不超过1米的格点数都是1个的格点有2个,坐标分别为(4,0),(0,4). 与周围格点的距离不超过1米的格点数都是2个的格点有4个,坐标分别为(0,0), (1,3), (2,2),(3,1).与周围格点的距离不超过1米的格点数都是3个的格点有6个,坐标分别为(1,0), (2,0), (3,0),(0,1,) ,(0,2),(0,3,).与周围格点的距离不超过1米的格点数都是4个的格点有3个,坐标分别为(1,1), (1,2), (2,1).如下表所示:平均年收获量4615==u .(Ⅱ)在15株中,年收获量至少为48kg 的作物共有2+4=6个. 所以,15株中任选一个,它的年收获量至少为48k 的概率P=4.0156=. 15.(2013年高考江西卷(文))小波已游戏方式决定是去打球、唱歌还是去下棋.游戏规则为以O 为起点,再从A 1,A 2,A 3,A 4,A 5,A 6(如图)这6个点中任取两点分别为终点得到两个向量,记住这两个向量的数量积为X,若X>0就去打球,若X=0就去唱歌,若X<0就去下棋.(1) 写出数量积X 的所有可能取值 (2) 分别求小波去下棋的概率和不.去唱歌的概率 【答案】解:(1) x 的所有可能取值为-2 ,-1 ,0, 1.(2)数量积为-2的只有25OA OA ∙一种数量积为-1的有15OA OA ∙,1624263435,,,,OA OA OA OA OA OA OA OA OA OA ∙∙∙∙∙六种 数量积为0的有13143646,,,OA OA OA OA OA OA OA OA ∙∙∙∙四种 数量积为1的有12234556,,,OA OA OA OA OA OA OA OA ∙∙∙∙四种 故所有可能的情况共有15种. 所以小波去下棋的概率为1715p = 因为去唱歌的概率为2415p =,所以小波不去唱歌的概率2411111515p p =-=-= 16.(2013年高考北京卷(文))下图是某市3月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气质量优良的概率;(Ⅱ)求此人在该市停留期间只有1天空气重度污染的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)【答案】解:(I)在3月1日至3月13日这13天中,1日.2日.3日.7日.12日.13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率是613. (II)根据题意,事件“此人在该市停留期间只有1天空气重度污染”等价于“此人到达该市的日期是4日,或5日,或7日,或8日”.所以此人在该市停留期间只有1天空气质量重度污染的概率为413. (III)从3月5日开始连续三天的空气质量指数方差最大. 几何概型:1.【2012高考辽宁文11】在长为12cm 的线段AB 上任取一点C. 现作一矩形,邻边长分别等于线段AC,CB 的长,则该矩形面积大于20cm 2的概率为 :(A)16 (B) 13 (C) 23 (D) 45【答案】C【解析】设线段AC 的长为x cm ,则线段CB 的长为(12x -)cm,那么矩形的面积为(12)x x -cm 2,由(12)20x x ->,解得210x <<。
重难点04 概率与统计新高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差。
概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。
取代了传统意义上的应用题,成为高考中的亮点。
解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注。
求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因;(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.捆绑法:题目中规定相邻的几个元素捆绑成一个组,当作一个大元素参与排列。
相离问题插空排:元素相离(即不相邻)问题,可先把无位置要求的几个元素全排列,再把规定的相离的几个元素插入上述几个元素的空位和两端。
定序问题缩倍法:在排列问题中限制某几个元素必须保持一定的顺序,可用缩小倍数的方法。
标号排位问题分步法:把元素排到指定位置上,可先把某个元素按规定排入,第二步再排另一个元素,如此继续下去,依次即可完成。
有序分配问题逐分法:有序分配问题指把元素分成若干组,可用逐步下量分组法。
对于二项式定理的应用,只要会求对应的常数项以及对应的n项即可,但是应注意是二项式系数还是系数。
新高考统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
1.春节前夕,质检部门检查一箱装有2 500件包装食品的质量,抽查总量的2%,在这个问题中,下列说法正确的是( )A .总体是指这箱2 500件包装食品B .个体是一件包装食品C .样本是按2%抽取的50件包装食品D .样本容量是50 答案 D解析 总体、个体、样本的考查对象是同一事,不同的是考查的范围不同,在本题中,总体、个体是指食品的质量,而样本容量是样本中个体的包含个数.故答案为D.2.在可行域内任取一点,其规则如流程图所示,则能输出数对(x ,y )的概率是( )A.π8B.π4C.π6D.π2 答案 B解析 依题意可行域为正方形AOCD ,输出数对(x ,y )形成的图形为图中阴影部分,故所求概率为:P =14π⎝⎛⎭⎫22222·22=π4.3.已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( ) A .0.6 B .0.4 C .0.3 D .0.2 答案 C解析 ∵P (ξ<4)=0.8, ∴P (ξ>4)=0.2,由题意知图象的对称轴为直线x =2, P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.4.节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮相互独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒为间隔闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是( ) A.14 B.12 C.34 D.78 答案 C 解析设在通电后的4秒钟内,甲串彩灯、乙串彩灯第一次亮的时刻为x 、y ,x 、y 相互独立,由题意可知⎩⎪⎨⎪⎧0≤x ≤4,0≤y ≤4,|x -y |≤2,如图所示.所以两串彩灯第一次亮的时间相差不超过2秒的概率为P (|x -y |≤2)=S 正方形-2S △ABC S 正方形=4×4-2×12×2×24×4=1216=34.5.为了从甲、乙两名运动员中选拔一人参加某次运动会跳水项目,对甲、乙两名运动员进行培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得到茎叶图如图所示.从平均成绩及发挥稳定性的角度考虑,你认为选派________(填甲或乙)运动员合适.答案 甲解析 根据茎叶图,可得x 甲=16×(78+79+81+84+93+95)=85,x 乙=16×(75+80+83+85+92+95)=85.s 2甲=16×[(78-85)2+(79-85)2+(81-85)2+(84-85)2+(93-85)2+(95-85)2]=1333, s 2乙=16×[(75-85)2+(80-85)2+(83-85)2+(85-85)2+(92-85)2+(95-85)2]=1393. 因为x 甲=x 乙,s 2甲<s 2乙,所以甲运动员的成绩比较稳定,选派甲运动员参赛比较合适.题型一 古典概型与几何概型例1 (1)(2015·陕西)设复数z =(x -1)+y i(x ,y ∈R ),若|z |≤1,则y ≥x 的概率为( ) A.34+12π B.14-12π C.12-1π D.12+1π答案 B解析 由|z |≤1可得(x -1)2+y 2≤1,表示以(1,0)为圆心,半径为1的圆及其内部,满足y ≥x 的部分为如图阴影所示,由几何概型概率公式可得所求概率为:P =14π×12-12×12π×12=π4-12π=14-12π.(2)有9张卡片分别写着数字1,2,3,4,5,6,7,8,9,甲、乙二人依次从中抽取一张卡片(不放回),试求: ①甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片的概率; ②甲、乙二人至少抽到一张写有奇数数字卡片的概率.解 ①甲、乙二人依次从9张卡片中抽取一张的可能结果有C 19·C 18,甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片的结果有C 15·C 14种,设“甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片”的概率为P 1,则P 1=C 15·C 14C 19·C 18=2072=518.②方法一 甲、乙二人至少抽到一张写有奇数数字卡片的事件包含下面的三个事件:“甲抽到写有奇数数字的卡片,乙抽到写有偶数数字的卡片”有C 15·C 14种; “甲抽到写有偶数数字卡片,且乙抽到写有奇数数字卡片”有C 14·C 15种; “甲、乙二人均抽到写有奇数数字卡片”有C 15·C 14种. 设甲、乙二人至少抽到一张写有奇数数字卡片的概率为P 2,则P 2=C 15·C 14+C 14·C 15+C 15·C 14C 19C 18=6072=56. 方法二 甲、乙二人至少抽到一张奇数数字卡片的对立事件为两人均抽到写有偶数数字卡片,设为P 2,则P 2=1-P 2=1-C 14C 13C 19C 18=56.思维升华 几何概型与古典概型的本质区别在于试验结果的无限性,几何概型经常涉及的几何度量有长度、面积、体积等,解决几何概型的关键是找准几何测度;古典概型是命题的重点,对于较复杂的基本事件空间,列举时要按照一定的规律进行,做到不重不漏.(1)为了丰富学生的课余生活,促进校园文化建设,我校高二年级通过预赛选出了6个班(含甲、乙)进行经典美文诵读比赛决赛.决赛通过随机抽签方式决定出场顺序.求: ①甲、乙两班恰好在前两位出场的概率;②决赛中甲、乙两班之间的班级数记为X ,求X 的分布列和均值. 解 ①设“甲、乙两班恰好在前两位出场”为事件A ,则P (A )=A 22×A 44A 66=115.所以甲、乙两班恰好在前两位出场的概率为115.②随机变量X 的可能取值为0,1,2,3,4.P (X =0)=A 22×A 55A 66=13,P (X =1)=4×A 22×A 44A 66=415,P (X =2)=A 24×A 22×A 33A 66=15, P (X =3)=A 34×A 22×A 22A 66=215,P (X =4)=A 44×A 22A 66=115. 随机变量X 的分布列为X 0 1 2 3 4 P1341515215115因此,E (X )=0×13+1×415+2×15+3×215+4×115=43.(2)已知关于x 的二次函数f (x )=ax 2-4bx +1.设点(a ,b )是区域⎩⎪⎨⎪⎧x +y -8≤0,x >0,y >0内的一点,求函数y =f (x )在区间[1,+∞)上是增函数的概率.解 ∵函数f (x )=ax 2-4bx +1的图象的对称轴为直线x =2ba ,要使f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数, 当且仅当a >0且2ba≤1,即2b ≤a .依条件可知事件的全部结果所构成的区域为 ⎩⎨⎧⎭⎬⎫(a ,b )⎪⎪⎪⎩⎪⎨⎪⎧ a +b -8≤0,a >0,b >0,构成所求事件的区域为三角形部分. 所求概率区间应满足2b ≤a .由⎩⎪⎨⎪⎧a +b -8=0,b =a 2,得交点坐标为(163,83),故所求事件的概率为P =12×8×8312×8×8=13.题型二 求离散型随机变量的均值与方差例2 (2015·四川)某市A ,B 两所中学的学生组队参加辩论赛,A 中学推荐了3名男生、2名女生,B 中学推荐了3名男生、4名女生,两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3人、女生中随机抽取3人组成代表队. (1)求A 中学至少有1名学生入选代表队的概率;(2)某场比赛前,从代表队的6名队员中随机抽取4人参赛,设X 表示参赛的男生人数,求X 的分布列和均值.解 (1)由题意,参加集训的男、女生各有6名,参赛学生全从B 中学抽取(等价于A 中学没有学生入选代表队)的概率为C 33C 34C 36C 36=1100,因此,A 中学至少有1名学生入选代表队的概率为 1-1100=99100. (2)根据题意,X 的可能取值为1,2,3,P (X =1)=C 13C 33C 46=15,P (X =2)=C 23C 23C 46=35,P (X =3)=C 33C 13C 46=15,所以X 的分布列为X 1 2 3 P153515因此,X 的均值为E (X )=1×P (X =1)+2×P (X =2)+3×P (X =3) =1×15+2×35+3×15=2.思维升华 离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如二点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率间的对应.受轿车在保修期内维修费等因素的影响,企业生产每辆轿车的利润与该轿车首次出现故障的时间有关.某轿车制造厂生产甲、乙两种品牌轿车,保修期均为2年.现从该厂已售出的两种品牌轿车中各随机抽取50辆,统计数据如下:品牌甲 乙 首次出现故障时间x (年)0<x ≤1 1<x ≤2 x >2 0<x ≤2 x >2 轿车数量(辆) 2 3 45 5 45 每辆利润(万元)1231.82.9将频率视为概率,解答下列问题:(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其首次出现故障发生在保修期内的概率;(2)若该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X 1,生产一辆乙品牌轿车的利润为X 2,分别求X 1,X 2的分布列;(3)该厂预计今后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌的轿车.若从经济效益的角度考虑,你认为应生产哪种品牌的轿车?说明理由.解 (1)设“甲品牌轿车首次出现故障发生在保修期内”为事件A ,则P (A )=2+350=110.(2)依题意得,X 1的分布列为X 1 1 2 3 P125350910X 2的分布列为X 2 1.8 2.9 P110910(3)由(2)得E (X 1)=1×125+2×350+3×910=14350=2.86(万元), E (X 2)=1.8×110+2.9×910=2.79(万元).因为E (X 1)>E (X 2),所以应生产甲品牌轿车. 题型三 概率与统计的综合应用例3 经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X (单位: t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X ∈[100,110),则取X =105,且X =105的概率等于需求量落入[100,110)的频率),求T 的均值. 解 (1)当X ∈[100,130)时,T =500X -300(130-X )=800X -39 000. 当X ∈[130,150]时,T =500×130=65 000.所以T =⎩⎪⎨⎪⎧800X -39 000,100≤X <130,65 000,130≤X ≤150.(2)由(1)知利润T 不少于57 000元当且仅当120≤X ≤150.由直方图知需求量X ∈[120,150]的频率为0.7,所以下一个销售季度内的利润T 不少于57 000元的概率的估计值为0.7.(3)依题意可得T 的分布列为T 45 000 53 000 61 000 65 000 P0.10.20.30.4所以E (T )=45 000×0.1+思维升华 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.甲组 乙组 9 9 0 X 8 9 111(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y 的分布列和均值. (注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解 (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数x =8+8+9+104=354; 方差s 2=14[(8-354)2+(8-354)2+(9-354)2+(10-354)2]=1116. (2)当X =9时,由茎叶图可知,甲组同学的植树棵数是9,9,11,11;乙组同学的植树棵数是9,8,9,10.分别从甲、乙两组中随机选取一名同学,共有4×4=16(种)可能的结果,这两名同学植树总棵数Y 的可能取值为17,18,19,20,21.事件“Y =17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P (Y =17)=216=18.同理可得P (Y =18)=14,P (Y =19)=14,P (Y =20)=14,P (Y =21)=18.所以随机变量Y 的分布列为Y 17 18 19 20 21 P1814141418E (Y )=17×18+18×14+19×14+20×14+21×18=19.题型四 概率与统计案例的综合应用例4 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料是否可以认为“体育迷”与性别有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X .若每次抽取的结果是相互独立的,求X 的分布列、均值E (X )和方差D (X ). 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25, “非体育迷”人数为75,从而2×2列联表如下:将2×2列联表的数据代入公式计算: χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(30×10-45×15)245×55×75×25=10033≈3.030. 因为2.706<3.030<3.841,所以有90%的把握认为“体育迷”与性别有关.(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意,X ~B ⎝⎛⎭⎫3,14,从而X 的分布列为E (X )=np =3×14=34,D (X )=np (1-p )=3×14×34=916.思维升华 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.为了解大学生观看湖南卫视综艺节目“快乐大本营”是否与性别有关,一所大学心理学教师从该校学生中随机抽取了50人进行问卷调查,得到了如下的列联表:喜欢看“快乐大本营”不喜欢看“快乐大本营”合计 女生 5 男生 10 合计50若该教师采用分层抽样的方法从50份问卷调查中继续抽查了10份进行重点分析,知道其中喜欢看“快乐大本营”的有6人.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关?说明你的理由;(3)已知喜欢看“快乐大本营”的10位男生中,A 1,A 2,A 3,A 4,A 5还喜欢看新闻,B 1,B 2,B 3还喜欢看动画片,C 1,C 2还喜欢看韩剧,现再从喜欢看新闻、动画片和韩剧的男生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率. 下面的临界值表供参考:P (χ2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828(参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解 (1)由分层抽样知识知,喜欢看“快乐大本营”的同学有50×610=30人,故不喜欢看“快乐大本营”的同学有50-30=20人,于是可将列联表补充如下:喜欢看“快乐大本营”不喜欢看“快乐大本营”合计 女生 20 5 25 男生 10 15 25 合计302050(2)∵χ2=50×(20×15-10×5)230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关.(3)从喜欢看“快乐大本营”的10位男生中选出喜欢看韩剧、喜欢看新闻、喜欢看动画片的各1名,其一切可能的结果组成的基本事件共有N =5×3×2=30个,用M 表示“B 1,C 1不全被选中”这一事件,则其对立事件M 表示“B 1,C 1全被选中”这一事件,由于M 由(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1),(A 4,B 1,C 1),(A 5,B 1,C 1)5个基本事件组成,所以P (M )=530=16.由对立事件的概率公式得 P (M )=1-P (M )=1-16=56.(时间:80分钟)1.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.1 7 92 0 1 5 3(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率. 解 (1)样本平均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人占的比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.(3)设事件A :“从该车间12名工人中,任取2人,恰有1名优秀工人”,则P (A )=C 14C 18C 212=1633.2.在10件产品中,有3件一等品,4件二等品,3件三等品.从这10件产品中任取3件,求: (1)取出的3件产品中一等品件数X 的分布列和均值; (2)取出的3件产品中一等品件数多于二等品件数的概率.解 (1)由于从10件产品中任取3件的结果数为C 310,从10件产品中任取3件,其中恰有k 件一等品的结果数为C k 3C 3-k7(k =0,1,2,3),那么从10件产品中任取3件,其中恰有k 件一等品的概率为P (X =k )=C k 3C 3-k7C 310,k =0,1,2,3.所以随机变量X 的分布列是X 的均值E (X )=0×724+1×2140+2×740+3×1120=910.(2)设“取出的3件产品中一等品件数多于二等品件数”为事件A ,“恰好取出1件一等品和2件三等品”为事件A 1,“恰好取出2件一等品”为事件A 2,“恰好取出3件一等品”为事件A 3,由于事件A 1,A 2,A 3彼此互斥,且A =A 1∪A 2∪A 3,而P (A 1)=C 13C 23C 310=340.P (A 2)=P (X =2)=740.P (A 3)=P (X =3)=1120,所以取出的3件产品中一等品件数多于二等品件数的概率为P (A )=P (A 1)+P (A 2)+P (A 3)=340+740+1120=31120.3.一个均匀的正四面体的四个面上分别涂有1,2,3,4四个数字,现随机投掷两次,正四面体面朝下的数字分别为b ,c .(1)z =(b -3)2+(c -3)2,求z =4的概率;(2)若方程x 2-bx -c =0至少有一根x ∈{1,2,3,4},就称该方程为“漂亮方程”,求方程为“漂亮方程”的概率.解 (1)因为是投掷两次,因此基本事件(b ,c ):(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)共16个. 当z =4时,(b ,c )的所有取值为(1,3),(3,1), 所以P (z =4)=216=18.(2)①若方程一根为x =1,则1-b -c =0, 即b +c =1,不成立.②若方程一根为x =2,则4-2b -c =0,即2b +c =4,所以⎩⎪⎨⎪⎧ b =1,c =2.③若方程一根为x =3,则9-3b -c =0,即3b +c =9,所以⎩⎪⎨⎪⎧b =2,c =3.④若方程一根为x =4,则16-4b -c =0,即4b +c =16,所以⎩⎪⎨⎪⎧b =3,c =4.由①②③④知(b ,c )的所有可能取值为(1,2),(2,3),(3,4),所以方程为“漂亮方程”的概率为P =316.4.某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上40件产品作为样本称出它们的重量(单位:克),重量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量;(2)在上述抽取的40件产品中任取2件,设Y 为重量超过505克的产品数量,求Y 的分布列; (3)从该流水线上任取2件产品,设X 为重量超过505克的产品数量,求X 的分布列.解 (1)根据频率分布直方图可知,重量超过505克的产品数量为[(0.01+0.05)×5]×40=12(件). (2)依题意,Y 的可能取值为0,1,2. P (Y =0)=C 228C 240=63130,P (Y =1)=C 128C 112C 240=2865,P (Y =2)=C 212C 240=11130,∴Y 的分布列为Y 0 1 2 P63130286511130(3)利用样本估计总体,该流水线上产品重量超过505克的概率为0.3, 令X 为任取的2件产品中重量超过505克的产品数量, 则X ~B (2,0.3), ∴X 的分布列为X 0 1 2 P0.490.420.095.如图所示,一圆形靶分成A ,B ,C 三部分,其面积之比为1∶1∶2.某同学向该靶投掷3枚飞镖,每次1枚.假设他每次投掷必定会中靶,且投中靶内各点是随机的.(1)求该同学在一次投掷中投中A 区域的概率;(2)设X 表示该同学在3次投掷中投中A 区域的次数,求X 的分布列;(3)若该同学投中A ,B ,C 三个区域分别可得3分,2分,1分,求他投掷3次恰好得4分的概率. 解 (1)设该同学在一次投掷中投中A 区域的概率为P (A ),依题意得P (A )=14.(2)依题意知,X ~B (3,14),从而X 的分布列为(3)设B i 表示事件“第i 次击中目标时,击中B 区域”,C i 表示事件“第i 次击中目标时,击中C 区域”,i =1,2,3.依题意知P =P (B 1C 2C 3)+P (C 1B 2C 3)+P (C 1C 2B 3)=3×14×12×12=316.6.一次考试共有12道选择题,每道选择题都有4个选项,其中有且只有一个是正确的.评分标准规定:“每题只选一个选项,答对得5分,不答或答错得零分”.某考生已确定有8道题的答案是正确的,其余题中:有两道题都可判断两个选项是错误的,有一道题可以判断一个选项是错误的,还有一道题因不理解题意只好乱猜.请求出该考生: (1)得60分的概率;(2)所得分数X 的分布列和均值.解 (1)设“可判断两个选项是错误的”两道题之一选对为事件A ,“有一道题可以判断一个选项是错误的”选对为事件B ,“有一道题不理解题意”选对为事件C , ∴P (A )=12,P (B )=13,P (C )=14,∴得60分的概率为P =12×12×13×14=148.(2)X 可能的取值为40,45,50,55,60. P (X =40)=12×12×23×34=18;P (X =45)=C 12×12×12×23×34+12×12×13×34+12×12×23×14=1748; P (X =50)=12×12×23×34+C 12×12×12×13×34+C 12×12×12×23×14+12×12×13×14=1748; P (X =55)=C 12×12×12×13×14+12×12×23×14+12×12×13×34=748; P (X =60)=12×12×13×14=148.X 的分布列为E (X )=40×18+45×1748+50×1748+55×748+60×148=57512.。
概率统计大题综合知识点总结1.数字样本特征(1)众数:在一组数据中出现次数最多的数(2)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数(3)平均数:x =x 1+x 2+⋯⋯+x nn ,反映样本的平均水平(4)方差:s 2=(x 1−x )2+(x 2−x )2+⋯⋯(x n −x )2n反映样本的波动程度,稳定程度和离散程度;s 2越大,样本波动越大,越不稳定;s 2越小,样本波动越小,越稳定;(5)标准差:σ=s 2,标准差等于方差的算术平方根,数学意义和方差一样(6)极差:等于样本的最大值−最小值2.求随机变量X 的分布列的步骤:(1)理解X 的意义,写出X 可能取得全部值;(2)求X 取每个值的概率;(3)写出X 的分布列;(4)根据分布列的性质对结果进行检验.还可判断随机变量满足常见分布列:两点分布,二项分布,超几何分布,正态分布.3.求随机变量的期望和方差的基本方法:(1)已知随机变量的分布列,直接利用期望和方差公式直接求解;(2)已知随机变量X 的期望、方差,求aX +b a ,b ∈R 的期望与方差,利用期望和方差的性质E aX +b =aE X +b ,D aX +b =a 2D X 进行计算;(3)若能分析出所给的随机变量服从常用的分布(如:两点分布、二项分布等),可直接利用常用分布列的期望和方差公式进行计算,若ξ~B (n ,p ),则Eξ=np ,Dξ=np (1-p ).4.求解概率最大问题的关键是能够通过P ξ=k ≥P ξ=k +1P ξ=k ≥Pξ=k -1构造出不等关系,结合组合数公式求解结果5.线性回归分析解题方法:(1)计算x ,y,ni =1x i 2 ,ni =1x i y i 的值;(2)计算回归系数a ,b ;(3)写出回归直线方程y =b x +a.线性回归直线方程为:y =b x +a ,b=ni =1x i −x y i −yni =1x i −x2=ni =1x i y i −nx yni =1x i 2−nx2,a =y −b x其中x ,y为样本中心,回归直线必过该点(4)线性相关系数(衡量两个变量之间线性相关关系的强弱)r=ni=1x i−xy i−yni=1x i−x2ni=1y i−y2=ni=1x i y i−nx yni=1x i2−nx 2ni=1y i2−ny 2r>0,正相关;r<0,负相关r ≤1,且r 越接近于1,线性相关性越强;r 越接近于0,线性相关性越弱,几乎不存在线性相关性6.独立性检验解题方法:(1)依题意完成列联表;(2)用公式求解;(3)对比观测值即可得到所求结论的可能性独立性检验计算公式:K2=n ad-bc2a+bc+da+cb+d模拟训练一、解答题1.(2023·福建三明·统考三模)在二十大报告中,体育、健康等关键词被多次提及,促进群众体育和竞技体育全面发展,加快建设体育强国是全面建设社会主义现代化国家的一个重要目标.某校为丰富学生的课外活动,加强学生体质健康,拟举行羽毛球团体赛,赛制采取3局2胜制,每局都是单打模式,每队有5名队员,比赛中每个队员至多上场一次且是否上场是随机的,每局比赛结果互不影响.经过小组赛后,最终甲、乙两队进入最后的决赛,根据前期比赛的数据统计,甲队种子选手M对乙队每名队员的胜率均为34,甲队其余4名队员对乙队每名队员的胜率均为12.(注:比赛结果没有平局)(1)求甲队最终2:1获胜且种子选手M上场的概率;(2)已知甲队2:1获得最终胜利,求种子选手M上场的概率.2.(2023·湖北武汉·统考模拟预测)“英才计划”最早开始于2013年,由中国科协、教育部共同组织实施,到2022年已经培养了6000多名具有创新潜质的优秀中学生,为选拔培养对象,某高校在暑假期间从武汉市的中学里挑选优秀学生参加数学、物理、化学、信息技术学科夏令营活动.(1)若化学组的12名学员中恰有5人来自同一中学,从这12名学员中选取3人,ξ表示选取的人中来自该中学的人数,求ξ的分布列和数学期望;(2)在夏令营开幕式的晚会上,物理组举行了一次学科知识竞答活动.规则如下:两人一组,每一轮竞答中,每人分别答两题,若小组答对题数不小于3,则取得本轮胜利,假设每轮答题结果互不影响.已知甲、乙两位同学组成一组,甲、乙答对每道题的概率分别为p1,p2,且p1+p2=43,如果甲、乙两位同学想在此次答题活动中取得6轮胜利,那么理论上至少要参加多少轮竞赛?3.(2023·福建宁德·校考二模)某科研团以为了考察某种药物预防疾病的效果,进行动物实验,得到如下列联表.患病未患病总计服用药物1045末服用药物50总计30(1)请将上面的列联表补充完整.(2)认为“药物对预防疾病有效”犯错误的概率是多少?(3)为了进一步研究,现按分层抽样的方法从未患病动物中抽取10只,设其中未服用药物的动物数为ξ,求ξ的分布列与期望.下面的临界值表供参考:P(K2≥k)0.150.100.050.0250.0100.0050.001k 2.0722706 3.841 5.024 6.6357.87910.828(参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)4.(2023·江苏常州·校考一模)设X,Y是一个二维离散型随机变量,它们的一切可能取的值为a i,b j,其中i,j∈N*,令p ij=P X=a i,Y=b j,称p ij i,j∈N*是二维离散型随机变量X,Y的联合分布列,与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式;X,Yb1b2b3⋅⋅⋅a1p11p12p13⋅⋅⋅a2p21p22p23⋅⋅⋅a3p31p32p33⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅现有n n∈N*个球等可能的放入编号为1,2,3的三个盒子中,记落入第1号盒子中的球的个数为X,落入第2号盒子中的球的个数为Y.(1)当n=2时,求X,Y的联合分布列,并写成分布表的形式;(2)设p k=nm=0P X=k,Y=m,k∈N且k≤n,求nk=0kp k的值.(参考公式:若X~B n,p,则nk=0kC k np k1-pn-k=np)5.(2023·江苏南京·南京市第九中学校考模拟预测)某种疾病可分为A,B两种类型,为了解该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者人数是男性患者的2倍,男性患A型疾病的人数占男性患者的56,女性患A型疾病的人数占女性患者的13.A型病B型病合计男女合计(1)填写2×2列联表,若本次调查得出“在犯错误的概率不超过0.005的前提下认为‘所患疾病的类型'与‘性别'有关”的结论,求被调查的男性患者至少有多少人?(2)某团队进行预防A型疾病的疫苗的研发试验,试验期间至多安排2个周期接种疫苗,每人每个周期接种3次,每次接种费用为m m>0元.该团队研发的疫苗每次接种后产生抗体的概率为p0<p<1,如果一个周期内至少2次出现抗体,则该周期结束后终止试验,否则进入第二个周期.若p=23,试验人数为1000人,试估计该试验用于接种疫苗的总费用.K2=n ad-bc2a+bc+da+cb+d,P K2≥k00.100.050.010.0050.001k0 2.706 3.841 6.6357.87910.8286.(2023·安徽蚌埠·统考三模)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生40女生30合计(1)根据所给数据完成上表,依据α=0.001的独立性检验,能否认为该校学生喜欢足球与性别有关?(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人射门相互独立,求3人进球总次数X的分布列和数学期望.附:χ2=n ad-bc2a+bc+da+cb+dα0.10.050.010.0050.001 xα 2.706 3.841 6.6357.87910.8287.(2023·海南海口·海南华侨中学校考模拟预测)在以视觉为主导的社交媒体时代,人们常借助具有美颜功能的产品对自我形象进行美化.移动端的美颜拍摄类APP 主要有两类:A 类是以自拍人像、美颜美妆为核心功能的APP ;B 类是图片编辑、精修等图片美化类APP .某机构为调查市民对上述A ,B 两类APP 的使用情况,随机调查了部分市民.已知被调查的市民中使用过A 类APP 的占60%,使用过B 类APP 的占50%,设个人对美颜拍摄类APP 类型的选择及各人的选择之间相互独立.(1)从样本人群中任选1人,求该人使用过美颜拍摄类APP 的概率;(2)从样本人群中任选5人,记X 为5人中使用过美颜拍摄类APP 的人数,设X 的数学期望为E X ,求P X =E X ;(3)在单独使用过A ,B 两类APP 的样本人群中,按类型分甲、乙两组,并在各组中随机抽取8人,甲组对A 类APP ,乙组对B 类APP 分别评分如下:甲组评分9486929687939082乙组评分8583859175908380记甲、乙两组评分的平均数分别为x 1 ,x 2 ,标准差分别为s 1,s 2,试判断哪组评价更合理.(设V i=s ix i (i =1,2),V i 越小,则认为对应组评价更合理.)参考数据:0.1925≈0.439,0.2325≈0.482.8.(2023·广东·统考模拟预测)某工厂车间有6台相同型号的机器,各台机器相互独立工作,工作时发生故障的概率都是14,且一台机器的故障由一个维修工处理.已知此厂共有甲、乙、丙3名维修工,现有两种配备方案,方案一:由甲、乙、丙三人维护,每人负责2台机器;方案二:由甲乙两人共同维护6台机器,丙负责其他工作.(1)对于方案一,设X 为甲维护的机器某一时刻发生故障的台数,求X 的分布列与数学期望E (X );(2)在两种方案下,分别计算某一时刻机器发生故障时不能得到及时维修的概率,并以此为依据来判断,哪种方案能使工厂的生产效率更高?9.(2023·福建福州·福建省福州第一中学校考模拟预测)相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.某健身连锁机构对其会员的年龄等级和一个月内到健身房健身次数进行了统计,制作成如下两个统计图.图1为会员年龄分布图(年龄为整数),其中将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类;图2为会员一个月内到健身房次数分布扇形图,其中将一个月内到健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56是“年轻人”.(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图表数据,补全2×2列联表,并依据小概率值α=0.05的独立性检验,是否可以认为“健身达人”与年龄有关?年轻人非年轻人合计健身达人健身爱好者合计(2)该健身机构在今年年底将针对全部的150名会员举办消费返利活动,预设有如下两种方案.方案1:按分层抽样从健身爱好者和健身达人中总共抽取20位“幸运之星”给予奖励.其中,健身爱好者和健身达人中的“幸运之星”每人分别奖励500元和800元.方案2:每位会员均可参加摸奖游戏,游戏规则如下:从一个装有3个白球、2个红球(球只有颜色不同)的箱子中,有放回地摸三次球,每次只能摸一个球.若摸到红球的总数为2,则可获得100元奖励金;若摸到红球的总数为3,则可获得300元奖励金;其他情况不给予奖励.如果每位健身爱好者均可参加1次摸奖游戏;每位健身达人均可参加3次摸奖游戏(每次摸奖的结果相互独立).以方案的奖励金的数学期望为依据,请你预测哪一种方案投资较少?并说明理由.附:χ2=n(ad-bc)2a+bc+da+cb+d.α0.100.050.0250.0100.0050.001χα 2.706 3.841 5.024 6.6357.87910.82810.(2023·云南昭通·校联考模拟预测)为了检测某种抗病毒疫苗的免疫效果,需要进行临床人体试验.研究人员将疫苗注射到200名志愿者体内,一段时间后测量志愿者的某项指标值,按0,20 ,20,40 ,40,60 ,60,80 ,80,100 分组,绘制频率分布直方图如图所示.试验发现志愿者体内产生抗体的共有160人,其中该项指标值不小于60的有110人.假设志愿者注射疫苗后是否产生抗体相互独立.(1)填写下面的2×2列联表,并根据列联表及小概率值α=0.05的独立性检验,判断能否认为注射疫苗后志愿者产生抗体与指标值不小于60有关.抗体指标值合计小于60不小于60有抗体没有抗体合计(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40名志愿者进行第二次注射疫苗,结果又有m 名志愿者产生抗体.(i )用频率估计概率,已知一名志愿者注射2次疫苗后产生抗体的概率p =0.9,求m 的值;(ⅱ)以(i )中的概率p 作为人体注射2次疫苗后产生抗体的概率,再进行另一组人体接种试验,记110名志愿者注射2次疫苗后产生抗体的数量为随机变量X ,求P X =k 最大时的k 的值.参考公式:χ2=n ad -bc 2a +b c +d a +c b +d(其中n =a +b +c +d 为样本容量).α0.500.400.250.150.1000.0500.025x α0.4550.7081.3232.0722.7063.8415.02411.(2023·湖南长沙·长沙市实验中学校考二模)首批全国文明典范城市将于2023年评选,每三年评选一次,2021年长沙市入选为全国文明典范城市试点城市,目前我市正全力争创首批全国文明典范城市,某学校号召师生利用周末从事创建志愿活动.高一(1)班一组有男生4人,女生2人,现随机选取2人作为志愿者参加活动,志愿活动共有交通协管员、创建宣传员、文明监督员三项可供选择,每名女生至多从中选择参加2项活动,且选择参加1项或2项的可能性均为12;每名男生至少从中选择参加2项活动,且选择参加2项或3项的可能性也均为12,每人每参加1项活动可获得综合评价10分,选择参加几项活动彼此互不影响,求:(1)在有女生参加活动的条件下,恰有一名女生的概率;(2)记随机选取的两人得分之和为X,求X的期望.12.(2023·江苏南京·南京市第一中学校考模拟预测)为了宣传航空科普知识,某校组织了航空知识竞赛活动.活动规定初赛需要从8道备选题中随机抽取4道题目进行作答.假设在8道备选题中,小明正确完成每道题的概率都是34且每道题正确完成与否互不影响,小宇能正确完成其中6道题且另外2道题不能完成.(1)求小明至少正确完成其中3道题的概率;(2)设随机变量X表示小宇正确完成题目的个数,求X的分布列及数学期望;(3)现规定至少完成其中3道题才能进入决赛,请你根据所学概率知识,判断小明和小宇两人中选择谁去参加市级比赛(活动规则不变)会更好,并说明理由.13.(2023·广东·校联考模拟预测)某商场在五一假期间开展了一项有奖闯关活动,并对每一关根据难度进行赋分,竞猜活动共五关,规定:上一关不通过则不进入下一关,本关第一次未通过有再挑战一次的机会,两次均未通过,则闯关失败,且各关能否通过相互独立,已知甲、乙、丙三人都参加了该项闯关活动.(1)若甲第一关通过的概率为23,第二关通过的概率为56,求甲可以进入第三关的概率;(2)已知该闯关活动累计得分服从正态分布,且满分为450分,现要根据得分给共2500名参加者中得分前400名发放奖励.①假设该闯关活动平均分数为171分,351分以上共有57人,已知甲的得分为270分,问甲能否获得奖励,请说明理由;②丙得知他的分数为430分,而乙告诉丙:“这次闯关活动平均分数为201分,351分以上共有57人”,请结合统计学知识帮助丙辨别乙所说信息的真伪.附:若随机变量Z∼Nμ,σ2,则Pμ-σ≤X≤μ+σ≈0.6827;Pμ-2σ≤X≤μ+2σ≈0.9545;Pμ-3σ≤X≤μ+3σ≈0.9973.14.(2023·广东韶关·统考模拟预测)研究表明,如果温差本大,人们不注意保暖,可能会导致自身受到风寒刺激,增加感冒患病概率,特别是对于几童以及年老体弱的人群,要多加防范某中学数学建模社团成员研究了昼夜温差大小与某小学学生患感冒就诊人数多少之间的关系,他们记录了某六天的温差,并到校医室查阅了这六天中每天学生新增感冒就诊的人数,得到数据如下:日期第一天第二天第三天第四天第五天第六天昼夜温差x (°C )47891412新增感就诊人数y (位)y 1y 2y 3y 4y 5y 6参考数据:6iy 2i=3463,6iy i -y 2=289(1)已知第一天新增感冒就的学生中有4位男生,从第一天多增的感冒就诊的学生中随机取2位,其中男生人数记为X ,若抽取的2人中至少有一位女生的概率为56,求随机变量X 的分布列和数学期望;(2)已知两个变量x 与y 之间的样本相关系数r =1617,请用最小二乘法求出y 关于x 的经验回归方程y =b x +a ,据此估计昼夜温差为15°C 时,该校新增感冒就诊的学生人数. 参考数据:r =n ix i -x y i -y n i =1x i -x 2 ⋅ni =1y i -y2,b =ni x i -x y i -yni =1x i -x 2 15.(2023·重庆·统考模拟预测)某地区由于农产品出现了滞销的情况,从而农民的收入减少,很多人开始在某直播平台销售农产品并取得了不错的销售量.有统计数据显示2022年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,且“经常使用直播销售用户”中有34是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,依据小概率值α=0.05的χ2独立性检验,能否认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2023年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售、根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不是不赚,且这三种情况发生的概率分别为35,15,15;方案二:线上直播销售,根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为12,310,15.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表α0.150.100.050.0250.0100.0050.001xα 2.072 2.706 3.841 5.024 6.6357.87910.828其中χ2=n ad-bc2a+bc+da+cb+d,n=a+b+c+d.16.(2023·河北衡水·衡水市第二中学校考三模)某医疗科研小组为研究某市市民患有疾病A 与是否具有生活习惯B 的关系,从该市市民中随机抽查了100人,得到如下数据:疾病A 生活习惯B 具有不具有患病2515未患病2040(1)依据α=0.01的独立性检验,能否认为该市市民患有疾病A 与是否具有生活习惯B 有关?(2)从该市市民中任选一人,M 表示事件“选到的人不具有生活习惯B ”,N 表示事件“选到的人患有疾病A ”,试利用该调查数据,给出P N M的估计值;(3)从该市市民中任选3人,记这3人中具有生活习惯B ,且末患有疾病A 的人数为X ,试利用该调查数据,给出X 的数学期望的估计值.附:χ2=n (ad -bc )2a +b c +d a +c b +d,其中n =a +b +c +d .α0.100.050.0100.001 x α2.7063.8416.63510.82817.(2023·江苏扬州·统考模拟预测)随着网络技术的迅速发展,各种购物群成为网络销售的新渠道.在凤梨销售旺季,某凤梨基地随机抽查了100个购物群的销售情况,各购物群销售凤梨的数量情况如下:凤梨数量(盒)100,200 200,300 300,400 400,500 500,600购物群数量(个)12m2032m(1)求实数m的值,并用组中值估计这100个购物群销售风梨总量的平均数(盒);(2)假设所有购物群销售凤梨的数量X服从正态分布Nμ,σ2,其中μ为(1)中的平均数,σ2=12100.若该凤梨基地参与销售的购物群约有1000个,销售风梨的数量在266,596(单位:盒)内的群为“一级群”,销售数量小于266盒的购物群为“二级群”,销售数量大于等于596盒的购物群为“优质群”.该凤梨基地对每个“优质群”奖励1000元,每个“一级群”奖励200元,“二级群”不奖励,则该风梨基地大约需要准备多少资金?(群的个数按四舍五入取整数)附:若X服从正态分布X~Nμ,σ2,则P(μ-σ<X<μ+σ)≈0.683,P(μ-2σ<X<μ+2σ)≈0.954,P(μ-3σ<X<μ+3σ)≈0.997.18.(2023·浙江·校联考模拟预测)某校有一个露天的篮球场和一个室内乒乓球馆为学生提供锻炼场所,甲、乙两位学生每天上下午都各花半小时进行体育锻炼,近50天天气不下雨的情况下,选择体育锻炼情况统计如下:上下午体育锻炼项目的情况(上午,下午)(篮球,篮球)(篮球,乒乓球)(乒乓球,篮球)(乒乓球,乒乓球)甲20天15天5天10天乙10天10天5天25天假设甲、乙选择上下午锻炼的项目相互独立,用频率估计概率.(1)分别估计一天中甲上午和下午都选择篮球的概率,以及甲上午选择篮球的条件下,下午仍旧选择篮球的概率;(2)记X 为甲、乙在一天中选择体育锻炼项目的个数,求X 的分布列和数学期望E (X );(3)假设A 表示事件“室外温度低于10度”,B 表示事件“某学生去打乒乓球”,P (A )>0,一般来说在室外温度低于10度的情况下学生去打乒乓球的概率会比室外温度不低于10度的情况下去打乒乓球的概率要大,证明:P (A |B )>P (A |B).19.(2023·广东深圳·统考二模)某校体育节组织定点投篮比赛,每位参赛选手共有3次投篮机会.统计数据显示,每位选手投篮投进与否满足:若第k 次投进的概率为p (0<p <1),当第k 次投进时,第k +1次也投进的概率保持p 不变;当第k 次没能投进时,第k +1次能投进的概率降为p2.(1)若选手甲第1次投进的概率为p (0<p <1),求选手甲至少投进一次的概率;(2)设选手乙第1次投进的概率为23,每投进1球得1分,投不进得0分,求选手乙得分X 的分布列与数学期望.20.(2023·湖北武汉·华中师大一附中校考模拟预测)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A 区B 区C 区D 区外来务工人数x /万3456就地过年人数y /万2.5344.5(1)请用相关系数说明y 与x 之间的关系可用线性回归模型拟合,并求y 关于x 的线性回归方程y =a +bx 和A 区的残差(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E 区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E 区就地过年的人员发放的补贴总金额;②若A 区的外来务工人员中甲、乙选择就地过年的概率分别为p ,2p -1,其中12<p <1,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p 的取值范围.参考公式:相关系数r =ni =1x i y i -nx yn i =1x 2i -nx 2ni =1y 2i -ny2,回归方程y =a +bx 中斜率和截距的最小二乘估计公式分别为b =ni =1x i y i -nx yni =1x 2i -nx2,a =y -b x .21.(2023·山西运城·山西省运城中学校校考二模)甲、乙两人进行象棋比赛,赛前每人发3枚筹码.一局后负的一方,需将自己的一枚筹码给对方;若平局,双方的筹码不动,当一方无筹码时,比赛结束,另一方最终获胜.由以往两人的比赛结果可知,在一局中甲胜的概率为0.3、乙胜的概率为0.2.(1)第一局比赛后,甲的筹码个数记为X,求X的分布列和期望;(2)求四局比赛后,比赛结束的概率;(3)若P i i=0,1,⋯,6表示“在甲所得筹码为i枚时,最终甲获胜的概率”,则P0=0,P6=1.证明:P i+1-P ii=0,1,2,⋯,5为等比数列.22.(2023·湖北襄阳·襄阳四中校考三模)为倡导公益环保理念,培养学生社会实践能力,某中学开展了旧物义卖活动,所得善款将用于捐赠“圆梦困境学生”计划.活动共计50多个班级参与,1000余件物品待出售.摄影社从中选取了20件物品,用于拍照宣传,这些物品中,最引人注目的当属优秀毕业生们的笔记本,已知高三1,2,3班分别有12,13,14的同学有购买意向.假设三个班的人数比例为6:7:8.(1)现从三个班中随机抽取一位同学:(i)求该同学有购买意向的概率;(ii)如果该同学有购买意向,求此人来自2班的概率;(2)对于优秀毕业生的笔记本,设计了一种有趣的“掷骰子叫价确定购买资格”的竞买方式:统一以0元为初始叫价,通过掷骰子确定新叫价,若点数大于2,则在已叫价格基础上增加1元更新叫价,若点数小于3,则在已叫价格基础上增加2元更新叫价;重复上述过程,能叫到10元,即获得以10元为价格的购买资格,未出现叫价为10元的情况则失去购买资格,并结束叫价.若甲同学已抢先选中了其中一本笔记本,试估计其获得该笔记本购买资格的概率(精确到0.01).23.(2023·广东茂名·统考二模)春节过后,文化和旅游业逐渐复苏,有意跨省游、出境游的旅客逐渐增多.某旅游景区为吸引更多游客,计划在社交媒体平台和短视频平台同时投放宣传广告并进行线上售票,通过近。
高考数学-概率与统计(含22年真题讲解)1.【2022年全国甲卷】某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差【答案】B【解析】【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.【详解】>70%,所以A错;讲座前中位数为70%+75%2讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%−80%=20%,讲座前问卷答题的正确率的极差为95%−60%=35%>20%,所以D错.故选:B.2.【2022年全国甲卷】从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为()A.15B.13C.25D.23【答案】C【解析】【分析】先列举出所有情况,再从中挑出数字之积是4的倍数的情况,由古典概型求概率即可.【详解】从6张卡片中无放回抽取2张,共有(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3 ,4),(3,5),(3,6),(4,5),(4,6),(5,6)15种情况,其中数字之积为4的倍数的有(1,4),(2,4),(2,6),(3,4),(4,5),(4,6)6种情况,故概率为615=25.故选:C.3.【2022年全国乙卷】分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是()A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6【答案】C【解析】【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.【详解】=7.4,A选项结论正确.对于A选项,甲同学周课外体育运动时长的样本中位数为7.3+7.52对于B选项,乙同学课外体育运动时长的样本平均数为:6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1=8.50625>8,16B选项结论正确.=0.375<0.4,对于C选项,甲同学周课外体育运动时长大于8的概率的估计值616C选项结论错误.=0.8125>0.6,对于D选项,乙同学周课外体育运动时长大于8的概率的估计值1316D选项结论正确.故选:C4.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为p1,p2,p3,且p3>p2>p1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率p;该棋手在第二盘与乙比赛且连胜两盘的概率p乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率p丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为p甲则p甲=2(1−p2)p1p3+2p2p1(1−p3)=2p1(p2+p3)−4p1p2p3记该棋手在第二盘与乙比赛,且连胜两盘的概率为p乙则p乙=2(1−p1)p2p3+2p1p2(1−p3)=2p2(p1+p3)−4p1p2p3记该棋手在第二盘与丙比赛,且连胜两盘的概率为p丙则p丙=2(1−p1)p3p2+2p1p3(1−p2)=2p3(p1+p2)−4p1p2p3则p甲−p乙=2p1(p2+p3)−4p1p2p3−[2p2(p1+p3)−4p1p2p3]=2(p1−p2)p3<0p 乙−p丙=2p2(p1+p3)−4p1p2p3−[2p3(p1+p2)−4p1p2p3]=2(p2−p3)p1<0即p甲<p乙,p乙<p丙,则该棋手在第二盘与丙比赛,p最大.选项D判断正确;选项BC判断错误;p与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D5.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率P=21−721=23.故选:D.6.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有n=C84=70个结果,这4个点在同一个平面的有m=6+6=12个,故所求概率P=mn =1270=635.故答案为:635.7.【2022年全国乙卷】从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为____________.【答案】310##0.3【解析】【分析】根据古典概型计算即可【详解】从5名同学中随机选3名的方法数为C53=10甲、乙都入选的方法数为C31=3,所以甲、乙都入选的概率P=310故答案为:3108.【2022年新高考2卷】已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为X∼N(2,σ2),所以P(X<2)=P(X>2)=0.5,因此P(X>2.5)=P(X>2)−P(2<X ≤2.5)=0.5−0.36=0.14.故答案为:0.14.9.【2022年浙江】现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为ξ,则P(ξ=2)=__________,E(ξ)=_________.【答案】 1635, 127##157 【解析】 【分析】利用古典概型概率公式求P(ξ=2),由条件求ξ分布列,再由期望公式求其期望. 【详解】从写有数字1,2,2,3,4,5,6的7张卡片中任取3张共有C 73种取法,其中所抽取的卡片上的数字的最小值为2的取法有C 41+C 21C 42种,所以P(ξ=2)=C 41+C 21C 42C 73=1635,由已知可得ξ的取值有1,2,3,4, P(ξ=1)=C 62C 73=1535,P(ξ=2)=1635,,P(ξ=3)=C 32C 73=335,P(ξ=4)=1C 73=135所以E(ξ)=1×1535+2×1635+3×335+4×135=127,故答案为:1635,127.10.【2022年全国甲卷】甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率; (2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d), P (K 2⩾k )0.100 0.050 0.010 k2.7063.8416.635【答案】(1)A ,B 两家公司长途客车准点的概率分别为1213,78(2)有 【解析】 【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算K 2,再利用临界值表比较即可得结论. (1)根据表中数据,A 共有班次260次,准点班次有240次, 设A 家公司长途客车准点事件为M , 则P(M)=240260=1213;B 共有班次240次,准点班次有210次, 设B 家公司长途客车准点事件为N , 则P(N)=210240=78.A 家公司长途客车准点的概率为1213; B 家公司长途客车准点的概率为78. (2)列联表K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=500×(240×30−210×20)2260×240×450×50≈3.205>2.706,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.11.【2022年全国甲卷】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立. (1)求甲学校获得冠军的概率;(2)用X 表示乙学校的总得分,求X 的分布列与期望.【答案】(1)0.6;(2)分布列见解析,E(X)=13.【解析】【分析】(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即可求出期望.(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为P=P(ABC)+P(A BC)+P(AB̅C)+P(ABC)=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.16+0.16+0.24+0.04=0.6.(2)依题可知,X的可能取值为0,10,20,30,所以,P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,P(X=30)=0.5×0.6×0.2=0.06.即X的分布列为期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.12.【2022年全国乙卷】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2)和材积量(单位:3),得到如下数据:并计算得∑x i 210i=1=0.038,∑y i 210i=1=1.6158,∑x i y i10i=1=0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数r =∑(x i−x̅)n i=1(y i −y̅)√∑(x i −x̅)2ni=1∑(y i−y ̅)2ni=1√1.896≈1.377.【答案】(1)0.06m 2;0.39m 3 (2)0.97 (3)1209m 3 【解析】 【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值. (1)样本中10棵这种树木的根部横截面积的平均值x̅=0.610=0.06样本中10棵这种树木的材积量的平均值y̅=3.910=0.39据此可估计该林区这种树木平均一棵的根部横截面积为0.06m 2, 平均一棵的材积量为0.39m 3 (2)r =∑(x i −x)10i=1(y i −y)√∑10i=1(x i −x)2∑10i=1(y i −y)2=∑10i=1i i 10xy√(∑10i=1x i 2−10x2)(∑10i=1y i 2−10y 2)=0.2474−10×0.06×0.39√(0.038−10×0.062)(1.6158−10×0.392)=0.0134√0.0001896≈0.01340.01377≈0.97则r ≈0.97 (3)设该林区这种树木的总材积量的估计值为Y m 3, 又已知树木的材积量与其根部横截面积近似成正比, 可得0.060.39=186Y,解之得Y =1209m 3. 则该林区这种树木的总材积量估计为1209m 313.【2022年新高考1卷】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.P(B|A)P(B ̅|A)与P(B|A )P(B ̅|A )的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R .(ⅰ)证明:R =P(A|B)P(A |B)⋅P(A |B ̅)P(A|B ̅);(ⅱ)利用该调查数据,给出P(A|B),P(A|B ̅)的估计值,并利用(ⅰ)的结果给出R 的估计值.附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),【答案】(1)答案见解析 (2)(i )证明见解析;(ii)R =6; 【解析】【分析】(1)由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求R.(1)由已知K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,又P(K2≥6.635)=0.01,24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为R=P(B|A)P(B̅|A)⋅P(B̅|A)P(B|A)=P(AB)P(A)⋅P(A)P(AB̅)⋅P(A B̅)P(A)⋅P(A)P(A B),所以R=P(AB)P(B)⋅P(B)P(A B)⋅P(A B̅)P(B̅)⋅P(B̅)P(AB̅)所以R=P(A|B)P(A|B)⋅P(A|B̅) P(A|B̅),(ii)由已知P(A|B)=40100,P(A|B̅)=10100,又P(A|B)=60100,P(A|B̅)=90100,所以R=P(A|B)P(A|B)⋅P(A|B̅)P(A|B̅)=614.【2022年新高考2卷】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)44.65岁;(2)0.89;(3)0.0014.【解析】【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1−P (A)即可解出;(3)根据条件概率公式即可求出.(1)平均年龄x̅=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023 +55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).(2)设A={一人患这种疾病的年龄在区间[20,70)},所以P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式可得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.15.【2022年北京】在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到9.50m以上(含9.50m)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,935,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)【答案】(1)0.4(2)75(3)丙【解析】【分析】(1)由频率估计概率即可(2)求解得X的分布列,即可计算出X的数学期望.(3)计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.(1)由频率估计概率可得甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3P(X=0)=P(A1̅̅̅A2̅̅̅A3̅̅̅)=0.6×0.5×0.5=3,20P(X=1)=P(A1A2̅̅̅A3̅̅̅)+P(A1̅̅̅A2A3̅̅̅)+P(A1̅̅̅A2̅̅̅A3)=0.4×0.5×0.5+0.6×0.5×0.5+0.6×0.5×0.5=8,20P(X=2)=P(A1A2A3̅̅̅)+P(A1A2̅̅̅A3)+P(A1̅̅̅A2A3)=0.4×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=7,20P(X=3)=P(A1A2A3)=0.4×0.5×0.5=2.20∴X的分布列为∴E(X)=0×320+1×820+2×720+3×220=75 (3)丙夺冠概率估计值最大.因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为14,甲获得9.80的概率为110,乙获得9.78的概率为16.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.1.(2022·河南省杞县高中模拟预测(理))某市有11名选手参加了田径男子100米赛的选拔比赛,前5名可以参加省举办的田径赛,如果各个选手的选拔赛成绩均不相同,选手小强已经知道了自己的成绩,为了判断自己能否参加省举办的田径赛,他还需要知道这11名选手成绩的( ) A .平均数 B .中位数 C .众数 D .方差【答案】B 【解析】 【分析】中位数恰好是第6名,比中位数成绩高即可确认自己能否进入省田径赛. 【详解】因为11名选手成绩的中位数恰好是第6名,知道了第6名的成绩,小强就可以判断自己是否能参加省举办的田径赛了,其余数字特征不能反映名次. 故选:B .2.(2022·黑龙江·大庆实验中学模拟预测(理))2021年5月30日清晨5时01分,天舟二号货运飞船在成功发射约8小时后,与中国空间站天和核心舱完成自主快速交接.如果下次执行空间站的任务由3名航天员承担,需要在3名女性航天员和3名男性航天员中选择,则选出的3名航天员中既有男性航天员又有女性航天员的概率为( ) A .67B .910 C .25D .415【答案】B 【解析】 【分析】利用对立事件和古典概型的概率公式求解即可. 【详解】设“选出的3名航天员中既有男性航天员又有女性航天员”为事件M ,则()333336C C 91C 10P M ==+-.故选:B.3.(2022·全国·模拟预测(文))如图是一组实验数据的散点图,拟合方程()0by c x x=+>,令1t x=,则y 关于t 的回归直线过点()2,5,()12,25,则当()1.01,1.02y ∈时,x 的取值范围是( )A .()0.01,0.02B .()50,100C .()0.02,0.04D .()100,200【答案】D 【解析】 【分析】 先令1t x =可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得522512b c b c=+⎧⎨=+⎩从而求得21y t =+,再由y 的范围求得t 的范围,进而求得x 的范围. 【详解】根据题意可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得:522512b cb c =+⎧⎨=+⎩,所以2,1b c ==, 所以21y t =+,由()1.01,1.02y ∈可得1.0121 1.02t <+<, 所以0.0050.01t <<, 所以10.0050.01x<<,所以100200x <<, 故选:D4.(2022·辽宁实验中学模拟预测)某国计划采购疫苗,现在成熟的疫苗中,三种来自中国,一种来自美国,一种来自英国,一种由美国和德国共同研发,从这6种疫苗中随机采购三种,若采购每种疫苗都是等可能的,则买到中国疫苗的概率为( ) A .16B .12C .910D .1920【答案】D 【解析】 【分析】由对立事件的概率公式计算. 【详解】没有买到中国疫苗的概率为13611C 20P ==, 所以买到中国疫苗的概率为119120P P =-=. 故选:D .5.(2022·四川省泸县第二中学模拟预测(理))食物链亦称“营养链”,是指生态系统中各种生物为维持其本身的生命活动,必须以其他生物为食物的这种由食物联结起来的链锁关系.如图为某个生态环境中的食物链,若从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,则这两种生物不能构成摄食关系的概率( )A .35B .25C .23D .13【解析】 【分析】用列举法写出构成的摄食关系,计数后可求得概率. 【详解】从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,共有10种选法:鹰麻雀,鹰兔,鹰田鼠,鹰蝗虫,麻雀兔,麻雀田鼠,麻雀蝗虫,兔田鼠,兔蝗虫,田鼠蝗虫.其中田鼠鹰,兔鹰,麻雀鹰,蝗虫麻雀共四种可构成摄食关系,不能构成摄食关系的有6种,所以概率为63105P ==. 故选:A .6.(2022·山东潍坊·模拟预测)Poisson 分布是统计学里常见的离散型概率分布,由法国数学家西莫恩·德尼·泊松首次提出,Poisson 分布的概率分布列为()()e 0,1,2,!kP X K k k λλ-===⋅⋅⋅,其中e 为自然对数的底数,λ是Poisson 分布的均值.当二项分布的n 很大()20n ≥而p 很小()0.05p ≤时,Poisson 分布可作为二项分布的近似.假设每个大肠杆菌基因组含有10000个核苷酸对,采用20.05/J m 紫外线照射大肠杆菌时,每个核苷酸对产生嘧啶二体的概率均为0.0003,已知该菌株基因组有一个嘧啶二体就致死,则致死率是( ) A .31e -- B .3e - C .313e -- D .314e --【答案】A 【解析】 【分析】结合题意1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似条件,再计算二项分布的均值为Poisson 分布的均值λ,再代入公式先求不致死的概率,再用对立事件的概率和为1计算即可 【详解】由题, 1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似的条件,此时100000.00033λ=⨯=,故不致死的概率为()03330e e 0!P X --===,故致死的概率为()3101e P X --==-7.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】 【分析】根据正态分布的性质求出()22P X ≥,从而估计出人数; 【详解】 解:因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人); 故选:B8.(2022·河南·模拟预测)某公司生产的一种产品按照质量由高到低分为A ,B ,C ,D 四级,为了增加产量、提高质量,该公司改进了一次生产工艺,使得生产总量增加了一倍.为了解新生产工艺的效果,对改进生产工艺前、后的四级产品的占比情况进行了统计,绘制了如下扇形图:根据以上信息:下列推断合理的是( ) A .改进生产工艺后,A 级产品的数量没有变化B.改进生产工艺后,D级产品的数量减少C.改进生产工艺后,C级产品的数量减少D.改进生产工艺后,B级产品的数量增加了不到一倍【答案】C【解析】【分析】由题可得改进生产工艺前后四个等级的生产量,逐项分析即得.【详解】设原生产总量为1,则改进生产工艺后生产总量为2,所以原A,B,C,D等级的生产量为0.3,0.37,0.28,0.05,改进生产工艺后四个等级的生产量为0.6,1.2,0.12,0.08,故改进生产工艺后,A级产品的数量增加,故A错误;改进生产工艺后,D级产品的数量增加,故B错误;改进生产工艺后,C级产品的数量减少,故C正确;改进生产工艺后,B级产品的数量增加超过2倍,故D错误.故选:C.9.(2022·河南安阳·模拟预测(文))为推动就业与培养有机联动、人才供需有效对接,促进高校毕业生更加充分更高质量就业,教育部今年首次实施供需对接就业育人项目.现安排甲、乙两所高校与3家用人单位开展项目对接,若每所高校至少对接两家用人单位,则两所高校的选择涉及到全部3家用人单位的概率为()A.12B.23C.34D.1316【答案】D【解析】【分析】由古典概型与对立事件的概率公式求解即可【详解】因为每所高校至少对接两家用人单位,所以每所高校共有2333314C C+=+=种选择,所以甲、乙两所高校共有4416⨯=种选择,其中甲、乙两所高校的选择涉及两家用人单位的情况有233C =种,所以甲、乙两所高校的选择涉及到全部3家用人单位的概率为31311616P =-=, 故选:D10.(2022·江苏·南京师大附中模拟预测)某同学在课外阅读时了解到概率统计中的马尔可夫不等式,该不等式描述的是对非负的随机变量X 和任意的正数a ,都有()()(),P X a f E X a ≥≤,其中()(),f E X a 是关于数学期望()E X 和a 的表达式.由于记忆模糊,该同学只能确定()(),f E X a 的具体形式是下列四个选项中的某一种.请你根据自己的理解,确定该形式为( ) A .()aE X B .()1aE XC .()a E XD .()E X a【答案】D 【解析】 【分析】根据期望的计算公式,以及m x a ≥即可求解. 【详解】设非负随机变量X 的所有可能取值按从小到大依次为0,i x i N *>∈,对应的概率分别为,0i i p p >设满足i x a ≥的有,,,m a a x k m n m N k N **≤≤∈∈,()ani i k P X a p =≥=∑,()111a ai nk i iii n i ii k i ax pE ax p x pX a -===+==∑∑∑,因为m x a ≥,所以1mx a≥()()()1111a a aaannniiiiiik k i k i k i k ii i i i x px px px p p P X a P X a E aa aaaX --=====⎛⎫+≥+=+≥≥≥ ⎪⎝⎭=∑∑∑∑∑故选:D11.(2022·吉林·三模(理))为了切实维护居民合法权益,提高居民识骗防骗能力,守好居民的“钱袋子”,某社区开展“全民反诈在行动——反诈骗知识竞赛”活动,现从参加该活动的居民中随机抽取了100名,统计出他们竞赛成绩分布如下:(1)求抽取的100名居民竞赛成绩的平均分x 和方差2s (同一组中数据用该组区间的中点值为代表);(2)以频率估计概率,发现该社区参赛居民竞赛成绩X 近似地服从正态分布()2,N μσ,其中μ近似为样本成绩平均分x ,2σ近似为样本成缋方差2s ,若2μσμσ-<≤+X ,参赛居民可获得“参赛纪念证书”;若2μσ>+X ,参赛居民可获得“反诈先锋证书”,①若该社区有3000名居民参加本次竞赛活动,试估计获得“参赛纪念证书”的居民人数(结果保留整数);②试判断竞赛成绩为96分的居民能否获得“反诈先锋证书”. 附:若()2,XN μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.【答案】(1)75x =,2100s = (2)①2456 ;②能 【解析】 【分析】(1)利用公式直接求出均值、方差即可;(2)①结合给的概率和正态分布的性质,确定获得“参赛纪念证书”,进而计算可得人数; ②利用正态分布的知识求出2μσ>+X ,即95>X ,进而可得结果. (1)100名居民本次竞赛成绩平均分24224028445556575859575100100100100100100=⨯+⨯+⨯+⨯+⨯+⨯=x , 100名居民本次竞赛成绩方差22222422(4575)(5575)(6575)100100100=-⨯+-⨯+-⨯s 22240284(7575)(8575)(9575)100100100100+-⨯+-⨯+-⨯=, (2)①由于μ近似为样本成绩平均分x ,2σ近似为样本成绩方差2s , 所以,275,100μσ==,可知,10σ=,由于竞赛成绩X 近似地服从正态分布()2,N μσ,因此竞赛居民可获得“参赛纪念证书”的概率 (2)P X μσμσ-<≤+11()(22)22μσμσμσμσ=-<≤++-<≤+P X P X 110.68270.95450.818622≈⨯+⨯= 30000.81862455.82456⨯=≈估计获得“参赛纪念证书”的居民人数为2456;②当2μσ>+X 时,即95>X 时,参赛居民可获得“反诈先锋证书”, 所以竞赛成绩为96分的居民能获得“反诈先峰证书”.12.(2022·贵州·贵阳一中模拟预测(文))“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物占全国的39.7%,淡水鱼类占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区某种水生动物的数量,将其分成面积相近的100个水域,从这些水域中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据()(),1,2,,20,i i x y i =其中i x 和i y 分别表示第i 个样区的水草覆盖面积(单位:公顷)和这种水生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,2021-)120,i i x x ==∑(2021-)9000,i i y ==∑(y 201-)-)1000.i iix x y ==∑((y (1)求该地区这种水生动物数量的估计值(这种水生动物数量的估计值等于样区这种水生动物数量的平均数乘以地块数); (2)求样本()(),1,2,,20i i x y i =的相关系数(精确到0.01);(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区这种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数-)-) 1.732.niix y x r =≈∑((y【答案】(1)6000 (2)0.96(3)采用分层抽样的方法,理由见解析 【解析】 【分析】(1)根据该地区这种水生动物数量的估计值的计算方法求解即可; (2)根据相关系数的公式求解即可;(3)根据(2)中的结论各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性考虑即可 (1)样区水生动物平均数为201111200602020i i y ==⨯=∑, 地块数为100,该地区这种水生动物的估计值为100606000⨯=. (2)样本()(),1,2,,20i i x y i =⋯的相关系数为()()20,0.96.iix x y y r -===≈∑ (3)由(2)知各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性,由于各地块间水草覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种水生动物数量更准确的估计.13.(2022·河南开封·模拟预测(理))大豆是我国重要的农作物,种植历史悠久.某种子实验基地培育出某大豆新品种,为检验其最佳播种日期,在A ,B 两块试验田上进行实验(两地块的土质等情况一致).6月25日在A 试验田播种该品种大豆,7月10日在B 试验田播种该品种大豆.收获大豆时,从中各随机抽取20份(每份1千粒),并测量出每份的质量(单位:克),按照[)100,150,[)150,200,[]200,250进行分组,得到如下表格:。
2011(19)(本小题满分12分)某种产品的质量以其质量指标值衡量,质量指标值越大表明质量越好,且质量指标值大于或等于102的产品为优质品,现用两种新配方(分别称为A配方和B 配方)做试验,各生产了100件这种产品,并测试了每件产品的质量指标值,得到下面试验结果:(Ⅰ)分别估计用A配方,B配方生产的产品的优质品率;(Ⅱ)已知用B配方生成的一件产品的利润y(单位:元)与其质量指标值t的关系式为从用B配方生产的产品中任取一件,其利润记为X(单位:元),求X的分布列及数学期望.(以实验结果中质量指标值落入各组的频率作为一件产品的质量指标值落入相应组的概率)解:(Ⅰ)由实验结果知,用A配方生产的产品中优质的平率为228=0.3100+,所以用A配方生产的产品的优质品率的估计值为0.3。
由实验结果知,用B配方生产的产品中优质品的频率为32100.42100+=,所以用B配方生产的产品的优质品率的估计值为0.42(Ⅱ)用B配方生产的100件产品中,其质量指标值落入区间[)[)[]90,94,94,102,102,110的频率分别为0.04,,054,0.42,因此P(X=-2)=0.04, P(X=2)=0.54, P(X=4)=0.42, 即X 的分布列为X 的数学期望值EX=2×0.04+2×0.54+4×0.42=2.68 201218.(本小题满分12分) 某花店每天以5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花作垃圾处理.(Ⅰ)若花店一天购进16朵玫瑰花,求当天的利润y (单位:元)关于当天需求量n (单位:枝,N n ∈)的函数解析式;日需求量n 14 15 16 17 18 19 20 频数10201616151310(ⅰ)若花店一天购进16枝玫瑰花,X 表示当天的利润(单位:元),求X 的分布列、数学期望及方差;(ⅱ)若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝?请说明理由.【解析】(1)当16n ≥时,16(105)80y =⨯-=当15n ≤时,55(16)1080y n n n =--=-得:1080(15)()80(16)n n y n N n -≤⎧=∈⎨≥⎩(2)(i )X 可取60,70,80 (60)0.1,(70)0.2,(80)0.7P X P X P X ====== X 60 70 80 P0.10.20.7600.1700.2800.776EX =⨯+⨯+⨯= 222160.160.240.744DX =⨯+⨯+⨯=(ii )购进17枝时,当天的利润为(14535)0.1(15525)0.2(16515)0.161750.5476.4 y=⨯-⨯⨯+⨯-⨯⨯+⨯-⨯⨯+⨯⨯=76.476>得:应购进17枝201319.(2013课标全国Ⅰ,理19)(本小题满分12分)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果n=3,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果n=4,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为12,且各件产品是否为优质品相互独立.(1)求这批产品通过检验的概率;(2)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.解:(1)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,第二次取出的4件产品都是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)=41113161616264⨯+⨯=.(2)X可能的取值为400,500,800,并且P(X=400)=41111161616--=,P(X=500)=116,P(X=800)=14.所以X的分布列为EX=111400+500+80016164⨯⨯⨯=506.25.201418. (本小题满分12分)从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(I)求这500件产品质量指标值的样本平均数x和样本方差2s(同一组数据用该区间的中点值作代表);(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值Z服从正态分布2(,)Nμδ,其中μ近似为样本平均数x,2δ近似为样本方差2s.(i)利用该正态分布,求(187.8212.2)P Z<<;(ii)某用户从该企业购买了100件这种产品,学科网记X表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i)的结果,求EX.150若Z~2(,)Nμδ,则()P Zμδμδ-<<+=0.6826,(22)P Zμδμδ-<<+=0.9544.【解析】:(Ⅰ) 抽取产品质量指标值的样本平均数x和样本方差2s分别为1700.021800.091900.222000.332100.242200.082300.02200x=⨯+⨯+⨯+⨯+⨯+⨯+⨯=()()()()()()2222222300.02200.09100.2200.33100.24200.08300.02s=-⨯+-⨯+-⨯+⨯+⨯+⨯+⨯150=…………6分(Ⅱ)(ⅰ)由(Ⅰ)知Z~(200,150)N,从而(187.8212.2)P Z<<=(20012.220012.2)0.6826P Z-<<+=………………9分(ⅱ)由(ⅰ)知,一件产品中质量指标值为于区间(187.8,212.2)的概率为0.6826依题意知(100,0.6826)X B:,所以1000.682668.26EX=⨯=………12分2015(19)某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费x1和年销售量y1(i=1,2,···,8)数据作了初步处理,得到下面的散点图及一些统计量的值。
专题63 统计与概率专题训练一、选择题:本题共8小题,每小题5分,共40分。
在每小题给出的四个选项中,只有一项是符合题目要求的。
1.小笼包在生活中非常常见,不同地方做出来的小笼包有不同的特色,无锡有一家商铺制作一种一笼有8个且是8种口味的小笼包,这8种口味分别为蟹粉味、鹅肝味、墨鱼味、芝士味、麻辣味,蒜香味、人参味,酱香味,将这样的一笼小包取出,排成一排,则人参味小笼包既与蟹粉味小包相邻又与墨鱼味小笼包相邻的概率为( )。
A 、281B 、161C 、81 D 、72 【答案】A【解析】将这8种口味的小笼包排成一排有88A 种排法,人参味小笼包既与蟹粉味小包相邻又与墨鱼味小笼包相邻有6622A A ⋅种排法,故所求概率为281886622=⋅A A A ,故选A 。
2.组数1a 、2a 、3a 、…、n a 的平均数是x ,方差是2s ,则另一组数121-a 、122-a 、123-a 、…、12-n a 的平均数和方差分别是( )。
A 、12-x ,2sB 、12-x ,22sC 、x 2,2sD 、12-x ,12222++s s 【答案】C【解析】由题意可知,x a E n =)(,2)(s a D n =,+∈N n ,根据数学期望与方差的公式得:121)(2)12(-=-=-x a E a E n n ,222)()2()12(s a D a D n n ==-,故选C 。
3.某校欲从高三年级学生编排的4个歌舞节目和2个小品节目中随机选出3个节目,参加学校举行的”迎新春”文艺汇演,则所选的3个节目中至少有1个是小品节目的概率为( )。
A 、51B 、52 C 、53 D 、54 【答案】D【解析】从6个节目中任选3个共有2036=C 种选法, 至少含有1个小品节目的共有1614222412=⋅+⋅C C C C 种选法, 故所选的3个节目中至少有1个是小品节目的概率为542016=,故选D 。
2019年高考数学试题分项版——统计概率(解析版)一、选择题1.(2019·全国Ⅰ文,6)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生答案 C解析根据题意,系统抽样是等距抽样,所以抽样间隔为=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知,616号学生被抽到.2.(2019·全国Ⅱ文,4)生物实验室有5只兔子,其中只有3只测量过某项指标.若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为()A. B. C. D.答案 B解析设5只兔子中测量过某项指标的3只为a1,a2,a3,未测量过这项指标的2只为b1,b2,则从5只兔子中随机取出3只的所有可能情况为(a1,a2,a3),(a1,a2,b1),(a1,a2,b2),(a1,a3,b1),(a1,a3,b2),(a1,b1,b2),(a2,a3,b1),(a2,a3,b2),(a2,b1,b2),(a3,b1,b2),共10种可能.其中恰有2只测量过该指标的情况为(a1,a2,b1),(a1,a2,b2),(a1,a3,b1),(a1,a3,b2),(a2,a3,b1),(a2,a3,b2),共6种可能.故恰有2只测量过该指标的概率为=.3.(2019·全国Ⅱ文,5)在“一带一路”知识测验后,甲、乙、丙三人对成绩进行预测.甲:我的成绩比乙高.乙:丙的成绩比我和甲的都高.丙:我的成绩比乙高.成绩公布后,三人成绩互不相同且只有一个人预测正确,那么三人按成绩由高到低的次序为()A.甲、乙、丙B.乙、甲、丙C.丙、乙、甲D.甲、丙、乙答案 A解析由于三人成绩互不相同且只有一个人预测正确.若甲预测正确,则乙、丙预测错误,于是三人按成绩由高到低的次序为甲、乙、丙;若甲预测错误,则甲、乙按成绩由高到低的次序为乙、甲,再假设丙预测正确,则乙、丙按成绩由高到低的次序为丙、乙,于是甲、乙、丙按成绩由高到低排序为丙、乙、甲,从而乙的预测也正确,与事实矛盾;若甲、丙预测错误,则可推出乙的预测也错误.综上所述,三人按成绩由高到低的次序为甲、乙、丙.4.(2019·全国Ⅲ文,3)两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是()A. B. C. D.答案 D解析设两位男同学分别为A,B,两位女同学分别为a,b,则用“树形图”表示四位同学排成一列所有可能的结果如图所示.由图知,共有24种等可能的结果,其中两位女同学相邻的结果(画“√”的情况)共有12种,故所求概率为=.5.(2019·全国Ⅲ文,4)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.8答案 C解析根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7. 6.(2019·浙江,7)设0<a<1.随机变量X的分布列是()则当a在(0,1)内增大时,()A.D(X)增大B.D(X)减小C.D(X)先增大后减小D.D(X)先减小后增大答案 D解析由题意可知,E(X)=(a+1),所以D(X)=++==,所以当a在(0,1)内增大时,D(X)先减小后增大.7.(2019·全国Ⅰ理,6)我国古代典籍《周易》用“卦”描述万物的变化,每一“重卦”由从下到上排列的6个爻组成,爻分为阳爻“”和阴爻“——”,如图就是一重卦,在所有重卦中随机取一重卦,则该重卦恰有3个阳爻的概率是()A. B. C. D.答案 A解析由6个爻组成的重卦种数为26=64,在所有重卦中随机取一重卦,该重卦恰有3个阳爻的种数为==20.根据古典概型的概率计算公式得,所求概率P==.故选A. 8.(2019·全国Ⅱ理,5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差答案 A解析记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A. 9.(2019·全国Ⅲ理,3)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5 B.0.6 C.0.7 D.0.8答案 C解析根据题意阅读过《红楼梦》《西游记》的人数用韦恩图表示如下:所以该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为=0.7. 10.(2019·全国Ⅲ理,4)(1+2x2)(1+x)4的展开式中x3的系数为()A.12 B.16 C.20 D.24答案 A解析展开式中含x3的项可以由“1与x3”和“2x2与x”的乘积组成,则x3的系数为+2=4+8=12.二、填空题1.(2019·全国Ⅱ文,14)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案0.98解析经停该站高铁列车所有车次的平均正点率的估计值为=0.98. 2.(2019·浙江,13)在二项式(+x)9的展开式中,常数项是________,系数为有理数的项的个数是________.答案16 5解析该二项展开式的第k+1项为T k+1=()9-k x k,当k=0时,第1项为常数项,所以常数项为()9=16;当k=1,3,5,7,9时,展开式的项的系数为有理数,所以系数为有理数的项的个数为5.3.(2019·江苏,5)已知一组数据6,7,8,8,9,10,则该组数据的方差是_____________.答案解析数据6,7,8,8,9,10的平均数是=8,则方差是=. 4.(2019·江苏,6)从3名男同学和2名女同学中任选2名同学参加志愿者服务,则选出的2名同学中至少有1名女同学的概率是________.答案解析记3名男同学为A,B,C,2名女同学为a,b,则从中任选2名同学的情况有(A,B),(A,C),(A,a),(A,b),(B,C),(B,a),(B,b),(C,a),(C,b),(a,b),共10种,其中至少有1名女同学的情况有(A,a),(A,b),(B,a),(B,b),(C,a),(C,b),(a,b),共7种,故所求概率为.5.(2019·全国Ⅰ理,15)甲、乙两队进行篮球决赛,采取七场四胜制(当一队赢得四场胜利时,该队获胜,决赛结束).根据前期比赛成绩,甲队的主客场安排依次为“主主客客主客主”.设甲队主场取胜的概率为0.6,客场取胜的概率为0.5,且各场比赛结果相互独立,则甲队以4∶1获胜的概率是________.答案0.18解析记事件M为甲队以4∶1获胜,则甲队共比赛五场,且第五场甲队获胜,前四场甲队胜三场负一场,所以P(M)=0.6×(0.62×0.52×2+0.6×0.4×0.52×2)=0.18.6.(2019·全国Ⅱ理,13)我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为________.答案0.98解析经停该站高铁列车所有车次的平均正点率的估计值为=0.98. 7.(2019·天津理,10)8的展开式中的常数项为________.答案28解析二项展开式的通项T r+1=(2x)8-r r=r·28-r x8-4r,令8-4r=0可得r=2,故常数项为2×26×=28.三、解答题1.(2019·全国Ⅰ文,17)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=.解(1)由调查数据,男顾客中对该商场服务满意的频率为=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的频率为=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K2的观测值k=≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.2.(2019·全国Ⅱ文,19)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)附:≈8.602.解(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.产值负增长的企业频率为=0.02.用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.(2)=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=i(y i-)2=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.029 6,s==0.02×≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.3.(2019·全国Ⅲ文,17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.4.(2019·北京文,17)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生中上个月A,B两种移动支付方式的使用情况,从全校所有的1 000名学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生支付金额分布情况如下:(1)估计该校学生中上个月A,B两种支付方式都使用的人数;(2)从样本仅使用B的学生中随机抽取1人,求该学生上个月支付金额大于2 000元的概率;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用B的学生中随机抽查1人,发现他本月的支付金额大于2 000元.结合(2)的结果,能否认为样本仅使用B的学生中本月支付金额大于2 000元的人数有变化?说明理由.解(1)由题意知,样本中仅使用A的学生有27+3=30(人),仅使用B的学生有24+1=25(人),A,B两种支付方式都不使用的学生有5人.故样本中A,B两种支付方式都使用的学生有100-30-25-5=40(人).估计该校学生中上个月A,B两种支付方式都使用的人数为×1 000=400.(2)记事件C为“从样本仅使用B的学生中随机抽取1人,该学生上个月的支付金额大于2 000元”,则P(C)==0.04.(3)记事件E为“从样本仅使用B的学生中随机抽查1人,该学生本月的支付金额大于2 000元”.假设样本仅使用B的学生中,本月支付金额大于2 000元的人数没有变化,则由(2)知,P(E)=0.04.答案示例1:可以认为有变化.理由如下:P(E)比较小,概率比较小的事件一般不容易发生,一旦发生,就有理由认为本月支付金额大于2 000元的人数发生了变化.所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:事件E是随机事件,P(E)比较小,一般不容易发生,但还是有可能发生的.所以无法确定有没有变化.5.(2019·天津文,15)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A,B,C,D,E,F.享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人随机抽取2人接受采访.①试用所给字母列举出所有可能的抽取结果;②设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.解(1)由已知得老、中、青员工人数之比为6∶9∶10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人、9人、10人.(2)①从已知的6人中随机抽取2人的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{B,C},{B,D},{B,E},{B,F},{C,D},{C,E},{C,F},{D,E},{D,F},{E,F},共15种.②由表格知,符合题意的所有结果为{A,B},{A,D},{A,E},{A,F},{B,D},{B,E},{B,F},{C,E},{C,F},{D,F},{E,F},共11种.所以,事件M发生的概率P(M)=.6.(2019·江苏,22)(10分)设(1+x)n=a0+a1x+a2x2+…+a n x n,n≥4,n∈N*.已知=2a2a4.(1)求n的值;(2)设(1+)n=a+b,其中a,b∈N*,求a2-3b2的值.解(1)因为(1+x)n=+x+x2+…+x n,n≥4,所以a2==,a3==,a4==.因为=2a2a4,所以2=2××.解得n=5.(2)由(1)知,n=5.(1+)n=(1+)5=++()2+()3+()4+()5=a+b.方法一因为a,b∈N*,所以a=+3+9=76,b=+3+9=44,从而a2-3b2=762-3×442=-32.方法二(1-)5=+(-)+(-)2+(-)3+(-)4+(-)5=-+()2-()3+()4-()5.因为a,b∈N*,所以(1-)5=a-b.因此a2-3b2=(a+b)(a-b)=(1+)5×(1-)5=(-2)5=-32.7.(2019·江苏,23)在平面直角坐标系xOy中,设点集A n={(0,0),(1,0),(2,0),…,(n,0)},B n={(0,1),(n,1)},C n={(0,2),(1,2),(2,2),…,(n,2)},n∈N*.令M n=A n∪B n∪C n.从集合M n中任取两个不同的点,用随机变量X表示它们之间的距离.(1)当n=1时,求X的概率分布;(2)对给定的正整数n(n≥3),求概率P(X≤n)(用n表示).解(1)当n=1时,A1={(0,0),(1,0)},B1={(0,1),(1,1)},C1={(0,2),(1,2)},所以M1={(0,0),(1,0),(0,1),(1,1),(0,2),(1,2)}.所以X的所有可能取值是1,,2,.X的概率分布为P(X=1)==,P(X=)==,P(X=2)==,P(X=)==.(2)设A(a,b)和B(c,d)是从M n中取出的两个点.因为P(X≤n)=1-P(X>n),所以仅需考虑X>n的情况.①若b=d,则AB≤n,不存在X>n的取法;②若b=0,d=1,则AB=≤,所以当且仅当AB=时X>n,此时a=0,c=n或a=n,c=0,有2种取法;③若b=0,d=2,则AB=≤,因为当n≥3时,≤n,所以当且仅当AB=时X>n,此时a=0,c=n或a=n,c=0,有2种取法;④若b=1,d=2,则AB=≤,所以当且仅当AB=时X>n,此时a=0,c=n或a=n,c=0,有2种取法.综上,当X>n时,X的所有可能取值是和,且P(X=)=,P(X=)=.因此,P(X≤n)=1-P(X=)-P(X=)=1-.8.(2019·全国Ⅰ理,21)为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得-1分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得-1分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X.(1)求X的分布列;(2)若甲药、乙药在试验开始时都赋予4分,p i(i=0,1,…,8)表示“甲药的累计得分为i时,最终认为甲药比乙药更有效”的概率,则p0=0,p8=1,p i=ap i-1+bp i+cp i+1(i=1,2,…,7),其中a=P(X=-1),b=P(X=0),c=P(X=1).假设α=0.5,β=0.8.(ⅰ)证明:{p i+1-p i}(i=0,1,2,…,7)为等比数列;(ⅱ)求p4,并根据p4的值解释这种试验方案的合理性.(1)解X的所有可能取值为-1,0,1.P(X=-1)=(1-α)β,P(X=0)=αβ+(1-α)(1-β),P(X=1)=α(1-β).所以X的分布列为(2)(ⅰ)证明由(1)得a=0.4,b=0.5,c=0.1.因此p i=0.4p i-1+0.5p i+0.1p i+1,故0.1(p i+1-p i)=0.4(p i-p i-1),即p i+1-p i=4(p i-p i-1).又因为p1-p0=p1≠0,所以{p i+1-p i}(i=0,1,2,…,7)为公比为4,首项为p1的等比数列.(ⅱ)解由(ⅰ)可得p8=p8-p7+p7-p6+…+p1-p0+p0=(p8-p7)+(p7-p6)+…+(p1-p0)=p1.由于p8=1,故p1=,所以p4=(p4-p3)+(p3-p2)+(p2-p1)+(p1-p0)=p1=.p4表示题干中的实验方案最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为p4=≈0.003 9,此时得出错误结论的概率非常小,说明这种试验方案合理.9.(2019·全国Ⅱ理,18)11分制乒乓球比赛,每赢一球得1分,当某局打成10∶10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10∶10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.解(1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1-0.5)×(1-0.4)=0.5.(2)X=4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为P=[0.5×(1-0.4)+(1-0.5)×0.4]×0.5×0.4=0.1.10.(2019·全国Ⅲ理,17)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.11.(2019·北京理,17)(13分)改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A,B两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A,B两种支付方式都不使用的有5人,样本中仅使用A和仅使用B的学生的支付金额分布情况如下:(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,求X的分布列和数学期望;(Ⅲ)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化?说明理由.【思路分析】(Ⅰ)从全校所有的1000名学生中随机抽取的100人中,A,B两种支付方式都不使用的有5人,仅使用A的有30人,仅使用B的有25人,从而A,B两种支付方式都使用的人数有40人,由此能求出从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率.(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,则X的可能取值为0,1,2,分别求出相应的概率,由此能求出X的分布列和数学期望()E X.(Ⅲ)从样本仅使用A的学生有30人,其中27人月支付金额不大于2000元,有3人月支付金额大于2000元,随机抽查3人,发现他们本月的支付金额都大于2000元的概率为3 3 3 301 4060CpC==,不能认为认为样本仅使用A的学生中本月支付金额大于2000元的人数有变化.【解析】:(Ⅰ)由题意得:从全校所有的1000名学生中随机抽取的100人中,A,B两种支付方式都不使用的有5人,仅使用A的有30人,仅使用B的有25人,A∴,B两种支付方式都使用的人数有:1005302540---=,∴从全校学生中随机抽取1人,估计该学生上个月A,B两种支付方式都使用的概率400.4100p==.(Ⅱ)从样本仅使用A和仅使用B的学生中各随机抽取1人,以X表示这2人中上个月支付金额大于1000元的人数,则X的可能取值为0,1,2,样本仅使用A的学生有30人,其中支付金额在(0,1000]的有18人,超过1000元的有12人,样本仅使用B的学生有25人,其中支付金额在(0,1000]的有10人,超过1000元的有15人,18101806(0)302575025P X==⨯==,1815121039013(1)3025302575025P X==⨯+⨯==,12151806(2)302575025P X ==⨯==, X ∴的分布列为:数学期望()0121252525E X =⨯+⨯+⨯=. (Ⅲ)不能认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化, 理由如下:从样本仅使用A 的学生有30人,其中27人月支付金额不大于2000元,有3人月支付金额大于2000元,随机抽查3人,发现他们本月的支付金额都大于2000元的概率为3333014060C p C ==,虽然概率较小,但发生的可能性为14060. 故不能认为认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化. 【归纳与总结】本题考查概率、离散型随机变量的分布列、数学期望的求法,考查古典概型、相互独立事件概率乘法公式等基础知识,考查推理能力与计算能力,是中档题.12.(2019·天津理,16)设甲、乙两位同学上学期间,每天7:30之前到校的概率均为,假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望;(2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率.解 (1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为 ,故X ~B ,从而P (X =k )= k3-k ,k =0,1,2,3. 所以,随机变量X 的分布列为随机变量X 的数学期望E (X )=3×=2. (2)设乙同学上学期间的三天中7:30之前到校的天数为Y ,则Y ~B,且M ={X =3,Y =1}∪{X =2,Y =0}.由题意知事件{X =3,Y =1}与{X =2,Y =0}互斥,且事件{X =3}与{Y=1},事件{X=2}与{Y=0}均相互独立,从而由(1)知P(M)=P({X=3,Y=1}∪{X=2,Y=0})=P({X=3,Y=1})+P({X=2,Y=0})=P({X=3})P({Y=1})+P({X=2})P({Y=0})=×+×=.。
专题15概率与统计(解答题)1.【2021·全国高考真题(理)】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x 和y ,样本方差分别记为21s 和22s .(1)求x ,y ,21s ,22s ;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x -≥不认为有显著提高).【答案】(1)221210,10.3,0.036,0.04x y s s ====;(2)新设备生产产品的该项指标的均值较旧设备有显著提高.【分析】(1)根据平均数和方差的计算方法,计算出平均数和方差.(2)根据题目所给判断依据,结合(1)的结论进行判断.【详解】(1)9.810.31010.29.99.81010.110.29.71010x +++++++++==,10.110.410.11010.110.310.610.510.410.510.310y +++++++++==,22222222210.20.300.20.10.200.10.20.30.03610s +++++++++==,222222222220.20.10.20.30.200.30.20.10.20.0410s +++++++++==.(2)依题意,0.320.15y x -==⨯=,=,y x -≥,所以新设备生产产品的该项指标的均值较旧设备有显著提高.2.【2021·北京高考真题】为加快新冠肺炎检测效率,某检测机构采取“k 合1检测法”,即将k 个人的拭子样本合并检测,若为阴性,则可以确定所有样本都是阴性的;若为阳性,则还需要对本组的每个人再做检测.现有100人,已知其中2人感染病毒.(1)①若采用“10合1检测法”,且两名患者在同一组,求总检测次数;②已知10人分成一组,分10组,两名感染患者在同一组的概率为111,定义随机变量X 为总检测次数,求检测次数X 的分布列和数学期望E (X );(2)若采用“5合1检测法”,检测次数Y 的期望为E (Y ),试比较E (X )和E (Y )的大小(直接写出结果).【答案】(1)①20次;②分布列见解析;期望为32011;(2)()()E Y E X >.【分析】(1)①由题设条件还原情境,即可得解;②求出X 的取值情况,求出各情况下的概率,进而可得分布列,再由期望的公式即可得解;(2)求出两名感染者在一组的概率,进而求出()E Y ,即可得解.【详解】(1)①对每组进行检测,需要10次;再对结果为阳性的组每个人进行检测,需要10次;所以总检测次数为20次;②由题意,X 可以取20,30,()12011P X ==,()1103011111P X ==-=,则X 的分布列:X2030P1111011所以()1103202030111111E X =⨯+⨯=;(2)由题意,Y 可以取25,30,两名感染者在同一组的概率为232981510020499C C P C ==,不在同一组的概率为19599P =,则()()49529502530=999999E Y E X =⨯+⨯>.3.【2021·全国高考真题】某学校组织“一带一路”知识竞赛,有A ,B 两类问题,每位参加比赛的同学先在两类问题中选择一类并从中随机抽取一个问题回答,若回答错误则该同学比赛结束;若回答正确则从另一类问题中再随机抽取一个问题回答,无论回答正确与否,该同学比赛结束.A 类问题中的每个问题回答正确得20分,否则得0分;B 类问题中的每个问题回答正确得80分,否则得0分,己知小明能正确回答A 类问题的概率为0.8,能正确回答B 类问题的概率为0.6,且能正确回答问题的概率与回答次序无关.(1)若小明先回答A 类问题,记X 为小明的累计得分,求X 的分布列;(2)为使累计得分的期望最大,小明应选择先回答哪类问题?并说明理由.【答案】(1)见解析;(2)B 类.【分析】(1)通过题意分析出小明累计得分X 的所有可能取值,逐一求概率列分布列即可.(2)与(1)类似,找出先回答B 类问题的数学期望,比较两个期望的大小即可.【详解】(1)由题可知,X 的所有可能取值为0,20,100.()010.80.2P X ==-=;()()200.810.60.32P X ==-=;()1000.80.60.48P X ==⨯=.所以X 的分布列为X020100P0.20.320.48(2)由(1)知,()00.2200.321000.4854.4E X =⨯+⨯+⨯=.若小明先回答B 问题,记Y 为小明的累计得分,则Y 的所有可能取值为0,80,100.()010.60.4P Y ==-=;()()800.610.80.12P Y ==-=;()1000.80.60.48P X ==⨯=.所以()00.4800.121000.4857.6E Y =⨯+⨯+⨯=.因为54.457.6<,所以小明应选择先回答B 类问题.4.【2021·全国高考真题】一种微生物群体可以经过自身繁殖不断生存下来,设一个这种微生物为第0代,经过一次繁殖后为第1代,再经过一次繁殖后为第2代……,该微生物每代繁殖的个数是相互独立的且有相同的分布列,设X 表示1个微生物个体繁殖下一代的个数,()(0,1,2,3)i P X i p i ===.(1)已知01230.4,0.3,0.2,0.1p p p p ====,求()E X ;(2)设p 表示该种微生物经过多代繁殖后临近灭绝的概率,p 是关于x 的方程:230123p p x p x p x x +++=的一个最小正实根,求证:当()1E X ≤时,1p =,当()1E X >时,1p <;(3)根据你的理解说明(2)问结论的实际含义.【答案】(1)1;(2)见解析;(3)见解析.【分析】(1)利用公式计算可得()E X .(2)利用导数讨论函数的单调性,结合()10f =及极值点的范围可得()f x 的最小正零点.(3)利用期望的意义及根的范围可得相应的理解说明.【详解】(1)()00.410.320.230.11E X =⨯+⨯+⨯+⨯=.(2)设()()3232101f x p x p x p x p =++-+,因为32101p p p p +++=,故()()32322030f x p x p x p p p x p =+-+++,若()1E X ≤,则123231p p p ++≤,故2302p p p +≤.()()23220332f x p x p x p p p '=+-++,因为()()20300f p p p '=-++<,()230120f p p p '=+-≤,故()f x '有两个不同零点12,x x ,且1201x x <<≤,且()()12,,x x x ∈-∞⋃+∞时,()0f x '>;()12,x x x ∈时,()0f x '<;故()f x 在()1,x -∞,()2,x +∞上为增函数,在()12,x x 上为减函数,若21x =,因为()f x 在()2,x +∞为增函数且()10f =,而当()20,x x ∈时,因为()f x 在()12,x x 上为减函数,故()()()210f x f x f >==,故1为230123p p x p x p x x +++=的一个最小正实根,若21>x ,因为()10f =且在()20,x 上为减函数,故1为230123p p x p x p x x +++=的一个最小正实根,综上,若()1E X ≤,则1p =.若()1E X >,则123231p p p ++>,故2302p p p +>.此时()()20300f p p p '=-++<,()230120f p p p '=+->,故()f x '有两个不同零点34,x x ,且3401x x <<<,且()()34,,x x x ∈-∞+∞ 时,()0f x '>;()34,x x x ∈时,()0f x '<;故()f x 在()3,x -∞,()4,x +∞上为增函数,在()34,x x 上为减函数,而()10f =,故()40f x <,又()000f p =>,故()f x 在()40,x 存在一个零点p ,且1p <.所以p 为230123p p x p x p x x +++=的一个最小正实根,此时1p <,故当()1E X >时,1p <.(3)意义:每一个该种微生物繁殖后代的平均数不超过1,则若干代必然灭绝,若繁殖后代的平均数超过1,则若干代后被灭绝的概率小于1.5.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116.(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684---=.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为111178168816+++=.6.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i ,y i )(i=1,2,…,20),其中x i 和y i 分别表示第i 个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i iy==∑,2021)8(0ii x x =-=∑,2021)9000(i iy y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i )(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)((iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000.(2)样本(,)i i x y (1,2,,20)i =的相关系数20220.943(iix y y x r --=∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.7.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)72(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次>400空气质量好空气质量不好附:K 2=()()()()2) n ad bc a b c d a c b d -++++,P (K 2≥k )0.0500.0100.001k 3.841 6.63510.828.【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:空气质量等级1234概率的估计值0.430.270.210.09(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=.(3)根据所给数据,可得22⨯列联表:人次≤400人次>400空气质量好3337空气质量不好228根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.8.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM 2.5和2SO 浓度(单位:3μg/m ),得下表:2SO [0,50](50,150](150,475]PM 2.5[0,35]32184(35,75]6812(75,115]3710(1)估计事件“该市一天空气中PM 2.5浓度不超过75,且2SO 浓度不超过150”的概率;(2)根据所给数据,完成下面的22⨯列联表:2SO PM 2.5[0,150](150,475][0,75](75,115](3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,2()P K k ≥0.0500.0100.001k3.8416.63510.828【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=.(2)根据抽查数据,可得22⨯列联表:2SO PM 2.5[0,150](150,475][0,75]6416(75,115]1010(3)根据(2)的列联表得22100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯.由于7.484 6.635>,故有99%的把握认为该市一天空气中PM 2.5浓度与2SO 浓度有关.9.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:男生女生支持不支持支持不支持方案一200人400人300人100人方案二350人250人150人250人假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明)【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313((1)()3433436C -+-=;(Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.10.【2019年高考全国Ⅲ卷理数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【答案】(1)a=0.35,b=0.10;(2)甲、乙离子残留百分比的平均值的估计值分别为4.05,6.00.【解析】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1–0.05–0.15–0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.11.【2019年高考全国Ⅱ卷理数】11分制乒乓球比赛,每赢一球得1分,当某局打成10:10平后,每球交换发球权,先多得2分的一方获胜,该局比赛结束.甲、乙两位同学进行单打比赛,假设甲发球时甲得分的概率为0.5,乙发球时甲得分的概率为0.4,各球的结果相互独立.在某局双方10:10平后,甲先发球,两人又打了X个球该局比赛结束.(1)求P(X=2);(2)求事件“X=4且甲获胜”的概率.【答案】(1)0.5;(2)0.1.【解析】(1)X=2就是10∶10平后,两人又打了2个球该局比赛结束,则这2个球均由甲得分,或者均由乙得分.因此P(X=2)=0.5×0.4+(1–0.5)×(1–0.4)=0.5.(2)X =4且甲获胜,就是10∶10平后,两人又打了4个球该局比赛结束,且这4个球的得分情况为:前两球是甲、乙各得1分,后两球均为甲得分.因此所求概率为[0.5×(1–0.4)+(1–0.5)×0.4]×0.5×0.4=0.1.12.【2019年高考天津卷理数】设甲、乙两位同学上学期间,每天7:30之前到校的概率均为23.假定甲、乙两位同学到校情况互不影响,且任一同学每天到校情况相互独立.(1)用X 表示甲同学上学期间的三天中7:30之前到校的天数,求随机变量X 的分布列和数学期望;(2)设M 为事件“上学期间的三天中,甲同学在7:30之前到校的天数比乙同学在7:30之前到校的天数恰好多2”,求事件M 发生的概率.【答案】(1)分布列见解析,()2E X =;(2)20243.【分析】本小题主要考查离散型随机变量的分布列与数学期望,互斥事件和相互独立事件的概率计算公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.【解析】(1)因为甲同学上学期间的三天中到校情况相互独立,且每天7:30之前到校的概率均为23,故2~(3,)3X B ,从而3321()C ()(),0,1,2,333k k k P X k k -===.所以,随机变量X 的分布列为X0123P 1272949827随机变量X 的数学期望2()323E X =⨯=.(2)设乙同学上学期间的三天中7:30之前到校的天数为Y ,则2~(3,)3Y B ,且{3,1}{2,0}M X Y X Y ===== .由题意知事件{3,1}X Y ==与{2,0}X Y ==互斥,且事件{3}X =与{1}Y =,事件{2}X =与{0}Y =均相互独立,从而由(1)知()({3,1}{2,0})P M P X Y X Y ===== (3,1)(2,0)P X Y P X Y ===+==(3)(1)(2)(0)P X P Y P X P Y ===+==824120279927243=⨯+⨯=.13.【2019年高考北京卷理数】改革开放以来,人们的支付方式发生了巨大转变.近年来,移动支付已成为主要支付方式之一.为了解某校学生上个月A ,B 两种移动支付方式的使用情况,从全校学生中随机抽取了100人,发现样本中A ,B 两种支付方式都不使用的有5人,样本中仅使用A 和仅使用B 的学生的支付金额分布情况如下:(1)从全校学生中随机抽取1人,估计该学生上个月A ,B 两种支付方式都使用的概率;(2)从样本仅使用A 和仅使用B 的学生中各随机抽取1人,以X 表示这2人中上个月支付金额大于1000元的人数,求X 的分布列和数学期望;(3)已知上个月样本学生的支付方式在本月没有变化.现从样本仅使用A 的学生中,随机抽查3人,发现他们本月的支付金额都大于2000元.根据抽查结果,能否认为样本仅使用A 的学生中本月支付金额大于2000元的人数有变化?说明理由.【答案】(1)0.4;(2)分布列见解析,E (X )=1;(3)见解析.【解析】(1)由题意知,样本中仅使用A 的学生有18+9+3=30人,仅使用B 的学生有10+14+1=25人,A ,B 两种支付方式都不使用的学生有5人.故样本中A ,B 两种支付方式都使用的学生有100−30−25−5=40人.所以从全校学生中随机抽取1人,该学生上个月A ,B 两种支付方式都使用的概率估计为400.4100=.(2)X 的所有可能值为0,1,2.记事件C 为“从样本仅使用A 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”,事件D 为“从样本仅使用B 的学生中随机抽取1人,该学生上个月的支付金额大于1000元”.由题设知,事件C ,D 相互独立,且93141()0.4,()0.63025P C P D ++====.所以(2)()()()0.24P X P CD P C P D ====,(1)()P X P CD CD ==()()()()P C P D P C P D =+0.4(10.6)(10.4)0.6=⨯-+-⨯0.52=,(0)()()()0.24P X P CD P C P D ====.所以X 的分布列为X012P 0.240.520.24故X 的数学期望()00.2410.5220.241E X =⨯+⨯+⨯=.(3)记事件E 为“从样本仅使用A 的学生中随机抽查3人,他们本月的支付金额都大于2000元”.假设样本仅使用A 的学生中,本月支付金额大于2000元的人数没有变化,则由上个月的样本数据得33011()C 4060P E ==.答案示例1:可以认为有变化.理由如下:P (E )比较小,概率比较小的事件一般不容易发生.一旦发生,就有理由认为本月的支付金额大于2000元的人数发生了变化,所以可以认为有变化.答案示例2:无法确定有没有变化.理由如下:事件E 是随机事件,P (E )比较小,一般不容易发生,但还是有可能发生的,所以无法确定有没有变化.14.【2019年高考全国Ⅰ卷理数】为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X .(1)求X 的分布列;(2)若甲药、乙药在试验开始时都赋予4分,(0,1,,8)i p i = 表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11i i i i p ap bp cp -+=++(1,2,,7)i = ,其中(1)a P X ==-,(0)b P X ==,(1)c P X ==.假设0.5α=,0.8β=.(i)证明:1{}i i p p +-(0,1,2,,7)i = 为等比数列;(ii)求4p ,并根据4p 的值解释这种试验方案的合理性.【答案】(1)分布列见解析;(2)(i)证明见解析,(ii)45 127p =,解释见解析.【解析】X 的所有可能取值为1,0,1-.(1)(1)P X αβ=-=-,(0)(1)(1)P X αβαβ==+--,(1)(1)P X αβ==-,所以X 的分布列为X1-01P (1)αβ-(1)(1)αβαβ+--(1)αβ-(2)(i )由(1)得0.4,0.5,0.1a b c ===.因此110.40.5 0.1i i i i p p p p -+=++,故110.1()0.4()i i i i p p p p +--=-,即114()i i i i p p p p +--=-.又因为1010p p p -=≠,所以1{}(0,1,2,,7)i i p p i +-= 为公比为4,首项为1p 的等比数列.(ii )由(i )可得88776100p p p p p p p p =-+-++-+ 877610()()()p p p p p p =-+-++-81413p -=.由于8=1p ,故18341p =-,所以44433221101( 411()327)(5())p p p p p p p p p p -=-+-+-+=-=.4p 表示最终认为甲药更有效的概率,由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为410.0039257p =≈,此时得出错误结论的概率非常小,说明这种试验方案合理.。
统计、概率练习试题1、【2012高考山东】 (4)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是(A)众数 (B)平均数 (C)中位数 (D)标准差【答案】D2、【2012高考四川】交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查。
假设四个社区驾驶员的总人数为N ,其中甲社区有驾驶员96人。
若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N 为( )A 、101B 、808C 、1212D 、2012【答案】B3、某市有大型超市200家、中型超市400家、小型超市1400家。
为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,应抽取中型超市__________家。
4、【2012高考陕西】对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则改样本的中位数、众数、极差分别是 ( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53【答案】A.5、【2012高考湖北】容量为20的样本数据,分组后的频数如下表则样本数据落在区间[10,40]的频率为A 0.35B 0.45C 0.55D 0.652【答案】B6、【2012高考广东】由正整数组成的一组数据1234,,,x x x x ,其平均数和中位数都是2,且标准差等于1,则这组数据为 .(从小到大排列)【答案】1,1,3,37、【2012高考山东】右图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5℃的城市个数为11,则样本中平均气温不低于25.5℃的城市个数为____.【答案】98、【2012高考湖南】图2是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_________.08910352图(注:方差2222121()()()n s x x x x x x n ⎡⎤=-+-++-⎣⎦,其中x 为x 1,x 2,…,x n 的平均数)[来 【答案】6.89、【2012高考江苏】某学校高一、高二、高三年级的学生人数之比为334::,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取名学生.【答案】15。
10、【2012高考安徽】袋中共有6个除了颜色外完全相同的球,其中有1个红球,2个白球和3个黑球,从袋中任取两球,两球颜色为一白一黑的概率等于(A )15 (B )25 (C )35 (D )45【答案】B【解析】1个红球,2个白球和3个黑球记为112123,,,,,a b b c c c ,从袋中任取两球共有111211121312111213212223121323,;,;,;,;,;,;,;,;,,;,;,;,;,;,a b a b a c a c a c b b b c b c b c b c b c b c c c c c c c 15种; 满足两球颜色为一白一黑有6种,概率等于62155=。
11、【2102高考北京】设不等式组⎩⎨⎧≤≤≤≤20,20y x ,表示平面区域为D ,在区域D 内随机取一个点,则此点到坐标原点的距离大于2的概率是(A )4π (B )22π- (C )6π (D )44π- 【答案】D 【解析】题目中⎩⎨⎧≤≤≤≤2020y x 表示的区域如图正方形所示,而动点D 可以存在的位置为正方形面积减去四分之一圆的面积部分,因此4422241222ππ-=⨯⋅-⨯=P ,故选D 。
12、【2012高考辽宁】在长为12cm 的线段AB 上任取一点C. 现作一矩形,邻边长分别等于线段AC,CB 的长,则该矩形面积大于20cm 2的概率为:(A) 16 (B) 13 (C) 23 (D) 45【答案】C【解析】设线段AC 的长为x cm ,则线段CB 的长为(12x -)cm,那么矩形的面积为(12)x x -cm 2,由(12)20x x ->,解得210x <<。
又012x <<,所以该矩形面积小于32cm 2的概率为23,故选C13、【2012高考浙江】从边长为1的正方形的中心和顶点这五点中,随机(等可能)取两点,则该两点间的距离为22的概率是___________。
【答案】25【解析】若使两点间的距离为22,则为对角线一半,选择点必含中心,概率为142542105C C ==.14、【2012高考江苏】现有10个数,它们能构成一个以1为首项,3-为公比的等比数列,若从这10个数中随机抽取一个数,则它小于8的概率是▲.【答案】35。
【考点】等比数列,概率。
【解析】∵以1为首项,3-为公比的等比数列的10个数为1,-3,9,-27,···其中有5个负数,1个正数1计6个数小于8,∴从这10个数中随机抽取一个数,它小于8的概率是63= 105。
15、从正六边形的6个顶点中随机选择4个顶点,则以它们作为顶点的四边形是矩形的概率等于(A)110(B)18(C)16(D)1516、甲、乙两队进行排球决赛,现在的情形是甲队只要在赢一次就获冠军,乙队需要再赢两局才能得冠军,若两队胜每局的概率相同,则甲队获得冠军的概率为A.12B.35C.23D.3417、从1,2,3,4这四个数中一次随机取两个数,则其中一个数是另一个的两倍的概率是______ 11.有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18[27.5,31.5) 1l [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,大于或等于31.5的数据约占(A)211(B)13(C)12(D)2318、从装有3个红球、2个白球的袋中任取3个球,则所取的3个球中至少有1个白球的概率是A.110B.310C.35D.91019、【2012高考山东】袋中有五张卡片,其中红色卡片三张,标号分别为1,2,3;蓝色卡片两张,标号分别为1,2.(Ⅰ)从以上五张卡片中任取两张,求这两张卡片颜色不同且标号之和小于4的概率;(Ⅱ)现袋中再放入一张标号为0的绿色卡片,从这六张卡片中任取两张,求这两张卡片颜色不同且标号之和小于4的概率.【答案】(18)(I)从五张卡片中任取两张的所有可能情况有如下10种:红1红2,红1红3,红1蓝1,红1蓝2,红2红3,红2蓝1,红2蓝2,红3蓝1,红3蓝2,蓝1蓝2.其中两张卡片的颜色不同且标号之和小于4的有3种情况,故所求的概率为310 P=.(II)加入一张标号为0的绿色卡片后,从六张卡片中任取两张,除上面的10种情况外,多出5种情况:红1绿0,红2绿0,红3绿0,蓝1绿0,蓝2绿0,即共有15种情况,其中颜色不同且标号之和小于4的有8种情况,所以概率为815 P=.20、【2012高考新课标】某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售.如果当天卖不完,剩下的玫瑰花做垃圾处理.(Ⅰ)若花店一天购进17枝玫瑰花,求当天的利润y(单位:元)关于当天需求量n(单位:枝,n∈N)的函数解析式.(Ⅱ)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:日需求量n14 15 16 17 18 19 20频数10 20 16 16 15 13 10(1)假设花店在这100天内每天购进17枝玫瑰花,求这100天的日利润(单位:元)的平均数;(2)若花店一天购进17枝玫瑰花,以100天记录的各需求量的频率作为各需求量发生的概率,求当天的利润不少于75元的概率.【答案】21、【2012高考四川】某居民小区有两个相互独立的安全防范系统(简称系统)A和B,系统A和系统B在任意时刻发生故障的概率分别为110和p。
(Ⅰ)若在任意时刻至少有一个系统不发生故障的概率为4950,求p 的值; (Ⅱ)求系统A 在3次相互独立的检测中不发生故障的次数大于发生故障的次数的概率。
命题立意:本题主要考查独立事件的概率公式、随机试验等基础知识,考查实际问题的数学建模能力,数据的分析处理能力和基本运算能力.【答案】【解析】22、【2012高考重庆】甲、乙两人轮流投篮,每人每次投一球,约定甲先投且先投中者获胜,一直每人都已投球3次时投篮结束,设甲每次投篮投中的概率为13,乙每次投篮投中的概率为12,且各次投篮互不影响。
(Ⅰ)求乙获胜的概率;(Ⅱ)求投篮结束时乙只投了2个球的概率。
独立事件同时发生的概率计算公式知112211223()()()p D p A B A B p A B A B A =+ 112211223()()()()()()()()()p A p B P A P B p A p B P A P B p A =+2222212114()()()()3232327=+= 23、【2012高考天津】某地区有小学21所,中学14所,大学7所,现采取分层抽样的方法从这些学校中抽取6所学校对学生进行视力调查。
(I )求应从小学、中学、大学中分别抽取的学校数目。
(II)若从抽取的6所学校中随机抽取2所学校做进一步数据分析,(1)列出所有可能的抽取结果;(2)求抽取的2所学校均为小学的概率。
【答案】24、【2012高考陕西】假设甲乙两种品牌的同类产品在某地区市场上销售量相等,为了解他们的使用寿命,现从两种品牌的产品中分别随机抽取100个进行测试,结果统计如下:(Ⅰ)估计甲品牌产品寿命小于200小时的概率;(Ⅱ)这两种品牌产品中,,某个产品已使用了200小时,试估计该产品是甲品牌的概率。
【答案】25、【2012高考江西】如图,从A1(1,0,0),A2(2,0,0),B1(0,1,0,)B2(0,2,0),C1(0,0,1),C2(0,0,2)这6个点中随机选取3个点。
(1)求这3点与原点O恰好是正三棱锥的四个顶点的概率;(2)求这3点与原点O共面的概率。
1、【2012高考浙江】设l是直线,a,β是两个不同的平面A. 若l∥a,l∥β,则a∥βB. 若l∥a,l⊥β,则a⊥βC. 若a⊥β,l⊥a,则l⊥βD. 若a⊥β, l∥a,则l⊥β【答案】B【解析】利用排除法可得选项B是正确的,∵l∥a,l⊥β,则a⊥β.如选项A:l∥a,l∥⊂;选项D:若若a⊥β, l⊥a,l∥β时,a⊥β或a∥β;选项C:若a⊥β,l⊥a,l∥β或lββ或l⊥β.2、【2012高考四川】下列命题正确的是()A、若两条直线和同一个平面所成的角相等,则这两条直线平行B、若一个平面内有三个点到另一个平面的距离相等,则这两个平面平行C、若一条直线平行于两个相交平面,则这条直线与这两个平面的交线平行D、若两个平面都垂直于第三个平面,则这两个平面平行【答案】C3、【2012高考新课标】如图,网格纸上小正方形的边长为1,粗线画出的是某几何体的三视图,则此几何体的体积为( )()A 6 ()B 9 ()C 12 ()D 18【答案】B【解析】选B 由三视图可知,该几何体是三棱锥,底面是俯视图,高为3,所以几何体的体积为93362131=⨯⨯⨯⨯=V ,选B. 4、[2011·陕西卷] 某几何体的三视图如图1-2所示,则它的体积是( )图1-2A .8-2π3B .8-π3C .8-2π D.2π3课标理数5.G2[2011·陕西卷] A 【解析】 分析图中所给的三视图可知,对应空间几何图形,应该是一个棱长为2的正方体中间挖去一个半径为1,高为2的圆锥,则对应体积为:V=2×2×2-13π×12×2=8-23π. 5、【2012高考新课标】平面α截球O 的球面所得圆的半径为1,球心O 到平面α的距离为2,则此球的体积为(A )6π (B )43π (C )46π (D )63π【答案】B【解析】球半径3)2(12=+=r ,所以球的体积为ππ34)3(343=⨯,选B. 6、【2012高考全国】已知正四棱柱1111ABCD A B C D -中 ,2AB =,122CC =,E 为1CC 的中点,则直线1AC 与平面BED 的距离为(A )2 (B )3 (C )2 (D )1【答案】D【解析】连结BD AC ,交于点O ,连结OE ,因为E O ,是中点,所以1//AC OE ,且121AC OE =,所以BDE AC //1,即直线1AC 与平面BED 的距离等于点C 到平面BED 的距离,过C 做OE CF ⊥于F ,则CF 即为所求距离.因为底面边长为2,高为22,所以22=AC ,2,2==CE OC ,2=OE ,所以利用等积法得1=CF ,选 D.【解析】A.两直线可能平行,相交,异面故A 不正确;B.两平面平行或相交;C.正确;D.这两个平面平行或相交.7、在三棱锥O-ABC 中,三条棱OA 、OB 、OC 两两互相垂直,且OA =OB =OC,M 是AB 的中点,则OM 与平面ABC 所成角的正弦值是______________8、如图,已知正三棱柱111ABC A B C -的各条棱长都相等,M 是侧 棱1CC 的中点,则异面直线1AB BM 和所成的角的大小是 。