概率与统计高考综合试题(含答案)
- 格式:docx
- 大小:372.46 KB
- 文档页数:7
高考数学复习专题训练—统计与概率解答题1.(2021·广东广州二模改编)根据相关统计,2010年以后中国贫困人口规模呈逐年下降趋势,2011~2019年全国农村贫困发生率的散点图如下:注:年份代码1~9分别对应年份2011年~2019年.(1)求y 关于t 的经验回归方程(系数精确到0.01);(2)已知某贫困地区的农民人均年纯收入X (单位:万元)满足正态分布N (1.6,0.36),若该地区约有97.72%的农民人均纯收入高于该地区最低人均年纯收入标准,则该地区最低人均年纯收入标准大约为多少万元?参考数据与公式:∑i=19y i =54.2,∑i=19t i y i =183.6. 经验回归直线y ^=b ^t+a ^的斜率和截距的最小二乘估计分别为b ^=∑i=1n t i y i -nt y ∑i=1n (t i -t )2 ,a ^=y −b ^t . 若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ≤X ≤μ+σ)≈0.682 7,P (μ-2σ≤X ≤μ+2σ)≈0.954 5,P (μ-3σ≤X ≤μ+3σ)≈0.997 3.2.(2021·湖北黄冈适应性考试改编)产品质量是企业的生命线.为提高产品质量,企业非常重视产品生产线的质量.某企业引进了生产同一种产品的A,B 两条生产线,为比较两条生产线的质量,从A,B 生产线生产的产品中各自随机抽取了100件产品进行检测,把产品等级结果和频数制成了如图的统计图.(1)依据小概率值α=0.025的独立性检验,分析数据,能否据此推断是否为一级品与生产线有关.(2)生产一件一级品可盈利100元,生产一件二级品可盈利50元,生产一件三级品则亏损20元,以频率估计概率.①分别估计A,B生产线生产一件产品的平均利润;②你认为哪条生产线的利润较为稳定?并说明理由.附:①参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.②临界值表:3.(2021·福建宁德模拟改编)某工厂为了检测一批新生产的零件是否合格,从中随机抽测100个零件的长度d(单位:mm).该样本数据分组如下:[57,58),[58,59),[59,60),[60,61),[61,62),[62,63],得到如图所示的频率分布直方图.经检测,样本中d大于61的零件有13个,长度分别为61.1,61.1,61.2,61.2,61.3,61.5,61.6,61.6,61.8,61.9,62.1,62.2,62.6.(1)求频率分布直方图中a,b,c的值及该样本的平均长度x(结果精确到1 mm,同一组数据用该区间的中点值作代表);(2)视该批次样本的频率为总体的概率,从工厂生产的这批新零件中随机选取3个,记ξ为抽取的零件长度在[59,61)的个数,求ξ的分布列和数学期望;(3)若变量X满足|P(μ-σ≤X≤μ+σ)-0.682 7|<0.03且|P(μ-2σ≤X≤μ+2σ)-0.954 5|≤0.03,则称变量X满足近似于正态分布N(μ,σ2)的概率分布.如果这批样本的长度d满足近似于正态分布N(x,12)的概率分布,则认为这批零件是合格的,将顺利出厂;否则不能出厂.请问,能否让该批零件出厂?4.(2021·山东潍坊期末)在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.设三台设备的可靠度均为r(0<r<1),它们之间相互不影响.(1)要使系统的可靠度不低于0.992,求r的最小值;(2)当r=0.9时,求能正常工作的设备数X的分布列;(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可能给该产业园带来约50万元的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.9,更新设备硬件总费用为8万元; 方案2:对系统的设备进行维护,使得设备可靠度维持在0.8,设备维护总费用为5万元.请从期望损失最小的角度判断决策部门该如何决策?答案及解析1.解 (1)t =1+2+3+4+5+6+7+8+99=5, y =12.7+10.2+8.5+7.2+5.7+4.5+3.1+1.7+0.69≈6.02, b ^=∑i=19t i y i -9t y∑i=19(t i -5)2=183.6-270.960≈-1.46,a ^=y −b ^t =6.02-(-1.46)×5=13.32.故y 关于t 的经验回归方程为y ^=-1.46t+13.32.(2)因为P (μ-2σ≤X ≤μ+2σ)≈0.954 5,所以P (X>μ-2σ)=0.954 5+1-0.954 52=0.977 25. 因为某贫困地区的农民人均年纯收入X 满足正态分布N (1.6,0.36),所以μ=1.6,σ=0.6,μ-2σ=0.4,P (X>0.4)=0.977 25,故该地区最低人均年纯收入标准大约为0.4万元.2.解 (1)根据已知数据可建立列联表如下:零假设为H 0:是否为一级品与生产线无关.χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )=200×(20×65-35×80)255×145×100×100≈5.643>5.024=x 0.025,依据小概率值α=0.025的独立性检验,推断H 0不成立,即认为是否为一级品与生产线有关.(2)A 生产线生产一件产品为一、二、三级品的概率分别为15,35,15.记A 生产线生产一件产品的利润为X ,则X 的取值为100,50,-20,其分布列为B生产线生产一件产品为一、二、三级品的概率分别为720,25 ,14.记B生产线生产一件产品的利润为Y,则Y的取值为100,50,-20, 其分布列为①E(X)=100×15+50×35+(-20)×15=46,E(Y)=100×720+50×25+(-20)×14=50.故A,B生产线生产一件产品的平均利润分别为46元、50元.②D(X)=(100-46)2×15+(50-46)2×35+(-20-46)2×15=1 464.D(Y)=(100-50)2×720+(50-50)2×25+(-20-50)2×14=2 100.因为D(X)<D(Y),所以A生产线的利润更为稳定.3.解(1)由题意可得P(61≤d<62)=10100=0.1,P(62≤d≤63)=3100=0.03,P(59≤d<60)=P(60≤d<61)=12(1-2×0.03-0.14-0.1)=0.35,所以a=0.031=0.03,b=0.11=0.1,c=0.351=0.35.x=(57.5+62.5)×0.03+58.5×0.14+(59.5+60.5)×0.35+61.5×0.1=59.94≈60.(2)由(1)可知从该工厂生产的新零件中随机选取1件,长度d在(59,61]的概率P=2×0.35=0.7,且随机变量ξ服从二项分布ξ~B(3,0.7),所以P(ξ=0)=C30×(1-0.7)3=0.027,P(ξ=1)=C31×0.7×(1-0.7)2=0.189,P(ξ=2)=C32×0.72×(1-0.7)=0.441,P(ξ=3)=C33×0.73=0.343,所以随机变量ξ的分布列为E(ξ)=0×0.027+1×0.189+2×0.441+3×0.343=2.1.(3)由(1)及题意可知x=60,σ=1.所以P(x-σ≤X≤x-σ)=P(59≤X≤61)=0.7.|P(x-σ≤X≤x+σ)-0.682 7|=|0.7-0.682 7|=0.017 3≤0.03,P(x-2σ≤X≤x-2σ)=P(58≤X≤62)=0.14+0.35+0.35+0.1=0.94,|P(x-2σ≤X≤x+2σ)-0.954 5|=|0.94-0.954 5|=0.014 5≤0.03.所以这批新零件的长度d满足近似于正态分布N(x,12)的概率分布.所以能让该批零件出厂.4.解(1)要使系统的可靠度不低于0.992,则P(X≥1)=1-P(X<1)=1-P(X=0)=1-(1-r)3≥0.992,解得r≥0.8,故r的最小值为0.8.(2)X为正常工作的设备数,由题意可知,X~B(3,r),P(X=0)=C30×0.90×(1-0.9)3=0.001,P(X=1)=C31×0.91×(1-0.9)2=0.027,P(X=2)=C32×0.92×(1-0.9)1=0.243,P(X=3)=C33×0.93×(1-0.9)0=0.729,从而X的分布列为(3)设方案1、方案2的总损失分别为X1,X2,采用方案1,更换部分设备的硬件,使得设备可靠度达到0.9,由(2)可知计算机网络断掉的概率为0.001,不断掉的概率为0.999,故E(X1)=80000+0.001×500 000=80 500元.采用方案2,对系统的设备进行维护,使得设备可靠度维持在0.8,由(1)可知计算机网络断掉的概率为0.008,故E(X2)=50 000+0.008×500 000=54 000元,因此,从期望损失最小的角度,决策部门应选择方案2.。
高考概率大题及答案【篇一:2015年高考数学概率与统计试题汇编】4.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:??a??0.76,a? ,据此估计,??bx? ,其中b???根据上表可得回归直线方程y该社区一户收入为15万元家庭年支出为( )a.11.4万元 b.11.8万元c.12.0万元 d.12.2万元【答案】b考点:线性回归方程.13.如图,点a 的坐标为?1,0? ,点c 的坐标为?2,4? ,函数f?x??x2 ,若在矩形abcd 内随机取一点,则此点取自阴影部分的概率等于.【答案】5 12【解析】试题分析:由已知得阴影部分面积为4??x2dx?4?1275?.所以此点取自阴影3355部分的概率等于?. 412考点:几何概型.16.某银行规定,一张银行卡若在一天内出现3次密码尝试错误,该银行卡将被锁定,小王到银行取钱时,发现自己忘记了银行卡的密码,但是可以确定该银行卡的正确密码是他常用的6个密码之一,小王决定从中不重复地随机选择1个进行尝试.若密码正确,则结束尝试;否则继续尝试,直至该银行卡被锁定. (Ⅰ)求当天小王的该银行卡被锁定的概率;(Ⅱ)设当天小王用该银行卡尝试密码次数为x,求x的分布列和数学期望.15【答案】(Ⅰ);(Ⅱ)分布列见解析,期望为. 22【解析】试题分析:(Ⅰ)首先记事件“当天小王的该银行卡被锁定”的事件为a.则银行3卡被锁死相当于三次尝试密码都错,基本事件总数为a6?6?5?4,事件a包含3的基本事件数为a5?5?4?3,代入古典概型的概率计算公式求解;(Ⅱ)列出随机变量x的所有可能取值,分别求取相应值的概率,写出分布列求期望即可.试题解析:(Ⅰ)设“当天小王的该银行卡被锁定”的事件为a,5431= 则p(a)=6542(Ⅱ)依题意得,x所有可能的取值是1,2,3151又p(x=1)=,p(x=2)=?6651542,p(x=3)=1=. 6653所以x的分布列为所以e(x)=1?1122?3?6635. 2考点:1、古典概型;2、离散型随机变量的分布列和期望.2015江苏理科5.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为________. 【答案】5. 6考点:古典概型概率2015年重庆理科17.(本小题满分13分,(1)小问5分,(2)小问8分)端午节吃粽子是我国的传统习俗,设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同,从中任意选取3个。
2019年高考专题:概率与统计1.【2019年高考全国Ⅲ卷文数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A .0.5 B .0.6 C .0.7 D .0.8 【解析】由题意得,阅读过《西游记》的学生人数为90-80+60=70, 则其与该校学生人数之比为70÷100=0.7.故选C . 2.【2019年高考全国Ⅰ卷文数】某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( ) A .8号学生B .200号学生C .616号学生D .815号学生【解析】由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n=+()n *∈N ,若8610n =+,解得15n =,不合题意;若200610n =+,解得19.4n =,不合题意;若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 3.【2019年高考全国Ⅱ卷文数】生物实验室有5只兔子,其中只有3只测量过某项指标,若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为( ) A .23B .35 C .25D .15【解析】设其中做过测试的3只兔子为,,a b c ,剩余的2只为,A B , 则从这5只中任取3只的所有取法有{,,},{,,},{,,},{,,},{,,},{,,},{,,}a b c a b A a b B a c A a c B a A B b c A ,{,,},{,,},{,,}b c B b A B c A B ,共10种.其中恰有2只做过测试的取法有{,,},{,,},{,,},{,,},a b A a b B a c A a c B {,,},{,,}b c A b c B ,共6种,所以恰有2只做过测试的概率为63105=,故选B .4.【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是______________. 【解析】由题意,该组数据的平均数为678891086+++++=,所以该组数据的方差是22222215[(68)(78)(88)(88)(98)(108)]63-+-+-+-+-+-=. 5.【2019年高考全国Ⅱ卷文数】我国高铁发展迅速,技术先进.经统计,在经停某站的高铁列车中,有10个车次的正点率为0.97,有20个车次的正点率为0.98,有10个车次的正点率为0.99,则经停该站高铁列车所有车次的平均正点率的估计值为______________.【解析】由题意得,经停该高铁站的列车正点数约为100.97200.98100.9939.2⨯+⨯+⨯=,其中高铁个数为10201040++=,所以该站所有高铁平均正点率约为39.20.9840=. 6.【安徽省江淮十校2019届高三年级5月考前最后一卷】《易经》是我国古代预测未来的著作,其中同时抛掷三枚古钱币观察正反面进行预测未知,则抛掷一次时出现两枚正面、一枚反面的概率为 A .18B .14 C .38D .12【解析】抛掷三枚古钱币出现的基本事件有:正正正,正正反,正反正,反正正,正反反,反正反,反反正,反反反,共8种,其中出现两正一反的共有3种,故所求概率为38.故选C . 7.【山东省济宁市2019届高三第一次模拟考试】某学校从编号依次为01,02,…,90的90个学生中用系统抽样(等间距抽样)的方法抽取一个样本,已知样本中相邻的两个组的编号分别为14,23,则该样本中来自第四组的学生的编号为( )A .32 B .33 C .41 D .42 【解析】因为相邻的两个组的编号分别为14,23,所以样本间隔为23149-=, 所以第一组的编号为1495-=,所以第四组的编号为53932+⨯=,故选A . 8.【河南省洛阳市2019届高三第三次统一考试】已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( ) A .100,10B .100,20C .200,10D .200,20【解析】由题得样本容量为(350020004500)2%100002%200++⨯=⨯=,抽取的高中生人数为20002%40⨯=人,则近视人数为400.520⨯=人,故选D .9.【西藏拉萨中学2019届高三第六次月考】某次知识竞赛中,四个参赛小队的初始积分都是10分,在答题过程中,各小队每答对1题加0.5分,若答题过程中四个小队答对的题数分别是3道,7道,7道,3道,则四个小队积分的方差为( ) A .0.5B .0.75C .1D .1.25【解析】四个小队积分分别为11.5,13.5,13.5,11.5,平均数为11.513.513.511.512.54+++=,故四个小队积分的方差为221[(11.512.5)2(13.512.5)2]14⨯-⨯+-⨯=,故选C . 10.【陕西省2019届高三第三次联考】口袋内装有一些大小相同的红球、白球和黑球,从中摸出1个球,摸出红球的概率是0.38,摸出白球的概率是0.32,那么摸出黑球的概率是( ) A .0.42B .0.28C .0.3D .0.7【解析】在口袋中摸球,摸到红球、摸到黑球、摸到白球这三个事件是互斥的,因为摸出红球的概率是0.38,摸出白球的概率是0.32,且摸出黑球是摸出红球或摸出白球的对立事件,所以摸出黑球的概率是10.380.320.3--=.故选C .11.【河南省郑州市2019届高三第三次质量检测】某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12 B .14 C .16 D .18【解析】因为中位数为12,所以4x y +=,数据的平均数为1(223420191910x y ⨯+++++++++2021)11.4+=,要使该总体的标准差最小,即方差最小,所以22(1011.4)(1011.4)x y +-++-=2222.8( 1.4)( 1.4)2()0.722x y x y +--+-≥=,当且仅当 1.4 1.4x y -=-,即2x y ==时取等号,此时总体标准差最小,4212x y +=,故选A . 12.【江西省新八校2019届高三第二次联考】某学校高一年级1802人,高二年级1600人,高三年级1499人,先采用分层抽样的方法从中抽取98名学生参加全国中学生禁毒知识竞赛,则在高一、高二、高三三个年级中抽取的人数分别为( ) A .35,33,30B .36,32,30C .36,33,29D .35,32,31【解析】先将每个年级的人数凑整,得高一:1800人,高二:1600人,高三:1500人,则三个年级的总人数所占比例分别为1849,1649,1549, 因此,各年级抽取人数分别为18983649⨯=,16983249⨯=,15983049⨯=,故选B . 13.【广东省汕头市2019届高三第二次模拟考试(B 卷)】在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是( )A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分【解析】由频率分布直方图可得,成绩在[70,80]的频率最高,因此考生人数最多,故A 正确;由频率分布直方图可得,成绩在[40,60)的频率为0.25,因此,不及格的人数为40000.251000⨯=,故B 正确;由频率分布直方图可得:平均分等于450.1550.15650.2750.3850.15⨯+⨯+⨯+⨯+⨯+950.170.5⨯=,故C 正确;因为成绩在[40,70)的频率为0.45,由[70,80]的频率为0.3,所以中位数为0.05701071.670.3+⨯≈,故D 错误.故选D . 14.【福建省泉州市2019届高三第二次(5月)质检】已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =<B .270,75x s =>C .270,75x s ><D .270,75x s ><【解析】由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+, 22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<,所以275s <.故选A .15.【2019年高考全国Ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++.【解析】(1)由调查数据,男顾客中对该商场服务满意的比率为400.850=, 因此男顾客对该商场服务满意的概率的估计值为0.8. 女顾客中对该商场服务满意的比率为300.650=, 因此女顾客对该商场服务满意的概率的估计值为0.6.(2)由题可得22100(40203010) 4.76250507030K ⨯⨯-⨯=≈⨯⨯⨯.由于4.762 3.841>,故有95%的把握认为男、女顾客对该商场服务的评价有差异.16.【2019年高考全国Ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例; (2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.018.602≈.【解析】(1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为1470.21100+=. 产值负增长的企业频率为20.02100=. 用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%. (2)1(0.1020.10240.30530.50140.707)0.30100y =-⨯+⨯+⨯+⨯+⨯=, ()52211100i i i s n y y ==-∑222221(0.40)2(0.20)240530.20140.407100⎡⎤=-⨯+-⨯+⨯+⨯+⨯⎣⎦ =0.0296,0.020.17s ==≈,所以,这类企业产值增长率的平均数与标准差的估计值分别为30%,17%.17.【2019年高考全国Ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C 为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P (C )的估计值为0.70. (1)求乙离子残留百分比直方图中a ,b 的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表). 【解析】(1)由已知得0.700.200.15a =++,故0.35a =.10.050.150.700.10b =---=.(2)甲离子残留百分比的平均值的估计值为20.1530.2040.3050.2060.1070.05 4.05⨯+⨯+⨯+⨯+⨯+⨯=.乙离子残留百分比的平均值的估计值为30.0540.1050.1560.3570.2080.15 6.00⨯+⨯+⨯+⨯+⨯+⨯=.18.【2019年高考天津卷文数】2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为,,,,,A B C D E F.享受情况如下表,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M发生的概率.【答案】(1)应从老、中、青员工中分别抽取6人,9人,10人;(2)(i)见解析,(ii)11 15.【分析】本题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识,考查运用概率知识解决简单实际问题的能力.【解析】(1)由已知,老、中、青员工人数之比为6 : 9 : 10,由于采用分层抽样的方法从中抽取25位员工,因此应从老、中、青员工中分别抽取6人,9人,10人.(2)(i)从已知的6人中随机抽取2人的所有可能结果为{, },{, },{, },{, },{, },{, },A B A C A D A E A F B C{, },{, },{, },{, {,}},,B D B E B FCD C E{,},C F {,},{,},{,}D E D F E F,共15种.(ii)由表格知,符合题意的所有可能结果为{, },{, },{, },{, },{, },{, },{, {,},{,},{,},{,},}A B A D A E A F B D B CE BF E C F D F E F,共11种.所以,事件M发生的概率11 ()15P M .19.【北京市清华大学附属中学2019届高三第三次模拟考试】手机厂商推出一款6寸大屏手机,现对500名该手机使用者(200名女性、300名男性)进行调查,对手机进行评分,评分的频数分布表如下:(1)完成下列频率分布直方图,并比较女性用户和男性用户评分的波动大小(不计算具体值,给出结论即可);(2)把评分不低于70分的用户称为“评分良好用户”,能否有90%的把握认为“是否是评分良好用户”与性别有关?参考公式及数据:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【解析】(1)女性用户和男性用户的频率分布直方图分别如下图所示:女性用户男性用户由图可得女性用户的波动小,男性用户的波动大.(2)由题可得22⨯列联表如下:则22500(14012018060)1255.208 2.70620030032018024K⨯⨯-⨯=≈>⨯⨯⨯=,所以有90%的把握认为“是否是评分良好用户”与性别有关.20.【2019年甘肃省兰州市高考数学一诊】“一本书,一碗面,一条河,一座桥”曾是兰州的城市名片,而现在“兰州马拉松”又成为了兰州的另一张名片,随着全民运动健康意识的提高,马拉松运动不仅在兰州,而且在全国各大城市逐渐兴起,参与马拉松训练与比赛的人口逐年增加.为此,某市对人们参加马拉松运动的情况进行了统计调查.其中一项调查是调查人员从参与马拉松运动的人中随机抽取200人,对其每周参与马拉松长跑训练的天数进行统计,得到以下统计表:若某人平均每周进行长跑训练天数不少于5天,则称其为“热烈参与者”,否则称为“非热烈参与者”.(1)经调查,该市约有2万人参与马拉松运动,试估计其中“热烈参与者”的人数;(2)根据上表的数据,填写下列22⨯列联表,并通过计算判断是否能在犯错误的概率不超过0.01的前提下认为“是否热烈参与马拉松”与性别有关?参考公式及数据:22()()()()()n ad bcKa b c d a c b d-=++++,其中n a b c d=+++.【解析】(1)以200人中“热烈参与者”的频率作为概率,可得该市“热烈参与者”的人数约为40 200004000200⨯=.(2)由题可得22⨯列联表如下:则22200(35551055)1757.292 6.635401601406024K⨯⨯-⨯==≈>⨯⨯⨯,所以能在犯错误的概率不超过0.01的前提下认为“是否热烈参与马拉松”与性别有关.21.【四川省成都七中2019届高三5月高考模拟测试】某学校为担任班主任的教师办理手机语音月卡套餐,为了解通话时长,采用随机抽样的方法,得到该校100位班主任每人的月平均通话时长T(单位:分钟)的数据,其频率分布直方图如图所示,将频率视为概率.(1)求图中m的值;(2)估计该校担任班主任的教师月平均通话时长的中位数;(3)在[450,500),[500,550]这两组中采用分层抽样的方法抽取6人,再从这6人中随机抽取2人,求抽取的2人恰在同一组的概率.【解析】(1)依题意,根据频率分布直方图的性质,可得:50(0.00400.00500.00660.00160.0008)1m⨯+++++=,解得0.0020m=.(2)设该校担任班主任的教师月平均通话时长的中位数为t.因为前2组的频率之和为(0.00200.0040)500.30.5+⨯=<,前3组的频率之和为(0.00200.00400.0050)500.550.5++⨯=>,所以350400t <<,由0.30.0050(350)0.5t +⨯-=,得390t =.所以该校担任班主任的教师月平均通话时长的中位数为390分钟.(3)由题意,可得在[450,500)内抽取0.0016640.00160.0008⨯=+人,分别记为a b c d ,,,, 在[500,550]内抽取2人,记为,e f ,则6人中抽取2人的取法有:{,}a b ,{,}a c ,{,}a d ,{,}a e ,{,}a f ,{,}b c ,{,}b d ,{,}b e ,{,}b f ,{,}c d ,{,}c e ,{,}c f ,{,}d e ,{,}d f ,{,}e f ,共15种等可能的取法.其中抽取的2人恰在同一组的有{,}a b ,{,}a c ,{,}a d ,{,}b c ,{,}b d ,{,}c d ,{,}e f ,共7种取法,所以从这6人中随机抽取的2人恰在同一组的概率715P =. 22.【西南名校联盟重庆市第八中学2019届高三5月高考适应性月考(六)】某种产品的质量按照其质量指标值M 进行等级划分,具体如下表: 质量指标值M80M < 80110M ≤< 110M ≥ 等级 三等品 二等品 一等品现从某企业生产的这种产品中随机抽取了100件作为样本,对其质量指标值M 进行统计分析,得到如图所示的频率分布直方图.(1)记A 表示事件“一件这种产品为二等品或一等品”,试估计事件A 的概率;(2)已知该企业的这种产品每件一等品、二等品、三等品的利润分别为10元、6元、2元,试估计该企业销售10000件该产品的利润;(3)根据该产品质量指标值M 的频率分布直方图,求质量指标值M 的中位数的估计值(精确到0.01).【解析】(1)记B 表示事件“一件这种产品为二等品”,C 表示事件“一件这种产品为一等品”, 则事件B ,C 互斥,且由频率分布直方图估计()0.20.30.150.65P B =++=,()0.10.090.19P C =+=,又()()()()0.84P A P B C P B P C =+=+=,所以事件A 的概率估计为0.84.(2)由(1)知,任取一件产品是一等品、二等品的概率估计值分别为0.19,0.65,故任取一件产品是三等品的概率估计值为0.16,从而10000件产品估计有一等品、二等品、三等品分别为1900,6500,1600件,故利润估计为190010650061600261200⨯+⨯+⨯=元.(3)因为在产品质量指标值M的频率分布直方图中,质量指标值90M<的频率为0.060.10.20.360.5++=<,质量指标值100M<的频率为0.060.1020.30.660.5+++=>,故质量指标值M的中位数估计值为0.50.369094.670.03-+≈.。
统计与概率【小题训练】1.(2018全国卷Ⅰ,T3)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2018全国卷Ⅱ,T5)从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为 A .0.6 B .0.5C .0.4D .0.33.(2018全国卷Ⅲ,T5)某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为 A .0.3B .0.4C .0.6D .0.74.(2017新课标Ⅰ,T2)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg)分别为1x ,2x ,…,n x ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是A .1x ,2x ,…,n x 的平均数B .1x ,2x ,…,n x 的标准差C .1x ,2x ,…,n x 的最大值D .1x ,2x ,…,n x 的中位数5.(2017新课标Ⅰ,T4)如图,正方形ABCD 内的图形来自中国古代的太极图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A.14B.8πC.12D.4π6.(2017新课标Ⅱ,T11)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C.310D.257.(2017新课标Ⅲ,T3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是A.月接待游客逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳8.(2016全国I卷,T3)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是A.13B.12C.23D.569.(2016全国II卷,T8)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为A.710B.58C.38D.31010.(2016年全国III 卷,T4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是A .各月的平均最低气温都在0℃以上B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D .平均最高气温高于20℃的月份有5个11.(2016全国III 卷,T5)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M ,I ,N 中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是 A .815 B .18 C .115 D .130 12.(2016年北京,T6)从甲、乙等5名学生中随机选出2人,则甲被选中的概率为A .15 B .25 C .825 D .92513.(2016年北京,T8)某学校运动会的立定跳远和30秒跳绳两个单项比赛分成预赛和决赛两个阶段.下表为10名学生的预赛成绩,其中有三个数据模糊.在这10名学生中,进入立定跳远决赛的有8人,同时进入立定跳远决赛和30秒跳绳决赛的有6人,则A .2号学生进入30秒跳绳决赛B .5号学生进入30秒跳绳决赛C .8号学生进入30秒跳绳决赛D .9号学生进入30秒跳绳决赛 14.(2015新课标1,T4)如果3个正整数可作为一个直角三角形三条边的边长,则称这3个数为一组勾股数,从1,2,3,4,5中任取3个不同的数,则这3个数构成一组勾股数的概率为 A .310 B .15 C .110 D .12015.(2015新课标2,T3)根据下面给出的2004年至2013年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论不正确的是A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关16.(2015北京,T4)某校老年,中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体情况,在抽取的样本中,青年教师有320人,则该样本的老年教师人数为A.90 B.100 C.180 D.300类别人数老年教师900中年教师1800青年教师1600合计430017.(2018全国卷Ⅲ,T14)某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.18、为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区户家庭,得到如下统计数据表:收入(万元)支出(万元)根据上表可得回归直线方程,据此估计,该社区一户收入为万元家庭年支出为()A.万元B.万元C.万元D.万元大题题型题型一:回归分析1、社会在对全日制高中的教学水平进行评价时,常常将被清华北大录取的学生人数作为衡量的标准之一.重庆市教委调研了某中学近五年(年-年)高考被清华北大录取的学生人数,制作了如下所示的表格(设年为第一年).年份(第年)人数(人)(1)试求人数关于年份的回归直线方程;(2)在满足(1)的前提之下,估计年该中学被清华北大录取的人数(精确到个位);(3)教委准备在这五年的数据中任意选取两年作进一步研究,求被选取的两年恰好不相邻的概率.参考公式:.题型二统计图1、某服装店对过去天其实体店和网店的销售量(单位:件)进行了统计,制成频率分布直方图如下:(1)若将上述频率视为概率,已知该服装店过去天的销售中,实体店和网店销售量都不低于件的概率为,求过去天的销售中,实体店和网店至少有一边销售量不低于件的天数;(2)若将上述频率视为概率,已知该服装店实体店每天的人工成本为元,门市成本为元,每售出一件利润为元,求该门市一天获利不低于元的概率;(3)根据销售量的频率分布直方图,求该服装店网店销售量中位数的估计值(精确到).2、某工厂有工人名,记岁以上(含岁)的为类工人,不足岁的为类工人,为调查该厂工人的个人文化素质状况,现用分层抽样的方法从两类工人中分别抽取了人、人进行测试.(1)求该工厂两类工人各有多少人?(2)经过测试,得到以下三个数据图表:图一:分以上两类工人成绩的茎叶图(茎、叶分别是十位和个位上的数字)①先填写频率分布表(表一)中的六个空格,然后将频率分布直方图(图二)补充完整;②该厂拟定从参加考试的分以上(含分)的类工人中随机抽取人参加高级技工培训班,求抽到的人分数都在分以上的概率.题型三独立性分析年全国两会,即中华人民共和国第十二届全国人民代表大会第四次会议和中国人民政治协商会议第十二届全国委员会第四次会议,分别于年月日和月日在北京开幕。
专题16 概率与统计(解答题)(文科专用)1.【2022年全国甲卷】甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d), P (K 2⩾k )0.100 0.050 0.010 k 2.7063.8416.6352.【2022年全国乙卷】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m 2)和材积量(单位:m 3),得到如下数据:并计算得∑x i 210i=1=0.038,∑y i 210i=1=1.6158,∑x i y i10i=1=0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数r =i n i=1i √∑(x i −x̅)2ni=1∑(y i−y ̅)2ni=1√1.896≈1.377.3.【2021年甲卷文科】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++4.【2021年乙卷文科】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为21s和22s.(1)求x,y,21s,22s;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x-≥认为有显著提高).5.【2020年新课标1卷文科】某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务6.【2019年新课标1卷文科】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.7.【2019年新课标2卷文科】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602.8.【2018年新课标1卷文科】某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)。
【答案】解: (Ⅰ) 由图知,三角形中共有15个格点,与周围格点的距离不超过1米的格点数都是1个的格点有2个,坐标分别为(4,0),(0,4). 与周围格点的距离不超过1米的格点数都是2个的格点有4个,坐标分别为(0,0), (1,3), (2,2),(3,1).与周围格点的距离不超过1米的格点数都是3个的格点有6个,坐标分别为(1,0), (2,0), (3,0),(0,1,) ,(0,2),(0,3,).与周围格点的距离不超过1米的格点数都是4个的格点有3个,坐标分别为(1,1), (1,2), (2,1).如下表所示:平均年收获量4615==u .(Ⅱ)在15株中,年收获量至少为48kg 的作物共有2+4=6个. 所以,15株中任选一个,它的年收获量至少为48k 的概率P=4.0156=. 15.(2013年高考江西卷(文))小波已游戏方式决定是去打球、唱歌还是去下棋.游戏规则为以O 为起点,再从A 1,A 2,A 3,A 4,A 5,A 6(如图)这6个点中任取两点分别为终点得到两个向量,记住这两个向量的数量积为X,若X>0就去打球,若X=0就去唱歌,若X<0就去下棋.(1) 写出数量积X 的所有可能取值 (2) 分别求小波去下棋的概率和不.去唱歌的概率 【答案】解:(1) x 的所有可能取值为-2 ,-1 ,0, 1.(2)数量积为-2的只有25OA OA ∙一种数量积为-1的有15OA OA ∙,1624263435,,,,OA OA OA OA OA OA OA OA OA OA ∙∙∙∙∙六种 数量积为0的有13143646,,,OA OA OA OA OA OA OA OA ∙∙∙∙四种 数量积为1的有12234556,,,OA OA OA OA OA OA OA OA ∙∙∙∙四种 故所有可能的情况共有15种. 所以小波去下棋的概率为1715p = 因为去唱歌的概率为2415p =,所以小波不去唱歌的概率2411111515p p =-=-= 16.(2013年高考北京卷(文))下图是某市3月1日至14日的空气质量指数趋势图,空气质量指数小于100表示空气质量优良,空气质量指数大于200表示空气重度污染,某人随机选择3月1日至3月13日中的某一天到达该市,并停留2天.(Ⅰ)求此人到达当日空气质量优良的概率;(Ⅱ)求此人在该市停留期间只有1天空气重度污染的概率;(Ⅲ)由图判断从哪天开始连续三天的空气质量指数方差最大?(结论不要求证明)【答案】解:(I)在3月1日至3月13日这13天中,1日.2日.3日.7日.12日.13日共6天的空气质量优良,所以此人到达当日空气质量优良的概率是613. (II)根据题意,事件“此人在该市停留期间只有1天空气重度污染”等价于“此人到达该市的日期是4日,或5日,或7日,或8日”.所以此人在该市停留期间只有1天空气质量重度污染的概率为413. (III)从3月5日开始连续三天的空气质量指数方差最大. 几何概型:1.【2012高考辽宁文11】在长为12cm 的线段AB 上任取一点C. 现作一矩形,邻边长分别等于线段AC,CB 的长,则该矩形面积大于20cm 2的概率为 :(A)16 (B) 13 (C) 23 (D) 45【答案】C【解析】设线段AC 的长为x cm ,则线段CB 的长为(12x -)cm,那么矩形的面积为(12)x x -cm 2,由(12)20x x ->,解得210x <<。
1.春节前夕,质检部门检查一箱装有2 500件包装食品的质量,抽查总量的2%,在这个问题中,下列说法正确的是( )A .总体是指这箱2 500件包装食品B .个体是一件包装食品C .样本是按2%抽取的50件包装食品D .样本容量是50 答案 D解析 总体、个体、样本的考查对象是同一事,不同的是考查的范围不同,在本题中,总体、个体是指食品的质量,而样本容量是样本中个体的包含个数.故答案为D.2.在可行域内任取一点,其规则如流程图所示,则能输出数对(x ,y )的概率是( )A.π8B.π4C.π6D.π2 答案 B解析 依题意可行域为正方形AOCD ,输出数对(x ,y )形成的图形为图中阴影部分,故所求概率为:P =14π⎝⎛⎭⎫22222·22=π4.3.已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( ) A .0.6 B .0.4 C .0.3 D .0.2 答案 C解析 ∵P (ξ<4)=0.8, ∴P (ξ>4)=0.2,由题意知图象的对称轴为直线x =2, P (ξ<0)=P (ξ>4)=0.2,∴P (0<ξ<4)=1-P (ξ<0)-P (ξ>4)=0.6. ∴P (0<ξ<2)=12P (0<ξ<4)=0.3.4.节日前夕,小李在家门前的树上挂了两串彩灯,这两串彩灯的第一次闪亮相互独立,且都在通电后的4秒内任一时刻等可能发生,然后每串彩灯以4秒为间隔闪亮,那么这两串彩灯同时通电后,它们第一次闪亮的时刻相差不超过2秒的概率是( ) A.14 B.12 C.34 D.78 答案 C 解析设在通电后的4秒钟内,甲串彩灯、乙串彩灯第一次亮的时刻为x 、y ,x 、y 相互独立,由题意可知⎩⎪⎨⎪⎧0≤x ≤4,0≤y ≤4,|x -y |≤2,如图所示.所以两串彩灯第一次亮的时间相差不超过2秒的概率为P (|x -y |≤2)=S 正方形-2S △ABC S 正方形=4×4-2×12×2×24×4=1216=34.5.为了从甲、乙两名运动员中选拔一人参加某次运动会跳水项目,对甲、乙两名运动员进行培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取6次,得到茎叶图如图所示.从平均成绩及发挥稳定性的角度考虑,你认为选派________(填甲或乙)运动员合适.答案 甲解析 根据茎叶图,可得x 甲=16×(78+79+81+84+93+95)=85,x 乙=16×(75+80+83+85+92+95)=85.s 2甲=16×[(78-85)2+(79-85)2+(81-85)2+(84-85)2+(93-85)2+(95-85)2]=1333, s 2乙=16×[(75-85)2+(80-85)2+(83-85)2+(85-85)2+(92-85)2+(95-85)2]=1393. 因为x 甲=x 乙,s 2甲<s 2乙,所以甲运动员的成绩比较稳定,选派甲运动员参赛比较合适.题型一 古典概型与几何概型例1 (1)(2015·陕西)设复数z =(x -1)+y i(x ,y ∈R ),若|z |≤1,则y ≥x 的概率为( ) A.34+12π B.14-12π C.12-1π D.12+1π答案 B解析 由|z |≤1可得(x -1)2+y 2≤1,表示以(1,0)为圆心,半径为1的圆及其内部,满足y ≥x 的部分为如图阴影所示,由几何概型概率公式可得所求概率为:P =14π×12-12×12π×12=π4-12π=14-12π.(2)有9张卡片分别写着数字1,2,3,4,5,6,7,8,9,甲、乙二人依次从中抽取一张卡片(不放回),试求: ①甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片的概率; ②甲、乙二人至少抽到一张写有奇数数字卡片的概率.解 ①甲、乙二人依次从9张卡片中抽取一张的可能结果有C 19·C 18,甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片的结果有C 15·C 14种,设“甲抽到写有奇数数字卡片,且乙抽到写有偶数数字卡片”的概率为P 1,则P 1=C 15·C 14C 19·C 18=2072=518.②方法一 甲、乙二人至少抽到一张写有奇数数字卡片的事件包含下面的三个事件:“甲抽到写有奇数数字的卡片,乙抽到写有偶数数字的卡片”有C 15·C 14种; “甲抽到写有偶数数字卡片,且乙抽到写有奇数数字卡片”有C 14·C 15种; “甲、乙二人均抽到写有奇数数字卡片”有C 15·C 14种. 设甲、乙二人至少抽到一张写有奇数数字卡片的概率为P 2,则P 2=C 15·C 14+C 14·C 15+C 15·C 14C 19C 18=6072=56. 方法二 甲、乙二人至少抽到一张奇数数字卡片的对立事件为两人均抽到写有偶数数字卡片,设为P 2,则P 2=1-P 2=1-C 14C 13C 19C 18=56.思维升华 几何概型与古典概型的本质区别在于试验结果的无限性,几何概型经常涉及的几何度量有长度、面积、体积等,解决几何概型的关键是找准几何测度;古典概型是命题的重点,对于较复杂的基本事件空间,列举时要按照一定的规律进行,做到不重不漏.(1)为了丰富学生的课余生活,促进校园文化建设,我校高二年级通过预赛选出了6个班(含甲、乙)进行经典美文诵读比赛决赛.决赛通过随机抽签方式决定出场顺序.求: ①甲、乙两班恰好在前两位出场的概率;②决赛中甲、乙两班之间的班级数记为X ,求X 的分布列和均值. 解 ①设“甲、乙两班恰好在前两位出场”为事件A ,则P (A )=A 22×A 44A 66=115.所以甲、乙两班恰好在前两位出场的概率为115.②随机变量X 的可能取值为0,1,2,3,4.P (X =0)=A 22×A 55A 66=13,P (X =1)=4×A 22×A 44A 66=415,P (X =2)=A 24×A 22×A 33A 66=15, P (X =3)=A 34×A 22×A 22A 66=215,P (X =4)=A 44×A 22A 66=115. 随机变量X 的分布列为X 0 1 2 3 4 P1341515215115因此,E (X )=0×13+1×415+2×15+3×215+4×115=43.(2)已知关于x 的二次函数f (x )=ax 2-4bx +1.设点(a ,b )是区域⎩⎪⎨⎪⎧x +y -8≤0,x >0,y >0内的一点,求函数y =f (x )在区间[1,+∞)上是增函数的概率.解 ∵函数f (x )=ax 2-4bx +1的图象的对称轴为直线x =2ba ,要使f (x )=ax 2-4bx +1在区间[1,+∞)上为增函数, 当且仅当a >0且2ba≤1,即2b ≤a .依条件可知事件的全部结果所构成的区域为 ⎩⎨⎧⎭⎬⎫(a ,b )⎪⎪⎪⎩⎪⎨⎪⎧ a +b -8≤0,a >0,b >0,构成所求事件的区域为三角形部分. 所求概率区间应满足2b ≤a .由⎩⎪⎨⎪⎧a +b -8=0,b =a 2,得交点坐标为(163,83),故所求事件的概率为P =12×8×8312×8×8=13.题型二 求离散型随机变量的均值与方差例2 (2015·四川)某市A ,B 两所中学的学生组队参加辩论赛,A 中学推荐了3名男生、2名女生,B 中学推荐了3名男生、4名女生,两校所推荐的学生一起参加集训.由于集训后队员水平相当,从参加集训的男生中随机抽取3人、女生中随机抽取3人组成代表队. (1)求A 中学至少有1名学生入选代表队的概率;(2)某场比赛前,从代表队的6名队员中随机抽取4人参赛,设X 表示参赛的男生人数,求X 的分布列和均值.解 (1)由题意,参加集训的男、女生各有6名,参赛学生全从B 中学抽取(等价于A 中学没有学生入选代表队)的概率为C 33C 34C 36C 36=1100,因此,A 中学至少有1名学生入选代表队的概率为 1-1100=99100. (2)根据题意,X 的可能取值为1,2,3,P (X =1)=C 13C 33C 46=15,P (X =2)=C 23C 23C 46=35,P (X =3)=C 33C 13C 46=15,所以X 的分布列为X 1 2 3 P153515因此,X 的均值为E (X )=1×P (X =1)+2×P (X =2)+3×P (X =3) =1×15+2×35+3×15=2.思维升华 离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如二点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率间的对应.受轿车在保修期内维修费等因素的影响,企业生产每辆轿车的利润与该轿车首次出现故障的时间有关.某轿车制造厂生产甲、乙两种品牌轿车,保修期均为2年.现从该厂已售出的两种品牌轿车中各随机抽取50辆,统计数据如下:品牌甲 乙 首次出现故障时间x (年)0<x ≤1 1<x ≤2 x >2 0<x ≤2 x >2 轿车数量(辆) 2 3 45 5 45 每辆利润(万元)1231.82.9将频率视为概率,解答下列问题:(1)从该厂生产的甲品牌轿车中随机抽取一辆,求其首次出现故障发生在保修期内的概率;(2)若该厂生产的轿车均能售出,记生产一辆甲品牌轿车的利润为X 1,生产一辆乙品牌轿车的利润为X 2,分别求X 1,X 2的分布列;(3)该厂预计今后这两种品牌轿车销量相当,由于资金限制,只能生产其中一种品牌的轿车.若从经济效益的角度考虑,你认为应生产哪种品牌的轿车?说明理由.解 (1)设“甲品牌轿车首次出现故障发生在保修期内”为事件A ,则P (A )=2+350=110.(2)依题意得,X 1的分布列为X 1 1 2 3 P125350910X 2的分布列为X 2 1.8 2.9 P110910(3)由(2)得E (X 1)=1×125+2×350+3×910=14350=2.86(万元), E (X 2)=1.8×110+2.9×910=2.79(万元).因为E (X 1)>E (X 2),所以应生产甲品牌轿车. 题型三 概率与统计的综合应用例3 经销商经销某种农产品,在一个销售季度内,每售出1 t 该产品获利润500元,未售出的产品,每1 t 亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t 该农产品.以X (单位: t,100≤X ≤150)表示下一个销售季度内的市场需求量,T (单位:元)表示下一个销售季度内经销该农产品的利润.(1)将T 表示为X 的函数;(2)根据直方图估计利润T 不少于57 000元的概率;(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X ∈[100,110),则取X =105,且X =105的概率等于需求量落入[100,110)的频率),求T 的均值. 解 (1)当X ∈[100,130)时,T =500X -300(130-X )=800X -39 000. 当X ∈[130,150]时,T =500×130=65 000.所以T =⎩⎪⎨⎪⎧800X -39 000,100≤X <130,65 000,130≤X ≤150.(2)由(1)知利润T 不少于57 000元当且仅当120≤X ≤150.由直方图知需求量X ∈[120,150]的频率为0.7,所以下一个销售季度内的利润T 不少于57 000元的概率的估计值为0.7.(3)依题意可得T 的分布列为T 45 000 53 000 61 000 65 000 P0.10.20.30.4所以E (T )=45 000×0.1+思维升华 概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.以下茎叶图记录了甲、乙两组各四名同学的植树棵数.乙组记录中有一个数据模糊,无法确认,在图中以X 表示.甲组 乙组 9 9 0 X 8 9 111(1)如果X =8,求乙组同学植树棵数的平均数和方差;(2)如果X =9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y 的分布列和均值. (注:方差s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解 (1)当X =8时,由茎叶图可知,乙组同学的植树棵数是8,8,9,10,所以平均数x =8+8+9+104=354; 方差s 2=14[(8-354)2+(8-354)2+(9-354)2+(10-354)2]=1116. (2)当X =9时,由茎叶图可知,甲组同学的植树棵数是9,9,11,11;乙组同学的植树棵数是9,8,9,10.分别从甲、乙两组中随机选取一名同学,共有4×4=16(种)可能的结果,这两名同学植树总棵数Y 的可能取值为17,18,19,20,21.事件“Y =17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”,所以该事件有2种可能的结果,因此P (Y =17)=216=18.同理可得P (Y =18)=14,P (Y =19)=14,P (Y =20)=14,P (Y =21)=18.所以随机变量Y 的分布列为Y 17 18 19 20 21 P1814141418E (Y )=17×18+18×14+19×14+20×14+21×18=19.题型四 概率与统计案例的综合应用例4 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料是否可以认为“体育迷”与性别有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X .若每次抽取的结果是相互独立的,求X 的分布列、均值E (X )和方差D (X ). 附:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),解 (1)由所给的频率分布直方图知,“体育迷”人数为100×(10×0.020+10×0.005)=25, “非体育迷”人数为75,从而2×2列联表如下:将2×2列联表的数据代入公式计算: χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )=100×(30×10-45×15)245×55×75×25=10033≈3.030. 因为2.706<3.030<3.841,所以有90%的把握认为“体育迷”与性别有关.(2)由频率分布直方图知,抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意,X ~B ⎝⎛⎭⎫3,14,从而X 的分布列为E (X )=np =3×14=34,D (X )=np (1-p )=3×14×34=916.思维升华 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.为了解大学生观看湖南卫视综艺节目“快乐大本营”是否与性别有关,一所大学心理学教师从该校学生中随机抽取了50人进行问卷调查,得到了如下的列联表:喜欢看“快乐大本营”不喜欢看“快乐大本营”合计 女生 5 男生 10 合计50若该教师采用分层抽样的方法从50份问卷调查中继续抽查了10份进行重点分析,知道其中喜欢看“快乐大本营”的有6人.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关?说明你的理由;(3)已知喜欢看“快乐大本营”的10位男生中,A 1,A 2,A 3,A 4,A 5还喜欢看新闻,B 1,B 2,B 3还喜欢看动画片,C 1,C 2还喜欢看韩剧,现再从喜欢看新闻、动画片和韩剧的男生中各选出1名进行其他方面的调查,求B 1和C 1不全被选中的概率. 下面的临界值表供参考:P (χ2≥k 0)0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 02.0722.7063.8415.0246.6357.87910.828(参考公式:χ2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d )解 (1)由分层抽样知识知,喜欢看“快乐大本营”的同学有50×610=30人,故不喜欢看“快乐大本营”的同学有50-30=20人,于是可将列联表补充如下:喜欢看“快乐大本营”不喜欢看“快乐大本营”合计 女生 20 5 25 男生 10 15 25 合计302050(2)∵χ2=50×(20×15-10×5)230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜欢看“快乐大本营”节目与性别有关.(3)从喜欢看“快乐大本营”的10位男生中选出喜欢看韩剧、喜欢看新闻、喜欢看动画片的各1名,其一切可能的结果组成的基本事件共有N =5×3×2=30个,用M 表示“B 1,C 1不全被选中”这一事件,则其对立事件M 表示“B 1,C 1全被选中”这一事件,由于M 由(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1),(A 4,B 1,C 1),(A 5,B 1,C 1)5个基本事件组成,所以P (M )=530=16.由对立事件的概率公式得 P (M )=1-P (M )=1-16=56.(时间:80分钟)1.某车间共有12名工人,随机抽取6名,他们某日加工零件个数的茎叶图如图所示,其中茎为十位数,叶为个位数.1 7 92 0 1 5 3(1)根据茎叶图计算样本均值;(2)日加工零件个数大于样本均值的工人为优秀工人.根据茎叶图推断该车间12名工人中有几名优秀工人?(3)从该车间12名工人中,任取2人,求恰有1名优秀工人的概率. 解 (1)样本平均值为17+19+20+21+25+306=1326=22.(2)由(1)知样本中优秀工人占的比例为26=13,故推断该车间12名工人中有12×13=4名优秀工人.(3)设事件A :“从该车间12名工人中,任取2人,恰有1名优秀工人”,则P (A )=C 14C 18C 212=1633.2.在10件产品中,有3件一等品,4件二等品,3件三等品.从这10件产品中任取3件,求: (1)取出的3件产品中一等品件数X 的分布列和均值; (2)取出的3件产品中一等品件数多于二等品件数的概率.解 (1)由于从10件产品中任取3件的结果数为C 310,从10件产品中任取3件,其中恰有k 件一等品的结果数为C k 3C 3-k7(k =0,1,2,3),那么从10件产品中任取3件,其中恰有k 件一等品的概率为P (X =k )=C k 3C 3-k7C 310,k =0,1,2,3.所以随机变量X 的分布列是X 的均值E (X )=0×724+1×2140+2×740+3×1120=910.(2)设“取出的3件产品中一等品件数多于二等品件数”为事件A ,“恰好取出1件一等品和2件三等品”为事件A 1,“恰好取出2件一等品”为事件A 2,“恰好取出3件一等品”为事件A 3,由于事件A 1,A 2,A 3彼此互斥,且A =A 1∪A 2∪A 3,而P (A 1)=C 13C 23C 310=340.P (A 2)=P (X =2)=740.P (A 3)=P (X =3)=1120,所以取出的3件产品中一等品件数多于二等品件数的概率为P (A )=P (A 1)+P (A 2)+P (A 3)=340+740+1120=31120.3.一个均匀的正四面体的四个面上分别涂有1,2,3,4四个数字,现随机投掷两次,正四面体面朝下的数字分别为b ,c .(1)z =(b -3)2+(c -3)2,求z =4的概率;(2)若方程x 2-bx -c =0至少有一根x ∈{1,2,3,4},就称该方程为“漂亮方程”,求方程为“漂亮方程”的概率.解 (1)因为是投掷两次,因此基本事件(b ,c ):(1,1),(1,2),(1,3),(1,4),(2,1),(2,2),(2,3),(2,4),(3,1),(3,2),(3,3),(3,4),(4,1),(4,2),(4,3),(4,4)共16个. 当z =4时,(b ,c )的所有取值为(1,3),(3,1), 所以P (z =4)=216=18.(2)①若方程一根为x =1,则1-b -c =0, 即b +c =1,不成立.②若方程一根为x =2,则4-2b -c =0,即2b +c =4,所以⎩⎪⎨⎪⎧ b =1,c =2.③若方程一根为x =3,则9-3b -c =0,即3b +c =9,所以⎩⎪⎨⎪⎧b =2,c =3.④若方程一根为x =4,则16-4b -c =0,即4b +c =16,所以⎩⎪⎨⎪⎧b =3,c =4.由①②③④知(b ,c )的所有可能取值为(1,2),(2,3),(3,4),所以方程为“漂亮方程”的概率为P =316.4.某食品厂为了检查一条自动包装流水线的生产情况,随机抽取该流水线上40件产品作为样本称出它们的重量(单位:克),重量的分组区间为(490,495],(495,500],…,(510,515],由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量;(2)在上述抽取的40件产品中任取2件,设Y 为重量超过505克的产品数量,求Y 的分布列; (3)从该流水线上任取2件产品,设X 为重量超过505克的产品数量,求X 的分布列.解 (1)根据频率分布直方图可知,重量超过505克的产品数量为[(0.01+0.05)×5]×40=12(件). (2)依题意,Y 的可能取值为0,1,2. P (Y =0)=C 228C 240=63130,P (Y =1)=C 128C 112C 240=2865,P (Y =2)=C 212C 240=11130,∴Y 的分布列为Y 0 1 2 P63130286511130(3)利用样本估计总体,该流水线上产品重量超过505克的概率为0.3, 令X 为任取的2件产品中重量超过505克的产品数量, 则X ~B (2,0.3), ∴X 的分布列为X 0 1 2 P0.490.420.095.如图所示,一圆形靶分成A ,B ,C 三部分,其面积之比为1∶1∶2.某同学向该靶投掷3枚飞镖,每次1枚.假设他每次投掷必定会中靶,且投中靶内各点是随机的.(1)求该同学在一次投掷中投中A 区域的概率;(2)设X 表示该同学在3次投掷中投中A 区域的次数,求X 的分布列;(3)若该同学投中A ,B ,C 三个区域分别可得3分,2分,1分,求他投掷3次恰好得4分的概率. 解 (1)设该同学在一次投掷中投中A 区域的概率为P (A ),依题意得P (A )=14.(2)依题意知,X ~B (3,14),从而X 的分布列为(3)设B i 表示事件“第i 次击中目标时,击中B 区域”,C i 表示事件“第i 次击中目标时,击中C 区域”,i =1,2,3.依题意知P =P (B 1C 2C 3)+P (C 1B 2C 3)+P (C 1C 2B 3)=3×14×12×12=316.6.一次考试共有12道选择题,每道选择题都有4个选项,其中有且只有一个是正确的.评分标准规定:“每题只选一个选项,答对得5分,不答或答错得零分”.某考生已确定有8道题的答案是正确的,其余题中:有两道题都可判断两个选项是错误的,有一道题可以判断一个选项是错误的,还有一道题因不理解题意只好乱猜.请求出该考生: (1)得60分的概率;(2)所得分数X 的分布列和均值.解 (1)设“可判断两个选项是错误的”两道题之一选对为事件A ,“有一道题可以判断一个选项是错误的”选对为事件B ,“有一道题不理解题意”选对为事件C , ∴P (A )=12,P (B )=13,P (C )=14,∴得60分的概率为P =12×12×13×14=148.(2)X 可能的取值为40,45,50,55,60. P (X =40)=12×12×23×34=18;P (X =45)=C 12×12×12×23×34+12×12×13×34+12×12×23×14=1748; P (X =50)=12×12×23×34+C 12×12×12×13×34+C 12×12×12×23×14+12×12×13×14=1748; P (X =55)=C 12×12×12×13×14+12×12×23×14+12×12×13×34=748; P (X =60)=12×12×13×14=148.X 的分布列为E (X )=40×18+45×1748+50×1748+55×748+60×148=57512.。
概率统计大题综合知识点总结1.数字样本特征(1)众数:在一组数据中出现次数最多的数(2)中位数:将一组数据按从小到大(或从大到小)的顺序排列,如果为奇数个,中位数为中间数;若为偶数个,中位数为中间两个数的平均数(3)平均数:x =x 1+x 2+⋯⋯+x nn ,反映样本的平均水平(4)方差:s 2=(x 1−x )2+(x 2−x )2+⋯⋯(x n −x )2n反映样本的波动程度,稳定程度和离散程度;s 2越大,样本波动越大,越不稳定;s 2越小,样本波动越小,越稳定;(5)标准差:σ=s 2,标准差等于方差的算术平方根,数学意义和方差一样(6)极差:等于样本的最大值−最小值2.求随机变量X 的分布列的步骤:(1)理解X 的意义,写出X 可能取得全部值;(2)求X 取每个值的概率;(3)写出X 的分布列;(4)根据分布列的性质对结果进行检验.还可判断随机变量满足常见分布列:两点分布,二项分布,超几何分布,正态分布.3.求随机变量的期望和方差的基本方法:(1)已知随机变量的分布列,直接利用期望和方差公式直接求解;(2)已知随机变量X 的期望、方差,求aX +b a ,b ∈R 的期望与方差,利用期望和方差的性质E aX +b =aE X +b ,D aX +b =a 2D X 进行计算;(3)若能分析出所给的随机变量服从常用的分布(如:两点分布、二项分布等),可直接利用常用分布列的期望和方差公式进行计算,若ξ~B (n ,p ),则Eξ=np ,Dξ=np (1-p ).4.求解概率最大问题的关键是能够通过P ξ=k ≥P ξ=k +1P ξ=k ≥Pξ=k -1构造出不等关系,结合组合数公式求解结果5.线性回归分析解题方法:(1)计算x ,y,ni =1x i 2 ,ni =1x i y i 的值;(2)计算回归系数a ,b ;(3)写出回归直线方程y =b x +a.线性回归直线方程为:y =b x +a ,b=ni =1x i −x y i −yni =1x i −x2=ni =1x i y i −nx yni =1x i 2−nx2,a =y −b x其中x ,y为样本中心,回归直线必过该点(4)线性相关系数(衡量两个变量之间线性相关关系的强弱)r=ni=1x i−xy i−yni=1x i−x2ni=1y i−y2=ni=1x i y i−nx yni=1x i2−nx 2ni=1y i2−ny 2r>0,正相关;r<0,负相关r ≤1,且r 越接近于1,线性相关性越强;r 越接近于0,线性相关性越弱,几乎不存在线性相关性6.独立性检验解题方法:(1)依题意完成列联表;(2)用公式求解;(3)对比观测值即可得到所求结论的可能性独立性检验计算公式:K2=n ad-bc2a+bc+da+cb+d模拟训练一、解答题1.(2023·福建三明·统考三模)在二十大报告中,体育、健康等关键词被多次提及,促进群众体育和竞技体育全面发展,加快建设体育强国是全面建设社会主义现代化国家的一个重要目标.某校为丰富学生的课外活动,加强学生体质健康,拟举行羽毛球团体赛,赛制采取3局2胜制,每局都是单打模式,每队有5名队员,比赛中每个队员至多上场一次且是否上场是随机的,每局比赛结果互不影响.经过小组赛后,最终甲、乙两队进入最后的决赛,根据前期比赛的数据统计,甲队种子选手M对乙队每名队员的胜率均为34,甲队其余4名队员对乙队每名队员的胜率均为12.(注:比赛结果没有平局)(1)求甲队最终2:1获胜且种子选手M上场的概率;(2)已知甲队2:1获得最终胜利,求种子选手M上场的概率.2.(2023·湖北武汉·统考模拟预测)“英才计划”最早开始于2013年,由中国科协、教育部共同组织实施,到2022年已经培养了6000多名具有创新潜质的优秀中学生,为选拔培养对象,某高校在暑假期间从武汉市的中学里挑选优秀学生参加数学、物理、化学、信息技术学科夏令营活动.(1)若化学组的12名学员中恰有5人来自同一中学,从这12名学员中选取3人,ξ表示选取的人中来自该中学的人数,求ξ的分布列和数学期望;(2)在夏令营开幕式的晚会上,物理组举行了一次学科知识竞答活动.规则如下:两人一组,每一轮竞答中,每人分别答两题,若小组答对题数不小于3,则取得本轮胜利,假设每轮答题结果互不影响.已知甲、乙两位同学组成一组,甲、乙答对每道题的概率分别为p1,p2,且p1+p2=43,如果甲、乙两位同学想在此次答题活动中取得6轮胜利,那么理论上至少要参加多少轮竞赛?3.(2023·福建宁德·校考二模)某科研团以为了考察某种药物预防疾病的效果,进行动物实验,得到如下列联表.患病未患病总计服用药物1045末服用药物50总计30(1)请将上面的列联表补充完整.(2)认为“药物对预防疾病有效”犯错误的概率是多少?(3)为了进一步研究,现按分层抽样的方法从未患病动物中抽取10只,设其中未服用药物的动物数为ξ,求ξ的分布列与期望.下面的临界值表供参考:P(K2≥k)0.150.100.050.0250.0100.0050.001k 2.0722706 3.841 5.024 6.6357.87910.828(参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d)4.(2023·江苏常州·校考一模)设X,Y是一个二维离散型随机变量,它们的一切可能取的值为a i,b j,其中i,j∈N*,令p ij=P X=a i,Y=b j,称p ij i,j∈N*是二维离散型随机变量X,Y的联合分布列,与一维的情形相似,我们也习惯于把二维离散型随机变量的联合分布列写成下表形式;X,Yb1b2b3⋅⋅⋅a1p11p12p13⋅⋅⋅a2p21p22p23⋅⋅⋅a3p31p32p33⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅现有n n∈N*个球等可能的放入编号为1,2,3的三个盒子中,记落入第1号盒子中的球的个数为X,落入第2号盒子中的球的个数为Y.(1)当n=2时,求X,Y的联合分布列,并写成分布表的形式;(2)设p k=nm=0P X=k,Y=m,k∈N且k≤n,求nk=0kp k的值.(参考公式:若X~B n,p,则nk=0kC k np k1-pn-k=np)5.(2023·江苏南京·南京市第九中学校考模拟预测)某种疾病可分为A,B两种类型,为了解该疾病的类型与患者性别是否相关,在某地区随机抽取了若干名该疾病的患者进行调查,发现女性患者人数是男性患者的2倍,男性患A型疾病的人数占男性患者的56,女性患A型疾病的人数占女性患者的13.A型病B型病合计男女合计(1)填写2×2列联表,若本次调查得出“在犯错误的概率不超过0.005的前提下认为‘所患疾病的类型'与‘性别'有关”的结论,求被调查的男性患者至少有多少人?(2)某团队进行预防A型疾病的疫苗的研发试验,试验期间至多安排2个周期接种疫苗,每人每个周期接种3次,每次接种费用为m m>0元.该团队研发的疫苗每次接种后产生抗体的概率为p0<p<1,如果一个周期内至少2次出现抗体,则该周期结束后终止试验,否则进入第二个周期.若p=23,试验人数为1000人,试估计该试验用于接种疫苗的总费用.K2=n ad-bc2a+bc+da+cb+d,P K2≥k00.100.050.010.0050.001k0 2.706 3.841 6.6357.87910.8286.(2023·安徽蚌埠·统考三模)某校为了丰富学生课余生活,组建了足球社团.为了解学生喜欢足球是否与性别有关,随机抽取了男、女同学各100名进行调查,部分数据如表所示:喜欢足球不喜欢足球合计男生40女生30合计(1)根据所给数据完成上表,依据α=0.001的独立性检验,能否认为该校学生喜欢足球与性别有关?(2)社团指导老师从喜欢足球的学生中抽取了2名男生和1名女生示范点球射门.已知这两名男生进球的概率均为23,这名女生进球的概率为12,每人射门一次,假设各人射门相互独立,求3人进球总次数X的分布列和数学期望.附:χ2=n ad-bc2a+bc+da+cb+dα0.10.050.010.0050.001 xα 2.706 3.841 6.6357.87910.8287.(2023·海南海口·海南华侨中学校考模拟预测)在以视觉为主导的社交媒体时代,人们常借助具有美颜功能的产品对自我形象进行美化.移动端的美颜拍摄类APP 主要有两类:A 类是以自拍人像、美颜美妆为核心功能的APP ;B 类是图片编辑、精修等图片美化类APP .某机构为调查市民对上述A ,B 两类APP 的使用情况,随机调查了部分市民.已知被调查的市民中使用过A 类APP 的占60%,使用过B 类APP 的占50%,设个人对美颜拍摄类APP 类型的选择及各人的选择之间相互独立.(1)从样本人群中任选1人,求该人使用过美颜拍摄类APP 的概率;(2)从样本人群中任选5人,记X 为5人中使用过美颜拍摄类APP 的人数,设X 的数学期望为E X ,求P X =E X ;(3)在单独使用过A ,B 两类APP 的样本人群中,按类型分甲、乙两组,并在各组中随机抽取8人,甲组对A 类APP ,乙组对B 类APP 分别评分如下:甲组评分9486929687939082乙组评分8583859175908380记甲、乙两组评分的平均数分别为x 1 ,x 2 ,标准差分别为s 1,s 2,试判断哪组评价更合理.(设V i=s ix i (i =1,2),V i 越小,则认为对应组评价更合理.)参考数据:0.1925≈0.439,0.2325≈0.482.8.(2023·广东·统考模拟预测)某工厂车间有6台相同型号的机器,各台机器相互独立工作,工作时发生故障的概率都是14,且一台机器的故障由一个维修工处理.已知此厂共有甲、乙、丙3名维修工,现有两种配备方案,方案一:由甲、乙、丙三人维护,每人负责2台机器;方案二:由甲乙两人共同维护6台机器,丙负责其他工作.(1)对于方案一,设X 为甲维护的机器某一时刻发生故障的台数,求X 的分布列与数学期望E (X );(2)在两种方案下,分别计算某一时刻机器发生故障时不能得到及时维修的概率,并以此为依据来判断,哪种方案能使工厂的生产效率更高?9.(2023·福建福州·福建省福州第一中学校考模拟预测)相关统计数据显示,中国经常参与体育锻炼的人数比例为37.2%,城乡居民达到《国民体质测定标准》合格以上的人数比例达到90%以上.某健身连锁机构对其会员的年龄等级和一个月内到健身房健身次数进行了统计,制作成如下两个统计图.图1为会员年龄分布图(年龄为整数),其中将会员按年龄分为“年轻人”(20岁-39岁)和“非年轻人”(19岁及以下或40岁及以上)两类;图2为会员一个月内到健身房次数分布扇形图,其中将一个月内到健身房锻炼16次及以上的会员称为“健身达人”,15次及以下的会员称为“健身爱好者”,且已知在“健身达人”中有56是“年轻人”.(1)现从该健身连锁机构会员中随机抽取一个容量为100的样本,根据图表数据,补全2×2列联表,并依据小概率值α=0.05的独立性检验,是否可以认为“健身达人”与年龄有关?年轻人非年轻人合计健身达人健身爱好者合计(2)该健身机构在今年年底将针对全部的150名会员举办消费返利活动,预设有如下两种方案.方案1:按分层抽样从健身爱好者和健身达人中总共抽取20位“幸运之星”给予奖励.其中,健身爱好者和健身达人中的“幸运之星”每人分别奖励500元和800元.方案2:每位会员均可参加摸奖游戏,游戏规则如下:从一个装有3个白球、2个红球(球只有颜色不同)的箱子中,有放回地摸三次球,每次只能摸一个球.若摸到红球的总数为2,则可获得100元奖励金;若摸到红球的总数为3,则可获得300元奖励金;其他情况不给予奖励.如果每位健身爱好者均可参加1次摸奖游戏;每位健身达人均可参加3次摸奖游戏(每次摸奖的结果相互独立).以方案的奖励金的数学期望为依据,请你预测哪一种方案投资较少?并说明理由.附:χ2=n(ad-bc)2a+bc+da+cb+d.α0.100.050.0250.0100.0050.001χα 2.706 3.841 5.024 6.6357.87910.82810.(2023·云南昭通·校联考模拟预测)为了检测某种抗病毒疫苗的免疫效果,需要进行临床人体试验.研究人员将疫苗注射到200名志愿者体内,一段时间后测量志愿者的某项指标值,按0,20 ,20,40 ,40,60 ,60,80 ,80,100 分组,绘制频率分布直方图如图所示.试验发现志愿者体内产生抗体的共有160人,其中该项指标值不小于60的有110人.假设志愿者注射疫苗后是否产生抗体相互独立.(1)填写下面的2×2列联表,并根据列联表及小概率值α=0.05的独立性检验,判断能否认为注射疫苗后志愿者产生抗体与指标值不小于60有关.抗体指标值合计小于60不小于60有抗体没有抗体合计(2)为检验疫苗二次接种的免疫抗体性,对第一次注射疫苗后没有产生抗体的40名志愿者进行第二次注射疫苗,结果又有m 名志愿者产生抗体.(i )用频率估计概率,已知一名志愿者注射2次疫苗后产生抗体的概率p =0.9,求m 的值;(ⅱ)以(i )中的概率p 作为人体注射2次疫苗后产生抗体的概率,再进行另一组人体接种试验,记110名志愿者注射2次疫苗后产生抗体的数量为随机变量X ,求P X =k 最大时的k 的值.参考公式:χ2=n ad -bc 2a +b c +d a +c b +d(其中n =a +b +c +d 为样本容量).α0.500.400.250.150.1000.0500.025x α0.4550.7081.3232.0722.7063.8415.02411.(2023·湖南长沙·长沙市实验中学校考二模)首批全国文明典范城市将于2023年评选,每三年评选一次,2021年长沙市入选为全国文明典范城市试点城市,目前我市正全力争创首批全国文明典范城市,某学校号召师生利用周末从事创建志愿活动.高一(1)班一组有男生4人,女生2人,现随机选取2人作为志愿者参加活动,志愿活动共有交通协管员、创建宣传员、文明监督员三项可供选择,每名女生至多从中选择参加2项活动,且选择参加1项或2项的可能性均为12;每名男生至少从中选择参加2项活动,且选择参加2项或3项的可能性也均为12,每人每参加1项活动可获得综合评价10分,选择参加几项活动彼此互不影响,求:(1)在有女生参加活动的条件下,恰有一名女生的概率;(2)记随机选取的两人得分之和为X,求X的期望.12.(2023·江苏南京·南京市第一中学校考模拟预测)为了宣传航空科普知识,某校组织了航空知识竞赛活动.活动规定初赛需要从8道备选题中随机抽取4道题目进行作答.假设在8道备选题中,小明正确完成每道题的概率都是34且每道题正确完成与否互不影响,小宇能正确完成其中6道题且另外2道题不能完成.(1)求小明至少正确完成其中3道题的概率;(2)设随机变量X表示小宇正确完成题目的个数,求X的分布列及数学期望;(3)现规定至少完成其中3道题才能进入决赛,请你根据所学概率知识,判断小明和小宇两人中选择谁去参加市级比赛(活动规则不变)会更好,并说明理由.13.(2023·广东·校联考模拟预测)某商场在五一假期间开展了一项有奖闯关活动,并对每一关根据难度进行赋分,竞猜活动共五关,规定:上一关不通过则不进入下一关,本关第一次未通过有再挑战一次的机会,两次均未通过,则闯关失败,且各关能否通过相互独立,已知甲、乙、丙三人都参加了该项闯关活动.(1)若甲第一关通过的概率为23,第二关通过的概率为56,求甲可以进入第三关的概率;(2)已知该闯关活动累计得分服从正态分布,且满分为450分,现要根据得分给共2500名参加者中得分前400名发放奖励.①假设该闯关活动平均分数为171分,351分以上共有57人,已知甲的得分为270分,问甲能否获得奖励,请说明理由;②丙得知他的分数为430分,而乙告诉丙:“这次闯关活动平均分数为201分,351分以上共有57人”,请结合统计学知识帮助丙辨别乙所说信息的真伪.附:若随机变量Z∼Nμ,σ2,则Pμ-σ≤X≤μ+σ≈0.6827;Pμ-2σ≤X≤μ+2σ≈0.9545;Pμ-3σ≤X≤μ+3σ≈0.9973.14.(2023·广东韶关·统考模拟预测)研究表明,如果温差本大,人们不注意保暖,可能会导致自身受到风寒刺激,增加感冒患病概率,特别是对于几童以及年老体弱的人群,要多加防范某中学数学建模社团成员研究了昼夜温差大小与某小学学生患感冒就诊人数多少之间的关系,他们记录了某六天的温差,并到校医室查阅了这六天中每天学生新增感冒就诊的人数,得到数据如下:日期第一天第二天第三天第四天第五天第六天昼夜温差x (°C )47891412新增感就诊人数y (位)y 1y 2y 3y 4y 5y 6参考数据:6iy 2i=3463,6iy i -y 2=289(1)已知第一天新增感冒就的学生中有4位男生,从第一天多增的感冒就诊的学生中随机取2位,其中男生人数记为X ,若抽取的2人中至少有一位女生的概率为56,求随机变量X 的分布列和数学期望;(2)已知两个变量x 与y 之间的样本相关系数r =1617,请用最小二乘法求出y 关于x 的经验回归方程y =b x +a ,据此估计昼夜温差为15°C 时,该校新增感冒就诊的学生人数. 参考数据:r =n ix i -x y i -y n i =1x i -x 2 ⋅ni =1y i -y2,b =ni x i -x y i -yni =1x i -x 2 15.(2023·重庆·统考模拟预测)某地区由于农产品出现了滞销的情况,从而农民的收入减少,很多人开始在某直播平台销售农产品并取得了不错的销售量.有统计数据显示2022年该地利用网络直播形式销售农产品的销售主播年龄等级分布如图1所示,一周内使用直播销售的频率分布扇形图如图2所示,若将销售主播按照年龄分为“年轻人”(20岁~39岁)和“非年轻人”(19岁及以下或者40岁及以上)两类,将一周内使用的次数为6次或6次以上的称为“经常使用直播销售用户”,使用次数为5次或不足5次的称为“不常使用直播销售用户”,且“经常使用直播销售用户”中有34是“年轻人”.(1)现对该地相关居民进行“经常使用网络直播销售与年龄关系”的调查,采用随机抽样的方法,抽取一个容量为200的样本,请你根据图表中的数据,完成2×2列联表,依据小概率值α=0.05的χ2独立性检验,能否认为经常使用网络直播销售与年龄有关?使用直播销售情况与年龄列联表年轻人非年轻人合计经常使用直播销售用户不常使用直播销售用户合计(2)某投资公司在2023年年初准备将1000万元投资到“销售该地区农产品”的项目上,现有两种销售方案供选择:方案一:线下销售、根据市场调研,利用传统的线下销售,到年底可能获利30%,可能亏损15%,也可能不是不赚,且这三种情况发生的概率分别为35,15,15;方案二:线上直播销售,根据市场调研,利用线上直播销售,到年底可能获利50%,可能亏损30%,也可能不赔不赚,且这三种情况发生的概率分别为12,310,15.针对以上两种销售方案,请你从期望和方差的角度为投资公司选择一个合理的方案,并说明理由.参考数据:独立性检验临界值表α0.150.100.050.0250.0100.0050.001xα 2.072 2.706 3.841 5.024 6.6357.87910.828其中χ2=n ad-bc2a+bc+da+cb+d,n=a+b+c+d.16.(2023·河北衡水·衡水市第二中学校考三模)某医疗科研小组为研究某市市民患有疾病A 与是否具有生活习惯B 的关系,从该市市民中随机抽查了100人,得到如下数据:疾病A 生活习惯B 具有不具有患病2515未患病2040(1)依据α=0.01的独立性检验,能否认为该市市民患有疾病A 与是否具有生活习惯B 有关?(2)从该市市民中任选一人,M 表示事件“选到的人不具有生活习惯B ”,N 表示事件“选到的人患有疾病A ”,试利用该调查数据,给出P N M的估计值;(3)从该市市民中任选3人,记这3人中具有生活习惯B ,且末患有疾病A 的人数为X ,试利用该调查数据,给出X 的数学期望的估计值.附:χ2=n (ad -bc )2a +b c +d a +c b +d,其中n =a +b +c +d .α0.100.050.0100.001 x α2.7063.8416.63510.82817.(2023·江苏扬州·统考模拟预测)随着网络技术的迅速发展,各种购物群成为网络销售的新渠道.在凤梨销售旺季,某凤梨基地随机抽查了100个购物群的销售情况,各购物群销售凤梨的数量情况如下:凤梨数量(盒)100,200 200,300 300,400 400,500 500,600购物群数量(个)12m2032m(1)求实数m的值,并用组中值估计这100个购物群销售风梨总量的平均数(盒);(2)假设所有购物群销售凤梨的数量X服从正态分布Nμ,σ2,其中μ为(1)中的平均数,σ2=12100.若该凤梨基地参与销售的购物群约有1000个,销售风梨的数量在266,596(单位:盒)内的群为“一级群”,销售数量小于266盒的购物群为“二级群”,销售数量大于等于596盒的购物群为“优质群”.该凤梨基地对每个“优质群”奖励1000元,每个“一级群”奖励200元,“二级群”不奖励,则该风梨基地大约需要准备多少资金?(群的个数按四舍五入取整数)附:若X服从正态分布X~Nμ,σ2,则P(μ-σ<X<μ+σ)≈0.683,P(μ-2σ<X<μ+2σ)≈0.954,P(μ-3σ<X<μ+3σ)≈0.997.18.(2023·浙江·校联考模拟预测)某校有一个露天的篮球场和一个室内乒乓球馆为学生提供锻炼场所,甲、乙两位学生每天上下午都各花半小时进行体育锻炼,近50天天气不下雨的情况下,选择体育锻炼情况统计如下:上下午体育锻炼项目的情况(上午,下午)(篮球,篮球)(篮球,乒乓球)(乒乓球,篮球)(乒乓球,乒乓球)甲20天15天5天10天乙10天10天5天25天假设甲、乙选择上下午锻炼的项目相互独立,用频率估计概率.(1)分别估计一天中甲上午和下午都选择篮球的概率,以及甲上午选择篮球的条件下,下午仍旧选择篮球的概率;(2)记X 为甲、乙在一天中选择体育锻炼项目的个数,求X 的分布列和数学期望E (X );(3)假设A 表示事件“室外温度低于10度”,B 表示事件“某学生去打乒乓球”,P (A )>0,一般来说在室外温度低于10度的情况下学生去打乒乓球的概率会比室外温度不低于10度的情况下去打乒乓球的概率要大,证明:P (A |B )>P (A |B).19.(2023·广东深圳·统考二模)某校体育节组织定点投篮比赛,每位参赛选手共有3次投篮机会.统计数据显示,每位选手投篮投进与否满足:若第k 次投进的概率为p (0<p <1),当第k 次投进时,第k +1次也投进的概率保持p 不变;当第k 次没能投进时,第k +1次能投进的概率降为p2.(1)若选手甲第1次投进的概率为p (0<p <1),求选手甲至少投进一次的概率;(2)设选手乙第1次投进的概率为23,每投进1球得1分,投不进得0分,求选手乙得分X 的分布列与数学期望.20.(2023·湖北武汉·华中师大一附中校考模拟预测)2021年春节前,受疫情影响,各地鼓励外来务工人员选择就地过年.某市统计了该市4个地区的外来务工人数与就地过年人数(单位:万),得到如下表格:A 区B 区C 区D 区外来务工人数x /万3456就地过年人数y /万2.5344.5(1)请用相关系数说明y 与x 之间的关系可用线性回归模型拟合,并求y 关于x 的线性回归方程y =a +bx 和A 区的残差(2)假设该市政府对外来务工人员中选择就地过年的每人发放1000元补贴.①若该市E 区有2万名外来务工人员,根据(1)的结论估计该市政府需要给E 区就地过年的人员发放的补贴总金额;②若A 区的外来务工人员中甲、乙选择就地过年的概率分别为p ,2p -1,其中12<p <1,该市政府对甲、乙两人的补贴总金额的期望不超过1400元,求p 的取值范围.参考公式:相关系数r =ni =1x i y i -nx yn i =1x 2i -nx 2ni =1y 2i -ny2,回归方程y =a +bx 中斜率和截距的最小二乘估计公式分别为b =ni =1x i y i -nx yni =1x 2i -nx2,a =y -b x .21.(2023·山西运城·山西省运城中学校校考二模)甲、乙两人进行象棋比赛,赛前每人发3枚筹码.一局后负的一方,需将自己的一枚筹码给对方;若平局,双方的筹码不动,当一方无筹码时,比赛结束,另一方最终获胜.由以往两人的比赛结果可知,在一局中甲胜的概率为0.3、乙胜的概率为0.2.(1)第一局比赛后,甲的筹码个数记为X,求X的分布列和期望;(2)求四局比赛后,比赛结束的概率;(3)若P i i=0,1,⋯,6表示“在甲所得筹码为i枚时,最终甲获胜的概率”,则P0=0,P6=1.证明:P i+1-P ii=0,1,2,⋯,5为等比数列.22.(2023·湖北襄阳·襄阳四中校考三模)为倡导公益环保理念,培养学生社会实践能力,某中学开展了旧物义卖活动,所得善款将用于捐赠“圆梦困境学生”计划.活动共计50多个班级参与,1000余件物品待出售.摄影社从中选取了20件物品,用于拍照宣传,这些物品中,最引人注目的当属优秀毕业生们的笔记本,已知高三1,2,3班分别有12,13,14的同学有购买意向.假设三个班的人数比例为6:7:8.(1)现从三个班中随机抽取一位同学:(i)求该同学有购买意向的概率;(ii)如果该同学有购买意向,求此人来自2班的概率;(2)对于优秀毕业生的笔记本,设计了一种有趣的“掷骰子叫价确定购买资格”的竞买方式:统一以0元为初始叫价,通过掷骰子确定新叫价,若点数大于2,则在已叫价格基础上增加1元更新叫价,若点数小于3,则在已叫价格基础上增加2元更新叫价;重复上述过程,能叫到10元,即获得以10元为价格的购买资格,未出现叫价为10元的情况则失去购买资格,并结束叫价.若甲同学已抢先选中了其中一本笔记本,试估计其获得该笔记本购买资格的概率(精确到0.01).23.(2023·广东茂名·统考二模)春节过后,文化和旅游业逐渐复苏,有意跨省游、出境游的旅客逐渐增多.某旅游景区为吸引更多游客,计划在社交媒体平台和短视频平台同时投放宣传广告并进行线上售票,通过近。
高考数学-概率与统计(含22年真题讲解)1.【2022年全国甲卷】某社区通过公益讲座以普及社区居民的垃圾分类知识.为了解讲座效果,随机抽取10位社区居民,让他们在讲座前和讲座后各回答一份垃圾分类知识问卷,这10位社区居民在讲座前和讲座后问卷答题的正确率如下图:则()A.讲座前问卷答题的正确率的中位数小于70%B.讲座后问卷答题的正确率的平均数大于85%C.讲座前问卷答题的正确率的标准差小于讲座后正确率的标准差D.讲座后问卷答题的正确率的极差大于讲座前正确率的极差【答案】B【解析】【分析】由图表信息,结合中位数、平均数、标准差、极差的概念,逐项判断即可得解.【详解】>70%,所以A错;讲座前中位数为70%+75%2讲座后问卷答题的正确率只有一个是80%,4个85%,剩下全部大于等于90%,所以讲座后问卷答题的正确率的平均数大于85%,所以B对;讲座前问卷答题的正确率更加分散,所以讲座前问卷答题的正确率的标准差大于讲座后正确率的标准差,所以C错;讲座后问卷答题的正确率的极差为100%−80%=20%,讲座前问卷答题的正确率的极差为95%−60%=35%>20%,所以D错.故选:B.2.【2022年全国甲卷】从分别写有1,2,3,4,5,6的6张卡片中无放回随机抽取2张,则抽到的2张卡片上的数字之积是4的倍数的概率为()A.15B.13C.25D.23【答案】C【解析】【分析】先列举出所有情况,再从中挑出数字之积是4的倍数的情况,由古典概型求概率即可.【详解】从6张卡片中无放回抽取2张,共有(1,2),(1,3),(1,4),(1,5),(1,6),(2,3),(2,4),(2,5),(2,6),(3 ,4),(3,5),(3,6),(4,5),(4,6),(5,6)15种情况,其中数字之积为4的倍数的有(1,4),(2,4),(2,6),(3,4),(4,5),(4,6)6种情况,故概率为615=25.故选:C.3.【2022年全国乙卷】分别统计了甲、乙两位同学16周的各周课外体育运动时长(单位:h),得如下茎叶图:则下列结论中错误的是()A.甲同学周课外体育运动时长的样本中位数为7.4B.乙同学周课外体育运动时长的样本平均数大于8C.甲同学周课外体育运动时长大于8的概率的估计值大于0.4D.乙同学周课外体育运动时长大于8的概率的估计值大于0.6【答案】C【解析】【分析】结合茎叶图、中位数、平均数、古典概型等知识确定正确答案.【详解】=7.4,A选项结论正确.对于A选项,甲同学周课外体育运动时长的样本中位数为7.3+7.52对于B选项,乙同学课外体育运动时长的样本平均数为:6.3+7.4+7.6+8.1+8.2+8.2+8.5+8.6+8.6+8.6+8.6+9.0+9.2+9.3+9.8+10.1=8.50625>8,16B选项结论正确.=0.375<0.4,对于C选项,甲同学周课外体育运动时长大于8的概率的估计值616C选项结论错误.=0.8125>0.6,对于D选项,乙同学周课外体育运动时长大于8的概率的估计值1316D选项结论正确.故选:C4.【2022年全国乙卷】某棋手与甲、乙、丙三位棋手各比赛一盘,各盘比赛结果相互独立.已知该棋手与甲、乙、丙比赛获胜的概率分别为p1,p2,p3,且p3>p2>p1>0.记该棋手连胜两盘的概率为p,则()A.p与该棋手和甲、乙、丙的比赛次序无关B.该棋手在第二盘与甲比赛,p最大C.该棋手在第二盘与乙比赛,p最大D.该棋手在第二盘与丙比赛,p最大【答案】D【解析】【分析】该棋手连胜两盘,则第二盘为必胜盘.分别求得该棋手在第二盘与甲比赛且连胜两盘的概率p;该棋手在第二盘与乙比赛且连胜两盘的概率p乙;该棋手在第二盘与丙比赛且连胜两盘甲的概率p丙.并对三者进行比较即可解决【详解】该棋手连胜两盘,则第二盘为必胜盘,记该棋手在第二盘与甲比赛,且连胜两盘的概率为p甲则p甲=2(1−p2)p1p3+2p2p1(1−p3)=2p1(p2+p3)−4p1p2p3记该棋手在第二盘与乙比赛,且连胜两盘的概率为p乙则p乙=2(1−p1)p2p3+2p1p2(1−p3)=2p2(p1+p3)−4p1p2p3记该棋手在第二盘与丙比赛,且连胜两盘的概率为p丙则p丙=2(1−p1)p3p2+2p1p3(1−p2)=2p3(p1+p2)−4p1p2p3则p甲−p乙=2p1(p2+p3)−4p1p2p3−[2p2(p1+p3)−4p1p2p3]=2(p1−p2)p3<0p 乙−p丙=2p2(p1+p3)−4p1p2p3−[2p3(p1+p2)−4p1p2p3]=2(p2−p3)p1<0即p甲<p乙,p乙<p丙,则该棋手在第二盘与丙比赛,p最大.选项D判断正确;选项BC判断错误;p与该棋手与甲、乙、丙的比赛次序有关.选项A判断错误.故选:D5.【2022年新高考1卷】从2至8的7个整数中随机取2个不同的数,则这2个数互质的概率为()A.16B.13C.12D.23【答案】D【解析】【分析】由古典概型概率公式结合组合、列举法即可得解.【详解】从2至8的7个整数中随机取2个不同的数,共有C72=21种不同的取法,若两数不互质,不同的取法有:(2,4),(2,6),(2,8),(3,6),(4,6),(4,8),(6,8),共7种,故所求概率P=21−721=23.故选:D.6.【2022年全国甲卷】从正方体的8个顶点中任选4个,则这4个点在同一个平面的概率为________.【答案】635.【解析】【分析】根据古典概型的概率公式即可求出.【详解】从正方体的8个顶点中任取4个,有n=C84=70个结果,这4个点在同一个平面的有m=6+6=12个,故所求概率P=mn =1270=635.故答案为:635.7.【2022年全国乙卷】从甲、乙等5名同学中随机选3名参加社区服务工作,则甲、乙都入选的概率为____________.【答案】310##0.3【解析】【分析】根据古典概型计算即可【详解】从5名同学中随机选3名的方法数为C53=10甲、乙都入选的方法数为C31=3,所以甲、乙都入选的概率P=310故答案为:3108.【2022年新高考2卷】已知随机变量X服从正态分布N(2,σ2),且P(2<X≤2.5)=0.36,则P(X>2.5)=____________.【答案】0.14##750.【解析】【分析】根据正态分布曲线的性质即可解出.【详解】因为X∼N(2,σ2),所以P(X<2)=P(X>2)=0.5,因此P(X>2.5)=P(X>2)−P(2<X ≤2.5)=0.5−0.36=0.14.故答案为:0.14.9.【2022年浙江】现有7张卡片,分别写上数字1,2,2,3,4,5,6.从这7张卡片中随机抽取3张,记所抽取卡片上数字的最小值为ξ,则P(ξ=2)=__________,E(ξ)=_________.【答案】 1635, 127##157 【解析】 【分析】利用古典概型概率公式求P(ξ=2),由条件求ξ分布列,再由期望公式求其期望. 【详解】从写有数字1,2,2,3,4,5,6的7张卡片中任取3张共有C 73种取法,其中所抽取的卡片上的数字的最小值为2的取法有C 41+C 21C 42种,所以P(ξ=2)=C 41+C 21C 42C 73=1635,由已知可得ξ的取值有1,2,3,4, P(ξ=1)=C 62C 73=1535,P(ξ=2)=1635,,P(ξ=3)=C 32C 73=335,P(ξ=4)=1C 73=135所以E(ξ)=1×1535+2×1635+3×335+4×135=127,故答案为:1635,127.10.【2022年全国甲卷】甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率; (2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d), P (K 2⩾k )0.100 0.050 0.010 k2.7063.8416.635【答案】(1)A ,B 两家公司长途客车准点的概率分别为1213,78(2)有 【解析】 【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算K 2,再利用临界值表比较即可得结论. (1)根据表中数据,A 共有班次260次,准点班次有240次, 设A 家公司长途客车准点事件为M , 则P(M)=240260=1213;B 共有班次240次,准点班次有210次, 设B 家公司长途客车准点事件为N , 则P(N)=210240=78.A 家公司长途客车准点的概率为1213; B 家公司长途客车准点的概率为78. (2)列联表K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=500×(240×30−210×20)2260×240×450×50≈3.205>2.706,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.11.【2022年全国甲卷】甲、乙两个学校进行体育比赛,比赛共设三个项目,每个项目胜方得10分,负方得0分,没有平局.三个项目比赛结束后,总得分高的学校获得冠军.已知甲学校在三个项目中获胜的概率分别为0.5,0.4,0.8,各项目的比赛结果相互独立. (1)求甲学校获得冠军的概率;(2)用X 表示乙学校的总得分,求X 的分布列与期望.【答案】(1)0.6;(2)分布列见解析,E(X)=13.【解析】【分析】(1)设甲在三个项目中获胜的事件依次记为A,B,C,再根据甲获得冠军则至少获胜两个项目,利用互斥事件的概率加法公式以及相互独立事件的乘法公式即可求出;(2)依题可知,X的可能取值为0,10,20,30,再分别计算出对应的概率,列出分布列,即可求出期望.(1)设甲在三个项目中获胜的事件依次记为A,B,C,所以甲学校获得冠军的概率为P=P(ABC)+P(A BC)+P(AB̅C)+P(ABC)=0.5×0.4×0.8+0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.16+0.16+0.24+0.04=0.6.(2)依题可知,X的可能取值为0,10,20,30,所以,P(X=0)=0.5×0.4×0.8=0.16,P(X=10)=0.5×0.4×0.8+0.5×0.6×0.8+0.5×0.4×0.2=0.44,P(X=20)=0.5×0.6×0.8+0.5×0.4×0.2+0.5×0.6×0.2=0.34,P(X=30)=0.5×0.6×0.2=0.06.即X的分布列为期望E(X)=0×0.16+10×0.44+20×0.34+30×0.06=13.12.【2022年全国乙卷】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2)和材积量(单位:3),得到如下数据:并计算得∑x i 210i=1=0.038,∑y i 210i=1=1.6158,∑x i y i10i=1=0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数r =∑(x i−x̅)n i=1(y i −y̅)√∑(x i −x̅)2ni=1∑(y i−y ̅)2ni=1√1.896≈1.377.【答案】(1)0.06m 2;0.39m 3 (2)0.97 (3)1209m 3 【解析】 【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值. (1)样本中10棵这种树木的根部横截面积的平均值x̅=0.610=0.06样本中10棵这种树木的材积量的平均值y̅=3.910=0.39据此可估计该林区这种树木平均一棵的根部横截面积为0.06m 2, 平均一棵的材积量为0.39m 3 (2)r =∑(x i −x)10i=1(y i −y)√∑10i=1(x i −x)2∑10i=1(y i −y)2=∑10i=1i i 10xy√(∑10i=1x i 2−10x2)(∑10i=1y i 2−10y 2)=0.2474−10×0.06×0.39√(0.038−10×0.062)(1.6158−10×0.392)=0.0134√0.0001896≈0.01340.01377≈0.97则r ≈0.97 (3)设该林区这种树木的总材积量的估计值为Y m 3, 又已知树木的材积量与其根部横截面积近似成正比, 可得0.060.39=186Y,解之得Y =1209m 3. 则该林区这种树木的总材积量估计为1209m 313.【2022年新高考1卷】一医疗团队为研究某地的一种地方性疾病与当地居民的卫生习惯(卫生习惯分为良好和不够良好两类)的关系,在已患该疾病的病例中随机调查了100例(称为病例组),同时在未患该疾病的人群中随机调查了100人(称为对照组),得到如下数据:(1)能否有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异?(2)从该地的人群中任选一人,A 表示事件“选到的人卫生习惯不够良好”,B 表示事件“选到的人患有该疾病”.P(B|A)P(B ̅|A)与P(B|A )P(B ̅|A )的比值是卫生习惯不够良好对患该疾病风险程度的一项度量指标,记该指标为R .(ⅰ)证明:R =P(A|B)P(A |B)⋅P(A |B ̅)P(A|B ̅);(ⅱ)利用该调查数据,给出P(A|B),P(A|B ̅)的估计值,并利用(ⅰ)的结果给出R 的估计值.附K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d),【答案】(1)答案见解析 (2)(i )证明见解析;(ii)R =6; 【解析】【分析】(1)由所给数据结合公式求出K2的值,将其与临界值比较大小,由此确定是否有99%的把握认为患该疾病群体与未黄该疾病群体的卫生习惯有差异;(2)(i) 根据定义结合条件概率公式即可完成证明;(ii)根据(i)结合已知数据求R.(1)由已知K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)=200(40×90−60×10)250×150×100×100=24,又P(K2≥6.635)=0.01,24>6.635,所以有99%的把握认为患该疾病群体与未患该疾病群体的卫生习惯有差异.(2)(i)因为R=P(B|A)P(B̅|A)⋅P(B̅|A)P(B|A)=P(AB)P(A)⋅P(A)P(AB̅)⋅P(A B̅)P(A)⋅P(A)P(A B),所以R=P(AB)P(B)⋅P(B)P(A B)⋅P(A B̅)P(B̅)⋅P(B̅)P(AB̅)所以R=P(A|B)P(A|B)⋅P(A|B̅) P(A|B̅),(ii)由已知P(A|B)=40100,P(A|B̅)=10100,又P(A|B)=60100,P(A|B̅)=90100,所以R=P(A|B)P(A|B)⋅P(A|B̅)P(A|B̅)=614.【2022年新高考2卷】在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).【答案】(1)44.65岁;(2)0.89;(3)0.0014.【解析】【分析】(1)根据平均值等于各矩形的面积乘以对应区间的中点值的和即可求出;(2)设A={一人患这种疾病的年龄在区间[20,70)},根据对立事件的概率公式P(A)=1−P (A)即可解出;(3)根据条件概率公式即可求出.(1)平均年龄x̅=(5×0.001+15×0.002+25×0.012+35×0.017+45×0.023 +55×0.020+65×0.012+75×0.006+85×0.002)×10=44.65(岁).(2)设A={一人患这种疾病的年龄在区间[20,70)},所以P(A)=1−P(A)=1−(0.001+0.002+0.006+0.002)×10=1−0.11=0.89.(3)设B={任选一人年龄位于区间[40,50)},C={任选一人患这种疾病},则由条件概率公式可得P(C|B)=P(BC)P(B)=0.1%×0.023×1016%=0.001×0.230.16=0.0014375≈0.0014.15.【2022年北京】在校运动会上,只有甲、乙、丙三名同学参加铅球比赛,比赛成绩达到9.50m以上(含9.50m)的同学将获得优秀奖.为预测获得优秀奖的人数及冠军得主,收集了甲、乙、丙以往的比赛成绩,并整理得到如下数据(单位:m):甲:9.80,9.70,9.55,9.54,9.48,9.42,9.40,935,9.30,9.25;乙:9.78,9.56,9.51,9.36,9.32,9.23;丙:9.85,9.65,9.20,9.16.假设用频率估计概率,且甲、乙、丙的比赛成绩相互独立.(1)估计甲在校运动会铅球比赛中获得优秀奖的概率;(2)设X是甲、乙、丙在校运动会铅球比赛中获得优秀奖的总人数,估计X的数学期望E(X);(3)在校运动会铅球比赛中,甲、乙、丙谁获得冠军的概率估计值最大?(结论不要求证明)【答案】(1)0.4(2)75(3)丙【解析】【分析】(1)由频率估计概率即可(2)求解得X的分布列,即可计算出X的数学期望.(3)计算出各自获得最高成绩的概率,再根据其各自的最高成绩可判断丙夺冠的概率估计值最大.(1)由频率估计概率可得甲获得优秀的概率为0.4,乙获得优秀的概率为0.5,丙获得优秀的概率为0.5,故答案为0.4(2)设甲获得优秀为事件A1,乙获得优秀为事件A2,丙获得优秀为事件A3P(X=0)=P(A1̅̅̅A2̅̅̅A3̅̅̅)=0.6×0.5×0.5=3,20P(X=1)=P(A1A2̅̅̅A3̅̅̅)+P(A1̅̅̅A2A3̅̅̅)+P(A1̅̅̅A2̅̅̅A3)=0.4×0.5×0.5+0.6×0.5×0.5+0.6×0.5×0.5=8,20P(X=2)=P(A1A2A3̅̅̅)+P(A1A2̅̅̅A3)+P(A1̅̅̅A2A3)=0.4×0.5×0.5+0.4×0.5×0.5+0.6×0.5×0.5=7,20P(X=3)=P(A1A2A3)=0.4×0.5×0.5=2.20∴X的分布列为∴E(X)=0×320+1×820+2×720+3×220=75 (3)丙夺冠概率估计值最大.因为铅球比赛无论比赛几次就取最高成绩.比赛一次,丙获得9.85的概率为14,甲获得9.80的概率为110,乙获得9.78的概率为16.并且丙的最高成绩是所有成绩中最高的,比赛次数越多,对丙越有利.1.(2022·河南省杞县高中模拟预测(理))某市有11名选手参加了田径男子100米赛的选拔比赛,前5名可以参加省举办的田径赛,如果各个选手的选拔赛成绩均不相同,选手小强已经知道了自己的成绩,为了判断自己能否参加省举办的田径赛,他还需要知道这11名选手成绩的( ) A .平均数 B .中位数 C .众数 D .方差【答案】B 【解析】 【分析】中位数恰好是第6名,比中位数成绩高即可确认自己能否进入省田径赛. 【详解】因为11名选手成绩的中位数恰好是第6名,知道了第6名的成绩,小强就可以判断自己是否能参加省举办的田径赛了,其余数字特征不能反映名次. 故选:B .2.(2022·黑龙江·大庆实验中学模拟预测(理))2021年5月30日清晨5时01分,天舟二号货运飞船在成功发射约8小时后,与中国空间站天和核心舱完成自主快速交接.如果下次执行空间站的任务由3名航天员承担,需要在3名女性航天员和3名男性航天员中选择,则选出的3名航天员中既有男性航天员又有女性航天员的概率为( ) A .67B .910 C .25D .415【答案】B 【解析】 【分析】利用对立事件和古典概型的概率公式求解即可. 【详解】设“选出的3名航天员中既有男性航天员又有女性航天员”为事件M ,则()333336C C 91C 10P M ==+-.故选:B.3.(2022·全国·模拟预测(文))如图是一组实验数据的散点图,拟合方程()0by c x x=+>,令1t x=,则y 关于t 的回归直线过点()2,5,()12,25,则当()1.01,1.02y ∈时,x 的取值范围是( )A .()0.01,0.02B .()50,100C .()0.02,0.04D .()100,200【答案】D 【解析】 【分析】 先令1t x =可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得522512b c b c=+⎧⎨=+⎩从而求得21y t =+,再由y 的范围求得t 的范围,进而求得x 的范围. 【详解】根据题意可得()0y bt c t =+>,由y 关于t 的回归直线过点()2,5,()12,25可得:522512b cb c =+⎧⎨=+⎩,所以2,1b c ==, 所以21y t =+,由()1.01,1.02y ∈可得1.0121 1.02t <+<, 所以0.0050.01t <<, 所以10.0050.01x<<,所以100200x <<, 故选:D4.(2022·辽宁实验中学模拟预测)某国计划采购疫苗,现在成熟的疫苗中,三种来自中国,一种来自美国,一种来自英国,一种由美国和德国共同研发,从这6种疫苗中随机采购三种,若采购每种疫苗都是等可能的,则买到中国疫苗的概率为( ) A .16B .12C .910D .1920【答案】D 【解析】 【分析】由对立事件的概率公式计算. 【详解】没有买到中国疫苗的概率为13611C 20P ==, 所以买到中国疫苗的概率为119120P P =-=. 故选:D .5.(2022·四川省泸县第二中学模拟预测(理))食物链亦称“营养链”,是指生态系统中各种生物为维持其本身的生命活动,必须以其他生物为食物的这种由食物联结起来的链锁关系.如图为某个生态环境中的食物链,若从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,则这两种生物不能构成摄食关系的概率( )A .35B .25C .23D .13【解析】 【分析】用列举法写出构成的摄食关系,计数后可求得概率. 【详解】从鹰、麻雀、兔、田鼠以及蝗虫中任意选取两种,共有10种选法:鹰麻雀,鹰兔,鹰田鼠,鹰蝗虫,麻雀兔,麻雀田鼠,麻雀蝗虫,兔田鼠,兔蝗虫,田鼠蝗虫.其中田鼠鹰,兔鹰,麻雀鹰,蝗虫麻雀共四种可构成摄食关系,不能构成摄食关系的有6种,所以概率为63105P ==. 故选:A .6.(2022·山东潍坊·模拟预测)Poisson 分布是统计学里常见的离散型概率分布,由法国数学家西莫恩·德尼·泊松首次提出,Poisson 分布的概率分布列为()()e 0,1,2,!kP X K k k λλ-===⋅⋅⋅,其中e 为自然对数的底数,λ是Poisson 分布的均值.当二项分布的n 很大()20n ≥而p 很小()0.05p ≤时,Poisson 分布可作为二项分布的近似.假设每个大肠杆菌基因组含有10000个核苷酸对,采用20.05/J m 紫外线照射大肠杆菌时,每个核苷酸对产生嘧啶二体的概率均为0.0003,已知该菌株基因组有一个嘧啶二体就致死,则致死率是( ) A .31e -- B .3e - C .313e -- D .314e --【答案】A 【解析】 【分析】结合题意1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似条件,再计算二项分布的均值为Poisson 分布的均值λ,再代入公式先求不致死的概率,再用对立事件的概率和为1计算即可 【详解】由题, 1000020n =≥,0.00030.05p =≤,此时Poisson 分布满足二项分布的近似的条件,此时100000.00033λ=⨯=,故不致死的概率为()03330e e 0!P X --===,故致死的概率为()3101e P X --==-7.(2022·河南安阳·模拟预测(理))某房产销售公司有800名销售人员,为了了解销售人员上一个季度的房屋销量,公司随机选取了部分销售人员对其房屋销量进行了统计,得到上一季度销售人员的房屋销量(20,4)X N ,则全公司上一季度至少完成22套房屋销售的人员大概有( )附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.A .254人B .127人C .18人D .36人【答案】B 【解析】 【分析】根据正态分布的性质求出()22P X ≥,从而估计出人数; 【详解】 解:因为(20,4)X N ,所以20μ=,2σ=,所以()1()10.6827220.1586522P X P X μσμσ--<≤+-≥===所以全公司上一季度至少完成22套房屋销售的人员大概有8000.15865127⨯≈(人); 故选:B8.(2022·河南·模拟预测)某公司生产的一种产品按照质量由高到低分为A ,B ,C ,D 四级,为了增加产量、提高质量,该公司改进了一次生产工艺,使得生产总量增加了一倍.为了解新生产工艺的效果,对改进生产工艺前、后的四级产品的占比情况进行了统计,绘制了如下扇形图:根据以上信息:下列推断合理的是( ) A .改进生产工艺后,A 级产品的数量没有变化B.改进生产工艺后,D级产品的数量减少C.改进生产工艺后,C级产品的数量减少D.改进生产工艺后,B级产品的数量增加了不到一倍【答案】C【解析】【分析】由题可得改进生产工艺前后四个等级的生产量,逐项分析即得.【详解】设原生产总量为1,则改进生产工艺后生产总量为2,所以原A,B,C,D等级的生产量为0.3,0.37,0.28,0.05,改进生产工艺后四个等级的生产量为0.6,1.2,0.12,0.08,故改进生产工艺后,A级产品的数量增加,故A错误;改进生产工艺后,D级产品的数量增加,故B错误;改进生产工艺后,C级产品的数量减少,故C正确;改进生产工艺后,B级产品的数量增加超过2倍,故D错误.故选:C.9.(2022·河南安阳·模拟预测(文))为推动就业与培养有机联动、人才供需有效对接,促进高校毕业生更加充分更高质量就业,教育部今年首次实施供需对接就业育人项目.现安排甲、乙两所高校与3家用人单位开展项目对接,若每所高校至少对接两家用人单位,则两所高校的选择涉及到全部3家用人单位的概率为()A.12B.23C.34D.1316【答案】D【解析】【分析】由古典概型与对立事件的概率公式求解即可【详解】因为每所高校至少对接两家用人单位,所以每所高校共有2333314C C+=+=种选择,所以甲、乙两所高校共有4416⨯=种选择,其中甲、乙两所高校的选择涉及两家用人单位的情况有233C =种,所以甲、乙两所高校的选择涉及到全部3家用人单位的概率为31311616P =-=, 故选:D10.(2022·江苏·南京师大附中模拟预测)某同学在课外阅读时了解到概率统计中的马尔可夫不等式,该不等式描述的是对非负的随机变量X 和任意的正数a ,都有()()(),P X a f E X a ≥≤,其中()(),f E X a 是关于数学期望()E X 和a 的表达式.由于记忆模糊,该同学只能确定()(),f E X a 的具体形式是下列四个选项中的某一种.请你根据自己的理解,确定该形式为( ) A .()aE X B .()1aE XC .()a E XD .()E X a【答案】D 【解析】 【分析】根据期望的计算公式,以及m x a ≥即可求解. 【详解】设非负随机变量X 的所有可能取值按从小到大依次为0,i x i N *>∈,对应的概率分别为,0i i p p >设满足i x a ≥的有,,,m a a x k m n m N k N **≤≤∈∈,()ani i k P X a p =≥=∑,()111a ai nk i iii n i ii k i ax pE ax p x pX a -===+==∑∑∑,因为m x a ≥,所以1mx a≥()()()1111a a aaannniiiiiik k i k i k i k ii i i i x px px px p p P X a P X a E aa aaaX --=====⎛⎫+≥+=+≥≥≥ ⎪⎝⎭=∑∑∑∑∑故选:D11.(2022·吉林·三模(理))为了切实维护居民合法权益,提高居民识骗防骗能力,守好居民的“钱袋子”,某社区开展“全民反诈在行动——反诈骗知识竞赛”活动,现从参加该活动的居民中随机抽取了100名,统计出他们竞赛成绩分布如下:(1)求抽取的100名居民竞赛成绩的平均分x 和方差2s (同一组中数据用该组区间的中点值为代表);(2)以频率估计概率,发现该社区参赛居民竞赛成绩X 近似地服从正态分布()2,N μσ,其中μ近似为样本成绩平均分x ,2σ近似为样本成缋方差2s ,若2μσμσ-<≤+X ,参赛居民可获得“参赛纪念证书”;若2μσ>+X ,参赛居民可获得“反诈先锋证书”,①若该社区有3000名居民参加本次竞赛活动,试估计获得“参赛纪念证书”的居民人数(结果保留整数);②试判断竞赛成绩为96分的居民能否获得“反诈先锋证书”. 附:若()2,XN μσ,则()0.6827P X μσμσ-<≤+≈,(22)0.9545P X μσμσ-<≤+≈,(33)0.9973P X μσμσ-<≤+≈.【答案】(1)75x =,2100s = (2)①2456 ;②能 【解析】 【分析】(1)利用公式直接求出均值、方差即可;(2)①结合给的概率和正态分布的性质,确定获得“参赛纪念证书”,进而计算可得人数; ②利用正态分布的知识求出2μσ>+X ,即95>X ,进而可得结果. (1)100名居民本次竞赛成绩平均分24224028445556575859575100100100100100100=⨯+⨯+⨯+⨯+⨯+⨯=x , 100名居民本次竞赛成绩方差22222422(4575)(5575)(6575)100100100=-⨯+-⨯+-⨯s 22240284(7575)(8575)(9575)100100100100+-⨯+-⨯+-⨯=, (2)①由于μ近似为样本成绩平均分x ,2σ近似为样本成绩方差2s , 所以,275,100μσ==,可知,10σ=,由于竞赛成绩X 近似地服从正态分布()2,N μσ,因此竞赛居民可获得“参赛纪念证书”的概率 (2)P X μσμσ-<≤+11()(22)22μσμσμσμσ=-<≤++-<≤+P X P X 110.68270.95450.818622≈⨯+⨯= 30000.81862455.82456⨯=≈估计获得“参赛纪念证书”的居民人数为2456;②当2μσ>+X 时,即95>X 时,参赛居民可获得“反诈先锋证书”, 所以竞赛成绩为96分的居民能获得“反诈先峰证书”.12.(2022·贵州·贵阳一中模拟预测(文))“十四五”规划纲要提出,全面推动长江经济带发展,协同推动生态环境保护和经济发展长江水资源约占全国总量的36%,长江流域河湖、水库、湿地面积约占全国的20%,珍稀濒危植物占全国的39.7%,淡水鱼类占全国的33%.长江经济带在我国生态文明建设中占据重要位置.长江流域某地区经过治理,生态系统得到很大改善,水生动物数量有所增加.为调查该地区某种水生动物的数量,将其分成面积相近的100个水域,从这些水域中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据()(),1,2,,20,i i x y i =其中i x 和i y 分别表示第i 个样区的水草覆盖面积(单位:公顷)和这种水生动物的数量,并计算得20160i i x ==∑,2011200i i y ==∑,2021-)120,i i x x ==∑(2021-)9000,i i y ==∑(y 201-)-)1000.i iix x y ==∑((y (1)求该地区这种水生动物数量的估计值(这种水生动物数量的估计值等于样区这种水生动物数量的平均数乘以地块数); (2)求样本()(),1,2,,20i i x y i =的相关系数(精确到0.01);(3)根据现有统计资料,各地块间水草覆盖面积差异很大.为提高样本的代表性以获得该地区这种水生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数-)-) 1.732.niix y x r =≈∑((y【答案】(1)6000 (2)0.96(3)采用分层抽样的方法,理由见解析 【解析】 【分析】(1)根据该地区这种水生动物数量的估计值的计算方法求解即可; (2)根据相关系数的公式求解即可;(3)根据(2)中的结论各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性考虑即可 (1)样区水生动物平均数为201111200602020i i y ==⨯=∑, 地块数为100,该地区这种水生动物的估计值为100606000⨯=. (2)样本()(),1,2,,20i i x y i =⋯的相关系数为()()20,0.96.iix x y y r -===≈∑ (3)由(2)知各样区的这种水生动物的数量与水草覆盖面积有很强的正相关性,由于各地块间水草覆盖面积差异很大,从而各地块间这种野生动物的数量差异很大,所以采用分层抽样的方法较好地保持了样本结构与总体结构得以执行,提高了样本的代表性,从而可以获得该地区这种水生动物数量更准确的估计.13.(2022·河南开封·模拟预测(理))大豆是我国重要的农作物,种植历史悠久.某种子实验基地培育出某大豆新品种,为检验其最佳播种日期,在A ,B 两块试验田上进行实验(两地块的土质等情况一致).6月25日在A 试验田播种该品种大豆,7月10日在B 试验田播种该品种大豆.收获大豆时,从中各随机抽取20份(每份1千粒),并测量出每份的质量(单位:克),按照[)100,150,[)150,200,[]200,250进行分组,得到如下表格:。
专题11 概率与统计综合问题【题型解读】几何概型、古典概型、相互独立事件与互斥事件的概率、条件概率是高考的热点,几何概型主要以客观题考查,求解的关键在于找准测度(面积,体积或长度);相互独立事件、互斥事件常作为解答题的一问考查,也是进一步求分布列、期望与方差的基础,求解该类问题要正确理解题意,准确判定概率模型,恰当选择概率公式.【例1】 (2018·天津卷)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16,现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(1)应从甲、乙、丙三个部门的员工中分别抽取多少人?(2)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查. ①用X 表示抽取的3人中睡眠不足的员工人数,求随机变量X 的分布列与数学期望;②设A 为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A 发生的概率. 【答案】见解析【解析】(1)由题意得,甲、乙、丙三个部门的员工人数之比为3∶2∶2.由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人、2人、2人. (2)①随机变量X 的所有可能取值为0,1,2,3. P (X =k )=C k 4C 3-k3C 37(k =0,1,2,3).所以随机变量X 的分布列为随机变量X 的数学期望E (X )=0×35+1×35+2×35+3×35=7.②设事件B 为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C 为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A =B ∪C ,且B 与C 互斥. 由①知,P (B )=P (X =2),P (C )=P (X =1), 故P (A )=P (B ∪C )=P (X =2)+P (X =1)=67.所以事件A 发生的概率为67.【素养解读】本题考查分层抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式,考查分析问题和解决问题的能力,体现了数学运算和数据分析等核心素养.试题难度:中.【突破训练1】 (2017·天津卷)从甲地到乙地要经过3个十字路口,设各路口信号灯工作相互独立,且在各路口遇到红灯的概率分别为12,13,14.(1)记X 表示一辆车从甲地到乙地遇到红灯的个数,求随机变量X 的分布列和数学期望; (2)若有2辆车独立地从甲地到乙地,求这2辆车共遇到1个红灯的概率. 【答案】见解析【解析】(1)随机变量X 的所有可能取值为0,1,2,3.P (X =0)=⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14=14,P (X =1)=12×⎝⎛⎭⎪⎫1-13×⎝⎛⎭⎪⎫1-14+⎝ ⎛⎭⎪⎫1-12×13×⎝⎛⎭⎪⎫1-14+⎝⎛⎭⎪⎫1-12×⎝⎛⎭⎪⎫1-13×14=1124,P (X =2)=⎝⎛⎭⎪⎫1-12×13×14+12×⎝ ⎛⎭⎪⎫1-13×14+12×13×⎝ ⎛⎭⎪⎫1-14=14,P (X =3)=12×13×14=124.所以随机变量X 的分布列为所以E (X )=0×4+1×24+2×4+3×24=12.(2)设Y 表示第一辆车遇到红灯的个数,Z 表示第二辆车遇到红灯的个数,则所求事件的概率为P (Y +Z =1)=P (Y =0,Z =1)+P (Y =1,Z =0)=P (Y =0)P (Z =1)+P (Y =1)P (Z =0) =14×1124+1124×14=1148. 所以这2辆车共遇到了1个红灯的概率为1148.▶▶题型二 离散型随机变量的分布列、均值与方差离散型随机变量及其分布列、均值与方差及应用是数学高考的一大热点,常有解答题的考查,属于中档题.复习中应强化应用类习题的理解与掌握,弄清随机变量的所有取值,它是正确求随机变量分布列和求均值与方差的关键,对概率模型的确定与转化是解题的基础,准确计算是解题的核心,在备考中应强化解答题的规范性训练.【例2】 (2018·北京卷)电影公司随机收集了电影的有关数据,经分类整理得到下表:假设所有电影是否获得好评相互独立.(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率; (2)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(3)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk =1”表示第k 类电影得到人们喜欢,“ξk =0”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.【答案】见解析【解析】 (1)设“从电影公司收集的电影中随机选取1部,这部电影是获得好评的第四类电影”为事件A . 因为第四类电影中获得好评的电影有200×0.25=50(部), 所以P (A )=50140+50+300+200+800+510=502 000=0.025.(2)设“从第四类电影和第五类电影中各随机选取1部,恰有1部获得好评”为事件B ,则P (B )=0.25×(1-0.2)+(1-0.25)×0.2=0.35.(3)由题意可知,定义随机变量如下:ξk =⎩⎪⎨⎪⎧0,第k 类电影没有得到人们喜欢,1,第k 类电影得到人们喜欢,则ξk 显然服从两点分布,故Dξ1=0.4×(1-0.4)=0.24,Dξ2=0.2×(1-0.2)=0.16, Dξ3=0.15×(1-0.15)=0.127 5,Dξ4=0.25×(1-0.25)=0.187 5, Dξ5=0.2×(1-0.2)=0.16, Dξ6=0.1×(1-0.1)=0.09.综上所述,Dξ1>Dξ4>Dξ2=Dξ5>Dξ3>Dξ6.【素养解读】本题考查统计中的概率计算、随机变量的方差计算,考查运算求解能力,体现了数据分析、数学运算等核心素养.试题难度:中.【突破训练2】 (2017·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:(1)求六月份这种酸奶一天的需求量X (单位:瓶)的分布列.(2)设六月份一天销售这种酸奶的利润为Y (单位:元).当六月份这种酸奶一天的进货量n (单位:瓶)为多少时,Y 的数学期望达到最大值? 【答案】见解析【解析】(1)由题意知,X 所有可能取值为200,300,500, 由表格数据知P (X =200)=2+1690=0.2,P (X =300)=3690=0.4, P (X =500)=25+7+490=0.4, 因此X 的分布列为当300≤n ≤500时,若最高气温不低于25,Y =6n -4n =2n ; 若最高气温位于区间[20,25),则Y=6×300+2(n-300)-4n=1 200-2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n,因此E(Y)=2n×0.4+(1 200-2n)×0.4+(800-2n)×0.2=640-0.4n.当200≤n<300时,若最高气温不低于20,则Y=6n-4n=2n;若最高气温低于20,则Y=6×200+2(n-200)-4n=800-2n.因此E(Y)=2n×(0.4+0.4)+(800-2n)×0.2=160+1.2n.所以当n=300时,Y的数学期望达到最大值,最大值为520元.▶▶题型三概率与统计的综合应用概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点.主要依托点是统计图表,正确认识和使用这些图表是解决问题的关键.复习时要在这些图表上下工夫,把这些统计图表的含义弄清楚,在此基础上掌握好样本特征数的计数方法、各类概率的计算方法及数学均值与方差的运算.【例3】(2017·全国卷Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下.(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg,新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面的列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;附:K 2=(a +b)(c +d)(a +c)(b +d).【答案】见解析【解析】(1)记B 表示事件“旧养殖法的箱产量低于50 kg”,C 表示事件“新养殖法的箱产量不低于50 kg”. 由题意知P (A )=P (BC )=P (B )P (C ). 旧养殖法的箱产量低于50 kg 的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62, 故P (B )的估计值为0.62.新养殖法的箱产量不低于50 kg 的频率为 (0.068+0.046+0.010+0.008)×5=0.66, 故P (C )的估计值为0.66.因此,事件A 的概率估计值为0.62×0.66=0.409 2. (2)根据箱产量的频率分布直方图得如下列联表.K 2=100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50 kg 的直方图面积为(0.004+0.020+0.044)×5=0.34<0.5,箱产量低于55 kg 的直方图面积为(0.004+0.020+0.044+0.068)×5=0.68>0.5, 故新养殖法箱产量的中位数的估计值为 50+0.5-0.340.068≈52.35(kg).【素养解读】本题考查频率分布直方图、独立性检验、中位数、相互独立事件的概率,考查学生的阅读理解能力、数据处理能力.主要体现了数据分析,数学运算等核心素养.【突破训练3】 (2017·北京卷)为了研究一种新药的疗效,选100名患者随机分成两组,每组各50名,一组服药,另一组不服药.一段时间后,记录了两组患者的生理指标x 和y 的数据,并制成下图,其中“*”表示服药者,“+”表示未服药者.(1)从服药的50名患者中随机选出一人,求此人指标y 的值小于60的概率;(2)从图中A ,B ,C ,D 四人中随机选出两人,记ξ为选出的两人中指标x 的值大于1.7的人数,求ξ的分布列和数学期望E (ξ);(3)试判断这100名患者中服药者指标y 数据的方差与未服药者指标y 数据的方差的大小(只需写出结论). 【答案】见解析【解析】(1)由题图知,在服药的50名患者中,指标y 的值小于60的有15人. 所以从服药的50名患者中随机选出一人,此人指标y 的值小于60的概率为1550=0.3.(2)由题图知,A ,B ,C ,D 四人中,指标x 的值大于1.7的有2人:A 和C . 所以ξ的所有可能取值为0,1,2.P (ξ=0)=C 22C 24=16,P (ξ=1)=C 12C 12C 24=23,P (ξ=2)=C 22C 24=16.所以ξ的分布列为故ξ的期望E (ξ)=0×6+1×3+2×6=1.(3)在这100名患者中,服药者指标y 数据的方差大于未服药者指标y 数据方差. 题型四 统计与统计案例能根据给出的线性回归方程系数公式求线性回归方程,了解独立性检验的基本思想、方法,在选择或填空题中常涉及频率分布直方图、茎叶图及样本的数字特征(如平均数、方差等)的考查,解答题中也有所考查.【例4】 (2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t . (1)分析利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?请说明理由. 【答案】见解析【解析】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施资源额的预测值为y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠.理由如下:(ⅰ)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势,2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年的数据建立基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ⅱ)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠. (以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.)【素养解读】本题以统计图为背景,考查线性回归方程,考查运算求解能力和数形结合思想,体现了数学运算的核心素养.【突破训练4】 下图是我国2011年至2017年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y 与t 的关系,请用相关系数加以说明; (2)建立y 关于t 的回归方程(系数精确到0.01),预测2019年我国生活垃圾无害化处理量. 附注:参考数据:∑i =17y i =9.32,∑i =17t i y i =40.17,∑i =17(y i -y)2=0.55,7≈2.646.参考公式:相关系数r =∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2∑i =1n(y i -y)2,回归方程y ^=a ^+b ^t 中斜率和截距的最小二乘估计公式分别为b ^=∑i =1n(t i -t)(y i -y )∑i =1n(t i -t )2,a ^=y -b ^t .【答案】见解析【解析】(1)由折线图中数据和附注中参考数据得t =4,∑i =17(t i -t )2=28,∑i =17(y i -y -)2=0.55,∑i =17(t i -t -)(y i -y -)=∑i =17t i y i -t -∑i =17y i =40.17-4×9.32=2.89,r ≈2.890.55×2×2.646≈0.99.因为y 与t 的相关系数近似为0.99,说明y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合y 与t 的关系.(2)由y -=9.327≈1.331及(1)得b ^=∑i =17(t i -t -)(y i -y -)∑i =17(t i -t -)2=2.8928≈0.103,a ^=y --b ^t -=1.331-0.103×4≈0.92.所以y 关于t 的回归方程为y ^=0.92+0.10t .将2019年对应的t =9代入回归方程,得y ^=0.92+0.10×9=1.82.所以预测2019年我国生活垃圾无害化处理量约为1.82亿吨.。
概率与统计1.【广西桂林市、崇左市2019届高三下学期二模联考】在某项测试中,测量结果ξ服从正态分布2(1,)(0)N σσ>,若(01)0.4P ξ<<=,则(02)P ξ<<=A .0.4B .0.8C .0.6D .0.2【答案】B【解析】由正态分布的图象和性质得(02)2(01)20.40.8P P ξξ<<=<<=⨯=.故选B . 【名师点睛】本题主要考查正态分布的图象和性质,考查正态分布指定区间的概率的求法,意在考查学生对这些知识的理解掌握水平和分析推理能力.2.【河南省洛阳市2019届高三第三次统一考试】已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为A .100,10B .100,20C .200,10D .200,20【答案】D【解析】由题得样本容量为(350020004500)2%100002%200++⨯=⨯=, 抽取的高中生人数为20002%40⨯=人,则近视人数为400.520⨯=人,故选D .3.【陕西省2019届高三年级第三次联考】同时抛掷2枚质地均匀的硬币4次,设2枚硬币均正面向上的次数为X ,则X 的数学期望是 A .1B .2C .32D .52【答案】A【分析】先计算依次同时抛掷2枚质地均匀的硬币,恰好出现2枚正面向上的概率,进而利用二项分布求数学期望即可.【解析】∵一次同时抛掷2枚质地均匀的硬币,恰好出现2枚正面向上的概率为111224⨯=, ∴1~(4,)4X B ,∴1()414E X =⨯=.故选A . 【名师点睛】求离散型随机变量期望的一般方法是先求分布列,再求期望.如果离散型随机变量服从二项分布~(,)B n p ,也可以直接利用公式()E np ξ=求数学期望.4.【江西省新八校2019届高三第二次联考】某学校高一年级1802人,高二年级1600人,高三年级1499人,先采用分层抽样的方法从中抽取98名学生参加全国中学生禁毒知识竞赛,则在高一、高二、高三三个年级中抽取的人数分别为 A .35,33,30 B .36,32,30 C .36,33,29D .35,32,31【答案】B【分析】先将各年级人数凑整,从而可确定抽样比;再根据抽样比计算得到各年级抽取人数. 【解析】先将每个年级的人数凑整,得高一:1800人,高二:1600人,高三:1500人,则三个年级的总人数所占比例分别为1849,1649,1549, 因此,各年级抽取人数分别为18983649⨯=,16983249⨯=,15983049⨯=,故选B . 5.【浙江省三校2019年5月第二次联考】已知甲口袋中有3个红球和2个白球,乙口袋中有2个红球和3个白球,现从甲、乙口袋中各随机取出一个球并相互交换,记交换后甲口袋中红球的个数为ξ,则()E ξ=A .145 B .135 C .73D .83【答案】A【分析】先求出ξ的可能取值及取各个可能取值时的概率,再利用1122()i i E p p p ξξξξ=++++可求得数学期望.【解析】ξ的可能取值为2,3,4,2ξ=表示从甲口袋中取出一个红球,从乙口袋中取出一个白球,故339(2)5525P ξ==⨯=;3ξ=表示从甲、乙口袋中各取出一个红球,或从甲、乙口袋中各取出一个白球,故322312(3)555525P ξ==⨯+⨯=;4ξ=表示从甲口袋中取出一个白球,从乙口袋中取出一个红球,故224(4)5525P ξ==⨯=,所以912414()2342525255E ξ=⨯+⨯+⨯=.故选A . 6.【福建省泉州市2019届高三第二次(5月)质检】已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则 A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s ><【答案】A【分析】分别根据数据的平均数和方差的计算公式,求得2,x s 的值,即可得到答案. 【解析】由题意,可得7050806070907050x ⨯+-+-==,设收集的48个准确数据分别记为1248,,,x x x ,则222221248175[(70)(70)(70)(6070)(9070)]50x x x =-+-++-+-+-22212481[(70)(70)(70)500]50x x x =-+-++-+, 22222212481[(70)(70)(70)(8070)(7070)]50s x x x =-+-++-+-+-22212481[(70)(70)(70)100]7550x x x =-+-++-+<, 所以275s <.故选A .【名师点睛】本题主要考查了数据的平均数和方差的计算公式的应用,其中解答中熟记数据的平均数和方差的公式,合理准确计算是解答的关键,着重考查了推理与运算能力,是基础题.7.【广东省汕头市2019届高三第二次模拟考试(B 卷)】在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间中点作代表,则下列说法中有误的是A .成绩在[70,80]分的考生人数最多B .不及格的考生人数为1000人C .考生竞赛成绩的平均分约70.5分D .考生竞赛成绩的中位数为75分【答案】D【解析】由频率分布直方图可得,成绩在[70,80]的频率最高,因此考生人数最多,故A 正确;由频率分布直方图可得,成绩在[40,60)的频率为0.25,因此,不及格的人数为40000.251000⨯=,故B 正确;由频率分布直方图可得:平均分等于450.1550.15650.2750.3850.15⨯+⨯+⨯+⨯+⨯+950.170.5⨯=,故C 正确;因为成绩在[40,70)的频率为0.45,由[70,80]的频率为0.3,所以中位数为0.05701071.670.3+⨯≈,故D 错误.故选D . 8.【天津市南开中学2019届高三模拟试题】《中国诗词大会》是央视推出的一档以“赏中华诗词,寻文化基因,品生活之美”为宗旨的大型文化类竞赛节目,邀请全国各个年龄段、各个领域的诗词爱好者共同参与诗词知识比拼.“百人团”由一百多位来自全国各地的选手组成,成员上至古稀老人,下至垂髫小儿,人数按照年龄分组统计如下表:(1)用分层抽样的方法从“百人团”中抽取6人参加挑战,求从这三个不同年龄组中分别抽取的挑战者的人数;(2)在(1)中抽出的6人中,任选2人参加一对一的对抗比赛,求这2人来自同一年龄组的概率. 【答案】(1)1,3,2;(2)415. 【分析】(1)先求出样本容量与总体个数的比,由此利用分层抽样的方法能求出从这三个不同年龄组中分别抽取的挑战者的人数;(2)从分层抽样的方法从“百人团”中抽取6人参加挑战,这三个不同年龄组[7,20),[20,40),[40,80)中分别抽取的挑战者的人数分别为1,3,2.从抽出的6人中,任选2人参加一对一的对抗比赛,基本事件总数26C 15n ==,这2人来自同一年龄组包含的基本事件个数为2232C C 4m =+=,由此能求出这2人来自同一年龄组的概率.【解析】(1)∵样本容量与总体个数的比是6110818=, ∴样本中包含3个年龄段落的个体数分别是:年龄在[7,20)的人数为6108⨯18=1, 年龄在[20,40)的人数为6108⨯54=3, 年龄在[40,80)的人数为6108⨯36=2, ∴从这三个不同年龄组[7,20),[20,40),[40,80)中分别抽取的挑战者的人数分别为1,3,2.(2)从分层抽样的方法从“百人团”中抽取6人参加挑战,这三个不同年龄组[7,20),[20,40),[40,80)中分别抽取的挑战者的人数分别为1,3,2.从抽出的6人中,任选2人参加一对一的对抗比赛,基本事件总数为26C 15n ==, 这2人来自同一年龄组包含的基本事件个数为2232C C 4m =+=,∴这2人来自同一年龄组的概率415m P n ==. 9.【2019北京市通州区三模】为调查某公司五类机器的销售情况,该公司随机收集了一个月销售的有关数据,公司规定同一类机器销售价格相同,经分类整理得到下表:利润率是指:一台机器销售价格减去出厂价格得到的利润与该机器销售价格的比值. (1)从该公司本月卖出的机器中随机选一台,求这台机器利润率高于0.2的概率;(2)从该公司本月卖出的销售单价为20万元的机器中随机选取2台,求这两台机器的利润率不同的概率;(3)假设每类机器利润率不变,销售一台第一类机器获利1x 万元,销售一台第二类机器获利2x 万元,…,销售一台第五类机器获利5x ,依据上表统计数据,随机销售一台机器获利的期望为()E x ,设123455x x x x x x ++++=,试判断()E x 与x 的大小.(结论不要求证明)【答案】(1)13;(2)1021;(3)()E x x <.【分析】(1)先由题意确定,本月卖出机器的总数,再确定利润率高于0.2的机器总数,即可得出结果;(2)先由题意确定,销售单价为20万元的机器分别:是第一类有5台,第三类有10台,共有15台,记两台机器的利润率不同为事件B ,由11510215C C ()C P B =即可结果;(3)先由题意确定,x 可能取的值,求出对应概率,进而可得出()E x ,再由123455x x x x x x ++++=求出均值,比较大小,即可得出结果.【解析】(1)由题意知,本月共卖出30台机器, 利润率高于0.2的是第一类和第四类,共有10台.设“这台机器利润率高于0.2”为事件A ,则101()303P A ==. (2)用销售总额除以销售量得到机器的销售单价,可知第一类与第三类的机器销售单价为20万, 第一类有5台,第三类有10台,共有15台,随机选取2台有215C 种不同方法, 两台机器的利润率不同则每类各取一台有11510C C 种不同方法,设两台机器的利润率不同为事件B ,则11510215C C 10()C 21P B ==. (3)由题意可得,x 可能取的值为8,5,3,1051(8)306P x ===,21(5)3015P x ===, 1083(3)305P x +===,51(10)306P x ===,因此113177853*******(55)E x =⨯+⨯+⨯+⨯=;又8531032955x ++++==,所以()E x x <.10.【江西省新八校2019届高三第二次联考】某种水果按照果径大小可分为四类:标准果、优质果、精品果、礼品果.某采购商从采购的一批水果中随机抽取100个,利用水果的等级分类标准得到的数据如下:(1)若将频率是为概率,从这100个水果中有放回地随机抽取4个,求恰好有2个水果是礼品果的概率;(结果用分数表示)(2)用样本估计总体,果园老板提出两种购销方案给采购商参考, 方案1:不分类卖出,单价为20元/kg . 方案2:分类卖出,分类后的水果售价如下:从采购单的角度考虑,应该采用哪种方案?(3)用分层抽样的方法从这100个水果中抽取10个,再从抽取的10个水果中随机抽取3个,X 表示抽取的是精品果的数量,求X 的分布列及数学期望()E X .【答案】(1)96625;(2)第一种方案;(3)分布列见解析,6()5E X =. 【分析】(1)计算出从100个水果中随机抽取一个,抽到礼品果的概率;则可利用二项分布的概率公式求得所求概率;(2)计算出方案2单价的数学期望,与方案1的单价进行比较,选择单价较低的方案;(3)根据分层抽样原则确定抽取的10个水果中,精品果4个,非精品果6个;则X 服从超几何分布,利用超几何分布的概率计算公式可得到每个X 取值对应的概率,从而可得分布列;再利用数学期望的计算公式求得结果.【解析】(1)设从100个水果中随机抽取一个,抽到礼品果的事件为A ,则201()1005P A ==, 现有放回地随机抽取4个,设抽到礼品果的个数为X ,则1~(4,)5X B , 所以恰好抽到2个礼品果的概率为22244196(2)C ()()55625P X ===, (2)设方案2的单价为ξ,则单价的期望值为134216548848()1618222420.61010101010E ξ+++=⨯+⨯+⨯+⨯==, 因为()20E ξ>,所以从采购商的角度考虑,应该采用第一种方案. (3)用分层抽样的方法从100个水果中抽取10个,则其中精品果4个,非精品果6个, 现从中抽取3个,则精品果的数量X 服从超几何分布,所有可能的取值为0,1,2,3,则36310C 1(0)C 6P X ===;2164310C C 1(1)C 2P X ===; 1264310C C 3(2)C 10P X ===;34310C 1(3)C 30P X ===,所以X 的分布列如下:所以()01236210305E X =⨯+⨯+⨯+⨯= 【名师点睛】本题考查二项分布求解概率、数学期望的实际应用、超几何分布的分布列与数学期望的求解问题,关键是能够根据抽取方式确定随机变量所服从的分布类型,从而可利用对应的概率公式求解出概率.。