高考数学(文)【六大解答题2】统计与概率 2
- 格式:doc
- 大小:727.41 KB
- 文档页数:14
高考数学概率统计专题题库概率统计是高考数学中的一大重点,对于学生来说是一个难点。
为了帮助同学们更好地掌握概率统计的知识,我们特地整理了一套专题题库,旨在提高同学们的题目解答能力。
以下是该题库中的一些典型题目,供同学们参考。
1. 事件A与事件B相互独立,且P(A)=0.2,P(B)=0.3,求P(A∩B)。
解析:由于事件A与事件B相互独立,所以P(A∩B) = P(A) * P(B)= 0.2 * 0.3 = 0.06。
2. 已知事件A的概率为0.6,事件B的概率为0.4,事件A与事件B相互独立,求事件A或事件B发生的概率。
解析:由于事件A与事件B相互独立,所以P(A或B) = P(A) + P(B) - P(A∩B) = 0.6 + 0.4 - (0.6 * 0.4) = 0.76。
3. 有一批产品,其中80%是合格品,20%是次品。
从中随机抽取3个产品进行检验,求恰好有1个次品的概率。
解析:使用组合数的知识,可以知道从总共的产品中选择1个次品和2个合格品的方法有C(1,1) * C(2,0) = 1种。
所以恰好有1个次品的概率为P = (0.2 * 0.8 * 0.8) = 0.128。
4. 某市共有100辆出租车,其中60辆汽车是空车,40辆汽车是有客人的。
一名乘客拦出租车时,随机选择一辆,发现是空车,求另一辆是空车的概率。
解析:由于已经知道选择的出租车是空车,所以可以将问题简化为从剩下的99辆车中选择一辆是空车的概率。
根据全概率公式,可知选择一辆是空车的概率为P = (60/100) * (59/99) = 0.3636。
5. 有一个罐子,里面有红球、黄球、蓝球各20个。
将这些球随机取出2个,求取出的两个球颜色相同的概率。
解析:首先计算红球颜色相同的概率,即取出两个红球的概率为P1 = (20/60) * (19/59) = 0.1153。
同理,黄球颜色相同的概率为P2 = (20/60) * (19/59) = 0.1153,蓝球颜色相同的概率为P3 = (20/60) * (19/59) =0.1153。
考纲解读明方向分析解读 本节内容是高考的重点考查内容之一,最近几年的高考有以下特点:1.古典概型主要考查等可能性事件发生的概率,也常与对立事件、互斥事件的概率及统计知识综合起来考查;2.几何概型试题也有所体现,可能考查会有所增加,以选择题、填空题为主.本节内容在高考中分值为5分左右,属容易题.分析解读从近几年的高考试题来看,本部分在高考中的考查点如下:1.主要考查分层抽样的定义,频率分布直方图,平均数、方差的计算,识图能力及借助概率知识分析、解决问题的能力;2.在频率分布直方图中,注意小矩形的高=频率/组距,小矩形的面积为频率,所有小矩形的面积之和为1;3.分析两个变量间的相关关系,通过独立性检验判断两个变量是否相关.本节内容在高考中分值为17分左右,属中档题.1.【2018年浙江卷】设0<p<1,随机变量ξ的分布列是则当p在(0,1)内增大时,A. D(ξ)减小B. D(ξ)增大C. D(ξ)先减小后增大D. D(ξ)先增大后减小【答案】D【解析】分析:先求数学期望,再求方差,最后根据方差函数确定单调性.点睛:2.【2018年全国卷Ⅲ文】若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为A. 0.3B. 0.4C. 0.6D. 0.7【答案】B【解析】分析:由公式计算可得详解:设设事件A为只用现金支付,事件B为只用非现金支付,则,因为,所以,故选B.点睛:本题主要考查事件的基本关系和概率的计算,属于基础题。
3.【2018年全国卷II文】从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为A. B. C. D.【答案】D【解析】分析:分别求出事件“2名男同学和3名女同学中任选2人参加社区服务”的总可能及事件“选中的2人都是女同学”的总可能,代入概率公式可求得概率.点睛:应用古典概型求某事件的步骤:第一步,判断本试验的结果是否为等可能事件,设出事件;第二步,分别求出基本事件的总数与所求事件中所包含的基本事件个数;第三步,利用公式求出事件的概率.4.【2018年江苏卷】某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为________.【答案】【解析】分析:先确定总基本事件数,再从中确定满足条件的基本事件数,最后根据古典概型概率公式求概率.详解:从5名学生中抽取2名学生,共有10种方法,其中恰好选中2名女生的方法有3种,因此所求概率为点睛:古典概型中基本事件数的探求方法(1)列举法.(2)树状图法:适合于较为复杂的问题中的基本事件的探求.对于基本事件有“有序”与“无序”区别的题目,常采用树状图法.(3)列表法:适用于多元素基本事件的求解问题,通过列表把复杂的题目简单化、抽象的题目具体化.(4)排列组合法(理科):适用于限制条件较多且元素数目较多的题目.5.【2018年江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.【答案】90【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.点睛:的平均数为.6.【2018年全国卷Ⅲ文】某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【答案】分层抽样【解析】分析:由题可知满足分层抽样特点详解:由于从不同龄段客户中抽取,故采用分层抽样,故答案为:分层抽样。
高考数学复习专题训练—统计与概率解答题1.(2021·广东广州二模改编)根据相关统计,2010年以后中国贫困人口规模呈逐年下降趋势,2011~2019年全国农村贫困发生率的散点图如下:注:年份代码1~9分别对应年份2011年~2019年.(1)求y 关于t 的经验回归方程(系数精确到0.01);(2)已知某贫困地区的农民人均年纯收入X (单位:万元)满足正态分布N (1.6,0.36),若该地区约有97.72%的农民人均纯收入高于该地区最低人均年纯收入标准,则该地区最低人均年纯收入标准大约为多少万元?参考数据与公式:∑i=19y i =54.2,∑i=19t i y i =183.6. 经验回归直线y ^=b ^t+a ^的斜率和截距的最小二乘估计分别为b ^=∑i=1n t i y i -nt y ∑i=1n (t i -t )2 ,a ^=y −b ^t . 若随机变量X 服从正态分布N (μ,σ2),则P (μ-σ≤X ≤μ+σ)≈0.682 7,P (μ-2σ≤X ≤μ+2σ)≈0.954 5,P (μ-3σ≤X ≤μ+3σ)≈0.997 3.2.(2021·湖北黄冈适应性考试改编)产品质量是企业的生命线.为提高产品质量,企业非常重视产品生产线的质量.某企业引进了生产同一种产品的A,B 两条生产线,为比较两条生产线的质量,从A,B 生产线生产的产品中各自随机抽取了100件产品进行检测,把产品等级结果和频数制成了如图的统计图.(1)依据小概率值α=0.025的独立性检验,分析数据,能否据此推断是否为一级品与生产线有关.(2)生产一件一级品可盈利100元,生产一件二级品可盈利50元,生产一件三级品则亏损20元,以频率估计概率.①分别估计A,B生产线生产一件产品的平均利润;②你认为哪条生产线的利润较为稳定?并说明理由.附:①参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.②临界值表:3.(2021·福建宁德模拟改编)某工厂为了检测一批新生产的零件是否合格,从中随机抽测100个零件的长度d(单位:mm).该样本数据分组如下:[57,58),[58,59),[59,60),[60,61),[61,62),[62,63],得到如图所示的频率分布直方图.经检测,样本中d大于61的零件有13个,长度分别为61.1,61.1,61.2,61.2,61.3,61.5,61.6,61.6,61.8,61.9,62.1,62.2,62.6.(1)求频率分布直方图中a,b,c的值及该样本的平均长度x(结果精确到1 mm,同一组数据用该区间的中点值作代表);(2)视该批次样本的频率为总体的概率,从工厂生产的这批新零件中随机选取3个,记ξ为抽取的零件长度在[59,61)的个数,求ξ的分布列和数学期望;(3)若变量X满足|P(μ-σ≤X≤μ+σ)-0.682 7|<0.03且|P(μ-2σ≤X≤μ+2σ)-0.954 5|≤0.03,则称变量X满足近似于正态分布N(μ,σ2)的概率分布.如果这批样本的长度d满足近似于正态分布N(x,12)的概率分布,则认为这批零件是合格的,将顺利出厂;否则不能出厂.请问,能否让该批零件出厂?4.(2021·山东潍坊期末)在一个系统中,每一个设备能正常工作的概率称为设备的可靠度,而系统能正常工作的概率称为系统的可靠度,为了增加系统的可靠度,人们经常使用“备用冗余设备”(即正在使用的设备出故障时才启动的设备).已知某计算机网络服务器系统采用的是“一用两备”(即一台正常设备,两台备用设备)的配置,这三台设备中,只要有一台能正常工作,计算机网络就不会断掉.设三台设备的可靠度均为r(0<r<1),它们之间相互不影响.(1)要使系统的可靠度不低于0.992,求r的最小值;(2)当r=0.9时,求能正常工作的设备数X的分布列;(3)已知某高科技产业园当前的计算机网络中每台设备的可靠度是0.7,根据以往经验可知,计算机网络断掉可能给该产业园带来约50万元的经济损失.为减少对该产业园带来的经济损失,有以下两种方案:方案1:更换部分设备的硬件,使得每台设备的可靠度维持在0.9,更新设备硬件总费用为8万元; 方案2:对系统的设备进行维护,使得设备可靠度维持在0.8,设备维护总费用为5万元.请从期望损失最小的角度判断决策部门该如何决策?答案及解析1.解 (1)t =1+2+3+4+5+6+7+8+99=5, y =12.7+10.2+8.5+7.2+5.7+4.5+3.1+1.7+0.69≈6.02, b ^=∑i=19t i y i -9t y∑i=19(t i -5)2=183.6-270.960≈-1.46,a ^=y −b ^t =6.02-(-1.46)×5=13.32.故y 关于t 的经验回归方程为y ^=-1.46t+13.32.(2)因为P (μ-2σ≤X ≤μ+2σ)≈0.954 5,所以P (X>μ-2σ)=0.954 5+1-0.954 52=0.977 25. 因为某贫困地区的农民人均年纯收入X 满足正态分布N (1.6,0.36),所以μ=1.6,σ=0.6,μ-2σ=0.4,P (X>0.4)=0.977 25,故该地区最低人均年纯收入标准大约为0.4万元.2.解 (1)根据已知数据可建立列联表如下:零假设为H 0:是否为一级品与生产线无关.χ2=n (ad -bc )2(a+b )(c+d )(a+c )(b+d )=200×(20×65-35×80)255×145×100×100≈5.643>5.024=x 0.025,依据小概率值α=0.025的独立性检验,推断H 0不成立,即认为是否为一级品与生产线有关.(2)A 生产线生产一件产品为一、二、三级品的概率分别为15,35,15.记A 生产线生产一件产品的利润为X ,则X 的取值为100,50,-20,其分布列为B生产线生产一件产品为一、二、三级品的概率分别为720,25 ,14.记B生产线生产一件产品的利润为Y,则Y的取值为100,50,-20, 其分布列为①E(X)=100×15+50×35+(-20)×15=46,E(Y)=100×720+50×25+(-20)×14=50.故A,B生产线生产一件产品的平均利润分别为46元、50元.②D(X)=(100-46)2×15+(50-46)2×35+(-20-46)2×15=1 464.D(Y)=(100-50)2×720+(50-50)2×25+(-20-50)2×14=2 100.因为D(X)<D(Y),所以A生产线的利润更为稳定.3.解(1)由题意可得P(61≤d<62)=10100=0.1,P(62≤d≤63)=3100=0.03,P(59≤d<60)=P(60≤d<61)=12(1-2×0.03-0.14-0.1)=0.35,所以a=0.031=0.03,b=0.11=0.1,c=0.351=0.35.x=(57.5+62.5)×0.03+58.5×0.14+(59.5+60.5)×0.35+61.5×0.1=59.94≈60.(2)由(1)可知从该工厂生产的新零件中随机选取1件,长度d在(59,61]的概率P=2×0.35=0.7,且随机变量ξ服从二项分布ξ~B(3,0.7),所以P(ξ=0)=C30×(1-0.7)3=0.027,P(ξ=1)=C31×0.7×(1-0.7)2=0.189,P(ξ=2)=C32×0.72×(1-0.7)=0.441,P(ξ=3)=C33×0.73=0.343,所以随机变量ξ的分布列为E(ξ)=0×0.027+1×0.189+2×0.441+3×0.343=2.1.(3)由(1)及题意可知x=60,σ=1.所以P(x-σ≤X≤x-σ)=P(59≤X≤61)=0.7.|P(x-σ≤X≤x+σ)-0.682 7|=|0.7-0.682 7|=0.017 3≤0.03,P(x-2σ≤X≤x-2σ)=P(58≤X≤62)=0.14+0.35+0.35+0.1=0.94,|P(x-2σ≤X≤x+2σ)-0.954 5|=|0.94-0.954 5|=0.014 5≤0.03.所以这批新零件的长度d满足近似于正态分布N(x,12)的概率分布.所以能让该批零件出厂.4.解(1)要使系统的可靠度不低于0.992,则P(X≥1)=1-P(X<1)=1-P(X=0)=1-(1-r)3≥0.992,解得r≥0.8,故r的最小值为0.8.(2)X为正常工作的设备数,由题意可知,X~B(3,r),P(X=0)=C30×0.90×(1-0.9)3=0.001,P(X=1)=C31×0.91×(1-0.9)2=0.027,P(X=2)=C32×0.92×(1-0.9)1=0.243,P(X=3)=C33×0.93×(1-0.9)0=0.729,从而X的分布列为(3)设方案1、方案2的总损失分别为X1,X2,采用方案1,更换部分设备的硬件,使得设备可靠度达到0.9,由(2)可知计算机网络断掉的概率为0.001,不断掉的概率为0.999,故E(X1)=80000+0.001×500 000=80 500元.采用方案2,对系统的设备进行维护,使得设备可靠度维持在0.8,由(1)可知计算机网络断掉的概率为0.008,故E(X2)=50 000+0.008×500 000=54 000元,因此,从期望损失最小的角度,决策部门应选择方案2.。
2023年高考数学真题试卷(全国甲卷)文科数学一、选择题:本题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.1.设全集,集合,则()A.B.C.D.2.()A.B.1C.D.3.已知向量,则()A.B.C.D.4.某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为()A.B.C.D.5.记为等差数列的前项和.若,则()A.25B.22C.20D.156.执行下边的程序框图,则输出的()A.21B.34C.55D.897.设为椭圆的两个焦点,点在上,若,则()A.1B.2C.4D.58.曲线在点处的切线方程为()A.B.C.D.9.已知双曲线的离心率为,其中一条渐近线与圆交于A,B两点,则()A.B.C.D.10.在三棱锥中,是边长为2的等边三角形,,则该棱锥的体积为()A.1B.C.2D.311.已知函数.记,则()A.B.C.D.12.函数的图象由的图象向左平移个单位长度得到,则的图象与直线的交点个数为()A.1B.2C.3D.4二、填空题:本大题共4小题,每小题5分,共20分.13.记为等比数列的前项和.若,则的公比为.14.若为偶函数,则.15.若x,y满足约束条件,则的最大值为.16.在正方体中,为的中点,若该正方体的棱与球的球面有公共点,则球的半径的取值范围是.三、解答题:共70分.解答应写出文字说明、证明过程或演算步骤.第17~21题为必考题,每个试题考生都必须作答.第22、23题为选考题,考生根据要求作答.17.记的内角的对边分别为,已知.(1)求;(2)若,求面积.18.如图,在三棱柱中,平面.(1)证明:平面平面;(2)设,求四棱锥的高.19.一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表对照组试验组(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:,0.1000.0500.0102.7063.841 6.63520.已知函数.(1)当时,讨论的单调性;(2)若,求的取值范围.21.已知直线与抛物线交于两点,.(1)求;(2)设为的焦点,为上两点,且,求面积的最小值.22.已知点,直线(为参数),为的倾斜角,与轴正半轴、轴正半轴分别交于,且.(1)求;(2)以坐标原点为极点,轴正半轴为极轴建立极坐标系,求的极坐标方程.23.已知.(1)求不等式的解集;(2)若曲线与轴所围成的图形的面积为2,求.答案解析部分1.【答案】A【解析】【解答】,故选:A【分析】先计算补集,再求并集即得答案.2.【答案】C【解析】【解答】,故选:C【分析】利用复数乘法运算计算由得出答案。
概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
重难点05 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【限时检测】(建议用时:35分钟)一、单选题1.(2021·广西钦州一中高三开学考试(文))点在边长为2的正方形内运动,P ABCD 则动点到顶点的距离的概率为( )P A 2PA <A .B .C .D .14124ππ【答案】C 【解析】分析:先根据题意得出PA 等于2 的临界值情况,再根据几何概型求解即可.详解:由题可知当PA=2时是以A 为圆心2为半径的四分之一圆,所以概率为P=,故选C21444r ππ=2.(2020·全国高三其他模拟(文))从某高中女学生中选取10名学生,根据其身高、体重数据,得到体重关于身高的回归方程,用来刻画回归效(cm)(kg)ˆ0.8585yx =-果的相关指数,则下列说法正确的是( )20.6R =A .这些女学生的体重和身高具有非线性相关关系B .这些女学生的体重差异有60%是由身高引起的C .身高为的女学生的体重一定为170cm 59.5kgD .这些女学生的身高每增加,其体重约增加0.85cm 1kg 【答案】B【分析】因为回归方程为,且刻画回归效果的相关指数,所以,ˆ0.8585y x =-20.6R =这些女学生的体重和身高具有线性相关关系,A 错误;这些女学生的体重差异有60%是由身高引起的,B 正确;时,,预测身高为的女学生体重为,C 错170x =ˆ0.851708559.5y=⨯-=170cm 59.5kg 误;这些女学生的身高每增加,其体重约增加,D 错误.0.85cm 0.850.850.7225(kg)⨯=故选:B3.(2020·石嘴山市第三中学高三其他模拟(文))网络是一种先进的高频传输技5G 术,我国的技术发展迅速,已位居世界前列.华为公司2019年8月初推出了一款手5G 5G 机,现调查得到该款手机上市时间和市场占有率(单位:%)的几组相关对应数5G x y 据.如图所示的折线图中,横轴1代表2019年8月,2代表2019年9月……,5代表2019年12月,根据数据得出关于的线性回归方程为.若用此方程分析并预y x0.042y x a =+测该款手机市场占有率的变化趋势,则最早何时该款手机市场占有率能超过0.5%(精5G 确到月)()A .2020年6月B .2020年7月C .2020年8月D .2020年9月【答案】C【分析】:,1(12345)35x =⨯++++=1(0.020.050.10.150.18)0.15y =⨯++++=点在直线上()3,0.1ˆˆ0.042y x a =+,ˆ0.10.0423a=⨯+ˆ0.026a =-ˆ0.0420.026yx =-令ˆ0.0420.0260.5y x =->13x ≥因为横轴1代表2019年8月,所以横轴13代表2020年8月,故选:C4.(2020·河南新乡市·高三一模(文))年的“金九银十”变成“铜九铁十”,全2020国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年2019月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月11202011份代码分别对应年月年月)113:2019112020:11根据散点图选择和两个模型进行拟合,经过数据处理得到的两y a =+ln y c d x =+个回归方程分别为,并得到以下一些0.9369y =+0.95540.0306ln y x =+统计量的值:是()A .当月在售二手房均价与月份代码呈正相关关系y xB .根据年月在售二手房均价约为万元/0.9369y =+20212 1.0509平方米C .曲线的图形经过点0.9369y =+0.95540.0306ln y x =+()x yD .回归曲线的拟合效果好于的拟合效0.95540.0306ln y x =+ 0.9369y =+果【答案】C【分析】对于A ,散点从左下到右上分布,所以当月在售二手房均价与月份代码呈正y x 相关关系,故A 正确;对于B ,令,由,16x =0.9369 1.0509y =+=所以可以预测年月在售二手房均价约为万元/平方米,故B 正确;20212 1.0509对于C ,非线性回归曲线不一定经过,故C 错误;()x y 对于D ,越大,拟合效果越好,故D 正确.2R 故选:C.5.(2020·全国高三专题练习(文))现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )A .样本中的女生数量多于男生数量B .样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C .样本中的男生偏爱两理一文D .样本中的女生偏爱两文一理【答案】D【分析】:由条形图知女生数量多于男生数量,故A 正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B 正确;男生偏爱两理一文,故C 正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D 错误.故选:D.6.(2021·全国高三专题练习(文))下图为中国古代刘徽的《九章算术注》中研究“勾股容方”问题的图形,图中为直角三角形,四边形为它的内接正方形,已知ABC :DEFC ,,在内任取一点,则此点取自正方形内的概率为(2BC =4AC =ABC :DEFC)A .B .C .D .12592949【答案】D【分析】解:,,4tan 22AC B BC === tan 2EFB FB ∴==,解得,22()2(2)EF FB BC EF EF ==-=-43EF =,,1142422ACB S AC BC ∴==⨯⨯=::4416339DEFC S =⨯=根据几何概型.164949P ==故选:D .7.(2021·江西新余市·高三期末(文))2013年华人数学家张益唐证明了孪生素数猜想的一个弱化形式.孪生素数猜想是希尔伯特在1900年提出的23个问题之一,可以这样描述:存在无穷多个素数,使得是素数.素数对称为孪生素数.从15以p 2p +(,2)p p +内的素数中任取2个构成素数对,其中是孪生素数的概率为()A .B .C .D .13141516【答案】C【分析】以内的素数有,,,,,,共个,任取两个构成素数对,则152********有:,,,,,,,,,,()2,3()2,5()2,7()2,11()2,13()3,5()3,7()3,11()3,13()5,7,,,,,共中取法,而是孪生素数的有,()5,11()5,13()7,11()7,13()11,1315()3,5,,其概率为.()5,7()11,1331155p ==故选:C.8.(2021·安徽阜阳市·高三期末(文))如图,根据已知的散点图,得到y 关于x 的线性回归方程为,则( )ˆ0.2y bx =+ˆb =A .1.5B .1.8C .2D .1.6【答案】D【分析】因为,所以,解得12345235783,555x y ++++++++====530.2b =+ .1.6b = 故选:D .9.(2021·全国高三专题练习(文))在上随机取一个数,则事件“直线与[]1,1-k y kx =圆相交”发生的概率为( )22(x 13)25y -+=A .B .12513C .D .51234【答案】C【分析】直线与圆相交y kx =22(x 13)25y -+=555,1212d k ⎛⎫⇒∈- ⎪⎝⎭直线斜率时与圆相交,故所求概率.55,1212k ⎛⎫∈- ⎪⎝⎭10512212P ==故答案选C10.(2021·全国高三专题练习(文))给出下列说法:①回归直线恒过样本点的中心,且至少过一个样本点;ˆˆˆy bx a =+(,)x y ②两个变量相关性越强,则相关系数就越接近1;||r ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少ˆ20.5y x =-x ˆy0.5个单位.其中说法正确的是( )A .①②④B .②③④C .①③④D .②④【答案】B【分析】对于①中,回归直线恒过样本点的中心,但不一定过一个样本ˆˆˆy bx a =+(x y 点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,||r 所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程中,当解释变量增ˆ20.5y x =-x 加一个单位时,预报变量平均减少0.5个单位,所以是正确的.ˆy 故选:B.11.(2020·江西吉安市·高三其他模拟(文))给出一组样本数据:1,4,,3,它们出m 现的频率分别为0.1,0.1,0.4,0.4,且样本数据的平均值为2.5,从1,4,,3中任取m 两个数,则这两个数的和为5的概率为()A .B .C .D .12231314【答案】C【分析】由题意得,样本平均值为,解得,10.140.10.430.4 2.5m ⨯+⨯+⨯+⨯=2m =即这组样本数据为1,4,2,3,从中任取两个有,,,,,共6种情况,()1,4()1,2()1,3()4,2()4,3()2,3其中和为5的有,两种情况,()1,4()2,3∴所求概率为,2163P ==故选:C.12.(2020·全国高三专题练习(理))物流业景气指数反映物流业经济发展的总体LPI 变化情况,以作为经济强弱的分界点,高于时,反映物流业经济扩张;低于50%50%时,则反映物流业经济收缩。
统计与概率大题解题模板 一、随机抽样和用样本估计总体模板一、频率分布直方图1、频率分布直方图的性质:(1)小矩形的面积=组距×频率/组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小; (2)在频率分布直方图中,各小矩形的面积之和等于1; (3)频数/相应的频率=样本容量.2、频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内的可能性.3、频率分布直方图中的纵坐标为频率组距,而不是频率值.例1-1.某城市100户居民月平均用电量(单位:度),以[160180),、[180200),、[200220),、[220240),、[240260),、[260280),、]280[300,分组的频率分布直方图如图.(1)求直方图中x 的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220240),、[240260),、[260280),、]280[300,的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220240),的用户中应抽取多少户? 【解析】(1)由(0.0020.00950.0110.01250.0050.0025)201x ++++++⨯=得:0.0075x =,∴直方图中x 的值是0.0075;(2)月平均用电量的众数是2202402302+=,∵(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220240),内,设中位数为a , 由(0.0020.00950.011)200.0125(220)0.5a ++⨯+⨯-=得:224a =, ∴月平均用电量的中位数是224;(3)月平均用电量为[220240),的用户有0.01252010025⨯⨯=户, 月平均用电量为[240260),的用户有0.00752010015⨯⨯=户, 月平均用电量为[260280),的用户有0.0052010010⨯⨯=户, 月平均用电量为]280[300,的用户有0.0025201005⨯⨯=户, 抽取比例11125151055==+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.模板二、茎叶图1、绘制茎叶图的关键是分清茎和叶,如数据是两位数,十位数字为“茎”,个位数字为“叶”;如果是小数时,通常把整数部分作为“茎”,小数部分作为“叶”,解题时要根据数据的特点合理选择茎和叶.2、利用茎叶图进行数据分析时,一般从数据分布的对称性、中位数、稳定性等几个方面来考虑. 例1-2.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下: 甲:95、81、75、91、86、89、71、65、76、88、94、110、107; 乙:83、86、93、99、88、103、98、114、98、79、78、106、101. 画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较. 【解析】甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的, 中位数是98;甲同学的得分情况,也大致对称,中位数是88, 乙同学的成绩比较稳定,总体情况比甲同学好.模板三、散点图1、两个变量的关系2、散点图:将样本中n 个数据点()i i x y ,(1i =,2,…,n )描在平面直角坐标系中得到的图形.3、正相关与负相关:(1)正相关:如果一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.(2)负相关:如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关. 4、最小二乘法:设x 、y 的一组观察值为()i i x y ,(1i =,2,…,n ),且回归直线方程为ˆˆˆybx a =+.当x 取值i x (1i =,2,…,n )时,y 的观察值为i y ,差ˆi i y y -(1i =,2,…,n )刻画了实际观察值i y 与回归直线上相应点纵坐标之间的偏离程度,通常是用离差的平方和,即21()ni i i Q y a bx ==--∑作为总离差,并使之达到最小.这样,回归直线就是所有直线中Q 取最小值的那一条.由于平方又叫二乘方,所以这种使“离差平方和最小”的方法,叫做最小二乘法. 5、回归直线方程的系数计算公式例1-3.一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10次试验,收集数据如下:(1)y 与x 是否具有线性相关关系?(2)如果y 与x 具有线性相关关系,求y 关于x 的回归直线方程. 审题路线图:→→→【解析】(1)画散点图如下:由图可知y 与x 具有线性相关关系;(2)列表、计算:1102211055950105591.70.66838500105520ˆ1iii ii x y x ybxx ==⋅-⋅⋅-⨯⨯==≈-⨯-⋅∑∑,91.70.668ˆ55.6ˆ549ay bx =-=-⨯=,即所求的回归直线方程为:0.66859ˆ 4.6y x =+.构建答题模板:第一步:列表i x 、i y 、i i x y ;第二步:计算x ,y ,21ni i x =∑,1ni i i x y =∑;第三步:代入公式计算ˆb 、ˆa 的值; 第四步:写出回归直线方程;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.模板四、古典概型例1-4.袋中有五张卡片,其中红色卡片三张,标号为1、2、3;蓝色卡片两张,标号为1、2. (1)从以上五张卡片中任取两张,求这两张卡片颜色不同且标号之和小于4的概率;(2)向袋中再放入一张标号为0的绿色卡片,从这六张卡片中任取两张,求这两张卡片颜色不同且标点之和小于4的概率.审题路线图:确定概率模型→列出所有取卡片的结果(基本事件)→构成事件的基本事件→求概率. 规范解答:【解析】(1)标号为1、2、3的三张红色卡片分别记为A 、B 、C , 标号为1、2的两张蓝色卡片分别记为D 、E , 从五张卡片中任取两张的所有可能的结果为:AB 、AC 、AD 、AE 、BC 、BD 、BE 、CD 、CE 、DE 共10种,由于每一张卡片被取到的机会均等,因此这些基本事件的出现是等可能的, 从五张卡片中任取两张,这两张卡片颜色不同且它们的标号之和小于4的结果为:AD 、AE 、BD ,共3种,∴这两张卡片颜色不同且它们的标号之和小于4的概率为310;(2)记F 是标号为0的绿色卡片,从六张卡中任取两张的所有可能的结果为:AB 、AC 、AD 、AE 、AF 、BC 、BD 、BE 、BF 、CD 、CE 、CF 、DE 、DF 、EF 共15种,用于每一张卡片被取到的机会均等,因此这些基本事件的出现是等可能的, 从六张卡片中任取两张,这两张卡片颜色不同且它们的标号之和小于4的结果为:AD 、AE 、BD 、AF 、BF 、CF 、DF 、EF ,共8种, ∴这两张卡片颜色不同且它们的标号之和小于4的概率为815. 构建答题模板:第一步:列出所有基本事件,计算基本事件总数;第二步:将所求事件分解为若干个互斥的事件或转化为其对立事件(也许不用分解,但分解必要注意互斥);第三步:分别计算每个互斥事件的概率;第四步:利用概率的加法公式求出问题事件的概率;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.二、概率与统计之超几何分布与二项分布离散型随机变量的分布列、数学期望与方差1、关于离散型随机变量分布列的计算方法如下: (1)写出ξ的所有可能取值;(2)用随机事件概率的计算方法,求出ξ取各个值的概率; (3)利用(1)、(2)的结果写出ξ的分布列. 2、常见的特殊离散型随机变量的分布列:(1)两点分布,分布列为(0p -、1q -),其中01p <<,且1p q +=;(2)二项分布,分布列为(00p 、11p 、22p 、…、k kp 、…、n np ),其中k k n kk n p C p q -=,0k =、1、2、…、n ,且01p <<,1p q +=,k k n k k n p C p q -=可记为(,,)b k n p .3、对离散型随机变量的期望应注意:(1)期望是算术平均值概念的推广,是概念意义下的平均;(2)()E ξ是一个实数,由ξ的分布列唯一确定,即作为随机变量ξ是可变的,可取不同值,而()E ξ是不变的,它描述ξ取值的平均状态;(3)()1122n n E x p x p x p ξ=++⋅⋅⋅++⋅⋅⋅直接给出了E ξ的求法,即随机变量取值与相应概率值分别相乘后相加.4、对离散型随机变量的方差应注意:(1)()D ξ表示随机变量ξ对()E ξ的平均偏离程度,()D ξ越大表明平均偏离程度越大,说明ξ的取值越分散;反之()D ξ越小,ξ的取值越集中,在()E ξ来描述ξ的分散程度.(2)()D ξ与()E ξ一样也是一个实数,由ξ的分布列唯一确定.模板一、超几何分布——离散型随机变量的分布列、期望与方差(1)超几何分布的特征:①在小范围内不放回的随机抽取;②每次抽取相互影响;③每次抽取的可能性一直变化;(2)超几何分布的题型:在含有M 件次品的N 件产品中任取n 件(n M N ≤≤),其中恰有X 件次品;(3)超几何分布的分布列、期望与方差:①分布列:()k n k M N MnNC C P X k C --⋅==,012k n =⋅⋅⋅,,,,,k ∈N ;②期望:0()[()]nk nME X k P X k N ===⋅=∑; ③{}22()()()[()]()(1)nk nM N M N n D X k E x P X k N N =--==-⋅=-∑. 例2-1.已知一个袋中装有3个白球和3个红球,这些球除颜色外完全相同.(1)每次从袋中取一个球,取出后不放回,直到取到一个红球为止,求取球次数ξ的分布列和数学期望()E ξ;(2)每次从袋中取一个球,取出后放回接着再取一个球,这样取3次,求取出红球次数η的分布列、数学期望和方差()D η.审题路线图:取到红球为止→取球次数的所有可能1、2、3、4→求对应次数的概率→列分布列→求()E ξ.取出后放回,这是条件→每次取到红球的概率相同→三次独立重复试验→利用公式. 规范解答:【解析】(1)ξ的可能取值为1、2、3、4,31(1)62P ξ===,333(2)6510P ξ==⨯=, 3233(3)65420P ξ==⨯⨯=,32131(4)654320P ξ==⨯⨯⨯=,故ξ的分布列为:17()123421020204E ξ=⨯+⨯+⨯+⨯=;(2)取出后放回,取球3次,可看作3次独立重复试验,∴1~(2)2B η,,η的可能取值为0、1、2、3,0033111(0)()()228P C η==⋅⋅=,1123113(1)()()228P C η==⋅⋅=,2213113(2)()()228P C η==⋅⋅=,3303111(4)()()228P C η==⋅⋅=,故ξ的分布列为:∴()322E η=⨯=,113()3224D η=⨯⨯=. 构建答题模板:第一步:确定离散型随机变量的所有可能性; 第二步:求出每个可能性的概率; 第三步:画出随机变量的分布列; 第四步:求期望和方差;第五步:反复回顾,查看是否有重复或遗漏情况,明确规范书写答题.如本题可重点查看随机变量的所有可能值是否正确;根据分布列性质检查概率是否正确.模板二、二项分布及其应用(1)二项分布的特征:①在小范围内有放回的随机抽取或在大范围内任意随机抽取;②每次抽取相互独立;③每次抽取的可能性保持不变;(2)二项分布的题型:在n 次独立重复试验中,设事件A 发生的次数为X ,在每次试验中事件A 发生的概率为p ;(3)二项分布的分布列、期望与方差:①分布列:~(,)X B n p ,n 为试验次数,p 为试验成功率,()(1)k kn k n P X k C p p -==-,0,1,2,,k n =⋅⋅⋅,k ∈N ;②期望:()E X np =; ③()(1)D X np p =-.例2-2.某联欢晚会举行抽奖活动,举办方设置了甲、乙两种抽奖方案,方案甲的中奖率为23,中奖可以获得2分;方案乙的中奖率为25,中奖可以获得3分;未中奖则不得分.每人有且只有一次抽奖机会,每次抽奖中奖与否互不影响,晚会结束后凭分数兑换奖品.(1)若小明选择方案甲抽奖,小红选择方案乙抽奖,记他们的累计得分为X ,求3≤X 的概率; (2)若小明、小红两人都选择方案甲或都选择方案乙进行抽奖,问:他们选择何种方案抽奖,累计得分的数学期望较大?【解析】(1)由已知得,小明中奖的概率为23,小红中奖的概率为25,且两人中奖与否互不影响,记“这2人的累计得分3≤X ”的事件为A ,则事件A 的对立事件为“5X =”, ∵224(5)3515P X ==⨯=,∴11()1(5)15P A P X =-==, 即这两人的累计得分3≤X 的概率为1115; (2)设小明小红都选择方案甲抽奖中奖次数为1X ,都选择方案乙抽奖中奖次数为2X ,则这两人选择方案甲抽奖累计得分的数学期望为1()2E X ⨯, 选择方案乙抽奖累计得分的数学期望为2()3E X ⨯,由已知可得12~(2)3X B ,,22~(2)5X B ,,∴124()233E X =⨯=,224()255E X =⨯=,从而18()23E X ⨯=,212()35E X ⨯=,∴12()2()3E X E X ⨯>⨯,∴他们都选择方案甲进行抽奖时,累计得分的数学期望较大.模板三、统计概率的综合应用例2-3.某食品厂为了检查一条自动包装流水线的生产情况,随即抽取该流水线上40件产品作为样本算出他们的重量(单位:克)重量的分组区间为,(495500],,…,(510515],,由此得到样本的频率分布直方图,如图所示.(1)根据频率分布直方图,求重量超过505克的产品数量.(2)在上述抽取的40件产品中任取2件,设X 为重量超过505克的产品数量,求X 的分布列及期望.(3)在上述抽取的40件产品中任取5件产品,求恰有2件产品的重量超过505克的概率. 【解析】(1)重量超过505克的产品数量是40(0.0550.015)12⨯⨯+⨯=件; (2)X 的所有可能取值为0、1、2,021********(0)130C C P X C ⋅===,11122824056(1)130C C P X C ⋅===,20122824011(2)130C C P X C ⋅===, X 的分布列为:X 的期望561139()01213013013065E X =⨯+⨯+⨯=; (3)设在上述抽取的40件产品中任取5件产品,恰有2件产品的重量超过505克为事件A ,则322812540231()703C C P A C ⋅==. 变式1:第三问改为:从流水线上任取5件产品,设Y 为重量超过505克的产品数量,求Y 的分布列、期望、方差.【解析】从流水线上任取5件产品服从二项分布:Y 可取:0、1、2、3、4、5;超过505克的产品发生的概率为0.3p =,则~(50.3)Y B ,, 005055(0)(1)0.70.16807P Y C p p -==-==, 115111455(1)(1)0.30.70.36015P Y C p p C -==-=⨯=,225222355(2)(1)0.30.70.3087P Y C p p C -==-=⨯=,335333255(3)(1)0.30.70.1323P Y C p p C -==-=⨯=,44544455(4)(1)0.30.70.02835P Y C p p C -==-=⨯=,555555(5)(1)0.30.00243P Y C p p -==-==,则Y 的分布列为:Y 的期望()50.3 1.5E Y =⨯=,方差()50.30.7 1.05D Y =⨯⨯=.变式2:某食品厂为了检查甲乙两条自动包装流水线的生产情况,随即在这两条抽流水线上各抽取40件产品作为样本算出他们的重量(单位:克).重量落在(495510],的产品为合格品,否则为不合格.表一为甲流水线样本频率分布表,图一为乙流水线样本的频率分布直方图.(1)根据上表数据在答题卡上作出甲流水线样本的频率分布直方图;(2)若以频率作为概率,试估计从乙流水线上任取5件产品,恰有3件产品为合格品的概率;(3)由以上统计数据完成下面22⨯列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.附:下面的临界值表供参考:(参考公式:22()()()()()n ad bcKa b a c c d b d-=++++,其中n a b c d=+++).在平面直角坐标系中做出频率分布直方图,甲流水线样本的频率分布直方图如下:(2)由图1知,乙样本中合格品为:(0.060.090.03)54036++⨯⨯=,故合格品的频率为360.940=, ∴可估计从乙流水线上任取一件产品该产品为合格品的概率0.9P =,设ξ为从乙流水线上任取5件产品中的合格品数,则~(50.9)B ξ,, ∴3325(3)0.90.10.0729P C ξ===,即从乙流水线上任取5件产品,恰有3件产品为合格品的概率为0.0729; (3)22⨯列联表如下:∵22()80(120360) 3.117 2.706()()()()66144040n ad bc K a b a c c d b d -⨯-==≈>++++⨯⨯⨯, ∴有90%的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.课后作业1. 某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.)(1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯;(2)根据以上数据完成下列22⨯列联表:(3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.【答案】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主;(2)表格见解析;(3)有,分析见解析.【解析】【分析】(1)根据茎叶图,分析题中数据即可得出结果.(2)根据茎叶图,补充完善列联表,计算观测值即可求解.【详解】(1)30位亲属中50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主;(2)补全22⨯列联表:(3)230(42168)10 6.63512182010K ⨯⨯-⨯==>⨯⨯⨯,有99%的把握认为其亲属的饮食习惯与年龄有关.2. 某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了50份,暴雨前的投票也收集了50份,所得统计结果如下表:已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为25. (1)求列联表中的数据x 、y 、A 、B 的值;(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关? 【答案】(1)40x =,10y =,60A =,40B =;(2)条形统计图答案见解析,暴雨影响到民众对加大修建城市地下排水设施的投入的态度;(3)有99.9%把握.【解析】【分析】(1)先求出y的值,再求,,B x A的值;(2)先求出暴雨前后的支持率和不支持率,画出条形统计图,再通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度.(3)利用独立性检验求解即可.【详解】(1)设“从所有投票中抽取一个,取到不支持投入的投票”为事件A,由已知得302()1005yP A+==,∴10y=,40B=,40x=,60A=;(2)由(1)知北京暴雨后支持为404505=,不支持率为41155-=,北京暴雨前支持率为202505=,不支持率为23155-=,条形统计图如图:由图可以看出暴雨影响到民众对加大修建城市地下排水设施的投入的态度;(3)22100(30402010)5016.7810.828505040603K⨯⨯-⨯==≈>⨯⨯⨯,故至少有99.9%把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关.【点睛】方法点睛:独立性检验的解题步骤:(1)2*2列联表;(2)提出假设:设p与q没有关系;(3)根据列联表中的数据2K计算的值;(4)根据计算得到的随机变量2K的观测值作出判断.3. 电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的22⨯列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关?(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:22()()()()()n ad bcKa b a c c d b d-=++++【答案】(1)列联表答案见解析,没有95%的把握认为“体育迷”与性别有关;(2)7 10 .【解析】 【分析】(1)根据频率分布直方图,计算体育迷的人数,再结合条件依次填入22⨯列联表,并计算2K ,并和临界值3.841比较后进行判断;(2)首先由频率分布直方图计算“超级体育迷”的人数,在通过编号列举的方法,利用古典概型的计算公式计算概率.【详解】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成22⨯列联表如下:将22⨯列联表中的数据代入公式计算,得22100(30104515)100 3.030 3.8417525455533K ⨯⨯-⨯==≈<⨯⨯⨯,∴没有95%的把握认为“体育迷”与性别有关;(2)由频率分布直方图可知“超级体育迷”为5人,设123,,a a a 是3名男超级体育迷,12,b b 是2名女超级体育迷,从而一切可能结果所组成基本事件为:12()a a ,、13()a a ,、23()a a ,、11()a b ,、12()a b ,、 21()a b ,、22()a b ,、31()a b ,、32()a b ,、12()b b ,,则由10个基本事件组成,而且这些基本事件的出现是等可能的, 用A 表示“任选2人中,至少有1人是女性”这一事件,则A 由11()a b ,、12()a b ,、21()a b ,、22()a b ,、31()a b ,、32()a b ,、12()b b , 这7个基本事件组成,因而7()10P A =.4. 2015年7月9日21时15分,台风“莲花”在我国广东省陆丰市甲东镇沿海登陆,给当地人民造成了巨大的财产损失,适逢暑假,大学生小张调查了当地某小区的100户居民由于台风造成的经济损失,将收集的数据分成[02000),、[2000,4000)、[4000,6000)、[6000,8000)、[800010000],五组作出频率分布直方图,如图:(1)台风后居委会号召小区居民为台风重灾区捐款,小张调查的100户居民捐款情况如表格,在表格空白处填写正确数字,并说明是否有95%以上的把握认为捐款数额多于或少于500元和自身经济损失是否到4000元有关?(2)将上述调查所得到的频率视为概率.现在从该地区大量受灾居民中,采用随机抽样方法每次抽取1户居民,抽取3次,记被抽取的3户居民中自身经济损失超过4000元的人数为ξ.若每次抽取的结果是相互独立的,求ξ的分布列,期望()E ξ和方差()D ξ.【答案】(1)答案见解析,有;(2)分布列见解析,()0.9E ξ=,()0.63D ξ=. 【解析】【分析】(1)由频率分布直方图可求出抽取的100户中,经济损失不超过4000元的户数,经济损失超过4000元的户数, 从而可补全列联表,进而可求出2K ,得出结论;(2)由题意知ξ的取值可能有0、1、2、3,符合二项分布,则3~(3)10B ξ,,从而利用二项分布的概率公式求出各自对应的概率,进而可得ξ的分布列,期望()E ξ和方差()D ξ. 【详解】(1)由频率分布直方图可知,在抽取的100户中,经济损失不超过4000元的有1002000(0.000150.00020)70⨯⨯+=户,则经济损失超过4000元的有30户, 则表格数据如下:22100(60102010) 4.76280207030K ⨯⨯-⨯=≈⨯⨯⨯,∵4.762 3.841>,2( 3.841)0.05P K ≥=,∴有95%以上把握认为捐款数额是否多于或少于500元和自身经济损失是否到4000元有关; (2)由频率分布直方图可知抽到自身经济损失超过4000元居民的频率为0.3,将频率视为概率,由题意知ξ的取值可能有0、1、2、3,符合二项分布,则3~(3)10B ξ,,003337343(0)()()10101000P C ξ==⋅⋅=,112337441(1)()()10101000P C ξ==⋅⋅=,221337189(2)()()10101000P C ξ==⋅⋅=,33033727(3)()()10101000P C ξ==⋅⋅=,从而ξ的分布列为:3()30.910E np ξ==⨯=,37()(1)30.631010D np p ξ=-=⨯⨯=. 5. 私家车的尾气排放是造成雾霾天气的重要因素之一,因此在生活中我们应该提倡低碳生活,少开私家车,尽量选择绿色出行方式,为预防雾霾出一份力.为此,很多城市实施了机动车车尾号限行,我市某报社为了解市区公众对“车辆限行”的态度,随机抽查了50人,将调查情况进行整理后制成下表:(1)完成被调查人员的频率分布直方图.(2)若从年龄在[15,25)([25,35)的被调查者中各随机选取2人进行追踪调查,求恰有2人不赞成的概率.(3)在(2)在条件下,再记选中的4人中不赞成...“车辆限行”的人数为ξ,求随机变量ξ的分布列和数学期望.【答案】(1)见解析(2(2275(3)见解析 【解析】【详解】试题分析:(1)根据频率等于频数除以总数,再求频率与组距之比得纵坐标,画出对应频率分布直方图.(2)先根据2人分布分类,再对应利用组合求概率,最后根据概率加法求概率,(3)先确定随机变量,再根据组合求对应概率,列表可得分布列,最后根据数学期望公式求期望. 试题解析:(1((2(由表知年龄在[)15,25内的有5人,不赞成的有1人,年龄在[)25,35 内的有10人,不赞成的有4人,恰有2人不赞成的概率为:()11122464442222510510C C C C C 4246666222C C C C 1025104522575P ξ==⋅+⋅=⋅+⋅==((3( ξ的所有可能取值为:0(1(2(3(()226422510C C 45150C C 22575P ξ==⋅==(()21112646442222510510C C C C C 415624102341C C C C 1045104522575P ξ⋅==⋅+⋅=⋅+⋅==( ()124422510C C 461243C C 104522575P ξ==⋅=⋅==( 所以ξ的分布列是:所以ξ的数学期望5E ξ=( 6. 某商场举行的“三色球”购物摸奖活动规定:在一次摸奖中,摸奖者先从装有3个红球与4个白球的袋中任意摸出3个球,再从装有1个蓝球与2个白球的袋中任意摸出1个球,根据摸出4个球中红球与蓝球的个数,设一、二、三等奖如下:其余情况无奖且每次摸奖最多只能获得一个奖级.(1)求一次摸奖恰好摸到1个红球的概率;(2)求摸奖者在一次摸奖中获奖金额x的分布列与期望E(x).【答案】(1)(2)X的分布列为EX==4元【解析】【详解】(1)设A i表示摸到i个红球,B i表示摸到i个蓝球,则与相互独立(i=0,1,2,3)∴P(A1)==(2)X的所有可能取值为0,10,50,200P(X=200)=P(A3B1)=P(A3)P(B1)=P(X=50)=P(A3)P(B0)==P(X=10)=P(A2)P(B1)==P(X=0)=1﹣=∴X的分布列为EX==4元7. 以下茎叶图记录了甲、乙两组个四名同学的植树棵树、乙组记录中有一个数据模糊,无法确认,在图中以X表示.(1)如果8X=,求乙组同学植树棵树的平均数和方差;(2)如果9X=,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y的分布列和数学期望.【答案】(1)平均数为354,方差为1116;(2)分布列答案见解析,数学期望:19.【解析】【分析】(1)利用平均数和方差公式求出即可;(2)根据题意可得Y 的可能取值为17,18,19,20,21,分别求出Y 取不同值的概率,即可得出分布列,求出期望.【详解】(1)当8X =时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10, ∴平均数为889103544x +++==,方差为2222213535353511[(8)(8)(9)(10)]4444416s =-+-+-+-=;(2)当9X =时,由茎叶图可知,甲组同学的植树棵树是:9,9,11,11, 乙组同学的植树棵数是:9,8,9,10,分别从甲、乙两组中随机选取一名同学,共有4416⨯=种可能的结果, 这两名同学植树总棵数Y 的可能取值为17,18,19,20,21,事件“17Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”, ∴该事件有2种可能的结果,21(17)168P Y ===, 事件“18Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树9棵”, ∴该事件有4种可能的结果,41(18)164P Y ===, 事件“19Y =”等价于“甲组选出的同学植树9棵,乙组选出的同学植树10棵, 或甲组选出的同学植树11棵,乙组选出的同学植树8棵”, ∴该事件有224+=种可能的结果,41(19)164P Y ===, 事件“20Y =”等价于“甲组选出的同学植树11棵,乙组选出的同学植树9棵”, ∴该事件有4种可能的结果,41(20)164P Y ===, 事件“21Y =”等价于“甲组选出的同学植树11棵,乙组选出的同学植树10棵”, ∴该事件有2种可能的结果,21(21)168P Y ===,∴随机变量Y 的分布列为:∴11()17181920211984448E Y =⨯+⨯+⨯+⨯+⨯=.8. 语文成绩服从正态分布2(100,17.5)N ,数学成绩的频率分布直方图如图,如果成绩大于135的则认为特别优秀.(1)这500名学生中本次考试语文、数学特别优秀的大约各多少人?(2)如果语文和数学两科都特别优秀的共有6人,从(1)中的这些同学中随机抽取3人,设三人中两科都特别优秀的有X 人,求X 的分布列和数学期望.(附公式:若2~(,)X N μσ,则()0.68P X μσμσ-<≤+=,(22)0.96P X μσμσ-<≤+=).【答案】(1)语文有10人,数学有12人;(2)分布列见解析,98.【解析】【分析】(1)利用正态分布的对称性求出语文成绩特别优秀的概率,从而可估计出语文成绩特别优秀人数,由频率分布直方图可求出数学成绩特别优秀的频率,用频率来衡量概率,从而可求出数学成绩特别优秀的人数;(2)结合(1)可知数学语文单科优秀的有10人,则X 的所有可能取值为0、1、2、3,然后求出各自对应的概率即可列出分布列,求得数学期望【详解】(1)∵语文成绩服从正态分布2(10017.5)N ,,∴语文成绩特别优秀概率为11(135)(10.96)0.022P P X =≥=-⨯=, ∴数学成绩特别优秀的概率为230.0016200.0244P =⨯⨯=, ∴语文特别优秀的同学有5000.0210⨯=人,数学特别优秀的同学有5000.02412⨯=人; (2)语文数学两科都优秀的有6人,单科优秀的有10人,X 的所有可能取值为0、1、2、3,3103163(0)14C P X C ===,2110631627(1)56C C P X C ⋅===, 1210631615(2)56C C P X C ⋅===,363161(3)28C P X C ===, ∴X 的分布列为:19()0123145656288E X =⨯+⨯+⨯+⨯=. 9. 张明要参加某单位组织的招聘面试.面试要求应聘者有7次选题答题的机会(选一题答一题),若答对4题即终止答题,直接进入下一轮,否则被淘汰.已知张明答对每一道题的概率都为12. (1)求张明进入下一轮的概率;(2)设张明在本次面试中答题的个数为ξ,试写出ξ的分布列,并求ξ的数学期望. 【答案】(1)12;(2)分布列答案见解析,数学期望:9316. 【解析】 【分析】(1)分情况讨论张明进入下一轮的概率;(2)由条件可知4,5,6,7ξ=,理解随机变量对应的事件,写出概率分布列,计算数学期望.。
专题16 概率与统计(解答题)(文科专用)1.【2022年全国甲卷】甲、乙两城之间的长途客车均由A 和B 两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关? 附:K 2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d), P (K 2⩾k )0.100 0.050 0.010 k 2.7063.8416.6352.【2022年全国乙卷】某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m 2)和材积量(单位:m 3),得到如下数据:并计算得∑x i 210i=1=0.038,∑y i 210i=1=1.6158,∑x i y i10i=1=0.2474. (1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量; (2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186m 2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值. 附:相关系数r =i n i=1i √∑(x i −x̅)2ni=1∑(y i−y ̅)2ni=1√1.896≈1.377.3.【2021年甲卷文科】甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++4.【2021年乙卷文科】某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为21s和22s.(1)求x,y,21s,22s;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y x-≥认为有显著提高).5.【2020年新课标1卷文科】某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:甲分厂产品等级的频数分布表乙分厂产品等级的频数分布表(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务6.【2019年新课标1卷文科】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++.7.【2019年新课标2卷文科】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602.8.【2018年新课标1卷文科】某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)。
概率与统计是高考数学中的一个重要的知识点,也是考察学生分析问题、统计数据以及进行概率计算的能力。
下面是2024年高考数学中概率与统计方面的热点问题解题指导,希望能对你备考有所帮助。
1.求二项式分布的期望和方差二项式分布可以描述在n次独立重复试验中,出现其中一事件的次数的概率分布。
求二项式分布的期望和方差是常见的题型。
对于n次独立重复试验中,事件A出现的次数X,其期望和方差分别为E(x) = np,Var(x) = np(1-p),其中p为单次试验中事件A发生的概率。
2.求事件的概率求事件的概率是概率与统计中的基本题型。
根据题目给出的条件,利用概率公式进行计算即可。
常见的题型有求交、并、互斥事件的概率,以及条件概率等。
3.求样本的点估计和区间估计在统计学中,样本是用来推断总体特征的重要依据。
对于样本中一些统计量,如平均值、比例等,可以利用它们作为总体特征的点估计。
而对于总体特征的区间估计,可以利用样本统计量的分布特性,计算出一个区间,该区间包含了总体特征的真值。
4.利用正态分布进行计算正态分布是概率与统计中最重要的概率分布之一,也是高考数学中的重点内容。
在许多情况下,可以使用正态分布来近似计算一些事件的概率或样本统计量的分布。
利用标准正态分布的概率表或计算器,可以方便地计算出正态分布的概率或分布的特征。
5.判断两个事件是否独立判断两个事件是否独立,可以利用概率的定义和条件概率的性质进行推导。
如果两个事件相互独立,则它们的联合概率等于事件的概率的乘积。
反之,如果联合概率不等于概率的乘积,则说明两个事件不独立。
6.利用抽样方法进行调查在概率与统计中,抽样是一种重要的数据收集方法。
通过合理地设计抽样方法和调查问卷,可以获得可靠的调查数据。
在解题时,需要注意抽样误差和样本的代表性等问题,以确保所得到的调查结果具有较高的可靠性。
以上是2024年高考数学概率与统计方面的热点问题解题指导。
在备考过程中,要牢固掌握概率与统计的基本概念和常用方法,多做相关的题目,提高解题能力。
广东高考数学(文)【六大解答题】专练2:统计与概率1.某学校为调查高三年学生的身高情况,按随机抽样的方法抽取80名学生,得到男生身高情况的频率分布直方图(图(1))和女生身高情况的频率分布直方图(图(2)).已知图(1)中身高在170 ~175cm 的男生人数有16人.图(1) 图(2)(Ⅰ)试问在抽取的学生中,男、女生各有多少人?(Ⅱ)根据频率分布直方图,完成下列的2×2列联表,并判断能有多大(百分几)的把握认为“身高与性别有关”?≥170cm <170cm总计 男生身高 女生身高 总计(Ⅲ)在上述80名学生中,从身高在170~175cm 之间的学生中按男、女性别分层抽样的方法,抽出5人,从这5人中选派3人当旗手,求3人中恰好有一名女生的概率.参考公式: 22()()()()()n ad bc K a b c d a c b d -=++++参考数据:20()P K k ≥0.025 0.010 0.005 0.001 0k5.0246.6357.87910.8282.某高校在2012年的自主招生考试成绩中随机抽取100名学生的笔试成绩,按成绩分组,得到的频率分布表如下左图所示. (I )请先求出频率分布表中①、②位置相应的数据,再在答题纸上完成下列频率分布直方图; (Ⅱ)为了能选拔出最优秀的学生,高校决定在笔试成绩高的第3、4、5组中用分层抽样抽取6名学生进入第二轮面试,求第3、4、5组每组各抽取多少名学生进入第二轮面试?(Ⅲ)在(2)的前提下,学校决定在6名学生中随机抽取2名学生接受A 考官的面试,求:第4组至少有一名学生被考官A 面试的概率?3.对某校高三年级学生参加社区服务次数进行统计,随机抽取M 名学生作为样本,得到这M 名学生参加社区服务的次数. 根据此数据作出了频数与频率的统计表和频率分布直方图如下:(Ⅰ)求出表中,M p 及图中a 的值;(Ⅱ)若该校高三学生有240人,试估计该校高三学生参加社区服务的次数在区间[10,15) 内的人数;(Ⅲ)在所取样本中,从参加社区服务的次数不少于20次的学生中任选2人,求至多一人参加社区服务次数在区间[25,30)内的概率. 分组 频数 频率 [10,15)m p [15,20) 24 n [20,25) 4 0.1[25,30) 2 0.05合计 M 1 频率/组距15 25 20 10 0 30 次数4.某日用品按行业质量标准分成五个等级,等级系数X依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:(I)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a,b,c的值;(Ⅱ)在(I)的条件下,将等级系数为4的3件日用品记为x1,x2,x3,等级系数为5的2件日用品记为y1,y2,现从x1,x2,x3,y1,y2这5件日用品中任取两件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这两件日用品的等级系数恰好相等的概率.5.已知A、B、C三个箱子中各装有2个完全相同的球,每个箱子里的球,有一个球标着号码1,另一个球标着号码2,现从A、B、C三个箱子中各摸出1个球。
(1)若用数组(x,y,z)中的x、y、z分别表示从A、B、C三个箱子中摸出的球的号码,请写出数组(x,y,z)的所有情形,并回答一共有多少种;(2)如果请您猜测摸出的这三个球的号码之和,猜中有奖,那么猜什么数获奖的可能性最大?请说明理由。
6.为了淮北市争创“全国文明城市”,市文明委组织了精神文明建设知识竞赛。
统计局调查中心随机抽取了甲.乙两队中各6名组员的成绩,得分情况如下表所示:(1)根据表中的数据,哪个组对精神文明建设知识的掌握更为稳定?(2)用简单随机抽样方法从乙组6名成员中抽取两名,他们的得分情况组成一个样本,求抽出的两名成员的分数差值至少是4分的概率。
7.某研究性学习小组对春季昼夜温差大小与某花卉种子发芽多少之间的关系进行研究,他们分别记录了3月1日至3月5日的每天昼夜温差与实验室每天每100颗种子浸泡后的发芽数,得到如下资料:(I )从3月1日至3月5日中任选2天,记发芽的种子数分别为,,求事件“,均小于25”的概率;(II )请根据3月2日至3月4日的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (III )若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(II )所得的线性回归方程是否可靠?(参考公式:回归直线方程式ˆˆˆybx a =+,其中1221ˆˆˆ,ni ii nii x ynx y b ay bx xnx==-==--∑∑)8. 为了解学生喜欢数学是否与性别有关,对50个学生进行了问卷调查得到了如下的列联表:(1(2(参考公式:2()()()()()n a d b c K a bc d a cb d -=++++,其中na b cd =+++)9. 为了比较注射,A B 两种药物后产生的皮肤疱疹的面积,选200只老鼠做试验,将这200只老鼠随机地分成两组,每组100只,其中一组注射药物A (称为A 组),另一组注射药物B (称为B 组),则,A B 两组老鼠皮肤疱疹面积(单位:2mm )的频率分布表、频率分布直方图分别如下.(Ⅰ)为方便,A B 两组试验对比,现都用分层抽样方法从,A B 两组中各挑出20只老鼠,求A B 、两组成肤疱疹面积同为[60,65)的这一区间应分别挑出几只? (Ⅱ)在(Ⅰ)的条件下,将,A B 两组挑出的皮肤疱疹面积 同为[60,65)这一区间上的老鼠放在一起观察,几天后,从中抽取两只抽血化验,求B 组中至少有1只被 抽中的概率.10.已知集合{2,0,1,3},A =-在平面直角坐标系中,点M(x,y)的坐标,x A y A ∈∈。
(1)请列出点M 的所有坐标; (2)求点M 不在x 轴上的概率;(3)求点M 正好落在区域5000x y x y +-<⎧⎪>⎨⎪>⎩上的概率。
11.中华人民共和国道路交通安全法》规定:车辆驾驶员血液酒精浓度在20~80 mg/100 ml(不含80)之间,属于酒后贺车;在80 mg /100 ml (含80)以上时,属醉酒贺车,对于酒后驾车和醉酒驾车的驾驶员公安机关将给予不同程度的处罚.某市公安局交通管理部门在某路段的一次拦查行动中,依法检查了250辆机动车,查出酒后驾车和醉酒贺车的驾驶员20人,下图是对这20人血液中酒精含量进行检查所得结果的频率分布直方图.(1)根据频率分布直方图,求:此次抽查的250人中,醉酒驾车的人数;(2)从血液酒精浓度在[70,90)范围内的驾驶员中任取2人,求恰有1人属于醉酒驾车的概率.12. 2.5PM 是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.我国 2.5PM 标准采用世卫组织设定的最宽限值, 2.5PM 日均值在35微克/立方米以下空气质量为一级;在35微克/立方米~75微克/立方米之间空气质量为二级;在75微克/立方米及其以上空气质量为超标.某试点城市环保局从该市市区2011年全年每天的 2.5PM 监测数据中随机抽取6天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶),若从这6天的数据中随机抽出2天. (Ⅰ)求恰有一天空气质量超标的概率; (Ⅱ)求至多有一天空气质量超标的概率.13.为加强中学生实践、创新能力和团队精神的培养,促进教育教学改革,郑州市教育局举办了全市中学生创新知识竞赛.某校举行选拔赛,共有200名学生参加,为了解成绩情况,从中抽取50名学生的成绩(得分均为整数,满分为100分)进行统计.请你根据尚未完成的频率分布表,解答下列问题:(I)若用系统抽样的方法抽取50个样本,现将所有学生随机地编号为000,001,002,…,199,试写出第二组第一位学生的编号;(II) 求出a,b ,c ,d ,e 的值(直接写出结果),并作出频率分布直方图;(III)若成绩在85.5〜95. 5分的学生为二等奖,问参赛学生中获得二等奖的学生约为多少人?14.某日用品按行业质量标准分成五个等级,等级系数X依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:(I)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a,b,c的值;(Ⅱ)在(I)的条件下,将等级系数为4的3件日用品记为x1,x2,x3,等级系数为5的2件日用品记为y1,y2,现从x1,x2,x3,y1,y2这5件日用品中任取两件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这两件日用品的等级系数恰好相等的概率.15. 已知A、B、C三个箱子中各装有2个完全相同的球,每个箱子里的球,有一个球标着号码1,另一个球标着号码2,现从A、B、C三个箱子中各摸出1个球。
(1)若用数组(x,y,z)中的x、y、z分别表示从A、B、C三个箱子中摸出的球的号码,请写出数组(x,y,z)的所有情形,并回答一共有多少种;(2)如果请您猜测摸出的这三个球的号码之和,猜中有奖,那么猜什么数获奖的可能性最大?请说明理由。
16.有关部门要了解甲型H1N1流感预防知识在学校的普及情况,命制了一份有10道题的问卷到各学校做问卷调、两个班各被随机抽取5名学生接受问卷调查,A班5名学生得分为:5,8,9,9,9;B班查.某中学A B5名学生得分为:6,7,8,9,10.、两个班中哪个班的问卷得分要稳定一些;(Ⅰ)请你估计A B(Ⅱ)如果把B班5名学生的得分看成一个总体,并用简单随机抽样方法从中抽取样本容量为2的样本,求样本平均数与总体平均数之差的绝对值不小于1的概率.17.近年来,我国机动车拥有量呈现快速增加的趋势,可与之配套的基础设施建设速度相对迟缓,交通拥堵问题已经成为制约城市发展的重要因素,为了解某市的交通状况,现对其6条道路进行评估,得分分别为5、6、7、8、9、10规定评估的平均得分与全市的总体交通状况等级如下表:(1)求本次评估的平均得分,并参照上表估计该市的总体交通状况等级。
(2)用简单随机抽样方法从6条道路中抽取2条,它们的得分组成一个样本,求该样本的平均数与总体的平均数之差的绝对值不超过0.5的概率。
18.(本小题满分12分)一工厂生产甲, 乙, 丙三种样式的杯子,每种样式均有500ml 和700ml 两种型号, 某天的产量如右表(单位:个):按样式进行分层抽样,在该天生产的杯子中抽取100个,其中有甲样式杯子25个. (I )求z 的值;(II )用分层抽样的方法在甲样式杯子中抽取一个容量为5的样本,从这个样本中任取2个杯子,求至少有1个500ml 杯子的概率.19.一化工厂因排污趋向严重,2011年1月决定着手整治。