2018高考理科概率与统计专题
- 格式:doc
- 大小:538.50 KB
- 文档页数:12
2018届高三理科高考数学常用知识考点——概率统计八、概率统计中位数(深圳一模)某重点中学将全部高一新生分成A,B两个成绩相当(成绩的均值、方差都相同)的级部,A级部采用传统形式的教学方式,B级部采用新型的基于信息化的自主学习教学方式.期末考试后分别从两个级部中各随机抽取100名学生的数学成绩进行统计,得到如下频率分布直方图:若记成绩不低于130分者为“优秀”。
(I)根据频率分布直方图,分别求出A,B两个级部的中位数和众数的估计值(精确到0.01);请根据这些数据初步分析A,B两个级部的数学成绩的优劣.系统抽样几何概型 条件概率81. 平均数、方差、标准差的计算平均数:n x x x x n +⋯++=21 方差:])()()[(1222212x x x x x x n s n -+⋯+-+-=标准差:])()()[(122221x x x x x x ns n -+⋯+-+-= 82. 回归直线方程y a bx =+,其中()()()1122211n ni i i i i i n ni ii i x x y y x y nx y b x x x nx a y bx====⎧---⎪⎪==⎨--⎪⎪=-⎩∑∑∑∑.83. 独立性检验))()()(()(22d b c a d c b a bd ac n K ++++-=84. 古典概型的计算(必须要用列举法...、列表法...、树状图...的方法把所有基本事件表示出来,不重复、不遗漏)85. 几何概型的计算,转化为体积,面积,长度之比。
命题角度1:事件的相互独立性19.某单位计划组织200名职工进行一种疾病的筛查,先到本单位医务室进行血检,血检呈阳性者再到医院进一步检测.已知随机一人血检呈阳性的概率为1%,且每个人血检是否呈阳性相互独立.(I)根据经验,采用分组检测法可有效减少工作量,具体操作如下:将待检人员随机分成20组,每组10人,先将每组的血样混在一起化验,若结果呈阴性,则可断定本组血样全部为阴性,不必再化验;若结果呈阳性,则本组中至少有一人呈阳性,再逐个化验.设进行化验的总次数为X ,试求X 的数学期望;(Ⅱ)若该疾病的患病率为0.5%,且患该疾病者血检呈阳性的概率为99%,该单位有一职工血检呈阳性,求该职工确实患该疾病的概率.(参考数据:0.9910=0.904,0.9911=0.895,0.9912=0.886.)2.(2018济宁二模18)某工厂有120名工人,其年龄都在20~ 60岁之间,各年龄段人数按[20,30),[30,40),[40,50),[50,60]分成四组,其频率分布直方图如下图所示.工厂为了开发新产品,引进了新的生产设备,要求每个工人都要参加A、B两项培训,培训结束后进行结业考试。
2018年高考统计与概率专题(全国卷1文)2.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B(全国卷1理)2.如图,正方形ABCD 内的图形来自中国古代的太极图。
正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8C .12D .π4【考点】:几何概型【思路】:几何概型的面积问题,=P 基本事件所包含的面积总面积.【解析】:()21212=82r S P S r ππ==,故而选B 。
(全国卷2理)6.安排3名志愿者完成4项工作,每人至少完成1项,每项工作由1人完成,则不同的安排方式共有( )A .12种B .18种C .24种D .36种(全国卷2文)6。
如图,网格纸上小正方形的边长为1,粗实线画出的是某几何体的三视图,该几何体由一平面将一圆柱截去一部分后所得,则该几何体的体积为 A.90πB 。
63πC 。
42π D.36π【答案】B【解析】由题意,该几何体是由高为6的圆柱截取一半后的图形加上高为4的圆柱,故其体积为2213634632V πππ=⋅⋅⋅+⋅⋅=,故选B 。
(天津卷)文(3)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫。
从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为(A)45(B)35(C)25(D)15(全国卷2文)11.从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C。
2018年普通高等学校招生全国统一考试数学分类解析—概率统计一.选择题:1. (安徽理)(10).设两个正态分布2111()(0)N μσσ>,和2222()(0)N μσσ>,的密度函数图像如图所示。
则有( A ) A .1212,μμσσ<<B .1212,μμσσ<>C .1212,μμσσ><D .1212,μμσσ>>2.(福建理)(5)某一批花生种子,如果每1粒发牙的概率为45,那么播下4粒种子恰有2粒发芽的概率是 (B )A.16625 B.96625 C.192625D.2566253. (福建文)(5)某一批花生种子,如果每1粒发芽的概率为45,那么播下3粒种子恰有2粒发芽的概率是 (C )A.12125 B.16125 C.48125 D.961254. (广东理)(3).某校共有学生2000名,各年级男、女生人数如表1.已知在全校 学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( C ) A .24 B .18 C .16 D .125.(湖南理) 4.设随机变量ζ服从正态分布N (2,9) ,若P (ζ>c+1)=P (ζ<c -)1,则c =(B)A.1B.2C.3D.46. (江西文)(11).电子钟一天显示的时间是从00:00到23:59,每一时刻都由四个数字组成,则一天中任一时刻显示的四个数字之和为23的概率为 (C )A .1180 B .1288 C .1360D .14807. (辽宁理文)(7).4张卡片上分别写有数字1,2,3,4,从这4张卡片中随机抽取2张,则取出的2张卡片上的数字之和为奇数的概率为( C ) A.13 B.12 C.23 D.348.(山东理)(7)在某地的奥运火炬传递活动中,有编号为1,2,3,…,18的18名火炬手.若从中任选3人,则选出的火炬手的编号能组成3为公差的等差数列的概率为(B ) (A )511(B )681 (C )3061(D )40819.(山东理) (8)右图是根据《山东统计年整2018》中的资料作成的1997年至2018年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2018年我省城镇居民百户家庭人口数的平均数为(B )(A )318.6 (B )318.6 (C)318.6 (D)301.6 10.(山东文)9.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( B )AB C .3D .8510.(陕西文)(3).某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( C ) A .30 B .25 C .20 D .15 11.(重庆理)(5)已知随机变量ζ服从正态分布N (3,a 2),则P (3)ζ<=(D )(A)15(B)14(C)13(D)1212. (重庆文)(5)某交高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是(D )(A)简单随机抽样法(B)抽签法7420136203851192(C)随机数表法 (D)分层抽样法13.(重庆文)(9)从编号为1,2,…,10的10个大小相同的球中任取4个,则所取4个球的最大号码是6的概率为 (B )(A)184(B)121(C)25(D)35二.填空题:1.(广东文) (11).为了调查某厂工人生产某种产品的能力,随机抽查 了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85, [)85,95由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[)55,75的人数是 13 .2.(海南宁夏理文)(16).从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm ),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 318 318 318 318 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 318 318 318 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ① ;3 127 7 5 5 0 28 4 5 4 2 29 2 5 8 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 8 8 5 5 3 32 0 2 2 4 7 9 7 4 1 33 1 3 6 734 3 2 35 6甲乙② .以下任填两个:(1).乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度). (2).甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大). (3).甲品种棉花的纤维长度的中位数为318mm ,乙品种棉花的纤维长度的中位数为318mm . (4).乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.3. (湖北文)11.一个公司共有1 000名员工,下设一些部门,要采用分层抽样方法从全体员工中抽取一个容量为50的样本,已知某部门有200名员工,那么从该部门抽取的工人数是 10 . 4.(湖北文)14.明天上午李明要参加奥运志愿者活动,为了准时起床,他用甲、乙两个闹钟叫醒自己,假设甲闹钟准时响的概率是0.80,乙闹钟准时响的概率是0.90,则两个闹钟至少有一准时响的概率是 0.98 .5. (湖南理)15.对有n (n ≥4)个元素的总体{1,2,3,…,n }进行抽样,先将总体分成两个子总体{1,2,…,m }和{m +1、m +2,…,n }(m 是给定的正整数,且2≤m ≤n -2),再从每个子总体中各随机抽取2个元素组成样本,用P i j 表示元素i 和f 同时出现在样本中的概率,则P 1m =4()m n m -;所有P if (1≤i <j ≤)n 的和等于 6 .6. (湖南文)(12)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示:则该地区生活不能自理的老人中男性比女性约多____60____人。
7.概率与统计1.【2018年浙江卷】设0<p<1,随机变量ξ分布列是ξ0 1 2P则当p在(0,1)内增大时,A. D(ξ)减小B. D(ξ)增大C. D(ξ)先减小后增大D. D(ξ)先增大后减小【答案】D点睛:2.【2018年理新课标I卷】下图来自古希腊数学家希波克拉底所研究几何图形.此图由三个半圆构成,三个半圆直径分别为直角三角形ABC斜边BC,直角边AB,AC.△ABC三边所围成区域记为I,黑色部分记为II,其余部分记为III.在整个图形中随机取一点,此点取自I,II,III概率分别记为p1,p2,p3,则A. p1=p2B. p1=p3C. p2=p3D. p1=p2+p3【答案】A【解析】分析:首先设出直角三角形三条边长度,根据其为直角三角形,从而得到三边关系,之后应用相应面积公式求得各个区域面积,根据其数值大小,确定其关系,再利用面积型几何概型概率公式确定出p1,p2,p3关系,从而求得结果.详解:设,则有,从而可以求得面积为,黑色部分面积为,其余部分面积为,所以有,根据面积型几何概型概率公式,可以得到,故选A.点睛:该题考查是面积型几何概型有关问题,题中需要解决是概率大小,根据面积型几何概型概率公式,将比较概率大小问题转化为比较区域面积大小,利用相关图形面积公式求得结果.【2018年理新课标I卷】某地区经过一年新农村建设,农村经济收入增加了一倍.实现翻番.为3.更好地了解该地区农村经济收入变化情况,统计了该地区新农村建设前后农村经济收入构成比例.得到如下饼图:则下面结论中不正确是A. 新农村建设后,种植收入减少B. 新农村建设后,其他收入增加了一倍以上C. 新农村建设后,养殖收入增加了一倍D. 新农村建设后,养殖收入与第三产业收入总和超过了经济收入一半【答案】A详解:设新农村建设前收入为M,而新农村建设后收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;新农村建设后,养殖收入与第三产业收入综合占经济收入,所以超过了经济收入一半,所以D正确;故选A.点睛:该题考查是有关新农村建设前后经济收入构成比例饼形图,要会从图中读出相应信息即可得结果.4.【2018年全国卷Ⅲ理】某群体中每位成员使用移动支付概率都为,各成员支付方式相互独立,设为该群体10位成员中使用移动支付人数,,,则A. 0.7B. 0.6C. 0.4D. 0.3【答案】B点睛:本题主要考查二项分布相关知识,属于中档题。
专题11 概率与统计(六)统计1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释. (4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(七)概率1.事件与概率(1)了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.(2)了解两个互斥事件的概率加法公式.2.古典概型(1)理解古典概型及其概率计算公式.(2)会计算一些随机事件所含的基本事件数及事件发生的概率.3.随机数与几何概型(1)了解随机数的意义,能运用模拟方法估计概率.(2)了解几何概型的意义.(二十一)概率与统计1.概率(1)理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性.(2)理解超几何分布及其导出过程,并能进行简单的应用.(3)了解条件概率和两个事件相互独立的概念,理解n次独立重复试验的模型及二项分布,并能解决一些简单的实际问题.(4)理解取有限个值的离散型随机变量均值、方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题.(5)利用实际问题的直方图,了解正态分布曲线的特点及曲线所表示的意义.2.统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.(1)独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.(2)回归分析了解回归分析的基本思想、方法及其简单应用.概率与统计作为高考的必考内容,在2018年的高考中预计仍会以“一小一大”的格局呈现. 对于概率部分,选择题或填空题中概率求值是高考命题的热点,以古典概型或几何概型为主线,考查随机事件的概率.解答题中则常与统计知识相结合,考查离散型随机变量的分布列与期望,需注意知识的灵活运用.对于统计部分,选择题、填空题中以考查抽样方法和用样本估计总体为主,兼顾两个变量的线性相关;解答题中则重点考查求回归直线方程及独立性检验.考向一三种抽样方法样题1 《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出钱(所得结果四舍五入,保留整数).【答案】17考向二频率分布直方图的应用样题2 (2017新课标全国Ⅱ理科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg).其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg,新养殖法的箱产量不低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01).附:,22()()()()()n ad bc K a b c d a c b d -=++++(2)根据箱产量的频率分布直方图得列联表:2K 的观测值()22006266343815.70510010096104k ⨯⨯-⨯=≈⨯⨯⨯, 由于15.705 6.635>,故有99%的把握认为箱产量与养殖方法有关.(3)因为新养殖法的箱产量频率分布直方图中,箱产量低于50kg 的直方图面积为 ()0.0040.0200.04450.340.5++⨯=<,箱产量低于55kg 的直方图面积为()0.0040.0200.0440.06850.680.5+++⨯=>, 故新养殖法箱产量的中位数的估计值为0.50.345052.35(kg)0.068-+≈.【名师点睛】利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.考向三 线性回归方程及其应用样题3 为了解某公司员工的年收入和年支出的关系,随机调查了5名员工,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆ0.65b =司一名员工年收入为15万元时支出为A .9.05万元B .9.25万元C .9.75万元D .10.25万元【答案】B考向四 概率的求解样题4 (2017新课标全国Ⅰ理科)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8C .12D .π4【答案】B【解析】设正方形边长为a ,则圆的半径为2a ,正方形的面积为2a ,圆的面积为2π4a .由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,此点取自黑色部分的概率是221ππ248a a ⋅=,选B . 秒杀解析:由题意可知,此点取自黑色部分的概率即为黑色部分面积占整个面积的比例,由图可知其概率p 满足1142p <<,故选B . 【名师点睛】对于几何概型的计算,首先确定事件类型为几何概型并确定其几何区域(长度、面积、体积或时间),其次计算基本事件区域的几何度量和事件A 区域的几何度量,最后计算()P A .样题5 如图,茎叶图表示的是甲,乙两人在5次综合测评中的成绩,其中一个数字被污染,则甲的平均成绩超过乙的平均成绩的概率为A .12B .35C .45D .710 【答案】C考向五离散型随机变量及其分布列、均值与方差样题6(2017新课标全国Ⅲ理科)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:以最高气温位于各区间的频率代替最高气温位于该区间的概率.(1)求六月份这种酸奶一天的需求量X(单位:瓶)的分布列;(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量n(单位:瓶)为多少时,Y的数学期望达到最大值?【名师点睛】离散型随机变量的分布列指出了随机变量X 的取值以及取各值的概率;要理解两种特殊的概率分布——两点分布与超几何分布,并善于灵活运用两性质:一是p i ≥0(i =1,2,…);二是p 1+p 2+…+p n =1检验分布列的正误.考向六 正态分布样题7 已知随机变量ξ服从正态分布()2,N μσ,若(2)(6)0.15P P ξξ<=>=,则(24)P ξ≤<等于A .0.3B .0.35C .0.5D .0.7【答案】B样题8 (2017新课标全国Ⅰ理科)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2(,)N μσ.(1)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(3,3)μσμσ-+之外的零件数,求(1)P X ≥及X 的数学期望;(2)一天内抽检零件中,如果出现了尺寸在(3,3)μσμσ-+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查. (ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得16119.9716i i x x ===∑,0.212s ==≈,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅. 用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则(33)0.997 4P Z μσμσ-<<+=, 160.997 40.959 2≈0.09≈.(ii )由9.97,0.212x s =≈,得μ的估计值为ˆ9.97μ=,σ的估计值为ˆ0.212σ=, 由样本数据可以看出有一个零件的尺寸在ˆˆˆˆ(3,3)μσμσ-+之外,因此需对当天的生产过程进行检查.剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22, 剩下数据的平均数为1(169.979.22)10.0215⨯-=, 因此μ的估计值为10.02.162221160.212169.971591.134i i x==⨯+⨯≈∑,剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈,因此σ0.09≈.【名师点睛】数学期望是离散型随机变量中重要的数学概念,反映随机变量取值的平均水平.求解离散型随机变量的分布列、数学期望时,首先要分清事件的构成与性质,确定离散型随机变量的所有取值,然后根据概率类型选择公式,计算每个变量取每个值的概率,列出对应的分布列,最后求出数学期望.正态分布是一种重要的分布,之前考过一次,尤其是正态分布的3σ原则.考向七 独立性检验样题9 某校为了让高一学生更有效率地利用周六的时间,在高一新生第一次摸底考试后采取周六到校自主学习,同时由班主任老师值班,家长轮流值班.一个月后进行了第一次月考,高一数学教研组通过系统抽样抽取了名学生,并统计了他们这两次数学考试的优良人数和非优良人数,其中部分统计数据如下:(1)请画出这次调查得到的列联表,并判定能否在犯错误的概率不超过的前提下认为周六到校自习对提高学生成绩有效?(2)从这组学生摸底考试数学优良成绩中和第一次月考数学非优良成绩中,按分层抽样随机抽取个成绩,再从这个成绩中随机抽取个,求这个成绩来自同一次考试的概率.下面是临界值表供参考:(参考公式:()()()()()22n ad bcΚa b c d a c b d-=++++,其中【解析】(1列联表如下:计算得的观测值为80010.8287k=>,因此能在犯错误的概率不超过的前提下,认为周六到校自习对提高学生成绩有效.。
2018年高考试题分类汇编(统计与概率)考点1 简单计数1.(2018·浙江卷)从1,3,5,7,9中任取2个数字,从0,2,4,6中任取2个数字,一共可以组成____个没有重复数字的四位数.(用数字作答)2.(2018·全国卷Ⅰ理科)从2位女生,4位男生中选3位参加科技比赛,且至少有1位女生入选,则不同的选法共有种.(用数字填写答案)考点2 随机事件的概率考法1古典概型1. (2018·全国卷Ⅱ文科)从2名男同学和3名女同学中任选2人参加社区服务,则选中的两人都是女同学的概率为A.0.6 B.0.5 C.0.4 D.0.32.(2018·全国卷Ⅱ理科)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果,哥德巴赫猜想是“每个大于2的偶数可以表示成两个素数的和”.例如30723=+.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A.112B.114C.115D.1183.(2018·江苏卷)某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为.4.(2018·上海卷)有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是_ __.(结果用最简分数表示)5.(2018·天津卷文科)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用,,,,,,A B C D E F G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(1)试用所给字母列举出所有可能的抽取结果;(2)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.考法2 几何概型1.(2018·全国卷Ⅰ文理)下图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC的斜边BC,直角边AB ,AC .ABC ∆的三边所围成的区域记为Ⅰ,黑色区域记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为1p ,2p ,3p ,则A.12p p =B. 13p p =C. 23p p =D. 123p p p =+考法3 互斥事件与相互独立事件 1.(2018·全国卷Ⅲ文科)某群中的成员只用现金支付的概率为0.45,既用现金也用非现金支付的概率为0.15,则不用现金支付的概率为A .0.3B .0.4C . 0.6D .0.72.(2018·全国卷Ⅲ理科)某群中的每位成员使用移动支付的概率都为p ,各成 员的支付方式互相独立,设X 为该群体的10位成员中使用移动支付的人数, 2.4DX =,(4)p X =<(6)p X =,则p =A .0.7B .0.6C .0.4D .0.3考点3 统计初步考法1 抽样方法1.(2018·全国卷Ⅲ文科)某公司有大量客户,且不同年龄段客户对其服务的平价有较大的差异.为了解客户的平价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最适合的抽样方法为 . 考法2 统计图表1.(2018·江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .2.(2018·全国卷Ⅰ文理)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解高该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:4% 6% 30% 60% 养殖收入 其他收入 第三产业收入 种植收入 建设前经济收入构成比例5% 28% 30% 37% 养殖收入 其他收入 第三产业收入 种植收入 建设后经济收入构成比例 8 9 9 9 0 1 1则下面结论中不正确的是A.新农村建成后,种植收入减少B.新农村建成后,其他收入增加一倍以上C.新农村建成后,养植收入增加一倍D.新农村建成后,养植收入与第三产业收入的总和超过了经济收入的一半考点4 统计与概率考法1 分布列、期望、方差1.(2018·天津卷理科)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16. 现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(Ⅰ)应从甲、乙、丙三个部门的员工中分别抽取多少人?(Ⅱ)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(1)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(2)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.2.(2018·全国卷Ⅰ理科)某工厂的某种产品成箱包装,每箱200件,每箱产品在交付用户之前要对产品作检验,如检验出不合格产品,则更换为合格产品.检验时,先从这箱产品种任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为(01)<<,且各件产品是否为不合格产品互相独立.p p(Ⅰ)记20件产品中恰有2件不合格品的概率为()p.f p的最大值f p,求()0(Ⅱ)现对一箱产品检验了20件,结果恰有2件不合格品,以(Ⅰ)中确定的p0作为p的值.已知每件产品的检验费为2元,若有不合格品进入用户手中,则工厂要对每件不合格产品支付25元的赔偿费用.(1)若不对该产箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;(2)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?3.(2018·北京卷文科)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)4.(2018·北京卷理科)好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(1,2,3,4,5,6k =).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.考法2 线性回归分析1.(2018·全国卷Ⅱ文理)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图,为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016的数据(时间变量t 的值依次为1,2,,17 )建立模型① 30.413.5y t =-+;根据2010年至2016的数据(时间变量t 的值依次为1,2,,7 )建立模型② 9917.5y t =+.(Ⅰ)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (Ⅱ)你认为哪个模型的预测值更可靠?并说明理由.考法3 用样本估计总体1.(2018·全国卷Ⅰ文科)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m )和使用节水龙头50天的日用水量数据,得到频率分布表如下:(Ⅰ)在答题卡上作出使用了节水龙头50天的日用水量频率分布直方图: (Ⅱ)估计该家庭使用了节水龙头后,日用水量小于3(Ⅲ)估计该家庭使用了节水龙头后,一年 能节省多少水?(一年按365天计算,同一 组中的数据以这组数据所在区间的中点的值 作代表.) 2000 2001 2002 20032004 2005 2006 2008 2007 2009 2010 2012 2014 2013 2015考法4 独立性检验1.(2018·全国卷Ⅲ文理)某工厂为了提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20名工人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(Ⅰ)根据茎叶图判断哪种生产方式的效率更高?并说明理由.(Ⅱ)求40名工人完成生产任务所需的时间的中位数m , 并将完成生产任务所(Ⅲ)根据(Ⅱ)中列联表,能否有99%把握认为两种生产方式的效率有差异?附:22()()()()()n ad bc K a b c d a c b d -=++++第一种生产方式 第二种生产方式 8 8 7 6 5 5 6 8 9 0 1 2 2 3 4 5 6 6 8 1 4 4 5 09 9 7 6 2 9 8 7 7 6 5 4 3 3 2 2 1 1 0 0。
2018全国高考真题数学统计与概率专题(附答案解析)1.(全国卷I,文数、理数第3题.5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A2.(全国卷I,文数19题.12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数 1 3 2 4 9 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案解析】解:(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=. 3.(全国卷I ,理数20题12分)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品,检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为()01p p <<,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为()f p ,求()f p 的最大值点0p ; (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【答案解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-.因此 2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =.当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数,依题意知(180,0.1)YB ,=+.X Y=⨯+,即402520225X Y所以(4025)4025490=+=+=.EX E Y EY(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于400EX>,故应该对余下的产品作检验.4.(全国卷Ⅱ,文数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5C.0.4D.0.3【答案】D5.(全国卷Ⅱ,文数、理数18题.12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5y t=-+;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案解析】解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.6.(全国卷Ⅱ,理数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5 C.0.4 D.0.3【答案】A7.(全国卷Ⅲ,文数5题.5分)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为A.0.3 B.0.4 C.0.6 D.0.7【答案】B8.(全国卷Ⅲ,文数、理数18题.12分)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m 和不超过m的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()0.0500.0100.0013.8416.63510.828P K kk≥.【答案解析】解:(1)第二种生产方式的效率更高.理由如下:(i)由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.(ii)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.(iii)由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.(iv)由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.学科%网以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分. (2)由茎叶图知7981802m +==. 列联表如下:超过m 不超过m第一种生产方式 15 5 第二种生产方式515(3)由于2240(151555)10 6.63520202020K ⨯-⨯==>⨯⨯⨯,所以有99%的把握认为两种生产方式的效率有差异.9.(北京卷,文数17题,13分)电影公司随机收集了电影的有关数据,经分类整理得到下表: 电影类型 第一类 第二类 第三类 第四类 第五类 第六类 电影部数 140 50 300 200 800 510 好评率0.40.20.150.250.20.1好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;学科*网(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)【答案解析】(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000. 第四类电影中获得好评的电影部数是200×0.25=50, 故所求概率为500.0252000=. (Ⅱ)方法一:由题意知,样本中获得好评的电影部数是 140×0.4+50×0.2+300×0.15+200×0.25+800×0.2+510×0.1 =56+10+45+50+160+51=372.故所求概率估计为37210.8142000-=. 方法二:设“随机选取1部电影,这部电影没有获得好评”为事件B .没有获得好评的电影共有140×0.6+50×0.8+300×0.85+200×0.75+800×0.8+510×0.9=1628部.由古典概型概率公式得16280.8142)00(0P B ==. (Ⅲ)增加第五类电影的好评率, 减少第二类电影的好评率. 10.(北京卷,理数17题,12分)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值. 假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率; (Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等,用“1k ξ=”表示第k 类电影得到人们喜欢,“0k ξ=”表示第k 类电影没有得到人们喜欢(k =1,2,3,4,5,6).写出方差1D ξ,2D ξ,3D ξ,4D ξ,5D ξ,6D ξ的大小关系.【答案解析】解:(Ⅰ)由题意知,样本中电影的总部数是140+50+300+200+800+510=2000, 第四类电影中获得好评的电影部数是200×0.25=50. 故所求概率为500.0252000=. (Ⅱ)设事件A 为“从第四类电影中随机选出的电影获得好评”, 事件B 为“从第五类电影中随机选出的电影获得好评”. 故所求概率为P (AB AB +)=P (AB )+P (AB )=P (A )(1–P (B ))+(1–P (A ))P (B ). 由题意知:P (A )估计为0.25,P (B )估计为0.2. 故所求概率估计为0.25×0.8+0.75×0.2=0.35. (Ⅲ)1D ξ>4D ξ>2D ξ=5D ξ>3D ξ>6D ξ. 11.(天津卷,文数,15题,13分)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A ,B ,C ,D ,E ,F ,G 表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i )试用所给字母列举出所有可能的抽取结果;(ii )设M 为事件“抽取的2名同学来自同一年级”,求事件M 发生的概率.【答案解析】本小题主要考查随机抽样、用列举法计算随机事件所含的基本事件数、古典概型及其概率计算公式等基本知识.考查运用概率知识解决简单实际问题的能力.满分13分. (Ⅰ)解:由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(Ⅱ)(i )解:从抽出的7名同学中随机抽取2名同学的所有可能结果为{A ,B },{A ,C },{A ,D },{A ,E },{A ,F },{A ,G },{B ,C },{B ,D },{B ,E },{B ,F },{B ,G },{C ,D },{C ,E },{C ,F },{C ,G },{D ,E },{D ,F },{D ,G },{E ,F },{E ,G },{F ,G },共21种.(ii )解:由(Ⅰ),不妨设抽出的7名同学中,来自甲年级的是A ,B ,C ,来自乙年级的是D ,E ,来自丙年级的是F ,G ,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A ,B },{A ,C },{B ,C },{D ,E },{F ,G },共5种. 所以,事件M 发生的概率为P (M )=521. 12.(天津卷,理数,16题,13分)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16. 现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(I )应从甲、乙、丙三个部门的员工中分别抽取多少人?(II)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.【答案解析】本小题主要考查随机抽样、离散型随机变量的分布列与数学期望、互斥事件的概率加法公式等基础知识.考查运用概率知识解决简单实际问题的能力.满分13分.学.科网(Ⅰ)解:由已知,甲、乙、丙三个部门的员工人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7人,因此应从甲、乙、丙三个部门的员工中分别抽取3人,2人,2人.(Ⅱ)(i)解:随机变量X的所有可能取值为0,1,2,3.P(X=k)=34337C CCk k-⋅(k=0,1,2,3).所以,随机变量X的分布列为随机变量X的数学期望11218412 ()0123353535357E X=⨯+⨯+⨯+⨯=.(ii)解:设事件B为“抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人”;事件C为“抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人”,则A=B∪C,且B与C互斥,由(i)知,P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=67.所以,事件A发生的概率为67.13.(江苏卷,3题,5分)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为__________.【答案解析】答案:90解析:8989909191905++++=14.(浙江卷,7题,4分)设0<p<1,随机变量ξ的分布列是ξ0 1 2P12p-122p 则当p在(0,1)内增大时,A.D(ξ)减小B.D(ξ)增大C.D(ξ)先减小后增大D.D(ξ)先增大后减小【答案】D第11 页共11 页。
2018年全国高考理科数学分类汇编——概率统计1.(北京)电影公司随机收集了电影的有关数据,经分类整理得到下表:好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.假设所有电影是否获得好评相互独立.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率;(Ⅲ)假设每类电影得到人们喜欢的概率与表格中该类电影的好评率相等.用“ξk=1”表示第k 类电影得到人们喜欢.“ξk=0”表示第k类电影没有得到人们喜欢(k=1,2,3,4,5,6).写出方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系.【解答】解:(Ⅰ)设事件A表示“从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影”,总的电影部数为140+50+300+200+800+510=2000部,第四类电影中获得好评的电影有:200×0.25=50部,∴从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的频率为:P(A)==0.025.(Ⅱ)设事件B表示“从第四类电影和第五类电影中各随机选取1部,恰有1部获得好评”,第四类获得好评的有:200×0.25=50部,第五类获得好评的有:800×0.2=160部,则从第四类电影和第五类电影中各随机选取1部,估计恰有1部获得好评的概率:P(B)==0.35.(Ⅲ)由题意知,定义随机变量如下:ξk=,则ξk服从两点分布,则六类电影的分布列及方差计算如下:第一类电影:E(ξ1)=1×0.4+0×0.6=0.4,D(ξ1)=(1﹣0.4)2×0.4+(0﹣0.4)2×0.6=0.24.第二类电影:E(ξ2)=1×0.2+0×0.8=0.2,D(ξ2)=(1﹣0.2)2×0.2+(0﹣0.2)2×0.8=0.16.第三类电影:E(ξ3)=1×0.15+0×0.85=0.15,D(ξ3)=(1﹣0.15)2×0.15+(0﹣0.85)2×0.85=0.1275.第四类电影:E(ξ4)=1×0.25+0×0.75=0.15,D(ξ4)=(1﹣0.25)2×0.25+(0﹣0.75)2×0.75=0.1875.第五类电影:E(ξ5)=1×0.2+0×0.8=0.2,D(ξ5)=(1﹣0.2)2×0.2+(0﹣0.2)2×0.8=0.16.第六类电影:E(ξ6)=1×0.1+0×0.9=0.1,D(ξ5)=(1﹣0.1)2×0.1+(0﹣0.1)2×0.9=0.09.∴方差Dξ1,Dξ2,Dξ3,Dξ4,Dξ5,Dξ6的大小关系为:Dξ6<Dξ3<Dξ2=Dξ5<Dξ4<Dξ1.2.(江苏)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为90.【解答】解:根据茎叶图中的数据知,这5位裁判打出的分数为89、89、90、91、91,它们的平均数为×(89+89+90+91+91)=90.故答案为:90.3.(江苏)某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为0.3.【解答】解:(适合理科生)从2名男同学和3名女同学中任选2人参加社区服务,共有C52=10种,其中全是女生的有C32=3种,故选中的2人都是女同学的概率P==0.3,(适合文科生),设2名男生为a,b,3名女生为A,B,C,则任选2人的种数为ab,aA,aB,aC,bA,bB,Bc,AB,AC,BC共10种,其中全是女生为AB,AC,BC共3种,故选中的2人都是女同学的概率P==0.3,故答案为:0.34.(全国1卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()AA.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解答】解:设建设前经济收入为a,建设后经济收入为2a.A项,种植收入37×2a﹣60%a=14%a>0,故建设后,种植收入增加,故A项错误.B项,建设后,其他收入为5%×2a=10%a,建设前,其他收入为4%a,故10%a÷4%a=2.5>2,故B项正确.C项,建设后,养殖收入为30%×2a=60%a,建设前,养殖收入为30%a,故60%a÷30%a=2,故C项正确.D项,建设后,养殖收入与第三产业收入总和为(30%+28%)×2a=58%×2a,经济收入为2a,故(58%×2a)÷2a=58%>50%,故D项正确.因为是选择不正确的一项,故选:A.5.(全国1卷)如图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC的斜边BC,直角边AB,AC.△ABC的三边所围成的区域记为I,黑色部分记为Ⅱ,其余部分记为Ⅲ.在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,p2,p3,则()AA.p1=p2B.p1=p3C.p2=p3D.p1=p2+p3【解答】解:如图:设BC=a,AB=c,AC=b,∴a2=b2+c2,∴SⅠ=×4bc=2bc,SⅢ=×πa2﹣2bc,SⅡ=×πc2+×πb2﹣SⅢ=×πc2+×πb2﹣×πa2+2bc=2bc,∴SⅠ=SⅡ,∴P1=P2,故选:A.6.(全国1卷)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验.设每件产品为不合格品的概率都为p(0<p<1),且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为f(p),求f (p)的最大值点p0.(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的p0作为p的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X,求EX;(ⅱ)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【解答】解:(1)记20件产品中恰有2件不合格品的概率为f(p),则f(p)=,∴=,令f′(p)=0,得p=0.1,当p∈(0,0.1)时,f′(p)>0,当p∈(0.1,1)时,f′(p)<0,∴f (p)的最大值点p0=0.1.(2)(i)由(1)知p=0.1,令Y表示余下的180件产品中的不合格品数,依题意知Y~B(180,0.1),X=20×2+25Y,即X=40+25Y,∴E(X)=E(40+25Y)=40+25E(Y)=40+25×180×0.1=490.(ii)如果对余下的产品作检验,由这一箱产品所需要的检验费为400元,∵E(X)=490>400,∴应该对余下的产品进行检验.7.(全国2卷)我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如30=7+23.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是()CA.B.C.D.解:在不超过30的素数中有,2,3,5,7,11,13,17,19,23,29共10个,从中选2个不同的数有=45种,和等于30的有(7,23),(11,19),(13,17),共3种,则对应的概率P==,故选:C.8. (全国2卷)如图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,…,17)建立模型①:=﹣30.4+13.5t;根据2010年至2016年的数据(时间变量t的值依次为1,2,…,7)建立模型②:=99+17.5t.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解答】解:(1)根据模型①:=﹣30.4+13.5t,计算t=19时,=﹣30.4+13.5×19=226.1;利用这个模型,求出该地区2018年的环境基础设施投资额的预测值是226.1亿元;根据模型②:=99+17.5t,计算t=9时,=99+17.5×9=256.5;.利用这个模型,求该地区2018年的环境基础设施投资额的预测值是256.5亿元;(2)模型②得到的预测值更可靠;因为从总体数据看,该地区从2000年到2016年的环境基础设施投资额是逐年上升的,而从2000年到2009年间递增的幅度较小些,从2010年到2016年间递增的幅度较大些,所以,利用模型②的预测值更可靠些.9.(全国3卷)某群体中的每位成员使用移动支付的概率都为p,各成员的支付方式相互独立.设X为该群体的10位成员中使用移动支付的人数,DX=2.4,P(x=4)<P(X=6),则p=()BA.0.7 B.0.6 C.0.4 D.0.3【解答】解:某群体中的每位成员使用移动支付的概率都为p,看做是独立重复事件,满足X~B(10,p),P(x=4)<P(X=6),可得,可得1﹣2p<0.即p.因为DX=2.4,可得10p(1﹣p)=2.4,解得p=0.6或p=0.4(舍去).故选:B.10.(全国3卷)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人.第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=,【解答】解:(1)根据茎叶图中的数据知,第一种生产方式的工作时间主要集中在70~92之间,第二种生产方式的工作时间主要集中在65~90之间,所以第二种生产方式的工作时间较少些,效率更高;(2)这40名工人完成生产任务所需时间按从小到大的顺序排列后,排在中间的两个数据是79和81,计算它们的中位数为m==80;由此填写列联表如下;(3)根据(2)中的列联表,计算K2===10>6.635,∴能有99%的把握认为两种生产方式的效率有差异.11.(上海)有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是(结果用最简分数表示).【解答】解:编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,3个数中含有1个2;2个2,没有2,3种情况,所有的事件总数为:=10,这三个砝码的总质量为9克的事件只有:5,3,1或5,2,2两个,所以:这三个砝码的总质量为9克的概率是:=,故答案为:.12.(天津)已知某单位甲、乙、丙三个部门的员工人数分别为24,16,16.现采用分层抽样的方法从中抽取7人,进行睡眠时间的调查.(Ⅰ)应从甲、乙、丙三个部门的员工中分别抽取多少人?(Ⅱ)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,求随机变量X的分布列与数学期望;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,求事件A发生的概率.【解答】解:(Ⅰ)单位甲、乙、丙三个部门的员工人数分别为24,16,16.人数比为:3:2:2,从中抽取7人现,应从甲、乙、丙三个部门的员工中分别抽取3,2,2人.(Ⅱ)若抽出的7人中有4人睡眠不足,3人睡眠充足,现从这7人中随机抽取3人做进一步的身体检查.(i)用X表示抽取的3人中睡眠不足的员工人数,随机变量X的取值为:0,1,2,3,,k=0,1,2,3.所以随机变量的分布列为:随机变量X的数学期望E(X)==;(ii)设A为事件“抽取的3人中,既有睡眠充足的员工,也有睡眠不足的员工”,设事件B为:抽取的3人中,睡眠充足的员工有1人,睡眠不足的员工有2人,事件C为抽取的3人中,睡眠充足的员工有2人,睡眠不足的员工有1人,则:A=B∪C,且P(B)=P(X=2),P(C)=P(X=1),故P(A)=P(B∪C)=P(X=2)+P(X=1)=.所以事件A发生的概率:.13.(浙江)设0<p<1,随机变量ξ的分布列是则当p在(0,1)内增大时,()A.D(ξ)减小B.D(ξ)增大C.D(ξ)先减小后增大D.D(ξ)先增大后减小【解答】解:设0<p<1,随机变量ξ的分布列是E(ξ)=0×+1×+2×=p+;方差是D(ξ)=×+×+×=﹣p2+p+=﹣+,∴p∈(0,)时,D(ξ)单调递增;p∈(,1)时,D(ξ)单调递减;∴D(ξ)先增大后减小.故选:D.。
2018高考试题解析分类汇编(理数)18:概率与统计一、选择题错误!未指定书签。
.(2018年普通高等学校招生统一考试辽宁数学(理)试题(WORD版))某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组一次为[)[)20,40,40,60,[)[)60,80,820,100.若低于60分的人数是18人,则该班的学生人数是()A.45B.50C.55D.60【答案】B第一、第二小组的频率分别是0.1、0.2,所以低于60分的频率是0.3,设班级人数为m,则150.3m=,50m=。
选B.错误!未指定书签。
.(2018年高考陕西卷(理))某单位有840名职工, 现采用系统抽样方法, 抽取42人做问卷调查, 将840人按1, 2, , 840随机编号, 则抽取的42人中, 编号落入区间[481, 720]的人数为()A.18 B.18 C.18 D.18【答案】B使用系统抽样方法,从840人中抽取42人,即从20人抽取1人。
,所以从编号1~480的人中,恰好抽取24人,接着从编号481~720共240人中抽取18人。
故选B错误!未指定书签。
.(2018年普通高等学校招生统一考试安徽数学(理)试题(纯WORD版))某班级有50名学生,其中有30名男生和20名女生,随机询问了该班五名男生和五名女生在某次数学测验中的成绩,五名男生的成绩分别为86,94,88,92,90,五名女生的成绩分别为88,93,93,88,93.下列说法一定正确的是()A.这种抽样方法是一种分层抽样B.这种抽样方法是一种系统抽样C.这五名男生成绩的方差大于这五名女生成绩的方差D.该班级男生成绩的平均数小于该班女生成绩的平均数【答案】C对A选项,分层抽样要求男女生总人数之比=男女生抽样人数之比,所以A选项错。
对B选项,系统抽样要求先对个体进行编号再抽样,所以B选项错。
对C选项,男生方差为40,女生方差为30。
所以C选项正确。
2018全国高考真题数学统计与概率专题(附答案解析)1.(全国卷I,文数、理数第3题.5分)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半答案:A2.(全国卷I,文数19题.12分)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,[)0.60.7,频数 1 3 2 4 9 26 5使用了节水龙头50天的日用水量频数分布表日用水量[)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数 1 5 13 10 16 5 (1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【答案解析】解:(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m 3的概率的估计值为0.48. (3)该家庭未使用节水龙头50天日用水量的平均数为11(0.0510.1530.2520.3540.4590.55260.655)0.4850x =⨯+⨯+⨯+⨯+⨯+⨯+⨯=. 该家庭使用了节水龙头后50天日用水量的平均数为21(0.0510.1550.25130.35100.45160.555)0.3550x =⨯+⨯+⨯+⨯+⨯+⨯=. 估计使用节水龙头后,一年可节省水3(0.480.35)36547.45(m )-⨯=. 3.(全国卷I ,理数20题12分)某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品,检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为()01p p <<,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为()f p ,求()f p 的最大值点0p ; (2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?【答案解析】(1)20件产品中恰有2件不合格品的概率为221820()C (1)f p p p =-.因此 2182172172020()C [2(1)18(1)]2C (1)(110)f p p p p p p p p '=---=--.令()0f p '=,得0.1p =.当(0,0.1)p ∈时,()0f p '>;当(0.1,1)p ∈时,()0f p '<. 所以()f p 的最大值点为00.1p =. (2)由(1)知,0.1p =.(i )令Y 表示余下的180件产品中的不合格品件数,依题意知(180,0.1)YB ,=+.X Y=⨯+,即402520225X Y所以(4025)4025490=+=+=.EX E Y EY(ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为400元.由于400EX>,故应该对余下的产品作检验.4.(全国卷Ⅱ,文数5题.5分)从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为A.0.6 B.0.5C.0.4D.0.3【答案】D5.(全国卷Ⅱ,文数、理数18题.12分)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5y t=-+;根据2010年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【答案解析】解:(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为。
1.两个变量的线性相关(1)正相关在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关.(2)负相关在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法.(2)回归方程方程错误!=错误!x+错误!是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),…,(x n,y n)的回归方程,其中a,^,错误!是待定参数.错误!3.回归分析(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1,y1),(x2,y2),…,(x n,y n),其中(错误!,错误!)称为样本点的中心.(3)相关系数当r>0时,表明两个变量正相关;当r〈0时,表明两个变量负相关.r的绝对值越接近于1,表明两个变量的线性相关性越强.r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系.通常|r|大于0.75时,认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.(2)列联表:列出两个分类变量的频数表,称为列联表.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为2×2列联表构造一个随机变量K2=错误!,其中n=a+b+c+d为样本容量.(3)独立性检验利用随机变量K2来判断“两个分类变量有关系"的方法称为独立性检验.【思考辨析】判断下列结论是否正确(请在括号中打“√"或“×")(1)相关关系与函数关系都是一种确定性的关系,也是一种因果关系.(×)(2)“名师出高徒”可以解释为教师的教学水平与学生的水平成正相关关系.( √)(3)只有两个变量有相关关系,所得到的回归模型才有预测价值.( √)(4)某同学研究卖出的热饮杯数y与气温x(℃)之间的关系,得回归方程错误!=-2。
专题12 概率与统计1.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为( ) A.15 B.25 C.825 D.925答案:B2.在区间[-5,5]内随机地取出一个数a ,则恰好使1是关于x 的不等式2x 2+ax -a 2<0的一个解的概率为( )A .0.3B .0.4C .0.6D .0.7 解析:由已知得2+a -a 2<0, 解得a >2或a <-1.故当a ∈[-5,-1)∪(2,5]时,1是关于x 的不等式2x 2+ax -a 2<0的一个解. 故所求事件的概率P =(-1+5)+(5-2)5-(-5)=710=0.7.答案:D3.某同学先后投掷一枚质地均匀的骰子两次,第一次向上的点数记为x ,第二次向上的点数记为y ,在直角坐标系xOy 中,以(x ,y )为坐标的点落在直线2x -y =1上的概率为( )A.112 B.19 C.536 D.16解析:先后掷两次骰子,共有6×6=36种不同结果.而以(x ,y )为坐标的点落在直线2x -y =1上的结果有(1,1),(2,3),(3,5),共3种,故所求概率为336=112.答案:A4.在区间[0,1]上随机取两个数x ,y ,记p 1为事件“x +y ≤12”的概率,p 2为事件“xy ≤12”的概率,则( )A .p 1<p 2<12B .p 2<12<p 1C.12<p 2<p 1 D .p 1<12<p 2解析:(x ,y )构成的区域是边长为1的正方形及其内部,其中满足x +y ≤12的区域如图①中阴影部分所示,所以p 1=12×12×121×1=18.满足“xy ≤12”的区域如图②中阴影部分所示.图① 图②所以p 2=S 1+S 21×1=S 1+S 2>12, 因此p 1<12<p 2.答案:D5.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A .93B .123C .137D .167解析:由题干扇形统计图可得该校女教师人数为:110×70%+150×(1-60%)=137. 答案:C6.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3解析:由于三种抽样过程中每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3. 答案:D7.已知变量x 和y 满足关系y =-0.1x +1,变量y 与z 正相关.下列结论中正确的是( ) A .x 与y 正相关,x 与z 负相关 B .x 与y 正相关,x 与z 正相关 C .x 与y 负相关,x 与z 负相关 D .x 与y 负相关,x 与z 正相关答案:C8.亚冠联赛前某参赛队准备在甲、乙两名球员中选一人参加比赛.如图所示的茎叶图记录了一段时间内甲、乙两人训练过程中的成绩,若甲、乙两名球员的平均成绩分别是x 1,x 2,则下列结论正确的是( )A .x 1>x 2,选甲参加更合适B .x 1>x 2,选乙参加更合适C .x 1=x 2,选甲参加更合适D .x 1=x 2,选乙参加更合适答案:A9.某新闻媒体为了了解观众对央视《开门大吉》节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:参考附表:可得K 2=110×(40×30-20×20)260×50×60×50≈7.822>6.635,所以有99%的把握认为“喜爱《开门大吉》节目与否和性别有关”. 答案:99%10.某单位为了了解用电量y(单位:度)与气温x (单位:℃)之间的关系,随机统计了某4天的用电量与当天气温,并制作了对照表:由表中数据得回归直线方程y =b x +a 中的b =-2,预测当气温为-4 ℃时,用电量为________度.答案:6811.某电子商务公司对10 000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.解析:(1)由0.1×1.5+0.1×2.5+0.1a +0.1×2.0+0.1×0.8+0.1×0.2=1,解得a =3. (2)区间[0. 3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6. 因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10 000=6 000. 答案:(1)3 (2)6 00012.一根绳子长为6米,绳子上有5个节点将绳子6等分,现从5个节点中随机选一个将绳子剪断,则所得的两段绳长均不小于2米的概率为________.解析:随机选一个节点将绳子剪断共有5种情况,分别为(1,5),(2,4),(3,3),(4,2),(5,1).满足两段绳长均不小于2米的为(2,4),(3,3),(4,2),共3种情况.所以所求概率为35.答案:3513.全网传播的融合指数是衡量电视媒体在中国网民中影响力的综合指标.根据相关报道提供的全网传播2015年某全国性大型活动的“省级卫视新闻台”融合指数的数据,对名列前20名的“省级卫视新闻台”的融合指数进行分组统计,结果如下表所示.(1)现从融合指数在[4,5)和[72家进行调研,求至少有1家的融合指数在[7,8]内的概率;(2)根据分组统计表求这20家“省级卫视新闻台”的融合指数的平均数.14.某出租车公司响应国家节能减排的号召,已陆续购买了140辆纯电动汽车作为运营车辆.目前我国主流纯电动汽车按续航里程数R (单位:千米)分为3类,即A 类:80≤R <150,B 类:150≤R <250,C 类:R ≥250.该公司对这140辆车的行驶总里程进行统计,结果如下表:(1)从这(2)公司为了了解这些车的工作状况,决定抽取14辆车进行车况分析,按表中描述的六种情况进行分层抽样,设从C 类车中抽取了n 辆车.①求n 的值;②如果从这n 辆车中随机选取两辆车,求恰有一辆车行驶总里程超过10万千米的概率.解:(1)从这140辆汽车中任取一辆,则该车行驶总里程超过10万千米的概率为P 1=20+20+20140=37.(2)①依题意n =30+20140×14=5.②5辆车中已行驶总里程不超过10万千米的车有3辆,记为a ,b ,c ;5辆车中已行驶总里程超过10万千米的有2辆,记为m,n.“从5辆车中随机选取两辆车”的所有选法共10种:ab,ac,am,an,bc,bm,bn,cm,cn,mn. “从5辆车中随机选取两辆车,恰有一辆车行驶里程超过10万千米”的选法共6种:am,an,bm,bn,cm,cn,则选取两辆车中恰有一辆车行驶里程超过10万千米的概率P2=610=3 5.15.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?。
2018年高考题分章节汇编选修Ⅱ第一章概率与统计一、选择题1.(2018年高考.湖北卷.理11文12)某初级中学有学生270人,其中一年级108人,二、三年级各81人,现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,...,270;使用系统抽样时,将学生统一随机编号1,2, (270)并将整个编号依次分为10段。
如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270;关于上述样本的下列结论中,正确的是(D )A.②、③都不能为系统抽样B.②、④都不能为分层抽样C.①、④都可能为系统抽样D.①、③都可能为分层抽样2.(2018年高考·江西卷·文12)为了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图,如右,由于不慎将部分数据丢失,但知道前4组的频数成等比数列,后6组的频数成等差数列,设最大频率为a,视力在4.6到5.0之间的学生数为b,则a, b的值分别为( A )A.0,27,78 B.0,27,83C.2.7,78 D.2.7,833.(2018年高考·江苏卷7)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4 8.4 9.4 9.9 9.6 9.4 9.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(D)A.9.4,0.484 B.9.4,0.016 C.9.5,0.18 D.9.5,0.0164.(2018年高考·浙江卷·文6)从存放号码分别为1,2,…,10的卡片的盒子中,在放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( A ) A.0.53B.0.5C.0.47D.0.37二、填空题1.(2018年高考·湖南卷·理11文12)一工厂生产了某种产品16800件,它们来自甲.乙.丙3条生产线,为检查这批产品的质量,决定采用分层抽样的方法进行抽样,已知甲.乙.丙三条生产线抽取的个体数组成一个等差数列,则乙生产线生产了 件产品. 56002.(2018年高考·山东卷·文13)某学校共有教师490人,其中不到40岁的有140人,岁即以上的有人。
2017高考理科专题 概率与统计(解析)一、选择题1. 5个车位分别停放了,,,,,5A B C D E 辆不同的车,现将所有车开出后再按,,,,A B C D E 的次序停入这5个车位,则在A 车停入了B 车原来的位置的条件下,停放结束后恰有1辆车停在原来位置上的概率是( ) A.38 B. 340 C. 16 D. 1122.如图是八位同学400米测试成绩的茎叶图(单位:秒),则( )A. 平均数为64B. 众数为7C. 极差为17D. 中位数为64.53.五个人围坐在一张圆桌旁,每个人面前放着完全相同的硬币,所有人同时翻转自己的硬币.若 硬币正面朝上, 则这个人站起来; 若硬币正面朝下, 则这个人继续坐着. 那么, 没有相邻的两 个人站起来的概率为( ) A.516 B. 1132 C. 1532D. 12 4. 5名学生进行知识竞赛.笔试结束后,甲、乙两名参赛者去询问成绩,回答者对甲说:“你们5人的成绩互不相同,很遗憾,你的成绩不是最好的”;对乙说:“你不是最后一名”.根据以上信息,这5人的笔试名次的所有可能的种数是( ) A. 54 B. 72 C. 78 D. 965.已知5件产品中有2件次品,现逐一检测,直至能确定...所有次品为止,记检测的次数为ξ,则E ξ=( ) A. 3 B.72 C. 185D. 4 6.将编号为1,2,3,4,5,6的六个小球放入编号为1,2,3,4,5,6的六个盒子,每个盒子放一个小球,若有且只有三个盒子的编号与放入的小球编号相同,则不同的放法总数是A. 40B. 60C. 80D. 1007.某厂家为了解广告宣传费与销售轿车台数之间的关系,得到如下统计数据表:根据数据万元时,销售轿车台数为A. 17B. 18C. 19D. 20二、填空题8.有3女2男共5名志愿者要全部分到3个社区去参加志愿服务,每个社区1到2人,甲、乙两名女志愿者需到同一社区,男志愿者到不同社区,则不同的分法种数为__________.10.从1,2,3,4,5,6,7这七个数中,随机抽取3个不同的数,则这3个数的和为偶数的概率是________.三、解答题11.一企业从某生产线上随机抽取100件产品,测量这些产品的某项技术指标值x,得到的频率分布直方图如图.(1)估计该技术指标值x平均数x;(2)在直方图的技术指标值分组中,以x落入各区间的频率作为x取该区间值的频率,若->,则产品不合格,现该企业每天从该生产线上随机抽取5件产品检测,记不合格x x4产品的个数为ξ,求ξ的数学期望Eξ.12.某保险公司针对企业职工推出一款意外险产品,每年每人只要交少量保费,发生意外后可一次性获赔50万元.保险公司把职工从事的所有岗位共分为A、B、C三类工种,根据历史数据统计出三类工种的每赔付频率如下表(并以此估计赔付概率).(Ⅰ)根据规定,该产品各工种保单的期望利润都不得超过保费的20%,试分别确定各类工种每张保单保费的上限;(Ⅱ)某企业共有职工20000人,从事三类工种的人数分布比例如图,老板准备为全体职工每人购买一份此种保险,并以(Ⅰ)中计算的各类保险上限购买,试估计保险公司在这宗交易中的期望利润.13.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等极如下表: 质量指标值m 185m <185205m ≤<205m ≥等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(1)根据以上抽样调查数据 ,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品90%”的规定?(2)在样本中,按产品等极用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(3)该企业为提高产品质量,开展了“质量提升月”活动,活动后再抽样检测,产品质量指标值X 近似满足()~218,140X N ,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?14. “微信运动”已成为当下热门的健身方式,小王的微信朋友圈内也有大量好友参与了“微信运动”,他随机选取了其中的40人(男、女各20人),记录了他们某一天的走路步数,并将数据整理如下:(1)已知某人一天的走路步数超过8000步被系统评定“积极型”,否则为“懈怠型”,根据题意完成下面的22⨯列联表,并据此判断能否有95%以上的把握认为“评定类型”与“性别”有关?附: ()()()()()22n ad bc k a b c d a c b d -=++++,()20P K k ≥ 0.10 0.05 0.025 0.0100k2.706 3.841 5.024 6.635(2)若小王以这40位好友该日走路步数的频率分布来估计其所有微信好友每日走路步数的概率分布,现从小王的所有微信好友中任选2人,其中每日走路不超过5000步的有X 人,超过10000步的有Y 人,设X Y ξ=-,求ξ的分布列及数学期望.15.某种产品的质量以其质量指标值衡量,并依据质量指标值划分等级如下表: 质量指标值m 185m <185205m ≤<205m ≥等级三等品二等品一等品从某企业生产的这种产品中抽取200件,检测后得到如下的频率分布直方图:(Ⅰ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“一、二等品至少要占全部产品92%”的规定?(Ⅱ)在样本中,按产品等级用分层抽样的方法抽取8件,再从这8件产品中随机抽取4件,求抽取的4件产品中,一、二、三等品都有的概率;(Ⅲ)该企业为提高产品质量,开展了“质量提升月”活动,活动后在抽样检测,产品质量指标值X 近似满足()218,140X N ~,则“质量提升月”活动后的质量指标值的均值比活动前大约提升了多少?16.仪器经过检验合格才能出厂,初检合格率为34:若初检不合格,则需要进行调试,经调试后再次对其进行检验;若仍不合格,作为废品处理,再检合格率为45.每台仪器各项费用如表:项目生产成本检验费/次调试费出厂价金额(元)1000 100 200 3000(Ⅰ)求每台仪器能出厂的概率;(Ⅱ)求生产一台仪器所获得的利润为1600元的概率(注:利润=出厂价-生产成本-检验费-调试费);(Ⅲ)假设每台仪器是否合格相互独立,记X为生产两台仪器所获得的利润,求X的分布列和数学期望.17.随着社会发展,淮北市在一天的上下班时段也出现了堵车严重的现象。
交通指数是交通拥堵指数的简称,是综合反映道路网畅通或拥堵的概念.记交通指数为T,其范围为[0,10],分别有5个级别:T∈[0,2)畅通;T∈[2,4)基本畅通;T∈[4,6)轻度拥堵;T∈[6,8)中度拥堵;T∈[8,10]严重拥堵.早高峰时段(T≥3 ),从淮北市交通指挥中心随机选取了一至四马路之间50个交通路段,依据交通指数数据绘制的直方图如图所示:(I)据此直方图估算交通指数T∈[4,8)时的中位数和平均数;(II)据此直方图求出早高峰一至四马路之间的3个路段至少有2个严重拥堵的概率是多少?(III)某人上班路上所用时间若畅通时为20分钟,基本畅通为30分钟,轻度拥堵为35分钟,中度拥堵为45分钟,严重拥堵为60分钟,求此人用时间的数学期望.18.为研究男女同学空间想象能力的差异,孙老师从高一年级随机选取了20名男生、20名女生,进行空间图形识别测试,得到成绩茎叶图如下,假定成绩大于等于80分的同学为“空间想象能力突出”,低于80分的同学为“空间想象能力正常”.(1)完成下面22⨯列联表,并判断是否有90%的把握认为“空间想象能力突出”与性别有关;空间想象能力突出空间想象能力正常合计男生女生合计(2)从“空间想象能力突出”的同学中随机选取男生2名、女生2名,记其中成绩超过90分的人数为ξ,求随机变量ξ的分布列和数学期望.下面公式及临界值表仅供参考:()()()()()22n ad bcXa b c d a c b d-=++++()2P X k≥0.100 0.050 0.010 k 2.706 3.841 6.63519.校计划面向高一年级1200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类,自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(Ⅰ)分别计算抽取的样本中男生及女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类学生数;(Ⅱ)根据抽取的180名学生的调查结果,完成下列列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关? 选择自然科学类 选择社会科学类 合计 男生 女生 合计附: ()()()()()22n ab bc K a b c d a c b d -=++++,其中n a b c d =+++.()20P K k ≥0.50 0.40 0.25 0.15 0.10 0.050.0250.0100.0050.0010K0.4550.7081.3232.0722.7063.8415.0246.6357.87910.82820.共享单车是指由企业在校园、公交站点、商业区、公共服务区等场所提供的自行车单车共享服务,由于其依托“互联网+”,符合“低碳出行”的理念,已越来越多地引起了人们的关注.某部门为了对该城市共享单车加强监管,随机选取了100人就该城市共享单车的推行情况进行问卷调查,并将问卷中的这100人根据其满意度评分值(百分制)按照[50,60),[60,70),…,[90,100] 分成5组,制成如图所示频率分直方图.(Ⅰ) 求图中x的值;(Ⅱ) 已知满意度评分值在[90,100]内的男生数与女生数的比为2:1,若在满意度评分值为[90,100]的人中随机抽取4人进行座谈,设其中的女生人数为随机变量X,求X的分布列和数学期望.21.在某单位的职工食堂中,食堂每天以3元/个的价格从面包店购进面包,然后以5元/个的价格出售.如果当天卖不完,剩下的面包以1元/个的价格卖给饲料加工厂.根据以往统计资料,得到食堂每天面包需求量的频率分布直方图如下图所示.食堂某天购进了90个面包,以x (单位:个, 60110x ≤≤)表示面包的需求量, T (单位:元)表示利润.(Ⅰ)求T 关于x 的函数解析式;(Ⅱ)根据直方图估计利润T 不少于100元的概率; (III )在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,并以需求量落入该区间的频率作为需求量取该区间中间值的概率(例如:若需求量[)60,70x ∈,则取65x =,且65x =的概率等于需求量落入[)60,70的频率),求T 的分布列和数学期望.。