2018年高考文科数学分类之统计与概率
- 格式:doc
- 大小:793.00 KB
- 文档页数:7
专题11 概率与统计(六)统计1.随机抽样(1)理解随机抽样的必要性和重要性.(2)会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法.2.用样本估计总体(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.(2)理解样本数据标准差的意义和作用,会计算数据标准差.(3)能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.变量的相关性(1)会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.(2)了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.(七)概率1.事件与概率(1)了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.(2)了解两个互斥事件的概率加法公式.2.古典概型(1)理解古典概型及其概率计算公式.(2)会用列举法计算一些随机事件所含的基本事件数及事件发生的概率.3.随机数与几何概型(1)了解随机数的意义,能运用模拟方法估计概率.(2)了解几何概型的意义.(十七)统计案例了解下列一些常见的统计方法,并能应用这些方法解决一些实际问题.1.独立性检验了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.2.回归分析了解回归分析的基本思想、方法及其简单应用.对于统计的考查:1.从考查题型来看,选择题、填空题与解答题并重,并各有侧重,选择题、填空题中以考查抽样方法和用样本估计总体为主,兼顾两个变量的线性相关;解答题中则重点考查求回归直线方程及独立性检验. 2.从考查内容来看,主要考查抽样方法的选择,利用频率分布直方图、茎叶图等图表分析众数、中位数、平均数等数字特征,两个变量之间的线性相关等.3.从考查热点来看,用样本估计总体是高考命题的热点,频率分布直方图、茎叶图、众数、中位数、平均数等是考查的重点,要能够对数据进行分析,然后对总体作简单、准确的评价.对于概率的考查:1.从考查题型来看,涉及本专题的题目若在选择题、填空题中出现,则主要考查古典概型和几何概型概率的计算;若在解答题中出现,则主要考查古典概型概率的计算.2.从考查内容来看,主要考查在古典概型或几何概型下求随机事件的概率,通过互斥事件、对立事件考查等可能性事件的概率取值问题,体现了概率问题的实际应用状况.3.从考查热点来看,概率求值是高考命题的热点,以古典概型或几何概型为主线,考查随机事件的概率.解答题中常与统计知识相结合考查概率的求解,需注意知识的灵活运用.考向一三种抽样方法样题1 《九章算术》第三章“衰分”中有如下问题:“今有甲持钱五百六十,乙持钱三百五十,丙持钱一百八十,凡三人俱出关,关税百钱,欲以钱数多少衰出之,问各几何?”其意为:“今有甲带了560钱,乙带了350钱,丙带了180钱,三人一起出关,共需要交关税100钱,依照钱的多少按比例出钱”,则丙应出 钱(所得结果四舍五入,保留整数). 【答案】17【解析】本题主要考查分层抽样法.设丙应出x 钱,由题意可得100560350180180x=++,求解可得100180171090x ⨯=≈钱.考向二 样本的数字特征样题2 (2017新课标全国Ⅰ文科)为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值 D .x 1,x 2,…,x n 的中位数【答案】B考向三 频率分布直方图的应用样题3 (2017新课标全国Ⅱ文科)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg ), 其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50 kg”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比较. 附:(22()()()()()n ad bc K a b c d a c b d -=++++.(3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.【名师点睛】(1)频率分布直方图中小长方形面积等于对应概率,所有小长方形面积之和为1. (2)频率分布直方图中均值等于组中值与对应概率乘积的和. (3)均值大小代表水平高低,方差大小代表稳定性.考向四 线性回归方程及其应用样题4 为了解某公司员工的年收入和年支出的关系,随机调查了5名员工,得到如下统计数据表:根据上表可得回归直线方程ˆˆˆybx a =+,其中ˆ0.65b =入为15万元时支出为 A .9.05万元 B .9.25万元 C .9.75万元 D .10.25万元【答案】B考向五 概率的求解样题5 (2017新课标全国Ⅰ文科)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14 B .π8C .12D .π 4【答案】B样题6 如图,茎叶图表示的是甲,乙两人在5次综合测评中的成绩,其中一个数字被污染,则甲的平均成绩超过乙的平均成绩的概率为A .12 B .35 C .45D .710【答案】C【解析】由茎叶图可知,甲的平均成绩8889909192905++++=,乙的平均成绩为即352+450,x <得到98x <,又因为90x ≥,且x 是整数,故基本事件为从90到99,共10个, 而满足条件的为90到97,共8个,C . 考向六 独立性检验样题7 某校为了让高一学生更有效率地利用周六的时间,在高一新生第一次摸底考试后采取周六到校自主学习,同时由班主任老师值班,家长轮流值班.一个月后进行了第一次月考,高一数学教研组通过系统抽样抽取了名学生,并统计了他们这两次数学考试的优良人数和非优良人数,其中部分统计数据如下:(1)请画出这次调查得到的列联表,并判定能否在犯错误的概率不超过的前提下认为周六到校自习对提高学生成绩有效?(2)从这组学生摸底考试数学优良成绩中和第一次月考数学非优良成绩中,按分层抽样随机抽取个成绩,再从这个成绩中随机抽取个,求这个成绩来自同一次考试的概率.下面是临界值表供参考:(参考公式:()()()()()22n ad bcΚa b c d a c b d-=++++,其中【解析】(1列联表如下:计算得的观测值为80010.8287k=>,因此能在犯错误的概率不超过的前提下,认为周六到校自习对提高学生成绩有效.。
《2018年高考数学分类汇编》第十篇:计数原理、统计、概率一、选择题1.【2018全国一卷3】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:建设前经济收入构成比例 建设后经济收入构成比例则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.【2018全国一卷10】下图来自古希腊数学家希波克拉底所研究的几何图形.此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边AB ,AC .△ABC 的三边所围成的区域记为I ,黑色部分记为II ,其余部分记为III .在整个图形中随机取一点,此点取自I ,II ,III 的概率分别记为p 1,p 2,p 3,则 A .p 1=p 2B .p 1=p 3C .p 2=p 3D .p 1=p 2+p 33.【2018全国二卷8】我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于2的偶数可以表示为两个素数的和”,如.在不超过30的素数中,随机选取两个不同的数,其和等于30的概率是A .B .C .D .4.【2018全国三卷5】的展开式中的系数为30723=+112114115118522x x ⎛⎫+ ⎪⎝⎭4xA .10B .20C .40D .805.【2018全国三卷8】某群体中的每位成员使用移动支付的概率都为,各成员的支付方式相互独立,设为该群体的10位成员中使用移动支付的人数,,,则A .0.7B .0.6C .0.4D .0.36.【2018浙江卷7】设0<p <1,随机变量ξ的分布列是则当p 在(0,1)内增大时, A .D (ξ)减小B .D (ξ)增大C .D (ξ)先减小后增大D .D (ξ)先增大后减小二、填空题1.【2018全国一卷15】从2位女生,4位男生中选3人参加科技比赛,且至少有1位女生入选,则不同的选法共有_____________种.(用数字填写答案)2.【2018天津卷10】在5(x -的展开式中,2x 的系数为 .3.【2018江苏卷3.】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为 .4.【2018江苏卷6】某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为 .5.【2018浙江卷14】二项式81)2x的展开式的常数项是___________. p X 2.4DX =()()46P X P X =<=p =6.【2018浙江卷16】16.从1,3,5,7,9中任取2个数字,从0,2,4,6中任取2个数字,一共可以组成___________个没有重复数字的四位数.(用数字作答)7.【2018上海卷3】在7)1(x +的二项展开式中,2x 项的系数为 .(结果用数值表示) 8.【2018上海卷9】9.有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是______(结果用最简分数表示) 三、解答题1.【2018全国一卷20】某工厂的某种产品成箱包装,每箱200件,每一箱产品在交付用户之前要对产品作检验,如检验出不合格品,则更换为合格品.检验时,先从这箱产品中任取20件作检验,再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为)10(<<p p ,且各件产品是否为不合格品相互独立.(1)记20件产品中恰有2件不合格品的概率为)(p f ,求)(p f 的最大值点0p .(2)现对一箱产品检验了20件,结果恰有2件不合格品,以(1)中确定的0p 作为p 的值.已知每件产品的检验费用为2元,若有不合格品进入用户手中,则工厂要对每件不合格品支付25元的赔偿费用.(i )若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为X ,求EX ;(ii )以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验?2.【2018全国二卷18】下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:. y y t t 1217,,…,ˆ30.413.5y t =-+t 127,,…,ˆ9917.5yt =+(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.3.【2018全国三卷18】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人。
第十三章概率与统计本章知识结构图第一节 概率及其计算考纲解读1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3.掌握古典概型及其概率计算公式。
4.了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义。
命题趋势探究1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。
知识点精讲一、必然事件、不可能事件、随机事件在一定条件下:①必然要发生的事件叫必然事件; ②一定不发生的事件叫不可能事件;③可能发生也可能不发生的事件叫随机事件。
二、概率在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。
对于必然事件A ,;对于不可能事件A ,=0.三、基本事件和基本事件空间在一次实验中,不可能再分的事件称为基本事件,所有基本事件组成的集合称为基本事件空间。
四、两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件 2、每个基本事件发生的可能性相同()(A)=()A card P A card =Ω包含基本事件数基本事件总数2、几何概型条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为Aμ.()P A =AμμΩ。
五、互斥事件的概率1、互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A 与事件B 互斥,则()()()P A B P A P B =+ 。
2、对立事件事件A,B 互斥,且其中必有一个发生,称事件A,B 对立,记作B A =或A B =。
()()1P A p A =- 。
3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A ,B 对立”是”事件A ,B 互斥“的充分不必要条件。
第二节 统计与概率综合及统计案例题型138 抽样方式2013年1.(2013江西文5)总体有编号为01,02,,19,20的20个个体组成.利用下面的随机数表选取5个个体,选取方法是从随机数表第行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为( ).A .08B .07C .02D .012.(2013湖南文3) 某工厂甲、乙、丙三个车间生产了同一种产品,数量分别为120件,80件, 60件.为了解它们的产品质量是否存在显著差异,用分层抽样方法抽取了一个容量为的样本进行调查,其中从丙车间的产品中抽取了件,则n =( ).A. B.10 C.12 D.132014年 1.(2014四川文2)在“世界读书日”前夕,为了了解某地5000名居民某天的阅读时间,从中抽取了200名居民的阅读时间进行统计分析.在这个问题中,5000名居民的阅读时间的全体是( ).A.总体B.个体C.样本的容量D.从总体中抽取的一个样本2.(2014重庆文3)某中学有高中生3500人,初中生1500人,为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为的样本,已知从高中生中抽取70人,则n =( ). A.100B.150C.200D.2503.(2014广东文6)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( ).A.50B.40C.25D.20 4.(2014湖南文3)对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( ).A.123p p p =<B. 231p p p =<C.132p p p =<D.123p p p == 5.(2014湖北文11)甲、乙两套设备生产的同类型产品共4800件,采用分层抽样的方法从中抽取一个容量为80的样本进行质量检测. 若样本中有50件产品由甲设备生产,则乙设备生产的产品总 数为件.6.(2014天津文9)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取名学生.2015年1.(2015四川文3)某学校为了了解三年级、六年级、九年级这三个年级之间的学生视力是否存在显著差异,拟从这三个年级中按人数比例抽取部分学生进行调查,则最合理的抽样方法是().A. 抽签法B. 系统抽样法C. 分层抽样法D. 随机数法1.解析按照各种抽样方法的适用范围可知,应使用分层抽样.故选C.2.(2015福建文13)某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______.2.解析由题意得抽样比例为45190020=,故应抽取的男生人数为15002520⨯=(人).3.(2015北京文4)某校老年,中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体情况,在抽取的样本中,青年教师有320人,则该样本的老年人数为().A.90B. 100C. 180D.3003.解析依题意,老年教师人数为900320180160043004300⨯=(人).故选C.2017年1.(2017江苏卷3)某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200,400,300,100件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60件进行检验,则应从丙种型号的产品中抽取件.1.解析按照分层抽样的概念应从丙种型号的产品中抽取60300181000⨯=(件).20330443454365577783210题型139 样本分析——用样本估计总体2013年1. (2013四川文7)某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据茎 叶图如图所示.以组距为将数据分组成[)[)[)[)0551030353540,,,,,,,,时,所作的频率分布直方图是( ).A.B.C . D.2. (2013山东文10)将某选手的个得分去掉个最高分,去掉一个最低分,个剩余分数的平均分为91.现场作的个分数的茎叶图后来有个数据模糊,无法辨认,在图中以表示:则个剩余分数的方差为( )A.11616 B.367 C.36D. 3.(2013辽宁文5) 某学校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[)[)[)[)20404060608080100,,,,,,,.若低于60分的人数是15人,则该班的学生人数是( ).A. 45B. 508779401091x/分C. 55D. 604.(2013江苏则成绩较为稳定(方差较小)的那位运动员成绩的方差为5.(2013湖北文12)某学员在一次射击测试中射靶10次,命中环数如下:7879,,,,5491074,,,,,,则(1)平均命中环数为; (2)命中环数的标准差为.6. (2013辽宁文16)为了考察某校各班参加课外书法小组的人数,在全校随机抽取个班级,把每个班级参加该小组的认为作为样本数据.已知样本平均数为,样本方差为,且样本数据互不 相同,则样本数据中的最大值为.2014年1.(2014陕西文9)某公司10位员工的月工资(单位:元)为1210,,x x x ,其均值和方差分别为和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ).A.,22100s +B.100x +,22100s +C.,2sD. +100,2s2.(2014山东文8)为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[)[)[)[)[]12,13,13,14,14,15,15,16,16,17,将其按从左到右的顺序分别编号为第一组,第二组,……,第五组,如图所示是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有人,则第三组中有疗效的人数为( ).A. B. C. 12 3.(2014江苏6位:cm ),所得数据均在区间[]80130,上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm .kPa(加上原点处数字0)4.(2014新课标Ⅰ文18)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如图所示频数分布表:(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表); (3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定? 5.(2014北京文18)从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图:100 90 80 110 /cmO75 85 95 105(1)从该校随机选取一名学生,试估计这名学生该周课外阅读时间少于12小时的概率;(2)求频率分布直方图中的a,b的值;(3)假设同一组中的每个数据可用该组区间的中点值代替,试估计样本中的100名学生该周课外阅读时间的平均数在第几组(只需写出结论).6. (2014新课标Ⅱ文19)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.7.(2014(1)求这20名工人年龄的众数与极差;(2)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(3)求这20名工人年龄的方差.2015年1.(2015重庆文4)重庆市2013年各月的平均气温(C)数据的茎叶图如下:0 8 91 2 5 82 0 03 3 8 3 1 2则这组数据的中位数是( ).A. 19B.20C. 21.5D. 23 1. 解析 将茎叶图各数据从小到大排列,中位数为2020202+=.故选B . 2.(2015湖南文2) 在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.13 0 0 3 4 5 6 6 8 8 8 914 1 1 1 2 2 2 3 3 4 4 5 5 5 6 6 7 8 15 0 1 2 2 3 3 3若将运动员按成绩由好到差编为135号,再用系统抽样方法从中抽取7人,则其中成绩在区间[]139,151上的运动员人数是( ).A. 3B. 4C. 5D. 62. 解析 由茎叶图可知,在区间]151,139[的人数为20,再由系统抽样的性质可知人数为435720=⨯人.故选B. 3.(2015湖北文2) 我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( ).A .134石B .169石C .338石D .1365石 3.解析 设一石米中有粒谷,这批米内夹谷石,则281534254x n n ⋅=⋅,得153428169254x ⨯=≈.故选B.4.(2015山东文6)为比较甲、乙两地某月14时的气温状况,随机选取该月中的天,将这天中14时的气温数据(单位:℃)制成如图所示的茎叶图. 考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差. 其中根据茎叶图能得到的统计结论的编号为( ). A. ①③B. ①④C. ②③D. ②④4.解析 由茎叶图可知,甲的数据为26,28,29,31,31;乙的数据为28,29,30,31,32. 所以()12628293131295x =⨯++++=甲,()12829+303132305x =⨯+++=乙. 所以x x <甲乙,①正确; 又()()()()()2222221182629282929293129312955s ⎡⎤=-+-+-+-+-=⎣⎦甲; ()()()()()22222212830293030303130323025s ⎡⎤=-+-+-+-+-=⎣⎦乙. 可得22s s >甲乙,所以s s >甲乙.④正确.故选B.5.(2015广东文12) 已知样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,则样本数据121x +,221x +,⋅⋅⋅,21n x +的均值为.5.解析 因为样本数据1x ,2x ,⋅⋅⋅,n x 的均值5x =,又样本数据121x +,221x +,⋅⋅⋅,21n x +的和为()122n x x x n ++++,所以样本数据的均值为21x +=11.评注本题考查均值的性质.6.(2015湖北文14)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.30.9],内,其频率分布直方图如图所示. (1)直方图中的=.(2)在这些购物者中,消费金额在区间[0.50.9],内的购物者的人数为./万元a6. 解析 由频率分布直方图及频率和等于,可得0.20.10.80.1 1.50.120.1 2.50.10.11a ⨯+⨯+⨯+⨯+⨯+⨯=,解之得3a =.于是消费金额在区间[]0.50.9,内频率为0.20.10.80.120.130.10.6⨯+⨯+⨯+⨯=, 所以消费金额在区间[]0.50.9,内的购物者的人数为0.6100006000⨯=.7.(2015广东文17)某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图所示./度(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取11户居民,则从月平均用电量在[)220,240的用户中应抽取多少户? 7.解析()1由()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=, 得0.0075x =.(2)由图可知,月平均用电量的众数是2202402302+=. 因为()0.0020.00950.011200.450.5++⨯=<, 又()0.0020.00950.0110.0125200.70.5+++⨯=>,所以月平均用电量的中位数在[)220,240内.设中位数为,由()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=, 得224a =,所以月平均用电量的中位数是224.(3)月平均用电量为[)220,240的用户有0.01252010025⨯⨯=(户); 月平均用电量为[)240,260的用户有0.00752010015⨯⨯=(户); 月平均用电量为[)260,280的用户有0.0052010010⨯⨯=(户); 月平均用电量为[]280,300的用户有0.0025201005⨯⨯=(户). 抽取比例为11125151055=+++,所以从月平均用电量在[)220,240的用户中应抽取12555⨯=(户).2016年1.(2016山东文3)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.,样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30] .根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( ). A.56 B.60 C.120 D.1401. D 解析 由图可知组距为2.5,每周的自习时间少于22.5小时的频率为0.30=2.5×)0.1+0.02(,所以,每周自习时间不少于22.5小时的人数是140=0.301×200)(-人.故选D.2.(2016上海文4)某次体检,位同学的身高(单位:m )分别为1.72,1.78,1.80,1.69,1.76,则这组数据的中位数是(m ).2.1.76解析 将数据从小到大排序1.69,1.72,1.76,1.78,1.80,故中位数为1.76.3.(2016江苏4)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是.3. 0.1解析由题意得 5.1x =,故()22222210.40.300.30.40.15s=++++=./小时17.54.(2016四川文16)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)[)00.50.5,1⋅⋅⋅,,,[]4,4.5分成组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于吨的人数.请说明理由;(3)估计居民月均用水量的中位数.4.解析 ()由频率分布直方图,可知:月用水量在[]0,05.的频率为0.080.5=0.04.⨯ 同理,在[)(][)[)[)[)0.5,1 1.5,222.53,3.5 3.5,44,4.5,,,,,,等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由()10.04+0.08+0.21+0.25+0.06+0.04+0.020=0.5+0.5a a -⨯⨯,解得0.30.a =(2)由(1)得,100位居民月均水量不低于吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于吨的人数为3000000.13=36000.⨯(3)设中位数为x 吨.因为前组的频率之和为0.040.080.15+0.21+0.250.730.5++=>, 而前4组的频率之和为0.040.080.150.210.480.5+++=<,所以2 2.5.x <… 由()0.5020.50.48x ⨯-=-,解得 2.04.x =故可估计居民月均用水量的中位数为2.04吨.5.(2016北京文17)某市民用水拟实行阶梯水价,每人用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图: (1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w =时,估计该市居民该月的人均水费.5. 解析 (1)由用水量的频率分布直方图知,该市居民该月用水量在区间[](](](](]0.5,1,1,1.5,1.5,2,2,2.5,2.5,3内的频率依次为0.1,0.15,0.2,0.25,0.15. 所以该月用水量不超过立方米的居民占85%,用水量不超过2立方米的居民占45%.依题意,w 至少定为.(2)由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表40.160.1580.2100.25120.15170.05220.05270.05⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=10.5用水量(立方米)(元).2017年1.(2017全国1文2)为评估一种农作物的种植效果,选了块地作试验田.这块地的亩产量(单位:kg )分别为12n x x x ⋯,,,,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是( ).A .12n x x x ⋯,,,的平均数 B .12n x x x ⋯,,,的标准差 C .12n x x x ⋯,,,的最大值 D .12n x x x ⋯,,,的中位数 1. 解析 刻画评估这种农作物亩产量稳定程度的指标是标准差.故选B. 2.(2017山东卷文8)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件). 若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( ).A. 3,5B. 5,5C. 3,7D. 5,72. 解析 由于甲组中位数为65,故5y =,计算得乙组平均数为66,故3x =.故选A.题型140 统计图表与概率的综合2013年1. (2013陕西文5)对一批产品的长度(单位: 毫米)进行抽样检测,下图为检测结果的频率分布直方图. 根据标准,产品长度在区间[)2025,上为一等品, 在区间[)1520,和区间[)2530,上为二等品, 在区间[)1015,和[]3035,上为三等品. 用频率估计概率, 现从该批产品中随机抽取一件, 则其为二等品的概率为( ).毫米O0.060.040.02A. 0.09B. 0.20C. 0.25D. 0.452. (2013重庆文6) 下图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[)2230, 内的概率为( ).A. 0.2B. 0.4C. 0.5D. 0.6开始结束3. (2013安徽文17)为调查甲、乙两校高三年级学生某次联考数学成绩情况,用简单随机抽样,从这两校中各抽取30 名高三年级学生,以他们的数学成绩(百分制)作为样本,样本数据的茎叶图如下:甲 乙 (1)若甲校高三年级每位学生被抽取的概率为0.05,求甲校高三年级学生总人数,并估计甲校高三年级这次联考数学成绩的及格率(60分及60分以上为及格); (2)设甲、乙两校高三年级学生这次联考数学平均成绩分别为12x x ,,估计12x x -的值. 4.(2013广东文17)从一批苹果中,随机抽取50个,其重量(单位:克)的频数分布表如下:(1) 根据频数分布表计算苹果的重量在[90,95)的频率;(2) 用分层抽样的方法从重量在[)80,85和[)95,100的苹果中共抽取4个,其中重量在[)80,85的有几个?(3)在(2)中抽出的个苹果中,任取个,求重量在[)80,85和[)95,100中各有的概率.5. (2013四川文1812324,,,,这24个整数中都可能随机产生.(1)分别求出按程序框图正确编程运行时输出y 的值为的 概率()123i P i =,,; (2)甲、乙两同学依据自己对程序框图的理解,各自编写程序 重复运行次后,统计记录了输出y 的值为()123i i =,,的频数 以下是甲、乙所作频数统计表的部分数据.甲的频数统计表(部分) 乙的频数统计表(部分)当2100n =时,根据表中的数据,分别写出甲、乙所编程序各自输出y 的值为(123)i i =,,的频率(用分数表示),并判断两位同学中哪一位所编写程序符合算法要求的可能性较大.6. (2013湖南文18)某人在如图所示的直角边长为米的三角形地块的每个格点(指纵、横直线的交叉点以及三角形的顶点)处都种了一株相同品种的作物.根据历年的种植经验,一株该种作物的年收获量Y (单位:kg )与它的“相近”作物株数X 之间的关系如下表所示:这里,两株作物“相近”是指它们之间的直线距离不超过米.(1(2)在所种作物中随机选取一株,求它的年收获量至少为48kg 的概率.2014年1.(2014重庆文17)20名学生某次数学考试成绩(单位:分)的频率分布直方图如图所示:7632(I )求频率分布直方图中的值;(II )分别求出成绩落在[)6050,与[)7060,中的学生人数; (III )从成绩在[)7050,的学生中任选2人,求此2人的成绩都在[)7060,中的概率.2015年1.(2015全国Ⅱ文3)根据下面给出的2004年至2013年我国二氧化碳年排放量(单位:万吨)柱形图,以下结论中不正确的是( ).A. 逐年比较,2008年减少二氧化碳排放量的效果显著B. 2007年我国治理二氧化碳排放显现成效C. 2006年以来我国二氧化碳年排放量呈逐渐减少趋势D. 2006年以来我国二氧化碳年排放量与年份正相关2010年2012年2009年2013年2004年2006年2007年2008年2011年2005年190020001.解析由柱形图可以看出,我国二氧化硫排放量呈下降趋势,故年排放量与年份是负相关关系,依题意,需选不正确的.故选D.命题意图 本题考查统计的基本知识,要注意读懂题意和图表,理解相关性有正相关和负相关. 2.(2015安徽文17)某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[)40,50,[)50,60,,[)80,90,[]90,100.(1)求频率分布图中的值;(2)估计该企业的职工对该部门评分不低于80分的概率;(3)从评分在[)40,60的受访职工中,随机抽取2人,求此2人评分都在[)40,50的概率.2. 解析 (1)由频率分布直方图可知,()0.0040.0180.02220.028101a +++⨯+⨯=, 解得0.006a =.(2)由频率估计概率,评分不低于80分的概率为()0.0220.018100.4+⨯=. (3)由频率分布直方图可知:在[)40,50内的人数为0.00410502⨯⨯=(人), 在[)50,60内的人数为0.00610503⨯⨯=(人).设[)40,50内的2人评分分别为12,a a ,[)50,60内的3人评分分别为123,,A A A ,则从[)40,60的受访职工中随机抽取2人,2人评分的基本事件有()12,a a ,()11,a A ,()12,a A ,()13,a A ,()21,a A ,()22,a A ,()23,a A ,()12,A A ,()13,A A ,()23,A A ,共10种.其中2人评分都在[)40,50的概率为110. 3.(2015全国Ⅱ文18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得出A 地区用户满意评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表(1)在答题卡上作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可).B 地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.3. 分析 (1) 根据题意通过两地区用户满意度评分的频率分布直方图可以看出B 地区用户满意评分的平均值高于A 地区用户满意度评分的平均值,B 地区用户满意度评分比较集中,A 地区用户的评分满意度比较分散;(2)由直方图得()A P C 的估计值为0.6.()B P C 的估计值为0.25,所以A 地区的用户满意度等级为不满意的概率大.解析 (1)通过两地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值;B 地区用户满意度评分比较集中,而A 地区用户满意度评分比较分散.(2)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”;B C 表示事件:“B 地区用户的满意度等级为不满意”.由直方图得()A P C 的估计值为()0.010.020.03100.6++⨯=,()B P C 的估计值为()0.0050.02100.25+⨯=.所以A 地区用户的满意度等级为不满意的概率大.评注 高考中对统计与概率的考查,主要建立在实际问题中,特别要能读懂题意,分析题目中的数据,并对数据进行处理,在解答中要注意概率的计算方法.2016年1.(2016全国甲文18)某险种的基本保费为a (单元:元),继续购买该险种的投保人称为续保人,续保人本年度的保费与其上年度出险次数的关联如下:(1)记A 为事件:“一续保人本年度的保费不高于基本保费”,求()P A 的估计值;(2)记B 为事件:“一续保人本年度的保费高于基本保费但不高于基本保费的160%”,求()P B 的估计值;(3)求续保人本年度平均保费的估计值.1.解析 (1)由所给数据知,事件A 发生当且仅当一年内出险次数小于,所以()60500.55200P A +==. (2)由所给数据知,事件B 发生当且仅当一年内出险次数大于等于且小于等于,所以3030()0.3200P B +==. (3)由题所求分布列为调查名续保人的平均保费为0.850.300.25 1.250.15 1.50.15 1.750.1020.05 1.1925a a a a a a a ⨯+⨯+⨯+⨯+⨯+⨯=.2.(2016山东文16)某儿童乐园在“六一”儿童节推出了一项趣味活动.参加活动的儿童需转动如图所示的转盘两次,每次转动后,待转盘停止转动时,记录指针所指区域中的数.设两次记录的数分别为x ,y .奖励规则如下:①若3xy …,则奖励玩具一个; ②若8xy …,则奖励水杯一个;③其余情况奖励饮料一瓶.假设转盘质地均匀,四个区域划分均匀.小亮准备参加此项活动. (1)求小亮获得玩具的概率;(2)请比较小亮获得水杯与获得饮料的概率的大小,并说明理由.2.解析 用数对(),x y 表示儿童参加活动先后记录的数,则基本事件空间Ω与点集(){},|,,14,14S x y x y x y=∈∈N N 剟剟一一对应.因为S 中元素个数是4416,⨯=所以基本事件总数为16.n =(1)记“3xy …”为事件A .则事件A 包含的基本事件共有个,即()()()()()1,1,1,2,1,3,2,1,3,1, 所以()5,16P A =即小亮获得玩具的概率为516. (2)记“8xy …”为事件B ,“38xy <<”为事件C .3421则事件B 包含的基本事件共有6个,即()()()()()()2,4,3,3,3,44,2,4,3,4,4,所以()63.168P B == 则事件C 包含的基本事件共有个,即()()()()()1,4,2,2,2,3,3,2,4,1,所以()5.16P C = 因为35,816> 所以小亮获得水杯的概率大于获得饮料的概率. 3.(2016全国乙文19)某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x 表示台机器在三年使用期内需更换的易损零件数,y 表示台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若19n =,求y 与x 的函数解析式;(2)若要求 “需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值; (3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买台机器的同时应购买19个还是20个易损零件?3.解析(1)当19x …时,192003800y =⨯=(元);当19x >时,()19200195005005700y x x =⨯+-⨯=-(元),所以3800,,195005700,,19x x y x x x ∈⎧=⎨-∈>⎩N N ….(2)由柱状图可知更换易损零件数的频率如表所示.所以更换易损零件数不大于18的频率为:,更换易损零件数不大于19的频率为:0.060.160.240.240.700.5+++=>,故n 最小值为19.(3)若每台都购买19个易损零件,则这100台机器在购买易损零件上所需费用的平均数为:10019200205002105004000100⨯⨯+⨯+⨯⨯=(元);若每台都够买20个易损零件,则这100台机器在购买易损零件上所需费用的平均数为 10020200105004050100⨯⨯+⨯=(元).因为40004050<,所以购买台机器的同时应购买19个易损零件.2017年1.(2017全国3卷文3)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图,根据该折线图,下列结论错误的是().A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月份D.各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳1.解析由图易知月接待游客量是随月份的变化而波动的,有上升也有下降,所以选项A错误.故选A.评注与2016年的雷达图考法类似,近年来,对各类图形与图表的理解与表示成为高考的一个热点,总体来说,此类题型属于基础类题型,用排除法解此类问题会比较快,但要注意题目要求选择错误的一项,如果审题不仔细可能会造成失分!2.(2017全国2卷文19)淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品产量(单位:kg)的某频率直方图如图所示. (1)设两种养殖方法的箱产量相互独立,记A表示事件:“旧养殖法的箱产量低于50kg”,估计A的概率;(修图:下面表中原点处加数字0)箱产量/kg箱产量/kg。
2018年高考统计与概率专题(全国卷1文)2.为评估一种农作物的种植效果,选了n 块地作试验田.这n 块地的亩产量(单位:kg )分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是 A .x 1,x 2,…,x n 的平均数 B .x 1,x 2,…,x n 的标准差 C .x 1,x 2,…,x n 的最大值D .x 1,x 2,…,x n 的中位数【答案】B【解析】刻画评估这种农作物亩产量稳定程度的指标是标准差,故选B(全国卷1理)2.如图,正方形ABCD 内的图形来自中国古代的太极图。
正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是A .14B .π8C .12D .π4【考点】:几何概型【思路】:几何概型的面积问题,=P 基本事件所包含的面积总面积.【解析】:()21212=82r S P S r ππ==,故而选B 。
(全国卷2理)6.安排3名志愿者完成4项工作,每人至少完成1项,每项工作由1人完成,则不同的安排方式共有( )A .12种B .18种C .24种D .36种(全国卷2文)6。
如图,网格纸上小正方形的边长为1,粗实线画出的是某几何体的三视图,该几何体由一平面将一圆柱截去一部分后所得,则该几何体的体积为 A.90πB 。
63πC 。
42π D.36π【答案】B【解析】由题意,该几何体是由高为6的圆柱截取一半后的图形加上高为4的圆柱,故其体积为2213634632V πππ=⋅⋅⋅+⋅⋅=,故选B 。
(天津卷)文(3)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫。
从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为(A)45(B)35(C)25(D)15(全国卷2文)11.从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为A.110B.15C。
第十三章概率与统计本章知识结构图统计概率第一节概率及其计算考纲解读1. 了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2. 了解两个互斥事件的概率的加法公式。
3. 掌握古典概型及其概率计算公式。
4. 了解随机数的意义,能运用模拟方法估计概率。
5. 了解几何概型的意义。
命题趋势探究1. 本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2. 命题设置以两种概型的概率计算及运用互斥、 对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下。
知识点精讲一、 必然事件、不可能事件、随机事件在一定条件下:① 必然要发生的事件叫必然事件; ② 一定不发生的事件叫不可能事件; ③ 可能发生也可能不发生的事件叫随机事件。
二、 概率在相同条件下,做次重复实验,事件 A 发生次,测得 A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动, 随着的增加,摆动幅度越来越小,这时就把这个常数叫 做A 的概率,记作。
对于必然事件A,;对于不可能事件 A, =0.三、 基本事件和基本事件空间在一次实验中,不可能再分的事件称为基本事件, 所有基本事件组成的集合称为基本事件空间。
四、 两个基本概型的概率公式1、古典概型条件:1、基本事件空间含有限个基本事件2、每个基本事件发生的可能性相同P AA 包含基本事件数 =card (A) 基本事件总数=card ()2、几何概型条件:每个事件都可以看作某几何区域的子集A ,A 的几何度量(长度、面积、体积或时间)记为五、互斥事件的概率1互斥事件在一次实验中不能同时发生的事件称为互斥事件。
事件A与事件B互斥,则P AUB P A P B2、对立事件事件A,B互斥,且其中必有一个发生,称事件A,B对立,记作B A或A B。
P A 1 p A。
3、互斥事件与对立事件的联系对立事件必是互斥事件,即“事件A, B对立”是”事件 A B互斥“的充分不必要条件。
2018年普通高等学校招生全国统一考试数学分类解析—概率统计一.选择题:1. (安徽理)(10).设两个正态分布2111()(0)N μσσ>,和2222()(0)N μσσ>,的密度函数图像如图所示。
则有( A ) A .1212,μμσσ<<B .1212,μμσσ<>C .1212,μμσσ><D .1212,μμσσ>>2.(福建理)(5)某一批花生种子,如果每1粒发牙的概率为45,那么播下4粒种子恰有2粒发芽的概率是 (B )A.16625 B.96625 C.192625D.2566253. (福建文)(5)某一批花生种子,如果每1粒发芽的概率为45,那么播下3粒种子恰有2粒发芽的概率是 (C )A.12125 B.16125 C.48125 D.961254. (广东理)(3).某校共有学生2000名,各年级男、女生人数如表1.已知在全校 学生中随机抽取1名,抽到二年级女生的概率是0.19.现用分层抽样的方法在全校抽取64名学生,则应在三年级抽取的学生人数为( C ) A .24 B .18 C .16 D .125.(湖南理) 4.设随机变量ζ服从正态分布N (2,9) ,若P (ζ>c+1)=P (ζ<c -)1,则c =(B)A.1B.2C.3D.46. (江西文)(11).电子钟一天显示的时间是从00:00到23:59,每一时刻都由四个数字组成,则一天中任一时刻显示的四个数字之和为23的概率为 (C )A .1180 B .1288 C .1360D .14807. (辽宁理文)(7).4张卡片上分别写有数字1,2,3,4,从这4张卡片中随机抽取2张,则取出的2张卡片上的数字之和为奇数的概率为( C ) A.13 B.12 C.23 D.348.(山东理)(7)在某地的奥运火炬传递活动中,有编号为1,2,3,…,18的18名火炬手.若从中任选3人,则选出的火炬手的编号能组成3为公差的等差数列的概率为(B ) (A )511(B )681 (C )3061(D )40819.(山东理) (8)右图是根据《山东统计年整2018》中的资料作成的1997年至2018年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2018年我省城镇居民百户家庭人口数的平均数为(B )(A )318.6 (B )318.6 (C)318.6 (D)301.6 10.(山东文)9.从某项综合能力测试中抽取100人的成绩,统计如表,则这100人成绩的标准差为( B )AB C .3D .8510.(陕西文)(3).某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( C ) A .30 B .25 C .20 D .15 11.(重庆理)(5)已知随机变量ζ服从正态分布N (3,a 2),则P (3)ζ<=(D )(A)15(B)14(C)13(D)1212. (重庆文)(5)某交高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是(D )(A)简单随机抽样法(B)抽签法7420136203851192(C)随机数表法 (D)分层抽样法13.(重庆文)(9)从编号为1,2,…,10的10个大小相同的球中任取4个,则所取4个球的最大号码是6的概率为 (B )(A)184(B)121(C)25(D)35二.填空题:1.(广东文) (11).为了调查某厂工人生产某种产品的能力,随机抽查 了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85, [)85,95由此得到频率分布直方图如图,则这20名工人中一天生产该产品数量在[)55,75的人数是 13 .2.(海南宁夏理文)(16).从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm ),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 318 318 318 318 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 318 318 318 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论: ① ;3 127 7 5 5 0 28 4 5 4 2 29 2 5 8 7 3 3 1 30 4 6 79 4 0 31 2 3 5 5 6 8 8 8 5 5 3 32 0 2 2 4 7 9 7 4 1 33 1 3 6 734 3 2 35 6甲乙② .以下任填两个:(1).乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度(或:乙品种棉花的纤维长度普遍大于甲品种棉花的纤维长度). (2).甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散.(或:乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中(稳定).甲品种棉花的纤维长度的分散程度比乙品种棉花的纤维长度的分散程度更大). (3).甲品种棉花的纤维长度的中位数为318mm ,乙品种棉花的纤维长度的中位数为318mm . (4).乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近).甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀.3. (湖北文)11.一个公司共有1 000名员工,下设一些部门,要采用分层抽样方法从全体员工中抽取一个容量为50的样本,已知某部门有200名员工,那么从该部门抽取的工人数是 10 . 4.(湖北文)14.明天上午李明要参加奥运志愿者活动,为了准时起床,他用甲、乙两个闹钟叫醒自己,假设甲闹钟准时响的概率是0.80,乙闹钟准时响的概率是0.90,则两个闹钟至少有一准时响的概率是 0.98 .5. (湖南理)15.对有n (n ≥4)个元素的总体{1,2,3,…,n }进行抽样,先将总体分成两个子总体{1,2,…,m }和{m +1、m +2,…,n }(m 是给定的正整数,且2≤m ≤n -2),再从每个子总体中各随机抽取2个元素组成样本,用P i j 表示元素i 和f 同时出现在样本中的概率,则P 1m =4()m n m -;所有P if (1≤i <j ≤)n 的和等于 6 .6. (湖南文)(12)从某地区15000位老人中随机抽取500人,其生活能否自理的情况如下表所示:则该地区生活不能自理的老人中男性比女性约多____60____人。
概率与统计热点一统计与统计案例以实际生活中的事例为背景,通过对相关数据的统计分析、抽象概括,作出估计,判断.常与抽样方法、茎叶图、频率分布直方图、概率等知识交汇考查,考查学生数据处理能力.【例1】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元。
在机器使用期间,如果备件不足再购买,则每个500元。
现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:记x表示1台机器在三年使用期内需更换的易损零件数,y表示1台机器在购买易损零件上所需的费用(单位:元),n表示购机的同时购买的易损零件数。
(1)若n=19,求y与x的函数解析式;(2)若要求“需更换的易损零件数不大于n”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件?解(1)当x≤19时,y=3 800;当x〉19时,y=3 800+500(x-19)=500x-5 700。
所以y与x的函数解析式为y=错误!(x∈N).(2)由柱状图知,需更换的零件数不大于18的频率为0。
46,不大于19的频率为0.7,故n的最小值为19。
(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1(3 800×70+4 300×20+4 800×10)=4 000,100若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1(4 000×90+4 500×10)=4 050.100比较两个平均数可知,购买1台机器的同时应购买19个易损零件。
概率与统计1.(2018全国卷1文)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是 A .新农村建设后,种植收入减少B .新农村建设后,其他收入增加了一倍以上C .新农村建设后,养殖收入增加了一倍D .新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半2.(2018全国卷1文)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m 3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量 [)00.1, [)0.10.2, [)0.20.3, [)0.30.4, [)0.40.5, [)0.50.6, [)0.60.7,频数13249265使用了节水龙头50天的日用水量频数分布表日用水量 [)00.1,[)0.10.2,[)0.20.3,[)0.30.4,[)0.40.5,[)0.50.6,频数151310165(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)3.(2018全国卷2文)从2名男同学和3名女同学中任选2人参加社区服务,则选中的2人都是女同学的概率为A.0.6B.0.5C.0.4D.0.34.(2018全国卷2文)下图是某地区2000年至2016年环境基础设施投资额y(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y与时间变量t的两个线性回归模型.根据2000年至2016年的数据(时间变量t的值依次为1,2,,17)建立模型①:ˆ30.413.5=-+;根据2010y t 年至2016年的数据(时间变量t的值依次为1,2,,7)建立模型②:ˆ9917.5=+.y t(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.5.(2018全国卷3文)若某群体中的成员只用现金支付的概率为0.45,既用现金支付也用非现金支付的概率为0.15,则不用现金支付的概率为A.0.3 B.0.4 C.0.6 D.0.76.(2018全国卷3文)某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.7.(2018全国卷3文)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式第二种生产方式(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:22()()()()()n ad bcKa b c d a c b d-=++++,2()0.0500.0100.0013.8416.63510.828P K kk≥.10.(2018北京卷文)电影公司随机收集了电影的有关数据,经分类整理得到下表:电影类型第一类第二类第三类第四类第五类第六类电影部数140 50 300 200 800 510好评率0.4 0.2 0.15 0.25 0.2 0.1 好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.(Ⅰ)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(Ⅱ)随机选取1部电影,估计这部电影没有获得好评的概率;学科%网(Ⅲ)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)11.(2018天津卷文)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.12.(2018江苏卷)已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为.13.(2018江苏卷)某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为.14.(2018浙江卷)设0<p<1,随机变量ξ的分布列是ξ0 1 2P 12p122p则当p在(0,1)内增大时,A.D(ξ)减小B.D(ξ)增大C.D(ξ)先减小后增大D.D(ξ)先增大后减小15.(2018上海卷)有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是______(结果用最简分数表示)。
统计与概率
一、选择题:
1.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番,为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
则下面结论中不正确的是()
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
2.某群体中的成员只用现金支付的概率为0.45,既用现金也用非现金支付的概率为0.15,则不用现金支付的概率为()
A.0.3B.0.4C.0.6D.0.7
3.从2名男同学和3名女同学中任选2人参加社区服务,则选中2人都是女同学的概率为()
A.0.6B.0.5C.0.4D.0.3
二、填空题:
4.某公司有大量客户,且不同年龄段客户对其服务的评价有较大差异,为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方式有简单随机抽样,分层抽样和系统抽样,则最适合的抽样方法是______.
5.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为___________.
6.某兴趣小组有2名男生和3名女生,现从中任选2名学生去参加活动,则恰好选中2名女生的概率为___________.
7.有编号互不相同的五个砝码,其中5克、3克、1克砝码各一个,2克砝码两个,从中随机选取三个,则这三个砝码的总质量为9克的概率是___________(结果用最简分数表示).三、解答题:
8.某家庭记录了未使用节水龙头50天的日用水量数据(单位:3m)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
使用了节水龙头50天的日用水量频数分布表
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图;
0.35m的概率;
(2)估计该家庭使用节水龙头后,日用水量小于3
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表).
9.下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,,17 )建立模型①:
ˆ30.413.5y
t =-+;根据2000年至2016的数据(时间变量t 的值依次为1,2,,7 )建立模型②:ˆ9917.5y
t =+. (1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
10.某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式. 为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人. 第一组工人用第一种生产方式,第二组工人用第二种生产方式,根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由; (2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:
()
()()()()
2
2
n ad bc
K
a b c d a c b d
-
=
++++
,
11.电影公司随机收集了电影的有关数据,经分类整理得到下表:
好评率是指:一类电影中获得好评的部数与该类电影的部数的比值.
(1)从电影公司收集的电影中随机选取1部,求这部电影是获得好评的第四类电影的概率;(2)随机选取1部电影,估计这部电影没有获得好评的概率;
(3)电影公司为增加投资回报,拟改变投资策略,这将导致不同类型电影的好评率发生变化.假设表格中只有两类电影的好评率数据发生变化,那么哪类电影的好评率增加0.1,哪类电影的好评率减少0.1,使得获得好评的电影总部数与样本中的电影总部数的比值达到最大?(只需写出结论)
12.已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.
(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?
(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.
(i)试用所给字母列举出所有可能的抽取结果;
(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.
答案:ABD ;分层抽样;90;310;1
5
8.答:(1)
(2)0.48;(3)3
47.45m
9.答:
10.答:(1)第二组生产方式效率更高;从茎叶图观察可知,第二组数据集中在70min~80min
之间,而第一组数据集中在80min~90min 之间,故可估计第二组的数据平均值要小于第一组数据平均值,事实上:
16872767779828383848586878788899090919192
84
20
E +++++++++++++++++++=
=同理274.7E =,21E E < ,故第二组生产方式效率更高;
(2)由茎叶图可知,中位数
7981
80
2
m
+
==,且列联表为:
(3)由(2)可知
()2
22
2
40155
10 6.635
20202020
K
-
==>
⨯⨯⨯
,故有99%的把握认为两种生产方式
的效率有差异.
11.答:(1)0.025;(2)0.814;(3)增加第五类电影的好评率,减少第二类电影的好评率.
12.答:(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人;
(2)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为:
{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},
{E,G},{F,G},共21种;(ii)5 21。