人教A版 2020高考冲刺 数学二轮--(文)(拔高):概率与统计
- 格式:docx
- 大小:912.82 KB
- 文档页数:44
2020 高考数学二轮复习 概率与统计概率内容的新概念 多,相近概念容易混淆,本 就学生易犯 作如下 :型一 “非等可能 ”与 “等可能 ”混同 例 1 两枚骰子,求所得的点数之和 6 的概率.解两枚骰子出 的点数之和2, 3, 4, ⋯ ,12 共 11 种基本事件,所以概率P=111剖析以上 11 种基本事件不是等可能的,如点数和 2 只有 (1, 1),而点数之和6 有 (1, 5)、(2, 4)、 (3, 3)、 (4,2)、 (5, 1)共 5 种.事 上, 两枚骰子共有 36 种基本事件,且是等可能的,所以“所得点数之和6”的概率 P= 5.36型二 “互斥 ”与 “ 立 ”混同例 2把 、黑、白、4 牌随机地分 甲、乙、丙、丁4 个人,每个人分得1 ,事件“甲分得 牌”与“乙分得 牌”是()A . 立事件B .不可能事件C .互斥但不 立事件D .以上均不解A剖析 本 的原因在于把 “互斥 ”与 “ 立”混同,二者的 系与区 主要体 在 :(1)两事件 立,必定互斥,但互斥未必 立; (2) 互斥概念适用于多个事件,但 立概念只适用于两个事件; (3) 两个事件互斥只表明 两个事件不能同 生,即至多只能 生其中一个,但可以都不 生;而两事件 立 表示它 有且 有一个 生.事件 “甲分得 牌 ”与 “乙分得 牌 ”是不能同 生的两个事件,两个事件可能恰有一个 生,一个不 生,可能两个都不 生,所以 C .型三 例 3解“互斥 ”与 “独立 ”混同甲投 命中率 O .8,乙投 命中率 0.7,每人投 3 次,两人恰好都命中 2 次的概率是多少 ?“甲恰好投中两次” 事件 A , “乙恰好投中两次” 事件B , 两人都恰好投中两次事件A+B , P(A+B)=P(A)+P(B): c 32 0.820.2 c 32 0.720.3 0.825剖析本 的原因是把相互独立同 生的事件当成互斥事件来考 , 将两人都恰好投中2 次理解 “甲恰好投中两次”与 “乙恰好投中两次 ”的和.互斥事件是指两个事件不可能同 生;两事件相互独立是指一个事件的 生与否 另一个事件 生与否没有影响,它 然都描 了两个事件 的关系,但所描 的关系是根本不同.解:“甲恰好投中两次 ” 事件 A ,“乙恰好投中两次” 事件 B ,且 A , B 相互独立,两人都恰好投中两次 事件A ·B ,于是 P(A ·B)=P(A) ×P(B)= 0.169类型四例 4错解“条件概率 P(B / A)”与“积事件的概率P(A·B)”混同袋中有 6 个黄色、 4 个白色的乒乓球,作不放回抽样,每次任取一球,取 2 次,求第二次才取到黄色球的概率.记“第一次取到白球”为事件A,“第二次取到黄球”为事件B,”第二次才取到黄球”为事件62C,所以 P(C)=P(B/A)=.93剖析本题错误在于 P(A B)与 P(B/A) 的含义没有弄清 , P(A B) 表示在样本空间S 中 ,A 与 B 同时发生的概率;而P( B/A )表示在缩减的样本空间S A中,作为条件的 A 已经发生的条件下事件 B 发生的概率。
概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。
2.理解超几何分布及其推导过程,并能进行简单的应用。
3.了解条件概率和两个事件相互独立的概念,理解n 次独立重复实验的模型及二项分布,并能解决一些简单的实际问题。
4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。
2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。
3.有关正态分布的考题多为一道小题。
三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作()P B A ,条件概率公式为()=P B A ()()P AB P A 。
(2)若()=P BA P B (),即()=()()P A B PAPB ,称A 与B 为相互独立事件。
A 与B相互独立,即A 发生与否对B 的发生与否无影响,反之亦然。
即,A B 相互独立,则有公式()=()()P AB P A P B 。
(3)在n 次独立重复实验中,事件A 发生k ()0k n ≤≤次的概率记作()n P k ,记A在其中一次实验中发生的概率为()P A p = ,则()()1n k k k n n P k C p p -=- .(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量ξ的分布列(如表13-1所示).表13-1①()11,i p i n i N θ*≤≤≤≤∈ ;②121n p p p ++= .(2)E ξ表示ξ的期望:1122=+n n p p p E ξξξξ++…,反应随机变量的平均水平,若随机变量ξη,满足=a b ηξ+,则E aE b ηξ=+.(3)D ξ表示ξ的方差:()()()2221122=---n n E p E p E p D ξξξξξξξ+++,反映随机变量ξ取值的波动性。
《计数原理与概率》高考复习指导一、考试说明:1.考试内容(1)分类计数原理与分步计数原理,排列与组合.(2)等可能性事件的概率,互斥事件有一个发生的概率,相互独立事件同时发生的概率.2.考试要求(1)掌握分类计数原理与分步计数原理,并能用它们分析和解决一些简单的应用问题.(2)理解排列与组合的意义,掌握排列数与组合数的计算公式,掌握组合数的两个性质,并能用它们解决一些简单的应用问题.(3)了解等可能性事件的概率的意义,会用排列组合公式计算一些等可能性事件的概率.(4)了解互斥事件的意义,会用互斥事件的概率加法公式计算一些事件的概率.(5)了解相互独立事件的意义,会用相互独立事件的概率乘法公式计算一些事件的概率,会计算事件在n次独立重复试验中恰好发生k次的概率.二、高考试题分析排列与组合、概率与统计是高中数学的重要内容.一方面,这部分内容占用教学时数多达36课时,另一方面,这部分内容是进一步学习高等数学的基础知识,因此,它是高考数学命题的重要内容.从近三年全国高考数学(新材)试题来看,主要是考查排列与组合、概率与统计的基本概念、公式及基本技能、方法,以及分析问题和解决问题的能力.试题特点是基础和全面.题目类型有选择题、填空题、解答题,一般是两小(9分~10分)一大(12分),解答题通常是概率问题.试题难度多为低中档.为了支持高中数学课程的改革,高考数学命题对这部分将进一步重视,但题目数量、难度、题型将会保持稳定.例1.(1999年全国)在一块并排10垄的田地中,选择2垄分别种植A、B两种作物,每种作物种植一垄,为有利于作物生长,要求A、B两种作物间的间隔不小于6垄,则不同的选垄方法共有_______种(用数字作答).[解析]A种植在左边第一垄时,B有3种不同的种植方法;A种植在左边第二垄时,B有两种不同的种植方法;A种植在左边第三垄时,B只有一种种植方法.B在左边种植的情形与上述情形相同.故共有2(3+2+1)=12种不同的选垄方法.∴应填12.例2.(2003年新教材)将3种作物种植在如图所示的5块试验田里,每一块种植一种作物且相邻的试验田不能种植同一作物,不同的种植方法共有______种(以数字作答).[解析]将5块试验田从左到右依次看作甲、乙、丙、丁、戊,3种作物依次看作A、B、C,则3种作物都可以种植在甲试验田里,由于相邻的试验田不能种植同一种作物,从而可知在乙试验田里只能有两种作物.同理,在丙、丁、戊试验田里也只能有两种作物可以种植.由分步计数原理,不同的种植方法共有3×2×2×2=48种.∴应填:48例3.(2003年全国高考题)某城市中心广场建造一个花圃,花圃分为6个部分(如图),现要栽种4种不同颜色的花,每部分栽种1种且相邻部分不能栽种同样颜色的花,不同的栽法有_______种.[解析]由于第1、2、3块两两相邻,我们先安排这三块,给第1、2、3块种花时分别有4、3、2种种法,所以共有4×3×2=24种不同种法.下面给第4块种花,若第4块与第6块同色,只有一种种植方法,则第5块只有2种种法,若第4块与第2块同色时,共有2×1=2种种法.若第4块与第6块不同色,但第4块与第2块同色,则第6块有2种种植的方案,而第5块只有1种种法,共有2种不同的种植方法.若第4块与第6块不同色,但第4块与第2块不同色,则第6块有1种种法,则第5块也有一种不同种法,所以第4块与第6块不同色时,有1种种法.综上共有24×(2+2+1)=120种不同的种植方法.例4.(2003年春季考试题)某班新年联欢会原定的5个节目已排成节目单,开演前又增加了两个新节目,如果将这两个节目插入原节目单中,那么不同的插法的种数为A 、42B 、30C 、20D 、12[解析]将两个新节目插入5个固定顺序节目单有两种情况:(1)两个新节目相邻的插法种数为226A ;(2)两个节目不相邻的插法种数为26A ;由分类计数原理共有2226642A A +=种方法,选A.例5.(2004重庆)(本小题满分12分)设甲、已、丙三人每次射击命中目标的概率分别为0.7、0.6和0.5。
第1讲概率、随机变量及其分布[做小题——激活思维]1.若随机变量X的分布列如表所示,E(X)=1。
6,则a-b=( )X0123P0。
1a b0。
1A.0.2C.0。
8 D.-0。
8B[由0。
1+a+b+0.1=1,得a+b=0。
8,又由E(X)=0×0.1+1×a+2×b+3×0。
1=1。
6,得a+2b=1.3,解得a=0。
3,b=0.5,则a-b=-0。
2.]2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0。
5,两个路口连续遇到红灯的概率为0。
4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( )A.0。
6 B.0.7C.0.8 D.0。
9C[记“第一个路口遇到红灯"为事件A,“第二个路口遇到红灯”为事件B,则P(A)=0.5,P(AB)=0。
4,则P(B|A)=错误!=0.8,故选C。
]3.两个实习生每人加工一个零件,加工为一等品的概率分别为错误!和错误!,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )A。
错误!B。
错误!C。
14D。
错误!B[设事件A:甲实习生加工的零件为一等品;事件B:乙实习生加工的零件为一等品,且A,B相互独立,则P(A)=错误!,P(B)=错误!,所以这两个零件中恰有一个一等品的概率为P(A错误!)+P(错误!B)=P(A)P(错误!)+P(错误!)P(B)=错误!×错误!+错误!×错误!=错误!。
]4.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=错误!,则P(Y≥1)=( )A.错误!B。
错误!C。
错误!D.1C[∵X~B(2,p),∴P(X≥1)=1-P(X=0)=1-C错误!(1-p)2=错误!,解得p=错误!,∴P(Y≥1)=1-P(Y=0)=1-C0,4(1-p)4=1-错误!=错误!,故选C.]5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X为取得红球的次数,则X的方差D(X)的值为________.错误![因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为错误!,连续取4次(做4次试验),X为取得红球(成功)的次数,则X~B错误!,∴D(X)=4×错误!×错误!=错误!.]6.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.(附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0。
2020年高考数学二轮复习重点专题冲刺复习指导 专题3 统计与概率【高考考场实情】统计与概率在高考考查中一般有一道选择题或填空题、一道解答题,共2道题,分值为17分.高考对这一部分的考查难度相对稳定,选择、填空题为容易题, 解答题为中等难度题.选择题在前六题的位置,填空题在前二题的位置,解答题在前三题的位置.选择、填空题常考古典概型、几何概型(理科时而考查对立事件、相互独立事件概率及独立重复试验的概率)。
【考查重点难点】解答题以频率分布表、频率分布直方图、柱形图、折线图、茎叶图等五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.下面对学生存在的主要问题进行剖析,并提出相应的教学对策.【存在问题分析】1.概念理解不透【指点迷津】本专题中,概念理解不到位的有事件、模型的判断等;容易混淆的概念有互斥事件与对立事件、超几何分布与二项分布、二项展开式的通项公式1y n r r r n T C a b -+=与n 次独立重复试验中事件A 发生k 次的概率()(1)k k n k n nP k C p p -=-等. 【例1】已知5只动物中有1只患有某种疾病,需要通过化验血液来确定患病的动物.血液化验结果呈阳性的即为患病动物,呈阴性的即没患病.下面是两种化验方案:方案甲:逐个化验,直到能确定患病动物为止.方案乙:先任取3只,将它们的血液混在一起化验.若结果呈阳性则表明患病动物为这3只中的1只,然后再逐个化验,直到能确定患病动物为止;若结果呈阴性,则在另外2只中任取l 只化验.(Ⅰ)求依方案甲所需化验次数不少于依方案乙所需化验次数的概率;(Ⅱ)ξ表示依方案乙所需化验次数,求ξ的期望.【解析】(Ⅰ)设1ξ、2ξ已分别表示依方案甲和依方案乙需化验的次数,P 表示对应的概率,则方案甲中1ξ的分布列为方案乙中2ξ的分布列为若甲化验的次数不少于乙化验的次数,则[][]1212212221(1)(1)(2)(1)(2)(3)(1)(2)(3)(4)P P P P P P P P P P P ξξξξξξξξξξ==⨯=+=⨯=+=+==+=+=+=131322=0+(0)(0)0.72555555⨯++⨯+++=. (Ⅱ)3212()1023 2.4555E ξ=⨯+⨯+⨯==. 【名师点睛】本题易错的主要原因是对事件不清.对于方案甲,患有疾病的一只动物在每一次化验时出现的概率是等可能的,学生对事件不清,易误认为化验次数的可能取值是1,2,3,4,5,且1(1)(2)(3)(4)(5)2P P P P P ξξξξξ==========.事实上,若前4次化验为阴性,第5次不需再化验即知最后一只是患病动物,所以化验次数只能取l ,2,3,4.类似地,对于方案乙,第一次化验呈阳性,再化验3只中的前2只呈阴性后也不需再化验,或第一次化验呈阴性,再化验另外2只中的第l 只呈阴性或阳性后也不需再化验,即ξ只能取2,3.在解决问题时,要理清事件,求随机变量的分布列时,要弄清随机变量可能取到的每一个值以及取每一个值时所表示的意义,然后再利用所学的概率知识求出随机变量取每一个值时的概率,从而求出分布列.2.审题析题不到位【指点迷津】审题析题不清是本专题解答错误的主要原因,主要包括题意不清,茫然作答;阅读肤浅,丢失信息;条件欠缺,鲁莽下笔;图形不准,缺乏严密;方向不明,目标模糊等情况.审题不清的最主要原因在于学生的阅读理解能力欠缺.【例2】(2017年全国卷Ⅰ理19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2(,)N μσ.(Ⅰ)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(3,3)μσμσ-+之外的零件数,求(1)P X ≥及X 的数学期望;(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)μσμσ-+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得16119.9716i i x x ===∑,161622221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则(33)0.997 4P Z μσμσ-<<+=, 160.997 40.959 2=0.0080.09≈.【解析】(Ⅰ)抽取的一个零件的尺寸在(3,3)μσμσ-+之内的概率为0.9974,从而零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026,故()16,0.0026X B -,因此()()1611010.99740.0408P X P X ≥=-==-≈,X 的数学期望为160.00260.0416EX =⨯=(Ⅱ)(i )如果生产状态正常,一个零件尺寸在(3,3)μσμσ-+之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(3,3)μσμσ-+之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.(ii )由9.97,0.212x s =≈,得μ的估计值为ˆ9.97,μσ=的估计值为ˆ0.212σ=,由样本数据可以看出有一个零件的尺寸在ˆˆˆˆ(3,3)μσμσ-+之外,因此需对当天的生产过程进行检查. 剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的平均数为1(169.979.22)10.0215⨯-= 因此μ的估计值为10.02.162221160.212169.971591.134i i x==⨯+⨯≈∑,剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的样本方差为 221(1591.1349.221510.02)0.00815--⨯≈,因此σ的估计值为0.0080.09≈. 【名师点睛】面对试题中冗长的文字表述,学生方寸大乱,不知所措,从而失去读题、解题信心;没有形成通读全题的习惯,未能发现试题所附相关公式;未能根据试题提供的相关公式,提取零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026;未能准确把握较长问句“生产线在这一天的生产过程可能出现了异常情况”的关键词等,导致回答问题含混不清、词不达意.3.读图识图能力弱【指点迷津】学生面对一堆数据无从下手,主要原因是对数据、图表的直观印象和积累储备的知识经验不够;没有形成“用数据说话”的统计观念;对抽象数据的数字特征理解不到位.【例3】(2016年全国卷Ⅲ理4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15C ︒,B 点表示四月的平均最低气温约为5C ︒.下面叙述不正确的是( )(A)各月的平均最低气温都在0C ︒以上 (B)七月的平均温差比一月的平均温差大(C)三月和十一月的平均最高气温基本相同 (D)平均最高气温高于20C ︒的月份有5个【解析】由图可知0C ︒均在虚线框内,所以各月的平均最低气温都在0C ︒以上,A 正确;由图可知七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,B 正确;由图可知三月和十一月的平均最高气温都大约在10C ︒,基本相同,C 正确;由图可知平均气温高于20C ︒的月份只有7、8两个月,D 错误.【名师点睛】解答本题错误主要是读图识图能力弱,对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;其次,不会从图表中读取有用数据并进行判断;第三,估计平均温差时易出现错误,错选B .4.解题规范性较差【指点迷津】涉及本专题内容的考查,学生失误和失分最多的是会而不对、对而不全和全而不准,如不能用字母表示事件,导致在利用简单事件表示复杂事件书写混乱;解答过程缺失关键步骤,丢三落四,导致丢分等.【例4】端午节吃粽子是我国的传统习俗,设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同,从中任意选取3个.(Ⅰ)求三种粽子各取到1个的概率;(Ⅱ)设X 表示取到的豆沙粽个数,求X 的分布列与数学期望.【解析】(Ⅰ)设A 表示事件“三种粽子各取到1个”,则由古典概型的计算公式有()11123531014C C C P A C ==. (Ⅱ)X 的所有可能取值为0,1,2则()383107015C P X C ===,()12283107115C C P X C ===,()21283101215C C P X C === 所以X 的分布列为 X 1 2 3 P715 715 115 故()0121515155E X =⨯+⨯+⨯=个. 【名师点睛】从解题规范方面看,学生常出现错误有,没有用字母表示事件,即缺少“设A 表示事件‘三种粽子各取到l 个’”这一步骤;直接写出1()4P A =,过程没写出来,应写为1112353101()4C C C P A C ==,一但答案错误,就失去过程分数;忽视“X 的所有可能值为0,1,2”,导致丢分等.5. 运算能力弱【指点迷津】运算求解能力主要是指会根据法则、公式进行正确运算、变形和数据处理,能根据问题的条件寻找与设计合理、简捷的运算途径,能根据要求对数据进行估计和近似计算.本专题中,学生运算能力弱主要体现在不能根据问题的条件寻找与设计合理、简捷的运算途径,不能根据要求对数据进行估计和近似计算.【例5】(2017年全国卷Ⅰ文19)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 12 3 4 5 6 7 8 9 10 11 12 13 14 15 16零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得16119.9716i i x x ===∑,16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,1621(8.5)18.439i i =-≈∑,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(Ⅰ)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数12211()()()()n i ii n n i i i i x x y y r x x y y ===--=--∑∑∑.0.0080.09≈. 【解析】(Ⅰ)由样本数据得(,)(1,2,...,16)i x i i =的相关系数为16116162211()(8.5)0.180.2121618.439()(8.5)ii ii i x x i r x x i ===--==≈-⨯⨯--∑∑∑. 由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(Ⅱ)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.92)10.0215⨯-=,这条生产线当天生产的零件尺寸的均值的估计值为10.02,162221160.212169.971591.134i i x ==⨯+⨯≈∑,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈.[来源:学+科+网] 这条生产线当天生产的零件尺寸的标准差的估计值为0.0080.09≈.【名师点睛】从运算方面看,学生不懂从16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑中解出 16221()160.212i i x x =-=⨯∑;不会计算0.2121618.439r =⨯⨯的值,不懂根据保留小数点后两位的要求,实施近似处理以简化运算;不懂直接由0.2121618.439r =⨯⨯采用放缩方法判断是否满足||0.25r <;不会由9.97x =和0.212s ≈计算出区间(3,3)x s x s -+的端点值9.334,10.606;计算151115i i x x ==∑时,不懂得先做相反数相消处理或各项统一分离10后转化为15'111015i i x x ==+∑计算;计算15'1115iix x==∑时,不懂得转化为1613115iix xx=-=∑,再利用16119.9716iix x===∑简化运算;计算222222221[0.070.10.060.060.010.10.0415s=++++++22220.020.240.110.11+++++222200.020.030.07]++++0.008130.008=≈,不懂得各项统一提取20.01的技巧;计算222221[160.212169.979.221510.02]15s=⨯+⨯--⨯时,不懂得在保证精确度要求的前提下作近似处理以简化运算.【解决问题对策】1.关注统计图表的教学【指点迷津】高考试卷的解答题往往以频率分布表、频率分布直方图、柱形图、折线图、茎叶图五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.复习过程中,应充分利用五个样本频率分布图表,让学生会从图表中读取有用数据,或根据问题需要选择合适图表,依据统计学中的方法对数据进行分析,作出合理的决策.【例6】【2015年全国卷Ⅱ文、理3】根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【答案】A2.关注样本数字特征的含义【指点迷津】在复习中,应关注众数、中位数、平均数(期望)、方差与标准差有的含义,并能根据解决问题的需要选择合理的数字特征说明问题.【例7】【2014年课标卷Ⅱ文19】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(Ⅰ)分别估计该市的市民对甲、乙部门评分的中位数;(Ⅱ)分别估计该市的市民对甲、乙部门的评分高于90的概率;(Ⅲ)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(Ⅰ)67;(Ⅱ)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为50.150=,80.1650=,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(Ⅲ)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分)3. 厘清事件及其概率【指点迷津】复习过程中,应厘清事件间的关系,准确计算相关事件的概率.特别要求学生能将复杂事件进行分解,先分解为互斥事件,每个互斥事件又分解为两个相互独立事件的积事件.【例8】(2013年全国卷Ⅰ理19)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果3n=,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果4n=,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为12,且各件产品是否为优质品相互独立.(Ⅰ)求这批产品通过检验的概率;(Ⅱ)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.【解析】(Ⅰ)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,第二次取出的4件产品都是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)=41113 161616264⨯+⨯=.(Ⅱ)X可能的取值为400,500,800,并且P(X=400)=41111161616--=,P(X=500)=116,P(X=800)=14,所以X的分布列为EX=1111400+500+80016164⨯⨯⨯=506.25.4.关注概率模型的识别与应用【指点迷津】复习过程中,应关注概率模型的识别与应用,一定要注意弄清题意,找出题中的关键字词,厘清各种概率模型及适用范围.如超几何分布和二项分布是教材中两个重要概率分布,二项分布与超几何分布的区别为,二项分布是有放回的抽样,每做一次事件,事件A 发生的概率是相同的;超几何分布是不放回的抽样,每做一次事件,事件A发生的概率是不相同的.【例9】某食品厂为了检查一条自动包装流水线的生产情况,从该流水线上随机抽取40件产品作为样本,测得它们的重量(单位:克),将重量按如下区间分组:(490,495],(495,500],(500,505],(505,510],(510,515],得到样本的频率分布直方图(如图所示).若规定重量超过495克但不超过510克的产品为合格产品,且视频率为概率,回答下列问题:(Ⅰ)在上述抽取的40件产品中任取2件,设X 为合格产品的数量,求X 的分布列和数学期望()E X ;(Ⅱ)若从流水线上任取3件产品,求恰有2件合格产品的概率.【解析】(Ⅰ)由样本的频率分布直方图得,合格产品的频率为0.0450.0750.0550.8⨯+⨯+⨯=. 所以抽取的40件产品中,合格产品的数量为400.832⨯=. 则X 可能的取值为0,1,2,所以()2824070195C P X C ===;()11832240641195C C P X C ===;()2322401242195C P X C ===, 因此X 的分布列为 X0 1 2 P 7195 64195 124195 故X 数学期望7641243128()0121951951951955E X =⨯+⨯+⨯==. (Ⅱ)因为从流水线上任取1件产品合格的概率为40.85=, 所以从流水线上任取3件产品,恰有2件合格产品的概率为223144855125P C ⎛⎫⎛⎫== ⎪⎪⎝⎭⎝⎭.学1科·网 5.关注用样本估计总体的思想分析解决问题【指点迷津】复习过程中,应让学生掌握,为了考察一个总体的情况,在统计中通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类:用样本的频率分布估计总体的分布、用样本的数字特征估计总体的数字特征.其次,“预测与决策”与人们的生活休戚相关.随着社会的不断进步,人们对许多实际问题会有多种解决方案,但哪种方案最有利于解决问题,需要进行科学的决策.而通过期望、方差等的计算,并进行大小比较,就是其中的一种科学预测与决策的手段.【例10】【2016年课标Ⅰ理19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数. (Ⅰ)求X的分布列;(Ⅱ)若要求()0.5≤≥,确定n的最小值;P X n(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在19n=之中选其一,应选用哪n=与20个?【答案】(Ⅰ)由柱状图并一频率代替概率知,一台机器在三年内需要更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而P X==⨯=;(16)0.20.20.04P X==⨯⨯=;(17)20.20.40.16(18)20.20.20.40.40.24P X==⨯⨯+⨯=;P X==⨯⨯+⨯⨯=;(19)20.20.220.40.20.24P X==⨯⨯+⨯=;(20)20.20.20.20.20.2P X==⨯⨯=;(21)20.20.20.08P X==⨯=(22)0.20.20.04所以X的分布列为X 16 17 18 19 20 2122P 04.0 16.0 24.0 24.0 2.0 08.0 04.0(Ⅱ)由(Ⅰ)知44.0)18(=≤X P ,68.0)19(=≤X P ,故n 的最小值为19.(Ⅲ)记Y 表示2台机器在购买易损零件上所需的费用(单位:元).当19=n 时,08.0)500220019(2.0)50020019(68.020019⨯⨯+⨯+⨯+⨯+⨯⨯=EY 404004.0)500320019(=⨯⨯+⨯+. 当20=n 时,04.0)500220020(08.0)50020020(88.020020⨯⨯+⨯+⨯+⨯+⨯⨯=EY 4080=. 可知当19=n 时所需费用的期望值小于20=n 时所需费用的期望值,故应选19=n .6.关注“冷门”知识的复习【指点迷津】高考是对高中阶段学习结果的大检阅,统计与概率的考查,在突出核心知识考查的同时,也关注知识点的覆盖面.因此,在复习教学中,要全面检索高中阶段的所有知识,特别是不能忽视对所谓的“冷门知识”的复习,如正态分布、条件概率、相关系数、残差图、拟合效果等.【例11】【2015年课标Ⅰ理18】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,,8i =⋅⋅⋅)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w 281(x )ii x =-∑ 281()i i w w =-∑ 81()(y )i i i x x y =--∑ 81()()i i i w w y y =--∑46.6 56.3 6.8 289.8 1.6 1469 108.8表中i i w x =,8118i i w w ==∑ (Ⅰ)根据散点图判断,y a bx =+y 与y c b x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)以知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题: (i )年宣传费49x =时,年销售量及年利润的预报值是多少?(ii)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,),,u v ⋅⋅⋅(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为µ121()()()n i i i n i i u u v v uu β==--=-∑∑,µµv u αβ=-. 【解析】(Ⅰ)100.668y x =+(Ⅲ) (i )由(Ⅱ)知,当49x =时,年销售量y 的预报值$100.66849576.6y =+=,年利润的预报值0.2576.64966.32z=⨯-=$. ②根据(Ⅱ)的结果知,年利润z 的预报值0.2(100.668)13.620.12zx x x x =+-=-++$, 所以当13.6 6.82x ==,即46.24x =时,z 取得最大值. 7.加强阅读理解能力培养与训练【指点迷津】统计与概率进一步强化应用意识的考查,已成高考命题改革的必然趋势,试卷试题文字阅读量的逐年增加,或成高考试卷的发展趋势.复习中,应规范教学的阅读指导.应该呈现读题提取关键信息、析题形成解题思路、解题示范规范表达、反思积淀解题经验的“四步曲”完整过程,才能充分发挥解题教学的效益.其次,加强平时的阅读训练.需要适当增加平时作业习题的阅读量,尤其是应用性试题的读题训练,提高学生的阅读理解能力及应试心态.【例12】【2014年课标Ⅰ理18】从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(Ⅰ)求这500件产品质量指标值的样本平均数x 和样本方差2s (同一组数据用该区间的中点值作代表);(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值Z 服从正态分布2(,)N μδ,其中μ近似为样本平均数x ,2δ近似为样本方差2s .(i )利用该正态分布,求(187.8212.2)P Z <<;(ii )某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i )的结果,求EX .12.2.若Z ~2(,)N μδ,则()P Z μδμδ-<<+=0.6826,(22)P Z μδμδ-<<+=0.9544.【解析】(Ⅰ) 2200,150x s ==(Ⅱ)(ⅰ)由(Ⅰ)知Z ~(200,150)N ,从而(187.8212.2)P Z <<=(20012.220012.2)0.6826P Z -<<+=,(ⅱ)由(ⅰ)知,一件产品中质量指标值为于区间(187.8,212.2)的概率为0.6826, 依题意知(100,0.6826)X B :,所以1000.682668.26EX =⨯=.8.规范答题表达形式【指点迷津】规范答题,一方面,思考问题要规范.也就是从知识的源头出发,弄清知识的来龙去脉.知识是怎么要求的,就怎么想、怎么用、怎么写,不能模棱两可,要会运用知识进行思考;另一方面,书写要规范.书写规范是一个重要的高考增分点,这一点应引起足够重视.如解题中应注意用字母表示事件,注意作答等.【例13】(2015年全国卷Ⅱ理18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:记时间C :“A 地区用户的满意度等级高于B 地区用户的满意度等级” .假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.【解析】(Ⅰ)略;(Ⅱ)记1A C 表示事件:“A 地区用户满意度等级为满意或者非常满意”;记2A C 表示事件:“A 地区用户满意度等级为非常满意”;记1B C 表示事件:“A 地区用户满意度等级为不满意”;记2B C 表示事件:“A 地区用户满意度等级为满意”;则1A C 与1B C 独立,2A C 与2B C 独立,1B C 与2B C 互斥,1122()()B A B A C C C C C =U ,1122()(()())B A B A P C P C C C C =U 1122()()B A B A P C C P C C =+1122()()()()B A B A P C P C P C P C =+, 由所给数据得1212,,,A A B B C C C C 发生的频率分别为164108,,,20202020,故1212164108(),(),(),()20202020A A B B P C P C P C P C ====,所以164108()0.4820202020P C =⨯⨯⨯=.。
2020年高考第二轮专题复习(教学案):统计与概率考纲指要:“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
统计案例主要包括回归分析的基本思想及其初步应用和独立性检验的基本思想和初步应用。
对概率考察的重点为互斥事件、古典概型的概率事件的计算为主,了解随机数的意义,能运用模拟方法(包括计算器产生随机数来进行模拟)估计概率,初步体会几何概型的意义。
考点扫描:1.三种常用抽样方法:(1)简单随机抽样;(2)系统抽样;(3)分层抽样。
2.用样本的数字特征估计总体的数字特征: (1)众数、中位数;(2)平均数与方差。
3.频率分布直方图、折线图与茎叶图。
4.线性回归:回归直线方程。
5.统计案例:相关系数、卡方检验,6.随机变量:随机变量的概念,离散性随机变量的分布列,相互独立事件、独立重复试验公式,随机变量的均值和方差,几种特殊的分布列:(1)两点分布;(2)超几何分布;(3)二项分布;正态分布。
7随机事件的概念、概率;事件间的关系:(1)互斥事件;(2)对立事件;(3)包含; 事件间的运算:(1)并事件(和事件)(2)交事件(积事件)8古典概型:古典概型的两大特点;古典概型的概率计算公式。
9几何概型:几何概型的概念;几何概型的概率公式;几种常见的几何概型。
考题先知:例1.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为:sxx Z -=(其中x 是某位学生的考试分数,x 是该次考试的平均分,s 是该次 考试的标准差,Z 称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此, 又常常再将Z 分数作线性变换转化成其他分数. 例如某次学业选拔考试采用的是T 分数,线性变换公式是:T=40Z+60. 已知在这次考试中某位考生的考试分数是85,这次考试的平均分是70,标准差是25,则该考生的T 分数为 . 分析:正确理解题意,计算所求分数。
2020年高考数学二轮复习回归教材基础知识总结-专题6概率与统计1.分类加法计数原理完成一件事,可以有n 类办法,在第一类办法中有m 1种方法,在第二类办法中有m 2种方法,…,在第n 类办法中有m n 种方法,那么完成这件事共有N =m 1+m 2+…+m n 种方法(也称加法原理).2.分步乘法计数原理完成一件事需要经过n 个步骤,缺一不可,做第一步有m 1种方法,做第二步有m 2种方法,…,做第n 步有m n 种方法,那么完成这件事共有N =m 1×m 2×…×m n 种方法(也称乘法原理).3.排列(1)排列的定义:从n 个不同元素中取出m (m ≤n )个元素,按照一定的顺序排成一列,叫做从n 个不同元素中取出m 个元素的一个排列.(2)排列数的定义:从n 个不同元素中取出m (m ≤n )个元素的所有不同排列的个数叫做从n 个不同元素中取出m 个元素的排列数,用A m n 表示.(3)排列数公式:A m n =n (n -1)(n -2)…(n -m +1).(4)全排列:n 个不同元素全部取出的一个排列,叫做n 个元素的一个全排列,A n n =n ·(n -1)·(n-2)·…·2·1=n !.排列数公式写成阶乘的形式为A m n =n !(n -m )!,这里规定0!=1. 4.组合(1)组合的定义:从n 个不同元素中取出m (m ≤n )个元素合成一组,叫做从n 个不同元素中取出m 个元素的一个组合.(2)组合数的定义:从n 个不同元素中取出m (m ≤n )个元素的所有不同组合的个数,叫做从n 个不同元素中取出m 个元素的组合数,用C m n 表示.(3)组合数的计算公式:C m n =A m n A m m =n !m !(n -m )!=n (n -1)(n -2)…(n -m +1)m !,由于0!=1,所以C 0n =1.(4)组合数的性质:①C m n =C n -m n ;②C m n +1=C m n +C m -1n . 5.二项式定理(a +b )n =C 0n a n +C 1n a n -1b 1+…+C k n a n -k b k +…+C n n b n (n ∈N *). 这个公式叫做二项式定理,右边的多项式叫做(a +b )n 的二项展开式,其中的系数C k n(k ∈{0,1,2,…,n })叫做二项式系数.式中的C k n a n -k b k 叫做二项展开式的通项,用T k +1表示,即展开式的第k +1项:T k +1=C k n a n -k b k . 6.二项展开式形式上的特点(1)项数为n +1.(2)各项的次数都等于二项式的幂指数n ,即a 与b 的指数的和为n .(3)字母a 按降幂排列,从第一项开始,次数由n 逐项减1直到零;字母b 按升幂排列,从第一项起,次数由零逐项增1直到n .(4)二项式的系数从C 0n ,C 1n ,一直到C n -1n ,C n n . 7.二项式系数的性质(1)对称性:与首末两端“等距离”的两个二项式系数相等,即C m n =C n -m n . (2)增减性与最大值:二项式系数C k n ,当k <n +12时,二项式系数是递增的;当k >n +12时,二项式系数是递减的.当n 是偶数时,那么其展开式中间一项+12n T 的二项式系数最大.当n 是奇数时,那么其展开式中间两项1+12n T -和1+12n T +的二项式系数相等且最大.(3)各二项式系数的和(a +b )n 的展开式的各个二项式系数的和等于2n ,即C 0n +C 1n +C 2n +…+C k n +…+C n n =2n .二项展开式中,偶数项的二项式系数的和等于奇数项的二项式系数的和,即C 1n +C 3n +C 5n +…=C 0n +C 2n +C 4n +…=2n -1. 8.概率的计算公式(1)古典概型的概率计算公式P (A )=事件A 包含的基本事件数m 基本事件总数n. (2)互斥事件的概率计算公式P (A ∪B )=P (A )+P (B ).(3)对立事件的概率计算公式P (A )=1-P (A ).(4)几何概型的概率计算公式P (A )=构成事件A 的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积). (5)条件概率公式P (B |A )=P (AB )P (A ). 9.抽样方法简单随机抽样、分层抽样、系统抽样.(1)从容量为N 的总体中抽取容量为n 的样本,则每个个体被抽到的概率都为n N. (2)分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.10.统计中四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:在样本数据中,将数据按从大到小(或从小到大)排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ). (4)方差与标准差方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 标准差:s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 11.离散型随机变量(1)离散型随机变量的分布列的两个性质①p i ≥0(i =1,2,…,n );②p 1+p 2+…+p n =1.(2)期望公式E (X )=x 1p 1+x 2p 2+…+x n p n .(3)期望的性质①E (aX +b )=aE (X )+b ;②若X ~B (n ,p ),则E (X )=np ;③若X 服从两点分布,则E (X )=p .(4)方差公式D (X )=[x 1-E (X )]2·p 1+[x 2-E (X )]2·p 2+…+[x n -E (X )]2·p n ,标准差为D (X ).(5)方差的性质①D (aX +b )=a 2D (X );②若X ~B (n ,p ),则D (X )=np (1-p );③若X 服从两点分布,则D (X )=p (1-p ).(6)独立事件同时发生的概率计算公式 P (AB )=P (A )P (B ).(7)独立重复试验的概率计算公式P (X =k )=C k n p k (1-p )n -k ,k =0,1,2,…,n .12.线性回归(1)线性回归方程y ^=b ^x +a ^一定过样本点的中心(x ,y ), 其中⎩⎪⎨⎪⎧ b ^=∑i =1n (x i -x )(y i -y )∑i =1n (x i -x )2,a ^=y -b ^ x .(2)相关系数r 具有如下性质:①|r |≤1;②|r |越接近于1,x ,y 的线性相关程度越高;③|r |越接近于0,x ,y 的线性相关程度越弱.13.独立性检验利用随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )来判断“两个分类变量有关系”的方法称为独立性检验.如果K 2的观测值k 越大,说明“两个分类变量有关系”的可能性越大.14.正态分布如果随机变量X 服从正态分布,则记为X ~N (μ,σ2).满足正态分布的三个基本概率的值是①P (μ-σ<X ≤μ+σ)≈0.682 7;②P (μ-2σ<X ≤μ+2σ)≈0.954 5;③P (μ-3σ<X ≤μ+3σ)≈0.997 3.1.关于两个计数原理应用的注意事项(1)分类加法计数原理和分步乘法计数原理,都是关于做一件事的不同方法的种数的问题,区别在于:分类加法计数原理针对“分类”问题,其中各种方法相互独立,用其中任何一种方法都可以做完这件事;分步乘法计数原理针对“分步”问题,各个步骤相互依存,只有各个步骤都完成了才算完成这件事.(2)混合问题一般是先分类再分步.(3)分类时标准要明确,做到不重复不遗漏.(4)要恰当画出示意图或树状图,使问题的分析更直观、清楚,便于探索规律.2.对于有附加条件的排列、组合应用题,通常从三个途径考虑:(1)以元素为主考虑,即先满足特殊元素的要求,再考虑其他元素.(2)以位置为主考虑,即先满足特殊位置的要求,再考虑其他位置.(3)先不考虑附加条件,计算出排列数或组合数,再减去不合要求的排列数或组合数.3.排列、组合问题的求解方法与技巧(1)特殊元素优先安排.(2)合理分类与准确分步.(3)排列、组合混合问题先选后排.(4)相邻问题捆绑处理.(5)不相邻问题插空处理.(6)定序问题排除法处理.(7)分排问题直排处理.(8)“小集团”排列问题先整体后局部.(9)构造模型.(10)正难则反,等价条件.4.二项式定理应用时的注意点(1)区别“项的系数”与“二项式系数”,审题时要仔细.项的系数与a,b有关,可正可负,二项式系数只与n有关,恒为正.(2)运用通项求展开式的一些特殊项,通常都是由题意列方程求出k,再求所需的某项;有时需先求n,计算时要注意n和k的取值范围及它们之间的大小关系.(3)赋值法求展开式中的系数和或部分系数和,常赋的值为0,±1.(4)在化简求值时,注意二项式定理的逆用,要用整体思想看待a,b.5.应用互斥事件的概率加法公式时,一定要注意首先确定各事件是否彼此互斥,然后求出各事件分别发生的概率,再求和.6.正确区别互斥事件与对立事件的关系:对立事件是互斥事件,是互斥中的特殊情况,但互斥事件不一定是对立事件,“互斥”是“对立”的必要不充分条件.7.混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.8.要注意概率P(A|B)与P(AB)的区别(1)在P(A|B)中,事件A,B发生有时间上的差异,B先A后;在P(AB)中,事件A,B同时发生.(2)样本空间不同,在P(A|B)中,事件B成为样本空间;在P(AB)中,样本空间仍为Ω,因而有P(A|B)≥P(AB).9.易忘判定随机变量是否服从二项分布,盲目使用二项分布的期望和方差公式计算致误.10.涉及求分布列时,要注意区分是二项分布还是超几何分布.。
课时跟踪检测(十)统计与统计案例A组一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1∶3∶5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()A.200 B.240C.400 D.480解析:选C设频率分布直方图中从左到右前3个小矩形的面积分别为P,3P,5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)×2=0.1.因为频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即P=0.1.所以平均每周上网时间少于4 h的学生所占比例为P+3P=0.4,由此估计学生人数为0.4×1 000=400.2.AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0~50),二级良(51~100),三级轻度污染(101~150),四级中度污染(151~200),五级重度污染(201~300),六级严重污染(大于300).如图是昆明市2019年4月份随机抽取的10天的AQI 茎叶图,利用该样本估计昆明市2020年4月份空气质量优的天数为()A.3 B.4C.12 D.21解析:选C从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为410=25,所以估计昆明市2020年4月份空气质量为优的天数为30×25=12,故选C.3.(2019·成都模拟)某城市收集并整理了该市2018年1月份至10月份各月最低气温与最高气温(单位:℃)的数据,绘制了下面的折线图.已知该城市各月的最低气温与最高气温具有较好的线性关系,则根据折线图,下列结论错误的是()A.最低气温与最高气温为正相关B.10月的最高气温不低于5月的最高气温C.月温差(最高气温减最低气温)的最大值出现在1月D.最低气温低于0 ℃的月份有4个解析:选D在A中,最低气温与最高气温为正相关,故A正确;在B中,10月的最高气温不低于5月的最高气温,故B正确;在C中,月温差(最高气温减最低气温)的最大值出现在1月,故C正确;在D中,最低气温低于0 ℃的月份有3个,故D错误.故选D.4.(2019·承德模拟)为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图(如图所示),其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述中错误的是()A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为60×60%=36,女性人数为40×60%=24,不相同.故选C.5.(2019·石家庄模拟)某学校A,B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为()A.①④B.②③C.②④D.①③解析:选A A班兴趣小组的平均成绩为53+62+64+…+92+9515=78,其方差为115×[(53-78)2+(62-78)2+…+(95-78)2]=121.6,则其标准差为121.6≈11.03;B 班兴趣小组的平均成绩为45+48+51+…+9115=66,其方差为115×[(45-66)2+(48-66)2+…+(91-66)2]=169.2, 则其标准差为169.2≈13.01.故选A.6.某商场对某一商品搞活动,已知该商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如图所示,设x (个)为每天商品的销量,y (元)为该商场每天销售这种商品的利润.从日利润不少于96元的几天里任选2天,则选出的这2天日利润都是97元的概率为( )A.19B.110 C.15D.18解析:选B 由题意知y =⎩⎪⎨⎪⎧5x ,x =18,19,95+(x -19)(4-3),x =20,21, 即y =⎩⎪⎨⎪⎧5x ,x =18,19,76+x ,x =20,21.当日销量不少于20个时,日利润不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利润为96元的有3天,记为a ,b ,c ,日利润为97元的有2天,记为A ,B ,从中任选2天有(a ,A ),(a ,B ),(a ,b ),(a ,c ),(b ,A ),(b ,B ),(b ,c ),(c,A),(c,B),(A,B),共10种情况.其中选出的这2天日利润都是97元的有(A,B)1种情况.故所求概率为110.故选B.二、填空题7.某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0销量y/瓶504443403528^=b^x+a^,其中b^=-20.若该品牌饮料的进价已知x,y的关系符合回归方程y为2元,为使利润最大,零售价应定为________元.解析:依题意得:x=3.5,y=40,所以a^=40-(-20)×3.5=110,所以回归直线方程为y^=-20x+110,利润L=(x-2)(-20x+110)=-20x2+150x-220,=3.75元时,利润最大.所以x=15040答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是________.解析:设所求的人数为n,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08+0.16)×2.5=0.7,∴n=0.7×200=140.答案:1409.为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为________.解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+m,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m+32)÷5=30,解得m=1,则甲地该月11时的平均气温的标准差为12+(29-30)2+(30-30)2+(31-30)2+(32-30)2] 5×[(28-30)= 2.答案: 2三、解答题10.某篮球运动员的投篮命中率为50%,他想提高自己的投篮水平,制定了一个夏季训练计划,为了了解训练效果,执行训练前,他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为46.3.执行训练后也统计了10场比赛的得分,茎叶图如图所示:(1)请计算该篮球运动员执行训练后统计的10场比赛得分的中位数、平均得分与方差;(2)如果仅从执行训练前后统计的各10场比赛得分数据分析,你认为训练计划对该运动员的投篮水平的提高是否有帮助?为什么?解:(1)训练后得分的中位数为14+152=14.5;平均得分为8+9+12+14+14+15+16+18+21+2310=15;方差为110×[(8-15)2+(9-15)2+(12-15)2+(14-15)2+(14-15)2+(15-15)2+(16-15)2+(18-15)2+(21-15)2+(23-15)2]=20.6.(2)尽管中位数训练后比训练前稍小,但平均得分一样,训练后方差20.6小于训练前方差46.3,说明训练后得分稳定性提高了(阐述观点合理即可),这是投篮水平提高的表现.故此训练计划对该篮球运动员的投篮水平的提高有帮助.11.(2019·西安八校联考)在2018年俄罗斯世界杯期间,莫斯科的部分餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x 与销售单价y (单位:元)之间的关系,经统计得到如下数据:(1)y 关于x 的线性回归方程(系数精确到0.1);(2)若莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y ^=b^x +a^的斜率和截距的最小二乘估计分别为b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x 2,a^=y -b ^x . 参考数据:∑i =16x i y i =8 440,∑i =16x 2i =25 564.解:(1)由题意,得x=38+48+58+68+78+886=63,y=16.8+18.8+20.8+22.8+24+25.86=21.5,b^=∑i=16x i y i-6x y∑i=16x2i-6x2=8 440-6×63×21.525 564-6×63×63≈0.2,a^=y-b^x=21.5-0.2×63=8.9.故所求线性回归方程为y^=0.2x+8.9.(2)由(1)知,当x=98时,y=0.2×98+8.9=28.5.∴估计该等级的中国小龙虾销售单价为28.5元.12.(2019·长沙模拟)某职称晋级评定机构对参加某次专业技术考试的100人的成绩进行了统计,绘制的频率分布直方图如图所示.规定80分以上者晋级成功,否则晋级失败(满分为100分).(1)求图中a的值;(2)估计该次考试的平均分x(同一组中的数据用该组的区间中点值代表);(3)根据已知条件完成下面2×2列联表,并判断能否有85%的把握认为“晋级成功”与性别有关.晋级成功晋级失败合计男16女50合计参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d0.030+0.040)×10=1,解得a=0.005.(2)由频率分布直方图知,各小组的中点值依次是55,65,75,85,95,对应的频率分别为0.05,0.30,0.40,0.20,0.05,则估计该次考试的平均分为x=55×0.05+65×0.30+75×0.40+85×0.20+95×0.05=74(分).(3)由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25,故晋级成功的人数为100×0.25=25,填写2×2列联表如下:K2=n((a+b)(c+d)(a+c)(b+d)=100×(16×41-34×9)225×75×50×50≈2.613>2.072,所以有85%的把握认为“晋级成功”与性别有关.B组1.为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单位:小时)如下:248256232243188268278266289312274296288302295228287217329283(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.[200,220)[220,240)[240,260)[260,280)[280,300)[300,320)[320,340)合计0.05解:(1)分组频数频率频率/组距[180,200)10.050.002 5[200,220)10.050.002 5[220,240)20.100.005 0[240,260)30.150.007 5[260,280)40.200.010 0[280,300)60.300.015 0[300,320)20.100.005 0[320,340)10.050.002 5合计20 1.000.05(2)由题意可得8×(0.30+0.10+0.05)=3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x=190×0.05+210×0.05+230×0.10+250×0.15+270×0.20+290×0.30+310×0.10+330×0.05=269(小时),所以样本的平均无故障连续使用时限为269小时.2.海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量<50 kg箱产量≥50 kg旧养殖法新养殖法(3)附:P(K2≥k)0.0500.0100.001k 3.841 6.63510.828K2=n(ad-bc)(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d. 解:(1)旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)×5=0.62.因此,事件A的概率估计值为0.62.(2)根据箱产量的频率分布直方图得到联表:箱产量<50 kg箱产量≥50 kg 旧养殖法6238K 2=200×(62×66-34×38)100×100×96×104≈15.705.由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关. (3)箱产量的频率分布直方图表明:新养殖法的箱产量平均值(或中位数)在50 kg 到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg 到50 kg 之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:=116∑i =116x 2i -16x 2≈0.212, ∑i =116(i -8.5)2≈18.439,∑i =116(x i -x )(i -8.5)=-2.78,其中x i 为抽取的第i 个零件的尺寸,i =1,2, (16)(1)求(x i ,i )(i =1,2,…,16)的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若|r |<0.25,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(x -3s ,x +3s )之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(x -3s ,x +3s )之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(x i ,y i )(i =1,2,…,n )的相关系数r =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2∑i =1n(y i -y )2.0.008≈0.09.解:(1)由样本数据得(x i ,i )(i =1,2,…,16)的相关系数为r =∑i =116(x i -x )(i -8.5)∑i =116(x i -x )2∑i =116(i -8.5)2=-2.780.212×16×18.439≈-0.18.由于|r |<0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于x =9.97,s ≈0.212,由样本数据可以看出抽取的第13个零件的尺寸在(x -3s ,x +3s )以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为115×(16×9.97-9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.∑i =116x 2i =16×0.2122+16×9.972≈1 591.134, 剔除第13个数据,剩下数据的样本方差为115×(1 591.134-9.222-15×10.022)≈0.008,这条生产线当天生产的零件尺寸的标准差的估计值为0.008≈0.09. 4.(2019·昆明模拟)“工资条里显红利,个税新政入民心”.随着2019年新年钟声的敲响,我国自1980年以来,力度最大的一次个人所得税(简称个税)改革迎来了全面实施的阶段.某IT 从业者为了解自己在个税新政下能享受多少税收红利,绘制了他在26~35岁(2009~2018年)之间各年的月平均收入y (单位:千元)的散点图:(1)由散点图知,可用回归模型y =b ln x +a 拟合y 与x 的关系,试根据有关数据建立y 关于x 的回归方程;(2)如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用(1)的结果,将月平均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.附注:参考数据:∑i =110x i =55,∑i =110y i =155.5,∑i =110(x i -x )2=82.5,∑i =110(x i -x )(y i-y )=94.9,∑i =110t i =15.1,∑i =110(t i -t )2=4.84,∑i =110(t i -t )(y i -y )=24.2,其中t i=ln x i ;取ln 11=2.4,ln 36=3.6.参考公式:回归方程v =b^u +a ^中斜率和截距的最小二乘估计分别为b ^=∑i =1n(u i -u )(v i -v )∑i =1n(u i -u )2,a^=v -b ^u .新旧个税政策下每月应纳税所得额(含税)计算方法及税率表如下:b^=∑i=110(t i-t)(y i-y)∑i=110(t i-t)2=24.24.84=5,y=∑i=110y i10=155.510=15.55,t=∑i=110t i10=15.110=1.51,a^=y-b^t=15.55-5×1.51=8,所以y关于t的回归方程为y=5t+8.因为t=ln x,所以y关于x的回归方程为y=5ln x+8.(2)由(1)得,该IT从业者36岁时月平均收入为y=5ln 11+8=5×2.4+8=20(千元).旧个税政策下每个月应缴纳的个人所得税为1 500×3%+3 000×10%+4 500×20%+(20 000-3 500-9 000)×25%=3 120(元).新个税政策下每个月应缴纳的个人所得税为3 000×3%+(20 000-5 000-3 000-3 000)×10%=990(元).故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(元).。
概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。
2.理解超几何分布及其推导过程,并能进行简单的应用。
3.了解条件概率和两个事件相互独立的概念,理解次独立重复实验的模型及二n 项分布,并能解决一些简单的实际问题。
4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。
二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。
2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。
3.有关正态分布的考题多为一道小题。
三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作 ,条件概率公式为 。
()P B A ()=P B A ()()P AB P A (2)若,即,称与为相互独立事件。
与()=P B A P B ()()=()()P AB P A P B A B A B 相互独立,即发生与否对的发生与否无影响,反之亦然。
即相互独立,A B ,A B 则有公式。
()=()()P AB P A P B(3)在次独立重复实验中,事件发生次的概率记作,记n A k ()0k n ≤≤()n P k A在其中一次实验中发生的概率为 ,则 .()P A p =()()1n k k k n n P k C p p -=-(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量的分布列(如表13-1所示).ξ表13-1ξ 1ξ 2ξ 3ξ… n ξ P 1p 2p 3pn p ① ;()11,i p i n i N θ*≤≤≤≤∈② .121n p p p ++= (2)表示的期望:,反应随机变量的平均水平,E ξξ1122=+n n p p p E ξξξξ++…若随机变量满足,则.ξη,=a b ηξ+E aE b ηξ=+(3)表示的方差:,反映随机D ξξ()()()2221122=---n n E p E p E p D ξξξξξξξ+++ 变量取值的波动性。
(新课标)2020版高考数学二轮复习专题四概率与统计第1讲统计与统计案例练习文新人教A版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望((新课标)2020版高考数学二轮复习专题四概率与统计第1讲统计与统计案例练习文新人教A版)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为(新课标)2020版高考数学二轮复习专题四概率与统计第1讲统计与统计案例练习文新人教A版的全部内容。
第1讲统计与统计案例一、选择题1.某校为了解学生学习的情况,采用分层抽样的方法从高一1 000人、高二1 200人、高三n人中,抽取81人进行问卷调查.已知高二被抽取的人数为30,那么n=()A.860 B.720C.1 020 D.1 040解析:选D.根据分层抽样方法,得错误!×81=30,解得n=1 040.故选D。
2.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分。
7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差解析:选A。
记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.3.(2019·高考全国卷Ⅲ)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )A.0.5 B.0。
概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。
2.理解超几何分布及其推导过程,并能进行简单的应用。
3.了解条件概率和两个事件相互独立的概念,理解n次独立重复实验的模型及二项分布,并能解决一些简单的实际问题。
4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。
二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。
2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。
3.有关正态分布的考题多为一道小题。
三、知识点精讲(一).条件概率与独立事件(1)在事件A发生的条件下,时间B发生的概率叫做A发生时B发生的条件概率,记作()P B A ,条件概率公式为()=P B A ()()P AB P A 。
(2)若()=P B A P B (),即()=()()P AB P A P B ,称A 与B 为相互独立事件。
A 与B 相互独立,即A 发生与否对B 的发生与否无影响,反之亦然。
即,A B 相互独立,则有公式()=()()P AB P A P B 。
(3)在n 次独立重复实验中,事件A 发生k ()0k n ≤≤次的概率记作()n P k ,记A在其中一次实验中发生的概率为()P A p = ,则()()1n kk kn nP k C p p -=- .(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量ξ的分布列(如表13-1所示).表13-1①11,i p i n i N θ*≤≤≤≤∈ ; ②121n p p p ++=L .(2)E ξ表示ξ的期望:1122=+n n p p p E ξξξξ++…,反应随机变量的平均水平,若随机变量ξη,满足=a b ηξ+,则E aE b ηξ=+.(3)D ξ表示ξ的方差:()()()2221122=---n n E p E p E p D ξξξξξξξ+++L ,反映随机变量ξ取值的波动性。
概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。
2.理解超几何分布及其推导过程,并能进行简单的应用。
3.了解条件概率和两个事件相互独立的概念,理解n 次独立重复实验的模型及二项分布,并能解决一些简单的实际问题。
4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。
二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。
2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。
3.有关正态分布的考题多为一道小题。
三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作()P B A ,条件概率公式为()=P B A ()()P AB P A 。
(2)若()=P BA P B (),即()=()()P A B P APB ,称A 与B 为相互独立事件。
A 与B相互独立,即A 发生与否对B 的发生与否无影响,反之亦然。
即,A B 相互独立,则有公式()=()()P AB P A P B 。
(3)在n 次独立重复实验中,事件A 发生k ()0k n ≤≤次的概率记作()n P k ,记A在其中一次实验中发生的概率为()P A p = ,则()()1n k k k n n P k C p p -=- .(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量ξ的分布列(如表13-1所示).表13-1①()11,i p i n i N θ*≤≤≤≤∈ ;②121n p p p ++= .(2)E ξ表示ξ的期望:1122=+n n p p p E ξξξξ++…,反应随机变量的平均水平,若随机变量ξη,满足=a b ηξ+,则E aE b ηξ=+.(3)D ξ表示ξ的方差:()()()2221122=---n n E p E p E p D ξξξξξξξ+++,反映随机变量ξ取值的波动性。
回顾9 概率与统计[必记知识]概率的几个基本性质(1)任何事件A 的概率都在0~1之间,即0≤P (A )≤1. (2)若A ⊆B ,则P (A )≤P (B ).(3)必然事件发生的概率为1,不可能事件发生的概率为0.(4)当事件A 与事件B 互斥时,P (A +B )=P (A )+P (B ).注意没有事件A 与事件B 互斥这一条件时,这个公式不成立.(5)若事件A 与事件B 互为对立事件,则P (A )+P (B )=1. 古典概型与几何概型的异同(1)古典概型的概率计算公式P (A )=事件A 包含的基本事件的个数基本事件的总数.(2)几何概型的概率计算公式P (A )=构成事件A 的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积).简单随机抽样、系统抽样、分层抽样.(1)从容量为N 的总体中抽取容量为n 的样本,则每个个体被抽到的概率都为n N. (2)分层抽样实际上就是按比例抽样,即按各层个体数占总体的比确定各层应抽取的样本容量.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x =1n(x 1+x 2+…+x n ).(4)方差与标准差方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差:s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].[必会结论]直方图的三个结论 (1)小长方形的面积=组距×频率组距=频率. (2)各小长方形的面积之和等于1.(3)小长方形的高=频率组距,所有小长方形高的和为1组距.线性回归方程线性回归方程y ^=b ^x +a ^一定过样本点的中心(x ,y ).独立性检验利用随机变量K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )来判断“两个分类变量有关系”的方法称为独立性检验.如果K 2的观测值k 越大,说明“两个分类变量有关系”的这种判断犯错误的可能性越小.[必练习题]1.(2019·洛阳尖子生第二次联考)已知x 与y 之间的一组数据如表:已求得y 关于x 的线性回归方程y =2.1x +0.85,则m 的值为( ) A .1 B .0.85 C .0.7D .0.5解析:选D.x -=0+1+2+34=1.5,y ^=m +3+5.5+74=m +15.54,因为点(x -,y -)在回归直线上,所以m +15.54=2.1×1.5+0.85,解得m =0.5,故选D.2.(2019·福州市第一学期抽测)随机抽取某中学甲班9名学生、乙班10名学生的期中考试数学成绩,获得茎叶图如图.估计该中学甲、乙两班期中考试数学成绩的中位数分别是( )A .75,84B .76,83C .76,84D .75,83解析:选B.甲班9名学生的期中考试数学成绩分别为52,66,72,74,76,76,78,82,96,中位数为76,乙班10名学生的期中考试数学成绩分别为62,74,76,78,82,84,85,86,88,92,中位数为82+842=83,所以估计该中学甲、乙两班期中考试数学成绩的中位数分别是76,83,故选B.3.(2019·昆明市诊断测试)高铁、扫码支付、共享单车、网购被称为中国的“新四大发明”,为评估共享单车的使用情况,选了n 座城市作试验基地.这n 座城市共享单车的使用量(单位:人次/天)分别为x 1,x 2,…,x n ,下面给出的指标中可以用来评估共享单车使用量的稳定程度的是( )A .x 1,x 2,…x n 的平均数B .x 1,x 2,…x n 的标准差C .x 1,x 2,…x n 的最大值D .x 1,x 2,…x n 的中位数解析:选B.平均数、中位数可以反映一组数据的集中程度;方差、标准差可以反映一组数据的波动大小,同时也反映这组数据的稳定程度.故选B.4.(2019·济南市学习质量评估)如图,在△ABC 中,∠C =90°,BC =2,AC =3,三角形内的空白部分由三个半径均为1的扇形构成,向△ABC 内随机投掷一点,则该点落在阴影部分的概率为()A.π6 B .1-π6C.π4D .1-π4解析:选B.三个空白部分的面积之和为一个半径为1的圆的面积的二分之一,即π2,△ABC 的面积为3,故所求的概率为1-π23=1-π6.5.某校为了了解学生一天的休息状况,分别从高一年级的510名学生、高二年级的480名学生、高三年级的450名学生中用分层抽样的方法抽取一个容量为n 的样本进行调查,其中从高三年级抽取了15名,则n =________.解析:由题意知抽样比为15450=130,所以n 510+480+450=130,解得n =48.答案:486.(一题多解)(2019·武昌区调研考试)甲盒中有红、黑皮笔记本各2本,乙盒中有黄、黑皮笔记本各1本,从两盒中各取1本,则取出的2本笔记本是不同颜色的概率为________.解析:法一:依题意,从甲盒、乙盒中各取1本笔记本共有4×2=8(种)取法,取出的2本笔记本是不同颜色的方法有2×2+2×1=6(种),所以取出的2本笔记本是不同颜色的概率P =68=34.法二:依题意,从甲盒、乙盒中各取1本笔记本共有4×2=8(种)取法,取出的2本笔记本是相同颜色的方法有2种,所以取出的2本笔记本是相同颜色的概率P ′=28=14,所以取出的2本笔记本是不同颜色的概率P =1-14=34.答案:347.(2019·武昌区调研考试)对参加某次数学竞赛的1 000名选手的初赛成绩(满分:100分)作统计,得到如图所示的频率分布直方图.(1)根据频率分布直方图完成以下表格;(3)如果从参加初赛的选手中选取380人参加复赛,那么如何确定进入复赛选手的成绩? 解:(1)填表如下.23)2×0.05+(-13)2×0.15+(-3)2×0.35+72×0.35+172×0.1=101.(3)进入复赛选手的成绩为80+350-(380-100)350×10=82(分),所以初赛成绩为82分及其以上的选手均可进入复赛.(说明:回答82分以上,或82分及其以上均可)8.2019年国际篮联篮球世界杯,于2019年8月31日至9月15日在中国的北京、广州、南京、上海、武汉、深圳、佛山、东莞八座城市举办.为了宣传世界杯,某大学从全校学生中随机抽取了120名学生,对是否会收看篮球世界杯赛进行了问卷调查,统计数据如下:(1)(2)现从参与问卷调查且会收看篮球世界杯赛的学生中,采用按性别分层抽样的方法选取4人参加2019年国际篮联篮球世界杯志愿者宣传活动.(ⅰ)求男、女学生各选取多少人;(ⅱ)若从这4人中随机选取2人到校广播站开展2019年国际篮联篮球世界杯宣传介绍,求恰好选到2名男生的概率.附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .解:(1)因为K 2=80×40×80×40=7.5>6.635,所以有99%的把握认为收看篮球世界杯赛与性别有关. (2)(ⅰ)根据分层抽样的知识得,选取的男生有6060+20×4=3(人),女生有2060+20×4=1(人),所以选取的4人中,男生有3人,女生有1人.(ⅱ)设选取的3名男生分别为A ,B ,C ,1名女生为甲.从4人中随机选取2人,有(A ,B ),(A ,C ),(A ,甲),(B ,C ),(B ,甲),(C ,甲),共6种情形,其中恰好选到2名男生,有(A ,B ),(A ,C ),(B ,C ),共3种情形,所以,所求概率P =36=12.。
专题5 概率与统计一、概率1.频率等于概率吗?频率反映了一个随机事件出现的频繁程度,频率是随机的,而概率是一个确定的值,通常用概率来反映随机事件发生的可能性的大小.通过大量的重复试验,事件发生的频率会逐渐趋近于某一个常数(概率),因此有时也用频率来作为随机事件的概率的估计值.2.如何求互斥事件之间至少一个发生的概率?若事件A 1、A 2、A 3、…、A n 彼此互斥,它们至少有一个发生的概率P (A 1+A 2+…+A n )=P (A 1)+P (A 2)+…+P (A n ).3.古典概型与几何概型有何不同点?不同点是基本事件数,一个是有限的,一个是无限的.基本事件可以抽象为点,对于几何概型,这些点尽管是无限的,但它们所占据的区域是有限的,根据等可能性,这个点落在区域的概率与该区域的几何度量成正比,而与该区域的位置和形状无关.二、统计初步与统计案例1.频率分布直方图的三个结论是什么? (1)小长方形的面积=组距×频率组距=频率.(2)各小长方形的面积之和等于1. (3)小长方形的高=频率组距,所有小长方形高的和为1组距.2.如何根据频率分布直方图计算频率、频数、样本容量? (1)频率组距×组距=频率;(2)频数样本容量=频率,此关系式的变形为频数频率=样本容量,样本容量×频率=频数.3.茎叶图的绘制需注意哪些问题?(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一; (2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据. 4.样本的数字特征有哪些?(1)众数:在样本数据中,出现次数最多的数据.(2)中位数:在样本数据中,将数据按大小顺序排列,位于最中间的数据.如果数据的个数为偶数,就取最中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即x −=1n(x 1+x 2+…+x n ).(4)方差与标准差方差:s 2=1n[(x 1-x −)2+(x 2-x −)2+…+(x n -x −)2]. 标准差:s=√1n[(x 1-x −)2+(x 2-x −)2+⋯+(x n -x −)2]. 5.怎样判断两个变量是否线性相关?(1)从散点图上看,如果这些点从整体上看大致分布在通过散点图中心的一条直线附近,称两个变量之间具有 线性相关关系 ,这条直线叫作 回归直线 .(2)相关系数:当r>0时,表明两个变量 正相关 ;当r<0时,表明两个变量 负相关 .r 的绝对值越接近于1,表明两个变量的线性相关性 越强 .r 的绝对值越接近于0时,表明两个变量之间几乎不存在线性相关关系.通常当|r|大于0.75时,认为两个变量有很强的线性相关性.6.回归直线必过的定点是哪个点?回归直线y ^=b ^x+a ^一定过样本点的中心(x −,y −).7.利用独立性检验判断表来判断“X 与Y 的关系”的注意点是什么? (1)独立性检验的关键是正确列出2×2列联表,并计算出K 2的值.(2)独立性检验是对两个变量有关系的可信程度的判断,而不是对它们是否有关系的判断.近三年统计与概率问题主要以现实生活、古代文化为背景来考查统计图表的识别,排列与组合与古典概型的交汇,二项式定理,几何概型,双图(茎叶图、频率直方图)与离散型随机变量的分布列,统计案例相结合等,呈现考点模式化与考题应用化的特点,难度中等,题目为两小一大,分值在17到20分左右.一、选择题和填空题的命题特点(一)考查古典概型、几何概型的计算,试题难度中等,综合考查事件的概率,几何图形,数学文化等知识.1.(2018年全国Ⅲ卷,文T5改编)若某超市的顾客群体中,只用现金支付的概率为0.4,既用现金支付也用非现金支付的概率为0.2,则不用现金支付的概率为( ). A .0.3 B .0.4 C .0.6 D .0.7解析▶ 由题意,不用现金支付的概率P=1-0.4-0.2=0.4. 答案▶ B(二)考查用样本估计总体,统计数据的分析,试题难度中等,综合考查对条形图,频率分布直方图,扇形统计图,折线统计图,茎叶图及统计数表的识别与数据的数字特征分析.2.(2018年全国Ⅰ卷,文T3改编)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:有以下结论:①新农村建设后,种植收入减少;②新农村建设后,其他收入增加了一倍以上; ③新农村建设后,养殖收入未变;④新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半.其中结论不正确的是( ). A .①② B .②④ C .①③ D .③④解析▶ 假设新农村建设前总收入为a ,则新农村建设后总收入为2a ,所以种植收入在新农村建设前为60%a ,新农村建设后为37%·2a ;其他收入在新农村建设前为4%·a ,新农村建设后为5%·2a ,养殖收入在新农村建设前为30%·a ,新农村建设后为30%·2a.故结论不正确的是①③. 答案▶ C3.(2019年全国Ⅱ卷,文T14改编)我国高铁发展迅速,技术先进.经统计,经停某站的高铁列车的车次与正点率之间的关系如下:正点率 0.970.980.99车次占比14 1214则经停该站高铁列车所有车次的平均正点率的估计值为 .解析▶ 由题意得,经停该站高铁列车所有车次的平均正点率的估计值为14×0.97+12×0.98+14×0.99=0.98. 答案▶ 0.984.(2016年山东卷,文T3改编)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生每周的自习时间的中位数是 .解析▶ 设自习时间的中位数为x ,则0.02×2.5+0.10×2.5+0.16×(x-22.5)=0.5,解得x=23.75.答案▶ 23.75(三)考查统计及统计案例,试题难度中等,综合考查概率与抽样方法的应用,回归分析,独立性检验等统计案例的数据分析及应用.5.(2019年全国Ⅲ卷,文T4改编)《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,若从该校学生中抽取10人进行座谈,则其中阅读过《西游记》的学生数的估计值为( ). A .5 B .6 C .7 D .8解析▶ 由题意得,100位学生中阅读过《西游记》的学生人数为90-80+60=70,70÷100=0.7.故抽取的10人中阅读过《西游记》的学生数的估计值为0.7×10=7,故选C .答案▶ C6.(2017年山东卷,理T5改编)为了研究某班学生的脚长x (单位:厘米)和身高y (单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y 与x 之间有线性相关关系,设其回归直线方程为y ^=b ^x+a ^.已知∑i=110x i =225,∑i=110y i =1600,a ^=70.该班某学生的脚长为24,据此估计其身高为( ). A .160B .163C .166D .170解析▶ ∵x −=22.5,y −=160,∴a ^=160-22.5b ^=70,∴b ^=4,∴y ^=4×24+70=166,故选C . 答案▶ C二、解答题的命题特点概率与统计综合试题一般难度不大,主要考查古典概型,用样本估计总体,利用回归方程进行预测,独立性检验的应用等.1.(2018年全国Ⅱ卷,文T18改编)如图所示的是某地区2010年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的线性回归模型.根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型:y ^=a ^+17.5t. (1)求回归直线方程;(2)求该地区2018年的环境基础设施投资额的预测值.解析▶ (1)根据题意,t −=4,y −=169,代入y ^=a ^+17.5t ,可得a ^=99,所以回归直线方程为y ^=99+17.5t.(2)该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元). 2.(2018年全国Ⅲ卷,文T18改编)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min )绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高,并说明理由.(2)求40名工人完成生产任务所需时间的中位数m ,并将完成生产任务所需时间超过m 和不超过m 的工人数填入下面的列联表:超过m不超过m第一种生产方式 第二种生产方式(3)根据(2)中的列联表,能否有99.9%的把握认为两种生产方式的效率有差异? 附:K2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d),P (K 2≥k 0) 0.050 0.010 0.001 k 03.8416.63510.828解析▶ (1)第二种生产方式效率更高.观察茎叶图可知,第二组数据集中在70 min ~80 min 之间,而第一组数据集中在80 min ~90 min 之间,故第二组生产方式效率更高.(2)由茎叶图数据得到m=80,故列联表为超过m 不超过m 第一种生产方式 15 5 第二种生产方式515(3)K 2=n(ad -bc)2(a+b)(c+d)(a+c)(b+d) =40×(15×15−5×5)220×20×20×20=10<10.828,所以没有99.9%的把握认为两种生产方式的效率有差异.1.求复杂事件的概率的方法有哪些?(1)直接法:将所求事件分解为一些彼此互斥的事件的和.(2)间接法(正难则反):判断事件A 的概率计算是否适合用间接法,而判断的标准是正向思考时分类较多,而其对立的分类较少,此时应用间接法.2.怎样在实际问题中利用样本的均值与方差做决策?均值与方差从整体和全局上刻画了随机变量,是实际生产中用于方案取舍的重要理论依据.一般先比较均值,若均值相同,再用方差来决定.3.进行分层抽样的相关计算时,什么是抽样比? (1)抽样比=样本容量总体容量=各层样本数量各层个体数量;(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比. 4.如何根据频率分布直方图估计样本的众数、中位数、平均数? (1)最高的小长方形底边中点的横坐标为众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积与小长方形底边中点的横坐标之积的总和.5.如何求回归直线方程中的系数?(1)公式法:利用公式,求出回归系数b ^,a ^.(2)待定系数法:利用回归直线过样本点中心(x −,y −)求系数. 6.利用独立性检验的思想,解决实际应用的基本步骤有哪些? (1)根据样本数据制成2×2列联表; (2)根据公式K2=n(ad -bc)2(a+b)(a+c)(c+d)(b+d),计算K 2的值;(3)查表比较K 2与临界值的大小关系,做统计判断.11概率1.(2019陕西宝鸡一模)如图所示,在边长为2的正方形中有一封闭曲线围成的阴影区域,在正方形中随机扔一粒豆子,它落在阴影区域内的概率是16,则阴影部分的面积是( ).A .16B .13C .12D .23解析▶ 根据几何概型的概率公式,可得P=S阴影S正方形,因为P=16,所以S 阴影=16×22=23.答案▶ D2.有一个游戏,其规则是甲、乙、丙、丁四个人从同一地点随机地向东、南、西、北四个方向前进,每人一个方向.事件“甲向南”与事件“乙向南”的关系为( ). A .互斥但非对立事件 B .对立事件 C .和事件是可能事件D .以上都不对解析▶ 由于每人一个方向,故“甲向南”意味着“乙向南”是不可能的,故是互斥事件,但不是对立事件,故选A . 答案▶ A3.(原创)某市一个健身房在注册会员中举行“7天健康挑战赛”,在未来连续7天中每天完成室外跑2公里,即可获得奖励.会员小李由于有事仅完成了2天,则这2天恰好为连续2天的概率为( ).A .17B .27C .13D .821解析▶ 从7天中任意选2天的所有可能事件为(1,2),(1,3),(1,4),(1,5),(1,6),(1,7),(2,3),(2,4),(2,5),(2,6),(2,7),(3,4),(3,5),(3,6),(3,7),(4,5),(4,6),(4,7),(5,6),(5,7),(6,7),共21种,其中选到连续2天的所有可能事件为(1,2),(2,3),(3,4),(4,5),(5,6),(6,7),共6种.所以在7天中能够选中连续2天的概率为621=27. 答案▶ B能力1 ▶ 求随机事件的概率【例1】 (2019湖北武汉模拟)某超市随机选取1000位顾客,记录了他们购买甲、乙、丙、丁四种商品的情况,整理成如下统计表,其中“√”表示购买,“×”表示未购买.商品顾客人数甲乙丙 丁 100 √×√√ 217 ×√ ×√200 √ √√ × 300 √ × √× 85 √×× × 98×√××(1)估计顾客同时购买乙和丙的概率;(2)估计顾客在甲、乙、丙、丁中同时购买3种商品的概率;(3)若顾客购买了甲,则该顾客同时购买乙、丙、丁中哪种商品的可能性最大?解析▶ (1)从统计表可以看出,在这1000位顾客中有200位顾客同时购买了乙和丙,所以顾客同时购买乙和丙的概率可以估计为2001000=0.2. (2)从统计表可以看出,在这1000位顾客中,有100位顾客同时购买了甲、丙、丁,另有200位顾客同时购买了甲、乙、丙,其他顾客最多购买了2种商品,所以顾客在甲、乙、丙、丁中同时购买3种商品的概率可以估计为100+2001000=0.3. (3)顾客同时购买甲和乙的概率可以估计为2001000=0.2,顾客同时购买甲和丙的概率可以估计为100+200+3001000=0.6,顾客同时购买甲和丁的概率可以估计为1001000=0.1.所以,若顾客购买了甲,则该顾客同时购买丙的可能性最大.若事件A 1、A 2、A 3、…、A n 彼此互斥,它们至少有一个发生的概率P (A 1+A 2+…+A n )=P (A 1)+P (A 2)+…+P (A n ).(2019山东德州模拟)某商场有奖销售活动中,购满100元商品得1张奖券,多购多得.1000张奖券为一个开奖单位,设特等奖1个,一等奖10个,二等奖50个.设1张奖券中特等奖、一等奖、二等奖的事件分别为A ,B ,C ,求:(1)P (A ),P (B ),P (C ); (2)1张奖券的中奖概率;(3)1张奖券不中特等奖且不中一等奖的概率. 解析▶ (1)P (A )=11000,P (B )=101000=1100,P (C )=501000=120. 故事件A ,B ,C 的概率分别为11000,1100,120. (2)1张奖券中奖包含中特等奖、一等奖、二等奖.设“1张奖券中奖”这个事件为M ,则M=A ∪B ∪C.∵A ,B ,C 两两互斥,∴P (M )=P (A ∪B ∪C )=P (A )+P (B )+P (C )=1+10+501000=611000. 故1张奖券的中奖概率为611000. (3)设“1张奖券不中特等奖且不中一等奖”为事件N ,则事件N 与“1张奖券中特等奖或中一等奖”为对立事件,∴P (N )=1-P (A ∪B )=1-(11000+1100)=9891000.故1张奖券不中特等奖且不中一等奖的概率为9891000.能力2 ▶ 求古典概型的概率【例2】 (2019年天津卷,文T15)2019年,我国施行个人所得税专项附加扣除办法,涉及子女教育、继续教育、大病医疗、住房贷款利息或者住房租金、赡养老人等六项专项附加扣除.某单位老、中、青员工分别有72,108,120人,现采用分层抽样的方法,从该单位上述员工中抽取25人调查专项附加扣除的享受情况.(1)应从老、中、青员工中分别抽取多少人?(2)抽取的25人中,享受至少两项专项附加扣除的员工有6人,分别记为A ,B ,C ,D ,E ,F.享受情况如表所示,其中“○”表示享受,“×”表示不享受.现从这6人中随机抽取2人接受采访.员工项目 A B C D E F子女教育 ○ ○ × ○ × ○继续教育 × × ○ × ○ ○ 大病医疗 × × × ○ × × 住房贷款利息 ○ ○ × × ○ ○住房租金 × × ○ × × ×赡养老人○ ○ × × × ○①试用所给字母列举出所有可能的抽取结果;②设M 为事件“抽取的2人享受的专项附加扣除至少有一项相同”,求事件M 发生的概率.解析▶ (1)由题意可得老、中、青员工人数之比为6∶9∶10, 因为采取分层抽样的方法从中抽取25位员工,所以应从老、中、青员工中分别抽取6人,9人,10人.(2)①从已知的6人中随机抽取2人的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{B,C},{B,D},{B,E},{B,F},{C,D},{C,E},{C,F},{D,E},{D,F},{E,F},共15种.②由表格知,符合题意的所有可能结果为{A,B},{A,D},{A,E},{A,F},{B,D},{B,E},{B,F},{C,E},{C,F},{D,F},{E,F},共11种,.所以事件M发生的概率P(M)=1115确定基本事件个数的方法:列举法、列表法、树状图法.(2018年天津卷,文T15)已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(1)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(2)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.①试用所给字母列举出所有可能的抽取结果;②设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.解析▶(1)由题意可得甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,因为采用分层抽样的方法从中抽取7名同学,所以应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(2)①从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E, F},{E,G},{F,G},共21种.②不妨设抽出的7名同学中,来自甲年级的是A,B,C,来自乙年级的是D,E,来自丙年级的是F,G,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A,B},{A,C},{B,C},{D,E},{F,G},共5种..所以事件M发生的概率P(M)=521能力3▶求几何概型的概率【例3】(2017年全国Ⅰ卷,文T4)如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是().A.14B.π8C.12D.π4解析▶ 不妨设正方形ABCD 的边长为2,则正方形内切圆的半径为1,S 正方形=4.由圆中的黑色部分和白色部分关于正方形的中心成中心对称,得S 黑=S 白=12S 圆=π2,所以由几何概型知所求概率P=S黑S正方形=π24=π8.故选B.答案▶ B判断几何概型中的几何度量形式的方法: (1)当题干是双重变量问题时,一般与面积有关.(2)当题干是单变量问题时,要看变量可以等可能到达的区域,若变量在线段上移动,则几何度量是长度;若变量在平面区域(空间区域)内移动,则几何度量是面积(体积),即一个几何度量的形式取决于该度量可以等可能变化的区域.(2019广东深圳一模)古希腊雅典学派算学家欧道克萨斯提出了“黄金分割”的理论,利用尺规作图可画出已知线段的黄金分割点,具体方法如下:(1)取线段AB=2,过点B 作AB 的垂线,并用圆规在垂线上截取BC=12AB ,连接AC ;(2)以C 为圆心,BC 为半径画弧,交AC 于点D ;(3)以A 为圆心,以AD 为半径画弧,交AB 于点E.则点E 即为线段AB 的黄金分割点.若在线段AB 上随机取一点F ,则使得BE ≤AF ≤AE 的概率约为( ).(参考数据:√5≈2.236)A .0.236B .0.382C .0.472D .0.618解析▶ 由勾股定理可得AC=√5,由图可知BC=CD=1,AD=AE=√5-1≈1.236,BE ≈2-1.236=0.764,则0.764≤AF ≤1.236,由几何概型中的线段型,可得使BE ≤AF ≤AE 的概率约为1.236−0.7642=0.236. 答案▶ A一、选择题1.(2019年全国Ⅱ卷,文T4改编)生物实验室有5只兔子,其中只有3只测量过某项指标,若从这5只兔子中随机取出3只,则至少有2只测量过该指标的概率为( ).A .710B .35C .25D .15解析▶ 设测量过该指标的3只兔子为a ,b ,c ,剩余的2只兔子为A ,B ,则从这5只兔子中任取3只的所有取法有{a ,b ,c },{a ,b ,A },{a ,b ,B },{a ,c ,A },{a ,c ,B },{a ,A ,B },{b ,c ,A },{b ,c ,B },{b ,A ,B },{c ,A ,B },共10种,其中至少有2只测量过该指标的取法有{a ,b ,A },{a ,b ,B },{a ,c ,A },{a ,c ,B },{b ,c ,A },{b ,c ,B },{a ,b ,c },共7种,所以至少有2只测量过该指标的概率为710,故选A .答案▶ A2.(2019安徽淮北期末)从1,3,5,7这四个数中随机取出两个数组成一个两位数,则组成的两位数是5的倍数的概率是( ). A .18B .16C .14D .12解析▶ 任取两个数可组成4×3=12个两位数,其中5的倍数有3个,故所求概率P=312=14.故选C .答案▶ C3.(原创)任取θ∈(0,π2),使得sin (π-θ)≥√3sinπ2+θ的概率为( ).A .23B .12C .13D .16解析▶ sin (π-θ)≥√3sin (π2+θ),即sin θ≥√3cos θ,即tan θ≥√3,故θ∈[π3,π2).则所求概率为π2-π3π2=13.答案▶ C4.(2019湖南湘潭模拟改编)近期中央电视台播出的《中国诗词大会》火遍全国,组委会在选拔赛中随机抽取了100名选手的成绩,按成绩分为五组,得到的频率分布表如下所示.组号 成绩 频数频率 第1组 [160,165) 0.1第2组 [165,170) ①第3组 [170,175) 20 ②第4组 [175,180) 20 0.2 第5组[180,185]100.1则频率分布表中①、②位置的相应数据分别为( ). A .40和0.4 B .40和0.2 C .20和0.2 D .20和0.4解析▶ 第1组的频数为100×0.1=10,∴①处应填的数为100-(10+20+20+10)=40.第3组的频率为20100=0.2, ∴②处应填的数为0.2.答案▶ B5.(原创)五个数组成公差为2的等差数列,他们的中位数、平均数与方差均相等,若从中任取3个不同的数,则这3个数之和能被5整除的概率为( ). A .15B .25C .35D .710解析▶ 设这五个数为a-4,a-2,a ,a+2,a+4,这组数的中位数和平均数为a ,方差为15(22+42+02+42+22)=8,故a=8,所以这五个数为4,6,8,10,12.从中任取3个不同的数共有10种不同的结果:(4,6,8),(4,6,10),(4,6,12),(4,8,10),(4,8,12),(4,10,12),(6,8,10),(6,8,12),(6,10,12),(8,10,12).其中3个数之和能被5整除的所有可能情况为(4,6,10),(8,10,12),共2种.故所求概率为210=15.答案▶ A6.(2019河南郑州一模)箱中装有6张卡片,上面分别写着如下6个定义域为R 的函数:f 1(x )=2x ,f 2(x )=2x,f 3(x )=x2,f 4(x )=sin x ,f 5(x )=cos x ,f 6(x )=1−2x1+2x ,现从箱中任取2张卡片,将卡片上的函数相乘得到一个新函数,所得新函数为奇函数的概率是( ). A .25B .35C .12D .13解析▶ f 1(x )=2x 为奇函数;f 2(x )=2x 为非奇非偶函数; f 3(x )=x 2为偶函数; f 4(x )=sin x 为奇函数; f 5(x )=cos x 为偶函数;f 6(x )=1−2x1+2x ,可得f 6(-x )=1−2-x1+2-x =-(1−2x1+2x )=-f (x ),故f 6(x )为奇函数.在6个函数中任选2个,有15种选法,要使2个函数的乘积为奇函数,必须其中1个为奇函数,另1个为偶函数,有6种选法,则所得新函数为奇函数的概率P=615=25.答案▶ A7.(2019新疆乌鲁木齐一模)《史记》中讲述了田忌与齐王赛马的故事.田忌的上等马优于齐王的中等马,劣于齐王的上等马;田忌的中等马优于齐王的下等马,劣于齐王的中等马;田忌的下等马劣于齐王的下等马.双方从各自的马匹中随机选一匹进行一场比赛,则田忌的马获胜的概率为( ).A .13B .14C .15D .16解析▶ 设齐王的上,中,下三个等次的马分别为a ,b ,c ,田忌的上,中,下三个等次的马分别为记为A ,B ,C ,从双方的马匹中随机选一匹进行一场比赛的所有的可能为Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,Ca ,Cb ,Cc ,共9种可能,根据题设其中Ab ,Ac ,Bc 是胜局,共3种可能,则田忌获胜的概率为39=13.答案▶ A8.(2019安徽合肥一模)如图,线段MN 是半径为2的圆O 的一条弦,且MN 的长为2.在圆O 内,将线段MN 绕点N 沿逆时针方向转动,使点M 移动到圆O 上的新位置,继续将线段NM 绕点M 沿逆时针方向转动,使点N 移动到圆O 上的新位置,依此顺序继续转动,点M 的轨迹所围成的区域是图中阴影部分.若在圆O 内随机取一点,则此点取自阴影部分内的概率为( ). A .4π-6√3 B .1-3√32πC .π-3√32D .3√32π解析▶阴影部分的面积S 阴=6×16(π×22)-12×2×2×√32=4π-6√3,设“在圆O 内随机取一点,则此点取自阴影部分内”为事件A ,由几何概型中的面积型可得P (A )=S阴S圆=4π-6√34π=1-3√32π. 答案▶ B9.(2019福建漳州二模)已知边长为2√3的正方形的中心为点P ,在正方形内任取一点Q ,则点Q 满足|PQ|≤2的概率为( ).A .π+3√39 B .π+3√312 C .2π+√39D .2π+√312解析▶在Rt △PAO 中,由题意可知,|PA|=2,|PO|=√3,则∠APO=π6,从而∠APB=π3,|AB|=2,则阴影部分的面积为S=12×2π3×22+12×2×√3×4=4π3+4√3,故所求概率为P=S阴S正=4π3+4√312=π+3√39.答案▶ A 二、填空题10.(2019湖北黄冈质检)已知某中学高三理科班学生的数学与物理的水平测试成绩抽样统计如下表:人 x 数y ABCA 1440 10B a36 bC28834若抽取学生n 人,成绩分为A (优秀),B (良好),C (及格)三个等级,设x ,y 分别表示数学成绩与物理成绩,例如:表中物理成绩为A 等级的共有14+40+10=64人,数学成绩为B 等级且物理成绩为C 等级的共有8人.已知x 与y 均为A 等级的概率是0.07.若a ≥7,b ≥6,则数学成绩为A 等级的人数比C 等级的人数多的概率为 .解析▶ 由题意知14n=0.07,解得n=200,由14+a+28>10+b+34得a>b+2,又a+b=30且a ≥7,b ≥6,则(a ,b )的所有可能结果为(7,23),(8,22),(9,21),…,(24,6),共18种,而a>b+2的可能结果为(17,13),(18,12),…,(24,6),共8种,则所求概率P=818=49. 答案▶4911.(2019广东佛山一模)不透明的布袋中有3个白球,2个黑球,2个红球,共7个球(除颜色外完全相同),从中随机摸出2个球,则 (1)两个球同色的情况有 种; (2)两个球不同色的概率是 .解析▶ (1)两个球同色的情况有3+1+1=5种.(2)基本事件总数n=21,两个球不同色的包含的基本事件个数m=21-5=16,∴两个球不同色的概率为1621.答案▶ (1)5 (2)1621三、解答题12.(2019安徽合肥一模)部分与整体以某种相似的方式呈现称为分形.谢尔宾斯基三角形是一种分形,由波兰数学家谢尔宾斯基于1915年提出.具体操作是取一个实心三角形,沿三角形的三边中点连线,将它分成4个小三角形,去掉中间的那一个小三角形后,对其余3个小三角形重复上述过程逐次得到各个图形,如图所示.(1)现在上述图3中随机选取一个点,求此点取自阴影部分的概率. (2)依照规律,在图4中随机选取一个点,求此点取自阴影部分的概率.解析▶ (1)设图3中1个小阴影三角形的面积为S ,则图3中阴影部分的面积为9S ,又图3中大三角形的面积为16S ,由几何概型中的面积型可得,此点取自阴影部分的概率为9S 16S =916. (2)图1的此点取自阴影部分的概率为1;图2的此点取自阴影部分的概率为34;图3的此点取自阴影部分的概率为(34)2.故可得图4的此点取自阴影部分的概率为(34)3=2764.13.(2019河北沧州模拟)长时间用手机上网会影响学生的身体健康,某校为了解A 、B 两班学生手机上网的时长,分别从这两个班中随机抽取5名同学进行调查,将他们平均每周手机上网的时长作为样本,绘制成茎叶图如图所示(图中茎表示十位数字,叶表示个位数字).(1)分别求出图中所给两组样本数据的平均值,并据此估计哪个班的学生平均每周手机上网时间较长.(2)从A班的样本数据中随机抽取一个不超过19的数据记为a,从B班的样本数据中随机抽取一个不超过21的数据记为b,求a>b的概率.(9+11+14+20+31)=17.解析▶(1)A班样本数据的平均值为15B班样本数据的平均值为1(11+12+21+25+26)=19.5由此估计B班学生每周平均手机上网时间较长.(2)A班的样本数据中不超过19的数据有3个,分别为9,11,14,B班的样本数据中不超过21的数据有3个,分别为11,12,21,故(a,b)共有9种不同情况,分别为(9,11),(9,12),(9,21),(11,11),(11,12),(11,21),(14,11),(14,12),(14,21),.其中a>b的情况有(14,11),(14,12)2种,故a>b的概率P=2912统计与统计案例1.(2019安徽黄山一模)某校高三(1)班共有48人,学号依次为1,2,3,…,48,现用系统抽样的办法抽取一个容量为6的样本.已知学号为3,11,19,35,43的同学在样本中,那么还有一个同学的学号应为().A.27B.26C.25D.24解析▶∵从48名学生从中抽取一个容量为6的样本,∴系统抽样的分段间隔为48÷6=8,∵学号为3,11,19,35,43的同学在样本中,∴抽取的另一个同学的学号应为27.答案▶ A2.(2019四川攀枝花三模)某商场一年中各月份的收入、支出情况的统计图如图所示,下列说法中正确的是().。
第5讲概率与统计[考情分析]概率与统计通过统计图、古典概型、几何概型、线性相关与线性回归方程等知识考查数据处理能力.题目设置比较注重数学与生活的结合,属于中档题,难度适中.热点题型分析热点1统计图1.一表二图(1)频率分布表——数据详实;(2)频率分布直方图——分布直观;(3)频率分布折线图——便于观察总体分布趋势.2.茎叶图(1)茎叶图适用于数据较少的情况,从中便于看出数据的分布,以及中位数、众数等;(2)个位数为叶,十位数(或百位与十位)为茎,相同的数据重复写.3.条形图条形图是用条形的长度表示各类别频数(或频率)的多少,其宽度(表示类别)则是固定的.某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数.解(1)由(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1得x=0.0075,∴直方图中x的值为0.0075.(2)月平均用电量的众数是220+2402=230.∵(0.002+0.0095+0.011)×20=0.45<0.5,∴月平均用电量的中位数在[220,240)内,设中位数为a,则(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5,解得a=224,即中位数为224.1.频率分布直方图中需要注意的几点(1)直方图与条形图不同,直方图中的纵坐标是频率组距,每个小矩形的面积为频率;条形图的纵坐标为频数或频率;(2)各组频率之和为1,即所有小矩形的面积和为1;(3)直方图中各小矩形的高度比=各组频率比=各组频数比.2.与频率分布直方图相关问题的解题模板第一步:根据频率分布直方图计算出相应的频率;第二步:运用样本频率估计总体的频率;第三步:得出结论.3.解决与茎叶图相关问题时,一要弄清茎叶图中茎与叶的含义,不要混淆;二要注意看清所有的样本数据,弄清图中的数字特点,不要漏掉数据.随着新课程改革和高考综合改革的实施,高中教学以发展学生学科核心素养为导向,学习评价更关注学科核心素养的形成和发展.为此,某市于2018年举行第一届高中数学学科素养竞赛,竞赛结束后,为了评估该市高中学生的数学学科素养,从所有参赛学生中随机抽取1000名学生的成绩(单位:分)作为样本进行估计,将抽取的成绩整理后分成五组,依次记为[50,60),[60,70),[70,80),[80,90),[90,100],并绘制成如图所示的频率分布直方图.(1)请补全频率分布直方图,并估计这1000名学生成绩的平均数(同一组数据用该组区间的中点值作代表);(2)该市决定对本次竞赛成绩排在前180名的学生给予表彰,授予“数学学科素养优秀标兵”称号,一名学生本次竞赛成绩为79分,请你判断该学生能否被授予“数学学科素养优秀标兵”称号.解 (1)成绩在[60,70)的频率为1-(0.30+0.15+0.10+0.05)=0.40,补全的频率分布直方图如图:样本的平均数x -=55×0.30+65×0.40+75×0.15+85×0.10+95×0.05=67. (2)因为1801000=0.18,所以由频率分布直方图可以估计获得“数学学科素养优秀标兵”称号学生的最低成绩为80-0.18-0.05-0.100.015=78(分).因为79>78,所以该同学能被授予“数学学科素养优秀标”称号. 热点2 概率统计1.古典概型P (A )=事件A 所包含的基本事件数基本事件总数.2.几何概型 P (A )=构成事件A 的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积).3.当事件A 与B 互斥时,满足加法公式:P (A ∪B )=P (A )+P (B ). 4.若事件A 与B 为对立事件,则P (A )=1-P (B ),即P (A )=1-P (A ).(2019·四川省成都模拟)某学校为担任班主任的教师办理手机语音月卡套餐,为了解通话时长,采用随机抽样的方法,得到该校100位班主任每人的月平均通话时长T (单位:分钟)的数据,其频率分布直方图如图所示,将频率视为概率.(1)求图中m的值;(2)估计该校担任班主任的教师月平均通话时长的中位数;(3)在[450,500),[500,550]这两组中采用分层抽样的方法抽取6人,再从这6人中随机抽取2人,求抽取的2人恰在同一组的概率.解(1)依题意,根据频率分布直方图的性质,可得:50×(m+0.0040+0.0050+0.0066+0.0016+0.0008)=1,解得m=0.0020.(2)设该校担任班主任的教师月平均通话时长的中位数为t.因为前2组的频率之和为(0.0020+0.0040)×50=0.3<0.5,前3组的频率之和为(0.0020+0.0040+0.0050)×50=0.55>0.5,所以350<t<400,由0.3+0.0050×(t-350)=0.5,得t=390.所以该校担任班主任的教师月平均通话时长的中位数为390.(3)由题意,可得在[450,500)内抽取6×0.00160.0016+0.0008=4人,分别记为a,b,c,d,在[500,550]内抽取2人,记为e,f,则6人中抽取2人的取法有:{a,b},{a,c,},{a,d},{a,e},{a,f},{b,c},{b,d},{b,e},{b,f},{c,d},{c,e},{c,f},{d,e},{d,f},{e,f},共15种等可能的取法.其中抽取的2人恰在同一组的有{a,b},{a,c},{a,d},{b,c},{b,d},{c,d},{e,f},共7种取法,所以从这6人中随机抽取的2人恰在同一组的概率P=715.求解概率与统计综合题的两点注意:(1)明确频率与概率的关系,频率可近似替代概率;(2)此类问题中的概率模型多是古典概型,在求解时,要明确基本事件的构成,并判断所述试验的所有基本事件是否为等可能的.(2019·西南名校联盟联考)某种产品的质量按照其质量指标值M进行等级划分,具体如下表:现从某企业生产的这种产品中随机抽取了100件作为样本,对其质量指标值M进行统计分析,得到如图所示的频率分布直方图.(1)记A表示事件“一件这种产品为二等品或一等品”,试估计事件A的概率;(2)已知该企业的这种产品每件一等品、二等品、三等品的利润分别为10元、6元、2元,试估计该企业销售10000件该产品的利润;(3)根据该产品质量指标值M的频率分布直方图,求质量指标值M的中位数的估计值(精确到0.01).解(1)记B表示事件“一件这种产品为二等品”,C表示事件“一件这种产品为一等品”,则事件B,C互斥,且由频率分布直方图估计P(B)=0.2+0.3+0.15=0.65,P(C)=0.1+0.09=0.19,又P(A)=P(B+C)=P(B)+P(C)=0.84,所以事件A的概率估计为0.84.(2)由(1)知,任取一件产品是一等品、二等品的概率估计值分别为0.19,0.65,故任取一件产品是三等品的概率估计值为0.16,从而10000件产品估计有一等品、二等品、三等品分别为1900,6500,1600件,故利润估计为1900×10+6500×6+1600×2=61200元.(3)因为在产品质量指标值M的频率分布直方图中,质量指标值M<90的频率为0.06+0.1+0.2=0.36<0.5,质量指标值M<100的频率为0.06+0.1+0.2+0.3=0.66>0.5,故质量指标值M的中位数估计值为90+0.5-0.360.03≈94.67.热点3线性回归分析与独立性检验1.线性回归方程方程y ^=b ^x +a ^称为线性回归方程,利用最小二乘法估计公式中的斜率和截距分别为b ^=∑n i =1x i y i -n x -y -∑n i =1x 2i-n x -2,a ^=y --b ^ x -,其中(x -,y -)是样本点的中心,且回归直线恒过该点.2.独立性检验根据2×2列联表,计算随机变量K 2=(a +b +c +d )(ad -bc )2(a +b )(c +d )(a +c )(b +d )(K 2也可以表示为χ2),当K 2>3.841时,则有95%的把握说两个事件有关;当K 2>6.635时,则有99%的把握说两个事件有关.具体参考数据如下表:1.某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:表1为了研究计算的方便,工作人员将上表的数据进行了处理,t =x -2012,z =y -5得到下表2:表2(1)求z 关于t 的线性回归方程;(2)通过(1)中的方程,求出y 关于x 的回归方程;(3)用所求回归方程预测到2022年年底,该地储蓄存款额可达多少?(附:对于线性回归方程y ^=b ^ x +a ^, 其中b ^=∑ni =1x i y i -n x -y -∑n i =1x 2i-n x -2,a ^=y --b ^ x -)解 (1)t =3,z -=2.2,∑5i =1t i z i =45,∑5i =1t 2i =55, b ^=45-5×3×2.255-5×9=1.2,a ^=z --b ^t =2.2-3×1.2=-1.4,所以z ^=1.2t -1.4.(2)将t =x -2012,z =y -5,代入z ^=1.2t -1.4, 得y -5=1.2(x -2012)-1.4,即y ^=1.2x -2410.8. (3)因为y ^=1.2×2022-2410.8=15.6,所以预测到2022年年底,该地储蓄存款额可达15.6千亿元.2.(2019·全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ).解 (1)由调查数据,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K 2的观测值k =100×(40×20-30×10)250×50×70×30≈4.762.由于4.762>3.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.1.线性回归模型是回归模型中的核心问题,判断两个变量是否线性相关及相关程度通常有两种方法:一是根据散点图直观判断;二是将相关数据代入相关系数公式求出r ,然后根据r 的大小进行判断.2.求线性回归直线的关键:一是根据公式准确计算出b ^,a ^的值;二是抓住样本点的中心(x -,y -)必在回归直线上.3.求解独立性检验问题时要注意:一是2×2列联表中的数据与公式中各个字母的对应,不能混淆;二是注意计算得到K 2之后的结论,即K 2的观测值k 越大,对应假设事件H 0成立(两类变量相互独立)的概率越小,H 0不成立的概率越大.(2018·全国卷Ⅱ)下图是某地区2000年至2016年环境基础设施投资额y (单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了y 与时间变量t 的两个线性回归模型.根据2000年至2016年的数据(时间变量t 的值依次为1,2,…,17)建立模型①:y ^=-30.4+13.5t ;根据2010年至2016年的数据(时间变量t 的值依次为1,2,…,7)建立模型②:y ^=99+17.5t .(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由.解 (1)利用模型①,该地区2018年的环境基础设施投资额的预测值为y ^=-30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为y ^=99+17.5×9=256.5(亿元). (2)利用模型②得到的预测值更可靠. 理由如下:①从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y =-30.4+13.5t 上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型y ^=99+17.5t 可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.②从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.专题作业1.(2019·合肥质检)一企业从某条生产线上随机抽取100件产品,测量这些产品的某项技术指标值x ,得到如下的频率分布表:(1)作出样本的频率分布直方图,并估计该技术指标值x 的平均数和众数; (2)若x <13或x ≥21,则该产品不合格.现从不合格的产品中随机抽取2件,求抽取的2件产品中技术指标值小于13的产品恰有1件的概率.解 (1)频率分布直方图为估计平均数为x -=12×0.02+14×0.12+16×0.34+18×0.38+20×0.10+22×0.04=17.08.由频率分布直方图,得当x ∈[17,19)时,矩形面积最大,因此估计众数为18. (2)记技术指标值x <13的2件不合格产品为a 1,a 2,技术指标值x ≥21的4件不合格产品为b1,b2,b3,b4,则从这6件不合格产品中随机抽取2件包含如下基本事件(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a1,b4),(a2,b1),(a2,b2),(a2,b3),(a2,b4),(b1,b2),(b1,b3),(b1,b4),(b2,b3),(b2,b4),(b3,b4),共15个基本事件.记抽取的2件产品中技术指标值小于13的产品恰有1件为事件M,则事件M 包含如下基本事件(a1,b1),(a1,b2),(a1,b3),(a1,b4),(a2,b1),(a2,b2),(a2,b3),(a2,b4),共8个基本事件.故抽取的2件产品中技术指标值小于13的产品恰有1件的概率为P=8 15.2.(2018·全国卷Ⅲ)某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;(2)求40名工人完成生产任务所需时间的中位数m,并将完成生产任务所需时间超过m和不超过m的工人数填入下面的列联表:(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),解(1)第二种生产方式的效率更高.理由如下:①由茎叶图可知:用第一种生产方式的工人中,有75%的工人完成生产任务所需时间至少80分钟,用第二种生产方式的工人中,有75%的工人完成生产任务所需时间至多79分钟.因此第二种生产方式的效率更高.②由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间的中位数为85.5分钟,用第二种生产方式的工人完成生产任务所需时间的中位数为73.5分钟.因此第二种生产方式的效率更高.③由茎叶图可知:用第一种生产方式的工人完成生产任务平均所需时间高于80分钟;用第二种生产方式的工人完成生产任务平均所需时间低于80分钟,因此第二种生产方式的效率更高.④由茎叶图可知:用第一种生产方式的工人完成生产任务所需时间分布在茎8上的最多,关于茎8大致呈对称分布;用第二种生产方式的工人完成生产任务所需时间分布在茎7上的最多,关于茎7大致呈对称分布,又用两种生产方式的工人完成生产任务所需时间分布的区间相同,故可以认为用第二种生产方式完成生产任务所需的时间比用第一种生产方式完成生产任务所需的时间更少,因此第二种生产方式的效率更高.(以上给出了4种理由,考生答出其中任意一种或其他合理理由均可得分.)(2)由茎叶图知m=79+81=80.列联表如下:(3)由于K2的观测值k=40×(15×15-5×5)220×20×20×20=10>6.635,所以有99%的把握认为两种生产方式的效率有差异.3.(2019·河南名校联考)某校高一年级学生全部参加了体育科目的达标测试,现从中随机抽取40名学生的测试成绩,整理数据并按分数段[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]进行分组,假设同一组中的每个数据可用该组区间的中点值代替,则得到体育成绩的折线图(如下).(1)体育成绩大于或等于70分的学生常被称为“体育良好”.已知该校高一年级有1000名学生,试估计该校高一年级中“体育良好”的学生人数;(2)为分析学生平时的体育活动情况,现从体育成绩在[60,70)和[80,90)的样本学生中随机抽取2人,求在抽取的2名学生中,至少有1人体育成绩在[60,70)的概率.解(1)由折线图,知样本中体育成绩大于或等于70分的学生有14+3+13=30(人).所以该校高一年级中,“体育良好”的学生人数大约有1000×3040=750(人).(2)设“至少有1人体育成绩在[60,70)”为事件M,记体育成绩在[60,70)的2人为A1,A2,体育成绩在[80,90)的3人为B1,B2,B3,则从这5人中随机抽取2人,所有可能的结果有10种,即(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3),(B1,B2),(B1,B3),(B2,B3).而事件M的结果有7种,即(A1,A2),(A1,B1),(A1,B2),(A1,B3),(A2,B1),(A2,B2),(A2,B3).因此事件M的概率P(M)=7 10.4.(2019·郑州模拟)社区服务是高中生社会实践活动的一个重要内容,某市某中学随机抽取了100名男生、100名女生了解他们一年参加社区服务的时间(单位:小时),按[0,10),[10,20),[20,30),[30,40),[40,50]进行统计,得到男生参加社区服务时间的频率分布表和女生参加社区服务时间的频率分布直方图如图.抽取的100名男生参加社区服务时间的频率分布表抽取的100名女生参加社区服务时间的频率分布直方图(1)完善男生参加社区服务时间的频率分布表和女生参加社区服务时间的频率分布直方图;(2)按高中综合素质评价的要求,高中生每年参加社区服务不少于20小时才为合格,根据题中的统计图表,完成抽取的这200名学生参加社区服务时间合格与性别的列联表,并判断是否有90%以上的把握认为参加社区服务时间达到合格程度与性别有关,并说明理由;(3)用这200名学生参加社区服务的时间估计全市90000名高中生参加社区服务时间的情况,并以频率作为概率.①求全市高中生参加社区服务不少于30小时的人数; ②对该市高中生参加社区服务的情况进行评价.⎝ ⎛⎭⎪⎫K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d 解 (1)由每组的频率等于每组的频数除以样本容量,知男生参加社区服务时间在[0,10)内的人数为0.05×100=5;在[10,20)内的频率为20÷100=0.2;在[20,30)内的人数为0.35×100=35;在[30,40)内的频率为30÷100=0.3;在[40,50)内的人数为100-5-20-35-30=10,频率为1-0.05-0.2-0.35-0.3=0.1.补全的频率分布表为根据频率分布直方图中各小长方形的面积的总和等于1,知女生参加社区服务时间在[20,30)内的频率为1-0.01×10-0.025×10-0.02×10-0.01×10=0.35,频率/组距为0.3510=0.035,所以补全的频率分布直方图如图.(2)完成的列联表为K 2=200×(25×65-75×35)2100×100×60×140≈2.38<2.706,所以没有90%以上的把握认为社区服务时间达到合格与性别有关.(3)①抽取的样本中社区服务不少于30小时的人数为70,频率为70200=720,所以全市高中生参加社区服务不少于30小时的概率约为720,所以全市高中生参加社区服务不少于30小时的人数约为90000×720=31500.②(可从以下角度分析,也可以从其他角度分析,角度正确,分析合理,即可给分.)a .从抽样数据可以得到全市高中生中还有一部分学生参加社区服务的时间太少,不能达到高中综合素质评价的要求.b .全市所有高中生参加社区服务的时间都偏少.c .全市高中生中,女生参加社区服务的时间比男生短.d .全市高中生参加社区服务的时间集中在10~40小时.。
概率及其计算
一、考纲解读
1.了解随机事件发生的不确定性、频率的稳定性、概率的意义、频率与概率的区别。
2.了解两个互斥事件的概率的加法公式。
3.掌握古典概型及其概率计算公式。
4.了解随机数的意义,能运用模拟方法估计概率。
5.了解几何概型的意义。
二、命题趋势探究
1.本部分为高考必考内容,在选择题、填空题和解答题中都有渗透。
2.命题设置以两种概型的概率计算及运用互斥、对立事件的概率公式为核心内容,题型及分值稳定,难度中等或中等以下.
三、知识点精讲
(一).必然事件、不可能事件、随机事件
在一定条件下:
①必然要发生的事件叫必然事件;
②一定不发生的事件叫不可能事件;
③可能发生也可能不发生的事件叫随机事件。
(二).概率
在相同条件下,做次重复实验,事件A 发生次,测得A 发生的频率为,当很大时,A 发生的频率总是在某个常数附近摆动,随着的增加,摆动幅度越来越小,这时就把这个常数叫做A 的概率,记作。
对于必然事件A ,;对于不可能事件A ,=0
(三).两个基本概型的概率公式
1、古典概型 条件:1、基本事件空间含有限个基本事件
2、每个基本事件发生的可能性相同
()(A)=()A card P A card =
Ω包含基本事件数基本事件总数 2、几何概型
条件:每个事件都可以看作某几何区域Ω的子集A ,A 的几何度量(长度、面积、体积或时间)记为A μ.
()P A =A μμΩ。
(四).互斥事件
1、互斥事件
在一次实验中不能同时发生的事件称为互斥事件。
事件A 与事件B 互斥,则()()()
P A B P A P B =+U 。
2、对立事件。