2020年高考理科数学重难点05 概率与统计(教师版)
- 格式:docx
- 大小:565.65 KB
- 文档页数:20
概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型,学习某些离散型随机变量分布列及其期望、方差等内容,初步学会利用离散型随机变量思想描述和分析某些随机现象的方法,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§11-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.6.条件概率与事件的独立性条件概率:一般的,设A 、B 为两个事件,且P (A )>0,称P (B |A )=)()(A P B A P I 为在事件A 发生的条件下,事件B 发生的概率.一般把P (B |A )读作“A 发生的条件下B 发生的概率”.在古典概型中,用n (A )表示事件A 中基本事件的个数,则有P (B |A )=)()(A n B A n I .事件的独立性:设A 、B 为两个事件,如果P (B |A )=P (B ),则称事件A 与事件B 相互独立,并称事件A 、B 为相互独立事件.若A 、B 为两个相互独立事件,则A 与A 、A 与B 、A 与B 也都相互独立.若事件A 与事件B 相互独立,则P (A ∩B )=P (A )·P (B ).【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.5.在具体情境中,了解条件概率,了解两个事件相互独立的概念及独立事件的概率乘法公式,并能解决一些简单的实际问题.【例题分析】例1(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)} 由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P(Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 一个口袋中装有大小相同的2个红球,3个黑球和4个白球,从口袋中一次摸出一个球,摸出的球不再放回.(1)连续摸球2次,求第一次摸出黑球,第二次摸出白球的概率;(2)连续摸球2次,在第一次摸到黑球的条件下,求第二次摸到白球的概率;(3)如果摸出红球,则停止摸球,求摸球次数不超过3次的概率.【分析】本题是一个古典概型问题,因为基本事件空间中所含基本事件的个数较多,宜用排列组合公式计算,当然也可利用两个计数原理计数.本题第二问是条件概率问题.做第三问时,要分为三个事件:“第一次摸到红球”,“第一次摸到不是红球,第二次摸到红球”,“前两次摸到不是红球,第三次摸到红球”,显然三个事件是互斥事件.解:(1)从袋中依次摸出2个球共有29A 种结果,第一次摸出黑球、第二次摸出白球有3×4=12种结果,则所求概率6112291==A P (或6184931=⨯=P ). (2)设“第一次摸到黑球”为事件A ,“第二次摸到白球”为事件B ,则“第一次摸到黑球,且第二次摸到白球”为事件A ∩B ,又31)(=A P ,P (A ∩B )61=,所以或⋅==213161)|(A B P (或2184)|(==A B P ). (3)第一次摸出红球的概率为1912A A ,第二次摸出红球的概率为291217A A A ,第三次摸出红球的概率为391227A A A ,则摸球次数不超过3次的概率为⋅=++=12739122729121719122A A A A A A A A P 【评析】利用古典概型求解时,求基本事件的个数和事件发生的总数时求法要一致,若无序则都无序,若有序则都有序,分子和分母的标准要相同.在求事件个数时常用列举法(画树状图、列表、坐标系法),有时也与排列组合联系紧密,计算时灵活多变,但要注意分类讨论,做到不重不漏.要正确识别条件概率问题,理解P (A),P (A ∩B ),P (B |A )的含义.例4 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例5 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }.所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.例6 如图,用A 、B 、C 三类不同的元件连结成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,已知元件A 、B 、C 正常工作的概率为0.80、0.90、0.90,分别求系统N 1、N 2正常工作的概率.【分析】三个元件能否正常工作相互独立.当元件A 、B 、C 同时正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作,而B 、C 至少有一个正常工作的概率可通过其对立事件计算.解:设元件A 、B 、C 正常工作为事件A 、B 、C ,则P (A )=0.8,P (B)=0.9,P (C)=0.9,且事件A 、B 、C 相互独立.(1)系统N 1正常工作的概率为p 1=P (A ·B ·C )=P (A )·P (B )·P (C )=0.80×0.90×0.90=0.648.(2)元件B 、C 至少有一个正常工作的概率为1-P (B ·C )=1-P (B )·P (C )=1-0.1×0.1=0.99,所以系统N 2正常工作的概率为p 2=P (A )·(1-P (B ·C ))=0.80×0.99=0.792.【评析】本题以串、并联为背景,重点在正确理解题意.在计算几个事件同时发生的概率时,要先判断各个事件之间是否相互独立.独立事件、互斥事件、对立事件的概率各有要求,要依据题目特点,巧妙地选用相关方法.例7 每次抛掷一枚质地均匀的骰子(六个面上分别标以数字1,2,3,4,5,6).(1)连续抛掷3次,求向上的点数之和为3的倍数的概率;(2)连续抛掷6次,求向上的点数为奇数且恰好出现4次的概率.【分析】向上点数之和为3的倍数共有6种情况,计数时要不重不漏;向上点数为奇数的概率为21,连续抛掷6次是独立重复试验. 解:(1)向上的点数之和为3的结果有1种情况,为6的结果共10种情况,为9的结果共25种情况,为12的结果共25种情况,为15的结果共10种情况,为18的结果共1种情况.所以⋅=⨯⨯+++++=3166611025251012P(2)因为每次抛掷骰子,向上的点数为奇数的概率为P =21, 根据独立重复试验概率公式有⋅==⋅⋅6415)21()21(24463C P 【评析】独立重复试验是一类重要的概率问题,要善于分析模型的特点,正确合理的解题.例8 某学校进行交通安全教育,设计了如下游戏,如图,一辆车模要直行通过十字路口,此时前方交通灯为红灯,且该车模前面已有4辆车模依次在同一车道上排队等候(该车道只可以直行或左转行驶).已知每辆车模直行的概率是53,左转行驶的概率是52,该路口红绿灯转换间隔时间均为1分钟.假设该车道上一辆直行去东向的车模驶出停车线需要10秒钟,一辆左转去北向的车模驶出停车线需要20秒钟,求:(1)前4辆车模中恰有2辆车左转行驶的概率;(2)该车模在第一次绿灯亮起时的1分钟内通过该路口的概率(汽车驶出停车线就算通过路口).【分析】该车模1分钟内通过路口包含2种情况:4辆车都直行,3辆车直行1辆车左转.解:(1)设前4辆车模中恰有2辆左转行驶为事件A ,则⋅=⨯=625216)52()53()(2224C A P (2)设该车在第一次绿灯亮起时的1分钟内通过该路口为事件B ,其中4辆车模均 直行通过路口为事件B 1,3辆直行1辆左转为事件B 2,则事件B 1、B 2互斥.=+=+=)()()()(2121B B P B B P B P ⋅=⨯+62529752)53()53(334444C C 【评析】善于从复杂的背景中发现线索,体会其实质.善于转化问题的叙述,恰当的分类.练习11-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.独立工作的两套报警系统遇危险报警的概率均为0.4,则遇危险时至少有一套报警系统报警的概率是( )A .0.16B .0.36C .0.48D .0.644.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题5.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.6.设每门高射炮命中飞机的概率都是0.6.今有一敌机来犯,要有99%的把握击中敌机,至少需要______门高射炮.7.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.8.一个口袋中有4个白球,2个黑球.有放回的取出3个球,如果第一次取出的是白球,则第三次取出的是黑球的概率为______;不放回的取出3个球,在第一次取出的是白球的条件下,第二次取出的是黑球的概率为______.三、解答题9.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.10.某个高中研究性学习小组共有9名学生,其中有3名男生和6名女生.在研究学习过程中,要进行两次汇报活动(即开题汇报和结题汇报),每次汇报都从这9名学生中随机选1人作为代表发言.设每人每次被选中与否均互不影响;(1)求两次汇报活动都是由小组成员甲发言的概率;(2)求男生发言次数不少于女生发言次数的概率.11.3名志愿者在10月1日至10月5日期间参加社区服务工作,若每名志愿者在这5天中任选两天参加社区服务工作,且各名志愿者的选择互不影响.求(1)这3名志愿者中在10月1日都参加社区服务工作的概率;(2)这3名志愿者中在10月1日至多有1人参加社区服务工作的概率.§11-2 概率(二)【知识要点】1.离散型随机变量及其分布列随机变量:如果随机试验的可能结果可以用一个变量X 来表示,并且X 是随着试验的结果的不同而变化的,我们把这样的变量X 叫做一个随机变量.如果随机变量X 的所有可能的取值都能一一列举出来,则称X 为离散型随机变量.离散型随机变量的分布列:设离散型随机变量X 的可能取值为x 1,x 2,…,x n ,X 取到i i ii 12+…+p n =1.离散型随机变量在某个范围取值的概率等于它取这个范围内各个值的概率和.其中0<p <1,q =1-,则称离散型随机变量服从参数为p 的二点分布.二项分布:一般的,在相同条件下重复地做n 次试验,各次试验的结果相互独立,称为n 次独立重复试验.在n 次独立重复试验中,事件A 恰好发生k 次的概率为==)(k X P k n k k n q p C -(其中p 为在一次试验中事件A 发生的概率,q =1-p ,k =0,1,…,n ).若将n次独立重复试验中事件A 发生的次数设为X ,则X 的分布列为超几何分布:一般的,设有总数为N 件的两类物品,其中一类有M 件,从所有物品中任取n 件(n ≤N ),这n 件中所含这类物品件数X 是一个离散型随机变量,它取值为m 时的概率为m C C C m X P n Nm n M N m M ≤==--0()(≤l ,其中l 为n 和M中较小的一个).我们称离散型随机变量X 的这种形式的概率分布为超几何分布,也称X 服从参数为N 、M 、n 的超几何分布.2.随机变量的数字特征及正态分布1122i i n n 了离散型随机变量的平均取值水平.称i i n i p X E xX D ⋅-=∑=21))(()(为随机变量X 的方差,它反映了离散型随机变量X 相对于期望的平均波动大小(或说离散程度),其算数平方根)(X D 为随机变量X 的标准差,记作σ (X ),方差(或标准差)越小表明X 的取值相对于期望越集中,否则越分散.均值与方差的性质:①E (aX +b )=aE (X )+b ②D (aX +b )=a 2D (X )若X 服从两点分布,则E (X )=p ,D (X )=pq ;若X ~B (n ,p ),则E (X )=np ,D (X )=npq . 正态曲线:函数),((21)(222)(+∞∝-∈=--x e x x σμσπϕ,其中μ ∈R ,σ >0)的图象为正态分布密度曲线,简称正态曲线.其特点有:①曲线位于x 轴上方,与x 轴不相交;②曲线是单峰的,关于x =μ 对称;③曲线在x =μ 处达到峰值σ2π1;④曲线与x 轴之间的面积为1;⑤当σ 一定时,曲线随着μ 的变化而沿x 轴平移;⑥当μ 一定时,曲线的形状由σ 决定.σ 越小,曲线越“瘦高”,表示总体的分布越集中;σ 越大,曲线越“矮胖”,表示总体的分布越分散.正态分布:如果对于任意实数a <b ,随机变量X 满足=≤<)(b X a P dx x ba )(ϕ⎰,则称X 的分布为正态分布;随机变量X 服从参数μ 、σ 的正态分布,记作N ~(μ ,σ 2).正态分布的三个常用数据:①P (μ -σ <X <μ +σ )=68.3%;②P (μ -2σ <X <μ +2σ )=95.4%;③P (μ -3σ <X <μ +3σ )=99.7%.【复习要求】①在对具体问题的分析中,理解取有限值的离散型随机变量及其分布列的概念,认识分布列对于刻画随机现象的重要性.②通过实例,理解超几何分布及其导出过程,并能进行简单的应用.③通过实例,理解n 次独立重复试验的模型及二项分布,并能解决一些简单的实际问题. ④通过实例,理解取有限值的离散型随机变量期望、方差的概念,能计算简单离散型随机变量的期望、方差,并能解决一些实际问题.⑤通过实际问题,认识正态分布曲线的特点及曲线所表示的意义.【例题分析】例1 一袋中装有编号为1、2、3、4、5、6的6个大小相同的小球,现从中随机取出3个球,以X 表示取出球的最大号码,(1)求X 的分布列;(2)求X >4的概率;(3)求E (X ).【分析】随机变量X 可能取的值为3、4、5、6,应用古典概型求得X 取每一个值的概率,就可以写出分布列.解:(1)随机变量X 可能取的值为3、4、5、6,且,203)4(,2011)3(362336======C C X P C X P 3624)5(C C X P ==103206==,212010)6(3625====C C X P ,所求X 的分布列为(2)==+==>)6()5()4(X P X P X P ⋅54 (3).25.5216103520342013)(=⨯+⨯+⨯+⨯=X E 【评析】离散型随机变量的分布列反映了一次试验的所有可能结果(X 的所有可能取值),以及取得每个结果(X 的每一个值)的概率.书写分布列首先要根据具体情况正确分析X 可取的所有值,然后利用排列组合及概率的有关知识求得每个x i 所对应的概率p i ,最后列成表格.要注意不同的X 值所对应的事件之间是互斥的,求离散型随机变量在某一范围的概率等于它取这个范围内各个值的概率和.例2 袋中装有大小相同的5个红球、5个白球,现从中任取4个球,其中所含红球的个数为X ,写出X 的分布列,并求X 的期望.【分析】袋中共有10个球,从中任取4个,所含红球的个数为0、1、2、3、4,每个事件的概率可以利用古典概型求解.解:随机变量X 可取的值有0、1、2、3、4,)0(=X P =,42121054104505==⋅C C C )1(=X P =215210504103515==⋅C C C ,)2(=X P 21102101004102525===⋅C C C ,===⋅4101535)3(C C C X P 21050 215=,4212105)4(4100545==⋅==C C C X P , 分布列为2424213212211420)(=⨯+⨯-+⨯+⨯+⨯=X E 【评析】本题的随机变量X 服从参数为N ,M ,n 的超几何分布,其中N =10,M =5,n =4.例3 某人练习射击,每次击中目标的概率为31. (1)用X 表示击中目标的次数.①若射击1次,求X 的分布列和期望;②若射击6次,求X 的分布列和期望;(2)若他连续射击6次,设ξ为他第一次击中目标前没有击中目标的次数,求ξ的分布列;(3)他一共只有6发子弹,若击中目标,则不再射击,否则子弹打完为止,求他射击次数η 的分布列.【分析】射击问题常被看做是独立重复试验.ξ的取值为0到6,η 的取值为1到6. 解:(1)①X 服从二点分布⋅=31)(X E ②X 服从二项分布)6,,1,0()2()1()(),1,6(~66Λ===-k C k X P B k k k ,分布列为.236)(=⨯=X E (2)ξ的取值为0到6,ξ=k (k =0,1,…,5)表示第k +1次击中目标,前k 次都没击中目标,则P (ξ=k )=)5,,1,0(31)32(.Λ=k k ,ξ=6表示射击6次都未击中目标,==)6(ξP6)2(.ξ的分布列为(3)η 的取值为1到6.η =k (k =1,2,…,5)表示第k 次时第一次击中目标,==)(k P η 6;1)2(.1=-ηk 表示前5次都没有击中目标,5)2()6(==ξP .η 的分布列为“X =k ”.在计算满足二点分布和二项分布的随机变量的期望和方差时,可直接应用公式计算.例4 甲乙两名射手在一次射击中的得分为两个相互独立的随机变量X 和Y ,且X 和Y 的分布列为计算X 和Y 【分析】先由分布列所提供的数据用期望和方差公式计算,再根据实际意义作出分析. 解:E (X )=8.85,D (X )=2.2275;E (Y )=5.6,D (Y )=10.24.由于E (X )>E (Y ),说明甲射击的平均水平比乙高;由于D (X )<D (Y ),说明甲射击的环数比较集中,发挥比较稳定,乙射击的环数比较分散,技术波动较大,不稳定,由此可以看出甲比乙的技术好.【评析】正确记忆期望和方差的公式,在分布列中,期望是每个变量乘以它所对应的概率再相加,求方差要先求期望,再作差、平方、乘以相应概率再相加.科学对待计算结果,正确分析数据所表达的实际意义.例5 设b 和c 分别是先后抛掷一枚骰子得到的点数,用随机变量ξ表示方程x 2+bx +c =0实根的个数(重根按一个计).(1)求方程x 2+bx +c =0有实根的概率;(2)求在先后两次出现的点数中有5的条件下,方程x 2+bx +c =0有实根的概率;(3)若η =2ξ+1,求ξ、η 的数学期望和方差;【分析】本题概率问题是古典概型,要分别求出事件中所含元素的个数,第一问事件“二次方程有实根”等价于“∆=b 2-4c ≥0”,b 、c 的值都取自{1,2,3,4,5,6};第二问是条件概率问题;第三问先求ξ的期望和方差,再由公式求η 的期望和方差.解:(1)由题意知:设基本事件空间为Ω,记“方程x 2+bx +c =0没有实根”为事件A ,“方程x 2+bx +c =0有且仅有一个实根”为事件B ,“方程x 2+bx +c =0有两个相异实数”为事件C ,Ω中基本事件总数为36个,A 中的基本事件总数为17个,B 中的基本事件总数为2个,C 中的基本事件总数为17个.又因为B ,C 是互斥事件,故所求概率⋅=+=+=36193617362)()(C B B P P (2)记“先后两次出现的点数中有5”为事件D ,“方程x 2+bx +c =0有实数”为事件E ,由上面分析得D P D P (,3611)(=∩367)=E ,∴⋅==117)()()|(D P E D P D E P I (Ⅱ)由题意ξ的可能取值为0,1,2,则,3617}2{,181}1{,3617}0{======&ξξξP P P 故ξ的分布列为:所以.18173617·)12(181·)11(3617·(0-0-,136172181136170222=-+-+==⨯+⨯+⨯=ξξD E 9342)12(,312)12(2==+==+=+=ξξξξηηD D D E E E 【评析】本题是一道概率的综合题,由07山东卷改编而得.在古典概型中解决条件概率问题时,概率公式是=)|(A B P )()()()(A n B A n A P B A P I I =.具有线性关系的两个随机变量的期望和方差之间的关系是b X aE b aX E +=+)()(,)()(2X D a b aX D =+.例6 (1)设两个正态分布N (μ 1,21σ)(σ 1>0)和N (μ 2,22σ)(σ 2>0)的密度函数图象如图所示.则有( )。
专题09 概率与统计1.【2020年高考全国Ⅰ卷理数】某校一个课外学习小组为研究某作物种子的发芽率y 和温度x (单位:°C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(,)(1,2,,20)i i x y i =得到下面的散点图:由此散点图,在10°C 至40°C 之间,下面四个回归方程类型中最适宜作为发芽率y 和温度x 的回归方程类型的是 A .y a bx =+ B .2y a bx =+ C .e x y a b =+D .ln y a b x =+【答案】D【解析】由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适合作为发芽率y 和温度x 的回归方程类型的是ln y a b x =+. 故选:D.【点睛】本题考查函数模型的选择,主要观察散点图的分布,属于基础题.2.【2020年高考全国II 卷理数】在新冠肺炎疫情防控期间,某超市开通网上销售业务,每天能完成1200份订单的配货,由于订单量大幅增加,导致订单积压.为解决困难,许多志愿者踊跃报名参加配货工作.已知该超市某日积压500份订单未配货,预计第二天的新订单超过1600份的概率为0.05,志愿者每人每天能完成50份订单的配货,为使第二天完成积压订单及当日订单的配货的概率不小于0.95,则至少需要志愿者A .10名B .18名C .24名D .32名【答案】B【解析】由题意,第二天新增订单数为50016001200900+-=,设需要志愿者x 名,500.95900x≥,17.1x ≥,故需要志愿者18名. 故选:B【点晴】本题主要考查函数模型的简单应用,属于基础题.3.【2020年高考全国III 卷理数】在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是 A .14230.1,0.4p p p p ==== B .14230.4,0.1p p p p ==== C .14230.2,0.3p p p p ==== D .14230.3,0.2p p p p ====【答案】B【解析】对于A 选项,该组数据的平均数为()()140.1230.4 2.5A x =+⨯++⨯=,方差为()()()()222221 2.50.12 2.50.43 2.50.44 2.50.10.65A s =-⨯+-⨯+-⨯+-⨯=;对于B 选项,该组数据的平均数为()()140.4230.1 2.5B x =+⨯++⨯=,方差为()()()()222221 2.50.42 2.50.13 2.50.14 2.50.4 1.85B s =-⨯+-⨯+-⨯+-⨯=;对于C 选项,该组数据的平均数为()()140.2230.3 2.5C x =+⨯++⨯=,方差为()()()()222221 2.50.22 2.50.33 2.50.34 2.50.2 1.05C s =-⨯+-⨯+-⨯+-⨯=;对于D 选项,该组数据的平均数为()()140.3230.2 2.5D x =+⨯++⨯=,方差为()()()()222221 2.50.32 2.50.23 2.50.24 2.50.3 1.45D s =-⨯+-⨯+-⨯+-⨯=.因此,B 选项这一组标准差最大. 故选:B.【点睛】本题考查标准差的大小比较,考查方差公式的应用,考查计算能力,属于基础题.4.【2020年高考山东】某中学的学生积极参加体育锻炼,其中有96%的学生喜欢足球或游泳,60%的学生喜欢足球,82%的学生喜欢游泳,则该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例是 A .62%B .56%C .46%D .42%【答案】C【解析】记“该中学学生喜欢足球”为事件A ,“该中学学生喜欢游泳”为事件B ,则“该中学学生喜欢足球或游泳”为事件A B +,“该中学学生既喜欢足球又喜欢游泳”为事件A B ⋅, 则()0.6P A =,()0.82P B =,()0.96P A B +=,所以()P A B ⋅=()()()P A P B P A B +-+0.60.820.960.46=+-= 所以该中学既喜欢足球又喜欢游泳的学生数占该校学生总数的比例为46%. 故选:C.【点睛】本题考查了积事件的概率公式,属于基础题.5.【2020年高考山东】信息熵是信息论中的一个重要概念.设随机变量X 所有可能的取值为1,2,,n ,且1()0(1,2,,),1ni i i P X i p i n p ===>==∑,定义X 的信息熵21()log ni i i H X p p ==-∑.A .若n =1,则H (X )=0B .若n =2,则H (X )随着1p 的增大而增大C .若1(1,2,,)i p i n n==,则H (X )随着n 的增大而增大D .若n =2m ,随机变量Y 所有可能的取值为1,2,,m ,且21()(1,2,,)j m j P Y j p p j m +-==+=,则H (X )≤H (Y ) 【答案】AC【解析】对于A 选项,若1n =,则11,1i p ==,所以()()21log 10H X =-⨯=,所以A 选项正确. 对于B 选项,若2n =,则1,2i =,211p p =-, 所以()()()121121log 1log 1H X p p p p =-⋅+-⋅-⎡⎤⎣⎦, 当114p =时,()221133log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭, 当13p 4=时,()223311log log 4444H X ⎛⎫=-⋅+⋅ ⎪⎝⎭,两者相等,所以B 选项错误. 对于C 选项,若()11,2,,i p i n n==,则()222111log log log H X n n nn n ⎛⎫=-⋅⨯=-= ⎪⎝⎭,则()H X 随着n 的增大而增大,所以C 选项正确.对于D 选项,若2n m =,随机变量Y 的所有可能的取值为1,2,,m ,且()21j m jP Y j p p +-==+(1,2,,j m =).()2222111log log mmi i i i i iH X p p p p ===-⋅=⋅∑∑ 122221222122121111log log log log m m m mp p p p p p p p --=⋅+⋅++⋅+⋅. ()H Y =()()()122221212122211111log log log m m m m m m m m p p p p p p p p p p p p -+-++⋅++⋅+++⋅+++12222122212221221121111log log log log m m m m m mp p p p p p p p p p p p ---=⋅+⋅++⋅+⋅++++由于()01,2,,2i p i m >=,所以2111i i m i p p p +->+,所以222111log log i i m ip p p +->+, 所以222111log log i i i i m ip p p p p +-⋅>⋅+, 所以()()H X H Y >,所以D 选项错误. 故选:AC【点睛】本小题主要考查对新定义“信息熵”的理解和运用,考查分析、思考和解决问题的能力,涉及对数运算和对数函数及不等式的基本性质的运用,属于难题.6.【2020年高考江苏】已知一组数据4,2,3,5,6a a -的平均数为4,则a 的值是 ▲ . 【答案】2【解析】∵数据4,2,3,5,6a a -的平均数为4 ∴4235620a a ++-++=,即2a =. 故答案为:2.【点睛】本题主要考查平均数的计算和应用,比较基础.7.【2020年高考江苏】将一颗质地均匀的正方体骰子先后抛掷2次,观察向上的点数,则点数和为5的概率是_____. 【答案】19【解析】根据题意可得基本事件数总为6636⨯=个.点数和为5的基本事件有()1,4,()4,1,()2,3,()3,2共4个. ∴出现向上的点数和为5的概率为41369P ==. 故答案为:19. 【点睛】本题考查概率的求法,考查古典概型、列举法等基础知识,考查运算求解能力,是基础题. 8.【2020年高考天津】从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为A .10B .18C .20D .36【答案】B【解析】根据直方图,直径落在区间[)5.43,5.47之间的零件频率为:()6.25 5.000.020.225+⨯=, 则区间[)5.43,5.47内零件的个数为:800.22518⨯=. 故选:B.【点睛】本题主要考查频率分布直方图的计算与实际应用,属于中等题. 9.【2020年高考天津】已知甲、乙两球落入盒子的概率分别为12和13.假定两球是否落入盒子互不影响,则甲、乙两球都落入盒子的概率为_________;甲、乙两球至少有一个落入盒子的概率为_________. 【答案】16 23【解析】甲、乙两球落入盒子的概率分别为11,23, 且两球是否落入盒子互不影响, 所以甲、乙都落入盒子概率为111236⨯=, 甲、乙两球都不落入盒子的概率为111(1)(1)233-⨯-=, 所以甲、乙两球至少有一个落入盒子的概率为23. 故答案为:16;23. 【点睛】本题主要考查独立事件同时发生的概率,以及利用对立事件求概率,属于基础题.10.【2020年高考浙江】盒中有4个球,其中1个红球,1个绿球,2个黄球.从盒中随机取球,每次取1个,不放回,直到取出红球为止.设此过程中取到黄球的个数为ξ,则(0)P ξ==_______,()E ξ=_______. 【答案】13,1 【解析】因为0ξ=对应事件为第一次拿红球或第一次拿绿球,第二次拿红球, 所以1111(0)4433P ξ==+⨯=, 随机变量0,1,2ξ=,212111211(1)434324323P ξ==⨯+⨯⨯+⨯⨯=,111(2)1333P ξ==--=,所以111()0121333E ξ=⨯+⨯+⨯=.的故答案为:1 ;1 3.【点睛】本题考查古典概型概率、互斥事件概率加法公式、数学期望,考查基本分析求解能力,属基础题.11.【2020年高考全国Ⅰ卷理数】甲、乙、丙三位同学进行羽毛球比赛,约定赛制如下:累计负两场者被淘汰;比赛前抽签决定首先比赛的两人,另一人轮空;每场比赛的胜者与轮空者进行下一场比赛,负者下一场轮空,直至有一人被淘汰;当一人被淘汰后,剩余的两人继续比赛,直至其中一人被淘汰,另一人最终获胜,比赛结束.经抽签,甲、乙首先比赛,丙轮空.设每场比赛双方获胜的概率都为12,(1)求甲连胜四场的概率;(2)求需要进行第五场比赛的概率;(3)求丙最终获胜的概率.【解析】(1)甲连胜四场的概率为116.(2)根据赛制,至少需要进行四场比赛,至多需要进行五场比赛.比赛四场结束,共有三种情况:甲连胜四场的概率为116;乙连胜四场的概率为116;丙上场后连胜三场的概率为18.所以需要进行第五场比赛的概率为11131161684 ---=.(3)丙最终获胜,有两种情况:比赛四场结束且丙最终获胜的概率为18.比赛五场结束且丙最终获胜,则从第二场开始的四场比赛按照丙的胜、负、轮空结果有三种情况:胜胜负胜,胜负空胜,负空胜胜,概率分别为116,18,18.因此丙最终获胜的概率为11117 8168816+++=.12.【2020年高考全国Ⅰ卷理数】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(x i,y i)(i=1,2,…,20),其中x i和y i分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160i ix==∑,2011200i i y ==∑,2021)8(0ii x x =-=∑,2021)9000(i i y y =-=∑,201)()800(i i i y y x x =--=∑.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(x i ,y i ) (i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数)()(iinx y r x y --=∑1.414≈.【解析】(1)由已知得样本平均数20160120i iy y===∑,从而该地区这种野生动物数量的估计值为60×200=12000. (2)样本(,)i i x y (1,2,,20)i =的相关系数20)()0.94(iix y y x r --===≈∑.(3)分层抽样:根据植物覆盖面积的大小对地块分层,再对200个地块进行分层抽样.理由如下:由(2)知各样区的这种野生动物数量与植物覆盖面积有很强的正相关.由于各地块间植物覆盖面积差异很大,从而各地块间这种野生动物数量差异也很大,采用分层抽样的方法较好地保持了样本结构与总体结构的一致性,提高了样本的代表性,从而可以获得该地区这种野生动物数量更准确的估计.13.【2020年高考全国III 卷理数】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天): 锻炼人次(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表); (3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?附:K 2【解析】(1)由所给数据,该市一天的空气质量等级为1,2,3,4的概率的估计值如下表:(2)一天中到该公园锻炼的平均人次的估计值为1(100203003550045)350100⨯+⨯+⨯=. (3)根据所给数据,可得22⨯列联表:根据列联表得22100(3382237) 5.82055457030K ⨯⨯-⨯=≈⨯⨯⨯.由于5.820 3.841>,故有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关.14.【2020年高考山东】为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了100天空气中的PM2.5和2SO 浓度(单位:3μg/m ),得下表:(1)估计事件“该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150”的概率; (2)根据所给数据,完成下面的22⨯列联表:(3)根据(2)中的列联表,判断是否有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关?附:22()()()()()n ad bc K a b c d a c b d -=++++,【解析】(1)根据抽查数据,该市100天的空气中PM2.5浓度不超过75,且2SO 浓度不超过150的天数为32186864+++=,因此,该市一天空气中PM2.5浓度不超过75,且2SO 浓度不超过150的概率的估计值为640.64100=. (2)根据抽查数据,可得22⨯列联表:(3)根据(2)的列联表得2100(64101610)7.48480207426K ⨯⨯-⨯=≈⨯⨯⨯.由于7.484 6.635>,故有99%的把握认为该市一天空气中PM2.5浓度与2SO 浓度有关.15.【2020年高考北京】某校为举办甲、乙两项不同活动,分别设计了相应的活动方案:方案一、方案二.为了解该校学生对活动方案是否支持,对学生进行简单随机抽样,获得数据如下表:假设所有学生对活动方案是否支持相互独立.(Ⅰ)分别估计该校男生支持方案一的概率、该校女生支持方案一的概率;(Ⅱ)从该校全体男生中随机抽取2人,全体女生中随机抽取1人,估计这3人中恰有2人支持方案一的概率;(Ⅲ)将该校学生支持方案的概率估计值记为0p ,假设该校年级有500名男生和300名女生,除一年级外其他年级学生支持方案二的概率估计值记为1p ,试比较0p 与1p 的大小.(结论不要求证明) 【解析】(Ⅰ)该校男生支持方案一的概率为2001200+4003=,该校女生支持方案一的概率为3003300+1004=;(Ⅱ)3人中恰有2人支持方案一分两种情况,(1)仅有两个男生支持方案一,(2)仅有一个男生支持方案一,一个女生支持方案一,所以3人中恰有2人支持方案一概率为:2121311313()(1)()(1)3433436C -+-=; (Ⅲ)01p p <【点睛】本题考查利用频率估计概率、独立事件概率乘法公式,考查基本分析求解能力,属基础题.1.【2020·广东省高三二模】高二某班共有45人,学号依次为1、2、3、…、45,现按学号用系统抽样的办法抽取一个容量为5的样本,已知学号为6、24、33的同学在样本中,那么样本中还有两个同学的学号应为 A .15,43 B .15,42C .14,43D .14,42【答案】B【解析】由题可知,该班共有45人,按学号用系统抽样的办法抽取一个容量为5的样本, 则抽到的每个同学的学号之间的间隔为:4595=, 而已知学号为6、24、33的同学在样本中,即抽到的第一个学号为6,则第二个学号为:6+9=15, 第三个学号为:15+9=24,则第四个学号为:24+9=33, 第五个学号为:33+9=42,所以样本中还有两个同学的学号应为:15,42. 故选:B.2.【2020·黑龙江省大庆实验中学高三月考(理)】设不等式组00x y x +≥⎧⎪⎨-≤⎪⎩表示的平面区域为Ω,若从圆C :224x y +=的内部随机选取一点P ,则P 取自Ω的概率为A .524B .724C .1124D .1724【答案】B【解析】作出Ω中在圆C 内部的区域,如图所示,因为直线0x y +=,0x -=的倾斜角分别为34π,6π,所以由图可得P取自Ω的概率为37 46224πππ-=.故选:B【点睛】本小题主要考查几何概型的计算,考查线性可行域的画法,属于基础题.3.【2020·河南省高三三模】“二进制”来源于我国古代的《易经》,该书中有两类最基本的符号:“─”和“﹣﹣”,其中“─”在二进制中记作“1”,“﹣﹣”在二进制中记作“0”.如符号“☱”对应的二进制数011(2)化为十进制的计算如下:011(2)=0×22+1×21+1×20=3(10).若从两类符号中任取2个符号进行排列,则得到的二进制数所对应的十进制数大于2的概率为A.12B.13C.23D.14【答案】D【解析】根据题意,不同符号可分为三类:第一类:由两个“─”组成,其二进制为:11(2)=3(10);第二类:由两个“﹣﹣“组成,其二进制为:00(2)=0(10);第三类:由一个“─”和一个“﹣﹣”组成,其二进制为:10(2)=2(10),01(2)=1(10),所以从两类符号中任取2个符号排列,则组成不同的十进制数为0,1,2,3,则得到的二进制数所对应的十进制数大于2的概率P14 =.故选:D.【点睛】本题主要考查了古典概型及其概率的计算,以及转化的应用,意在考查学生的计算能力和应用能力,属于中档试题.4.【2020·河南省高三三模】随着2022年北京冬奥会临近,中国冰雪产业快速发展,冰雪运动人数快速上升,冰雪运动市场需求得到释放,将引领户外用品行业市场增长.下面是2012年至2018年中国雪场滑雪人次(万人次)与同比增长率的统计图,则下面结论中不正确的是A .2013年至2018年,中国雪场滑雪人次逐年增加B .2013年至2015年,中国雪场滑雪人次和同比增长率均逐年增加C .2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等,所以同比增长人数也近似相等D .2018年与2016年相比,中国雪场滑雪人次增长率约为30.5% 【答案】C【解析】由2012年至2018年中国雪场滑雪人次(万人次)与同比增长率的统计图,得:对于A ,2013年至2018年,中国雪场滑雪人次逐年增加,故A 正确;对于B ,2013年至2015年,中国雪场滑雪人次和同比增长率均逐年增加,故B 正确; 对于C ,2018年与2013年相比,中国雪场滑雪人次的同比增长率近似相等, 但是同比增长人数也不相等,2018年比2013年增长人数多,故C 错误; 对于D ,2018年与2016年相比,中国雪场滑雪人次增长率约为:19701510100%30.5%1510-⨯≈.故D 正确.故选:C .【点睛】本题考查统计图表的应用,考查学生的数据分析能力,属于基础题.5.【2020·山东省邹城市第一中学高三其他】2020年初,新型冠状病毒(19COVID -)引起的肺炎疫情爆发以来,各地医疗机构采取了各种针对性的治疗方法,取得了不错的成效,某地开始使用中西医结合方法后,每周治愈的患者人数如下表所示:由表格可得y 关于x 的二次回归方程为2ˆ6yx a =+,则此回归模型第4周的残差(实际值与预报值之差)为 A .5 B .4C .1D .0【答案】A【解析】设2t x =,则()11491625115t =++++=,()12173693142585y =++++= 586118a =-⨯=-,所以2ˆ68yx =-.令4x =,得2444936485ˆe y y =-=-⨯+=. 故选:A6.【2020·四川省绵阳南山中学高三一模】从标号分别为1、2、3、4、5的5张标签中随机抽取一张,放回后再随机抽取一张,则抽得的第一张标签的标号与第二张标签的标号恰好相差1的概率为 A .45 B .25C .425D .825【答案】D【解析】从标号分别为1、2、3、4、5的5张标签中随机抽取一张,放回后再随机抽取一张, 所有的基本事件数为2525=,其中,事件“抽得的第一张标签的标号与第二张标签的标号恰好相差1”所包含的基本事件有:()1,2、()2,1、()2,3、()3,2、()3,4、()4,3、()4,5、()5,4,共8种情况,因此,所求事件的概率为825P =. 故选:D.【点睛】本题考查利用古典概型的概率公式求事件的概率,一般利用列举法列举出基本事件,考查计算能力,属于基础题.7.【2020·四川省阆中中学高三其他】中国古代十进制的算筹计数法,在数学史上是一个伟大的创造,算筹实际上是一根根同长短的小木棍.如图,是利用算筹表示数1-9的一种方法.例如:3可表示为“≡”,26可表示为“=⊥”,现有6根算筹,据此表示方法,若算筹不能剩余,则可以用1-9这9个数字表示两位数中,能被3整除的概率是A .518B .718C .716D .516【答案】D【解析】1根算筹只能表示1,2根根算筹可以表示2和6,3根算筹可以表示3和7,4根算筹可以表示4和8,5根算筹可以表示5和9,因此6根算筹表示的两位数有15,19,51,91,24,28,64,68,42,82,46,86,37,33,73,77共16个,其中15,51,24,42,33共5个可以被3整除, 所以所求概率为516P =. 故选:D .【点睛】本题考查古典概型,考查中国古代数学文化,解题关键是用列举法写出6根算筹所能表示的两位数.8.【2020·山西省高三月考】勒洛三角形是具有类似圆的“定宽性”的曲线,它是由德国机械工程专家、机构运动学家勒洛首先发现,其作法是:以等边三角形每个顶点为圆心,以边长为半径,在另两个顶点间作一段弧,三段弧围成的曲边三角形就是勒洛三角形.如图中的两个勒洛三角形,它们所对应的等边三角形的边长比为1:3,若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率是A .13 BC .19D 【答案】C【解析】设图中的小的勒洛三角形所对应的等边三角形的边长为a ,则小勒洛三角形的面积2221(32642a a S a ππ=⨯-⨯=, 因为大小两个勒洛三角形,它们所对应的等边三角形的边长比为1:3,所以在勒洛三角形的面积为2S ==若从大的勒洛三角形中随机取一点,则此点取自小勒洛三角形内的概率为1219S S P ==, 故选:C【点睛】此题考查概率与几何概型、平面图形等知识,考查阅读能力和数学计算能力,属于中档题. 9.【2020·山东省邹城市第一中学高三其他】下列命题中假命题是 A .若随机变量ξ服从正态分布()21,N σ,()40.79P ξ≤=,则()20.21P ξ≤-=;B .已知直线l ⊥平面α,直线//m 平面β,则“//αβ”是“l m ⊥”的必要不充分条件;C .若//a b ,则a 在b 方向上的正射影的数量为aD .命题:0,1∃<->x p x e x 的否定:0,1⌝∀≥-≤x p x e x 【答案】BCD【解析】对于A ,随机变量ξ服从正态分布()21,N σ,所以图像关于1x =对称,根据()40.79P ξ≤=, 可得()()4140.21p p ξξ≥=-≤=,所以()()240.21P p ξξ≤-=≥=,故A 正确; 对于B ,直线l ⊥平面α,直线//m 平面β,若//αβ,则l m ⊥是真命题;若l m ⊥,则//αβ是假命题, 所以“//αβ”是“l m ⊥”的充分不必要条件,故B 错误;对于C ,若//a b ,则a 在b 方向上的正射影的数量为a 或a -,故C 错误; 对于D ,命题:0,1∃<->xp x e x 的否定:0,1xp x e x ⌝∀<-≤,故D 错误; 故选:BCD【点睛】本题主要考查了正态分布概率的性质、充分性与必要性的定义、向量数量积的几何意义、特称命题的否定变换原则,属于基础题.10.【2020·上海高三二模】某社区利用分层抽样的方法从140户高收入家庭、280户中等收入家庭、80户低收入家庭中选出100户调查社会购买力的某项指标,则中等收入家庭应选________户.【答案】56【解析】该社区共有14028080500++=户,利用分层抽样的方法, 中等收入家庭应选28010056 500⨯=户,故答案为:56.【点睛】本题考查分层抽样,注意抽取比例是解决问题的关键,属于基础题.11.【2020·辽河油田第三高级中学高三三模】辊子是客家传统农具,南方农民犁开田地后,仍有大的土块.农人便用六片叶齿组成辊轴,两侧装上木板,人跨开两脚站立,既能掌握平衡,又能增加重量,让牛拉动辊轴前进,压碎土块,以利于耕种.这六片叶齿又对应着菩萨六度,即布施、持戒、忍辱、精进、禅定与般若.若甲、乙每人依次有放回地从这六片叶齿中随机取一片,则这两人选的叶齿对应的“度”相同的概率为______.【答案】1 6【解析】记布施,持戒,忍辱,精进,禅定,般若分别为a,b,c,d,e,f,则基本事件有(),a a,(),a b,(),a c,(),a d,(),a e,(),a f,(),b a,(),b b,(),b c,(),b d,(),b e,(),b f,(),c a,(),c b,(),c c,(),c d,(),c e,(),c f,(),d a,(),d b,(),d c,(),d d,(),d e,(),d f,(),e a,(),e b,(),e c,(),e d,(),e e,(),e f,(),f a,(),f b,(),f c,(),f d,(),f e,(),f f,共36个,其中符合条件的有6个,故所求概率61366P==.故答案为1 6 .12.【2020·辽宁省沈阳二中高三其他】为迎接2022年冬奥会,北京市组织中学生开展冰雪运动的培训活动,并在培训结束后对学生进行了考核.记X 表示学生的考核成绩,并规定85X ≥为考核优秀.为了了解本次培训活动的效果,在参加培训的学生中随机抽取了30名学生的考核成绩,并作成如下茎叶图:(Ⅰ)从参加培训的学生中随机选取1人,请根据图中数据,估计这名学生考核优秀的概率; (Ⅰ)从图中考核成绩满足[]80,89X ∈的学生中任取2人,求至少有一人考核优秀的概率; (Ⅰ)记()P a X b ≤≤表示学生的考核成绩在区间[],a b 的概率,根据以往培训数据,规定当8510.510x P ⎛-⎫≤≥ ⎪⎝⎭时培训有效.请根据图中数据,判断此次中学生冰雪培训活动是否有效,并说明理由. 【答案】(Ⅰ)730(Ⅰ)35(Ⅰ)见解析【解析】(Ⅰ)设这名学生考核优秀为事件A ,由茎叶图中的数据可以知道,30名同学中,有7名同学考核优秀, 所以所求概率()P A 约为730(Ⅰ)设从图中考核成绩满足[]80,89X ∈的学生中任取2人, 至少有一人考核成绩优秀为事件B ,因为表中成绩在[]80,89的6人中有2个人考核为优,所以基本事件空间Ω包含15个基本事件,事件B 包含9个基本事件, 所以93()155P B == (Ⅰ)根据表格中的数据,满足85110x -≤的成绩有16个, 所以8516810.5103015x P ⎛-⎫≤==>⎪⎝⎭所以可以认为此次冰雪培训活动有效.13.【2020·重庆高三月考】某市积极贯彻落实国务院《“十三五”节能减排综合工作方案》,空气质量明显改善.该市生态环境局统计了某月(30天)空气质量指数,绘制成如下频率分布直方图.已知空气质量等级与空气质量指数对照如下表:(1)根据频率分布直方图估计,在这30天中,空气质量等级为优或良的天数;(2)根据体质检查情况,医生建议:当空气质量指数高于90时,市民甲不宜进行户外体育运动;当空气质量指数高于70时,市民乙不宜进行户外体育运动(两人是否进行户外体育运动互不影响).①从这30天中随机选取2天,记乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数为X,求X的分布列和数学期望;②以该月空气质量指数分布的频率作为以后每天空气质量指数分布的概率(假定每天空气质量指数互不影响),甲、乙两人后面分别随机选择3天和2天进行户外体育运动,求甲恰有2天,且乙恰有1天不宜进行户外体育运动的概率.【答案】(1)28天;(2)①分布列见解析,25;②56750000.【解析】(1)由频率分布直方图可得,空气质量指数在(]90,110的天数为2天,所以估计空气质量指数在(]90,100的天数为1天,故在这30天中空气质量等级属于优或良的天数为28天.(2)①在这30天中,乙不宜进行户外体育运动,且甲适宜进行户外体育运动的天数共6天,∴()224230920145C P X C ===,()11624230481145C C P X C ⋅===,()262301229C P X C ===, ∴X 的分布列为∴9248()012145145295E X =⨯+⨯+⨯=. ②甲不宜进行户外体育运动的概率为110,乙不宜进行户外体育运动的概率为310,∴2223219375671010101050000P C C ⎛⎫=⋅⋅⋅⋅⋅=⎪⎝⎭. 【点睛】此题考查离散型随机变量的分布列及期望的求法,频率分布表的应用,属于中档题.14.【2020·东莞市光明中学高三月考】某土特产超市为预估2020年元旦期间游客购买土特产的情况,对2019年元旦期间的90位游客购买情况进行统计,得到如下人数分布表.(1)根据以上数据完成22⨯列联表,并判断是否有95%的把握认为购买金额是否少于60元与性别有关.(2)为吸引游客,该超市推出一种优惠方案,购买金额不少于60元可抽奖3次,每次中奖概率为p (每次抽奖互不影响,且p 的值等于人数分布表中购买金额不少于60元的频率),中奖1次减5元,中奖2次减10元,中奖3次减15元.若游客甲计划购买80元的土特产,请列出实际付款数X (元)的分布列并求其数学期望.附:参考公式和数据:()()()()()22n ad bc K a b c d a c b d -=++++,n a b c d =+++.附表:【答案】(1)见解析,有95%的把握认为购买金额是否少于60元与性别有关.(2)分布列见解析,数学期望75【解析】(1)22⨯列联表如下:()22901220401814405 3.84130605238247K ⨯⨯-⨯==>>⨯⨯⨯,因此有95%的把握认为购买金额是否少于60元与性别有关. (2)X 可能取值为65,70,75,80,且10201903p +==. ()3331165327P X C ⎛⎫=== ⎪⎝⎭,()22312270339P X C ⎛⎫==⨯= ⎪⎝⎭, ()21312475339P X C ⎛⎫==⨯⨯= ⎪⎝⎭,()3032880327P X C ⎛⎫=== ⎪⎝⎭, 所以X 的分布列为6570758075279927EX =⨯+⨯+⨯+⨯=. 15.【2020·山东省邹城市第一中学高三其他】为了提高生产线的运行效率,工厂对生产线的设备进行了技术改造.为了对比技术改造后的效果,采集了生产线的技术改造前后各20次连续正常运行的时间长度(单位:天)数据,并绘制了如下茎叶图:。
第1讲概率、随机变量及其分布[做小题——激活思维]1.若随机变量X的分布列如表所示,E(X)=1.6,则a-b=() X0123P0。
1a b0.1A.0.2C.0.8 D.-0。
8B[由0。
1+a+b+0。
1=1,得a+b=0。
8,又由E(X)=0×0.1+1×a+2×b+3×0。
1=1。
6,得a+2b=1.3,解得a=0。
3,b=0.5,则a-b=-0。
2。
]2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0。
5,两个路口连续遇到红灯的概率为0.4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( ) A.0。
6 B.0.7C.0。
8 D.0。
9C[记“第一个路口遇到红灯”为事件A,“第二个路口遇到红灯"为事件B,则P(A)=0。
5,P(AB)=0.4,则P(B|A)=错误!=0。
8,故选C。
]3.两个实习生每人加工一个零件,加工为一等品的概率分别为错误!和错误!,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )A.错误!B.错误!C.错误!D.错误!B[设事件A:甲实习生加工的零件为一等品;事件B:乙实习生加工的零件为一等品,且A,B相互独立,则P(A)=错误!,P(B)=错误!,所以这两个零件中恰有一个一等品的概率为P(A错误!)+P(错误!B)=P(A)P(错误!)+P(错误!)P(B)=错误!×错误!+错误!×错误!=错误!.]4.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=错误!,则P(Y≥1)=( )A。
错误!B。
错误!C.错误!D.1C[∵X~B(2,p),∴P(X≥1)=1-P(X=0)=1-C错误!(1-p)2=错误!,解得p=错误!,∴P(Y≥1)=1-P(Y=0)=1-C错误!(1-p)4=1-错误!=错误!,故选C.]5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X为取得红球的次数,则X的方差D(X)的值为________.错误![因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为错误!,连续取4次(做4次试验),X为取得红球(成功)的次数,则X~B错误!,∴D(X)=4×35×错误!=错误!.]6.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.(附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0.682 7,P(μ-2σ<X<μ+2σ)=0.954 5)0。
专题5.2概率与统计(专题训练卷)一、单选题一、选择题1.(2018·海林市朝鲜族中学高二单元测试)下列说法正确的有( )①概率是频率的稳定值,频率是概率的近似值;②一次试验中不同的基本事件不可能同时发生;③任意事件A发生的概率P(A)总满足0<P(A)<1;④若事件A的概率趋近于0,即P(A)→0,则事件A是不可能事件.A.0个B.1个C.2个D.3个【答案】C【解析】频率是较少数据统计的结果,是一种具体的趋势和规律.在大量重复试验时,频率具有一定的稳定性,总在某个常数附近摆动,且随着试验次数的不断增加,这种摆动幅度越来越小,这个常数叫做这个事件的概率.∴随机事件A的概率是频率的稳定值,频率是概率的近似值.∴①正确.∵基本事件的特点是任意两个基本事件是互斥的,∴一次试验中,不同的基本事件不可能同时发生.∴②正确.∵必然事件的概率为1,不可能事件的概率为0,随机事件的概率大于0,小于1,∴任意事件A发生的概率P (A)满足0≤P(A)≤1,∴③错误.若事件A的概率趋近于0,则事件A是小概率事件,∴④错误.∴说法正确的有两个,故选:C.2.(2019·全国高考真题(文))两位男同学和两位女同学随机排成一列,则两位女同学相邻的概率是()A.16B.14C.13D.12【答案】D【解析】两位男同学和两位女同学排成一列,因为男生和女生人数相等,两位女生相邻与不相邻的排法种数相同,所以两位女生相邻与不相邻的概率均是12.故选D.3.(2018·全国高考真题(理))某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【答案】A【解析】设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C项正确;+=>,所以超过了经济新农村建设后,养殖收入与第三产业收入的综合占经济收入的30%28%58%50%收入的一半,所以D正确;故选A.4.(2014·山东高考真题(理))为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A .6B .8C .12D .18【答案】C【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.5.(2019·湖北襄阳四中高三月考(文))如图是调查某学校高三年级男女学生是否喜欢数学的等高条形图,阴影部分的高表示喜欢数学的频率.已知该年级男生女生各500名(所有学生都参加了调查),现从所有喜欢数学的同学中按分层抽样的方式抽取32人,则抽取的男生人数为A.16B.32C.24D.8【答案】C【解析】由等高条形图可知:喜欢数学的女生和男生的比为1:3,所以抽取的男生数为24人.故选C . 6.(2019·上海市复兴高级中学高二期末)在一次数学测试中,高一某班50名学生成绩的平均分为82,方差为8.2,则下列四个数中不可能是该班数学成绩的是( ) A.60 B.70 C.80 D.100【答案】A【解析】当60为该班某学生的成绩时,则()26082484-=,则214849.6850s >⨯= 与方差为8.2矛盾 ∴60不可能是该班成绩 故选:A7.(2019·吉林高二期末(理))甲、乙同时参加某次法语考试,甲、乙考试达到优秀的概率分别为0.6,0.7,两人考试相互独立,则甲、乙两人都未达到优秀的概率为( ) A.0.42 B.0.12C.0.18D.0.28【答案】B【解析】所求概率为()()10.610.70.12-⨯-=.故选B.8.(2019·安徽高一期末(文))某人射击一次,设事件A :“击中环数小于4”;事件B :“击中环数大于4”;事件C :“击中环数不小于4”;事件D :“击中环数大于0且小于4”,则正确的关系是( ) A .A 和B 为对立事件 B .B 和C 为互斥事件 C .C 与D 是对立事件 D .B 与D 为互斥事件【答案】D【解析】由题意,A 项中,事件“击中环数等于4环”可能发生,所以事件A 和B 为不是对立事件; B 项中,事件B 和C 可能同时发生,所以事件B 和C 不是互斥事件;C 项中,事件“击中环数等于0环”可能发生,所以事件C 和D 为不是对立事件;D 项中,事件B :“击中环数大于4”与事件D :“击中环数大于0且小于4”,不可能同时发生,所以B 与D 为互斥事件,故选D.9.(2019·全国高考真题(文))生物实验室有5只兔子,其中只有3只测量过某项指标,若从这5只兔子中随机取出3只,则恰有2只测量过该指标的概率为( )A .23 B .35 C .25D .15【答案】B【解析】设其中做过测试的3只兔子为,,a b c ,剩余的2只为,A B ,则从这5只中任取3只的所有取法有{,,},{,,},{,,},{,,},{,,},{,,}a b c a b A a b B a c A a c B a A B ,{,c,},{,c,},{b,,},{c,,}b A b B A B A B 共10种.其中恰有2只做过测试的取法有{,,},{,,},{,,},{,,},a b A a b B a c A a c B {,c,},{,c,}b A b B 共6种, 所以恰有2只做过测试的概率为63105=,选B . 10.(2017·全国高一课时练习)对空中飞行的飞机连续射击两次,每次发射一枚炮弹,设A ={两次都击中飞机},B ={两次都没击中飞机},C ={恰有一弹击中飞机},D ={至少有一弹击中飞机},下列关系不正确的是( ) A.A ⊆D B.B ∩D =∅ C.A ∪C =DD.A ∪C =B ∪D【答案】D【解析】事件C “恰有一弹击中飞机”包含两种情况:一种是第一枚击中第二枚没中,第二种是第一枚没中第二枚击中.事件D“至少有一弹击中”包含两种情况:一种是恰有一弹击中,一种是两弹都击中. 对于选项A,事件A 包含在事件D 中,故A 正确.对于选项B,由于事件B,D 不能同时发生,故B ∩D =∅正确. 对于选项C,由题意知正确.对于选项D,由于A ∪C =D ={至少有一弹击中飞机},不是必然事件;而B ∪D 为必然事件,所以A ∪C ≠B ∪D .故D 不正确. 选D.11.(2019·湖北高考模拟(理))设同时抛掷两个质地均匀的四面分别标有1,2,3,4的正四面体一次.记事件A ={第一个四面体向下的一面出现偶数};事件B ={第二个四面体向下的一面出现奇数};C ={两个四面体向下的一面或者同时出现奇数或者同时出现偶数}.给出下列说法: ①()()()P A P B P C ==; ②()()()P AB P AC P BC ==; ③1()8P ABC =; ④1()()()8P A P B P C =, 其中正确的有( ) A.0个 B.1个C.2个D.3个【答案】D 【解析】111(),(),()222P A P B P C ===故①④对, 111111111(),(),()224224224P AB P AC P BC =⨯==⨯==⨯=故②对,事件,,A B C 不可能同时发生,()0P ABC =,故③错 故选:D.12.(2019·湖北高二月考)如图所示茎叶图记录了甲乙两组各5名同学的数学成绩甲组成绩中有一个数据模糊,无法确认,在图中以X 表示若两个小组的平均成绩相同,则下列结论正确的是( )A.2X =,22S S <甲乙 B.2X =,22S S >甲乙C.6X =,22S S <甲乙 D.6X =,2,22S S >甲乙【答案】A【解析】∵两个小组的平均成绩相同,∴8072747463X +++++8183706566=++++, 解得:2X =,由茎叶图中的数据可知,甲组的数据都集中在72附近,而乙组的成绩比较分散,∴根据数据分布集中程度与方差之间的关系可得22S S <甲乙,故选:A . 二、填空题13.(2019·河北高一期末)某公司当月购进A 、B 、C 三种产品,数量分别为2000、3000、5000,现用分层抽样的方法从A 、B 、C 三种产品中抽出样本容量为n 的样本,若样本中A 型产品有20件,则n 的值为_______. 【答案】100.【解析】在分层抽样中,每层抽样比和总体的抽样比相等,则有202000200030005000n=++, 解得100n =,故答案为:100.14.(2019·上海曹杨二中高三期中)有5条线段,其长度分别为3,4,5,7,9,现从中任取3条,则能构成三角形的概率是_____. 【答案】35【解析】从5条线段中任取3条,共有3510C =种情况,其中,能构成三角形的有:3,4,5; 3,5,7; 3,7,9; 4,5,7; 4,7,9; 5,7,9. 共6种情况; 即能构成三角形的概率是63=105,故答案为:3515.(2019·湖北高三月考(理))在一段线路中有4个自动控制的常用开关A 、B 、C 、D,如图连接在一起,假定在2019年9月份开关A,D 能够闭合的概率都是0.7,开关B,C 能够闭合的概率都是0.8,则在9月份这段线路能正常工作的概率为________.【答案】0.9676【解析】,B C 段不能正常工作的概率为10.80.80.36-⨯=.线路不能正常工作的概率为0.30.30.36⨯⨯,故能正常工作的概率为10.30.30.360.9676-⨯⨯=.16.(2019·四川石室中学高三开学考试(文))已知甲、乙两组数据的茎叶图如图所示,若甲的众数与乙的中位数相等,则图中x =________.【答案】4.【解析】由题意,根据茎叶图可得,甲组数据的众数是23,乙组数据的中位数为22(20)2x ++,因为甲的众数与乙的中位数相等,所以22(20)232x ++=,解得4x =.三、解答题17.(2019·陕西高三月考(文))某学校1200名高三学生参加当地教育局举办的人身安全测试(满分100分),将所得成绩统计如图所示,其中0.016a b -=.(1)求测试分数在[)60,90的学生人数;(2)求这1200名高三学生成绩的平均数以及中位数. 【答案】(1)1044;(2)平均数为76,中位数为76.【解析】(1)依题意,()0.0050.0350.028101a b ++++⨯=,解得:0.032a b += 又0.016a b -=,联立两式解得:0.024a =,0.008b =∴测试分数在[)60,90的频率:()0.0240.0350.028100.87P =++⨯=∴所求人数为:12000.871044⨯=(2)所求平均数为:550.05650.24750.35850.28950.08⨯+⨯+⨯+⨯+⨯ 2.7515.626.2523.87.676=++++=所求中位数为:0.50.050.2470760.035--+=18.(2019·河北高一月考)为了调查甲、乙两个网站受欢迎的程度,随机选取了14天,统计上午8:00—10:00间各自的点击量,得如下所示的统计图,根据统计图:(1)甲、乙两个网站点击量的极差分别是多少? (2)甲网站点击量在[10,60]间的频率是多少? (3)甲、乙两个网站哪个更受欢迎?并说明理由. 【答案】(1甲的极差65,乙的极差66 ; (2)12; (3)甲网站更受欢迎. 【解析】(1)由茎叶图中的数据,根据极差的概念及算法,可得 甲网站点击量的极差为73865-=, 乙网站点击量的极差为71566-=.(2)由茎叶图中的数据,可得甲网站点击量在[]10,60中的数据为20,24,25,38,41,55,58,共有7个,由古典概型及概率的计算公式,可得概率为71142=. (3)由茎叶图中的数据,甲网站的点击量集中在茎叶图的下方,而乙茎叶图的点击量集中在茎叶图的上方,从而得到甲网站更受欢迎.19.(2019·河北高二月考)为了检测某种零件的一条生产线的生产过程,从生产线上随机抽取一批零件,根据其尺寸的数据得到如图所示的频率分布直方图.若尺寸落在区间(2,2x s x s -+)之外,则认为该零件属“不合格”的零件,其中,x s ,分别为样本平均数和样本标准差,计算可得:15s ≈(同一组中的数据用该组区间的中点值作代表).(1)若一个零件的尺寸是100cm ,试判断该零件是否属于“不合格”的零件;(2)工厂利用分层抽样的方法从样本的前3组中抽出6个零件,标上记号,并从这6个零件中再抽取2个,求再次抽取的2个零件中恰有1个尺寸不超过50cm 的概率. 【答案】(1) 不合格;(2)35. 【解析】(1)由题意()0.005350.01450.015550.03650.02750.015850.0059510x =⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯66.5=故(2,2x s x s -+)=()36.5,96.5()10036.5,96.5∉Q 故该零件属于“不合格”的零件.(2)用分层抽样的方法从样本的前3组中抽出6个零件,则[)30,40 中取1个,[)40,50中取2个,[)50,60中取3个,分别记为1A ,1B ,2B ,1C ,2C ,3C ,从中任取两件,所有可能结果有:()11,A B 、()12,AB 、()11,AC 、()12,A C 、()13,A C 、()12,B B 、()11,B C 、()12,B C 、()13,B C 、()21,B C 、()22,B C 、()23,B C 、()12,C C 、()13,C C 、()23,C C ;满足条件的有()11,A C 、()12,A C 、()13,A C 、()11,B C 、()12,B C 、()13,B C 、()21,B C 、()22,B C 、()23,B C ,故概率93155P == 20.(2018·湖北高二期末(文))20名高二学生某次数学考试成绩(单位:分)的频率分布直方图如图:(1)求频率分布直方图中a 的值;(2)分别求出成绩落在[50,60)与[60,70)中的学生人数;(3)从成绩在[50,70)的学生中任选2人,求此2人的成绩都在[60,70)中的概率. 【答案】(1)0.005a =;(2)见解析;(3)310. 【解析】(1)∵组距为10,∴(23672)102001a a a a a a ++++⨯==,∴10.005200a ==. (2)落在[50,60)中的频率为210200.1a a ⨯==,∴落在[50,60)中的人数为2.落在[60,70)中的学生人数为3102030.00510203a ⨯⨯=⨯⨯⨯=.(3)设落在[50,60)中的2人成绩为1A 2A ,落在[60,70)中的3人为1B ,2B ,3B . 则从[50,70)中选2人共有10种选法,()()()()()(){121112132122,,,,,,,,,,,,A A A B A B A B A B A B Ω=()()()()}23121323,,,,,,,A B B B B B B B ,其中2人都在[60,70)中的基本事件有3个:()12,B B ,()13,B B ,()23,B B , 故所求概率310p =. 21.(2016·四川高考真题(文))我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行调查,通过抽样,获得某年100为居民每人的月均用水量(单位:吨),将数据按照分成9组,制成了如图所示的频率分布直方图.(1)求直方图的的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月用水量的中位数.【答案】(1) ; (2)36000;(3).【解析】(Ⅰ)由频率分布直方图,可知:月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)等组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1–(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30.(Ⅱ)由(Ⅰ)100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36000.(Ⅲ)设中位数为x吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5所以2≤x<2.5.由0.50×(x–2)=0.5–0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨.22.(2018·天津高考真题(文))已知某校甲、乙、丙三个年级的学生志愿者人数分别为240,160,160.现采用分层抽样的方法从中抽取7名同学去某敬老院参加献爱心活动.(Ⅰ)应从甲、乙、丙三个年级的学生志愿者中分别抽取多少人?(Ⅱ)设抽出的7名同学分别用A,B,C,D,E,F,G表示,现从中随机抽取2名同学承担敬老院的卫生工作.(i)试用所给字母列举出所有可能的抽取结果;(ii)设M为事件“抽取的2名同学来自同一年级”,求事件M发生的概率.【答案】(1)3,2,2(2)(i)见解析(ii)5 21【解析】(Ⅰ)由已知,甲、乙、丙三个年级的学生志愿者人数之比为3∶2∶2,由于采用分层抽样的方法从中抽取7名同学,因此应从甲、乙、丙三个年级的学生志愿者中分别抽取3人,2人,2人.(Ⅱ)(i)从抽出的7名同学中随机抽取2名同学的所有可能结果为{A,B},{A,C},{A,D},{A,E},{A,F},{A,G},{B,C},{B,D},{B,E},{B,F},{B,G},{C,D},{C,E},{C,F},{C,G},{D,E},{D,F},{D,G},{E,F},{E,G},{F,G},共21种.(ii)由(Ⅰ),不妨设抽出的7名同学中,来自甲年级的是A,B,C,来自乙年级的是D,E,来自丙年级的是F,G,则从抽出的7名同学中随机抽取的2名同学来自同一年级的所有可能结果为{A,B},{A,C},{B,C},{D,E},{F,G},共5种.所以,事件M发生的概率为P(M)=5 21.以下内容为“高中数学该怎么有效学习?”首先要做到以下两点:1、先把教材上的知识点、理论看明白。
一、排列组合问题的解题策略一、相临问题——捆绑法例1.7名学生站成一排,甲、乙必须站在一起有多少不同排法?解:两个元素排在一起的问题可用“捆绑〞法解决,先将甲乙二人看作一个元素与其他五人进展排列,并考虑甲乙二人的顺序,所以共有种。
评注:一般地: 个人站成一排,其中某个人相邻,可用“捆绑〞法解决,共有种排法。
二、不相临问题——选空插入法例2. 7名学生站成一排,甲乙互不相邻有多少不同排法?解:甲、乙二人不相邻的排法一般应用“插空〞法,所以甲、乙二人不相邻的排法总数应为:种 .评注:假设个人站成一排,其中个人不相邻,可用“插空〞法解决,共有种排法。
三、复杂问题——总体排除法在直接法考虑比拟难,或分类不清或多种时,可考虑用“排除法〞,解决几何问题必须注意几何图形本身对其构成元素的限制。
例3.(1996年全国高考题)正六边形的中心和顶点共7个点,以其中3个点为顶点的三角形共有多少个.解:从7个点中取3个点的取法有种,但其中正六边形的对角线所含的中心和顶点三点共线不能组成三角形,有3条,所以满足条件的三角形共有-3=32个.四、特殊元素——优先考虑法对于含有限定条件的排列组合应用题,可以考虑优先安排特殊位置,然后再考虑其他位置的安排。
例4. (1995年高考题) 1名教师和4名获奖学生排成一排照像留念,假设教师不排在两端,那么共有不同的排法种.解:先考虑特殊元素〔教师〕的排法,因教师不排在两端,故可在中间三个位置上任选一个位置,有种,而其余学生的排法有种,所以共有=72种不同的排法.例5.〔2000年全国高考题〕乒乓球队的10名队员中有3名主力队员,派5名队员参加比赛,3名主力队员要安排在第一、三、五位置,其余7名队员选2名安排在第二、四位置,那么不同的出场安排共有种.解:由于第一、三、五位置特殊,只能安排主力队员,有种排法,而其余7名队员选出2名安排在第二、四位置,有种排法,所以不同的出场安排共有=252种.五、多元问题——分类讨论法对于元素多,选取情况多,可按要求进展分类讨论,最后总计。
重难点05 概率与统计【高考考试趋势】统计主要考查抽样的统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算.试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,几何概型解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差.概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活.取代了传统意义上的应用题,成为高考中的亮点.解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注【知识点分析以及满分技巧】1抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【常见题型限时检测】(建议用时:35分钟)一、单选题1.(2019·广西高考模拟(理))中国古代的五经是指:《诗经》、《尚书》、《礼记》、《周易》、《春秋》,甲、乙、丙、丁、戊5名同学分别选取了其中一本不同的书作为课外兴趣研读,若甲乙都没有选《诗经》,乙也没选《春秋》,则5名同学所有可能的选择有()A.18种B.24种C.36种D.54种2.(2020·重庆巴蜀中学高三月考(理))新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为A、B、C、D、E五个等级.某试点高中2018年参加“选择考”总人数是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年和2018年“选择考”成绩等级结果,得到如下图表:针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是( )A .获得A 等级的人数减少了B .获得B 等级的人数增加了1.5倍C .获得D 等级的人数减少了一半 D .获得E 等级的人数相同3.(2019·广东高考模拟(理))己知某产品的销售额y 与广告费用x 之间的关系如下表:若求得其线性回归方程为 6.5ˆy x a =+,则预计当广告费用为6万元时的销售额为( )A .42万元B .45万元C .48万元D .51万元4.(2019·横峰中学高考模拟(理))已知(1)n x λ+展开式中第三项的二项式系数与第四项的二项式系数相同,且01(1)n x a a x λ+=++22n n a x a x +⋯+,若12242n a a a ++⋯+=,则4()x x λ+展开式中常数项( ) A .32 B .24 C .4 D .86.(2019·安徽高考模拟(理))2019年5月22日具有“国家战略”意义的“长三角一体化”会议在芜湖举行;长三角城市群包括:上海市以及江苏省、浙江省、安徽省三省部分城市,简称“三省一市”. 现有4 名高三学生准备高考后到上海市、江苏省、浙江省、安徽省四个地方旅游,假设每名同学均从这四个地方中任意选取一个去旅游, 则恰有一个地方未被选中的概率为( )A .2764B .916C .81256D .716二、解答题7.(2020·四川高三期末(理))随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;①将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X,求随机变量X的数学期望和方差.参考公式:()()()()()22n ad bcKa b c d a c b d-=++++8.(2020·四川高三期末(理))某市教育部门为了了解全市高一学生的身高发育情况,从本市全体高一学生中随机抽取了100人的身高数据进行统计分析.经数据处理后,得到了如下图1所示的频事分布直方图,并发现这100名学生中,身不低于1.69米的学生只有16名,其身高茎叶图如下图2所示,用样本的身高频率估计该市高一学生的身高概率.(I)求该市高一学生身高高于1.70米的概率,并求图1中a b c 、、的值.(II)若从该市高一学生中随机选取3名学生,记ξ为身高在(]1.501.70,的学生人数,求ξ的分布列和数学期望; (①)若变量S 满足-<+)>0.6826PS (μσμσ≤且22)0.9544P S μσμσ-≤+(,则称变量S 满足近似于正态分布2(,)N μσ的概率分布.如果该市高一学生的身高满足近似于正态分布(1.6,0.01)N 的概率分布,则认为该市高一学生的身高发育总体是正常的.试判断该市高一学生的身高发育总体是否正常,并说明理由.9.(2019·陕西西北工业大学附属中学高考模拟(理))2017年3月智能共享单车项目正 式登陆某市,两种车型(“小绿车”、“小黄车”)采用分时段计费的方式,“小绿车”每30分钟收费0.5元(不足30分钟的部分按30分钟计算);“小黄车”每30分钟收费1元(不足30分钟的部分按30分钟计算).有甲、乙、丙三人相互独立的到租车点租车骑行(各租一车一次).设甲、乙、丙不超过30分钟还车的概率分别为34,23,12,三人租车时间都不会超过60分钟.甲、乙均租用“小绿车”,丙租用“小黄车”.()1求甲、乙两人所付的费用之和等于丙所付的费用的概率;(2)设甲、乙、丙三人所付的费用之和为随机变量ξ,求ξ的分布列和数学期望. 10.(2019·江西高三月考(理))据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:(1)已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05,现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.11.(2019·深圳市高级中学高考模拟(理))某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:该景点为了预测2021年的旅游人数,建立了y 与x 的两个回归模型:模型①:由最小二乘法公式求得y 与x 的线性回归方程$50.8169.7y x =+;模型①:由散点图的样本点分布,可以认为样本点集中在曲线bx y ae =的附近.(1)根据表中数据,求模型①的回归方程$bx y ae =.(a 精确到个位,b 精确到0.01).(2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据()()()1122,,,,,,n n v w v w v w L ,其回归直线µµµwv αβ=+的斜率和截距的最小二乘法估计分别为µµµ121()(),()ni ii n ii w w v v w v v v βαβ==--==--∑∑. ①刻画回归效果的相关指数µ22121()1()ni i i ni i y y R y y ==-=--∑∑ . ①参考数据: 5.46235e ≈, 1.43 4.2e ≈.表中1011ln ,10i i i i u y u u ===∑. 12.(2019·湖南高考模拟(理))在全国第五个“扶贫日”到来之前,某省开展“精准扶贫,携手同行”的主题活动,某贫困县调查基层干部走访贫困户数量.A 镇有基层干部60人,B 镇有基层干部60人,C 镇有基层干部80人,每人都走访了若干贫困户,按照分层抽样,从,,A B C 三镇共选40名基层干部,统计他们走访贫困户的数量,并将走访数量分成5组,[)[)[)[)[]5,15,15,25,25,35,35,45,45,55,绘制成如图所示的频率分布直方图.A B C三镇的基层干部平均每人走访多少(1)求这40人中有多少人来自C镇,并估计,,贫困户;(同一组中的数据用该组区间的中点值作代表)A B C三镇的(2)如果把走访贫困户达到或超过25户视为工作出色,以频率估计概率,从,,所有基层干部中随机选取3人,记这3人中工作出色的人数为X,求X的分布列及数学期望.以下内容为“高中数学该怎么有效学习?”首先要做到以下两点:1、先把教材上的知识点、理论看明白。
高三数学概率统计知识点归纳(word版可编辑修改)编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高三数学概率统计知识点归纳(word版可编辑修改))的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高三数学概率统计知识点归纳(word版可编辑修改)的全部内容。
概率统计知识点归纳平均数、众数和中位数平均数、众数和中位数.要描述一组数据的集中趋势,最重要也是最常见的方法就是用这“三数”来说明.一、正确理解平均数、众数和中位数的概念1.平均数平均数是反映一组数据的平均水平的特征数,反映一组数据的集中趋势.平均数的大小与一组数据里的每一个数据都有关系,任何一个数据的变化都会引起平均数的变化.2.众数在一组数据中出现次数最多的数据叫做这一组数据的众数.一组数据中的众数有时不唯一.众数着眼于对各数出现的次数的考察,这就告诉我们在求一组数据的众数时,既不需要排列,又不需要计算,只要能找出样本中出现次数最多的那一个(或几个)数据就可以了.当一组数据中有数据多次重复出现时,它的众数也就是我们所要关心的一种集中趋势.3.中位数中位数就是将一组数据按大小顺序排列后,处在最中间的一个数(或处在最中间的两个数的平均数).一组数据中的中位数是唯一的.二、注意区别平均数、众数和中位数三者之间的关系平均数、众数和中位数都是描述一组数据的集中趋势的量,但它们描述的角度和适用的范围又不尽相同.在具体问题中采用哪种量来描述一组数据的集中趋势,那得看数据的特点和要关注的问题.三、能正确选用平均数、众数和中位数来解决实际问题由于平均数、众数和中位数都是描述一组数据的集中趋势的量,所以利用平均数、众数和中位数可以来解决现实生活中的问题.极差、方差、标准差极差、方差和标准差都是用来研究一组数据的离散程度的,反映一组数据的波动范围或波动大小的量。
2020年高考理科数学《概率与统计》题型归纳与训练【题型归纳】题型一 古典概型与几何概型例1、某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为 . 【答案】【解析】因为红灯持续时间为40秒.所以这名行人至少需要等待15秒才出现绿灯的概率为. 例2、市政府为调查市民对本市某项调控措施的态度,随机抽取了100名市民,统计了他们的月收入频率分布和对该项措施的赞成人数,统计结果如下表所示:(1)用样本估计总体的思想比较该市月收入低于20(百元)和不低于30(百元)的两类人群在该项措施的态度上有何不同;(2)现从样本中月收入在)20,10[和)70,60[的市民中各随机抽取一个人进行跟踪调查,求抽取的两个人恰好对该措施一个赞成一个不赞成的概率. 【答案】(1)详见解析;(2)2011. 【解析】(1)由表知,样本中月收入低于20(百元)的共有5人,其中持赞成态度的共有2人,故赞成人数的频率为52,月收入不低于30(百元)的共有75人,其中持赞成态度的共有64人,故赞成人数的频率为7564, ∵527564>,∴根据样本估计总体的思想可知月收入不低于30(百元)的人群对该措施持赞成态度的比月收入低于20(百元)的人群持赞成态度的比例要高.(2) 将月收入在)20,10[内,不赞成的3人记为321,,a a a ,赞成的2人记为54,a a ,将月收入在)70,60[内,不赞成的1人记为1b ,赞成的3人记为,,,432b b b 从月收入在)20,10[和)70,60[内的人中各随机抽取1人,基本事件总数20=n ,其中事件“抽取的两个人恰好对该措施一个赞成一个不赞成”包含的基本事件有5840155408-=),(),,(),,(),,(),,(),,(),,(),,(),,(),,(),,(1514433323423222413121b a b a b a b a b a b a b a b a b a b a b a 共11个,∴抽取的两个人恰好对该措施一个赞成一个不赞成的概率2011=P . 【易错点】求解古典概型问题的关键:先求出基本事件的总数,再确定所求目标事件包含基本事件的个数,结合古典概型概率公式求解.一般涉及“至多”“至少”等事件的概率计算问题时,可以考虑其对立事件的概率,从而简化运算. 【思维点拨】1. 求复杂互斥事件概率的方法一是直接法,将所求事件的概率分解为一些彼此互斥事件概率的和,运用互斥事件的求和公式计算;二是间接法,先求此事件的对立事件的概率,再用公式()()1P A P A =-,即运用逆向思维的方法(正难则反)求解,应用此公式时,一定要分清事件的对立事件到底是什么事件,不能重复或遗漏.特别是对于含“至多”“至少”等字眼的题目,用第二种方法往往显得比较简便.2.求古典概型的概率的基本步骤:算出所有基本事件的个数;求出事件A 包含的基本事件个数;代入公式,求出()P A ;几何概型的概率是几何度量之比,主要使用面积、体积之比与长度之比. 题型二 统计与统计案例例1、某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:],90,80[,),40,30[),30,20[Λ并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间)50,40[内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【答案】(Ⅰ)4.0;(Ⅱ)20;(Ⅲ)2:3.【解析】(Ⅰ)根据频率分布直方图可知,样本中分数不小于70的频率为6.010)04.002.0(=⨯+,所以样本中分数小于70的频率为4.06.01=-.(Ⅱ)根据题意,样本中分数不小于50的频率为,分数在区间内的人数为.所以总体中分数在区间内的人数估计为. (Ⅲ)由题意可知,样本中分数不小于70的学生人数为6010010)04.002.0(=⨯⨯+,所以样本中分数不小于70的男生人数为302160=⨯.所以样本中的男生人数为60230=⨯,女生人数为4060100=-,男生和女生人数的比例为2:340:60=,所以根据分层抽样的原理,总体中男生和女生人数的比例估计为2:3. 【易错点】求解统计图表问题,重要的是认真观察图表,发现有用信息和数据.对于频率分布直方图,应注意图中的每一个小矩形的面积是落在该区间上的频率,所有小矩形的面积和为1,当小矩形等高时,说明频率相等,计算时不要漏掉其中一个. 【思维点拨】1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成. 4.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中: (1)最高的小长方形底边中点的横坐标即是众数; (2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.求回归直线方程的关键①正确理解计算^^,a b 的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关(0.010.020.040.02)100.9+++⨯=[40,50)1001000.955-⨯-=[40,50)540020100⨯=系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值. 6.独立性检验的关键①根据22⨯列联表准确计算2K ,若22⨯列联表没有列出来,要先列出此表. ②2K 的观测值k 越大,对应假设事件0H 成立的概率越小,0H 不成立的概率越大. 题型三 概率、随机变量及其分布例1、“过大年,吃水饺”是我国不少地方过春节的一大习俗.2018年春节前夕, 市某质检部门随机抽取了100包某种品牌的速冻水饺,检测其某项质量指标,(1)求所抽取的100包速冻水饺该项质量指标值的样本平均数(同一组中的数据用该组区间的中点值作代表);(2)①由直方图可以认为,速冻水饺的该项质量指标值服从正态分布,利用该正态分布,求落在内的概率;②将频率视为概率,若某人从某超市购买了4包这种品牌的速冻水饺,记这4包速冻水饺中这种质量指标值位于内的包数为,求的分布列和数学期望.附:①计算得所抽查的这100包速冻水饺的质量指标的标准差为; ②若,则, .【答案】(1) (2) (3)的分布列为;.【解析】(1)所抽取的100包速冻水饺该项质量指标值的样本平均数为A x Z ()2,N μσZ ()14.55,38.45()10,30X X 11.95σ=≈()2~,Z N μσ()0.6826P Z μσμσ-<≤+=(22)0.9544P Z μσμσ-<≤+=26.5x =0.6826X ()2E X =x.(2)①∵服从正态分布,且, ,∴, ∴落在内的概率是. ②根据题意得, ; ; ; ; . ∴的分布列为∴. 50.1150.2250.3350.25450.1526.5x =⨯+⨯+⨯+⨯+⨯=Z ()2,N μσ26.5μ=11.95σ≈(14.5538.45)(26.511.9526.511.95)0.6826P Z P Z <<=-<<+=Z ()14.55,38.450.68261~4,2X B ⎛⎫ ⎪⎝⎭()404110216P X C ⎛⎫=== ⎪⎝⎭()41411124P X C ⎛⎫=== ⎪⎝⎭()42413228P X C ⎛⎫=== ⎪⎝⎭()43411324P X C ⎛⎫=== ⎪⎝⎭()444114216P X C ⎛⎫=== ⎪⎝⎭X ()1422E X =⨯=【思维点拨】1.条件概率的两种求解方法: (2)基本事件法,借助古典概型概率公式,先求事件A 包含的基本事件数)(A n ,再求事件AB 所包含的基本事件数()AB n ,得)()()|(A n AB n A B P =. 2.判断相互独立事件的三种常用方法:(1)利用定义,事件B A ,相互独立⇔)()()(B P A P AB P ⋅=.(2)利用性质,A 与B 相互独立,则A 与A B ,与B ,B A 与也都相互独立. (3)具体背景下,①有放回地摸球,每次摸球的结果是相互独立的. ②当产品数量很大时,不放回抽样也可近似看作独立重复试验.3. 求离散型随机变量的分布列,首先要根据具体情况确定X 的取值情况,然后利用排列、组合与概率知识求出X 取各个值的概率.4. 利用独立重复试验概率公式可以简化求概率的过程,但需要注意检验该概率模型是否满足公式k n k k n p p C k X P --==)1()(的三个条件:(1)在一次试验中某事件A 发生的概率是一个常数p ;(2)n 次试验不仅是在完全相同的情况下进行的重复试验,而且各次试验的结果是相互独立的;(3)该公式表示n 次试验中事件A 恰好发生了k 次的概率.5. 求离散型随机变量的均值与方差的基本方法有:(1)已知随机变量的分布列求它的均值、方差和标准差,可直接按定义(公式)求解;(2)已知随机变量X 的均值、方差,求X 的线性函数b aX Y +=的均值、方差,可直接用均值、方差的性质求解,即b X aE b aX E +=+)()(,)()(2X D a b aX D =+(b a ,为常数).(3)如能分析所给随机变量服从常用的分布,可直接利用它们的均值、方差公式求解,即若X 服从两点分布,则p X E =)(,)1()(p p X D -=;若),(~p n B X ,则np X E =)(,)1()(p np X D -=.【巩固训练】题型一 古典概型与几何概型1.已知,,则函数在区间上为增函数的概率是( )A .B .C .D . {}0 1 2a ∈,,{}1 1 3 5b ∈-,,,()22f x ax bx =-()1 +∞,512131416【答案】A【解析】①当时,,情况为符合要求的只有一种; ②当时,则讨论二次函数的对称轴要满足题意则产生的情况表示: ,8种情况满足的只有4种; 综上所述得:使得函数在区间为增函数的概率为:1251214=+=P .2.在区间上任取一数,则的概率是( )A .B .C .D . 【答案】C【解析】由题设可得,即;所以,则由几何概型的概率公式.故应选C .(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.【答案】(1) 0.4;(2) 45;(3)74. 【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为0a =()2f x bx =- 1 1 3 5b =-,,,1b =-0a ≠22b b x a a -=-=1ba≤() a b ,()()()1 1 1 1 1 3-,,,,,()()()()()1 5 2 1 2 1 2 3 2 5-,,,,,,,,,()22f x ax bx =-()1 +∞,()0,4x 1224x -<<12131434211<-<x 32<<x 4,1==D d 41=P考向二 统计与统计案例1.为考查某种疫苗预防疾病的效果,进行动物实验,得到统计数据如下:现从所有试验动物中任取一只, (Ⅰ)求列联表中的数据,,,的值; (Ⅱ)绘制发病率的条形统计图,并判断疫苗是否有效? (Ⅲ)能够有多大把握认为疫苗有效?22⨯x y A B【答案】(Ⅰ),,,;(Ⅱ)详见解析;(Ⅲ)至少有%9.99的把握认为疫苗有效.【解析】(Ⅰ)设“从所有试验动物中任取一只,取到“注射疫苗”动物”为事件A, 由已知得,所以,,,.发病率的条形统计图如图所示,由图可以看出疫苗影响到发病率.10y =40B =40x =60A =302()1005y P A +==10y =40B =40x =60A =未注射 注射. 所以至少有%9.99的把握认为疫苗有效.2.在“新零售”模式的背景下,某大型零售公司为推广线下分店,计划在市的区开设分店.为了确定在该区开设分店的个数,该公司对该市已开设分店的其他区的数据作了初步处理后得到下列表格.记表示在各区开设分店的个数, 表示这个分店的年收入之和.(Ⅰ)该公司已经过初步判断,可用线性回归模型拟合与的关系,求关于的线性回归方程; (Ⅱ)假设该公司在区获得的总年利润(单位:百万元)与之间的关系为,请结合(Ⅰ)中的线性回归方程,估算该公司应在区开设多少个分店,才能使区平均每个分店的年利润最大? 参考公式:, , .【答案】(1);(2)公司应在区开设4个分店,才能使区平均每个分店的年利润最大.【解析】(1)10085)())(()(,4,42112121^=---=--===∑∑∑∑====x x y yx x x n xyx n yx b y x ni ini iini ini iiΘ,6.0^^=-=x b y a , ∴y 关于x 的线性回归方程6.085.0+=x y .(2) ,区平均每个分店的年利润 ,∴时, 取得最大值,故该公司应在区开设4个分店,才能使区平均每个分店的年利润最大.10000005016.6710.8285020603=≈>⨯⨯S A x y x y x y x A z ,x y 20.05 1.4z y x =--A A y b x a ∧∧∧=+1221ni i i nii x y nxyb x nx ∧==-==-∑∑()()()121niii n ii x x y y x x ==---∑∑a y b x ∧∧=-0.850.6y x =+A A 20.05 1.4z y x =--=20.050.850.8x x -+-A 0.80.050.85z t x x x ==--+800.0150.85x x ⎛⎫=-++ ⎪⎝⎭4x =t A A3. 某商场对商品30天的日销售量y (件)与时间t (天)的销售情况进行整理,得到如下数据,经统计分析,日销售量y (件)与时间t (天)之间具有线性相关关系.(1)请根据表中提供的数据,用最小二乘法求出y 关于t 的线性回归方程a t b y +=. (2)已知商品30天内的销售价格z (元)与时间t(天)的关系为,),200(,20),3020(,100⎩⎨⎧∈<<+∈≤≤+-=N t t t N t t t z 根据(1)中求出的线性回归方程,预测t 为何值时,商品的日销售额最大.参考公式:2121^)(t n tyt n yt b ni ini ii--=∑∑==,t b y a ^^-=.【答案】(1)40^+-=t y ;(2)预测当20=t 时,商品的日销售额最大,最大值为1600元. 【解析】(1)根据题意,6)108642(51=++++⨯=t ,34)3033323738(51=++++⨯=y , 980301033832637438251=⨯+⨯+⨯+⨯+⨯=∑=i i i y t ,22010864222222512=++++=∑=i i t ,所以回归系数为1652203465980)(22121^-=⨯-⨯⨯-=--=∑∑==t n tyt n yt b ni ini ii,406)1(34^^=⨯--=-=t b y a ,故所求的线性回归方程为40^+-=t y . (2)由题意得日销售额为,,3020),40)(100(,200),40)(20(⎩⎨⎧∈≤≤+-+-∈<<+-+=Nt t t t Nt t t t L当N t t ∈<<,200时,900)10(80020)40)(20(22+--=++-=+-+=t t t t t L , 所以当;90010max ==L t 时,当N t t ∈≤≤,3020时,900)70(4000140)40)(100(22--=+-=+-+-=t t t t t L , 所以当.160020max ==L t 时,综上所述,预测当20=t 时,A 商品的日销售额最大,最大值为1600元. 题型三 概率、随机变量及其分布A A A A1.在心理学研究中,常采用对比试验的方法评价不同心理暗示对人的影响,具体方法如下:将参加试验的志愿者随机分成两组,一组接受甲种心理暗示,另一组接受乙种心理暗示,通过对比这两组志愿者接受心理暗示后的结果来评价两种心理暗示的作用,现有6名男志愿者654321,,,,,A A A A A A 和4名女志愿者4321,,,B B B B ,从中随机抽取5人接受甲种心理暗示,另5人接受乙种心理暗示.(I )求接受甲种心理暗示的志愿者中包含1A 但不包含的频率。
重难点05 概率与统计【高考考试趋势】统计主要考查抽样的统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算.试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,几何概型解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差.概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活.取代了传统意义上的应用题,成为高考中的亮点.解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注【知识点分析以及满分技巧】1抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【常见题型限时检测】(建议用时:35分钟)一、单选题1.(2019·广西高考模拟(理))中国古代的五经是指:《诗经》、《尚书》、《礼记》、《周易》、《春秋》,甲、乙、丙、丁、戊5名同学分别选取了其中一本不同的书作为课外兴趣研读,若甲乙都没有选《诗经》,乙也没选《春秋》,则5名同学所有可能的选择有()A.18种B.24种C.36种D.54种【答案】D【分析】分两类求解:(1)甲选《春秋》;(2)甲不选《春秋》;分别求出可能的选择情况,再求和即可得出结果.【详解】(1)若甲选《春秋》,则有133318C A=种情况;(2)若甲不选《春秋》,则有233336A A=种情况;+=种情况.所以5名同学所有可能的选择有183654故选D【点睛】本题主要考查计数原理,熟记排列组合的概念等即可,属于常考题型. 2.(2020·重庆巴蜀中学高三月考(理))新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为A、B、C、D、E五个等级.某试点高中2018年参加“选择考”总人数是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年和2018年“选择考”成绩等级结果,得到如下图表:针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是()A.获得A等级的人数减少了B.获得B等级的人数增加了1.5倍C.获得D等级的人数减少了一半D.获得E等级的人数相同【答案】B【分析】设出两年参加考试的人数,然后根据图表计算两年等级为A,B,C,D,E的人数,由此判断出正确选项.【详解】设2016年参加考试x人,则2018年参加考试2x人,根据图表得出两年各个等级的人数如下图所示:由图可知A,C,D 选项错误,B 选项正确,故本小题选B. 【点睛】本小题主要考查图表分析,考查数据分析与处理能力,属于基础题.3.(2019·广东高考模拟(理))己知某产品的销售额y 与广告费用x 之间的关系如下表:若求得其线性回归方程为 6.5ˆyx a =+,则预计当广告费用为6万元时的销售额为 A .42万元 B .45万元C .48万元D .51万元【答案】C 【分析】根据上表中的数据,求得样本点中心(),x y ,代入回归直线的方程,求得a 的值,得到回归直线的方程,即可求解. 【详解】由题意,根据上表中的数据,可得2x =,22y =,即回归方程经过样本点中心(),x y ,又由线性回归方程为 6.5ˆyx a =+,所以22 6.52a =⨯+,解得9a =, 所以 6.59ˆyx =+,当6x =时,ˆ48y =,故选C. 【点睛】本题主要考查了回归直线方程的应用问题,其中解答中熟记回归直线方程的性质,求得归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.4.(2019·横峰中学高考模拟(理))已知(1)n x λ+展开式中第三项的二项式系数与第四项的二项式系数相同,且01(1)n x a a x λ+=++22nn a x a x +⋯+,若12242n a a a ++⋯+=,则4()x xλ+展开式中常数项( )A .32B .24C .4D .8【答案】B 【分析】先由二项展开式中第三项的二项式系数与第四项的二项式系数相同,求出n ;再由2012(1)n n n x a a x a x a x λ+=+++⋯+求出λ,由二项展开式的通项公式,即可求出结果.【详解】因为(1)nx λ+展开式中第三项的二项式系数与第四项的二项式系数相同, 所以23n n C C =,因此5n =,又5205125(1)x a a x a x a x λ+=+++⋯+,所以01a =, 令1x =,则01525(1)a a a a λ+=+++⋯+,又125242a a a ++⋯+=,所以55(3)3124λ+==,因此2λ=, 所以42()x x +展开式的通项公式为44214422k k k k k k k k T C x x C x ---+==,由420k -=得2k =,因此42()x x+展开式中常数项为2234224T C ==.故选B【点睛】本题主要考查求指定项的系数,熟记二项式定理即可,属于常考题型. 5.(2019·山东高三月考)2521(2)(1)x x+-的展开式的常数项是( ) A .3- B .2-C .2D .3【答案】D 【详解】的展开式通项为:,由2100r -=得=5r ,所以的常数项系数为;由2102r -=-得4r =,所以的 项系数为,所以的展开式的常数项是,故选D.6.(2019·安徽高考模拟(理))2019年5月22日具有“国家战略”意义的“长三角一体化”会议在芜湖举行;长三角城市群包括:上海市以及江苏省、浙江省、安徽省三省部分城市,简称“三省一市”. 现有4 名高三学生准备高考后到上海市、江苏省、浙江省、安徽省四个地方旅游,假设每名同学均从这四个地方中任意选取一个去旅游, 则恰有一个地方未被选中的概率为()A.2764B.916C.81256D.716【答案】B【分析】根据排列组合的知识分别求解出恰有一个地方未被选中的情况和所有情况,利用古典概型计算可得结果.【详解】4名同学去旅游的所有情况有:44256=种恰有一个地方未被选中共有:2113424322144C CC AA⋅⋅=种情况∴恰有一个地方未被选中的概率:144925616 p==本题正确选项:B【点睛】本题考查古典概型计算概率的问题、排列组合中的分组分配问题;关键是能够利用排列组合的知识准确求解出恰有一个地方未被选中的情况种数;易错点是忽略了分组分配中的平均分配问题.二、解答题7.(2020·四川高三期末(理))随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;①将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X ,求随机变量X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(①)详见解析;(①)①4960;①数学期望为6,方差为2.4. 【分析】(1)完成列联表,由列联表,得2258.333 6.6353K =≈>,由此能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关.(2)① 由题意所抽取的10名女市民中,经常网购的有70107100⨯=人,偶尔或不用网购的有30103100⨯=人,由此能选取的3人中至少有2人经常网购的概率. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=,由题意100.6X B :(,),由此能求出随机变量X 的数学期望()E X 和方差()D X . 【详解】解:(1)完成列联表(单位:人):由列联表,得: ()2220050305070258.333 6.635120801001003K ⨯⨯-⨯==≈>⨯⨯⨯, ①能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关. (2)①由题意所抽取的10名女市民中,经常网购的有70107100⨯=人, 偶尔或不用网购的有30103100⨯=人, ①选取的3人中至少有2人经常网购的概率为:2137373104960c c c P c +==. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=, 将频率视为概率,①从我市市民中任意抽取一人,恰好抽到经常网购市民的概率为0.6, 由题意()100.6X B :,, ①随机变量X 的数学期望()100.66E X =⨯=, 方差D (X )=()100.60.4 2.4D X =⨯⨯=. 【点睛】本题考查独立检验的应用,考查概率、离散型随机变量的分布列、数学期望、方差的求法,考查古典概型、二项分布等基础知识,考查运算求解能力,是中档题.8.(2020·四川高三期末(理))某市教育部门为了了解全市高一学生的身高发育情况,从本市全体高一学生中随机抽取了100人的身高数据进行统计分析.经数据处理后,得到了如下图1所示的频事分布直方图,并发现这100名学生中,身不低于1.69米的学生只有16 名,其身高茎叶图如下图2所示,用样本的身高频率估计该市高一学生的身高概率.(I)求该市高一学生身高高于1.70米的概率,并求图1中a b c 、、的值.(II)若从该市高一学生中随机选取3名学生,记ξ为身高在(]1.501.70,的学生人数,求ξ 的分布列和数学期望;(①)若变量S 满足-<+)>0.6826PS (μσμσ≤且22)0.9544P S μσμσ-≤+(,则称变量S 满足近似于正态分布2(,)N μσ的概率分布.如果该市高一学生的身高满足近似于正态分布(1.6,0.01)N 的概率分布,则认为该市高一学生的身高发育总体是正常的.试判断该市高一学生的身高发育总体是否正常,并说明理由. 【答案】(I) 见解析;(①)见解析;(①) 见解析. 【解析】分析: (I)先求出身高高于1.70米的人数,再利用概率公式求这批学生的身高高于1.70 的概率.分别利用面积相等求出a 、b 、c 的值. (II)先求出从这批学生中随机选取1名,身高在[]1.501.70,的概率,再利用二项分布写出ξ的分布列和数学期望. (①)先分别计算出-<X +P μσμσ≤()和22)PS μσμσ-<≤+(,再看是否满足-<+)>0.6826P S μσμσ≤(且22)0.9544P S μσμσ-<≤+>(,给出判断.详解: (I)由图2 可知,100名样本学生中身高高于1.70米共有15 名,以样本的频率估计总体的概率,可得这批学生的身高高于1.70 的概率为0.15. 记X 为学生的身高,结合图1可得:2(1.30 1.40)(1.80 1.90)0.02100f X f X <≤=<≤==, 13(1.40 1.50)(1.70 1.80)0.13100f X f X <≤=<≤==,1(1.50 1.60)(1.60 1.70)(120.0220.13)0.352f X f X <≤=<≤=-⨯-⨯=,又由于组距为0.1,所以0.2a =, 1.3 3.5b c ==, (①)以样本的频率估计总体的概率,可得: 从这批学生中随机选取1名,身高在[]1.501.70,的概率 (1.50 1.70)(1.50 1.60)+(1.60 1.70)0.7P X f X f X <≤=<≤<≤=.因为从这批学生中随机选取3 名,相当于三次重复独立试验, 所以随机变量ξ服从二项分布(3,0.7)B ,故ξ的分布列为:()3()?0.3?0.70,1,2,33n nn P n C n ξ-====00.027+10.189+20.441+30.343=2.1E ξ⨯⨯⨯⨯()(或=30.7=2.1E ())ξ⨯(①)由 1.60.01N (,),取=1.60=0.1μσ, 由(①)可知,-<X += 1.50 1.70)0.70.6826PP X μσμσ≤<≤=>()(, 又结合(I),可得:-2<X +2= 1.40 1.80)PP X μσμσ≤<≤()( =2 1.70<X 1.80 1.50 1.70)0.960.544f P X ⨯≤+<≤=>()(,所以这批学生的身高满足近似于正态分布(1.60.01N ,)的概率分布,应该认为该市高一学生的身高发育总体是正常的.【点睛】:(1)本题不难,但是题目的设计比较新颖,有的同学可能不能适应. 遇到这样的问题,首先是认真审题,理解题意,再解答就容易了. (2)在本题的解答过程中,要灵活利用频率分布图计算概率.9.(2019·陕西西北工业大学附属中学高考模拟(理))2017年3月智能共享单车项目正式登陆某市,两种车型(“小绿车”、“小黄车”)采用分时段计费的方式,“小绿车”每30分钟收费0.5元(不足30分钟的部分按30分钟计算);“小黄车”每30分钟收费1元(不足30分钟的部分按30分钟计算).有甲、乙、丙三人相互独立的到租车点租车骑行(各租一车一次).设甲、乙、丙不超过30分钟还车的概率分别为34,23,12,三人租车时间都不会超过60分钟.甲、乙均租用“小绿车”,丙租用“小黄车”.()1求甲、乙两人所付的费用之和等于丙所付的费用的概率;(2)设甲、乙、丙三人所付的费用之和为随机变量ξ,求ξ的分布列和数学期望.【答案】(1)724;(2)见解析.【解析】【分析】(1)利用相互独立事件的概率公式,分两种情况计算概率即可;(2)根据相互独立事件的概率公式求出各种情况下的概率,得出分布列,利用公式求解数学期望.【详解】(I)由题意得,甲乙丙在30分钟以上且不超过60分钟还车的概率分别为.记甲、乙两人所付的费用之和等于丙所付的费用为事件A.则,答:甲、乙两人所付的费用之和等于丙所付的费用的概率为,(①)ξ可能取值有2,2.5,3,3.5,4,①;;;,.甲、乙、丙三人所付的租车费用之和ξ的分布列为:①.【点睛】本题主要考查了相互对立事件的概率的计算,以及离散型随机变量的分布列、数学期望的求解,其中正确理解题意,利用相互独立事件的概率计算公式求解相应的概率是解答的关键,着重考查了分析问题和解答问题的能力,能很好的考查考生数学应用意识、基本运算求解能力等.10.(2019·江西高三月考(理))据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:(1)已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05,现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.【答案】(1)72;(2)2 .【解析】【分析】(1)由题意得持“应该保留”态度的人为120x+,占总人数3600的0.05,列出对应的概率等式即可算得60x=,再利用分层抽样的方法求解在持“无所谓”态度的人中抽取多少人即可.(2)由分层抽样可求得在校学生为4人,社会人士为2人,再利用超几何分布的方法列出分布列求解期望即可.【详解】(1)因为抽到持“应该保留”态度的人的概率为0.05,所以1200.053600x+=,所以60x=.所以持“无所谓”态度的人数共有3600210012060060720----=,所以应在“无所谓”态度抽取360720723600⨯=人. (2)解:由(①)知持“应该保留”态度的一共有180人, 所以在所抽取的6人中,在校学生为12064180⨯=人, 社会人士为6062180⨯=人, 则第一组在校学生人数1,2,3ξ=1242361(1)5C C P C ξ===,2142363(2)5C C P C ξ===,3042361(3)5C C P C ξ===, 即ξ的分布列为:所以1311232555E ξ=⨯+⨯+⨯=. 【点睛】本题主要考查分层抽样的一般方法与超几何分布的一般方法.同时也考查了分布列与数学期望的方法,属于中等题型.11.(2019·深圳市高级中学高考模拟(理))某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:该景点为了预测2021年的旅游人数,建立了y 与x 的两个回归模型:模型①:由最小二乘法公式求得y 与x 的线性回归方程$50.8169.7y x =+;模型①:由散点图的样本点分布,可以认为样本点集中在曲线bxy ae =的附近.(1)根据表中数据,求模型①的回归方程$bx y ae =.(a 精确到个位,b 精确到0.01). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据()()()1122,,,,,,n n v w v w v w L ,其回归直线µµµwv αβ=+的斜率和截距的最小二乘法估计分别为µµµ121()(),()niii nii w w v v w v v v βαβ==--==--∑∑. ①刻画回归效果的相关指数µ22121()1()nii i n ii yy R yy ==-=--∑∑ .①参考数据: 5.46235e ≈, 1.43 4.2e ≈.表中1011ln ,10i i i i u y u u ===∑. 【答案】(1) $0.11235x y e = (2)见解析 【解析】 【分析】(1)对bxy ae =取对数,得ln ln y bx a =+, 设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,进而可得结果;(2)由表格中的数据, 30407>14607,可得101022113040714607()()iii i y y y y ==>--∑∑,从而得2212R R < ,进而可得结果.【详解】(1)对bxy ae =取对数,得ln ln y bx a =+,设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,()()()10110219.000.10883iii ii x x u u bx x ==--==≈-∑∑$, 6.050.108 5.5 5.456 5.46cu bx =-≈-⨯=≈$$ $ 5.46235c a e e =≈≈$∴模型①的回归方程为$0.11235x y e =(2)由表格中的数据,有30407>14607,即101022113040714607()()iii i y y y y ==>--∑∑,即10102211304071460711()()iii i y y y y ==-<---∑∑,2212R R <模型①的相关指数21R 小于模型①的22R ,说明回归模型①的拟合效果更好.2021年时,13x =,预测旅游人数为$0.1113 1.43235235235 4.2987y e e ⨯==≈⨯=(万人) 【点睛】本题考查了非线性拟合及非线性回归方程的求解与应用,是源于课本的试题类型,解答非线性拟合问题,先作出散点图,再根据散点图选择合适的函数类型,设出回归方程,利用换元法将非线性回归方程化为线性回归方程,求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.12.(2019·湖南高考模拟(理))在全国第五个“扶贫日”到来之前,某省开展“精准扶贫,携手同行”的主题活动,某贫困县调查基层干部走访贫困户数量.A 镇有基层干部60人,B 镇有基层干部60人,C 镇有基层干部80人,每人都走访了若干贫困户,按照分层抽样,从,,A B C 三镇共选40名基层干部,统计他们走访贫困户的数量,并将走访数量分成5组,[)[)[)[)[]5,15,15,25,25,35,35,45,45,55,绘制成如图所示的频率分布直方图.(1) 求这40人中有多少人来自C 镇,并估计,,A B C 三镇的基层干部平均每人走访多少 贫困户;(同一组中的数据用该组区间的中点值作代表)(2)如果把走访贫困户达到或超过25户视为工作出色,以频率估计概率,从,,A B C 三镇的所有基层干部中随机选取3人,记这3人中工作出色的人数为X ,求X 的分布列及数学期望.【答案】(1)40人中有16人来自C 镇,28.5户(2)见解析 【分析】(1)先确定抽样比,再由C 镇有基层干部80人即可求出结果;求平均数时,只需每组的中间值乘以该组的频率再求和即可;(2)先确定从三镇的所有基层干部中随机选出1人,其工作出色的概率,由题意可知X 服从二项分布,进而可求出结果. 【详解】解:(1)因为,,A B C 三镇分别有基层干部60人,60人,80人,共200人, 利用分层抽样的方法选40人,则C 镇应选取408016200⨯=(人), 所以这40人中有16人来自C 镇因为100.15200.25300.3x =⨯+⨯+⨯ 400.2500.128.5+⨯+⨯=, 所以三镇基层干部平均每人走访贫困户28.5户(2)由直方图得,从三镇的所有基层干部中随机选出1人,其工作出色的概率为35显然X 可取0,1,2,3,且33,5X B ⎛⎫~ ⎪⎝⎭,则()32805125P X ⎛⎫=== ⎪⎝⎭, ()12133236155125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()21233254255125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()332735125P X ⎛⎫=== ⎪⎝⎭ 所以X 的分布列为所以数学期望()8365427901231251251251255E X =⨯+⨯+⨯+⨯= 【点睛】本题主要考查频率分布直方图,以及二项分布,由频率分布直方图求平均数,只需每组的中间值乘以该组频率再求和即可,对于二项分布的问题,熟记二项分布即可求解,属于常考题型.。
概率与统计一、考纲解读1.理解取有限个值的离散型随机变量及其分布列的概念,了解分布列对于刻画随机现象的重要性。
2.理解超几何分布及其推导过程,并能进行简单的应用。
3.了解条件概率和两个事件相互独立的概念,理解次独立重复实验的模型及二n 项分布,并能解决一些简单的实际问题。
4.理解取有限个值的离散型变量均值,方差的概念,能计算简单离散型随机变量的均值、方差,并能解决一些实际问题。
5.利用实际问题的频率分布直方图,了解正态分布密度曲线的特点及曲线所表示的意义。
二、命题趋势探究1.高考命题中,该部分命题形式有选择题、填空题,但更多的是解答题。
2.主要以离散型随机变量分布列为主体命题,计算离散型随机变量的期望和方差,其中二项分布与超几何分布为重要考点,难度中等以下。
3.有关正态分布的考题多为一道小题。
三、知识点精讲(一).条件概率与独立事件(1)在事件A 发生的条件下,时间B 发生的概率叫做A 发生时B 发生的条件概率,记作 ,条件概率公式为 。
()P B A ()=P B A ()()P AB P A (2)若,即,称与为相互独立事件。
与()=P B A P B ()()=()()P AB P A P B A B A B 相互独立,即发生与否对的发生与否无影响,反之亦然。
即相互独立,A B ,A B 则有公式。
()=()()P AB P A P B(3)在次独立重复实验中,事件发生次的概率记作,记n A k ()0k n ≤≤()n P k A在其中一次实验中发生的概率为 ,则 .()P A p =()()1n k k k n n P k C p p -=-(二).离散型随机变量分布列、期望、方差及其性质(1)离散型随机变量的分布列(如表13-1所示).ξ表13-1ξ 1ξ 2ξ 3ξ… n ξ P 1p 2p 3pn p ① ;()11,i p i n i N θ*≤≤≤≤∈② .121n p p p ++= (2)表示的期望:,反应随机变量的平均水平,E ξξ1122=+n n p p p E ξξξξ++…若随机变量满足,则.ξη,=a b ηξ+E aE b ηξ=+(3)表示的方差:,反映随机D ξξ()()()2221122=---n n E p E p E p D ξξξξξξξ+++ 变量取值的波动性。
2023届新高考卷概率与统计热门考题汇编第一部分:基本原理和重要概念一、分类加法计数原理和分步乘法计数原理分类加法计数原理分步乘法计数原理相同点用来计算完成一件事的方法种类不同点分类完成,类类相加分步完成,步步相乘每类方案中的每一种方法都能独立完成这件事每步依次完成才算完成这件事(每步中的一种方法不能独立完成这件事)注意点类类独立,不重不漏步步相依,步骤完整二、常见的一些排列问题及其解决方法直接法把符合条件的排列数直接列式计算优先法优先安排特殊元素或特殊位置捆绑法把相邻元素看作一个整体与其他元素一起排列,同时注意捆绑元素的内部排列插空法对不相邻问题,先考虑不受限制的元素的排列,再将不相邻的元素插在前面元素排列的空当中定序问题除法处理对于定序问题,可先不考虑顺序限制,排列后,再除以定序元素的全排列间接法正难则反,等价转化的方法三、分组分配问题(1)分组问题属于“组合”问题,常见的分组问题有三种:①完全均匀分组,每组的元素个数均相等;②部分均匀分组,应注意不要重复,有n组均匀,最后必须除以n!;③完全非均匀分组,这种分组不考虑重复现象.(2)分配问题属于“排列”问题,分配问题可以按要求逐个分配,也可以分组后再分配.四、二项式定理(1)一般地,对于任意正整数,都有:(a+b)n=C0n a n+C1n a n-1b+⋯+C r n a n-r b r+⋯+C n n b n(n∈N∗),这个公式所表示的定理叫做二项式定理,等号右边的多项式叫做的二项展开式.式中的C r n a n-r b r做二项展开式的通项,用T r+1表示,即通项为展开式的第r+1项:T r+1=C r n a n-r b r,其中的系数C rn (r =0,1,2,⋯,n )叫做二项式系数,2.(2)两个常用的二项展开式:①(a -b )n =C 0n a n +C 1n a n -1b +L +-1 r C r n a n -r b r +L +-1 n C n n b n (n ∈N ∗),②1+x n =1+C 1n x +C 2n x 2+L +C r n x r +L +x n(3)二项式系数的性质(杨辉三角形)①每一行两端都是1,即C 0n =C n n ;其余每个数都等于它“肩上”两个数的和,即C m n +1=C m -1n +C m n .②对称性每一行中,与首末两端“等距离”的两个二项式系数相等,即C m n =C n -m n .③二项式系数和令a =b =1,则二项式系数的和为C 0n +C 1n +C 2n +⋯+C r n +⋯+C n n =2n ,变形式C 1n +C 2n +⋯+C r n +⋯+C n n =2n -1.④奇数项的二项式系数和等于偶数项的二项式系数和在二项式定理中,令a =1,b =-1,则C 0n -C 1n +C 2n -C 3n +⋯+(-1)n C n n =(1-1)n =0,从而得到:C 0n +C 2n +C 4n ⋅⋅⋅+C 2r n +⋅⋅⋅=C 1n +C 3n +⋯+C 2r +1n +⋅⋅⋅=12⋅2n =2n -1.⑤最大值:如果二项式的幂指数n 是偶数,则中间一项T n 2+1的二项式系数C n 2n 最大;如果二项式的幂指数n 是奇数,则中间两项T n +12,T n +12+1的二项式系数C n -12n ,C n +12n相等且最大.⑥求(a +bx )n 展开式中最大的项,一般采用待定系数法.设展开式中各项系数分别为A 1,A 2,⋅⋅⋅,A n +1,设第r +1项系数最大,应有A r +1≥A rA r +1≥A r +2 ,从而解出r 来.(4)二项式系数和的计算与赋值五、二项分布1.n 重伯努利试验的概念只包含两个可能结果的试验叫做伯努利试验,将一个伯努利试验独立地重复进行n 次所组成的随机试验称为n 重伯努利试验.2.n 重伯努利试验具有如下共同特征(1)同一个伯努利试验重复做n 次;(2)各次试验的结果相互独立.3.二项分布一般地,在n 重伯努利试验中,设每次试验中事件A 发生的概率为p (0<p <1),用X 表示事件A 发生的次数,则X 的分布列为:P (X =k )=C k n p k(1−p )n −k ,k =0,1,2,⋅⋅⋅n ,如果随机变量X 的分布列具有上式的形式,则称随机变量X 服从二项分布,记作X ~B (n ,p )4.一般地,可以证明:如果X ~B (n ,p ),那么EX =np ,DX =np (1−p ).六、超几何分布1.超几何分布模型是一种不放回抽样,一般地,假设一批产品共有N 件,其中有M 件次品,从N 件产品中随机抽取n 件(不放回),用X 表示抽取的n 件产品中的次品数,则X 的分布列为P (X =k )=C k M C n -kN -MC nN,k =m ,m +1,m +2,⋯,r .其中n ,N ,M ∈N *,M ≤N ,n ≤N ,m =max {0,n -N +M },r =min {n ,M }.如果随机变量X 的分布列具有上式的形式,那么称随机变量X 服从超几何分布.2.超几何分布的期望E (X )==np (p 为N 件产品的次品率).七、二项分布与超几何分布的区别1.看总体数是否给出,未给出或给出总体数较大一般考查二项分布,此时往往会出现重要的题眼“将频率视为概率”.2.看一次抽取抽中“次品”概率是否给出,若给出或可求出一般考查二项分布.3.看一次抽取的结果是否只有两个结果,若只有两个对立的结果A 或A ,一般考查二项分布.4.看抽样方法,如果是有放回抽样,一定是二项分布;若是无放回抽样,需要考虑总体数再确定.5.看每一次抽样试验中,事件是否独立,事件发生概率是否不变,若事件独立且概率不变,一定考查二项分布,这也是判断二项分布的最根本依据.6.把握住超几何分布与二项分布在定义叙述中的区别,超几何分布多与分层抽样结合,出现“先抽,再抽”的题干信息.7.二项分布一般地,在n 重伯努利试验中,设每次试验中事件A 发生的概率为p (0<p <1),用X 表示事件A 发生的次数,则X 的分布列为:P (X =k )=C k n p k(1−p )n −k ,k =0,1,2,⋅⋅⋅n ,如果随机变量X 的分布列具有上式的形式,则称随机变量X 服从二项分布,记作X ~B (n ,p )8.一般地,可以证明:如果X ~B (n ,p ),那么EX =np ,DX =np (1−p ).八、二项分布的两类最值(1)当p 给定时,可得到函数f (k )=C k n p k (1−p )n −k ,k =0,1,2,⋅⋅⋅n ,这个是数列的最值问题.p kp k −1=C n k p k (1−p )n −k C k −1n p k −1(1−p )n −k +1=(n −k +1)p k (1−p )=k (1−p )+(n +1)p −k k (1−p )=1+(n +1)p −k k (1−p ).分析:当k <(n +1)p 时,p k >p k −1,p k 随k 值的增加而增加;当k >(n +1)p 时,p k <p k −1,p k 随k 值的增加而减少.如果(n +1)p 为正整数,当k =(n +1)p 时,p k =p k −1,此时这两项概率均为最大值.如果(n +1)p 为非整数,而k 取(n +1)p 的整数部分,则p k 是唯一的最大值.注:在二项分布中,若数学期望为整数,则当随机变量k 等于期望时,概率最大.(2)当k 给定时,可得到函数f (p )=C k n p k(1−p )n −k ,p ∈(0,1),这个是函数的最值问题,这可以用导数求函数最值与最值点.分析:f '(p )=C k n kp k −1(1−p )n −k −p k (n −k )(1−p )n −k −1=C k n p k −1(1−p )n −k −1k (1−p )−(n −k )p =C k n p k −1(1−p )n −k −1(k −np ).当k =1,2,⋯,n −1时,由于当p <k n 时,f '(p )>0,f (p )单调递增,当p >kn时,f '(p )<0,f (p )单调递减,故当p =k n 时,f (p )取得最大值,f (p )max =f kn.又当p →0,f (p )→1,当p →0时,f (p )→0,从而f (p )无最小值.九、复杂概率计算(1)善于引入变量表示事件:可用“字母+变量角标”的形式表示事件“第几局胜利”,例如:A i 表示“第i 局比赛胜利”,则A i表示“第i 局比赛失败”.(2)理解事件中常见词语的含义:A ,B 中至少有一个发生的事件为A ∪B ;A ,B 都发生的事件为AB ;A ,B 都不发生的事件为;A ,B 恰有一个发生的事件为A ∪B ;A ,B 至多一个发生的事件为A ∪B ∪.(3)善于“正难则反”求概率:若所求事件含情况较多,可以考虑求对立事件的概率,再用P A =1-P A解出所求事件概率.十、条件概率1.条件概率定义一般地,设A ,B 为两个随机事件,且P (A )>0,我们称P (B |A )=P (AB )P (A )为在事件A 发生的条件下,事件B 发生的条件概率,简称条件概率.可以看到,P (B |A )的计算,亦可理解为在样本空间A 中,计算AB 的概率. 于是就得到计算条件概率的第二种途,即P (B |A )=n (AB )n (A )=n AB n Ω n A n Ω=P ABP A.特别地,当P (B |A )=P (B )时,即A ,B 相互独立,则P (AB )=P (A )P (B ).2.条件概率的性质设P (A )>0,全样本空间定义为Ω,则(1)P Ω|A =1;(2)如果B 与C 是两个互斥事件,则P ((B ∪C )|A )=P B |A +P C |A ;(3)设事件A 和B 互为对立事件,则P (B∣A )=1-P (B ∣A ).十一、全概率公式与贝叶斯公式1.在全概率的实际问题中我们经常会碰到一些较为复杂的概率计算,这时,我们可以用“化整为零”的思想将它们分解为一些较为容易的情况分别进行考虑一般地,设A 1,A 2,⋯,A n 是一组两两互斥的事件,A 1∪A 2∪⋯∪A n =Ω,且P A i >0,i =1,2,⋯,n ,则对任意的事件B ⊆Ω,有P (B )=ni =1P A i P B ∣A i .我们称上面的公式为全概率公式,全概率公式是概率论中最基本的公式之一.2.贝叶斯公式设A 1,A 2,⋯,A n 是一组两两互斥的事件,A 1∪A 2∪⋯∪A n =Ω,且P A i >0,i =1,2,⋯,n ,则对任意事件B ⊆Ω,P B >0,有P A i ∣B =P A i P B ∣A iP (B )=P A i P B ∣A ink =1P A k P B ∣A k,i =1,2,⋯,n .在贝叶斯公式中,P A i 和P A i |B 分别称为先验概率和后验概率.十二、一维随机游走与马尔科夫链1.转移概率:对于有限状态集合S ,定义:P i ⋅j =P X n +1=j X n =i 为从状态i 到状态j 的转移概率.2.马尔可夫链:若P X n +1=i X n =i ,X n -1=i n -1,⋅⋅⋅,X 0=i 0=P X n +1=j X n =i =P ij ,即未来状态X n +1只受当前状态X n 的影响,与之前的X n -1,X n -2,⋅⋅⋅,X 0无关.3.一维随机游走模型.设数轴上一个点,它的位置只能位于整点处,在时刻t =0时,位于点x =i i ∈N + ,下一个时刻,它将以概率α或者βα∈0,1 ,α+β=1 向左或者向右平移一个单位. 若记状态X t =i 表示:在时刻t 该点位于位置x =i i ∈N + ,那么由全概率公式可得:P X t +1=i =P X t =i -1 ⋅P X t +1=i X t =i -1 +P X t =i +1 ⋅P X t +1=i X t =i +1 另一方面,由于P X t +1=i X t =i -1 =β,P X t +1=i X t =i +1 =α,代入上式可得:P i =α⋅P i +1+β⋅P i -1进一步,我们假设在x =0与x =m m >0,m ∈N + 处各有一个吸收壁,当点到达吸收壁时被吸收,不再游走.于是,P 0=0,P m =1随机游走模型是一个典型的马尔科夫过程.进一步,若点在某个位置后有三种情况:向左平移一个单位,其概率为a ,原地不动,其概率为b ,向右平移一个单位,其概率为c ,那么根据全概率公式可得:P i =a ⋅P i +1+b ⋅P i +c ⋅P i -1有了这样的理论分析,下面我们看全概率公式及以为随机游走模型在2019年全国1卷中的应用.十三、统计1.线性回归方程与最小二乘法(1)回归直线方程过样本点的中心(x ,y ),是回归直线方程最常用的一个特征(2)我们将y =b x +a称为Y 关于x 的线性回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做最小二乘法,求得的b ,a叫做b ,a 的最小二乘估计(leastsquaresestimate ),其中b =ni =1x i -xy i -y n i =1x i -x 2 =ni =1x i y i -nx ⋅y ni =1x 2i -nx2a =y -b x .(3)残差的概念对于响应变量Y ,通过观测得到的数据称为观测值,通过经验回归方程得到的y称为预测值,观测值减去预测值称为残差.残差是随机误差的估计结果,通过残差的分析可以判断模型刻画数据的效果,以及判断原始数据中是否存在可疑数据等,这方面工作称为残差分析.(4)刻画回归效果的方式(i )残差图法:作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图.若残差点比较均匀地落在水平的带状区域内,带状区域越窄,则说明拟合效果越好.(ii )残差平方和法:残差平方和ni =1y i -y i 2 ,残差平方和越小,模型拟合效果越好,残差平方和越大,模型拟合效果越差.(iii )利用R 2刻画回归效果:决定系数R 2是度量模型拟合效果的一种指标,在线性模型中,它代表解释变量客立预报变量的能力.R 2=1ni =1y i -yi 2ni =1y i -y2,R 2越大,即拟合效果越好,R 2越小,模型拟合效果越差.第二部分.试题汇编一、单选题2.(福建省福州市普通高中2023届高三毕业班质量检测(二检))若二项式3x 2+1x2n展开式中存在常数项,则正整数n 可以是()A.3B.5C.6D.7【详解】二项式3x 2+1x2n展开式的通项为T r +1=C r n(3x 2)n -r1x 2r =3n -r C r n x 2n -4r,令2n -4r =0,解得:r =n2,又因为0≤r ≤n 且r 为整数,所以n 为2的倍数,所以n =6,故选:C .3.(福建省福州市普通高中2023届高三毕业班质量检测(二检))为培养学生“爱读书、读好书、普读书”的良好习惯,某校创建了人文社科类、文学类、自然科学类三个读书社团.甲、乙两位同学各自参加其中一个社团,每位同学参加各个社团的可能性相同,则这两位同学恰好参加同一个社团的概率为()A.13B.12C.23D.34【详解】记人文社科类、文学类、自然科学类三个读书社团分别为a ,b ,c ,则甲、乙两位同学各自参加其中一个社团的基本事件有a ,a ,a ,b ,a ,c ,b ,a ,b ,b ,b ,c ,c ,a ,c ,b ,c ,c 共9种,而这两位同学恰好参加同一个社团包含的基本事件有a ,a ,b ,b ,c ,c 共3种,故这两位同学恰好参加同一个社团的概率P =39=13.故选:A 4.(福建省厦门市2023届高三下学期第二次质量检测)ax +y 5的展开式中x 2y 3项的系数等于80,则实数a =()A.2B.±2C.22D.±22【详解】展开式的通项公式是T r +1=C r 5⋅ax 5-r ⋅y r ,当r =3时,x 2y 3项的系数为C 35⋅a 2=80,解得:a =±2 2.故选:D5.(福建省厦门市2023届高三下学期第二次质量检测)厦门山海健康步道云海线全长约23公里,起于东渡邮轮广场,终于观音山沙滩,沿线申联贸鸟湖、狐尾山、仙岳山、园山、薛岭山、虎头山、金山、湖边水库、五缘湾、虎仔山、观音山等“八山三水”.市民甲计划从“八山三水”这11个景点中随机选取相邻的3个游览,则选取的景点中有“水”的概率为()A.13B.49C.59D.109165【详解】11个景点随机选取相邻的3个游览,共有9种情况,选取景点中有“水”的对立事件是在狐尾山、仙岳山、园山、薛岭山、虎头山、金山中选取3个相邻的,共有4种情况,则其概率P =49,则11个景点中随机选取相邻的3个游览,则选取的景点中有“水”的概率P =1-49=59.故选:C 6.(广东省2023届高考一模)如图,在两行三列的网格中放入标有数字1,2,3,4,5,6的六张卡片,每格只放一张卡片,则“只有中间一列两个数字之和为5”的不同的排法有()A.96种B.64种C.32种D.16种【详解】根据题意,分3步进行,第一步,要求“只有中间一列两个数字之和为5”,则中间的数字只能为两组数1,4或2,3中的一组,共有2A 22=4种排法;第二步,排第一步中剩余的一组数,共有A 14A 12=8种排法;第三步,排数字5和6,共有A 22=2种排法;由分步计数原理知,共有不同的排法种数为4×8×2=64.故选:B .7.(广东省佛山市2023届高三教学质量检测(一))已知事件A ,B ,C 的概率均不为0,则P A =P B的充要条件是()A.P A ∪B =P A +P BB.P A ∪C =P B ∪CC.P AB =P ABD.P AC =P BC【详解】解:对于A :因为P A ∪B =P A +P B -P A ∩B ,由P A ∪B =P A +P B ,只能得到P A ∩B =0,并不能得到P A =P B ,故A 错误;对于B :因为P A ∪C =P A +P C -P A ∩C ,P B ∪C =P B +P C -P B ∩C ,由P A ∪C =P B ∪C ,只能得到P A -P A ∩C =P B -P B ∩C ,由于不能确定A ,B ,C 是否相互独立,故无法确定P A =P B ,故B 错误;对于C :因为P AB =P A -P AB ,P AB =P B -P AB ,又P AB =P AB ,所以P A =P B ,故C 正确;对于D :由于不能确定A ,B ,C 是否相互独立,若A ,B ,C 相互独立,则P AC =P A P C ,P BC =P B P C ,则由P AC =P BC 可得P A =P B ,故由P AC =P BC 无法确定P A =P B ,故D 错误;故选:C8.(广东省广州市2023届高三综合测试(一))“回文”是古今中外都有的一种修辞手法,如“我为人人,人人为我”等,数学上具有这样特征的一类数称为“回文数”、“回文数”是指从左到右与从右到左读都一样的正整数,如121,241142等,在所有五位正整数中,有且仅有两位数字是奇数的“回文数”共有()A.100个B.125个C.225个D.250个【详解】依题意,五位正整数中的“回文数”具有:万位与个位数字相同,且不能为0;千位与十位数字相同,求有且仅有两位数字是奇数的“回文数”的个数有两类办法:最多1个0,取奇数字有A15种,取能重复的偶数字有A14种,它们排入数位有A22种,取偶数字占百位有A15种,不同“回文数”的个数是A15A14A22A15=200个,最少2个0,取奇数字有A15种,占万位和个位,两个0占位有1种,取偶数字占百位有A15种,不同“回文数”的个数是A15A15=25个,由分类加法计算原理知,在所有五位正整数中,有且仅有两位数字是奇数的“回文数”共有200+25=225个.故选:C9.(广东省深圳市2023届高三第一次调研)安排5名大学生到三家企业实习,每名大学生只去一家企业,每家企业至少安排1名大学生,则大学生甲、乙到同一家企业实习的概率为()A.15B.310C.325D.625【详解】5名大学生分三组,每组至少一人,有两种情形,分别为2,2,1人或3,1,1人;当分为3,1,1人时,有C35A33=60种实习方案,当分为2,2,1人时,有C25C23A22⋅A33=90种实习方案,即共有60+90=150种实习方案,其中甲、乙到同一家企业实习的情况有C13A33+C23A33=36种,故大学生甲、乙到同一家企业实习的概率为36150=625,故选:D.10.(湖北省七市(州)2023届高三下学期3月联合统一调研测试)一组数据按照从小到大的顺序排列为1,2,3,5,6,8,记这组数据的上四分位数为n,则二项式2x-1xn展开式的常数项为()A.-160B.60C.120D.240【详解】因为6×75%=4.5,所以n=6,所以2x-1 x6展开式的通项为:T r+1=C r62x6-r-1 xr=C r6⋅26-r⋅-1 r⋅x6-32r,令6-32r=0得:r=4,所以展开式的常数项为C46×22×-14=60,故选:B.11.(江苏省八市(南通、泰州、扬州、徐州、淮安、连云港、宿迁、盐城)2023届高三二模)已知x3+2x2n的展开式中各项系数和为243,则展开式中常数项为()A.60B.80C.100D.120【详解】当x=1时,3n=243,解得n=5,则x3+2 x2n的展开式第r+1项T r+1=C r5(x3)5-r2x2 r=C r5 x15-3r2r x-2r=C r52r x15-5r,令15-5r=0,解得r=3,所以C3523=10×8=80,故选:B12.(江苏省南京市、盐城市2023届高三下学期一模)某种品牌手机的电池使用寿命X(单位:年)服从正态分布N 4,σ2 σ>0 ,且使用寿命不少于2年的概率为0.9,则该品牌手机电池至少使用6年的概率为()A.0.9B.0.7C.0.3D.0.1【详解】由题得:P x ≥2 =0.9,故P x <2 =0.1,因为6+22=4,所以根据对称性得:P x ≥6 =P x <2 =0.1.故选:D .13.(江苏省苏锡常镇四市2023届高三下学期3月教学情况调研(一))“绿水青山,就是金山银山”,随着我国的生态环境越来越好,外出旅游的人越来越多.现有两位游客慕名来江苏旅游,他们分别从“太湖鼋头渚、苏州拙政园、镇江金山寺、常州恐龙园、南京夫子庙、扬州瘦西湖”这6个景点中随机选择1个景点游玩.记事件A 为“两位游客中至少有一人选择太湖鼋头渚”,事件B 为“两位游客选择的景点不同”,则P B A =()A.79B.89C.911D.1011【详解】由题可得P A =6×6-5×56×6=1136,P AB =2×56×6=518,所以P B A =P ABP A=5181136=1011.故选:D .14.(2023年湖北省八市高三(3月)联考)甲、乙、丙、丁、戊5名志愿者参加新冠疫情防控志愿者活动,现有A ,B ,C 三个小区可供选择,每个志愿者只能选其中一个小区.则每个小区至少有一名志愿者,且甲不在A 小区的概率为()A.193243B.100243C.23D.59【详解】首先求所有可能情况,5个人去3个地方,共有35=243种情况,再计算5个人去3个地方,且每个地方至少有一个人去,5人被分为3,1,1或2,2,1当5人被分为3,1,1时,情况数为C 35×A 33=60;当5人被分为2,2,1时,情况数为C 15×C 24A 22×A 33=90;所以共有60+90=150.由于所求甲不去A ,情况数较多,反向思考,求甲去A 的情况数,最后用总数减即可,当5人被分为3,1,1时,且甲去A ,甲若为1,则C 34×A 22=8,甲若为3,则C 24×A 22=12,共计8+12=20种,当5人被分为2,2,1时,且甲去A ,甲若为1,则C 24A 22×A 22=6,甲若为2,则C 14×C 13×A 22=24,共计6+24=30种,所以甲不在A 小区的概率为150-20+30 243=100243,故选:B .15.(山东省济南市2023届高三下学期3月一模)从正六边形的6个顶点中任取3个构成三角形,则所得三角形是直角三角形的概率为()A.310B.12C.35D.910【详解】以点A为例,以点A为其中一个顶点的三角形有△ABC,△ABD,△ABE,△ABF,△ACD,△ACE,△ACF,△ADE,△ADF,△AEF,共10个,其中直角三角形为△ABD,△ABE,△ACD,△ACF,△ADE,△ADF,共6个,故所得三角形是直角三角形的概率为610=35.故选:C16.(山东省青岛市2023届高三下学期第一次适应性检测)某次考试共有4道单选题,某学生对其中3道题有思路,1道题完全没有思路.有思路的题目每道做对的概率为0.8,没有思路的题目,只好任意猜一个答案,猜对的概率为0.25.若从这4道题中任选2道,则这个学生2道题全做对的概率为()A.0.34B.0.37C.0.42D.0.43【详解】设事件A表示“两道题全做对”,若两个题目都有思路,则P1=C23C24×0.82=0.32,若两个题目中一个有思路一个没有思路,则P2=C11C13C24×0.8×0.25=0.1,故P(A)=P1+P2=0.32+0.1=0.42,故选:C17.(浙江省温州市普通高中2023届高三下学期3月第二次适应性考试)已知随机变量X服从正态分布N2,σ2,且P(X>3)=16,则P(X<1)=()A.13B.23C.16D.56【详解】随机变量X服从正态分布N2,σ2,显然对称轴X=2,所以由对称性知P(x<1)=P(x>3)=16,故选:C.18.(浙江省温州市普通高中2023届高三下学期3月第二次适应性考试)(1+x)n展开式中二项式系数最大的是C5n,则n不可能是()A.8B.9C.10D.11【详解】当n=9时,C59是最大的二项式系数,符合要求,当n=10时,C510是最大的二项式系数,符合要求,当n =11时,C 511=C 611是最大的二项式系数,符合要求,当n =8时,显然C 58<C 48,不满足,故选:A .19.(浙江省温州市普通高中2023届高三下学期3月第二次适应性考试)一枚质地均匀的骰子,其六个面的点数分别为1,2,3,4,5,6.现将此骰子任意抛掷2次,正面向上的点数分别为X 1,X 2.设Y 1=X 1,X 1≥X 2X 2,X 1<X 2 ,设Y 2=X 1,X 1≤X 2X 2,X 1>X 2 ,记事件A =“Y 1=5”,B =“Y 2=3”,则P B ∣A =()A.19B.29C.15D.211【详解】将此骰子任意抛掷2次,则基本事件的方法总数为36种,显然Y 1是取大函数,所以A =“Y 1=5”,则X 1,X 2中有一个数字是5,另一个数字小于等于5,有5×2-1=9种;显然Y 2是取小函数,所以A =“Y 1=5”,B =“Y 2=3”同时发生,则有3,5 和5,3 ;所以P A =936=14,P BA =236,所以P B ∣A =P BA P A=29.故选:B .二、多选题20.(福建省厦门市2023届高三下学期第二次质量检测)李明每天7:00从家里出发去学校,有时坐公交车,有时骑自行车.他各记录了50次坐公交车和骑自行车所花的时间,经数据分析得到:坐公交车平均用时30分钟,样本方差为36;自行车平均用时34分钟,样本方差为4.假设坐公交车用时X 和骑自行车用时Y 都服从正态分布,则()A.P (X >32)>P (Y >32)B.P (X ≤36)=P (Y ≤36)C.李明计划7:34前到校,应选择坐公交车D.李明计划7:40前到校,应选择骑自行车【详解】A .由条件可知X ∼N 30,62 ,Y ∼N 34,22 ,根据对称性可知P Y >32 >0.5>P X >32 ,故A 错误;B .P X ≤36 =P X ≤μ+σ , P Y ≤36 =P Y ≤μ+σ ,所以P X ≤36 =P Y ≤36 ,故B 正确;C . P X ≤34 >0.5=P Y ≤34 ,所以P X ≤34 >P Y ≤34 ,故C 正确;D . P X ≤40 <P X <42 =P X <μ+2σ ,P Y ≤40 =P Y ≤μ+3σ ,所以P X ≤40 <P Y ≤40 ,故D 正确.故选:BCD21.(广东省佛山市2023届高三教学质量检测(一))中国共产党第二十次全国代表大会的报告中,一组组数据折射出新时代十年的非凡成就,数字的背后是无数的付出,更是开启新征程的希望.二十大首场新闻发布会指出近十年我国居民生活水平进一步提高,其中2017年全国居民恩格尔系数为29.39%,这是历史上中国恩格尔系数首次跌破30%.恩格尔系数是由德国统计学家恩斯特·恩格尔提出的,计算公式是“恩格尔系数=食物支出金额总支出金额×100%”.恩格尔系数是国际上通用的衡量居民生活水平高低的一项重要指标,一般随居民家庭收入和生活水平的提高而下降,恩格尔系数达60%以上为贫困,50%~60%为温饱,40%~50%为小康,30%~40%为富裕,低于30%为最富裕.如图是近十年我国农村与城镇居民的恩格尔系数折线图,由图可知()A.城镇居民2015年开始进入“最富裕”水平B.农村居民恩格尔系数的平均数低于32%C.城镇居民恩格尔系数的第45百分位数高于29%D.全国居民恩格尔系数等于农村居民恩格尔系数和城镇居民恩格尔系数的平均数【详解】对于A:从折线统计图可知2015年开始城镇居民的恩格尔系数均低于30%,即从2015年开始进入“最富裕”水平,故A正确;对于B:农村居民恩格尔系数只有2017、2018、2019这三年在30%∼32%之间,其余年份均大于32%,且2012、2013这两年大于(等于)34%,故农村居民恩格尔系数的平均数高于32%,故B错误;对于C:城镇居民恩格尔系数从小到大排列(所对应的年份)前5位分别为2019、2018、2017、2021、2020,因为10×45%=4.5,所以第45百分位数为第5位,即2020年的恩格尔系数,由图可知2020年的恩格尔系数高于29%,故C正确;对于D:由于无法确定农村居民与城镇居民的比例,显然农村居民占比要大于50%,故不能用农村居民恩格尔系数和城镇居民恩格尔系数的平均数作为全国居民恩格尔系数,故D错误;故选:AC22.(广东省广州市2023届高三综合测试(一))某校随机抽取了100名学生测量体重,经统计,这些学生的体重数据(单位:kg)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则()A.频率分布直方图中a 的值为0.07B.这100名学生中体重低于60kg 的人数为60C.据此可以估计该校学生体重的第78百分位数约为62D.据此可以估计该校学生体重的平均数约为62.5【详解】对于A 项,因为5×(0.01+a +0.06+0.04+0.02)=1,解得:a =0.07,故A 项正确;对于B 项,(0.01+0.07+0.06)×5×100=70人,故B 项错误;对于C 项,因为0.01×5+0.07×5+0.06×5=0.7,0.01×5+0.07×5+0.06×5+0.04×5=0.9,0.7<0.78<0.9,所以第78百分位数位于[60,65)之间,设第78百分位数为x ,则0.01×5+0.07×5+0.06×5+(x -60)×0.04=0.78,解得:x =62,故C 项正确;对于D 项,因为0.01×5×47.5+0.07×5×52.5+0.06×5×57.5+0.04×5×62.5+0.02×5×67.5=57.25,即:估计该校学生体重的平均数约为57.25,故D 项错误.故选:AC .23.(湖北省七市(州)2023届高三下学期3月联合统一调研测试)下列命题中正确的是()A.若样本数据x 1,x 2,⋯,x 20的样本方差为3,则数据2x 1+1,2x 2+1,⋯,2x 20+1的方差为7B.经验回归方程为y=0.3-0.7x 时,变量x 和y 负相关C.对于随机事件A 与B ,P A >0,P B >0,若P A B =P A ,则事件A 与B 相互独立D.若X ∼B 7,12,则P X =k 取最大值时k =4【详解】对于A ,数据2x 1+1,2x 2+1,⋯,2x 20+1的方差为22×3=12,所以A 错误;对于B ,回归方程的直线斜率为负数,所以变量x 与y 呈负的线性相关关系,所以B 正确;对于C ,由P A B =P ABP B=P A ,得P AB =P A ⋅P B ,所以事件A 与事件B 独立,所以C正确;对于D ,由P X =k ≥P X =k +1P X =k ≥PX =k -1,即C k 712 7≥C k +17127C k 712 7≥Ck -17127,解得k =3或k =4,所以D 错误.故选:BC .24.(湖北省武汉市2023届高三下学期二月调研)在一次全市视力达标测试后,该市甲乙两所学校统计本校理科和文科学生视力达标率结果得到下表:甲校理科生甲校文科生乙校理科生乙校文科生达标率60%70%65%75%定义总达标率为理科与文科学生达标人数之和与文理科学生总人数的比,则下列说法中正确的有()A.乙校的理科生达标率和文科生达标率都分别高于甲校B.两校的文科生达标率都分别高于其理科生达标率C.若甲校理科生和文科生达标人数相同,则甲校总达标率为65%D.甲校的总达标率可能高于乙校的总达标率【详解】由表中数据可得甲校理科生达标率为60%,文科生达标率为70%,乙校理科生达标率为65%,文科生达标率为75%,故选项AB 正确;设甲校理科生有x 人,文科生有y 人,若0.6x =0.7y ,即6x =7y ,则甲校总达标率为0.6x +0.7yx +y=4265,选项C 错误;由总达标率的计算公式可知当学校理科生文科生的人数相差较大时,所占的权重不同,总达标率会接近理科生达标率或文科生达标率,当甲校文科生多于理科生,乙校文科生少于理科生时,甲校的总达标率可能高于乙校的总达标率,选项D 正确;故选:ABD25.(湖北省武汉市2023届高三下学期二月调研)已知离散型随机变量X 服从二项分布B n ,p ,其中n ∈N ∗,0<p <1,记X 为奇数的概率为a ,X 为偶数的概率为b ,则下列说法中正确的有()A.a +b =1 B.p =12时,a =b C.0<p <12时,a 随着n 的增大而增大 D.12<p <1时,a 随着n 的增大而减小【详解】对于A 选项,由概率的基本性质可知,a +b =1,故A 正确,对于B 选项,由p =12时,离散型随机变量X 服从二项分布B n ,12 ,则P =X =k =C kn12k1-12n -kk =0,1,2,3,⋯,n ,所以a =12nC 1n +C 3n +C 5n +⋯⋯ =12n×2n -1=12,b =12nC 0n+C 2n+C 4n+⋯⋯ =12n×2n -1=12,所以a =b ,故B 正确,。
北京市高考概率与统计解题技巧(基础篇)一、基础知识1. 等可能事件(古典概型)求概率方法:(1)什么是古典概型?基本事件的个数是有限个的,并且每一个基本事件的发生的概率相等。
(2)生活中的基本事件举例:投硬币、投骰子、选班长(不靠实力靠运气选)(3)概率公式:()=A P A 包含的基本事件的个数基本事件的总数例题1.(2020·北京平谷区高三一模)为了解本学期学生参加公益劳动的情况,某校从初高中学生中抽取100名学生,收集了他们参加公益劳动时间(单位:小时)的数据,绘制图表的一部分如表.从男生中随机抽取一人,抽到的男生参加公益劳动时间在[)10,20的概率:答案:100名学生中共有男生48名,其中共有20人参加公益劳动时间在[)10,20,设男生中随机抽取一人,抽到的男生参加公益劳动时间在[)10,20的事件为A ,那么()205 4812P A==;做题技巧:审题的时候一定要审清从哪里随机选取,确定选取范围;本题中是从男生中随机抽取一人。
拓展1-1(2020·北京西城区高三期末)高铁和航空的飞速发展不仅方便了人们的出行,更带动了我国经济的巨大发展.据统计,在2018年这一年内从A市到B市乘坐高铁或飞机出行的成年人约为50万人次.为了解乘客出行的满意度,现从中随机抽取100人次作为样本,得到下表(单位:人次):问题:在样本中任取1个,求这个出行人恰好不是青年人的概率;答案:设事件:“在样本中任取1个,这个出行人恰好不是青年人”为M,由表可得:样本中出行的老年人、中年人、青年人人次分别为19,39,42,所以在样本中任取1个,这个出行人恰好不是青年人的概率193929 ()10050P M+==.拓展1-28.(2020·北京市育英学校高三月考)自由购是通过自助结算方式购物的一种形式.某大型超市为调查顾客使用自由购的情况,随机抽取了100人,统计结果整理如下:(Ⅰ)现随机抽取1名顾客,试估计该顾客年龄在[)30,50且未使用自由购的概率;答案:在随机抽取的100名顾客中,年龄在[30,50)且未使用自由购的共有3+14=17人,所以,随机抽取1名顾客,估计该顾客年龄在[30,50)且未使用自由购的概率为17100P=.拓展1-3(2020·北京人大附中高三月考)某市旅游管理部门为提升该市26个旅游景点的服务质量,对该市26个旅游景点的交通、安全、环保、卫生、管理五项指标进行评分.每项评分最低分0分,最高分100分.每个景点总分为这五项得分之和,根据考核评分结果,绘制交通得分与安全得分散点图、交通得分与景点总分散点图如图请根据图中所提供的信息,完成下列问题:(1)若从交通得分排名前5名的景点中任取1个,求其安全得分大于90分的概率;答案:由图象可知交通得分排名前5名的景点中,安全得分大于90分的景点有3个, ∴从交通得分排名前5名的景点中任取1个,其安全得分大于90分的概率为35.2. 分层抽样在北京高考试题中考察:(1)知识拓展:抽样方法:1.简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.2.系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).3.分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.(2)分层抽样计算公式:样本总个数的个数样本中总体个数的个数总体中A A =(3)分层抽样举例:北京市牛栏山一中有高三学生1500人,其中男生1000人,女生500人,现按照分层抽样的方式随机抽取30人,男生抽取人数为多少人?3015001000x=例题:3.(2020·北京人大附中高三月考)2019年底,北京2022年冬奥组委会启动志愿者全球招募,仅一个月内报名人数便突破60万,其中青年学生约有50万人.现从这50万青年学生志愿者中,按男女分层抽样随机选取20人进行英语水平测试,所得成绩(单位:分)统计结果用茎叶图记录如下:(Ⅰ)试估计在这50万青年学生志愿者中,英语测试成绩在80分以上的女生人数;答案:(Ⅰ)样本中女生英语成绩在80分以上的有2人,故人数为:250520⨯=万人.拓展2-1(2019·门头沟一模(文))在某区“创文明城区”(简称“创城”)活动中,教委对本区,,,A B C D四所高中学校按各校人数分层抽样,随机抽查了100人,将调查情况进行整理后制成下表:(注:参与率是指:一所学校“创城”活动中参与的人数与被抽查人数的比值)假设每名高中学生是否参与”创城”活动是相互独立的.(1)若该区共2000名高中学生,估计A学校参与“创城”活动的人数;答案:(1)A学校高中生的总人数为1005010002000÷=人A学校参与“创城”活动的人数为40 100080050⨯=人拓展2-2(2020·北京房山区高一期末)中学生研学旅行是通过集体旅行、集中食宿方式开展的研究性学习和旅行体验相结合的校外教育活动,是学校教育和校外教育衔接的创新形式,是综合实践育人的有效途径.每年暑期都会有大量中学生参加研学旅行活动.为了解某地区中学生暑期研学旅行支出情况,在该地区各个中学随机抽取了部分中学生进行问卷调查,从中统计得到中学生暑期研学旅行支出(单位:百元)频率分布直方图如图所示.利用分层抽样在[40,45),[45,50),[50,55]三组中抽取5人,应从这三组中各抽取几人?答案:由频率分布直方图可知[40,45),[45,50),[50,55)三组的频数的比为0.06:0.02:0.023:1:1=,所以从[40,45)中抽取:353311⨯=++人,从[45,50)中抽取:151311⨯=++人,从[50,55)中抽取:151311⨯=++人,所以从这三组中抽取的人数分别为3,1,1;3.超几何分布:从有限N 个物件(其中包含M 个指定种类的物件)中抽出n 个物件,成功抽出该指定种类的物件的次数(不放回)。
重难点05 概率与统计【高考考试趋势】统计主要考查抽样的统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算.试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,几何概型解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差.概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活.取代了传统意义上的应用题,成为高考中的亮点.解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注【知识点分析以及满分技巧】1抽样方法是统计学的基础,在复习时要抓住各种抽样方法的概念以及它们之间的区别与联系.茎叶图也成为高考的热点内容,应重点掌握.明确变量间的相关关系,体会最小二乘法和线性回归方法是解决两个变量线性相关的基本方法,就能适应高考的要求.2.求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因.(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.3.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.【常见题型限时检测】(建议用时:35分钟)一、单选题1.(2019·广西高考模拟(理))中国古代的五经是指:《诗经》、《尚书》、《礼记》、《周易》、《春秋》,甲、乙、丙、丁、戊5名同学分别选取了其中一本不同的书作为课外兴趣研读,若甲乙都没有选《诗经》,乙也没选《春秋》,则5名同学所有可能的选择有()A.18种B.24种C.36种D.54种【答案】D【分析】分两类求解:(1)甲选《春秋》;(2)甲不选《春秋》;分别求出可能的选择情况,再求和即可得出结果.【详解】(1)若甲选《春秋》,则有133318C A=种情况;(2)若甲不选《春秋》,则有233336A A=种情况;+=种情况.所以5名同学所有可能的选择有183654故选D【点睛】本题主要考查计数原理,熟记排列组合的概念等即可,属于常考题型. 2.(2020·重庆巴蜀中学高三月考(理))新高考方案规定,普通高中学业水平考试分为合格性考试(合格考)和选择性考试(选择考).其中“选择考”成绩将计入高考总成绩,即“选择考”成绩根据学生考试时的原始卷面分数,由高到低进行排序,评定为A、B、C、D、E五个等级.某试点高中2018年参加“选择考”总人数是2016年参加“选择考”总人数的2倍,为了更好地分析该校学生“选择考”的水平情况,统计了该校2016年和2018年“选择考”成绩等级结果,得到如下图表:针对该校“选择考”情况,2018年与2016年比较,下列说法正确的是()A.获得A等级的人数减少了B.获得B等级的人数增加了1.5倍C.获得D等级的人数减少了一半D.获得E等级的人数相同【答案】B【分析】设出两年参加考试的人数,然后根据图表计算两年等级为A,B,C,D,E的人数,由此判断出正确选项.【详解】设2016年参加考试x人,则2018年参加考试2x人,根据图表得出两年各个等级的人数如下图所示:由图可知A,C,D 选项错误,B 选项正确,故本小题选B. 【点睛】本小题主要考查图表分析,考查数据分析与处理能力,属于基础题.3.(2019·广东高考模拟(理))己知某产品的销售额y 与广告费用x 之间的关系如下表:若求得其线性回归方程为 6.5ˆyx a =+,则预计当广告费用为6万元时的销售额为 A .42万元 B .45万元C .48万元D .51万元【答案】C 【分析】根据上表中的数据,求得样本点中心(),x y ,代入回归直线的方程,求得a 的值,得到回归直线的方程,即可求解. 【详解】由题意,根据上表中的数据,可得2x =,22y =,即回归方程经过样本点中心(),x y ,又由线性回归方程为 6.5ˆyx a =+,所以22 6.52a =⨯+,解得9a =, 所以 6.59ˆyx =+,当6x =时,ˆ48y =,故选C. 【点睛】本题主要考查了回归直线方程的应用问题,其中解答中熟记回归直线方程的性质,求得归直线的方程是解答的关键,着重考查了运算与求解能力,属于基础题.4.(2019·横峰中学高考模拟(理))已知(1)n x λ+展开式中第三项的二项式系数与第四项的二项式系数相同,且01(1)n x a a x λ+=++22nn a x a x +⋯+,若12242n a a a ++⋯+=,则4()x xλ+展开式中常数项( )A .32B .24C .4D .8【答案】B 【分析】先由二项展开式中第三项的二项式系数与第四项的二项式系数相同,求出n ;再由2012(1)n n n x a a x a x a x λ+=+++⋯+求出λ,由二项展开式的通项公式,即可求出结果.【详解】因为(1)nx λ+展开式中第三项的二项式系数与第四项的二项式系数相同, 所以23n n C C =,因此5n =,又5205125(1)x a a x a x a x λ+=+++⋯+,所以01a =, 令1x =,则01525(1)a a a a λ+=+++⋯+,又125242a a a ++⋯+=,所以55(3)3124λ+==,因此2λ=, 所以42()x x +展开式的通项公式为44214422k k k k k k k k T C x x C x ---+==,由420k -=得2k =,因此42()x x+展开式中常数项为2234224T C ==.故选B【点睛】本题主要考查求指定项的系数,熟记二项式定理即可,属于常考题型. 5.(2019·山东高三月考)2521(2)(1)x x+-的展开式的常数项是( ) A .3- B .2-C .2D .3【答案】D 【详解】的展开式通项为:,由2100r -=得=5r ,所以的常数项系数为;由2102r -=-得4r =,所以的 项系数为,所以的展开式的常数项是,故选D.6.(2019·安徽高考模拟(理))2019年5月22日具有“国家战略”意义的“长三角一体化”会议在芜湖举行;长三角城市群包括:上海市以及江苏省、浙江省、安徽省三省部分城市,简称“三省一市”. 现有4 名高三学生准备高考后到上海市、江苏省、浙江省、安徽省四个地方旅游,假设每名同学均从这四个地方中任意选取一个去旅游, 则恰有一个地方未被选中的概率为()A.2764B.916C.81256D.716【答案】B【分析】根据排列组合的知识分别求解出恰有一个地方未被选中的情况和所有情况,利用古典概型计算可得结果.【详解】4名同学去旅游的所有情况有:44256=种恰有一个地方未被选中共有:2113424322144C CC AA⋅⋅=种情况∴恰有一个地方未被选中的概率:144925616 p==本题正确选项:B【点睛】本题考查古典概型计算概率的问题、排列组合中的分组分配问题;关键是能够利用排列组合的知识准确求解出恰有一个地方未被选中的情况种数;易错点是忽略了分组分配中的平均分配问题.二、解答题7.(2020·四川高三期末(理))随着科技的发展,网络已逐渐融入了人们的生活.网购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;①将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X ,求随机变量X 的数学期望和方差.参考公式:()()()()()22n ad bc K a b c d a c b d -=++++【答案】(①)详见解析;(①)①4960;①数学期望为6,方差为2.4. 【分析】(1)完成列联表,由列联表,得2258.333 6.6353K =≈>,由此能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关.(2)① 由题意所抽取的10名女市民中,经常网购的有70107100⨯=人,偶尔或不用网购的有30103100⨯=人,由此能选取的3人中至少有2人经常网购的概率. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=,由题意100.6X B :(,),由此能求出随机变量X 的数学期望()E X 和方差()D X . 【详解】解:(1)完成列联表(单位:人):由列联表,得: ()2220050305070258.333 6.635120801001003K ⨯⨯-⨯==≈>⨯⨯⨯, ①能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关. (2)①由题意所抽取的10名女市民中,经常网购的有70107100⨯=人, 偶尔或不用网购的有30103100⨯=人, ①选取的3人中至少有2人经常网购的概率为:2137373104960c c c P c +==. ① 由22⨯列联表可知,抽到经常网购的市民的频率为:1200.6200=, 将频率视为概率,①从我市市民中任意抽取一人,恰好抽到经常网购市民的概率为0.6, 由题意()100.6X B :,, ①随机变量X 的数学期望()100.66E X =⨯=, 方差D (X )=()100.60.4 2.4D X =⨯⨯=. 【点睛】本题考查独立检验的应用,考查概率、离散型随机变量的分布列、数学期望、方差的求法,考查古典概型、二项分布等基础知识,考查运算求解能力,是中档题.8.(2020·四川高三期末(理))某市教育部门为了了解全市高一学生的身高发育情况,从本市全体高一学生中随机抽取了100人的身高数据进行统计分析.经数据处理后,得到了如下图1所示的频事分布直方图,并发现这100名学生中,身不低于1.69米的学生只有16 名,其身高茎叶图如下图2所示,用样本的身高频率估计该市高一学生的身高概率.(I)求该市高一学生身高高于1.70米的概率,并求图1中a b c 、、的值.(II)若从该市高一学生中随机选取3名学生,记ξ为身高在(]1.501.70,的学生人数,求ξ 的分布列和数学期望;(①)若变量S 满足-<+)>0.6826PS (μσμσ≤且22)0.9544P S μσμσ-≤+(,则称变量S 满足近似于正态分布2(,)N μσ的概率分布.如果该市高一学生的身高满足近似于正态分布(1.6,0.01)N 的概率分布,则认为该市高一学生的身高发育总体是正常的.试判断该市高一学生的身高发育总体是否正常,并说明理由. 【答案】(I) 见解析;(①)见解析;(①) 见解析. 【解析】分析: (I)先求出身高高于1.70米的人数,再利用概率公式求这批学生的身高高于1.70 的概率.分别利用面积相等求出a 、b 、c 的值. (II)先求出从这批学生中随机选取1名,身高在[]1.501.70,的概率,再利用二项分布写出ξ的分布列和数学期望. (①)先分别计算出-<X +P μσμσ≤()和22)PS μσμσ-<≤+(,再看是否满足-<+)>0.6826P S μσμσ≤(且22)0.9544P S μσμσ-<≤+>(,给出判断.详解: (I)由图2 可知,100名样本学生中身高高于1.70米共有15 名,以样本的频率估计总体的概率,可得这批学生的身高高于1.70 的概率为0.15. 记X 为学生的身高,结合图1可得:2(1.30 1.40)(1.80 1.90)0.02100f X f X <≤=<≤==, 13(1.40 1.50)(1.70 1.80)0.13100f X f X <≤=<≤==,1(1.50 1.60)(1.60 1.70)(120.0220.13)0.352f X f X <≤=<≤=-⨯-⨯=,又由于组距为0.1,所以0.2a =, 1.3 3.5b c ==, (①)以样本的频率估计总体的概率,可得: 从这批学生中随机选取1名,身高在[]1.501.70,的概率 (1.50 1.70)(1.50 1.60)+(1.60 1.70)0.7P X f X f X <≤=<≤<≤=.因为从这批学生中随机选取3 名,相当于三次重复独立试验, 所以随机变量ξ服从二项分布(3,0.7)B ,故ξ的分布列为:()3()?0.3?0.70,1,2,33n nn P n C n ξ-====00.027+10.189+20.441+30.343=2.1E ξ⨯⨯⨯⨯()(或=30.7=2.1E ())ξ⨯(①)由 1.60.01N (,),取=1.60=0.1μσ, 由(①)可知,-<X += 1.50 1.70)0.70.6826PP X μσμσ≤<≤=>()(, 又结合(I),可得:-2<X +2= 1.40 1.80)PP X μσμσ≤<≤()( =2 1.70<X 1.80 1.50 1.70)0.960.544f P X ⨯≤+<≤=>()(,所以这批学生的身高满足近似于正态分布(1.60.01N ,)的概率分布,应该认为该市高一学生的身高发育总体是正常的.【点睛】:(1)本题不难,但是题目的设计比较新颖,有的同学可能不能适应. 遇到这样的问题,首先是认真审题,理解题意,再解答就容易了. (2)在本题的解答过程中,要灵活利用频率分布图计算概率.9.(2019·陕西西北工业大学附属中学高考模拟(理))2017年3月智能共享单车项目正式登陆某市,两种车型(“小绿车”、“小黄车”)采用分时段计费的方式,“小绿车”每30分钟收费0.5元(不足30分钟的部分按30分钟计算);“小黄车”每30分钟收费1元(不足30分钟的部分按30分钟计算).有甲、乙、丙三人相互独立的到租车点租车骑行(各租一车一次).设甲、乙、丙不超过30分钟还车的概率分别为34,23,12,三人租车时间都不会超过60分钟.甲、乙均租用“小绿车”,丙租用“小黄车”.()1求甲、乙两人所付的费用之和等于丙所付的费用的概率;(2)设甲、乙、丙三人所付的费用之和为随机变量ξ,求ξ的分布列和数学期望.【答案】(1)724;(2)见解析.【解析】【分析】(1)利用相互独立事件的概率公式,分两种情况计算概率即可;(2)根据相互独立事件的概率公式求出各种情况下的概率,得出分布列,利用公式求解数学期望.【详解】(I)由题意得,甲乙丙在30分钟以上且不超过60分钟还车的概率分别为.记甲、乙两人所付的费用之和等于丙所付的费用为事件A.则,答:甲、乙两人所付的费用之和等于丙所付的费用的概率为,(①)ξ可能取值有2,2.5,3,3.5,4,①;;;,.甲、乙、丙三人所付的租车费用之和ξ的分布列为:①.【点睛】本题主要考查了相互对立事件的概率的计算,以及离散型随机变量的分布列、数学期望的求解,其中正确理解题意,利用相互独立事件的概率计算公式求解相应的概率是解答的关键,着重考查了分析问题和解答问题的能力,能很好的考查考生数学应用意识、基本运算求解能力等.10.(2019·江西高三月考(理))据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改革”引起广泛关注,为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:(1)已知在全体样本中随机抽取1人,抽到持“应该保留”态度的人的概率为0.05,现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)在持“应该保留”态度的人中,用分层抽样的方法抽取6人,再平均分成两组进行深入交流,求第一组中在校学生人数ξ的分布列和数学期望.【答案】(1)72;(2)2 .【解析】【分析】(1)由题意得持“应该保留”态度的人为120x+,占总人数3600的0.05,列出对应的概率等式即可算得60x=,再利用分层抽样的方法求解在持“无所谓”态度的人中抽取多少人即可.(2)由分层抽样可求得在校学生为4人,社会人士为2人,再利用超几何分布的方法列出分布列求解期望即可.【详解】(1)因为抽到持“应该保留”态度的人的概率为0.05,所以1200.053600x+=,所以60x=.所以持“无所谓”态度的人数共有3600210012060060720----=,所以应在“无所谓”态度抽取360720723600⨯=人. (2)解:由(①)知持“应该保留”态度的一共有180人, 所以在所抽取的6人中,在校学生为12064180⨯=人, 社会人士为6062180⨯=人, 则第一组在校学生人数1,2,3ξ=1242361(1)5C C P C ξ===,2142363(2)5C C P C ξ===,3042361(3)5C C P C ξ===, 即ξ的分布列为:所以1311232555E ξ=⨯+⨯+⨯=. 【点睛】本题主要考查分层抽样的一般方法与超几何分布的一般方法.同时也考查了分布列与数学期望的方法,属于中等题型.11.(2019·深圳市高级中学高考模拟(理))某景区的各景点从2009年取消门票实行免费开放后,旅游的人数不断地增加,不仅带动了该市淡季的旅游,而且优化了旅游产业的结构,促进了该市旅游向“观光、休闲、会展”三轮驱动的理想结构快速转变.下表是从2009年至2018年,该景点的旅游人数y (万人)与年份x 的数据:该景点为了预测2021年的旅游人数,建立了y 与x 的两个回归模型:模型①:由最小二乘法公式求得y 与x 的线性回归方程$50.8169.7y x =+;模型①:由散点图的样本点分布,可以认为样本点集中在曲线bxy ae =的附近.(1)根据表中数据,求模型①的回归方程$bx y ae =.(a 精确到个位,b 精确到0.01). (2)根据下列表中的数据,比较两种模型的相关指数2R ,并选择拟合精度更高、更可靠的模型,预测2021年该景区的旅游人数(单位:万人,精确到个位).参考公式、参考数据及说明:①对于一组数据()()()1122,,,,,,n n v w v w v w L ,其回归直线µµµwv αβ=+的斜率和截距的最小二乘法估计分别为µµµ121()(),()niii nii w w v v w v v v βαβ==--==--∑∑. ①刻画回归效果的相关指数µ22121()1()nii i n ii yy R yy ==-=--∑∑ .①参考数据: 5.46235e ≈, 1.43 4.2e ≈.表中1011ln ,10i i i i u y u u ===∑. 【答案】(1) $0.11235x y e = (2)见解析 【解析】 【分析】(1)对bxy ae =取对数,得ln ln y bx a =+, 设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,进而可得结果;(2)由表格中的数据, 30407>14607,可得101022113040714607()()iii i y y y y ==>--∑∑,从而得2212R R < ,进而可得结果.【详解】(1)对bxy ae =取对数,得ln ln y bx a =+,设ln u y =,ln c a =,先建立u 关于x 的线性回归方程,()()()10110219.000.10883iii ii x x u u bx x ==--==≈-∑∑$, 6.050.108 5.5 5.456 5.46cu bx =-≈-⨯=≈$$ $ 5.46235c a e e =≈≈$∴模型①的回归方程为$0.11235x y e =(2)由表格中的数据,有30407>14607,即101022113040714607()()iii i y y y y ==>--∑∑,即10102211304071460711()()iii i y y y y ==-<---∑∑,2212R R <模型①的相关指数21R 小于模型①的22R ,说明回归模型①的拟合效果更好.2021年时,13x =,预测旅游人数为$0.1113 1.43235235235 4.2987y e e ⨯==≈⨯=(万人) 【点睛】本题考查了非线性拟合及非线性回归方程的求解与应用,是源于课本的试题类型,解答非线性拟合问题,先作出散点图,再根据散点图选择合适的函数类型,设出回归方程,利用换元法将非线性回归方程化为线性回归方程,求出样本数据换元后的值,然后根据线性回归方程的计算方法计算变换后的线性回归方程系数,即可求出非线性回归方程,再利用回归方程进行预报预测,注意计算要细心,避免计算错误.12.(2019·湖南高考模拟(理))在全国第五个“扶贫日”到来之前,某省开展“精准扶贫,携手同行”的主题活动,某贫困县调查基层干部走访贫困户数量.A 镇有基层干部60人,B 镇有基层干部60人,C 镇有基层干部80人,每人都走访了若干贫困户,按照分层抽样,从,,A B C 三镇共选40名基层干部,统计他们走访贫困户的数量,并将走访数量分成5组,[)[)[)[)[]5,15,15,25,25,35,35,45,45,55,绘制成如图所示的频率分布直方图.(1) 求这40人中有多少人来自C 镇,并估计,,A B C 三镇的基层干部平均每人走访多少 贫困户;(同一组中的数据用该组区间的中点值作代表)(2)如果把走访贫困户达到或超过25户视为工作出色,以频率估计概率,从,,A B C 三镇的所有基层干部中随机选取3人,记这3人中工作出色的人数为X ,求X 的分布列及数学期望.【答案】(1)40人中有16人来自C 镇,28.5户(2)见解析 【分析】(1)先确定抽样比,再由C 镇有基层干部80人即可求出结果;求平均数时,只需每组的中间值乘以该组的频率再求和即可;(2)先确定从三镇的所有基层干部中随机选出1人,其工作出色的概率,由题意可知X 服从二项分布,进而可求出结果. 【详解】解:(1)因为,,A B C 三镇分别有基层干部60人,60人,80人,共200人, 利用分层抽样的方法选40人,则C 镇应选取408016200⨯=(人), 所以这40人中有16人来自C 镇因为100.15200.25300.3x =⨯+⨯+⨯ 400.2500.128.5+⨯+⨯=, 所以三镇基层干部平均每人走访贫困户28.5户(2)由直方图得,从三镇的所有基层干部中随机选出1人,其工作出色的概率为35显然X 可取0,1,2,3,且33,5X B ⎛⎫~ ⎪⎝⎭,则()32805125P X ⎛⎫=== ⎪⎝⎭, ()12133236155125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()21233254255125P X C ⎛⎫⎛⎫=== ⎪ ⎪⎝⎭⎝⎭, ()332735125P X ⎛⎫=== ⎪⎝⎭ 所以X 的分布列为所以数学期望()8365427901231251251251255E X =⨯+⨯+⨯+⨯= 【点睛】本题主要考查频率分布直方图,以及二项分布,由频率分布直方图求平均数,只需每组的中间值乘以该组频率再求和即可,对于二项分布的问题,熟记二项分布即可求解,属于常考题型.以下内容为“高中数学该怎么有效学习?”首先要做到以下两点:1、先把教材上的知识点、理论看明白。