2021届新高考数学二轮复习课件:专题四 概率与统计 第1讲 统计与统计案例 课件(共50张PPT)
- 格式:ppt
- 大小:1.50 MB
- 文档页数:51
【2021届高考二轮精品资源-数学】专题五 概率与统计(文理) 第1讲 统计与统计案例 教师版1.抽样方法、样本的数字特征、统计图表、回归分析与独立性检验主要以选择题、填空题形式命题,难度较小;2.注重知识的交汇渗透,统计与概率,回归分析与概率是近年命题的热点.1.抽样方法抽样方法包括简单随机抽样、系统抽样、分层抽样,三种抽样方法都是等概率抽样,体现了抽样的公平性,但又各有其特点和适用范围. 2.统计中的四个数据特征(1)众数:在样本数据中,出现次数最多的那个数据.(2)中位数:样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.(3)平均数:样本数据的算术平均数,即=n 1(x 1+x 2+…+x n ). (4)方差与标准差. s 2=n 1[(x 1-)2+(x 2-)2+…+(x n -)2],s=[(x1- EMBED Equation.DSMT4 )2+(x2- EMBED Equation.DSMT4 )2+…+(xn - EMBED Equation.DSM 1.3.直方图的两个结论(1)小长方形的面积=组距×组距频率=频率. (2)各小长方形的面积之和等于1. 4.回归分析与独立性检验(1)回归直线^y =^b x +^a 经过样本点的中心点(,),若x 取某一个值代入回归直线方程^y=^b x +^a中,可求出y 的估计值. (2)独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K 2=(a +b )(c +d )(a +c )(b +d )n (ad -bc )2(其中n =a +b +c +d 为样本容量).型更合适,并用此模型预测A 超市广告费支出为8万元时的销售额. 参数数据及公式:=8,=42,7x i y i =2 794,7x i 2=708,(1)解析 ∵k ≈3.918>3.841,且P (K 2≥k 0=3.841)=0.05,根据独立性检验思想“这种血清能起到预防感冒的作用”出错的可能性不超过5%. 答案 B(2)解 ①∵=8,=42,7x i y i =2 794,7x i 2=708.因此^a =-^b=42-1.7×8=28.4.所以,y 关于x 的线性回归方程是^y=1.7x +28.4. ②∵0.75<0.97, ∴对数回归模型更合适.当x =8时,^y=12ln 8+22=36ln 2+22=36×0.7+22=47.2万元.∴广告费支出8万元时,预测A超市销售额为47.2万元.1.(2017·全国Ⅰ卷)为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,x n,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,x n的平均数B.x1,x2,…,x n的标准差C.x1,x2,…,x n的最大值D.x1,x2,…,x n的中位数【解题思路】刻画评估这种农作物亩产量稳定程度的指标是标准差.【答案】B2.(2018·全国I卷)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半【解题思路】首先设出新农村建设前的经济收入为M,根据题意,得到新农村建设后的经济收入为2M,之后从图中各项收入所占的比例,得到其对应的收入是多少,从而可以比较其大小,并且得到其相应的关系,从而得出正确的选项.【答案】设新农村建设前的收入为M,而新农村建设后的收入为2M,则新农村建设前种植收入为0.6M,而新农村建设后的种植收入为0.74M,所以种植收入增加了,所以A项不正确;新农村建设前其他收入我0.04M,新农村建设后其他收入为0.1M,故增加了一倍以上,所以B项正确;新农村建设前,养殖收入为0.3M,新农村建设后为0.6M,所以增加了一倍,所以C 项正确;新农村建设后,养殖收入与第三产业收入的综合占经济收入的,所以超过了经济收入的一半,所以D正确;故选A.3.(2018·全国III卷))某公司有大量客户,且不同龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是________.【解题思路】由题可知满足分层抽样特点【答案】由于从不同龄段客户中抽取,故采用分层抽样,故答案为分层抽样.4.7.(2018·全国II卷)下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;(2)你认为用哪个模型得到的预测值更可靠?并说明理由.【解题思路】(1)两个回归直线方程中无参数,所以分别求自变量为2018时所对应的函数值,就得结果,(2)根据折线图知2000到2009,与2010到2016是两个有明显区别的直线,且2010到2016的增幅明显高于2000到2009,也高于模型1的增幅,因此所以用模型2更能较好得到2018的预测.【答案】(1)利用模型①,该地区2018年的环境基础设施投资额的预测值为=–30.4+13.5×19=226.1(亿元).利用模型②,该地区2018年的环境基础设施投资额的预测值为=99+17.5×9=256.5(亿元).(2)利用模型②得到的预测值更可靠.理由如下:(i)从折线图可以看出,2000年至2016年的数据对应的点没有随机散布在直线y=–30.4+13.5t上下,这说明利用2000年至2016年的数据建立的线性模型①不能很好地描述环境基础设施投资额的变化趋势.2010年相对2009年的环境基础设施投资额有明显增加,2010年至2016年的数据对应的点位于一条直线的附近,这说明从2010年开始环境基础设施投资额的变化规律呈线性增长趋势,利用2010年至2016年的数据建立的线性模型=99+17.5t可以较好地描述2010年以后的环境基础设施投资额的变化趋势,因此利用模型②得到的预测值更可靠.(ii)从计算结果看,相对于2016年的环境基础设施投资额220亿元,由模型①得到的预测值226.1亿元的增幅明显偏低,而利用模型②得到的预测值的增幅比较合理,说明利用模型②得到的预测值更可靠.以上给出了2种理由,考生答出其中任意一种或其他合理理由均可得分.点睛:若已知回归直线方程,则可以直接将数值代入求得特定要求下的预测值;若回归直线方程有待定参数,则根据回归直线方程恒过点求参数.1.(2018·内江期末)为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x为()A.64B.96C.144D.160【解题思路】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为,因为共抽出30人,所以总人数为人,即可求出20~30岁年龄段的人数.【答案】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为,因为共抽出30人,所以总人数为人,所以,20~30岁龄段的人有,故选D.2.(2017·全国Ⅲ卷)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【解题思路】由题图可知,2014年8月到9月的月接待游客量在减少,则A选项错误.【答案】A3.(2017·泉州模拟)某厂在生产甲产品的过程中,产量x(吨)与生产能耗y(吨)的对应数据如表:根据最小二乘法求得回归方程为^=0.65x+^,当产量为80吨时,预计需要生产能耗为________吨.【解题思路】由回归直线方程过样本点中心可得^a.【答案】由题意,=45,=36.25,代入^y=0.65x+^a,可得^a=7,∴当产量为80吨时,预计需要生产能耗为0.65×80+7=59.故填59.4.(2018·全国I卷)某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表使用了节水龙头50天的日用水量频数分布表(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)【解题思路】(1)根据题中所给的使用了节水龙头50天的日用水量频数分布表,算出落在相应区间上的频率,借助于直方图中长方形的面积表示的就是落在相应区间上的频率,从而确定出对应矩形的高,从而得到直方图;(2)结合直方图,算出日用水量小于0.35的矩形的面积总和,即为所求的频率;(3)根据组中值乘以相应的频率作和求得50天日用水量的平均值,作差乘以365天得到一年能节约用水多少,从而求得结果.【答案】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35m3的频率为0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35m3的概率的估计值为0.48.(3)该家庭未使用节水龙头50天日用水量的平均数为.该家庭使用了节水龙头后50天日用水量的平均数为.估计使用节水龙头后,一年可节省水.1.(2017·汉中模拟)已知两个随机变量x,y之间的相关关系如表所示:根据上述数据得到的回归方程为^y =^b x +^a,则大致可以判断( ) A .^a >0,^b >0B .^a >0,^b <0C .^a <0,^b >0D .^a <0,^b <0【解题思路】作出散点图,画出回归直线直观判定^b >0,^a<0. 【答案】C2.(2018·衡水中学)已知某种商品的广告费支出x (单位:万元)与销售额y (单位:万元)之间有如下对应数据:根据表中的全部数据,用最小二乘法得出y 与x 的线性回归方程为,则表中m 的值为( ) A .45B .50C .55D .70【解题思路】根据回归直线经过样本平均数点,可求得m 的值.【答案】由表可知,,,因为回归直线会经过平均数样本中心点,代入,解得,所以选D .3.为了研究雾霾天气的治理情况,某课题组对部分城市进行空气质量调查,按地域特点把这些城市分成甲、乙、丙三组,已知三组城市的个数分别为4,y ,z ,依次构成等差数列,且4,y ,z +4成等比数列,若用分层抽样抽取6个城市,则乙组中应抽取的城市个数为________.【解题思路】根据等差数列和等比数列的定义列方程组解出y ,z .【答案】由题意可得y2=4(z +4),2y =4+z ,即y2=4z +16,,解得z =12或z =-4(舍去),故y =8. 所以甲、乙、丙三组城市的个数分别为4,8,12. 因为一共要抽取6个城市,所以抽样比为4+8+126=41. 故乙组城市应抽取的个数为8×41=2.故填 2.4.(2017·赤峰二模)微信是腾讯公司推出的一种手机通讯软件,它支持发送语音短信、视频、图片和文字,一经推出便风靡全国,甚至涌现出一批在微信的朋友圈内销售商品的人(被称为微商).为了调查每天微信用户使用微信的时间,某经销化妆品的微商在一广场随机采访男性、女性用户各50名,将男性、女性使用微信的时间分成5组:(0,2],(2,4],(4,6],(6,8],(8,10]分别加以统计,得到如图所示的频率分布直方图.(1)根据女性频率分布直方图估计女性使用微信的平均时间;(2)若每天玩微信超过4小时的用户列为“微信控”,否则称其为“非微信控”,请你根据已知条件完成2×2的列联表,并判断是否有90%的把握认为“微信控”与“性别有关”? 【解题思路】(1)取每组的中间值代表这组,平均数;(2)根据题意列出2×2列联表,并计算K 2.【答案】解 (1)女性平均使用微信的时间为:0.16×1+0.24×3+0.28×5+0.2×7+0.12×9=4.76 (小时).(2)由已知得:2(0.04+a +0.14+2×0.12)=1,解得a =0.08. 由题设条件得列联表∴K 2=(a +b )(c +d )(a +c )(b +d )n (ad =50×50×68×32≈2.941>2.706. 所以有90%的把握认为“微信控”与“性别”有关.。
高三数学第二轮专题讲座复习:概率与统计高考要求概率是高考的重点内容之一,尤其是新增的随机变量这部分内容要充分注意一些重要概念的实际意义,理解概率处理问题的基本思想方法重难点归纳本章内容分为概率初步和随机变量两部分第一部分包括等可能事件的概率、互斥事件有一个发生的概率、相互独立事件同时发生的概率和独立重复实验第二部分包括随机变量、离散型随机变量的期望与方差涉及的思维方法观察与试验、分析与综合、一般化与特殊化主要思维形式有逻辑思维、聚合思维、形象思维和创造性思维典型题例示范讲解例1有一容量为50的样本,数据的分组及各组的频率数如下[10,15]4 [30,35)9 [15,20)5 [35,40)8[20,25)10 [40,45)3 [25,30)11(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图和累积频率的分布图命题意图本题主要考查频率分布表,频率分布直方图和累积频率的分布图的画法知识依托频率、累积频率的概念以及频率分布表、直方图和累积频率分布图的画法错解分析解答本题时,计算容易出现失误,且要注意频率分布与累积频率分布的区别技巧与方法本题关键在于掌握三种表格的区别与联系解(1)由所给数据,计算得如下频率分布表数据段频数频率累积频率[10,15) 4 0.08 0.08[15,20) 5 0.10 0.18[20,25)10 0.20 0.38[25,30)11 0.22 0.60[30,35)9 0.18 0.78[35,40)8 0.16 0.94[40,45) 3 0.06 1总计50 1(2)频率分布直方图与累积频率分布图如下例2袋子A 和B 中装有若干个均匀的红球和白球,从A 中摸出一个红球的概率是31,从B 中摸出一个红球的概率为p .(Ⅰ) 从A 中有放回地摸球,每次摸出一个,有3次摸到红球即停止. (i )求恰好摸5次停止的概率;(ii )记5次之内(含5次)摸到红球的次数为ξ,求随机变量ξ的分布率及数学期望E ξ. (Ⅱ) 若A 、B 两个袋子中的球数之比为12,将A 、B 中的球装在一起后,从中摸出一个红球的概率是25,求p 的值. 命题意图本题考查利用概率知识和期望的计算方法 知识依托概率的计算及期望的概念的有关知识错解分析在本题中,随机变量的确定,稍有不慎,就将产生失误 技巧与方法 可借助n 次独立重复试验概率公式计算概率解 (Ⅰ)(i )2224121833381C ⎛⎫⎛⎫⨯⨯⨯= ⎪ ⎪⎝⎭⎝⎭(ii)随机变量ξ的取值为0,1,2,3,;由n 次独立重复试验概率公式()()1n kk kn n P k C p p -=-,得()50513*******P C ξ⎛⎫==⨯-= ⎪⎝⎭; ()41511801133243P C ξ⎛⎫==⨯⨯-= ⎪⎝⎭()232511802133243P C ξ⎛⎫⎛⎫==⨯⨯-= ⎪ ⎪⎝⎭⎝⎭()323511173133243P C ξ⎛⎫⎛⎫==⨯⨯-= ⎪ ⎪⎝⎭⎝⎭(或()328021731243243P ξ+⨯==-=) 随机变量ξ的分布列是ξ0 1 2 3P32243 80243 80243 17243ξ的数学期望是 32808017131012324324324324381E ξ=⨯+⨯+⨯+⨯=(Ⅱ)设袋子A 中有m 个球,则袋子B 中有2m 个球由122335m mpm +=,得1330p = 例3如图,用A 、B 、C 三类不同的元件连接成两个系统N 1、N 2,当元件A 、B 、C 都正常工作时,系统N 1正常工作;当元件A 正常工作且元件B 、C 至少有一个正常工作时,系统N 2正常工作 已知元件A 、B 、C 正常工作的概率依次为0.80,0.90,0.90,分别求系统N 1,N 2正常工作的概率P 1、P 2(N 2)AB C(N 1)CB A解 记元件A 、B 、C 正常工作的事件分别为A 、B 、C , 由已知条件P (A )=0.80, P (B )=0.90,P (C )=0.90(1)因为事件A 、B 、C 是相互独立的,所以,系统N 1正常工作的概率P 1=P (A ·B ·C )=P (A )P (B )P (C )=0.648,故系统N 1正常工作的概率为0.648(2)系统N 2正常工作的概率P 2=P (A )·[1-P (C B ⋅)]=P (A )·[1-P (B )P (C )] =0 80×[1-(1-0 90)(1-0 90)]=0 792 故系统N 2正常工作的概率为0 792 学生巩固练习1 甲射击命中目标的概率是21,乙命中目标的概率是31,41现在三人同时射击目标,则目标被击中的概率为( )107 D. 54C. 32 B. 43A. 2 已知随机变量ζ的分布列为 P (ζ=k )=31,k =1,2,3,则P (3ζ+5)等于A 6B 9C 3D 43 1盒中有9个正品和3个废品,每次取1个产品,取出后不再放回,在取得正品前已取出的废品数ζ的期望E ζ=_________4 某班有52人,男女各半,男女各自平均分成两组,从这个班中选出4人参加某项活动,这4人恰好来自不同组别的概率是_________5 甲、乙两人各进行一次射击,如果两人击中目标的概率都是0.6,计算 (1)两人都击中目标的概率;(2)其中恰有一人击中目标的概率; (3)至少有一人击中目标的概率6 已知连续型随机变量ζ的概率密度函数f (x )=⎪⎩⎪⎨⎧≥<≤-≤2 021 1 0x x a x x(1)求常数a 的值,并画出ζ的概率密度曲线; (2)求P (1<ζ<23) 参考答案:1 解析 设甲命中目标为事件A ,乙命中目标为事件B ,丙命中目标为事件C ,则目标被击中的事件可以表示为A+B+C ,即击中目标表示事件A 、B 、C 中至少有一个发生.41)411)(311)(211()](1[)](1[)](1[)()()()(=---=-⋅-⋅-=⋅⋅=⋅⋅∴C P B P A P C P B P A P C B A P故目标被击中的概率为1-P (A ·B ·C )=1-4341= 答案 A 2 解析 E ξ=(1+2+3)·31=2,E ξ2=(12+22+32)·31=314∴D ξ=E ξ2-(E ξ)2=314-2232∴D (3ξ+5)=9E ξ=6答案 A3 解析 由条件知,ξ的取值为0,1,2,3,并且有P (ξ=0)=43C C 11219=,3.02201322092449143022012C C C )3(,22092C C C )2(,4492C C C )1(412193331219232121913=⨯+⨯+⨯+⨯=ξ∴===ξ=⋅==ξ===ξE P P P 答案 0.34 解析 因为每组人数为13,因此,每组选1人有C 113种方法,所以所求概率为P 4524113)C ( 答案 4524113C )C ( 5 解 (1)我们把“甲射击一次击中目标”叫做事件A ,“乙射击一次击中目标”叫做事件B 显然事件A 、B 相互独立,所以两人各射击一次都击中目标的概率是P (A ·B ) =P (A )·P (B )=0.6×0.6=0.36答 两人都击中目标的概率是0.36(2)同理,两人各射击一次,甲击中、乙未击中的概率是P (A ·B )=P (A )·P (B )=0.6×(1-0.6)=0.6×0.4=0.24甲未击中、乙击中的概率是P (A ·B)=P (A )P (B )=0.24,显然,“甲击中、乙未击中”和“甲未击中、乙击中”是不可能同时发生,即事件A ·B 与A ·B 互斥,所以恰有一人击中目标的概率是P (A ·B )+P (A ·B )=0.24+0.24=0.48(2)两人各射击一次,至少有一人击中目标的概率P =P (A ·B )+[P (A ·B )+P (A )·B ]=0.36+0.48=0.84答 至少有一人击中目标的概率是0.846 解 (1)因为ξ所在区间上的概率总和为1,所以21 (1-a +2-a )·1=1,∴a =21概率密度曲线如图 (2)P (1<ξ<23)=9323)121(21=⋅+⋅。