2020版高考数学复习专题3概率与统计解密高考3概率与统计问题重在“辨”——辨析、辨型、辨图教案文
- 格式:docx
- 大小:183.78 KB
- 文档页数:4
高考数学中的概率与统计题详解概率与统计是高考数学中的重要内容之一,涉及概率、统计两个部分。
概率是研究随机事件发生的可能性,统计则是根据观察到的现象,对总体进行推断。
在高考中,概率与统计题往往需要运用一定的公式和推理能力来解答。
下面将详细介绍高考中常见的概率与统计题,并提供相关的解题技巧。
一、概率题概率题常见于高考数学中,考察学生对随机事件和概率的理解与计算能力。
下面将从基本定义、计算公式和常见类型等方面对概率题进行详解。
1.基本定义概率是事件发生的可能性大小的度量,用一个介于0和1之间的数表示。
当事件不可能发生时,概率为0;当事件一定发生时,概率为1。
2.计算公式(1)事件A的概率:P(A) = 事件A的可能结果数 / 样本空间的可能结果数。
(2)互斥事件的概率:P(A或B) = P(A) + P(B)。
(3)独立事件的概率:P(A和B) = P(A) × P(B)。
3.常见类型(1)选择题:将概率题与其他数学知识相结合,如求百分比、比例等。
解题时应根据题目给出的条件,利用计算公式进行计算。
(2)排列组合问题:对于不同颜色、大小、形状的球,求取满足某个条件的组合数。
解题时应根据题目所给条件,使用排列组合公式进行计算。
(3)事件的复合:求两个或多个事件复合后的概率。
解题时应根据题目所给条件,利用计算公式进行计算。
二、统计题统计题常见于高考数学中,考察学生对收集、整理和分析数据的能力,以及对统计方法的应用。
下面将从数据收集与整理、统计指标和抽样调查等方面对统计题进行详解。
1.数据收集与整理统计题要求学生根据给定的数据进行分析和计算。
在实际情境中,常见的数据收集方法有观察、问卷调查、实验等。
解题时应根据题目所给的数据,进行整理和清晰的分类。
2.统计指标统计指标是对统计数据进行度量和描述的指标。
常见的统计指标有均值、中位数、众数、标准差等。
解题时应根据题目所要求的统计指标,运用相应的公式进行计算。
高考复习专题之:概率与统计一、概率:随机事件A 的概率是频率的稳定值,反之,频率是概率的近似值.1.随机事件A 的概率0()1P A ≤≤,其中当()1P A =时称为必然事件;当()0P A =时称为不可能事件P(A)=0; 注:求随机概率的三种方法: (一)枚举法例1如图1所示,有一电路AB 是由图示的开关控制,闭合a ,b ,c ,d ,e 五个开关中的任意两个开关,使电路形成通路.则使电路形成通路的概率是 .分析:要计算使电路形成通路的概率,列举出闭合五个开关中的任意两个可能出现的结果总数,从中找出能使电路形成通路的结果数,根据概率的意义计算即可。
解:闭合五个开关中的两个,可能出现的结果数有10种,分别是a b 、a c 、a d 、a e 、bc 、bd 、be 、cd 、ce 、de ,其中能形成通路的有6种,所以p(通路)=106=53评注:枚举法是求概率的一种重要方法,这种方法一般应用于可能出现的结果比较少的事件的概率计算. (二)树形图法例2小刚和小明两位同学玩一种游戏.游戏规则为:两人各执“象、虎、鼠”三张牌,同时各出一张牌定胜负,其中象胜虎、虎胜鼠、鼠胜象,若两人所出牌相同,则为平局.例如,小刚出象牌,小明出虎牌,则小刚胜;又如,两人同时出象牌,则两人平局.如果用A 、B 、C 分别表示小刚的象、虎、鼠三张牌,用A 1、B 1、C 1分别表示小明的象、虎、鼠三张牌,那么一次出牌小刚胜小明的概率是多少?分析:为了清楚地看出小亮胜小刚的概率,可用树状图列出所有可能出现的结果,并从中找出小刚胜小明可能出现的结果数。
解:画树状图如图树状图。
由树状图(树形图)或列表可知,可能出现的结果有9种,而且每种结果出现的可能性相同,其中小刚胜小明的结果有3种.所以P (一次出牌小刚胜小明)=31点评:当一事件要涉及两个或更多的因素时,为了不重不漏地列出所有可能的结果,通过画树形图的方法来计算概率 (三)列表法例3将图中的三张扑克牌背面朝上放在桌面上,从中随机摸出两张,并用这两张扑克牌上的数字组成一个两位数.请你用画树形(状)图或列表的方法求:(1)组成的两位数是偶数的概率;(2)组成的两位数是6的倍数的概率.分析:本题可通过列表的方法,列出所有可能组成的两位数的可能情况,然后再找出组成的两位数是偶数的可能情况和组成两位数 是6的倍数的可能情况。
新高考数学复习:概率与统计随着新高考改革的深入,数学科目的考查范围与难度也在逐年增加。
作为高考复习的重要环节,概率与统计部分的知识点成为了考生们的焦点。
本文将探讨如何有效地进行新高考数学复习,特别是概率与统计部分的知识点。
一、明确考试要求在复习概率与统计之前,首先要了解新高考数学对于这一部分的考试要求。
通常,高考数学对于概率与统计的考查包括以下几个方面:随机事件及其概率、随机变量及其分布、数理统计的基本概念与方法等。
因此,在复习过程中,要着重这些方面的知识点。
二、扎实基础知识概率与统计部分的知识点较为抽象,需要考生具备扎实的数学基础。
在复习过程中,要注重对基础知识点的掌握,例如:集合、不等式、函数等。
只有掌握了这些基础知识,才能更好地理解概率与统计的相关概念与公式。
三、强化解题能力解题能力是高考数学考查的重要方面。
在复习概率与统计时,要注重强化解题能力。
具体而言,可以通过以下几个方面来提高解题能力:1、掌握解题方法对于概率与统计的题目,要掌握常用的解题方法,例如:直接法、排除法、枚举法等。
同时,要了解各类题型的解题步骤与方法,从而在解题时能够迅速找到突破口。
2、多做真题做真题是提高解题能力的有效途径。
通过多做真题,可以了解高考数学对于概率与统计的考查重点与难点,进而有针对性地进行复习。
同时,也可以通过对比历年真题,发现自身的知识盲点,及时查漏补缺。
3、反思与总结在解题过程中,要及时反思与总结。
对于做错的题目,要分析错误原因,并总结出正确的解题方法。
同时,也要总结出各类题型的解题技巧与注意事项,以便在今后的解题中能够更加得心应手。
四、拓展知识面高考数学对于考生知识面的考查也越来越广泛。
在复习概率与统计时,要注重拓展自身的知识面。
具体而言,可以通过以下几个方面来拓展知识面:1、阅读相关书籍可以阅读相关的数学书籍,例如:《概率论与数理统计》、《统计学》等。
通过阅读这些书籍,可以深入了解概率与统计的相关知识点,拓展自身的知识面。
重难点05 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【限时检测】(建议用时:35分钟)一、单选题1.(2021·广西钦州一中高三开学考试(文))点在边长为2的正方形内运动,P ABCD 则动点到顶点的距离的概率为( )P A 2PA <A .B .C .D .14124ππ【答案】C 【解析】分析:先根据题意得出PA 等于2 的临界值情况,再根据几何概型求解即可.详解:由题可知当PA=2时是以A 为圆心2为半径的四分之一圆,所以概率为P=,故选C21444r ππ=2.(2020·全国高三其他模拟(文))从某高中女学生中选取10名学生,根据其身高、体重数据,得到体重关于身高的回归方程,用来刻画回归效(cm)(kg)ˆ0.8585yx =-果的相关指数,则下列说法正确的是( )20.6R =A .这些女学生的体重和身高具有非线性相关关系B .这些女学生的体重差异有60%是由身高引起的C .身高为的女学生的体重一定为170cm 59.5kgD .这些女学生的身高每增加,其体重约增加0.85cm 1kg 【答案】B【分析】因为回归方程为,且刻画回归效果的相关指数,所以,ˆ0.8585y x =-20.6R =这些女学生的体重和身高具有线性相关关系,A 错误;这些女学生的体重差异有60%是由身高引起的,B 正确;时,,预测身高为的女学生体重为,C 错170x =ˆ0.851708559.5y=⨯-=170cm 59.5kg 误;这些女学生的身高每增加,其体重约增加,D 错误.0.85cm 0.850.850.7225(kg)⨯=故选:B3.(2020·石嘴山市第三中学高三其他模拟(文))网络是一种先进的高频传输技5G 术,我国的技术发展迅速,已位居世界前列.华为公司2019年8月初推出了一款手5G 5G 机,现调查得到该款手机上市时间和市场占有率(单位:%)的几组相关对应数5G x y 据.如图所示的折线图中,横轴1代表2019年8月,2代表2019年9月……,5代表2019年12月,根据数据得出关于的线性回归方程为.若用此方程分析并预y x0.042y x a =+测该款手机市场占有率的变化趋势,则最早何时该款手机市场占有率能超过0.5%(精5G 确到月)()A .2020年6月B .2020年7月C .2020年8月D .2020年9月【答案】C【分析】:,1(12345)35x =⨯++++=1(0.020.050.10.150.18)0.15y =⨯++++=点在直线上()3,0.1ˆˆ0.042y x a =+,ˆ0.10.0423a=⨯+ˆ0.026a =-ˆ0.0420.026yx =-令ˆ0.0420.0260.5y x =->13x ≥因为横轴1代表2019年8月,所以横轴13代表2020年8月,故选:C4.(2020·河南新乡市·高三一模(文))年的“金九银十”变成“铜九铁十”,全2020国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年2019月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月11202011份代码分别对应年月年月)113:2019112020:11根据散点图选择和两个模型进行拟合,经过数据处理得到的两y a =+ln y c d x =+个回归方程分别为,并得到以下一些0.9369y =+0.95540.0306ln y x =+统计量的值:是()A .当月在售二手房均价与月份代码呈正相关关系y xB .根据年月在售二手房均价约为万元/0.9369y =+20212 1.0509平方米C .曲线的图形经过点0.9369y =+0.95540.0306ln y x =+()x yD .回归曲线的拟合效果好于的拟合效0.95540.0306ln y x =+ 0.9369y =+果【答案】C【分析】对于A ,散点从左下到右上分布,所以当月在售二手房均价与月份代码呈正y x 相关关系,故A 正确;对于B ,令,由,16x =0.9369 1.0509y =+=所以可以预测年月在售二手房均价约为万元/平方米,故B 正确;20212 1.0509对于C ,非线性回归曲线不一定经过,故C 错误;()x y 对于D ,越大,拟合效果越好,故D 正确.2R 故选:C.5.(2020·全国高三专题练习(文))现行普通高中学生在高一时面临着选科的问题,学校抽取了部分男、女学生意愿的一份样本,制作出如下两个等高堆积条形图:根据这两幅图中的信息,下列哪个统计结论是不正确的( )A .样本中的女生数量多于男生数量B .样本中有两理一文意愿的学生数量多于有两文一理意愿的学生数量C .样本中的男生偏爱两理一文D .样本中的女生偏爱两文一理【答案】D【分析】:由条形图知女生数量多于男生数量,故A 正确;有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故B 正确;男生偏爱两理一文,故C 正确;女生中有两理一文意愿的学生数量多于有两文一理意愿的学生数量,故D 错误.故选:D.6.(2021·全国高三专题练习(文))下图为中国古代刘徽的《九章算术注》中研究“勾股容方”问题的图形,图中为直角三角形,四边形为它的内接正方形,已知ABC :DEFC ,,在内任取一点,则此点取自正方形内的概率为(2BC =4AC =ABC :DEFC)A .B .C .D .12592949【答案】D【分析】解:,,4tan 22AC B BC === tan 2EFB FB ∴==,解得,22()2(2)EF FB BC EF EF ==-=-43EF =,,1142422ACB S AC BC ∴==⨯⨯=::4416339DEFC S =⨯=根据几何概型.164949P ==故选:D .7.(2021·江西新余市·高三期末(文))2013年华人数学家张益唐证明了孪生素数猜想的一个弱化形式.孪生素数猜想是希尔伯特在1900年提出的23个问题之一,可以这样描述:存在无穷多个素数,使得是素数.素数对称为孪生素数.从15以p 2p +(,2)p p +内的素数中任取2个构成素数对,其中是孪生素数的概率为()A .B .C .D .13141516【答案】C【分析】以内的素数有,,,,,,共个,任取两个构成素数对,则152********有:,,,,,,,,,,()2,3()2,5()2,7()2,11()2,13()3,5()3,7()3,11()3,13()5,7,,,,,共中取法,而是孪生素数的有,()5,11()5,13()7,11()7,13()11,1315()3,5,,其概率为.()5,7()11,1331155p ==故选:C.8.(2021·安徽阜阳市·高三期末(文))如图,根据已知的散点图,得到y 关于x 的线性回归方程为,则( )ˆ0.2y bx =+ˆb =A .1.5B .1.8C .2D .1.6【答案】D【分析】因为,所以,解得12345235783,555x y ++++++++====530.2b =+ .1.6b = 故选:D .9.(2021·全国高三专题练习(文))在上随机取一个数,则事件“直线与[]1,1-k y kx =圆相交”发生的概率为( )22(x 13)25y -+=A .B .12513C .D .51234【答案】C【分析】直线与圆相交y kx =22(x 13)25y -+=555,1212d k ⎛⎫⇒∈- ⎪⎝⎭直线斜率时与圆相交,故所求概率.55,1212k ⎛⎫∈- ⎪⎝⎭10512212P ==故答案选C10.(2021·全国高三专题练习(文))给出下列说法:①回归直线恒过样本点的中心,且至少过一个样本点;ˆˆˆy bx a =+(,)x y ②两个变量相关性越强,则相关系数就越接近1;||r ③将一组数据的每个数据都加一个相同的常数后,方差不变;④在回归直线方程中,当解释变量增加一个单位时,预报变量平均减少ˆ20.5y x =-x ˆy0.5个单位.其中说法正确的是( )A .①②④B .②③④C .①③④D .②④【答案】B【分析】对于①中,回归直线恒过样本点的中心,但不一定过一个样本ˆˆˆy bx a =+(x y 点,所以不正确;对于②中,根据相关系数的意义,可得两个变量相关性越强,则相关系数就越接近1,||r 所以是正确的;对于③中,根据方差的计算公式,可得将一组数据的每个数据都加一个相同的常数后,方差是不变的,所以是正确的;对于④中,根据回归系数的含义,可得在回归直线方程中,当解释变量增ˆ20.5y x =-x 加一个单位时,预报变量平均减少0.5个单位,所以是正确的.ˆy 故选:B.11.(2020·江西吉安市·高三其他模拟(文))给出一组样本数据:1,4,,3,它们出m 现的频率分别为0.1,0.1,0.4,0.4,且样本数据的平均值为2.5,从1,4,,3中任取m 两个数,则这两个数的和为5的概率为()A .B .C .D .12231314【答案】C【分析】由题意得,样本平均值为,解得,10.140.10.430.4 2.5m ⨯+⨯+⨯+⨯=2m =即这组样本数据为1,4,2,3,从中任取两个有,,,,,共6种情况,()1,4()1,2()1,3()4,2()4,3()2,3其中和为5的有,两种情况,()1,4()2,3∴所求概率为,2163P ==故选:C.12.(2020·全国高三专题练习(理))物流业景气指数反映物流业经济发展的总体LPI 变化情况,以作为经济强弱的分界点,高于时,反映物流业经济扩张;低于50%50%时,则反映物流业经济收缩。
重难点05 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【限时检测】(建议用时:35分钟)一、单选题1.(2019·四川高考模拟(文))空气质量指数AQI是一种反映和评价空气质量的方法,AQI 指数与空气质量对应如下表所示:如图是某城市2018年12月全月的指AQI数变化统计图.根据统计图判断,下列结论正确的是()A.整体上看,这个月的空气质量越来越差B.整体上看,前半月的空气质量好于后半月的空气质量C.从AQI数据看,前半月的方差大于后半月的方差D.从AQI数据看,前半月的平均值小于后半月的平均值【答案】C【分析】根据题意可得,AQI指数越高,空气质量越差;数据波动越大,方差就越大,由此逐项判断,即可得出结果.【详解】从整体上看,这个月AQI数据越来越低,故空气质量越来越好;故A,B不正确;从AQI数据来看,前半个月数据波动较大,后半个月数据波动小,比较稳定,因此前半个月的方差大于后半个月的方差,所以C正确;从AQI数据来看,前半个月数据大于后半个月数据,因此前半个月平均值大于后半个月平均值,故D不正确.故选C.【点睛】本题主要考查样本的均值与方差,熟记方差与均值的意义即可,属于基础题型. 2.(2020·陕西高三月考(理))如图是某学校研究性课题《什么样的活动最能促进同学们进行垃圾分类》向题的统计图(每个受访者都只能在问卷的5个活动中选择一个),以下结论错误的是()A.回答该问卷的总人数不可能是100个B.回答该问卷的受访者中,选择“设置分类明确的垃圾桶”的人数最多C.回答该问卷的受访者中,选择“学校团委会宣传”的人数最少D.回答该问卷的受访者中,选择“公益广告”的人数比选择“学校要求”的少8个【答案】D【分析】先对图表数据分析处理,再结合简单的合情推理逐一检验即可得解.【详解】对于选项A,若回答该问卷的总人数不可能是100个,则选择③③③的同学人数不为整数,故A正确,对于选项B,由统计图可知,选择“设置分类明确的垃圾桶”的人数最多,故B正确,对于选项C,由统计图可知,选择“学校团委会宣传”的人数最少,故C正确,对于选项D,由统计图可知,选择“公益广告”的人数比选择“学校要求”的少8%,故D 错误,故选D.【点睛】本题考查了对图表数据的分析处理能力及简单的合情推理,属中档题. 3.(2018·湖南高考模拟(文))已知变量x 、y 之间的线性回归方程为0.710.3y x =-+,且变量x 、y 之间的一-组相关数据如下表所示,则下列说法错误..的是( )A .可以预测,当20x =时, 3.7y =-B .4m =C .变量x 、y 之间呈负相关关系D .该回归直线必过点()9,4【答案】B 【分析】将20x =的值代入回归直线方程可判断出A 选项的正误;将(),x y 的坐标代入回归直线方程可计算出实数m 的值,可判断出B 选项的正误;根据回归直线方程的斜率的正负可判断出C 选项的正误;根据回归直线过点(),x y 可判断出D 选项的正误. 【详解】对于A 选项,当20x =时,0.72010.3 3.7y =-⨯+=-,A 选项正确;对于B 选项,6810+1292x ++==,6321144m m y ++++==,将点(),x y 的坐标代入回归直线方程得110.7910.344m +=-⨯+=,解得5m =,B 选项错误; 对于C 选项,由于回归直线方程的斜率为负,则变量x 、y 之间呈负相关关系,C 选项正确;对于D 选项,由B 选项可知,回归直线0.710.3y x =-+必过点()9,4,D 选项正确.故选:B.【点睛】本题考查回归直线方程有关命题的判断,解题时要熟悉与回归直线有关的结论,考查分析问题和解决问题的能力,属于基础题.4.(2019·莒县第二中学高考模拟(文))我国现代著名数学家徐利治教授提出:图形的对称性是数学美的具体内容.如图,一个圆的外切正方形和内接正方形构成一个优美的几何图形,正方形ABCD 所围成的区域记为③,在圆内且在正方形ABCD 外的部分记为③,在圆外且在大正方形内的部分记为③.在整个图形中随机取一点,此点取自③,③,③的概率分别记为123,,P P P ,则( )A .123P P P =+B .132P P P >>C .123P P P >=D .123P P P => 【答案】A 【分析】首先要将小正方形旋转45度,由此看出大正方形与小正方形边长的比值,进而得到面积比,从而可确定概率间的关系. 【详解】将小正方形旋转45度,图像转化为:由图像易知:小正方形的面积是大正方形面积的一半,所以123P P P =+. 则选A.【点睛】本题考查了几何概型,着重考查了利用相似比求面积比,突显了对数学抽象与直观想象的考查.5.(2019·湖北高考模拟(理))七巧板是我们祖先的一项创造,被誉为“东方魔板”,它是由五块等腰直角三角形(两块全等的小三角形、一块中三角形和两块全等的大三角形)、一块正方形和一块平行四边形组成的.如图是一个用七巧板拼成的正方形,现从该正方形中任取一点,则此点取自黑色部分的概率是A .316B .38C .14D .18【答案】A 【解析】设2AB =,则1BC CD DE EF ====.③1124BCI S ∆==,112242BCI EFGHS S ∆==⨯=平行四边形 ③所求的概率为113422216P +==⨯ 故选A.二、解答题6.(2019·陕西高考模拟(文))某公司在若干地区各投入4万元广告费用,并将各地的销售收益绘制成频率分布直方图(如图所示).由于工作人员操作失误,横轴的数据丢失,但可以确定横轴是从0开始计数的.(1)根据频率分布直方图,计算图中各小长方形的宽度;(2)根据频率分布直方图,估计投入4万元广告费用之后,销售收益的平均值(以各组的区间中点值代表该组的取值);(3)按照类似的研究方法,测得另外一些数据,并整理得到下表:表中的数据显示,x 与y 之间存在线性相关关系,请将(2)的结果填入空白栏,并计算y 关于x 的回归方程.附公式:1221ni ii nii x y nx ybxnx==-=-∑∑$,a y bx =-$$.【答案】(1)2;(2)5;(3) 1.20.2y x =+. 【分析】(③)根据频率分布直方图,由频率分布直方图各小长方形面积总和为1,可计算图中各小长方形的宽度;(③)以各组的区间中点值代表该组的取值,即可计算销售收益的平均值; (③)求出回归系数,即可得出结论. 【详解】(③)设各小长方形的宽度为m ,由频率分布直方图各小长方形面积总和为1,可知()0.080.10.140.120.040.020.51m m +++++⋅==,故2m =;(③)由(③)知各小组依次是[)[)[)[)[)[]0,2,2,4,4,6,6,8,8,10,10,12, 其中点分别为1,3,5,7,9,11,对应的频率分别为0.16,0.20,0.28,0.24,0.08,0.04, 故可估计平均值为10.1630.250.2870.2490.08110.045⨯+⨯+⨯+⨯+⨯+⨯=; (③)由(③)知空白栏中填5. 由题意可知,1234535x ++++==,232573.85y ++++==,51122332455769i ii x y==⨯+⨯+⨯+⨯+⨯=∑,522222211234555ii x==++++=∑,根据公式,可求得26953 3.8121.2555310ˆb-⨯⨯===-⨯, 3.8 1.230ˆ.2a =-⨯=,即回归直线的方程为 1.2.2ˆ0yx =+. 【点睛】本题考查回归方程,考查频率分布直方图,考查学生的读图、计算能力,属于中档题.7.(2019·宁夏高考模拟(文))2014年7月18日15时,超强台风“威马逊”登陆海南省.据统计,本次台风造成全省直接经济损失119.52亿元,适逢暑假,小明调查住在自己小区的50户居民由于台风造成的经济损失,作出如下频率分布直方图:(1)台风后区委会号召小区居民为台风重灾区捐款,小明调查的50户居民捐款情况如上表,在表格空白处填写正确数字,并说明是否有95%以上的把握认为捐款数额是否多于或少于500元和自身经济损失是否到4000元有关?(2)台风造成了小区多户居民门窗损坏,若小区所有居民的门窗均由李师傅和张师傅两人进行维修,李师傅每天早上在7:00到8:00之间的任意时刻来到小区,张师傅每天早上在7:30到8:30分之间的任意时刻来到小区,求李师傅比张师傅早到小区的概率.附:临界值表参考公式:22()()()()()n ad bcKa b c d a c b d-=++++,n a b c d=+++.【答案】(1)有把握;(2)218. 【分析】(1)由直方图得到22⨯列联表,利用公式求得2K 的值,与临界值比较即可作出判定,得到结论.(2)设李师傅、张师傅到小区的时间分别为,x y ,得到试验的全部结果所构成的区域及事件A 表示“李师傅比张师傅早到小区”, 根据几何概型,利用面积比可求()78P A =,则李师傅比张师傅早到小区的天数的分布列为二项分布,利用二项分布的期望公式可得结果. 【详解】 (1)如下表:()225030695 4.046 3.84139113515K ⨯⨯-⨯=≈>⨯⨯⨯所以有95%以上的把握认为捐款数额是否多于或少于500元和自身经济损失是否到4000元有关. (2)设李师傅、张师傅到小区的时间分别为,x y ,则(,x y )可以看成平面中的点.试验的全部结果所构成的区域为(){,|78,7.58.5}Q x y x x =≤≤≤≤,则S Ω=1,事件A 表示“李师傅比张师傅早到小区”,所构成的区域为A ={(x ,y )|y ≥x ,7≤x ≤8,7.5≤y ≤8.5}, 即图中的阴影部分面积为111712228A S =-⨯⨯=,所以()78A QS P A S ==, 李师傅比张师傅早到小区的天数的分布列为二项分布73,8B ξ⎛⎫~ ⎪⎝⎭,721388E ξ=⨯=. 【点睛】本题主要考查了独立性检验的应用,以及几何概型概率的计算问题,以及二项分布的数学期望公式的应用,属于中档试题. “求期望”,一般利用离散型随机变量的数学期望的定义求期望.对于某些实际问题中的随机变量,如果能够断定它服从某常见的典型分布(如二项分布(),X B n p ~),则此随机变量的期望可直接利用这种典型分布的期望公式(()E X np =)求得.因此,应熟记常见的典型分布的期望公式,可加快解题速度. 8.(2019·江西高二月考(文))通过随机询问某地100名高中学生在选择座位时是否挑同桌,得到如下22⨯列联表:()1从这50名男生中按是否挑同桌采取分层抽样的方法抽取一个容量为5的样本,现从这5人中随机选取3人做深度采访,求这3名学生中至少有2名要挑同桌的概率; ()2根据以上22⨯列联表,是否有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关?下面的临界值表供参考:(参考公式:()()()()22()n ad bc K a b c d a c b d -=++++,其中)n a b c d =+++【答案】(③) 7(10P =③)见解析 试题分析:(③)根据分层抽样原理求出样本中挑同桌有3人,不挑同桌有2人,利用列举法求出基本事件数,计算对应的概率值;(③)根据2×2列联表计算观测值,对照临界值表得出结论. 解析:(③)根据分层抽样方法抽取容量为5的样本,挑同桌有3人,记为A 、B 、C ,不挑同桌有2人,记为d 、e ; 从这5人中随机选取3人,基本事件为ABC ABd ABe ACd ACe Ade BCd BCe Bde Cde ,,,,,,,,,共10种;这3名学生中至少有2名要挑同桌的事件为概率为ABC ABd ABe ACd ACe BCd BCe ,,,,,,,共7种;故所求的概率为710P =; (③)根据以上22⨯列联表,计算观测值22100(30102040) 4.7619 3.84170305050K ⨯⨯-⨯=≈>⨯⨯⨯,对照临界值表知,有95%以上的把握认为“性别与在选择座位时是否挑同桌”有关. 9.(2019·四川棠湖中学高三(文))省环保厅对A 、B 、C 三个城市同时进行了多天的空气质量监测,测得三个城市空气质量为优或良的数据共有180个,三城市各自空气质量为优或良的数据个数如下表所示:已知在这180个数据中随机抽取一个,恰好抽到记录B 城市空气质量为优的数据的概率为0.2.(I )现按城市用分层抽样的方法,从上述180个数据中抽取30个进行后续分析,求在C 城中应抽取的数据的个数;(II )已知23y ≥,24z ≥,求在C 城中空气质量为优的天数大于空气质量为良的天数的概率.【答案】(1)9;(2)38.【试题分析】(1)由0.2180x=计算出x ,再由总数计算出y z +,按比例计算得应抽人数.(2) 由(1)知54y z +=,,y z N ∈且23y ≥,24z ≥,利用列举法和古典概型计算公式计算得相应的概率. 【试题解析】 (1)由题意得0.2180x=,即36x =. ③1802832363054y z +=----=, ③在C 城中应抽取的数据个数为30549180⨯=. (2)由(1)知54y z +=,,y z N ∈且23y ≥,24z ≥,③满足条件的数对(),y z 可能的结果有()23,31,()24,30,()25,29,()26,28,()27,27,()28,26,()29,25,()30,24共8种.其中“空气质量为优的天数大于空气质量为良的天数”对应的结果有()28,26,()29,25,()30,24共3种.③在C 城中空气质量为优的天数大于空气质量为良的天数的概率为38. 10.(2019·江西高考模拟(文))某书店为了了解销售单价(单位:元)在[8,20]]内的图书销售情况,从2018年上半年已经销售的图书中随机抽取100本,获得的所有样本数据按照[8,10),[10,12),[12,14),[14,16),[16,18),[18,20]分成6组,制成如图所示的频率分布直方图,已知样本中销售单价在[14,16)内的图书数是销售单价在[18,20]内的图书数的2倍.(1)求出x 与y ,再根据频率分布直方图估计这100本图书销售单价的平均数(同一组中的数据用该组区间的中点值作代表);(2)用分层抽样的方法从销售单价在[8,20]内的图书中共抽取40本,求单价在6组样本数据中的图书销售的数量;(3)从(2)中抽取且价格低于12元的书中任取2本,求这2本书价格都不低于10元的概率.【答案】(1)见解析;(2)6本;(3)25【解析】(1)先求出x 与y ,再根据直方图求出平均值; (2)根据分层抽样是按比例抽样可得结果; (3)用列举法和古典概型概率公式求出结果 【详解】(1)样本中图书的销售单价在[)14,16内的图书数是2100200x x ⨯=g ,样本中图书的销售单价在[)1820,内的图书数是2100200y y ⨯=g , 依据题意,有2002200x y =⨯,即2x y =,③根据频率分布直方图可知()0.120.0250.0521x y ⨯++++⨯=,③ 由③③得0.15,0.075x y ==.根据频率分布直方图估计这100本图书销售单价的平均数为810101212141416161818200.02520.0520.120.1520.120.0752222222++++++⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯ =0.45+1.1+2.6+4.5+3.4+2.85=14.9(元)(2)因为销售单价在[)[)[)[)[)[]8,10,10,12,12,14,14,16,16,18,18,20的图书的分层抽样比为1:2:4:6:4:3,故在抽取的40本图书中,销售单价在[)[)[)[)[)[]8,10,10,12,12,14,14,16,16,18,18,20内的图书分别为124643402,404,408,4012,408,406202020202020⨯=⨯=⨯=⨯=⨯=⨯=(本) (3)这40本书中价格低于12元的共有6本,其中价格低于10元的2本,记这2本为12,A A ,另外4本记为1234,,,B B B B ,从中抽取2本的基本事件有:121112131421222324121314232434,,,,,,,,,,,,,,A A A B A B A B A B A B A B A B A B B B B B B B B B B B B B共15个,其中价格不低于10元的有6个,所以: 这2本书价格都不低于10元的概率62155P ==. 【点睛】本题考查了频率分布直方图、分层抽样及概率问题,较为简单11.(2019·四川高考模拟(文))目前有声书正受着越来越多人的喜爱.某有声书公司为了解用户使用情况,随机选取了100名用户,统计出年龄分布和用户付费金额(金额为整数)情况如下图.有声书公司将付费高于20元的用户定义为“爱付费用户”,将年龄在30岁及以下的用户定义为“年轻用户”.已知抽取的样本中有38的“年轻用户”是“爱付费用户”. (1)完成下面的22⨯列联表,并据此资料,能否有95%的把握认为用户“爱付费”与其为“年轻用户”有关?(2)若公司采用分层抽样方法从“爱付费用户”中随机选取5人,再从这5人中随机抽取2 人进行访谈,求抽取的2人恰好都是“年轻用户”的概率.()()()()()22n ad bc K a b c d a c b d -=++++.【答案】(1)有95%的把握认为“爱付费用户”和“年轻用户”有关;(2)35. 【解析】 【分析】(1)根据题意可得列联表,然后根据表中的数据求出2K 后与临界值表中的数据对照后可得结论.(2)根据古典概型概率公式求解可得所求概率. 【详解】(1)根据题意可得22⨯列联表如下:由表中数据可得()()()()()()2221002430406 4.76 3.84130706436n ad bc K a b c d a c b d -⨯⨯-⨯==≈>++++⨯⨯⨯,所以有95%的把握认为“爱付费用户”和“年轻用户”有关.(2)由分层抽样可知,抽取的5人中有4人为“年轻用户”,记为1A ,2A ,3A ,4A ,1人为“非年轻用户”,记为B .则从这5人中随机抽取2人的基本事件有:()12,A A ,()13,A A ,()14,A A ,()1,A B ,()23,A A ,()24,A A ,()2,A B ,()34,A A ,()3,A B ,()4,A B ,共10个基本事件.其中满足抽取的2人均是“年轻用户”的事件有:()12,A A ,()13,A A ,()14,A A ,()23,A A ,()24,A A ,()34,A A ,共6个.所以从中抽取2人恰好都是“年轻用户”的概率为63P 105==. 【点睛】独立性检验的方法是得到列联表后求出2K 的值后与临界值表进行对照后得到结论,查表时要根据题目要求的百分比找到第一行对应的数值,再将该数值对应的k 值与求得的2K 相比较.另外,表中第一行数据表示两个变量没有关联的可能性p ,所以其有关联的可能性为1p -.。
高三数学文史科三轮复习概率与统计课件一、概率与统计的概述概率与统计是高中数学的重要内容之一,也是文史科学生备战高考的重点之一。
本课件旨在对概率与统计的知识进行全面系统的复习,帮助学生巩固知识,提高解题能力。
1.1 概率与统计的定义概率是研究随机现象的发生可能性的数学工具,统计是研究大量数据的收集、整理、分析和解释的方法。
概率与统计的研究对象都是随机变量,但侧重点不同。
1.2 概率的基本概念概率的基本概念包括样本空间、事件、概率、频率等。
学生需要理解这些概念的含义,掌握计算概率的方法,并能够用概率解决实际问题。
1.3 统计的基本概念统计的基本概念包括总体、样本、样本均值等。
学生需要掌握概念的定义,理解统计的基本思想和方法,能够进行数据的整理、分析和解释。
二、概率的运算概率的运算是概率论的基础,掌握概率的运算方法对于解决概率问题非常重要。
2.1 事件的概率事件的概率是指事件发生的可能性大小,常用的计算方法有频率法、古典概型法、几何概型法等。
学生需要掌握这些方法的原理和应用,能够灵活运用于解题中。
2.2 复合事件概率的计算复合事件是由两个或多个简单事件构成的事件,计算复合事件的概率需要运用交集、并集等运算法则。
学生需要理解复合事件的概念,掌握计算方法,并能够应用于实际问题中。
2.3 条件概率与独立性条件概率是指在已知一事件发生的条件下,另一事件发生的概率。
独立事件是指两个事件之间的发生与否互不影响。
学生需要深入理解条件概率和独立性的概念,熟练掌握计算方法,并能够解决与之相关的问题。
三、统计的基本方法统计的基本方法主要包括数据的收集、整理、分析和解释。
3.1 数据的收集与整理数据的收集是指通过实地观察、调查问卷等方式收集原始数据。
数据的整理是指对原始数据进行排序、分类、编码等处理,以便进行后续分析。
3.2 数据的分析与解释数据的分析是指通过绘制图表、计算统计指标等方法对数据进行分析,发现数据的规律和特征。
重难点04 概率与统计新高考概率与统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
试题考查特点是以实际应用问题为载体,小题部分主要是考查排列组合与古典概型,解答题部分主要考查独立性检验、超几何分布、离散型分布以及正态分布对应的数学期望以及方差。
概率的应用立意高,情境新,赋予时代气息,贴近学生的实际生活。
取代了传统意义上的应用题,成为高考中的亮点。
解答题中概率与统计的交汇是近几年考查的热点趋势,应该引起关注。
求解概率问题首先确定是何值概型再用相应公式进行计算,特别对于解互斥事件(独立事件)的概率时,要注意两点:(1)仔细审题,明确题中的几个事件是否为互斥事件(独立事件),要结合题意分析清楚这些事件互斥(独立)的原因;(2)要注意所求的事件是包含这些互斥事件(独立事件)中的哪几个事件的和(积),如果不符合以上两点,就不能用互斥事件的和的概率.离散型随机变量的均值和方差是概率知识的进一步延伸,是当前高考的热点内容.解决均值和方差问题,都离不开随机变量的分布列,另外在求解分布列时还要注意分布列性质的应用.捆绑法:题目中规定相邻的几个元素捆绑成一个组,当作一个大元素参与排列。
相离问题插空排:元素相离(即不相邻)问题,可先把无位置要求的几个元素全排列,再把规定的相离的几个元素插入上述几个元素的空位和两端。
定序问题缩倍法:在排列问题中限制某几个元素必须保持一定的顺序,可用缩小倍数的方法。
标号排位问题分步法:把元素排到指定位置上,可先把某个元素按规定排入,第二步再排另一个元素,如此继续下去,依次即可完成。
有序分配问题逐分法:有序分配问题指把元素分成若干组,可用逐步下量分组法。
对于二项式定理的应用,只要会求对应的常数项以及对应的n项即可,但是应注意是二项式系数还是系数。
新高考统计主要考查统计分析、变量的相关关系,独立性检验、用样本估计总体及其特征的思想,以排列组合为工具,考查对五个概率事件的判断识别及其概率的计算。
第1讲概率、随机变量及其分布[做小题——激活思维]1.若随机变量X的分布列如表所示,E(X)=1。
6,则a-b=( )X0123P0。
1a b0。
1A.0.2C.0。
8 D.-0。
8B[由0。
1+a+b+0.1=1,得a+b=0。
8,又由E(X)=0×0.1+1×a+2×b+3×0。
1=1。
6,得a+2b=1.3,解得a=0。
3,b=0.5,则a-b=-0。
2.]2.已知甲在上班途中要经过两个路口,在第一个路口遇到红灯的概率为0。
5,两个路口连续遇到红灯的概率为0。
4,则甲在第一个路口遇到红灯的条件下,第二个路口遇到红灯的概率为( )A.0。
6 B.0.7C.0.8 D.0。
9C[记“第一个路口遇到红灯"为事件A,“第二个路口遇到红灯”为事件B,则P(A)=0.5,P(AB)=0。
4,则P(B|A)=错误!=0.8,故选C。
]3.两个实习生每人加工一个零件,加工为一等品的概率分别为错误!和错误!,两个零件是否加工为一等品相互独立,则这两个零件中恰有一个一等品的概率为( )A。
错误!B。
错误!C。
14D。
错误!B[设事件A:甲实习生加工的零件为一等品;事件B:乙实习生加工的零件为一等品,且A,B相互独立,则P(A)=错误!,P(B)=错误!,所以这两个零件中恰有一个一等品的概率为P(A错误!)+P(错误!B)=P(A)P(错误!)+P(错误!)P(B)=错误!×错误!+错误!×错误!=错误!。
]4.设随机变量X~B(2,p),Y~B(4,p),若P(X≥1)=错误!,则P(Y≥1)=( )A.错误!B。
错误!C。
错误!D.1C[∵X~B(2,p),∴P(X≥1)=1-P(X=0)=1-C错误!(1-p)2=错误!,解得p=错误!,∴P(Y≥1)=1-P(Y=0)=1-C0,4(1-p)4=1-错误!=错误!,故选C.]5.罐中有6个红球和4个白球,从中任取1球,记住颜色后再放回,连续取4次,设X为取得红球的次数,则X的方差D(X)的值为________.错误![因为是有放回地取球,所以每次取球(试验)取得红球(成功)的概率均为错误!,连续取4次(做4次试验),X为取得红球(成功)的次数,则X~B错误!,∴D(X)=4×错误!×错误!=错误!.]6.已知某批零件的长度误差(单位:毫米)服从正态分布N(0,32),从中随机取一件,其长度误差落在区间(3,6)内的概率为________.(附:若随机变量X服从正态分布N(μ,σ2),则P(μ-σ<X<μ+σ)=0。
【高考复习】2020年高考数学(理数) 概率与统计大题1.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机下单和支付.出门不带现金的人数正在迅速增加.中国人民大学和法国调查公司益普索(Ipsos)合作,调查了腾讯服务的6 000名用户,从中随机抽取了60名,统计他们出门随身携带的现金(单位:元)如茎叶图所示,规定:随身携带的现金在100元以下的为“淡定族”,其他为“非淡定族”.(1)根据上述样本数据,列出2×2列联表,判断是否有75%的把握认为“淡定族”与“性别”有关?(2)用样本估计总体,若从腾讯服务的用户中随机抽取3人,设这3人中“淡定族”的人数为随机变量ξ,求随机变量ξ的概率分布列及数学期望.参考公式:K2=n ad-bc2a+b c+d a+c b+d,其中n=a+b+c+d.参考数据:2.第四届世界互联网大会在浙江乌镇隆重召开,人工智能技术深受全世界人民的关注,不同年龄段的人群关注人工智能技术应用与发展的侧重点有明显的不同,某中等发达城市的市场咨询与投资民调机构在该市对市民关注人工智能技术应用与发展的侧重方向进行调查,随机抽取1 000名市民,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],并绘制了如图所示的频率分布直方图.(1)求这 1 000名市民年龄的平均数和中位数(同一组中的数据用该组区间的中点值作代表);(2)调查发现年龄在[20,40)的市民侧重关注人工智能技术在学习与工作方面的应用与发展,其中关注智能办公的共有100人,将样本的频率视为总体的频率,从该市年龄在[20,40)的市民中随机抽取300人,请估计这300人中关注智能办公的人数;(3)用样本的频率代替概率,现从该市随机抽取20名市民调查关注人工智能技术在养老服务方面的应用与发展的情况,其中有k名市民的年龄在[60,80]的概率为P(X=k),其中k=0,1,2,…,20,当P(X=k)最大时,求k的值.3.某校高三年级有500名学生,一次考试的英语成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如下:(1)如果成绩高于135分的为特别优秀,则本次考试英语、数学成绩特别优秀的学生大约各多少人?(2)试问本次考试英语和数学的平均成绩哪个较高,并说明理由;(3)如果英语和数学两科成绩都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设3人中两科成绩都特别优秀的有ξ人,求ξ的分布列和数学期望.参考公式及数据:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.68,P(μ-2σ<X≤μ+2σ)=0.96,P(μ-3σ<X≤μ+3σ)=0.99.4.已知具有相关关系的两个变量x ,y 的几组数据如下表所示:(1)请根据上表数据在网格纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^,并估计当x=20时y 的值;(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列以及期望.参考公式:b ^=∑i=1nx i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.5.某知名品牌汽车深受消费者喜爱,但价格昂贵.某汽车经销商推出A,B,C三种分期付款方式销售该品牌汽车,并对近期100位采用上述分期付款方式付款的客户进行统计分析,得到柱状图如图所示.已知从A,B,C三种分期付款销售中,该经销商每销售此品牌汽车1辆所获得的利润分别是1万元、2万元、3万元.现甲、乙两人从该汽车经销商处,采用上述分期付款方式各购买此品牌汽车一辆.以这100位客户所采用的分期付款方式的频率估计1位客户采用相应分期付款方式的概率.(1)求甲、乙两人采用不同分期付款方式的概率;(2)记X(单位:万元)为该汽车经销商从甲、乙两人购车中所获得的利润,求X的分布列与期望.6.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万元)的数据如下:(1)若用线性回归模型拟合y 与x 的关系,求出y 关于x 的线性回归方程;(2)若用y=c +d x 模型拟合y 与x 的关系,可得回归方程y ^=1.63+0.99x ,经计算线性回归模型和该模型的R 2分别约为0.75和0.88,请用R 2说明选择哪个回归模型更好;(3)已知利润z 与x ,y 的关系为z=200y-x.根据(2)的结果回答下列问题:①广告费x=20时,销售量及利润的预报值是多少?②广告费x 为何值时,利润的预报值最大?(精确到0.01)参考公式:回归直线y ^=a ^+b ^x 的斜率和截距的最小二乘估计分别为b ^=∑i=1n x i y i -n x-y -∑i =1n x 2i -n x -2,a ^=y --b ^x -.参考数据:5≈2.24.7.通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:(1)将题中的2×2列联表补充完整;(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由;(3)如果按性别进行分层抽样,从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派3人参加某项校际挑战赛,记选出3人中的女大学生人数为X,求X的分布列和数学期望.附:K2=n ad-bc2a+b c+d a+c b+d.8.甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率;(2)若将频率视为概率,回答下列两个问题:①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.9.近年来“双十一”已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业.某商家为了准备2018年“双十一”的广告策略,随机调查了1 000名客户在2017年“双十一”前后10天内网购所花时间T(单位:时),并将调查结果绘制成如图所示的频率分布直方图.由频率分布直方图可以认为,这10天网购所花的时间T近似服从N(μ,σ2),其中μ用样本平均值代替,σ2=0.24.(1)计算μ,并利用该正态分布求P(1.51<T<2.49).(2)利用由样本统计获得的正态分布估计整体,将这10天网购所花时间在(2,2.98)小时内的人定义为目标客户,对目标客户发送广告提醒.现若随机抽取10 000名客户,记X为这10 000人中目标客户的人数.(ⅰ)求EX;(ⅱ)问:10 000人中目标客户的人数X为何值的概率最大?附:若随机变量Z服从正态分布N(μ,σ2),则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,P(μ-3σ<Z<μ+3σ)=0.997 4.0.24≈0.49.10.某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=23,记该班级完成n 首背诵后的总得分为S n . (1)求S 6=20且S i ≥0(i =1,2,3)的概率;(2)记ξ=|S 5|,求ξ的分布列及数学期望.答案解析1.解:(1)依题意可得2×2列联表如下:K 2=60×10×12-30×8218×42×40×20≈1.429>1.323,故有75%的把握认为“淡定族”与“性别”有关.(2)用样本估计总体,用户中为“淡定族”的概率为1860=310,ξ的可能取值为0,1,2,3,由题意,得到ξ~B ⎝ ⎛⎭⎪⎫3,310, P(ξ=k)=C k 3⎝ ⎛⎭⎪⎫310k ⎝ ⎛⎭⎪⎫7103-k,k=0,1,2,3,随机变量ξ的分布列为故随机变量ξ的数学期望E(ξ)=0×3431 000+1×4411 000+2×1891 000+3×271 000=9001 000=910.2.解:(1)由频率分布直方图可知,抽取的1 000名市民年龄的平均数 x -=25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54(岁). 设1 000名市民年龄的中位数为x ,则0.05+0.1+0.2+0.03×(x -50)=0.5,解得x=55, 所以这1 000名市民年龄的平均数为54,中位数为55.(2)由频率分布直方图可知,这1 000名市民中年龄在[20,40)的市民共有 (0.05+0.10)×1 000=150人,所以关注智能办公的频率为100150=23,则从该市年龄在[20,40)的市民中随机抽取300人,这300人中关注智能办公的人数为300×23=200.故估计这300人中关注智能办公的人数为200.(3)设在抽取的20名市民中,年龄在[60,80]的人数为X ,X 服从二项分布, 由频率分布直方图可知,年龄在[60,80]的频率为(0.025+0.010)×10=0.35,所以X ~B(20,0.35),所以P(X=k)=C k 200.35k (1-0.35)20-k,k=0,1,2, (20)设t=P X =k P X =k -1=C k 200.35k 0.6520-kC k -1200.35k -10.6521-k =721-k 13k ,k=1,2,…,20. 若t>1,则k<7.35,P(X=k-1)<P(X=k); 若t<1,则k>7.35,P(X=k-1)>P(X=k). 所以当k=7时,P(X=k)最大, 即当P(X=k)最大时,k 的值为7.3.解:(1)因为英语成绩服从正态分布N(100,17.52),所以英语成绩特别优秀的概率P 1=P(X≥135)=(1-0.96)×12=0.02,由频率估计概率,得数学成绩特别优秀的概率P 2=0.001 6×20×34=0.024,所以英语成绩特别优秀的学生大约有500×0.02=10(人), 数学成绩特别优秀的学生大约有500×0.024=12(人). (2)本次考试英语的平均成绩为100分,数学的平均成绩为60×0.16+80×0.168+100×0.48+120×0.16+140×0.032=94.72(分),因为94.72<100,所以本次考试英语的平均成绩较高.(3)英语和数学成绩都特别优秀的有6人,则单科成绩特别优秀的有10人, ξ可取的值有0,1,2,3,所以P(ξ=0)=C 310C 316=314,P(ξ=1)=C 210C 16C 316=2756,P(ξ=2)=C 110C 26C 316=1556,P(ξ=3)=C 36C 316=128,故ξ的分布列为E(ξ)=0×314+1×2756+2×1556+3×128=98.4.解:(1)散点图如图所示:(2)依题意,x -=15×(2+4+6+8+10)=6,y -=15×(3+6+7+10+12)=7.6,∑i =15x 2i=4+16+36+64+100=220,∑i =15x i y i =6+24+42+80+120=272,b ^=∑i=15x i y i -5x-y-∑i =15x 2i -5x -2=272-5×6×7.6220-5×62=4440=1.1,∴a ^=7.6-1.1×6=1, ∴线性回归方程为y ^=1.1x +1,故当x=20时,y=23.(3)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),故ξ的所有可能取值为1,2,3,P(ξ=1)=C22C13C35=310,P(ξ=2)=C12C23C35=610=35,P(ξ=3)=C33C35=110,故ξ的分布列为故E(ξ)=1×310+2×35+3×110=1810=95.5.解:(1)设“采用A种分期付款方式购车”为事件A,“采用B种分期付款方式购车”为事件B,“采用C种分期付款方式购车”为事件C,由柱状图得,P(A)=35100=0.35,P(B)=45100=0.45,P(C)=20100=0.2,∴甲、乙两人采用不同分期付款方式的概率P=1-(P(A)·P(A)+P(B)·P(B)+P(C)·P(C))=0.635.(2)由题意知,X的所有可能取值为2,3,4,5,6,P(X=2)=P(A)P(A)=0.35×0.35=0.122 5,P(X=3)=P(A)P(B)+P(B)P(A)=0.35×0.45+0.45×0.35=0.315,P(X=4)=P(A)P(C)+P(B)P(B)+P(C)P(A)=0.35×0.2+0.45×0.45+0.2×0.35=0.342 5,P(X=5)=P(B)P(C)+P(C)P(B)=0.45×0.2+0.2×0.45=0.18,P(X=6)=P(C)P(C)=0.2×0.2=0.04.∴X的分布列为E(X)=0.122 5×2+0.315×3+0.342 5×4+0.18×5+0.04×6=3.7.6.解:(1)∵x-=8,y-=4.2,∑i=17x i y i=279.4,∑i=17x2i=708,∴b^=∑i=17x i y i-7x-y-∑i=17x2i-7x-2=279.4-7×8×4.2708-7×82=0.17,a^=y--b^x-=4.2-0.17×8=2.84,∴y关于x的线性回归方程为y^=0.17x+2.84.(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,∴选用y^=1.63+0.99x更好.(3)由(2)知,①当x=20时,销售量的预报值y^=1.63+0.9920≈6.07(万台),利润的预报值z=200×6.07-20≈1 194(万元).②z=200(1.63+0.99x)-x=-x+198x+326=-(x)2+198x+326=-(x-99)2+10 127,∴当x=99,即x=9 801时,利润的预报值最大,故广告费为9 801万元时,利润的预报值最大.7.解:(1)题中的2×2列联表补充如下:(2)K 2=100×40×25-20×15255×45×60×40≈8.25>6.635,所以有99%的把握认为是否爱好该项运动与性别有关.(3)由题意,抽取6人中包括男生4名,女生2名,X 的取值为0,1,2,则P(X=0)=C 34C 36=15,P(X=1)=C 24C 12C 36=35,P(X=2)=C 14C 22C 36=15,故X 的分布列为E(X)=0×15+1×35+2×15=1.8.解:(1)记抽取的3天送餐单数都不小于40为事件M ,则P(M)=C 325C 350=23196.(2)①设乙公司送餐员的送餐单数为a , 当a=38时,X=38×6=228, 当a=39时,X=39×6=234, 当a=40时,X=40×6=240,当a=41时,X=40×6+1×7=247, 当a=42时,X=40×6+2×7=254.所以X 的所有可能取值为228,234,240,247,254. 故X 的分布列为所以E(X)=228×110+234×15+240×15+247×25+254×110=241.8.②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,所以甲公司送餐员的日平均工资为80+4×39.7=238.8元. 由①得乙公司送餐员的日平均工资为241.8元. 因为238.8<241.8,所以推荐小王去乙公司应聘. 9.解:(1)μ=0.4×(0.050×0.8+0.225×1.2+0.550×1.6+0.825×2.0+0.600×2.4+0.200×2.8+0.050×3.2)=2,从而T 服从N(2,0.24),又σ=0.24≈0.49,从而P(1.51<T <2.49)=P(μ-σ<T <μ+σ)=0.682 6. (2)(ⅰ)任意抽取1名客户,该客户是目标客户的概率为P(2<T <2.98)=P(μ<T <μ+2σ) =12P(μ-2σ<T <μ+2σ)=12×0.954 4=0.477 2. 由题意知X 服从B(10 000,0.477 2),所以EX=10 000×0.477 2=4 772. (ⅱ)X 服从B(10 000,0.477 2),P(X=k)=C k 10 0000.477 2k (1-0.477 2)10 000-k =C k 10 0000.477 2k ·0.522 810 000-k(k=0,1,2,…,10 000). 设当X=k(k≥1,k ∈N)时概率最大,则有⎩⎪⎨⎪⎧P X =k >P X =k +1,PX =k >P X =k -1,得⎩⎪⎨⎪⎧0.522 8C k 10 000>0.477 2C k +110 000,0.477 2C k 10 000>0.522 8C k -110 000,解得k=4 772.故10 000人中目标客户的人数为4 772的概率最大. 10.解:(1)当S 6=20时,即背诵6首后,正确的有4首,错误的有2首.由S i ≥0(i =1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首; 若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.则所求的概率P=⎝ ⎛⎭⎪⎫232×C 24⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫132+23×13×23×C 23⎝ ⎛⎭⎪⎫232×13=1681.(2)由题意知ξ=|S 5|的所有可能的取值为10,30,50,又p=23,∴P(ξ=10)=C 35⎝ ⎛⎭⎪⎫233×⎝ ⎛⎭⎪⎫132+C 25⎝ ⎛⎭⎪⎫232×⎝ ⎛⎭⎪⎫133=4081,P(ξ=30)=C 45⎝ ⎛⎭⎪⎫234×⎝ ⎛⎭⎪⎫131+C 15⎝ ⎛⎭⎪⎫231×⎝ ⎛⎭⎪⎫134=3081,P(ξ=50)=C 55⎝ ⎛⎭⎪⎫235×⎝ ⎛⎭⎪⎫130+C 05⎝ ⎛⎭⎪⎫230×⎝ ⎛⎭⎪⎫135=1181,∴ξ的分布列为∴E(ξ)=10×4081+30×3081+50×1181=1 85081.。
2020年高考数学二轮复习重点专题冲刺复习指导 专题3 统计与概率【高考考场实情】统计与概率在高考考查中一般有一道选择题或填空题、一道解答题,共2道题,分值为17分.高考对这一部分的考查难度相对稳定,选择、填空题为容易题, 解答题为中等难度题.选择题在前六题的位置,填空题在前二题的位置,解答题在前三题的位置.选择、填空题常考古典概型、几何概型(理科时而考查对立事件、相互独立事件概率及独立重复试验的概率)。
【考查重点难点】解答题以频率分布表、频率分布直方图、柱形图、折线图、茎叶图等五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.下面对学生存在的主要问题进行剖析,并提出相应的教学对策.【存在问题分析】1.概念理解不透【指点迷津】本专题中,概念理解不到位的有事件、模型的判断等;容易混淆的概念有互斥事件与对立事件、超几何分布与二项分布、二项展开式的通项公式1y n r r r n T C a b -+=与n 次独立重复试验中事件A 发生k 次的概率()(1)k k n k n nP k C p p -=-等. 【例1】已知5只动物中有1只患有某种疾病,需要通过化验血液来确定患病的动物.血液化验结果呈阳性的即为患病动物,呈阴性的即没患病.下面是两种化验方案:方案甲:逐个化验,直到能确定患病动物为止.方案乙:先任取3只,将它们的血液混在一起化验.若结果呈阳性则表明患病动物为这3只中的1只,然后再逐个化验,直到能确定患病动物为止;若结果呈阴性,则在另外2只中任取l 只化验.(Ⅰ)求依方案甲所需化验次数不少于依方案乙所需化验次数的概率;(Ⅱ)ξ表示依方案乙所需化验次数,求ξ的期望.【解析】(Ⅰ)设1ξ、2ξ已分别表示依方案甲和依方案乙需化验的次数,P 表示对应的概率,则方案甲中1ξ的分布列为方案乙中2ξ的分布列为若甲化验的次数不少于乙化验的次数,则[][]1212212221(1)(1)(2)(1)(2)(3)(1)(2)(3)(4)P P P P P P P P P P P ξξξξξξξξξξ==⨯=+=⨯=+=+==+=+=+=131322=0+(0)(0)0.72555555⨯++⨯+++=. (Ⅱ)3212()1023 2.4555E ξ=⨯+⨯+⨯==. 【名师点睛】本题易错的主要原因是对事件不清.对于方案甲,患有疾病的一只动物在每一次化验时出现的概率是等可能的,学生对事件不清,易误认为化验次数的可能取值是1,2,3,4,5,且1(1)(2)(3)(4)(5)2P P P P P ξξξξξ==========.事实上,若前4次化验为阴性,第5次不需再化验即知最后一只是患病动物,所以化验次数只能取l ,2,3,4.类似地,对于方案乙,第一次化验呈阳性,再化验3只中的前2只呈阴性后也不需再化验,或第一次化验呈阴性,再化验另外2只中的第l 只呈阴性或阳性后也不需再化验,即ξ只能取2,3.在解决问题时,要理清事件,求随机变量的分布列时,要弄清随机变量可能取到的每一个值以及取每一个值时所表示的意义,然后再利用所学的概率知识求出随机变量取每一个值时的概率,从而求出分布列.2.审题析题不到位【指点迷津】审题析题不清是本专题解答错误的主要原因,主要包括题意不清,茫然作答;阅读肤浅,丢失信息;条件欠缺,鲁莽下笔;图形不准,缺乏严密;方向不明,目标模糊等情况.审题不清的最主要原因在于学生的阅读理解能力欠缺.【例2】(2017年全国卷Ⅰ理19)为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量其尺寸(单位:cm ).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布2(,)N μσ.(Ⅰ)假设生产状态正常,记X 表示一天内抽取的16个零件中其尺寸在(3,3)μσμσ-+之外的零件数,求(1)P X ≥及X 的数学期望;(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)μσμσ-+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)试说明上述监控生产过程方法的合理性;(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸: 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.0410.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95经计算得16119.9716i i x x ===∑,161622221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.用样本平均数x 作为μ的估计值ˆμ,用样本标准差s 作为σ的估计值ˆσ,利用估计值判断是否需对当天的生产过程进行检查?剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据,用剩下的数据估计μ和σ(精确到0.01).附:若随机变量Z 服从正态分布2(,)N μσ,则(33)0.997 4P Z μσμσ-<<+=, 160.997 40.959 2=0.0080.09≈.【解析】(Ⅰ)抽取的一个零件的尺寸在(3,3)μσμσ-+之内的概率为0.9974,从而零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026,故()16,0.0026X B -,因此()()1611010.99740.0408P X P X ≥=-==-≈,X 的数学期望为160.00260.0416EX =⨯=(Ⅱ)(i )如果生产状态正常,一个零件尺寸在(3,3)μσμσ-+之外的概率只有0.0026,一天内抽取的16个零件中,出现尺寸在(3,3)μσμσ-+之外的零件的概率只有0.0408,发生的概率很小.因此一旦发生这种情况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.(ii )由9.97,0.212x s =≈,得μ的估计值为ˆ9.97,μσ=的估计值为ˆ0.212σ=,由样本数据可以看出有一个零件的尺寸在ˆˆˆˆ(3,3)μσμσ-+之外,因此需对当天的生产过程进行检查. 剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的平均数为1(169.979.22)10.0215⨯-= 因此μ的估计值为10.02.162221160.212169.971591.134i i x==⨯+⨯≈∑,剔除ˆˆˆˆ(3,3)μσμσ-+之外的数据9.22,剩下数据的样本方差为 221(1591.1349.221510.02)0.00815--⨯≈,因此σ的估计值为0.0080.09≈. 【名师点睛】面对试题中冗长的文字表述,学生方寸大乱,不知所措,从而失去读题、解题信心;没有形成通读全题的习惯,未能发现试题所附相关公式;未能根据试题提供的相关公式,提取零件的尺寸在(3,3)μσμσ-+之外的概率为0.0026;未能准确把握较长问句“生产线在这一天的生产过程可能出现了异常情况”的关键词等,导致回答问题含混不清、词不达意.3.读图识图能力弱【指点迷津】学生面对一堆数据无从下手,主要原因是对数据、图表的直观印象和积累储备的知识经验不够;没有形成“用数据说话”的统计观念;对抽象数据的数字特征理解不到位.【例3】(2016年全国卷Ⅲ理4)某旅游城市为向游客介绍本地的气温情况,绘制了一年中月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15C ︒,B 点表示四月的平均最低气温约为5C ︒.下面叙述不正确的是( )(A)各月的平均最低气温都在0C ︒以上 (B)七月的平均温差比一月的平均温差大(C)三月和十一月的平均最高气温基本相同 (D)平均最高气温高于20C ︒的月份有5个【解析】由图可知0C ︒均在虚线框内,所以各月的平均最低气温都在0C ︒以上,A 正确;由图可知七月的平均温差大于7.5C ︒,而一月的平均温差小于7.5C ︒,B 正确;由图可知三月和十一月的平均最高气温都大约在10C ︒,基本相同,C 正确;由图可知平均气温高于20C ︒的月份只有7、8两个月,D 错误.【名师点睛】解答本题错误主要是读图识图能力弱,对图形中的线条认识不明确,不知所措,只觉得是两把雨伞重叠在一起,找不到解决问题的方法;其次,不会从图表中读取有用数据并进行判断;第三,估计平均温差时易出现错误,错选B .4.解题规范性较差【指点迷津】涉及本专题内容的考查,学生失误和失分最多的是会而不对、对而不全和全而不准,如不能用字母表示事件,导致在利用简单事件表示复杂事件书写混乱;解答过程缺失关键步骤,丢三落四,导致丢分等.【例4】端午节吃粽子是我国的传统习俗,设一盘中装有10个粽子,其中豆沙粽2个,肉粽3个,白粽5个,这三种粽子的外观完全相同,从中任意选取3个.(Ⅰ)求三种粽子各取到1个的概率;(Ⅱ)设X 表示取到的豆沙粽个数,求X 的分布列与数学期望.【解析】(Ⅰ)设A 表示事件“三种粽子各取到1个”,则由古典概型的计算公式有()11123531014C C C P A C ==. (Ⅱ)X 的所有可能取值为0,1,2则()383107015C P X C ===,()12283107115C C P X C ===,()21283101215C C P X C === 所以X 的分布列为 X 1 2 3 P715 715 115 故()0121515155E X =⨯+⨯+⨯=个. 【名师点睛】从解题规范方面看,学生常出现错误有,没有用字母表示事件,即缺少“设A 表示事件‘三种粽子各取到l 个’”这一步骤;直接写出1()4P A =,过程没写出来,应写为1112353101()4C C C P A C ==,一但答案错误,就失去过程分数;忽视“X 的所有可能值为0,1,2”,导致丢分等.5. 运算能力弱【指点迷津】运算求解能力主要是指会根据法则、公式进行正确运算、变形和数据处理,能根据问题的条件寻找与设计合理、简捷的运算途径,能根据要求对数据进行估计和近似计算.本专题中,学生运算能力弱主要体现在不能根据问题的条件寻找与设计合理、简捷的运算途径,不能根据要求对数据进行估计和近似计算.【例5】(2017年全国卷Ⅰ文19)为了监控某种零件的一条生产线的生产过程,检验员每隔30 min 从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm ).下面是检验员在一天内依次抽取的16个零件的尺寸: 抽取次序 12 3 4 5 6 7 8 9 10 11 12 13 14 15 16零件尺寸 9.95 10.12 9.96 9.96 10.01 9.92 9.98 10.04 10.26 9.91 10.13 10.02 9.22 10.04 10.05 9.95 经计算得16119.9716i i x x ===∑,16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑,1621(8.5)18.439i i =-≈∑,161()(8.5) 2.78i i x x i =--=-∑,其中i x 为抽取的第i 个零件的尺寸,1,2,,16i =⋅⋅⋅.(Ⅰ)求(,)i x i (1,2,,16)i =⋅⋅⋅的相关系数r ,并回答是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(若||0.25r <,则可以认为零件的尺寸不随生产过程的进行而系统地变大或变小).(Ⅱ)一天内抽检零件中,如果出现了尺寸在(3,3)x s x s -+之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.(ⅰ)从这一天抽检的结果看,是否需对当天的生产过程进行检查?(ⅱ)在(3,3)x s x s -+之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(,)i i x y (1,2,,)i n =⋅⋅⋅的相关系数12211()()()()n i ii n n i i i i x x y y r x x y y ===--=--∑∑∑.0.0080.09≈. 【解析】(Ⅰ)由样本数据得(,)(1,2,...,16)i x i i =的相关系数为16116162211()(8.5)0.180.2121618.439()(8.5)ii ii i x x i r x x i ===--==≈-⨯⨯--∑∑∑. 由于||0.25r <,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(Ⅱ)(i )由于9.97,0.212x s =≈,由样本数据可以看出抽取的第13个零件的尺寸在(3,3)x s x s -+以外,因此需对当天的生产过程进行检查.(ii )剔除离群值,即第13个数据,剩下数据的平均数为1(169.979.92)10.0215⨯-=,这条生产线当天生产的零件尺寸的均值的估计值为10.02,162221160.212169.971591.134i i x ==⨯+⨯≈∑,剔除第13个数据,剩下数据的样本方差为221(1591.1349.221510.02)0.00815--⨯≈.[来源:学+科+网] 这条生产线当天生产的零件尺寸的标准差的估计值为0.0080.09≈.【名师点睛】从运算方面看,学生不懂从16162221111()(16)0.2121616i i i i s x x x x ===-=-≈∑∑中解出 16221()160.212i i x x =-=⨯∑;不会计算0.2121618.439r =⨯⨯的值,不懂根据保留小数点后两位的要求,实施近似处理以简化运算;不懂直接由0.2121618.439r =⨯⨯采用放缩方法判断是否满足||0.25r <;不会由9.97x =和0.212s ≈计算出区间(3,3)x s x s -+的端点值9.334,10.606;计算151115i i x x ==∑时,不懂得先做相反数相消处理或各项统一分离10后转化为15'111015i i x x ==+∑计算;计算15'1115iix x==∑时,不懂得转化为1613115iix xx=-=∑,再利用16119.9716iix x===∑简化运算;计算222222221[0.070.10.060.060.010.10.0415s=++++++22220.020.240.110.11+++++222200.020.030.07]++++0.008130.008=≈,不懂得各项统一提取20.01的技巧;计算222221[160.212169.979.221510.02]15s=⨯+⨯--⨯时,不懂得在保证精确度要求的前提下作近似处理以简化运算.【解决问题对策】1.关注统计图表的教学【指点迷津】高考试卷的解答题往往以频率分布表、频率分布直方图、柱形图、折线图、茎叶图五个样本频率分布图表为载体,理科侧重考查随机变量的分布列及期望,文科侧重考查样本数字特征的应用,突出了对应用意识、数据处理能力及创新能力的考查.复习过程中,应充分利用五个样本频率分布图表,让学生会从图表中读取有用数据,或根据问题需要选择合适图表,依据统计学中的方法对数据进行分析,作出合理的决策.【例6】【2015年全国卷Ⅱ文、理3】根据下面给出的2004年至2013年我国二氧化硫排放量(单位:万吨)柱形图.以下结论不正确的是()A.逐年比较,2008年减少二氧化硫排放量的效果最显著B.2007年我国治理二氧化硫排放显现成效C.2006年以来我国二氧化硫年排放量呈减少趋势D.2006年以来我国二氧化硫年排放量与年份正相关【答案】A2.关注样本数字特征的含义【指点迷津】在复习中,应关注众数、中位数、平均数(期望)、方差与标准差有的含义,并能根据解决问题的需要选择合理的数字特征说明问题.【例7】【2014年课标卷Ⅱ文19】某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(Ⅰ)分别估计该市的市民对甲、乙部门评分的中位数;(Ⅱ)分别估计该市的市民对甲、乙部门的评分高于90的概率;(Ⅲ)根据茎叶图分析该市的市民对甲、乙两部门的评价.【答案】(Ⅰ)67;(Ⅱ)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为50.150=,80.1650=,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(Ⅲ)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.(注:考生利用其他统计量进行分析,结论合理的同样给分)3. 厘清事件及其概率【指点迷津】复习过程中,应厘清事件间的关系,准确计算相关事件的概率.特别要求学生能将复杂事件进行分解,先分解为互斥事件,每个互斥事件又分解为两个相互独立事件的积事件.【例8】(2013年全国卷Ⅰ理19)一批产品需要进行质量检验,检验方案是:先从这批产品中任取4件作检验,这4件产品中优质品的件数记为n.如果3n=,再从这批产品中任取4件作检验,若都为优质品,则这批产品通过检验;如果4n=,再从这批产品中任取1件作检验,若为优质品,则这批产品通过检验;其他情况下,这批产品都不能通过检验.假设这批产品的优质品率为50%,即取出的每件产品是优质品的概率都为12,且各件产品是否为优质品相互独立.(Ⅰ)求这批产品通过检验的概率;(Ⅱ)已知每件产品的检验费用为100元,且抽取的每件产品都需要检验,对这批产品作质量检验所需的费用记为X(单位:元),求X的分布列及数学期望.【解析】(Ⅰ)设第一次取出的4件产品中恰有3件优质品为事件A1,第一次取出的4件产品全是优质品为事件A2,第二次取出的4件产品都是优质品为事件B1,第二次取出的1件产品是优质品为事件B2,这批产品通过检验为事件A,依题意有A=(A1B1)∪(A2B2),且A1B1与A2B2互斥,所以P(A)=P(A1B1)+P(A2B2)=P(A1)P(B1|A1)+P(A2)P(B2|A2)=41113 161616264⨯+⨯=.(Ⅱ)X可能的取值为400,500,800,并且P(X=400)=41111161616--=,P(X=500)=116,P(X=800)=14,所以X的分布列为EX=1111400+500+80016164⨯⨯⨯=506.25.4.关注概率模型的识别与应用【指点迷津】复习过程中,应关注概率模型的识别与应用,一定要注意弄清题意,找出题中的关键字词,厘清各种概率模型及适用范围.如超几何分布和二项分布是教材中两个重要概率分布,二项分布与超几何分布的区别为,二项分布是有放回的抽样,每做一次事件,事件A 发生的概率是相同的;超几何分布是不放回的抽样,每做一次事件,事件A发生的概率是不相同的.【例9】某食品厂为了检查一条自动包装流水线的生产情况,从该流水线上随机抽取40件产品作为样本,测得它们的重量(单位:克),将重量按如下区间分组:(490,495],(495,500],(500,505],(505,510],(510,515],得到样本的频率分布直方图(如图所示).若规定重量超过495克但不超过510克的产品为合格产品,且视频率为概率,回答下列问题:(Ⅰ)在上述抽取的40件产品中任取2件,设X 为合格产品的数量,求X 的分布列和数学期望()E X ;(Ⅱ)若从流水线上任取3件产品,求恰有2件合格产品的概率.【解析】(Ⅰ)由样本的频率分布直方图得,合格产品的频率为0.0450.0750.0550.8⨯+⨯+⨯=. 所以抽取的40件产品中,合格产品的数量为400.832⨯=. 则X 可能的取值为0,1,2,所以()2824070195C P X C ===;()11832240641195C C P X C ===;()2322401242195C P X C ===, 因此X 的分布列为 X0 1 2 P 7195 64195 124195 故X 数学期望7641243128()0121951951951955E X =⨯+⨯+⨯==. (Ⅱ)因为从流水线上任取1件产品合格的概率为40.85=, 所以从流水线上任取3件产品,恰有2件合格产品的概率为223144855125P C ⎛⎫⎛⎫== ⎪⎪⎝⎭⎝⎭.学1科·网 5.关注用样本估计总体的思想分析解决问题【指点迷津】复习过程中,应让学生掌握,为了考察一个总体的情况,在统计中通常是从总体中抽取一个样本,用样本的有关情况去估计总体的相应情况.这种估计大体分为两类:用样本的频率分布估计总体的分布、用样本的数字特征估计总体的数字特征.其次,“预测与决策”与人们的生活休戚相关.随着社会的不断进步,人们对许多实际问题会有多种解决方案,但哪种方案最有利于解决问题,需要进行科学的决策.而通过期望、方差等的计算,并进行大小比较,就是其中的一种科学预测与决策的手段.【例10】【2016年课标Ⅰ理19】某公司计划购买2台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图:以这100台机器更换的易损零件数的频率代替1台机器更换的易损零件数发生的概率,记X表示2台机器三年内共需更换的易损零件数,n表示购买2台机器的同时购买的易损零件数. (Ⅰ)求X的分布列;(Ⅱ)若要求()0.5≤≥,确定n的最小值;P X n(Ⅲ)以购买易损零件所需费用的期望值为决策依据,在19n=之中选其一,应选用哪n=与20个?【答案】(Ⅰ)由柱状图并一频率代替概率知,一台机器在三年内需要更换的易损零件数为8,9,10,11的概率分别为0.2,0.4,0.2,0.2,从而P X==⨯=;(16)0.20.20.04P X==⨯⨯=;(17)20.20.40.16(18)20.20.20.40.40.24P X==⨯⨯+⨯=;P X==⨯⨯+⨯⨯=;(19)20.20.220.40.20.24P X==⨯⨯+⨯=;(20)20.20.20.20.20.2P X==⨯⨯=;(21)20.20.20.08P X==⨯=(22)0.20.20.04所以X的分布列为X 16 17 18 19 20 2122P 04.0 16.0 24.0 24.0 2.0 08.0 04.0(Ⅱ)由(Ⅰ)知44.0)18(=≤X P ,68.0)19(=≤X P ,故n 的最小值为19.(Ⅲ)记Y 表示2台机器在购买易损零件上所需的费用(单位:元).当19=n 时,08.0)500220019(2.0)50020019(68.020019⨯⨯+⨯+⨯+⨯+⨯⨯=EY 404004.0)500320019(=⨯⨯+⨯+. 当20=n 时,04.0)500220020(08.0)50020020(88.020020⨯⨯+⨯+⨯+⨯+⨯⨯=EY 4080=. 可知当19=n 时所需费用的期望值小于20=n 时所需费用的期望值,故应选19=n .6.关注“冷门”知识的复习【指点迷津】高考是对高中阶段学习结果的大检阅,统计与概率的考查,在突出核心知识考查的同时,也关注知识点的覆盖面.因此,在复习教学中,要全面检索高中阶段的所有知识,特别是不能忽视对所谓的“冷门知识”的复习,如正态分布、条件概率、相关系数、残差图、拟合效果等.【例11】【2015年课标Ⅰ理18】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t )和年利润z (单位:千元)的影响,对近8年的年宣传费i x 和年销售量i y (1,2,,8i =⋅⋅⋅)数据作了初步处理,得到下面的散点图及一些统计量的值.x y w 281(x )ii x =-∑ 281()i i w w =-∑ 81()(y )i i i x x y =--∑ 81()()i i i w w y y =--∑46.6 56.3 6.8 289.8 1.6 1469 108.8表中i i w x =,8118i i w w ==∑ (Ⅰ)根据散点图判断,y a bx =+y 与y c b x =+哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立y 关于x 的回归方程;(Ⅲ)以知这种产品的年利率z 与x 、y 的关系为0.2z y x =-.根据(Ⅱ)的结果回答下列问题: (i )年宣传费49x =时,年销售量及年利润的预报值是多少?(ii)年宣传费x 为何值时,年利率的预报值最大?附:对于一组数据11(,)u v ,22(,),,u v ⋅⋅⋅(,)n n u v ,其回归直线v u αβ=+的斜率和截距的最小二乘估计分别为µ121()()()n i i i n i i u u v v uu β==--=-∑∑,µµv u αβ=-. 【解析】(Ⅰ)100.668y x =+(Ⅲ) (i )由(Ⅱ)知,当49x =时,年销售量y 的预报值$100.66849576.6y =+=,年利润的预报值0.2576.64966.32z=⨯-=$. ②根据(Ⅱ)的结果知,年利润z 的预报值0.2(100.668)13.620.12zx x x x =+-=-++$, 所以当13.6 6.82x ==,即46.24x =时,z 取得最大值. 7.加强阅读理解能力培养与训练【指点迷津】统计与概率进一步强化应用意识的考查,已成高考命题改革的必然趋势,试卷试题文字阅读量的逐年增加,或成高考试卷的发展趋势.复习中,应规范教学的阅读指导.应该呈现读题提取关键信息、析题形成解题思路、解题示范规范表达、反思积淀解题经验的“四步曲”完整过程,才能充分发挥解题教学的效益.其次,加强平时的阅读训练.需要适当增加平时作业习题的阅读量,尤其是应用性试题的读题训练,提高学生的阅读理解能力及应试心态.【例12】【2014年课标Ⅰ理18】从某企业的某种产品中抽取500件,测量这些产品的一项质量指标值,由测量结果得如下频率分布直方图:(Ⅰ)求这500件产品质量指标值的样本平均数x 和样本方差2s (同一组数据用该区间的中点值作代表);(Ⅱ)由频率分布直方图可以认为,这种产品的质量指标值Z 服从正态分布2(,)N μδ,其中μ近似为样本平均数x ,2δ近似为样本方差2s .(i )利用该正态分布,求(187.8212.2)P Z <<;(ii )某用户从该企业购买了100件这种产品,记X 表示这100件产品中质量指标值为于区间(187.8,212.2)的产品件数,利用(i )的结果,求EX .12.2.若Z ~2(,)N μδ,则()P Z μδμδ-<<+=0.6826,(22)P Z μδμδ-<<+=0.9544.【解析】(Ⅰ) 2200,150x s ==(Ⅱ)(ⅰ)由(Ⅰ)知Z ~(200,150)N ,从而(187.8212.2)P Z <<=(20012.220012.2)0.6826P Z -<<+=,(ⅱ)由(ⅰ)知,一件产品中质量指标值为于区间(187.8,212.2)的概率为0.6826, 依题意知(100,0.6826)X B :,所以1000.682668.26EX =⨯=.8.规范答题表达形式【指点迷津】规范答题,一方面,思考问题要规范.也就是从知识的源头出发,弄清知识的来龙去脉.知识是怎么要求的,就怎么想、怎么用、怎么写,不能模棱两可,要会运用知识进行思考;另一方面,书写要规范.书写规范是一个重要的高考增分点,这一点应引起足够重视.如解题中应注意用字母表示事件,注意作答等.【例13】(2015年全国卷Ⅱ理18)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A 地区:62 73 81 92 95 85 74 64 53 76 78 86 95 66 97 78 88 82 76 89B 地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,得出结论即可);(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:记时间C :“A 地区用户的满意度等级高于B 地区用户的满意度等级” .假设两地区用户的评价结果相互独立.根据所给数据,以事件发生的频率作为相应事件发生的概率,求C 的概率.【解析】(Ⅰ)略;(Ⅱ)记1A C 表示事件:“A 地区用户满意度等级为满意或者非常满意”;记2A C 表示事件:“A 地区用户满意度等级为非常满意”;记1B C 表示事件:“A 地区用户满意度等级为不满意”;记2B C 表示事件:“A 地区用户满意度等级为满意”;则1A C 与1B C 独立,2A C 与2B C 独立,1B C 与2B C 互斥,1122()()B A B A C C C C C =U ,1122()(()())B A B A P C P C C C C =U 1122()()B A B A P C C P C C =+1122()()()()B A B A P C P C P C P C =+, 由所给数据得1212,,,A A B B C C C C 发生的频率分别为164108,,,20202020,故1212164108(),(),(),()20202020A A B B P C P C P C P C ====,所以164108()0.4820202020P C =⨯⨯⨯=.。
解密高考③ 概率与统计问题重在“辨”——辨析、辨型、辨图
——————[思维导图]——————
——————[技法指津]—————— 概率与统计问题辨析、辨型与辨图的基本策略
(1)准确弄清问题所涉及的事件有什么特点,事件之间有什么关系,如互斥、对立等. (2)理清事件以什么形式发生,如同时发生、至少有几个发生等. (3)明确抽取方式,如放回还是不放回、抽取有无顺序等. (4)分清是古典概型还是几何概型后再求概率. (5)会套用求b ^,K 2
的公式,再作进一步求值与分析. (6)理解各图表所给信息,利用信息找出所要数据.
母题示例:2019年全国卷Ⅰ,本小题满分12分
某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
满意 不满意 男顾客 40 10 女顾客
30
20
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异? 附:K 2
=
n ad -bc 2
a +b
c +
d a +c
b +d
P (K 2≥k )
0.050 0.010 0.001 k
3.841
6.635
10.828
(1)看到估计男、女顾客对该商场服务满意的概率,想到频率与概率的关系以及频率的求法.
(2)看到能否有95%的把握认为男、女顾客对该商场服务的评价有差异,想到利用公式计
算K 2
的值与临界值比较.
[规范解答·评分标准]
(1)由题中表格可知,50名男顾客对商场服务满意的有40人,
所以男顾客对商场服务满意率估计为P 1=4050=4
5
.
50名女顾客对商场满意的有30人,所以女顾客对商场服务满意率估
计为P 2=3050=3
5
.·······················································6分
(2)由列联表可知K 2
=
-
2
70×30×50×50
=
100
21
≈4.762>3.841,············································10分
所以能有95%的把握认为男、女顾客对该商场服务的评价有差异. ··12分 [构建模板·两点关键]
1.求概率的关键:定型——定性——定数量(几何量)——求概率. 2.求解统计案例问题的关键:作图(列表格)——计算——得结论.
母题突破:2019年潍坊模拟
母题突破2:2019年合肥模拟
2019年,在庆祝中华人民共和国成立70周年之际,又迎来了以“创军人荣耀,筑世界和平”为口号的第七届世界军人运动会(以下简称“军运会”).据悉,这次军运会将于2019年10月18日至27日在美丽的江城武汉举行,届时将有来自100多个国家的近万名军人运动员参赛.相对于奥运会、亚运会等大型综合赛事,军运会或许对很多人来说还很陌生,所以武汉某高校为了在学生中更广泛地推介普及军运会相关知识内容,特在网络上组织了一次“我所知晓的武汉军运会”知识问答比赛.为便于对答卷进行对比研究,组委会抽取了1 000名男生和1 000名女生的答卷,他们的成绩(单位:分)频率分布直方图如下:
(注:答卷满分为100分,成绩≥80的答卷为“优秀”等级)
(1)从现有1 000名男生和1 000名女生的答卷中各取一份,分别求答卷成绩为“优秀”等级的概率;
(2)求下面列联表中a,b,c,d的值,并根据列联表回答:能否在犯错误的概率不超过0.025的前提下认为“答卷成绩为‘优秀’等级与性别有关”?
附:K2=
n ad-bc2
a +
b c+d a+
c b+d
,其中n=a+b+c+d.
1
=0.58,
女生答卷成绩为“优秀”等级的概率P2=(0.046+0.034+0.016+0.010)×5=0.53.
(2)
由K2=
n ad-bc2
a +
b c+d a+
c b+d
得,
K2=
-2
1 110×890×1 000×1 000
≈5.061>5.024,
∴在犯错误的概率不超过0.025的前提下认为“答卷成绩为‘优秀’等级与性别有关”.
(3)根据男、女生成绩频率分布直方图可得,男、女生成绩的中位数均在80到85之间,但男生的成绩分布集中程度较女生成绩分布集中程度高,因此,可以认为男生的成绩较好且稳定.。