(完整)2020年高考文科数学《概率与统计》题型归纳与训练,推荐文档
- 格式:pdf
- 大小:281.09 KB
- 文档页数:22
高考数学概率与统计题型解析与答题技巧在高考数学中,概率与统计是一个重要的板块,它不仅考查学生的数学知识和技能,还培养学生的数据分析和推理能力。
对于很多同学来说,这部分内容既有一定的挑战性,又充满了得分的机会。
下面我们就来详细解析高考数学中概率与统计的常见题型以及相应的答题技巧。
一、概率题型1、古典概型古典概型是概率中最基础的题型之一。
它的特点是试验结果有限且等可能。
例如,从装有若干个红球和白球的袋子中摸球,计算摸到某种颜色球的概率。
答题技巧:首先,确定总的基本事件数和所求事件包含的基本事件数。
然后,利用古典概型的概率公式 P(A)=所求事件包含的基本事件数÷总的基本事件数进行计算。
2、几何概型几何概型与古典概型不同,它的试验结果是无限的。
常见的有长度型、面积型、体积型几何概型。
比如,在一个区间内随机取一个数,求满足某个条件的概率。
答题技巧:对于几何概型,关键是要正确确定几何度量。
例如,长度型就计算长度,面积型就计算面积,体积型就计算体积。
然后,按照几何概型的概率公式 P(A)=构成事件 A 的区域长度(面积或体积)÷试验的全部结果所构成的区域长度(面积或体积)进行求解。
3、条件概率条件概率是指在事件 B 发生的条件下,事件 A 发生的概率。
题目中通常会给出一些条件,让我们计算在这些条件下的概率。
答题技巧:利用条件概率公式 P(A|B)= P(AB)÷P(B),先求出 P(AB)和 P(B),再计算条件概率。
4、相互独立事件与互斥事件相互独立事件是指一个事件的发生与否对另一个事件的发生概率没有影响;互斥事件则是指两个事件不能同时发生。
答题技巧:对于相互独立事件,它们同时发生的概率用乘法计算,即 P(AB)= P(A)×P(B);对于互斥事件,它们至少有一个发生的概率用加法计算,即 P(A∪B)= P(A)+ P(B)。
二、统计题型1、抽样方法包括简单随机抽样、分层抽样和系统抽样。
概率与统计知识点及专练(一)统计基础知识:1. 随机抽样:(1).简单随机抽样:设一个总体的个数为N ,如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样.常用抽签法和随机数表法.(2).系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样).(3).分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽样,这种抽样叫做分层抽样.2. 普通的众数、平均数、中位数及方差: (1).众数:一组数据中,出现次数最多的数(2).平均数:常规平均数:12nx x x x n ++⋅⋅⋅+=(3).中位数:从大到小或者从小到大排列,最中间或最中间两个数的平均数(4).方差:2222121[()()()]n s x x x x x x n =-+-+⋅⋅⋅+-(5).标准差:s3 .频率直方分布图中的频率:(1).频率 =小长方形面积:f S y d ==⨯距;频率=频数/总数; 频数=总数*频率(2).频率之和等于1:121n f f f ++⋅⋅⋅+=;即面积之和为1: 121n S S S ++⋅⋅⋅+=4. 频率直方分布图下的众数、平均数、中位数及方差: (1).众数:最高小矩形底边的中点(2).平均数:112233n n x x f x f x f x f =+++⋅⋅⋅+ 112233n n x x S x S x S x S =+++⋅⋅⋅+(3).中位数:从左到右或者从右到左累加,面积等于0.5时x 的值(4).方差:22221122()()()nn s x x f x x f x x f =-+-+⋅⋅⋅+-5.线性回归直线方程:(1).公式:ˆˆˆy bx a=+其中:1122211()()ˆ()n ni i i ii in ni ii ix x y y x y nxybx x x nx====---∑∑==--∑∑(展开)ˆˆa y bx=-(2).线性回归直线方程必过样本中心(,) x y(3).ˆ0:b>正相关;ˆ0:b<负相关(4).线性回归直线方程:ˆˆˆy bx a=+的斜率ˆb中,两个公式中分子、分母对应也相等;中间可以推导得到6. 回归分析:(1).残差:ˆˆi i ie y y=-(残差=真实值—预报值)分析:ˆie越小越好(2).残差平方和:2 1ˆ() ni iiy y =-∑分析:①意义:越小越好;②计算:222211221ˆˆˆˆ()()()() ni i n niy y y y y y y y =-=-+-+⋅⋅⋅+-∑(3).拟合度(相关指数):2 2121ˆ()1()ni iiniiy y Ry y==-∑=--∑分析:①.(]20,1R∈的常数;②.越大拟合度越高(4).相关系数:()()n ni i i ix x y y x y nx y r---⋅∑∑==分析:①.[1,1]r∈-的常数;②.0:r>正相关;0:r<负相关③.[0,0.25]r∈;相关性很弱;(0.25,0.75)r∈;相关性一般;[0.75,1]r∈;相关性很强7. 独立性检验:(1).2×2列联表(卡方图): (2).独立性检验公式①.22()()()()()n ad bc k a b c d a c b d -=++++②.上界P 对照表:(3).独立性检验步骤:①.计算观察值k :2()()()()()n ad bc k a b c d a c b d -=++++ ②.查找临界值0k :由犯错误概率P ,根据上表查找临界值0k③.下结论:0k k ≥即认为有P 的没把握、有1-P 以上的有把握认为两个量相关;0k k <:即认为没有1-P 以上的把握认为两个量是相关关系。
高考文科数学概率与统计题型归纳与训练高考文科数学概率与统计题型归纳与训练近年来,随着高考评价重点的转变,我国高考数学概率与统计所占的比重越来越大,也极大地影响了学生的试题解答,特别是对文科类学生而言。
因此,归纳与训练概率与统计的题型对提升高考成绩非常有效。
一、高考概率与统计试题类型1、概率题:(1)概率概念题:要求判断某事件的可能性大小、求概率大小、比较概率大小,以及用中文描述概率大小等概念性问题。
(2)条件概率及贝叶斯公式:求两事件同时发生的条件概率,用贝叶斯公式求解概率问题。
(3)随机变量和概率分布:讨论正态分布、泊松分布等随机变量的概率分布。
2、统计学题:(1)数据的勘误析:把调查所得原始数据准确地归类编单,以便找出这些数据中蕴含的结论。
(2)图表分析:分析调查对象之间的关系,从折线图、饼形图、柱形图等图表中获取相应的数据。
二、概率与统计的训练方法1、理论思考训练:多看有关概率、统计的权威论文和教材,把基本概念牢牢掌握,把常见的概率公式及统计公式及推导式脱口而出。
2、示范练习:对常考的知识点补充示范练习,可以通过复现例题和大量习题来熟悉该知识点,从而深入理解,提高解题能力。
3、联系模拟考试:利用模拟考试把学过的知识点和技巧联系起来,在试题中能够驾轻就熟地掌握各试题技巧,大大提升实力。
4、强化记忆:记忆知识点、公式要选择相应的方法,通过反复记忆和熟习,把重点内容融会贯通,熟练记忆几个重点的式子和结论有助于考试的取得好成绩。
总之,学习概率与统计,除了要用心去理解之外,还需要不断的训练,把一些重点的知识点、公式强化记忆,加深理解,才能在考试中取得较好的成绩。
文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率P(A)e(0,1)(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1•某校高一年级有900名学生,其中女生400名•按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为.2•某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取名学生.3.某校老年、中年和青年教师的人数见右表,米用分层抽样的方法调查教类另U人数师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年老年教师900教师人数为中年教师1800 4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是青年教师1600 5•若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为•合计4300 6•重庆市2013年各月的平均气温(°C)数据的茎叶图如右图:o吕9则这组数据的中位数是•1252003127•某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国豕,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图的频率分布直方图.(II)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(III)估计居民月均用水量的中位数.0Q.511622.533.544.6月满意度评分低于70分 70分到89分不低于90分 满意度等级不满意满意非常满意A 地区用户满意度评分的频率分布直方司为了解用户对其产品的满意度,从A,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.(II) 根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(I) 应收集多少位女生的样本数据?(II) 根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(&10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;满意度评分分组 [50,60) [60,70) [70,80) [80,90) [90,100] 频数 2 8 14 10 6B 地区用户满意度评分的频数分布表 (I)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分 的平均值及分散程度(不要求计算出具 体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(III)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体 育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间 与性别有关”.n (ad 一bc\附:尺2步畝+d 儿+枫+d )P (2>k)0.10 0.05 0.01 0.005 k2.7063.8416.6357.8799.(2015全国II 文)某公03511.(2014全国I文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:(I)在下表中作出这些数据的频率分布直方图: 12.(2014广东文)某车间20名工人年龄数据如下表: 年皤7舁工人執7人1912日329330531斗323401昔讦20(I)求这20名工人年龄的众数与极差;(II)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(III)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是.14.___________________________________________________ 从甲、乙等5名学生中随机选出2人,则甲被选中的概率为(II)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是.(III)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95 16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是.的产品至少要占全部产品80%”的规定?17. (2016天津文)甲、乙两人下棋,两人下成和棋的概率为1,甲获胜的概率是-,则甲不23输的概率为.18. 已知5件产品中有2件次品,其余为合格品•现从这5件产品中任选2件,恰有一件次品 的概率为.24. 如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴19.某单位N 名员工参加“社区低碳你我他”活动•他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表.区间 [25,30) [30,35) [35,40) [40,45) [45,50] 人数25 ab5丰25. 为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174 176 176 176 178 儿子身高y (cm )17517517617717722. ____________________________________________ 在区间[-2,3]上随机选取一个数x ,则x <1的概率为23. ___________________________________ 若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是.(I )求y 关于t 的回归方程y =bt+a ;(II )利用(I )中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情4550年龄/驴(I )求正整数a ,b ,N 的值;(II )现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(III )在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率. 20.(2016全国丨文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是( A.1B.1C.-D.- 21.(2016全国II 文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒•若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()10 B.5D.—10 则y 对X 的线性回归方程为()A .y =x 一1B .y =x +1C .y =88+-x广告费用x (万元)4 2 35 销售额y (万元)4926395426.某产品的广告费用x 与销售额y 的统计数据如下:D .y =176根据上表可得回归方程y =bx+a 中的b 为9.4,据此模型预报广告费用为6万元时销售额为 A .63.6万元B .65.5万元C .67.7万元D .72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长•设某地区城乡居民人民币储蓄存款(年 底余额)如下表:年份 2011 2012 2013 2014 2015 时间代号t1 2 3 4 5 储蓄存款y (千亿兀)567810年(1=6)的人民币储蓄存款.V--‘’ty-nty _‘附:回归方程$=几+<2中,,a=y-bt.乙/2-nt 2i=l28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:乙校:(1)计算兀y 的值;况,并 预测 该地 区 2016P^Ki>k)0.10 0.05 0.010 k2.7063.8416.635参考数据与(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率; (3)由以上统计数据填写下面2X2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.公式:由列联表中数(a+b)(?+d)C+c)a+d),临界值表:29.—次考试中,5名学生的数学、物理成绩如下表所示:学生 A B C D E 数学成绩兀(分) 89 91 93 95 97 物理成绩y (分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90 分的概率;(2 )性回归100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.0.08°1—r---—r方程(系数精确到0.01).''''(1)求频率分布表中a、b的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标II)某险种的基本保费为a(单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:附:回归直线的方程是:y=bx+a上年度出险次数0 1 2 3 4 >5保费0.85a a 1.25a 1.5a 1.75a2a其中b=㈠(j——,a=y-b x;设该险种一续保人一年内出险次数与相应概率如下:ii=130•为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取一年内出险次数0 1 2 3 4 >5 概率0.30 0.15 0.20 0.20 0.10 0.05(I)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机摸出2只球,则这2只球颜色不同的概率为.33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答•试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.34.某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 82 93 48 65 81 74 56 54 76 65 79(I)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);A地区B帥反4567S9。
数学高三数学概率与统计知识总结与题型解析概率与统计是高中数学中的一个重要部分,也是数学高考中的一个重点考点。
掌握好概率与统计的知识对于高三学生来说非常重要。
本文将对高三数学概率与统计的知识进行总结,并解析一些常见的题型。
一、概率的基本概念和性质概率是研究随机试验结果出现的可能性的数学理论。
在概率的研究中,有几个基本概念和性质需要掌握。
1.1 试验、样本空间和事件随机试验是指具有以下三个特点的试验:可以在相同的条件下重复进行,每次试验的结果不确定,且试验的结果有多种可能性。
样本空间是指一个随机试验的所有可能结果的集合。
事件是样本空间的一个子集,表示随机试验中我们关心的一些结果。
1.2 概率的定义和性质概率的定义可以通过两种方式来描述:频率定义和古典定义。
频率定义是指当试验重复进行很多次时,事件发生的频率趋近于概率值。
古典定义是指在满足条件的情况下,事件发生的可能性与样本空间中元素个数的比值。
概率具有以下几个性质:非负性、规范性、可列可加性、互斥性和独立性。
1.3 条件概率和乘法定理条件概率是指在另一个事件已经发生的条件下,某个事件发生的概率。
条件概率可以通过乘法定理来计算。
二、离散型随机变量离散型随机变量是指在有限或可数无限个取值中取一个确定值的变量。
离散型随机变量具有以下几个重要的性质:概率函数、分布函数、数学期望、方差等。
2.1 二项分布二项分布是指在n次独立的伯努利试验中,事件发生的次数所符合的概率分布。
如果事件发生的概率为p,不发生的概率为q=1-p,那么在n次试验中,事件发生k次的概率可以由二项分布来计算。
2.2 泊松分布泊松分布是在一定时间或空间范围内,某个事件发生的概率符合的分布。
泊松分布的参数λ表示单位时间或单位空间内事件的平均发生率。
三、连续型随机变量连续型随机变量是指在一个或者几个区间内取值的变量。
连续型随机变量具有以下几个重要的性质:概率密度函数、分布函数、数学期望、方差等。
文科数学《统计与概率》核心知识点与参考练习题一、统计(核心思想:用样本估计总体)1.抽样(每个个体被抽到的概率相等)(1)简单随机抽样:抽签法与随机数表法(2)系统抽样(等距抽样)(3)分层抽样2.用样本估计总体:(1)样本数字特征估计总体:众数、中位数、平均数、方差与标准差(2)样本频率分布估计总体:频率分布直方图与茎叶图3.变量间的相关关系:散点图、正相关、负相关、回归直线方程(最小二乘法)4.独立性检验二、概率(随机事件发生的可能性大小)1.基本概念(1)随机事件A的概率1,0AP(2)用随机模拟法求概率(用频率来估计概率)(3)互斥事件(对立事件)2.概率模型(1)古典概型(有限等可能)(2)几何概型(无限等可能)三、参考练习题1.某校高一年级有900名学生,其中女生400名.按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为_______ .2.某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则该从高二年级抽取_____名学生.3.某校老年、中年和青年教师的人数见右表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为_______ .4.已知一组数据5.5,4.5,1.5,8.4,7.4,则该组数据的方差是_____.5.若1,2,3,4,m这五个数的平均数为3,则这五个数的标准差为____.6.重庆市2013年各月的平均气温(℃)数据的茎叶图如右图:则这组数据的中位数是________.7.某高校调查了200名学生每周的晚自习时间(单位:小时),制成了如图所示的频率分布直方图,其中晚自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.1408.(2016四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查. 通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 [0,0.5),[0.5,1),…,[4,4.5] 分成9组,制成了如图的频率分布直方图. (Ⅰ)求直方图中a的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(Ⅲ)估计居民月均用水量的中位数.类别人数老年教师900中年教师1800青年教师1600合计43009.(2015全国Ⅱ文)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频数分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100]频数2814106(Ⅰ)作出B 地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B地区用户满意度评分的频率分布直方图(Ⅱ)根据用户满意度评分,将用户的满意度分为三个等级:试估计哪个地区用户的满意度等级为不满意的概率大?说明理由.10.(2014安徽文)某高校共有学生15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(Ⅰ)应收集多少位女生的样本数据?(Ⅱ)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4小时的概率;(Ⅲ)在样本数据中,有60位女生的每周平均体育运动时间超过4小时,请完成每周平均体育运动时间与性别列联表,并判断是否有95%的把握认为“该校学生的每周平均体育运动时间与性别有关”.附:db c a d cb a bcd a n K22满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意2k KP 0.10 0.05 0.01 0.005 0k 2.7063.8416.6357.87911.(2014全国Ⅰ文)从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85)[85,95)[95,105)[105,115)[115,125] 频数 6 26 38 22 8(Ⅰ)在下表中作出这些数据的频率分布直方图:(Ⅱ)估计这种产品质量指标值的平均数和方差(同一组中的数据用该组区间的中点值作代表);(Ⅲ)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?12.(2014广东文)某车间20名工人年龄数据如下表:(Ⅰ)求这20名工人年龄的众数与极差;(Ⅱ)以十位数为茎,个位数为叶,作出这20名工人年龄的茎叶图;(Ⅲ)求这20名工人年龄的方差.13.(2016江苏)将一颗质地均匀的骰子(一种各个面上分别标有1,2,3,4,5,6个点的正方体玩具)先后抛掷2次,则出现向上的点数之和小于10的概率是_______ .14.从甲、乙等5名学生中随机选出2人,则甲被选中的概率为_______ .15.(2016全国乙卷文)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是______ .16.(2016全国丙卷文)小敏打开计算机时,忘记了开机密码的前两位,只记得第一位是M、I、N中的一个字母,第二位是1,2,3,4,5中的一个数字,则小敏输入一次密码能够成功开机的概率是________ .17.(2016天津文)甲、乙两人下棋,两人下成和棋的概率为21,甲获胜的概率是31,则甲不输的概率为_________ . 18.已知5件产品中有2件次品,其余为合格品.现从这5件产品中任选2件,恰有一件次品的概率为_________ .19.某单位N 名员工参加“社区低碳你我他”活动.他们的年龄在25岁至50岁之间.按年龄分组并得到的频率分布直方图如图所示.下表是年龄的频数分布表.区间[25,30)[30,35)[35,40)[40,45)[45,50]人数25ab(Ⅰ)求正整数a ,b ,N 的值;(Ⅱ)现要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,则年龄在第1,2,3组的人数分别是多少?(Ⅲ)在(2)的条件下,从这6人中随机抽取2人参加社区宣传交流活动,求恰有1人在第3组的概率.20.(2016全国Ⅰ文)某公司的班车在7:30,8:00,8:30发车,小明在7:50至8:30之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10分钟的概率是()A.31 B.21 C.32 D.4321.(2016全国Ⅱ文)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()A.107 B.85 C.83 D.10322.在区间[-2,3]上随机选取一个数x ,则1x 的概率为_____ .23.若将一个质点随机投入如图所示的长方形ABCD 中,其中AB=2,BC=1,则质点落在以AB 为直径的半圆内的概率是_______ .24.如图,在边长为1的正方形中随机撒1000粒豆子,有180粒落到阴影部分,据此估计阴影部分的面积为_________ .25.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x 的线性回归方程为()A.1?x yB.1?x yC.xy 2188? D.176?y26.某产品的广告费用x 与销售额y 的统计数据如下:根据上表可得回归方程axb y ???中的b ?为9.4,据此模型预报广告费用为6万元时销售额为A.63.6万元B.65.5万元C.67.7万元D.72.0万元27.随着我国经济的发展,居民的储蓄存款逐年增长.设某地区城乡居民人民币储蓄存款(年底余额)如下表:年份2011 2012 2013 2014 2015 时间代号t 1 2 3 4 5 储蓄存款y (千亿元)567810(Ⅰ)求y 关于t 的回归方程at by ???;(Ⅱ)利用(Ⅰ)中的回归方程,分析2011年至2015年该地区城乡居民储蓄存款的变化情父亲身高x (cm )174 176 176 176 178 儿子身高y (cm )175175176177177广告费用x (万元) 4 2 3 5 销售额y (万元)49263954况,并预测该地区2016年(t =6)的人民币储蓄存款.附:回归方程at b y ???中,t by atn t yt n y t b ni ini ii ??,?1221. 28.甲、乙两所学校高三年级分别有1200人、1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样的方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校:分组[70,80)[80,90)[90,100)[100,110)频数 3 4 8 15 分组[110,120)[120,130)[130,140)[140,150]频数15x32乙校:分组[70,80)[80,90)[90,100)[100,110)频数 1 2 8 9 分组[110,120)[120,130)[130,140)[140,150]频数1010y3(1)计算y x,的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.参考数据与公式:由列联表中数据计算db c a d cb abcadn K22;临界值表:29.一次考试中,5名学生的数学、物理成绩如下表所示:学生 A B C D E 数学成绩x (分)89 91 93 95 97 物理成绩y (分)8789899293(1)要从5名学生中选2人参加一项活动,求选中的学生中至少有一人的物理成绩高于90分的概率;甲校乙校总计优秀非优秀总计2k KP 0.10 0.05 0.010 0k 2.7063.8416.635(2)根据上表数据作散点图,求y 与x 的线性回归方程(系数精确到0.01).附:回归直线的方程是:ax b y ???,其中x byaxx y y x x b ni ini i i??,?121;90,93y x ,30,4051251yy x x xx ii i i i.30.为调查市民对汽车品牌的认可度,在秋季车展上,从有意购车的500名市民中,随机抽取100名市民,按年龄情况进行统计得到下面的频率分布表和频率分布直方图.(1)求频率分布表中a 、b 的值,并补全频率分布直方图,再根据频率分布直方图估计有意购车的这500名市民的平均年龄;31.(2016新课标Ⅱ)某险种的基本保费为a (单位:元),继续购买该险种的投保人称为续保人,续保人的本年度的保费与其上年度的出险次数的关联如下:上年度出险次数0 1 2 3 4 5保费0.85aa1.25a1.5a 1.75a 2a设该险种一续保人一年内出险次数与相应概率如下:一年内出险次数0 1 2 3 4 5 概率0.300.150.200.200.100.05(Ⅰ)求一续保人本年度的保费高于基本保费的概率;32.袋中有形状、大小都相同的4只球,其中1只白球,1只红球,2只黄球,从中一次随机分组(岁)频数频数[20,25) 5 0.050 [25,30) 200.200 [30,35) a0.350 [35,40) 30 b [40,45] 10 0.100 合计1001.000摸出2只球,则这2只球颜色不同的概率为____________ .33.现有6道题,其中4道甲类题,2道乙类题,某同学从中任取2道题解答.试求:(1)所取的2道题都是甲类题的概率;(2)所取的2道题不是同一类题的概率.A,两地区分别随机调查了20个用户,得到用34.某公司为了解用户对其产品的满意度,从B户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(Ⅰ)根据两组数据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);。
热点10 概率与统计【命题趋势】统计与概率是高考文科中的一个重要的一环高考对概率与统计内容的考查一般以实际应用题出现,这既是这类问题的特点,也符合高考发展的方向.概率应用题侧重于古典概率,近几年的高考有以概率应用题替代传统应用题的趋势,该题出现在解答题第二或第三题的位置,可见概率统计在高考中属于中档题.虽为中档题,但是实际生活背景在加强,阅读量大,所以快速阅读考题并准确理解题意是很重要的.对于这部分,我们还应当重视与传统内容的有机结合. 为了准确地把握2020年高考概率统计命题思想与趋势,在最后的复习中做到有的放矢,提高复习效率,纵观近五年的全国文科I卷,我们看到近几年每年一考,多出现在19题,分值12分;从难度上看:以中档题为主,重基础,考查的重点为统计图表的绘制与分析、数字特征的计算与分析、概率计算、线性回归分析,独立性检验等知识点,一般都会以实际问题为载体,代替传统建模题目.本专题我们把这些热点问题逐一说明,并提出备考指南,希望同学们在复习时抓住重点、事半功倍.【热点预测以及解题技巧】热点一:“统计”背景下的“概率”问题这类问题一般将统计与概率相结合.以频率分布直方图或茎叶图为背景来考查概率知识,有时以表格为背景来考查概率知识,需要从统计图、表格获取信息、处理数据的能力,并根据得出的数据求概率.热点二:样本分析并通过样本分析作决策进行样本分析时从统计图表中获取数据,得出频率、平均数、方差,用样本频率估计概率、样本数字特征估计总体数字特征,有时需以此作出决策.热点三:线性回归分析根据最小二乘法得出回归直线方程,有时需适当换元转化为线性回归方程. 由于计算量很大,题目一般会给出的参考数据,但是注意数据设置的“障眼法”,这时就要认真领会题意,找出适用的参考数据加以计算.热点四:独立性检验寻找数据完成列联表,下面的解题步骤比较固定,按部就班完成即可.热点五:与函数相结合的概率统计题这类题也是近几年出现较多的一类题,其综合性强,理解题意后找准变量,构建函数关系式.【考查题型】选择,填空,解答题【限时检测】(建议用时:45分钟)1.(2018·黑龙江哈尔滨三中高考模拟(文))从甲、乙两种树苗中各抽测了10株树苗的高度,其茎叶图如图所示.根据茎叶图,下列描述正确的是( )A.甲种树苗的高度的中位数大于乙种树苗高度的中位数,且甲种树苗比乙种树苗长得整齐B.甲种树苗的高度的中位数大于乙种树苗高度的中位数,但乙种树苗比甲种树苗长得整齐C.乙种树苗的高度的中位数大于甲种树苗高度的中位数,且乙种树苗比甲种树苗长得整齐D.乙种树苗的高度的中位数大于甲种树苗高度的中位数,但甲种树苗比乙种树苗长得整齐【答案】D【解析】从茎叶图的数据可以看出甲种树苗的平均高度为27,乙种树苗的平均高度为30,因此乙种树苗的平均高度大于甲种树苗的平均高度.又从茎叶图分析知道,甲种树苗的高度集中在20到30之间,因此长势更集中.2.(2019·辽宁高考模拟(文))《九章算术》中有如下问题:“今有勾五步,股一十二步,问勾中容圆,径几何?”其大意:“已知直角三角形两直角边长分别为5步和12步,问其内切圆的直径为多少步?”现若向此三角形内随机投一粒豆子,则豆子落在其内切圆外的概率是( )A .215π B .320π C .2115π-D .3120π-【答案】C 【解析】 【分析】本题首先可以根据直角三角形的三边长求出三角形的内切圆半径,然后分别计算出内切圆和三角形的面积,最后通过几何概型的概率计算公式即可得出答案. 【详解】13=, 设内切圆的半径为r ,则51213r r -+-=,解得2r =. 所以内切圆的面积为24r ππ=,所以豆子落在内切圆外部的概率42P 111155122ππ=-=-⨯⨯,故选C.【名师点睛】本题主要考查“面积型”的几何概型,属于中档题. 解决几何概型问题常见类型有:长度型、角度型、面积型、体积型,求与面积有关的几何概型问题关鍵是计算问题的总面积以及事件的面积;几何概型问题还有以下几点容易造成失分,在备考时要高度关注:(1)不能正确判断事件是古典概型还是几何概型导致错误;(2)基本事件对应的区域测度把握不准导致错误 ;(3)利用几何概型的概率公式时 , 忽视验证事件是否等可能性导致错误. 3.(2019·安徽合肥一中高考模拟(文))甲、乙两名同学在 6 次数学考试中,所得成绩 用茎叶图表示如下,若甲、乙两人这 6 次考试的平均成绩分别用,x x 乙甲 表示,则下列结论正确的是( )A .x x >乙甲 ,且甲成绩比乙成绩稳定B .x x >乙甲 ,且乙成绩比甲成绩稳定C .x x <乙甲 ,且甲成绩比乙成绩稳定D .x x <乙甲,且乙成绩比甲成绩稳定【答案】C 【解析】 【分析】从茎叶图提取两个人的成绩,分别求出两个人的平均分,得到甲的平均数比乙的平均数要低,但甲数据比较集中,所以成绩比较稳定. 【详解】757782838590826x +++++==甲,727681869192836x +++++==乙,所以x x <乙甲,因为甲数据比较集中,所以成绩比较稳定. 【名师点睛】茎叶图保留了原始数据,所以可通过计算平均数来比较大小,再通过数据的集中与离散程度判断稳定性.4.(2018·天津南开中学高考模拟(文))在长为12cm 的线段AB 上任取一点C .现作一矩形,邻边长分别等于线段AC ,CB 的长,则该矩形面积大于20cm 2的概率为 A .16B .13C .23D .45【答案】C 【解析】试题分析:设AC=x ,则BC=12-x (0<x <12) 矩形的面积S=x (12-x )>20 ∴x 2-12x+20<0 ∴2<x <10由几何概率的求解公式可得,矩形面积大于20cm 2的概率10221203p -==-考点:几何概型5.(2019·新疆高考模拟(文))《史记》中讲述了田忌与齐王赛马的故事.“田忌的上等马优于齐王的中等马,劣于齐王的上等马;田忌的中等马优于齐王的下等马,劣于齐王的中等马;田忌的下等马劣于齐王的下等马.”双方从各自的马匹中随机选一匹进行一场比赛,则田忌的马获胜的概率为A .31 B .41 C .51 D .61 【答案】A 【解析】分析:由题意结合古典概型计算公式即可求得最终结果.详解:记田忌的上等马、中等马、下等马分别为a ,b ,c ,齐王的上等马、中等马、下等马分别为A ,B ,C ,由题意可知,可能的比赛为:Aa ,Ab ,Ac ,Ba ,Bb ,Bc ,Ca ,Cb ,Cc ,共有9种,其中田忌可以获胜的事件为:Ba ,Ca ,Cb ,共有3种,则田忌马获胜的概率为p =39=13.本题选择A 选项.【名师点睛】:有关古典概型的概率问题,关键是正确求出基本事件总数和所求事件包含的基本事件数.(1)基本事件总数较少时,用列举法把所有基本事件一一列出时,要做到不重复、不遗漏,可借助“树状图”列举.(2)注意区分排列与组合,以及计数原理的正确使用.6.(2017·天津耀华中学高考模拟(文))某工厂甲,乙,丙三个车间生产了同一种产品,数量分别为600件,400件,300件,用分层抽样方法抽取容量为n 的样本,若从丙车间抽取6件,则n 的值为( ) A .18 B .20C .24D .26【答案】D 【解析】由分层抽样的定义可得:6300600400300n =++,解得:26n =. 本题选择D 选项.7.(2017·辽宁高考模拟(文))设样本数据1210,,,x x x L 的均值和方差分别为1和4,若(i i y x a a =+为非零常数,1,2,,10)i =L ,则1210,,,y y y L 的均值和方差分别为( )A .1,4a +B .1,4a a ++C .1,4D .1,4a +【答案】A 【解析】试题分析:因为样本数据1210,,,x x x L 的平均数是1,所以1210,,...y y y 的平均数是121012101210 (1101010)y y y x a x a x a x x x a a ++++++++++++==+=+;根据i i y x a =+(a 为非零常数,1,2,,10i =L ),以及数据1210,,,x x x L 的方差为4可知数据1210,,,y y y L 的方差为2144⨯=,综上故选A. 考点:样本数据的方差和平均数.8.(2017·陕西高考模拟(文))已知函数2()log ,[1,8]f x x x =∈,则不等式1()2f x ≤≤ 成立的概率是( ) A .17B .27C .37D .47【答案】B 【解析】由()12f x ≤≤,可知21log 2x ≤≤,解得24x ≤≤,由几何概型可知27P =,选B 二、填空题9.(2017·河南高考模拟(文))已知()0,0O ,()2,1A ,()1,2B -,31,55C ⎛⎫- ⎪⎝⎭,动点(),P x y 满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r≤⋅≤,则点P 到点C 的距离大于14的概率为______.【答案】5164π- 【解析】由题意得,因为()()()310,0,2,1,1,2,,55O A B C ⎛⎫-- ⎪⎝⎭,所以动点(,)P x y 满足02OP OA ≤⋅≤u u u r u u u r 且02OP OB u u u r u u u r≤⋅≤,所以022{022x y x y ≤+≤≤-≤ ,则点P 到点C 的距离为22311()()5516z x y =-++≥ ,作出不等式组对应的平面区域,如图所示, 因为点P 到点C 的距离大于14,所以14PC >,则对应的部分为阴影部分,由2042,2055x y x y x y -==⎧⇒=+=⎨⎩ ,即点42(,)55E,则OE ==,所以正方形OEFG 的面积为45, 则阴影部分的面积为41516π- ,所以根据几何概型的概率公式可知所求的概率为41551614645ππ-=-.【名师点睛】:本题主要考查了几何概型及其概率的计算问题,其中解答中涉及到向量的数量积的运算,二元一次不等式组所表示的平面区域,简单的线性规划的应用,几何概型及其概率的计算公式等知识点的综合应用,着重考查了学生分析问题和解答问题的能力,以及推理与运算能力,本题的解答中利用向量的数量积的运算,转化为简单的线性规划求解是解答的关键.9.(2018·河南高考模拟(文))某班共有56名学生,现将所有学生随机编号,用系统抽样的方法抽取一个容量为4的样本,已知12号、26号、54号同学在样本中,则样本中还 有一名同学的编号是__________. 【答案】40【解析】【分析】先求出组距,然后根据已知的第二个样本的编号,求得第三个样本的编号.【详解】从56名学生中抽取4名,组距为56414÷=,由于抽取到第二个编号为26号,故第三个样本的编号为261440+=号.【名师点睛】本小题主要考查系统抽样的知识,先求得系统抽样的组距,然后根据已知来求得未知的样本编号,属于基础题.11.(2019·浠水县实验高级中学高三月考(文))设AB=6,在线段AB上任取两点(端点A,B除外),将线段AB分成了三条线段,若分成的三条线段长度均为正整数,则这三条线段可以构成三角形的概率是____________;若分成的三条线段的长度均为正实数,则这三条线段可以构成三角形的概率是_________.【答案】11014【解析】【分析】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;2,2,2共3种情况,其中只有三条线段为2,2,2时能构成三角形,由古典概型的概念,得到概率.三条线段的长度均为正实数时,则是几何概型,设出变量,写出全部结果所构成的区域,和满足条件的事件对应的区域,注意整理三条线段能组成三角形的条件,求出面积,作比值得到概率.【详解】若分成的三条线段的长度均为正整数,则三条线段的长度的所有可能为:1,1,4;1,2,3;1,3,2;1,4,1;2,1,3;2,2,2;2,3,1;3,1,2;3,2,1;4,1,1共10种情况,其中只有三条线段为2,2,2时能构成三角形则构成三角形的概率p1 10 =.(2)由题意知本题是一个几何概型设其中两条线段长度分别为x,y,则第三条线段长度为6﹣x﹣y,则全部结果所构成的区域为:0<x<6,0<y<6,0<6﹣x﹣y<6,即为0<x<6,0<y<6,0<x+y<6所表示的平面区域为三角形OAB;若三条线段x,y,6﹣x﹣y,能构成三角形,则还要满足666x y x yx x y yy x y x+--⎧⎪+--⎨⎪+--⎩>>>,即为333x yyx+⎧⎪⎨⎪⎩><<,所表示的平面区域为三角形DEF,由几何概型知所求的概率为:P14DEFAOBSS==VV【名师点睛】本题考查古典概型,考查几何概型,对于几何概型的问题,一般要通过把试验发生包含的事件同集合结合起来,根据集合对应的图形做出面积,用面积的比值得到结果. 三、解答题12.(2019·天津高考模拟(文))为预防H 1N 1病毒爆发,某生物技术公司研制出一种新流感疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个流感样本分成三组,测试结果如下表:已知在全体样本中随机抽取1个,抽到B 组疫苗有效的概率是0.33. (∴)求x 的值;(∴)现用分层抽样的方法在全体样本中抽取360个测试结果,问应在C 组抽取多少个? (∴)已知y ≥465,z ≥30,求不能通过测试的概率.【答案】(1)660;(2)90;(3)112.【解析】 【分析】(1)由古典概型概率公式列方程求解即可;(2)先求出C 组样本个数,再根据分层抽样方法可得结果;(3)利用列举法可得基本事件空间包含的基本事件有11个,测试不能通过事件包含基本事件2个,利用古典概型概率公式可得结果. 【详解】(1)∵在全体样本中随机抽取1个,抽到B 组疫苗有效的概率约为其频率 即x 2000=0.33, ∴ x =660;(2)C 组样本个数为y +z =2000-(673+77+660+90)=500,现用分层抽样的方法在全体样本中抽取360个测试结果,应在C 组抽取个数为3602000×500=90;(3)设测试不能通过事件为A,C 组疫苗有效与无效的可能的情况记为(y,z )由(2)知500=y+z ,且y,z ∈N ,基本事件空间包含的基本事件有:(465,35)、(466,34)、(467,33)、……(475,25)共11个 若测试不能通过,则77+90+z>200,即z>33事件A 包含的基本事件有:(465,35)、(466,34)共2个 ∴ P(A)=211故不能通过测试的概率为211.【名师点睛】本题主要考查分层抽样以及古典概型概率公式的应用,属于难题,利用古典概型概率公式求概率时,找准基本事件个数是解题的关键,基本亊件的探求方法有 (1)枚举法:适合给定的基本事件个数较少且易一一列举出的;(2)树状图法:适合于较为复杂的问题中的基本亊件的探求.在找基本事件个数时,一定要按顺序逐个写出:先(A 1,B 1),(A 1,B 2)….(A1,B n),再(A2,B1),(A2,B2)…..(A2,B n)依次(A3,B1)(A3,B2)….(A3,B n)… 这样才能避免多写、漏写现象的发生.13.(2019·山东高考模拟(文))2019年2月13日《烟台市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X(单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数x和中位数a(a的值精确到0.01);(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i)你认为9个名额应该怎么分配?并说明理由;(ii)座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:【答案】(1)平均数9,中位数8.99;(2)(i )按照1:2进行名额分配;理由见详解; (ii )有. 【解析】 【分析】(1)根据平均数,中位数的定义进行求解即可(2)完成列联表,计算2K 的观测值,结合独立性检验的性质进行判断即可. 【详解】(1)该组数据的平均数60.0370.180.290.35100.19x =⨯+⨯+⨯+⨯+⨯110.09120.049+⨯+⨯=,因为0.030.10.20.350.680.5+++=>,所以中位数[8.5,9.5)a ∈,由0.030.10.2(8.5)0.350.5a +++-⨯=,解得0.50.338.58.990.35a -=+≈;(2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配.(ii)由频率分布直方图可知,阅读时间不足8.5小时的学生共有200(0.030.10.2)66⨯++=人,超过8.5小时的共有20066134-=人.于是列联表为:2K的观测值2200(40742660)4.432 3.84166134100100k⨯⨯-⨯=≈>⨯⨯⨯,所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【名师点睛】本题主要考查独立性检验的应用,根据数据计算出K2的观测值是解决本题的关键.考查学生的计算能力.14.(2019·江西高考模拟(文))某品牌餐饮公司准备在10个规模相当的地区开设加盟店,为合理安排各地区加盟店的个数,先在其中5个地区试点,得到试点地区加盟店个数分别为1,2,3,4,5时,单店日平均营业额y(万元)的数据如下:(1)求单店日平均营业额y(万元)与所在地区加盟店个数x(个)的线性回归方程;(2)根据试点调研结果,为保证规模和效益,在其他5个地区,该公司要求同一地区所有加盟店的日平均营业额预计值总和不低于35万元,求一个地区开设加盟店个数m 的所有可能取值;(3)小赵与小王都准备加入该公司的加盟店,根据公司规定,他们只能分别从其他五个地区(加盟店都不少于2个)中随机选一个地区加入,求他们选取的地区相同的概率.(参考数据及公式:51125i ii x y==∑,52155i i x ==∑,线性回归方程ˆybx a =+,其中1221ni ii nii x y nxyb xnx ==-=-∑∑,a y bx =-.)【答案】(1) ˆ12yx =-+ (2) 5,6,7 (3) 15P = 【解析】 【分析】(1)利用最小二乘法求线性回归方程;(2)解不等式()1235m m -≥得一个地区开设加盟店个数m 的所有可能取值;(3)利用古典概型的概率求选取的地区相同的概率. 【详解】(1)由题可得,3x =,9y =,设所求线性回归方程为ˆybx a =+, 则5152215125135155455i i i ii x y xy b x x ==--===---∑∑,将3x =,9y =代入,得()9312a =--=,故所求线性回归方程为ˆ12yx =-+. (2)根据题意,()1235m m -≥,解得:57m ≤≤,又m Z +∈,所以m 的所有可能取值为5,6,7.(3)设其他5个地区分别为,,,,A B C D E ,他们选择结果共有25种,具体如下:AA ,AB ,AC ,AD ,AE ,BA ,BB ,BC ,BD ,BE ,CA ,CB ,CC ,CD ,CE ,DA ,DB ,DC ,DD ,DE ,EA ,EB ,EC ,ED ,EE ,其中他们在同一个地区的有5种,所以他们选取的地区相同的概率51255P ==. 【名师点睛】本题主要考查线性回归方程的求法,考查古典概型的概率的计算,意在考查学生对这些知识的理解掌握水平和分析推理能力.15.(2018·天津南开中学高考模拟(文))某校从高一年级学生中随机抽取40名学生,将 他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,后得到如图的频率分布直方图.(1)求图中实数a 的值;(2)若该校高一年级共有学生640人,试估计该校高一年级 期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生,求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03a =. (2)544人. (3)()715P M =. 【解析】试题分析:(1)由于图中所有小矩形的面积之和等于1, 所以10(0.0050.010.02⨯++0.0250.01)1a +++=. ……2分解得0.03a =. ……3分(2)根据频率分布直方图,成绩不低于60分的频率 为110(0.0050.01)-⨯+0.85=. ……5分由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学成绩不低于60分的人数约为6400.85544⨯=人. ……6分 (3)成绩在[)40,50分数段内的人数为400.052⨯=人,分别记为A ,B . ……7分成绩在[]90,100分数段内的人数为400.14⨯=人,分别记为C ,D ,E ,F . ……8分若从数学成绩在[)40,50与[]90,100两个分数段内的学生中随机选取两名学生, 则所有的基本事件有:(),A B ,(),A C ,(),A D ,(),A E ,(),A F ,(),B C ,(),B D ,(),B E ,(),B F ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F , (),E F 共15种. ……10分如果两名学生的数学成绩都在[)40,50分数段内或都在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[)40,50分数段内,另一个成绩在[]90,100分数段内,那么这两名学生的数学成绩之差的绝对值一定大于10. 记“这两名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有:(),A B ,(),C D ,(),C E ,(),C F ,(),D E ,(),D F ,(),E F 共7种. ……11分所以所求概率为()715P M =. ……12分 考点:本小题主要考查频率分布直方图的应用和古典概型概率的求解,考查学生识图、用图的能力和运算求解能力.【名师点睛】:解决与频率分布直方图有关的题目时,要注意到频率分布直方图中纵轴表示的是频率/组距,不是频率,图中小矩形的面积才表示频率.16.(2019·江西高考模拟(文))某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:万元)对年销售量y (单位:吨)和年利润z (单位:万元)的影响.对近六年的年宣传费i x 和年销售量i y (1,2,3,4,5,6i =)的数据作了初步统计,得到如下数据:经电脑模拟,发现年宣传费x (万元)与年销售量y (吨)之间近似满足关系式b y a x =⋅(,0a b >).对上述数据作了初步处理,得到相关的值如表:(1)根据所给数据,求y 关于x 的回归方程; (2)已知这种产品的年利润z 与x ,y 的关系为e14zx =-若想在2019年达到年利润最大,请预测2019年的宣传费用是多少万元?附:对于一组数据()1,l u v ,()22,u v ,…,(),n n u v ,其回归直线v u a β=⋅+中的斜率和截距的最小二乘估计分别为()1221()()ni i i nii u v n uv un u β==-=-∑∑,v u αβ=-⋅【答案】(1)y e =(2)当2018年的宣传费用为98万元时,年利润有最大值. 【解析】 【分析】(1)转化方程by a x =⋅,结合线性回归方程参数计算公式,计算,即可.(2)将z 函数转化为二次函数,计算最值,即可. 【详解】(1)对by a x =⋅,(0a >,0b >),两边取对数得ln ln ln y a b x =+,令ln i i u x =,ln i i v y =,得ln v a b u =+⋅,由题目中的数据,计算24.6 4.16u ==,18.33.056v ==, 且()()6611ln ln i iiii i u v x y ====∑∑ 75.3,()6622111n 101.4ii i i u x ====∑∑; 则()6162216ˆ6i i i i i u v u v b u u ==-⋅=-⋅∑∑ 275.36 4.1 3.05101.46 4.1-⨯⨯=-⨯ 0.2710.542==, 1ln ln 3.05 4.112a v u =-=-⨯=, 得出ˆae =, 所以y 关于x的回归方程是ˆye = (2)由题意知这种产品的年利润z 的预测值为14ˆe z x e =-=1414e e x -=-(14e x -=-27e +,=98x =时,ˆz 取得最大值,即当2019年的年宣传费用是98万元时,年利润有最大值.【名师点睛】考查了线性回归方程求解,考查了二次函数计算最值问题,关键结合题意,得到回归方程,第二问关键转化为二次函数问题,难度中等.。
概率统计统计是研究如何合理收集、整理、分析数据的学科,为人们制定决策提供依据.概率是研究随机现象规律的学科,为人们认识客观世界提供重要的思维模式和解决问题的方法. 统计一章介绍随机抽样、样本估计总体、线性回归的基本方法,通过对典型案例的讨论,了解和使用一些常用的统计方法,进一步体会运用统计方法解决实际问题的基本思想,认识统计方法在决策中的作用.概率一章介绍随机现象与概率的意义、古典概型及几何概型等内容,并能用所学知识解决一些简单的实际问题,进一步体会概率模型的作用及运用概率思考问题的特点,初步形成用随机观念观察、分析问题的意识.§10-1 概率(一)【知识要点】1.事件与基本事件空间:随机事件:当我们在同样的条件下重复进行试验时,有的结果始终不会发生,它称为不可能事件;有的结果在每次试验中一定会发生,它称为必然事件;在试验中可能发生也可能不发生的结果称为随机事件,随机事件简称为事件.基本事件与基本事件空间:在一次试验中我们常常要关心的是所有可能发生的基本结果,它们是试验中不能再分的最简单的随机事件,其他事件可以用它们来描述,这样的事件称为基本事件.所有基本事件构成的集合叫做基本事件空间,常用 表示.2.频率与概率频率:在相同的条件S 下,重复n 次试验,观察某个事件A 是否出现,称n 次试验中事件A 的出现次数m 为事件A 出现的频数,称事件A 出现的比例nm 为事件A 出现的频率. 概率:一般的,在n 次重复进行的试验中,事件A 发生的频率nm ,当n 很大时总是在某个常数附近摆动,随着n 的增加,摆动幅度越来越小,这时就把这个常数叫做事件A 的概率,记做P (A ).显然有0≤P (A )≤1.不可能事件的概率为0,必然事件的概率为1,随机事件的概率在(0,1)之间.3.互斥事件的概率加法公式事件的并:由事件A 或B 至少有一个发生构成的事件C 称为事件A 与B 的并,记做C =A ∪B .互斥事件:不可能同时发生的两个事件称为互斥事件.互斥事件加法公式:如果事件A 、B 互斥,则事件A ∪B 发生的概率等于这两个事件分别发生的概率和,即P (A ∪B )=P (A )+P (B ).如果A 1,A 2,…,A n 两两互斥,那么事件A 1∪A 2∪…∪A n 发生的概率,等于这n 个事件分别发生的概率和,即P (A 1∪A 2∪…∪A n )=P (A 1)+P (A 2)+…+P (A n ).对立事件:不能同时发生且必有一个发生的两个事件叫做互为对立事件.事件A 的对立事件记作A ,满足P (A )=1-P (A ).概率的一般加法公式(选学):事件A 和B 同时发生构成的事件D ,称为事件A 与B 的交(积),记作D =A ∩B .在古典概型中,P (A ∪B )=P (A )+P (B )-P (A ∩B ).4.古典概型古典概型:一次试验有下面两个特征:(1)有限性,在一次试验中可能出现的结果只有有限个,即只有有限个不同的基本事件;(2)等可能性,每个基本事件发生的可能性是均等的,则称这个试验为古典概型.古典概型的性质:对于古典概型,如果试验的n 个基本事件为A 1,A 2,…,A n ,则有P (A 1∪A 2∪…∪A n )=1且⋅=nA P i 1)( 概率的古典定义:在古典概型中,如果试验的基本事件总数为n (Ω ),随机事件A 包含的基本事件数为n (A),则p (A)=试验的基本事件总数包含的基本事件数事件A ,即⋅=)()()(Ωn A n A P 5.几何概型几何概型:一次试验具有这样的特征:事件A 理解为区域Ω的一个子区域A ,A 的概率只与子区域A 的几何度量(长度、面积或体积)成正比,而与A 的位置和形状无关,这样的试验称为几何概型.几何概型的特点:(1)无限性:一次试验中可能出现的结果有无穷多个;(2)等可能性,每个基本事件发生的可能性相等.几何概型中事件A 的概率定义:ΩA A P μμ=)(,其中μ Ω 表示区域Ω 的几何度量,μ A 表示子区域A 的几何度量.随机数:就是在一定范围内随机产生的数,并且得到这个范围内的每一个数的机会均等.计算机随机模拟法(蒙特卡罗方法)是利用模型来研究某种现象的性质的一种有效方法,可以节约大量的人力物力.【复习要求】1.了解随机事件发生的不确定性和频率的稳定性,了解概率的意义,了解频率与概率的区别.2.了解两个互斥事件的概率加法公式.3.理解古典概型及其概率计算公式,会计算一些随机事件所含的基本事件数及事件发生的概率.4.了解随机数的意义,了解几何概型的意义.【例题分析】例1 国家射击队的某队员射击一次,命中7-10环的概率如下表:求该队员射击一次,(1)射中9环或10环的概率;(2)至少命中8环的概率;(3)命中不足8环的概率.【分析】射击运动员一次射击只能命中1个环数,命中不同的环数是互斥事件,射中9环或10环的概率等于射中9环与射中10环的概率和.命中不足8环所包含的事件较多,而其对立事件为“至少命中8环”,可先求其对立事件的概率,再通过P (A )=1-P (A )求解.解:设事件“射击一次,命中k 环”为事件A k (k ∈N ,k ≤10),则事件A k 彼此互斥.(1)记“射击一次,射中9环或10环”为事件A ,则P (A )=P (A 10)+P (A 9)=0.60.(2)记“射击一次,至少命中8环”为事件B ,则P (B )=P (A 10)+P (A 9)+P (A 8)=0.78.(3)“射击一次,命中不足8环”为事件B 的对立事件,则P (B )=1-P (B )=0.22.【评析】解决概率问题时,要先分清所求事件由哪些事件组成,分析是否是互斥事件,再决定用哪个公式.当用互斥事件的概率加法公式解题时,要学会不重不漏的将事件拆为几个互斥事件,要善于用对立事件解题.例2 现有8名奥运会志愿者,其中志愿者A 1,A 2,A 3通晓日语,B 1,B 2,B 3通晓俄语,C 1,C 2通晓韩语.从中选出通晓日语、俄语和韩语的志愿者各1名,组成一个小组.(Ⅰ)求A 1被选中的概率;(Ⅱ)求B 1和C 1不全被选中的概率.【分析】本题是一个古典概型的问题,可以直接用概率公式)()()(Ωn A n A P =求解. 解:(Ⅰ)从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果组成的基本事件空间Ω={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2),(A 2,B 1,C 1),(A 2,B 1,C 2),(A 2,B 2,C 1),(A 2,B 2,C 2),(A 2,B 3,C 1),(A 2,B 3,C 2),(A 3,B 1,C 1),(A 3,B 1,C 2),(A 3,B 2,C 1),(A 3,B 2,C 2),(A 3,B 3,C 1),(A 3,B 3,C 2)}由18个基本事件组成.由于每一个基本事件被抽取的机会均等,因此这些基本事件的发生是等可能的.用M 表示“A 1恰被选中”这一事件,则M ={(A 1,B 1,C 1),(A 1,B 1,C 2),(A 1,B 2,C 1),(A 1,B 2,C 2),(A 1,B 3,C 1),(A 1,B 3,C 2)}事件M 由6个基本事件组成,因而⋅==31186)(M P (Ⅱ)用N 表示“B 1,C 1不全被选中”这一事件,则其对立事件N 表示“B 1,C 1全被选中”这一事件, 由于N ={(A 1,B 1,C 1),(A 2,B 1,C 1),(A 3,B 1,C 1)},事件N 由3个基本事件组成, 所以61183)(==N P ,由对立事件的概率公式得⋅=-=-=65611)(1)(N P N P 【评析】古典概型解决概率问题时,选定基本事件空间并计算其所含基本事件的个数是重要的一步.本题中选定“从8人中选出日语、俄语和韩语志愿者各1名,其一切可能的结果”为基本事件空间,计算时采用列举法,也可以利用乘法计数原理计算3×3×2=18.本题第一问还可以选定“从通晓日语的3人中选出1人的可能结果”为基本事件空间,共有3个基本事件,选出A 1只有一种可能,故所求概率为⋅31例3 (1)两根相距6米的木杆上系一根绳子,并在绳子上挂一盏灯,则灯与两端距离都大于2米的概率是______.(2)甲乙两人约定在6点到7点之间在某处会面,并约好先到者等候另一人一刻钟,过时即可离去.则两人能会面的概率是______.(3)正方体内有一个内切球,则在正方体内任取一点,这个点在球内的概率为______.【分析】这三个题都可转化为几何概率问题求解.分别转化为线段长度、图形面积、几何体体积问题求解.解:(1)本题可转化为:“在长为6m 的线段上随机取点,恰好落在2m 到4m 间的概率为多少?” 易求得⋅=31P (2)本题可转化为面积问题:即“阴影部分面积占总面积的多少?”, 解得⋅=167)(A P (3)本题可转化为体积问题:即“内切球的体积与正方体体积之比是多少?”.解得⋅=6πP 【评析】几何概型也是一种概率模型,它具有等可能性和无限性两个特点.解题的关键是要建立模型,将实际问题转化为几何概率问题.基本步骤是:把基本事件空间转化为与之对应的区域Ω;把随机事件A 转化为与之对应的区域A ;利用概率公式)()()(ΩA A P μμ=计算.常用的几何度量包括:长度、面积、体积.例4 设有关于x 的一元二次方程x 2+2ax +b 2=0.(Ⅰ)若a 是从0,1,2,3四个数中任取的一个数,b 是从0,1,2三个数中任取的一个数,求上述方程有实根的概率;(Ⅱ)若a 是从区间[0,3]任取的一个数,b 是从区间[0,2]任取的一个数,求上述方程有实根的概率.【分析】本题第一问是古典概型问题,第二问由于a 、b 在实数区间选取,可以转化为几何概型问题求解.解:设事件A 为“方程x 2+2ax +b 2=0有实根”.当a ≥0,b ≥0时,方程x 2+2ax +b 2=0有实根的充要条件为a ≥b .(Ⅰ)基本事件共12个:(0,0),(0,1),(0,2),(1,0),(1,1),(1,2),(2,0),(2,1),(2,2),(3,0),(3,1),(3,2).其中第一个数表示a 的取值,第二个数表示b 的取值.事件A 中包含9个基本事件,事件A 发生的概率为⋅==43129)(A P (Ⅱ)试验的全部结果所构成的区域为{(a ,b )|0≤a ≤3,0≤b ≤2}.构成事件A 的区域为{(a ,b )|0≤a ≤3,0≤b ≤2,a ≥b }. 所以所求的概率为⋅=⨯⨯-⨯=3223221232 【评析】几何概型与古典概型的每个基本事件发生的可能性是均等的,只是几何概型的基本事件有无限个,而古典概型的基本事件有有限个.在具体问题中,不能因为古典概型的基本事件的个数多而误认为是几何概型.练习10-1一、选择题1.下列随机事件的频率和概率的关系中哪个是正确的( )A .频率就是概率B .频率是客观存在的,与试验次数无关C .随着试验次数增加,频率一般会越来越接近概率D .概率是随机的,在试验前不能确定2.从装有2个黑球2个白球的口袋中任取2个球,那么互斥而不对立的两个事件是( )A .至少有一个白球,都是白球B .至少有一个白球,至少有一个红球C .恰有一个白球,恰有两个白球D .至少有一个白球,都是红球3.考察正方体6个面的中心,甲从这6个点中任意选两个点连成直线,乙也从这6个点中任意选两个点连成直线,则所得的两条直线相互平行但不重合的概率等于( )A .751B .752C .753D .754 二、填空题4.甲、乙二人掷同一枚骰子各一次.如果谁掷的点数大谁就取胜,则甲取胜的概率为______.5.在平面直角坐标系xoy 中,设D 是横坐标与纵坐标的绝对值均不大于2的点构成的区域,E 是到原点的距离不大于1的点构成的区域,向D 中随机投一点,则落入E 中概率为______.三、解答题6.已知集合A ={-4.-2,0,1,3,5},在平面直角坐标系中点M (x ,y )的坐标满足x ∈A ,y ∈A .计算:(1)点M 恰在第二象限的概率;(2)点M 不在x 轴上的概率;(3)点M 恰好落在区域⎪⎩⎪⎨⎧>>>-+0008y x y x 上的概率.§10-2 统 计【知识要点】1.随机抽样总体、个体、样本:把所考察对象的某一个数值指标的全体构成的集合看成总体,构成总体的每一个元素称为个体,从总体中抽出若干个体所组成的集合叫做样本.随机抽样:抽样时,保证每一个个体都可能被抽到,且每个个体被抽到的机会均等,满足这样条件的抽样为随机抽样.简单随机抽样:从元素个数为N 的总体中,不放回的抽取容量为n 的样本,如果每一次抽样时,总体中的各个个体有相同的可能性被抽到,这种抽样方法叫简单随机抽样.系统抽样:当总体个数很大时,可将总体分成均匀的若干部分,然后按照预先制定的规则从每一部分抽取一个个体得到所需要的样本,这种抽样的方式叫做系统抽样.分层抽样:当总体由有明显差异的几部分组成时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样.三种抽样方法的比较常用频率分布表、频率分布直方图、频率分布折线图、茎叶图等统计图表来表示样本数据,观察样本数据的特征,从而估计总体的分布情况.频率分布(表)直方图的画法步骤:(1)计算极差(用样本数据的最大值减去最小值)(2)决定组数与组距(组数×组距=极差)(3)决定分点(4)列频率分布表(5)绘制频率分布直方图易见直方图中各个小长方形面积等于相应各组的频率,所有小长方形面积之和等于1. 频率分布折线图:连结频率分布直方图各个长方形上边的中点,就得到频率分布折线图. 总体密度曲线:随着样本容量的增加,分组的组距不断缩小,相应的频率分布折线图就会越来越接近于一条光滑曲线,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.茎叶图:茎指中间的一列数,叶是从茎的旁边生长出来的数.在样本数据较少时,茎叶图表示数据的效果较好.它的突出优点是:统计图中没有原始数据的损失,所有的数据信息都可以从茎叶图中得到;茎叶图可随时记录,方便表示.3.用样本的数字特征估计总体的数字特征样本数据的平均数:如果有n 个数x 1,x 2,…,x n ,那么nx x x x n +++=Λ21叫做这n 个数的平均数.标准差:样本数据到平均数的一种平均距离,一般用s 表示,其中nx x x x x x s n 22221)()()(-++-+-=Λ.方差:标准差的平方s 2叫做方差.⋅-++-+-=n x x xx x x s Zn )()()(22212¬Λ 4.两个变量间的关系散点图:两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫做散点图.线性相关:若两个变量的散点图中所有点看上去都在一条直线附近波动,则这两个变量可近似看成具有线性相关关系.回归直线方程:从散点图上看,如果这些点从整体上看大致分布在通过散点图中心一条直线附近,则这条直线叫做这些数据点的回归直线方程,记作yˆ=bx +a ,其中b 叫回归系数.最小二乘法:假设我们已经得到两个具有线性相关关系的变量的一组数组),(11y x ,),(22y x ,…,),(33y x ,求得,)()()(ˆ2211211x n x y x n y x x x y y x x b in i i i n i ini i in i --=---=∑∑∑∑====⋅⋅⋅ x b y a ˆˆ-=,这时离差211)(2i i bx a y n Q --==最小,所求回归直线方程是a x b y ˆˆˆ+=.这种求回归直线的方法称为最小二乘法.【复习要求】1.会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,理解它们各自的特点.3.理解样本数据标准差的意义和作用,会计算样本数据平均数、标准差,并给出合理解释.4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想.5.会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系.了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程.【例题分析】例1 某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是______,若用分层抽样方法,则40岁以下年龄段应抽取______人.【分析】由已知系统抽样的组距为5,所以相邻组间的号码相差5;由饼形图可知200名职工中,50岁以上人数:40-50岁人数:40岁以下人数=2∶3∶5,总样本为40人,分层抽样抽取每层人数比例为2∶3∶5.解:37;20【评析】系统抽样的特征是等距,也就是只要在一组内选定号码,其余各组的号码随之选定,所选相邻号码的间隔为组距.分层抽样的特征是按比例抽取,也就是每一层所选人数占总选出人数的比例与每层人数占总人数的比例相等.抽样是统计分析的重要部分,最常用的抽样方法是简单随机抽样、系统抽样和分层抽样,抽样时每个个体被抽到的可能性相等.简单随机抽样常用抽签法和随机数表法.例2 对某电子元件进行寿命追踪调查,情况如下:寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600)个数(个) 20 30 80 40 30(2)画出频率分布直方图;(3)估计电子元件寿命在[100,400)以内的概率;(4)估计电子元件寿命在400h以上的概率.【分析】按要求列表、绘图,并用样本的分布估计总体的分布.解:(1)频率分布表(2)(画图);(3)P=0.10+0.15+0.40=0.65;(4)P=1-0.65=0.35.寿命(h) 频数频率[100,200) 20 0.10[200,300) 30 0.15[300,400) 80 0.40[400,500) 40 0.20[500,600) 30 0.15合计200 1.00【评析】频率分布表和频率分布直方图是用统计的方法对样本数据加以概括和总结.列频数分布表时,要区分频数和频率的意义,画频率分布直方图时要注意横、纵坐标代表的意义和单位.频率分布指的是一个样本数据在各拿小范围内所占比例的大小,常用样本数据落在某个范围的频率估计总体落在这个范围的概率.频率分布直方图中众数是最高矩形中点的横坐标,中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.例3 (海南)从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307 308 310 314 319 323 325 325 328 331 334 337 352 乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318 320 322 322 324 327 329 331 333 336 337 343 356 由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①___________________________________________________________________________________________________________________________________________________;②___________________________________________________________________________________________________________________________________________________.【分析】抽样数据比较分散,很难观察数据的分布特征,通过茎叶图展现了样本数据的分布.通过茎叶图可观察出平均数、众数、中位数,数据分布的对称性等等,由于茎叶图保留了原始数据,还可计算平均数、方差、标准差.解:(可任选两个作答)(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度;(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中);(3)甲品种棉花的纤维长度的中位数为307mm,乙品种棉花的纤维长度的中位数为318mm;(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近),甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀;【评析】茎叶图是统计图表的一种,它具有统计图表的一般功能:通过样本的数据分布推断总体的分布,通过样本的数字特征估计总体的数字特征.本题中的统计结论,是指用样本的特征估计总体特征得到的结论.例4图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A1、A2、…、A m(如A2表示身高(单位:cm)在[150,155)内的学生人数).图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是______.图1 图2【分析】条形图的横坐标是身高,纵坐标为每个身高区间内的人数.条形图没有提供具体的数据信息.程序框图的算法含义是统计[160,180)内学生人数,即求A 4+A 5+A 6+A 7的和.解:i <8或i ≤7.【评析】设计算法利用计算机完成数据的统计工作,是实际统计工作中经常应用的.除了可以完成计数工作外,还可排序、求最值,利用公式进行各种计算等等.将算法和统计一起考查是新课程的一个特色.例5 甲乙两位运动员在相同的条件下分别射击10次,记录各次命中环数如下: 甲:8,8,6,8,6,5,9,10,7,4乙:9,5,7,8,7,6,8,6,8,7(1)分别计算他们射击环数的平均数及标准差;(2)判断他们设计水平谁高,谁的射击情况更稳定?【分析】平均数、标准差分别反映了两个选手的射击水平和稳定程度,平均数越高说明选手射击水平越高,标准差越小说明选手发挥越稳定.解:(1)甲的平均数为7.1,标准差为1.758;乙的平均数为7.1,标准差为1.136;(2)从平均值上看,两人的水平相当;从标准差上看,乙的情况更稳定.【评析】平均数反映的是平均水平的高低,方差和标准差反映的是数据的离散程度.如果样本数据中每个数都增加数a ,则它的平均数也增加a ,但是它的标准差不变,因为数据的离散程度没有变化.由于方差与原始数据的单位不同,而且可能夸大了偏离程度,实际解决问题中常采用标准差.例6 假定关于某设备的使用年限x 和所支出费用y (万元),有如下的统计资料 使用年限x2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0(1)请画出上表数据的散点图;(2)根据上表数据,用最小二乘法求出线性回归方程a x by ˆˆ+=; (3)估计使用10年时,维修费用是多少?【分析】利用描点法画出散点图,用公式x by axn x yx n yx bi n i ii ni ˆˆ,ˆ2211=-=--=∑∑=⋅⋅求得回归直线方程,取x =10求得结果. 解:(1)散点图如图(2)y =0.08+1.23x (3)12.38【评析】判断两个变量有无相关关系时,散点图直观简便,这是一道应用问题,通过回归直线方程分析使用年限和维修费用的关系.例7 某工厂有工人1000名,其中250名工人参加过短期培训(称为A 类工人),另外750名工人参加过长期培训(称为B 类工人),现用分层抽样方法(按A 类、B 类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(Ⅰ)求甲、乙两工人都被抽到的概率,其中甲为A 类工人,乙为B 类工人; (Ⅱ)从A 类工人中的抽查结果和从B 类工人中的抽查结果分别如下表1和表2. 生产能力分组 [100,110) [110,120) [120,130) [130,140) [140,150)人数 48x 5 3表2生产能力分组[110,120)[120,130)[130,140)[140,150)人数6y3618(i )先确定x ,y ,再在答题纸上完成下列频率分布直方图.就生产能力而言,A 类工人中个体间的差异程度与B 类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图(ii )分别估计A 类工人和B 类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).【分析】(1)相互独立事件同时发生的概率用乘法公式(2)画出直方图,从图中分析数据信息.解:(Ⅰ)甲乙被抽到的概率都是101,而且事件“甲工人被抽到”与“乙工人被抽到”相互独立,所以甲、乙两工人都被抽到的概率⋅=⨯=1001101101pA 类工人中和B 类工人中分别抽查25名和75名.(Ⅱ)(i)由4+8+x +5+3=25,得x =5;6+y +36+18=75,得y =15.频率分布直方图如下图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.,123145253135255125255115258105254)ii (=⨯+⨯+⨯⋅+⨯+⨯=A x ,8.133145751813575361257515115756=⨯+⨯+⨯+⨯=B x1.1318.1331007512310025=⨯+⨯=x . A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.【评析】本题是一道综合应用题,通过语言叙述和图表给出信息.频率分布直方图反映了数据分布的情况,数据的差异大小及数据的方差大小.练习10-3一、选择题1.(08重庆)某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是( ) A .简单随机抽样法 B .抽签法 C .随机数表法 D .分层抽样法2.从容量为N 的总体中抽取容量为n 的样本,若采用系统抽样法,则抽样间隔为( ) A .nN B .n C .][nN D .1][+nN3.(08山东)下图是根据《山东统计年整2007》中的资料做成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( )A .304.6B .303.6C .302.6D .301.6 4.甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表甲的成绩乙的成绩丙的成绩环数 7 8 9 10 环数 7 8 9 10 环数 7 8 9 10 频数 55 5 5频数 6446频数 46641,2,3分别表示甲、乙、丙三名运动员这次测试成绩的标准差,则有( ) A .s 3>s 1>s 2 B .s 2>s 1>s 3 C .s 1>s 2>s 3 D .s 2>s 3>s 1二、填空题 5.要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,将它们编号为001,002,……800,利用随机数表抽取样本,从第7行第1个数开始,依次向右,再到下一行,继续从左到右.请问选出的第七袋牛奶的标号是______. (为了便于说明,下面摘取了随机数表的第6行至第10行).16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 76 63 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28。
2020年高考文科数学一轮复习大题篇----概率统计题型一 概率与统计的综合应用【例】某公司计划购买1台机器,该种机器使用三年后即被淘汰.机器有一易损零件,在购进机器时,可以额外购买这种零件作为备件,每个200元.在机器使用期间,如果备件不足再购买,则每个500元.现需决策在购买机器时应同时购买几个易损零件,为此搜集并整理了100台这种机器在三年使用期内更换的易损零件数,得下面柱状图.记x 表示1台机器在三年使用期内需更换的易损零件数,y 表示1台机器在购买易损零件上所需的费用(单位:元),n 表示购机的同时购买的易损零件数. (1)若n =19,求y 与x 的函数解析式;(2)若要求“需更换的易损零件数不大于n ”的频率不小于0.5,求n 的最小值;(3)假设这100台机器在购机的同时每台都购买19个易损零件,或每台都购买20个易损零件,分别计算这100台机器在购买易损零件上所需费用的平均数,以此作为决策依据,购买1台机器的同时应购买19个还是20个易损零件? 【解】 (1)当x ≤19时,y =3 800;当x >19时,y =3 800+500(x -19)=500x -5 700. 所以y 与x 的函数解析式为y =⎩⎪⎨⎪⎧3 800,x ≤19,500x -5 700,x >19(x ∈N ). (2)由柱状图知,需更换的零件数不大于18的频率为0.46,不大于19的频率为0.7,故n 的最小值为19.(3)若每台机器在购机同时都购买19个易损零件,则这100台机器中有70台在购买易损零件上的费用为3 800,20台的费用为4 300,10台的费用为4 800,因此这100台机器在购买易损零件上所需费用的平均数为1100(3 800×70+4 300×20+4 800×10)=4 000;若每台机器在购机同时都购买20个易损零件,则这100台机器中有90台在购买易损零件上的费用为4 000,10台的费用为4 500,因此这100台机器在购买易损零件上所需费用的平均数为1100(4 000×90+4 500×10)=4 050.比较两个平均数可知,购买1台机器的同时应购买19个易损零件.【思维升华】概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.【训练】某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:[40,50),[50,60),…,[90,100]后得到如图所示的频率分布直方图.(1)求图中实数a的值;(2)若该校高一年级共有640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,求这2名学生的数学成绩之差的绝对值不大于10的概率.【解】(1)由已知,得10×(0.005+0.010+0.020+a+0.025+0.010)=1,解得a=0.030. (2)根据频率分布直方图,可知成绩不低于60分的频率为1-10×(0.005+0.010)=0.85.由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级期中考试数学成绩不低于60分的人数为640×0.85=544.(3)易知成绩在[40,50)分数段内的人数为40×0.05=2,这2人分别记为A,B;成绩在[90,100]分数段内的人数为40×0.1=4,这4人分别记为C,D,E,F.若从数学成绩在[40,50)与[90,100]两个分数段内的学生中随机选取2名学生,则所有的基本事件有(A,B),(A,C),(A,D),(A,E),(A,F),(B,C),(B,D),(B,E),(B,F),(C,D),(C,E),(C,F),(D,E),(D,F),(E,F),共15个.如果2名学生的数学成绩都在[40,50)分数段内或都在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定不大于10.如果一个成绩在[40,50)分数段内,另一个成绩在[90,100]分数段内,那么这2名学生的数学成绩之差的绝对值一定大于10.记“这2名学生的数学成绩之差的绝对值不大于10”为事件M ,则事件M 包含的基本事件有(A ,B ),(C ,D ),(C ,E ),(C ,F ),(D ,E ),(D ,F ),(E ,F ),共7个,故所求概率P (M )=715.题型二 概率与统计案例的综合应用【例】某大学餐饮中心为了解新生的饮食习惯,在全校一年级学生中进行了抽样调查,调查结果如下表所示:(1)根据表中数据,问是否有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”;(2)已知在被调查的北方学生中有5名数学系的学生,其中2名喜欢甜品,现在从这5名学生中随机抽取3人,求至多有1人喜欢甜品的概率. 附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2.【解】 (1)将2×2列联表中数据代入公式计算,得 χ2=100×60×10-20×10270×30×80×20=10021≈4.762. 由于4.762>3.841,所以有95%的把握认为“南方学生和北方学生在选用甜品的饮食习惯方面有差异”.(2)设这5名数学系的学生喜欢甜品的为a 1,a 2,不喜欢甜品的为b 1,b 2,b 3,从5名数学系的学生中任取3人的一切可能结果所组成的基本事件空间Ω={(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,b 3),(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)}. Ω由10个基本事件组成,且这些基本事件出现是等可能的.用A 表示“3人中至多有1人喜欢甜品”这一事件,则A ={(a 1,b 1,b 2),(a 1,b 2,b 3),(a 1,b 1,b 3),(a 2,b 1,b 2),(a 2,b 2,b 3),(a 2,b 1,b 3),(b 1,b 2,b 3)},A 由7个基本事件组成,因而P (A )=710.【思维升华】 统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.【训练】某校计划面向高一年级1 200名学生开设校本选修课程,为确保工作的顺利实施,先按性别进行分层抽样,抽取了180名学生对社会科学类、自然科学类这两大类校本选修课程进行选课意向调查,其中男生有105人.在这180名学生中选择社会科学类的男生、女生均为45人.(1)分别计算抽取的样本中男生、女生选择社会科学类的频率,并以统计的频率作为概率,估计实际选课中选择社会科学类的学生人数;(2)根据抽取的180名学生的调查结果,完成以下2×2列联表.并判断能否在犯错误的概率不超过0.025的前提下认为科类的选择与性别有关?附:χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2,其中n =a +b +c +d .【解】 (1)由条件知,抽取的男生有105人,女生有180-105=75(人).男生选择社会科学类的频率为45105=37,女生选择社会科学类的频率为4575=35.由题意,知男生总数为1 200×105180=700,女生总数为1 200×75180=500,所以估计选择社会科学类的人数为 700×37+500×35=600.(2)根据统计数据,可得列联表如下:则χ2=180×60×45-30×452105×75×90×90=367≈5.142 9>5.024, 所以在犯错误的概率不超过0.025的前提下能认为科类的选择与性别有关.专题突破训练1.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;(2)规定日平均生产件数不少于80的为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?附:χ2=nn 11n 22-n 12n 212n 1+n 2+n +1n +2.【解】 (1)由已知得,样本中有25周岁以上(含25周岁)组工人60名,25周岁以下组工人40名.所以样本中日平均生产件数不足60的工人中,25周岁以上(含25周岁)组工人有60×0.005×10=3(人),记为A 1,A 2,A 3;25周岁以下组工人有40×0.005×10=2(人),记为B 1,B 2. 从中随机抽取2名工人,所有的可能结果共有10种,它们是(A 1,A 2),(A 1,A 3),(A 2,A 3),(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是(A 1,B 1),(A 1,B 2),(A 2,B 1),(A 2,B 2),(A 3,B 1),(A 3,B 2),(B 1,B 2).故所求的概率P =710.(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上(含25周岁)组”中的生产能手有60×(0.02+0.005)×10=15(人),“25周岁以下组”中的生产能手有40×(0.032 5+0.005)×10=15(人),据此可得2×2列联表如下:所以得χ2=n n 11n 22-n 12n 212n 1+n 2+n +1n +2=100×15×25-15×45260×40×30×70=2514≈1.79. 因为1.79<2.706.所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.2.某省电视台为了解该省卫视一档成语类节目的收视情况,抽查东、西部各5个城市,得到观看该节目的人数的统计数据(单位:千人),并画出如下茎叶图,其中一个数字被污损.(1)求东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数的概率;(2)该节目的播出极大地激发了观众对成语知识学习积累的热情,现从观看节目的观众中随机统计了4位观众学习成语知识的周均时间(单位:小时)与年龄(单位:岁),并绘制了如下对照表:根据表中数据,试求回归直线方程y ^=b ^x +a ^,并预测年龄为55岁的观众周均学习成语知识的时间.参考公式:b ^=∑ni =1x i y i -n x y ∑ni =1x 2i -n x2,a ^ =y -b ^x .【解】 (1)设被污损的数字为a ,则a 有10种情况. 由88+89+90+91+92>83+83+87+90+a +99, 得a <8,∴有8种情况使得东部各城市观看该节目的观众的平均人数超过西部各城市观看该节目的观众的平均人数, 所求概率为810=45.(2)由表中数据,计算得x =35,y =3.5,b ^=∑4i =1x i y i -4x y∑4i =1x 2i -4x 2=525-4×35×3.55 400-4×352=0.07,a ^=y -b ^x =3.5-0.07×35=1.05.∴y ^=0.07x +1.05.当x =55时,y ^=4.9.即预测年龄为55岁的观众周均学习成语知识的时间为4.9小时.3.长沙某购物中心在开业之后,为了解消费者购物金额的分布情况,在当月的电脑消费小票中随机抽取n 张进行统计,将结果分成6组,分别是[0,100),[100,200),[200,300),[300,400),[400,500),[500,600],制成如图所示的频率分布直方图(假设消费金额均在[0,600]元的区间内). (1)若按分层抽样的方法在消费金额为[400,600]元区间内抽取6张电脑小票,再从中任选2张,求这2张小票均来自[400,500)元区间的概率;(2)为做好五一劳动节期间的商场促销活动,策划人员设计了两种不同的促销方案. 方案一:全场商品打八折.方案二:全场购物满100元减20元,满300元减80元,满500元减120元,以上减免只取最高优惠,不重复减免,利用直方图的信息分析:哪种方案优惠力度更大,并说明理由(直方图中每个小组取中间值作为该组数据的替代值).【解】 (1)由题意知,在[400,500)元区间内抽4张,分别记为a ,b ,c ,d ,在[500,600]元区间内抽2张,分别记为E ,F ,设“2张小票均来自[400,500)元区间”为事件A ,从中任选2张,有以下选法:ab ,ac ,ad ,aE ,aF ,bc ,bd ,bE ,bF ,cd ,cE ,cF ,dE ,dF ,EF ,共15种.其中,2张小票均来自[400,500)元区间的有ab ,ac ,ad ,bc ,bd ,cd ,共6种, ∴P (A )=25.(2)方法一 由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05.方案一:购物的平均费用为0.8×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+550×0.05)=0.8×275=220(元).方案二:购物的平均费用为50×0.1+130×0.2+230×0.25+270×0.3+370×0.1+430×0.05=228(元).∵220<228,∴方案一的优惠力度更大.方法二由频率分布直方图可知,各组频率依次为0.1,0.2,0.25,0.3,0.1,0.05,方案一:平均优惠金额为0.2×(50×0.1+150×0.2+250×0.25+350×0.3+450×0.1+550×0.05)=0.2×275=55(元).方案二:平均优惠金额为20×(0.2+0.25)+80×(0.3+0.1)+120×0.05=47(元).∵55>47,∴方案一的优惠力度更大.4.某校高三期中考试后,数学教师对本次全部数学成绩按1∶30进行分层抽样,随机抽取了20名学生的成绩为样本,成绩用茎叶图记录如图所示,但部分数据不小心丢失,同时得到如下表所示的频率分布表:(1)求表中a,b的值及成绩在[90,110)范围内的样本数,并估计这次考试全校高三学生数学成绩的及格率(成绩在[90,150]内为及格);(2)若从茎叶图中成绩在[100,130)范围内的样本中一次性抽取两个,求取出两个样本数字之差的绝对值大于10的概率.【解】(1)由茎叶图知成绩在[50,70)范围内的有2人,在[110,130)范围内的有3人,∴a=0.1,b=3.成绩在[70,90)内的样本数为0.25×20=5.∴成绩在[90,110)内的样本数为20-2-5-5=8.估计这次考试全校高三学生数学成绩的及格率为P=1-0.1-0.25=0.65.(2)所有可能的结果为(100,102),(100,106),(100,106),(100,116),(100,118),(100,128),(102,106),(102,106),(102,116),(102,118),(102,128),(106,106),(106,116),(106,118),(106,128),(106,116),(106,118),(106,128),(116,118),(116,128),(118,128),共21个,取出的两个样本中数字之差的绝对值大于10的结果为(100,116),(100,118),(100,128),(102,116),(102,118),(102,128),(106,118),(106,128),(106,118),(106,128),(116,128),共11个,∴P(A)=1121.。
统计概率考点总结【考点一】分层抽样01,交通治理部门为明白机动车驾驶员(简称驾驶员)对某新法规的知晓情形,对甲,乙,丙,丁四个社N ,其中甲社区有驾驶员区做分层抽样调查;假设四个社区驾驶员的总人数为96 人;如在甲,乙,N 丙,丁四个社区抽取驾驶员的人数分别为12,21,25,43,就这四个社区驾驶员的总人数为()A ,101 B,808 C,1212 D ,202102,某个年级有男生560 人,女生420 人,用分层抽样的方法从该年级全体同学中抽取一个容量为280 的样本,就此样本中男生人数为.03,一支田径运动队有男运动员56 人,女运动员42 人;现用分层抽样的方法抽取如干人,如抽取的男运动员有8 人,就抽取的女运动员有人;04,某单位有840 名职工, 现采纳系统抽样方法抽取42 人做问卷调查, 将840 人按1, 2, , 840 随机,编号, 就抽取的42 人中, 编号落入区间[481, 720] 的人数为()A .11B .12 C.13 D .1405,将参与夏令营的600 名同学编号为:001,002,600,采纳系统抽样方法抽取一个容量为50 的样本,且随机抽得的号码为003.这600 名同学分住在三个营区,从001 到300 在第Ⅰ营区,从301 到495 住在第Ⅱ营区,从496 到600 在第Ⅲ营区,三个营区被抽中的人数依次为()A .26, B.25,17,8 C.25,16,9 D .24,17,916, 8【考点二】频率分布直方图(估量各种特点数据)01,从某小区抽取100 户居民进行月用电量调查, 发觉其用电量都在50 到350 度之间, 频率分布直方图所示.x 的值为;(I) 直方图中(II) 在这些用户中, 用电量落在区间100,250 内的户数为.02,下图是样本容量为200 的频率分布直方图;依据样本的频率分布直方图估量,样本数据落在[6 ,10]内的频数为,数据落在(2,10)内的概率约为03,有一个容量为200 的样本,其频率分布直方图如下列图,依据样本的频率分布直方图估量,样本数据落在区间10,12 内的频数为A .18B .36 C.54 D .7204,如上题的频率分布直方图,估量该组试验数据的众数为,中位数为,平均数为【考点三】数据特点01,抽样统计甲,乙两位设计运动员的 5 次训练成果( 单位: 环), 结果如下:运动员甲乙第 1 次8789第 2 次9190第 3 次9091第 4 次8988第 5 次9392就成果较为稳固( 方差较小) 的那位运动员成果的方差为.02,某单位200 名职工的年龄分布情形如图2,现要从中抽取40 名职工作样本,用系统抽样法,将全体职工随机按1-200 编号,并按编号次序平均分为40 组(1-5 号,6-10 号,196-200 号).如第5 组抽出的号码为22,就第8 组抽出的号码应是;如用分层抽样方法,就40 岁以下年龄段应抽取人.03,在某次测量中得到的 A 样本数据如下:82,84,84,86,86,86,88,88,88,88.如 B 样本数据恰好是 A 样本数据都加 2 后所得数据,就A,B 两样本的以下数字特点对应相同的是(A) 众数(B) 平均数(C)中位数(D) 标准差04,总体由编号为,19,2的020 个个体组成;利用下面的随机数表选取 5 个个体,选取方法是从随01,02,机数表第 1 行第5 列和第6 列数字开头由左到右依次选取两个数字,就选出的第 5 个个体编号为A .08B .07 C.02 D.0105,容量为20 的样本数据,分组后的频数如下表就样本数据落在区间[10,40] 的频率为A B C D06,小波一星期的总开支分布图如图1 所示,一星期的食品开支如图2 所示,就小波一星期的鸡蛋开支占总开支的百分比为% % % D. 不能确定07,对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),就该样本的中位数,众数,极差分别是( )A .46,45,56B . 46,45,53C . 47,45,56D .45,47,5308,考察某校各班参与课外书法小组人数, 在全校随机抽取 5 个班级 , 把每个班级参与该小组的人数作为样本数据. 已知样本平均数为 7, 样本方差为 4, 且样本数据相互不相同 , 就样本数据中的最大值为【考点四】求回来直线,相关系数,相关指数 依据一组样本数据 (x i , 01,设某高校的女生体重y (单位: kg )与身高 x (单位: cm )具有线性相关关系, y y i )(i=1 ,2, , n ),用最小二乘法建立的回来方程为 ,就以下结论中不正确选项A.y 与 x 具有正的线性相关关系 x , )y B. 回来直线过样本点的中心( C.如该高校某女生身高增加 1cm ,就其体重约增加D.如该高校某女生身高为170cm ,就可肯定其体重必为x, y 有观测数据理力争( x 1 , y 1 )( i=1,2, 02,对变量 ,10),得散点图如下左图;对变量 u ,v 有观测数据( u 1 , v 1 )( i=1,2, , 10) ,得散点图如下右图 . 由这两个散点图可以判定; ( A )变量 与 正相关, 与 正相关 x y u v ( B )变量 与 正相关, 与 负相关 x y u v ( C )变量 与 负相关, 与 正相关 x y u v ( D )变量 与 负相关, 与 负相关x y u vx 和y 的n 个样本点,直线l 是由这些样本点通过03,设(x1,y1),(x2,y2),,(x n,y n)是变量最小二乘法得到的线性回来直线(如图),以下结论中正确选项x 和y 的相关系数为直线l 的斜率A .x 和y 的相关系数在B .0 到1 之间C.当n 为偶数时,分布在l两侧的样本点的个数肯定相同D .直线l 过点( x, y)x1,y1),(x2,y2),,(x n,y n)(n≥2,x1,x2, ,x n 不全相等)的散点图中,如所04,在一组样本数据(1有样本点(x i,y i)( i=1,2 ,, n) 都在直线y= x+1 上,就这组样本数据的样本相关系数为2(C)12(A )-1 (B)0 (D)105,如表供应了某厂节能降耗技术改造后生产甲产品过程中记录的产量x ( 吨) 与相应的生产能耗y ( 吨标准煤) 的几组对比数据;请依据表格供应的数据,用最小二乘法求出y 关于x 的线性回来方程为:ny xx i y i nx y ^b^,a^b x ,i 1y343546) (n22x i nxi 106,某产品的广告费用x 与销售额广告费用y 的统计数据如下表x(万元) 4235销售额y(万元) 49 26 39 54 依据上表可得回来方程^y=b^x+a中的b^^,据此模型预报广告费用为 6 万元时销售额为()A .万元B.万元C.万元D.万元07,某地2021 年其次季各月平均气温x (℃)与某户用水量y (吨)y 关于月平均如下表,依据表中数据,用最小二乘法求得用水量气温x 的线性回来方程是A . y.B. y.x C. y.x D . y.5x x08,( 2021 年全国 I 18 题)某公司为确定下一年度投入某种产品的宣扬费,需明白年宣扬费 x(单位:千元 )对年销售量 y(单位:t)和年利润 z(单位:千元 )的影响.对近 8 年的年宣扬费 x i 和年销售量 y i (i = 1,2, , 8)数据作了初步处理,得到下面的散点图及一些统计量的值. ( 1)依据散点图判定, y =a + bx 与 y = c + d x 哪一个相宜作为年销售量 y 关于年宣扬费 x 的回来方程类型? (给出判定即 可,不必说明理由 )( 2)依据 (1) 的判定结果及表中数据, 建立 y 关于 x 的回来方程; ( 3)已知这种产品的年利润z 与 x , y 的关系为 z = - x.依据 (2) 的结果回答以下问题:①年宣扬费 x = 49 时,年销售量及年利润的预报值是多少? ②年宣扬费 x 为何值时,年利润的预报值最大?888822( x ix)( w iw)(w iw)( y iy)( x ix)( y i y)x y wi 1i 1i 1i 15631 46981 附: ( 1)在下 表中 w i = x i , w =w i8 i1( 2)对于一组数据 (u 1, v 1), (u 2,v 2), n, (u n , v n ),其回来直线 v = α+ βu 的斜率和截距的最小二乘法 ( u iu)( v i v) ^ ,α= v -β^运算公式分别为u i 1n2(u iu)i 1【考点五】独立性检验01,通过随机询问 110 名性别不同的高校生是否爱好某项运动,得到如下的列联表:男 40 20 60女 20 30 50总计6050 110爱好 不爱好 总计22n c 2ad d k)bc a 110 40 30 20 20由 算得,.22KK a b P(Kc b d60 50 60 500. 050 0. 010 0. 001 3. 8416. 63510. 828k参照附表,得到的正确结论是 A .再犯错误的概率不超过 0.1% 的前提下,认为“爱好该项运动与性别有关” B .再犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C .有 99%以上的把握认为“爱好该项运动与性别有关”D .有 99%以上的把握认为“爱好该项运动与性别无关”【考点六】古典概型——列举法( 6 选 3, 5 选 3)1 14, 就 n01,从 n 个正整1,2, n 中任意取出两个不同的数 5 的概率为, 如取出的两数之和等于 m , n ( m 7 , n 9 ) 可以任意选取 , 就 m ,n 都取到奇数的概02,现在某类病毒记作X m Y n , 其中正整数 率为 .03,从个位数与十位数之和为奇数的两位数中任取一个,其个位数为0 的概率是4 91 3291 9A.B.C.D.22x y 3的概率是 ( )04,某同学同时掷两颗骰子,得到点数分别为a ,b ,就椭圆 + b = 1 的离心率 e> 2 2a 21 51 1 A .18B . 36C . 6D . 305,一袋中装有 10 个球 , 其中 3 个黑球 , 7 个白球 , 先后两次从袋中各取一球 (不放回 ). 就其次次取出的是黑球的概率是;已知第一次取出的是黑球 ,就其次次取出的仍是黑球的概率是.06,从装有1A.103 个红球,2 个白球的袋中任取 3 个球,就所取的 3 个球中至少有 1 个白球的概率是()339D.10B.10C.507,从长度分别为2,3,4,5 的四条线段中任意取出三条,就以这三条线段为边可以构成三角形的概率是【考点七】几何概型(显性,隐性)1 2,01,小波通过做嬉戏的方式来确定周末活动,他随机的往单位圆内投掷一点,如此点到圆心的距离大于14就周末去看电影;如此点到圆心的距离小于,就去打篮球;否就,在家看书. 就小波周末不在家看书的概率为.a, 就时间“3a 10 ”发生的概率为02,利用运算机产生0~1 之间的匀称随机数03,在长为12cm 的线段AB 上任取一点 C.现作一矩形,令边长分别等于线段AC ,CB 的长,就该矩形面32cm2 的概率为积小于1 6132345(A) (B) (C) (D)1x , 使得x 1 x 2 1 成立的概率为3,304,在区间上随机取一个数3 05,如图,在圆心角为直角的扇形OAB 中,分别以OA,OB 为直径作两个半圆. 在扇形A .OAB 内随机取一点,就此点取自阴影部分的概率是B.C. D .2π121π2π1π1RT BAC 中, 06,在 A, AB = 1 , BC = 2211 2D ,就 ΔABD 的面积比 ΔABC 的面积的( 1)在 BC 上取一点 仍大的概率为 211 2BC 交于点 D ,就 ΔABD 的面积比 ΔABC 的面积的( 2)过 A 作射线与 仍大的概率为 314A ,B ,C ,就 ΔABC 为锐角三角形的概率为 07,在一个圆上任取三点答案:有注明讲的题目为下次上课必讲对象 【考点一】 5(讲) 【考点二】 4(讲) 702. 643. B 【考点三】 1. 22. 37, 203. D4. D5. B6. C7. A8. 10 【考点四】1. D 8( 讲)2. C3. D4. D5.6. B7 .D【考点五】 1. C 20 633 10 2 9【考点六】 1. 82.4. C5.7.13 16 2 3【考点七】1. 4 讲 6 讲7 讲2. 5. A。
规范解答集训(三)概率与统计(建议用时:40分钟)前言“一学就会,一考就废?”,正是因为考试后缺少了这个环节从小学到初中,学生们经历了无数次考试。
通过考试可以检测同学们对知识的理解、掌握情况,提高应试能力。
但对待考试,部分同学只关注自己的分数,而对试卷的分析和总结缺乏重视。
结果常常出现一些题在考试中屡次出现,但却一错再错的情况。
这样,学生们无法从考试中获益,考试也就失去了它的重要意义。
做好试卷分析和总结是十分有必要的。
那么,怎样做好试卷分析呢?我认为,应从下面两点做起:一.失分的原因主要有如下四方面:(1)考试心理:心理紧张,马虎大意;(2)知识结构:知识面窄,基础不扎实;(3)自身能力:审题不清,读不懂题意;(4)解题基本功:答题规范性差。
只有查出、找准原因,才能对症下药,从弱项方面加强训练,以提高成绩。
二.“扭转乾坤”的方法做题的过程中对每一道题要试图问如下几个问题?(1)怎样做出来的?——想解题方法;(2)为什么这样做?——思考解题原理;(3)怎样想到这种方法?——想解题的基本思路;(4)题目体现什么样的思想?——揭示本质,挖掘规律;(5)是否可将题目变化?——一题多变,拓宽思路;(6)题目是否有创新解法?——创新、求异思维。
转变,让我们从每一次练习开始。
按照上面两点认真完成后面练习题。
希望每一位同学经过时间后,能够扭转“一考就废”的局面,最后决胜2020年高考。
1.某机构组织语文、数学学科能力竞赛,按照一定比例淘汰后,颁发一、二、三等奖(分别对应成绩等级的一、二、三等).现有某考场所有考生的两科成绩等级统计如图1所示,其中获数学二等奖的考生有12人.图1(1)求该考场考生中获语文一等奖的人数;(2)用随机抽样的方法从获得数学和语文二等奖的考生中各抽取5人,进行综合素质测试,将他们的综合得分绘成茎叶图(如图2所示),求样本的平均数及方差并进行比较分析;图2(3)已知本考场的所有考生中,恰有3人两科均获一等奖,在至少一科获一等奖的考生中,随机抽取2人进行访谈,求这2人两科均获一等奖的概率.[解](1)∵获数学二等奖的考生有12人,∴该考场考生的总人数为121-0.40-0.26-0.10=50,故该考场获语文一等奖的考生人数为50×(1-0.38×2-0.16)=4.(2)设获数学二等奖考生综合得分的平均数和方差分别为x1,s21,获语文二等奖考生综合得分的平均数和方差分别为x2,s22.x 1=81+84+92+90+935=88, x 2=79+89+84+86+875=85, s 21=15×[(-7)2+(-4)2+42+22+52]=22, s 22=15×[(-6)2+42+(-1)2+12+22]=11.6, ∵88>85,11.6<22,∴获数学二等奖考生较获语文二等奖考生综合素质测试的平均分高,但是成绩差距较大,稳定性较差.(3)两科均获一等奖的考生共有3人,则仅数学获一等奖的考生有2人,仅语文获一等奖的考生有1人.把两科均获一等奖的3人分别记为A 1,A 2,A 3,仅数学获一等奖的2人分别记为B 1,B 2,仅语文获一等奖的1人记为C ,则在至少一科获一等奖的考生中,随机抽取2人的基本事件有A 1A 2,A 1A 3,A 1B 1,A 1B 2,A 1C ,A 2A 3,A 2B 1,A 2B 2,A 2C ,A 3B 1,A 3B 2,A 3C ,B 1B 2,B 1C ,B 2C ,共15个.记“这2人两科均获一等奖”为事件M ,则事件M 包含的基本事件有A 1A 2,A 1A 3,A 2A 3,共3个,∴P (M )=315=15,故这2人两科均获一等奖的概率为15.2.(2019·唐山模拟)最近青少年的视力健康问题引起人们的高度重视,某地区为了解当地24所小学,24所初中和12所高中的学生的视力状况,准备采用分层抽样的方法从这些学校中随机抽取5所学校对学生进行视力调查.(1)若从所抽取的5所学校中再随机抽取3所学校进行问卷调查,求抽到的这3所学校中,小学、初中、高中分别有一所的概率;(2)若某小学被抽中,调查得到了该小学前五个年级近视率y 的数据如下表:根据方程预测六年级学生的近视率.附:回归直线y ^=b ^x +a ^的斜率和截距的最小二乘法估计公式分别为b ^=∑ni =1x i y i -n x y∑ni =1x 2i -n x 2,a ^=y -b ^ x .参考数据:∑5i =1x i y i =2.76,∑5i =1x 2i =55.[解] (1)由24∶24∶12=2∶2∶1,得抽取的5所学校中有2所小学、2所初中、1所高中,分别设为a 1,a 2,b 1,b 2,c ,从这5所学校中随机抽取3所学校的所有基本事件为(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,c ),(a 1,b 1,b 2),(a 1,b 1,c ),(a 1,b 2,c ),(a 2,b 1,b 2),(a 2,b 1,c ),(a 2,b 2,c ),(b 1,b 2,c ),共10种, 设事件A 表示“抽到的这3所学校中,小学、初中、高中分别有一所”,则事件A 包含的基本事件为(a 1,b 1,c ),(a 1,b 2,c ),(a 2,b 1,c ),(a 2,b 2,c ),共4种,故P (A )=410=25.(2)由题中表格数据得x =3,y =0.15,5x y =2.25,5x 2=45,且由参考数据:∑5i =1x i y i =2.76,∑5i =1x 2i =55,得b ^=2.76-2.2555-45=0.051,a ^=0.15-0.051×3=-0.003, 得线性回归方程为y ^=0.051x -0.003.当x =6时,代入得y ^=0.051×6-0.003=0.303,所以六年级学生的近视率在0.303左右.3.(2019·昆明模拟)《中国大能手》是央视推出的一档大型职业技能挑战赛类的节目,旨在通过该节目,在全社会传播和弘扬“劳动光荣、技能宝贵、创造伟大”的时代风尚.某公司准备派出选手代表公司参加《中国大能手》职业技能挑战赛.经过层层选拔,最后集中在甲、乙两位选手在一项关键技能的区分上,选手完成该项挑战的时间越少越好.已知这两位选手在15次挑战训练中,完成该项关键技能挑战所用的时间(单位:秒)及挑战失败(用“×”表示)的情况如表1:据表1中甲、乙两位选手完成该项关键技能挑战所用时间的数据,应用统计软件得表2:(1)在表1中,从选手甲完成挑战用时低于90秒的成绩中,任取2个,求这2个成绩都低于80秒的概率;(2)若该公司只有一个参赛名额,以完成该项关键技能挑战所用时间为标准,根据以上信息,判断哪位选手代表公司参加职业技能挑战赛更合适?请说明你的理由.[解] (1)选手甲完成挑战用时低于90秒的成绩共有6个,其中低于80秒的成绩有3个,分别记为A 1,A 2,A 3,其余的3个分别记为B 1,B 2,B 3,从6个成绩中任取2个的所有取法有:A 1A 2,A 1A 3,A 1B 1,A 1B 2,A1B3,A2A3,A2B1,A2B2,A2B3,A3B1,A3B2,A3B3,B1B2,B1B3,B2B3,共15种,其中2个成绩都低于80秒的有A1A2,A1A3,A2A3,共3种,所以所取的2个成绩都低于80秒的概率P=315=15.(2)甲、乙两位选手完成关键技能挑战的次数都为10,挑战失败的次数都为5,所以只需要比较他们完成关键技能挑战的情况即可,其中x甲=85(秒),x乙=84(秒),s2甲=50.2,s2乙=54.答案①:选手乙代表公司参加职业技能挑战赛比较合适,因为在相同次数的挑战中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,但x甲>x乙,乙选手平均用时更短.答案②:选手甲代表公司参加职业技能挑战赛比较合适,因为在相同次数的挑战中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,虽然x甲>x乙,但两者相差不大,水平相当,s2甲<s2乙,表明甲选手的发挥更稳定.答案③:选手乙代表公司参加职业技能挑战赛比较合适,因为在相同次数的挑战中,两位选手在关键技能挑战的完成次数和失败次数都分别相同,但x乙<x甲,乙选手平均用时更短,从表1中的数据整体看,甲、乙的用时都逐步减少,s2乙>s2甲,说明乙选手进步幅度更大,成绩提升趋势更好.(答案不唯一) 4.(2019·昆明模拟)互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分.某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下简称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表:业的经营状况;(2)据统计表明,y 与x 之间具有线性关系.①请用相关系数r 对y 与x 之间的相关性强弱进行判断(若|r |>0.75,则可认为y 与x 有较强的线性相关关系(r 值精确到0.001));②经计算求得y 与x 之间的回归方程为y ^=1.382x -2.674,假定每单外卖业务,企业平均能获取纯利润3元,试预测当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润的大致范围(x 值精确到0.01).相关公式:r =∑ni =1(x i -x )(y i -y )∑ni =1 (x i -x )2∑n i =1 (y i -y )2. 参考数据:∑5i =1(x i -x )(y i -y )=66, ∑5i =1 (x i -x )2∑5i =1 (y i -y )2≈77.[解] (1)由题可知x =5+2+9+8+115=7(百单), y =2+3+10+5+155=7(百单). 外卖甲的日接单量的方差s 2甲=10,外卖乙的日接单量的方差s 2乙=23.6,因为x =y ,s 2甲<s 2乙,即外卖甲平均日接单量与外卖乙相同,且外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①计算可得,相关系数r =6677≈0.857>0.75,所以可认为y 与x 之间有较强的线性相关关系.②令y ≥25,得1.382x -2.674≥25,解得x ≥20.02,又20.02×100×3=6 006,所以当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润大约不低于6 006元.5.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x (单位:千元)对年销售量y (单位:t)和年利润z (单位:千元)的影响.对近8年的年宣传费x i 和年销售量y i (i =1,2,…,8)数据作了初步处理,得到下面的散点图及一些统计量的值.表中w i =x i ,w =18∑i =1w i . (1)根据散点图判断,y ^=a ^+b ^ x 与y ^=c ^+d ^x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及表中数据,建立y 关于x 的回归方程;(3)已知这种产品的年利润z 与x ,y 的关系为z =0.2y -x .根据(2)的结果回答下列问题:①年宣传费x =49时,年销售量及年利润的预报值是多少?②年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据(u 1,v 1),(u 2,v 2),…,(u n ,v n ),其回归直线v ^=α^+β^u的斜率和截距的最小二乘法估计分别为β^=∑ni =1 (u i -u )(v i -v )∑ni =1(u i -u )2,α^=v -β^ u . [解] (1)由散点图可以判断,y ^=c ^+d ^x 适宜作为年销售量y 关于年宣传费x 的回归方程类型.(2)令w =x ,先建立y 关于w 的线性回归方程.由于d ^=∑8i =1 (w i -w )(y i -y )∑8i =1(w i -w )2=108.81.6=68, c ^=y -d ^ w =563-68×6.8=100.6,所以y 关于w 的线性回归方程为y ^=100.6+68w ,因此y 关于x 的回归方程为y ^=100.6+68x .(3)①由(2)知,当x =49时,年销售量y 的预报值y ^=100.6+6849=576.6,年利润z 的预报值z ^=576.6×0.2-49=66.32.②根据(2)的结果知,年利润z 的预报值z ^=0.2(100.6+68x )-x =-x +13.6x +20.12. 所以当x =13.62=6.8,即x =46.24时,z ^取得最大值.故年宣传费为46.24千元时,年利润的预报值最大.。
1 52 5258 259 2020 年高考文科数学《概率与统计》题型归纳与训练【题型归纳】 题型一 古典概型 例 1从甲、乙等5 名学生中随机选出2 人,则甲被选中的概率为().A.B.C.D.【答案】 【解析】 法有:可设这 5 名学生分别是甲、乙、丙、丁、戊,从中随机选出 2 人的方(甲,乙),(甲,丙),(甲,丁),(甲,戊),(乙,丙),(乙,丁),(乙,戊), (丙,丁),(丙,戊),(丁,戊),共有10 种选法,其中只有前 4 种是甲被选中,所以所求概率为 42.故选 B.10 5例 2 将 2 本不同的数学书和 1 本语文书在书架上随机排成一行,则 2 本数学书相邻的概率为 .【答案】 【解析】根据题意显然这是一个古典概型,其基本事件有:数 1,数 2,语; 数 1,语,数 2;数 2,数 1,语; 数 2,语,数 1;语,数 2,数 1; 语,数 1,数 2 共B2314π 81 2⎧⎪∆ = 4 p 2 - 4(3 p - 2) ≥ 0⎨ x + x = -2 p < 0 1 2 ⎩ ⎪ x x= 3 p - 2 > 0 1 2有 6 种,其中 2 本数学书相邻的有 4 种,则其概率为:.【易错点】列举不全面或重复,就是不准确 【思维点拨】直接列举,找出符合要求的事件个数. 题型二 几何概型 例 1如图所示,正方形ABCD 内的图形来自中国古代的太极 AD图,正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概BC率是( ).A.B.C.D.【答案】【解析】不妨设正方形边长为a ,由图形的对称性可知,太极图中黑白部分面积相等,即各占圆面积的一半.由几何概型概率的计算公式得,所求概率为.故选 B.例 2 在区间[0, 5] 上随机地选择一个数的概率为.,则方程 x 2 +2 px +3 p - 2 = 0 有两个负根【答案】【解析】方程 x 2+2 px +3 p - 2 = 0 有两个负根的充要条件是 即Bπ 4p 23p = 4 = 6 2 31 ⎛ a ⎫2 ⨯⨯ ⎪2⎝ 2 ⎭ = 8a 2400或 p ≥ 2 ,又因为 p ∈[0, 5] ,所以使方程 x 2 +2 px +3 p - 2 = 0 有两个负根的 p【易错点】“有两个负根”这个条件不会转化.【思维点拨】“有两个负根”转化为函数图像与 x 轴负半轴有两个交点.从而得到参数 p 的范围.在利用几何概型的计算公式计算即可. 题型三 抽样与样本数据特征 例 1某工厂生产甲、乙、丙、丁四种不同型号的产品,产量分别为200 ,, 300 ,100 件.为检验产品的质量,现用分层抽样的方法从以上所有的产品中抽取60 件进行检验,则应从丙种型号的产品中抽取件.【答案】18【解析】按照分层抽样的概念应从丙种型号的产品中抽取300 ⨯ 60 1000= 18 (件).例 2已知样本数据x 1 , x 2 , ⋅⋅⋅ , x n 的均值 x = 5 ,则样本数据2x 1 +1 , 2x 2 +1 , ⋅⋅⋅ , 2x n +1 的均值为 .【答案】11 【解析】因为样本数据x 1 , x 2 , ⋅⋅⋅ , x n 的均值x = 5 ,又样本数据2x 1 +1 ,2x 2 +1, ⋅⋅⋅ , 2x n +1的和为2(x 1 + x 2 + + x n )+ n ,所以样本数据的均值为2x +1 =11.例 3 某电子商务公司对10000 名网络购物者 2018 年度的消费情况进行统计,3 2.发现消费金额(单位:万元)都在区间[0.3,0.9] 内,其频率分布直方图如图所示. (1)直方图中的a = .(2)在这些购物者中,消费金额在区间[0.5,0.9] 内的购物者的人数为.a/万万【答案】a = 3 人数为0.6 ⨯10000 = 6000【解析】由频率分布直方图及频率和等于1,可得0.2 ⨯ 0.1+ 0.8⨯ 0.1+1.5⨯ 0.1+ 2 ⨯ 0.1+ 2.5⨯ 0.1+a ⨯ 0.1 = 1 ,解之得a = 3 .于是消费金额在区间[0.5,0.9]内频率为0.2 ⨯0.1+ 0.8⨯0.1+ 2 ⨯0.1+ 3⨯0.1 = 0.6 ,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6⨯10000=6000.例4 某城市100户居民的月平均用电量(单位:度),以[160,180),[180, 200),[200, 220),[220, 240),[240, 260),[260, 280),[280, 300]分组的频率分布直方图如图所示.2220 + 240 = 230得 x = 0.0075 .又(0.002 + 0.0095 + 0.011+ 0.0125)⨯ 20 = 0.7 > 0.5 ,160 180 200 220 240 260 280 300 万万万万万万/万(1) 求直方图中 x 的值;(2) 求月平均用电量的众数和中位数;(3)在月平均用电量为[220, 240), [240, 260), [260, 280), [280, 300]的四组用户中, 用分层抽样的方法抽取11户居民,则从月平均用电量在[220, 240)的用户中应抽 取多少户?【答案】见解析【解析】(1)由(0.002 + 0.0095 + 0.011+ 0.0125 + x + 0.005 + 0.0025)⨯ 20 = 1 ,(2)由图可知,月平均用电量的众数是.因为(0.002 + 0.0095 + 0.011)⨯ 20 = 0.45 < 0.5 ,所以月平均用电量的中位数在[220, 240)内.设中位数为a ,由(0.002 +0.0095 +0.011)⨯20 +0.0125⨯(a -220)=0.5 ,得a = 224 ,所以月平均用电量的中位数是224 .(3)月平均用电量为[220,240)的用户有0.0125⨯ 20 ⨯100 = 25 (户);月平均用电量为[240,260)的用户有0.0075⨯20⨯100=15(户);月平均用电量为[260,280)的用户有0.005⨯20⨯100=10(户);月平均用电量为[280, 300]的用户有0.0025⨯ 20 ⨯100 = 5 (户).所以从月平均用电量在[220,240)的用户中应抽取25⨯1 = 5 (户).5【易错点】没有读懂题意,计算错误.不会用函数思想处理问题【思维点拨】根据题意分情况写出函数解析式;2 牵涉到策略问题,一般可以转化为比较两个指标的大小.题型四回归与分析例1 下图是我国2008 年至2014 年生活垃圾无害化处理量(单位:亿吨)的折线图∑ i =1nn(t - t ) (y - y)2 ∑ 2i ii =1∑ i =17( y - y )2i nn万万 1.80 万万 1.60 万万万 1.40 万万 1.20 万万1.00y0.80234567年份代码t(1) 由折线图看出,可用线性回归模型拟合 y 与t 的关系,请用相关系数加以说明(2) 建立 y 关于t 的回归方程(系数精确到0.01 ),预测2016 年我国生活垃圾无害化处理量.参考数据: 7 y = 9.32 , 7 t y = 40.17 ,= 0.55 , ≈ 2.646 .∑ii =1∑i ii =1n∑(t i - t )( y i - y )参考公式:相关系数r =i =1回归方程 y = a+ b t 中斜率和截距的最小二乘估计公式分别为:∑(t i - t )( y i - y )b= i =1 a = y - bt .∑(ti- t )2i =1【答案】见解析72【解析】(1)由折线图中数据和附注中参考数据得t = 4 , ∑(t i - t ) = 28 ,i =1 7∑ i =17 7(t - t ) ⋅ ( y - y )2∑ 2iii =1 ∑ i =17 (t - t ) 2ii =1 ∑ i =17( y - y )2i7 ∑ 7(t - t ) 2 i i =1i= 0.55 ,∑7(t - t )(y - y )= ∑7t y - t ∑7y = 40.17 - 4 ⨯ 9.32 = 2.89 ≈2.89≈ . , r0.99 i ii ii0.55⨯ 2 ⨯ 2.646i =1i =1i =1因为 y 与t 的相关系数近似为0.99 ,说明 y 与t 的线性相关程度相当高,从而可以用线性回归模型拟合 y 与t 的关系.7777 ∑(t i - t )( y i - y )7∑t i y i - ∑t i ⋅∑ y i(1)变量 y 与t 的相关系数r =i =1=i =1i =1,7 ⨯⋅777又∑t i = 28 , ∑ y i = 9.32 , ∑t i y i = 40.17 2= 5.292 ,i =1i =1i =1= 0.55 ,所以r = 7 ⨯ 40.17 - 28⨯ 9.32 ≈ 0.997 ⨯ 5.292 ⨯ 0.55,故可用线性回归模型拟合变量 y 与t 的关系.t y - 7t ⋅ y117∑7i i40.17 - 7 ⨯ 4 ⨯ 7 ⨯ 9.32(2) t = 4 , y =∑y ,所以b ˆ= i =1 == 0.10 ,7 i =1 i∑7 i =1t 2 -7t 2 28a ˆ = y -b ˆx = 1⨯ 9.32 - 0.10 ⨯ 4 ≈ 0.93 ,所以线性回归方程为 y ˆ = 0.1t + 0.93 .7当t = 9 时, y ˆ= 0.1⨯ 9 + 0.93 = 1.83 .因此,我们可以预测 2016 年我国生活垃圾无害化处理1.83 亿吨.【易错点】没有读懂题意,计算错误.∑(72y - y i) i =1∑ i =17( y - y )2i【思维点拨】将题目的已知条件分析透彻,利用好题目中给的公式与数据.题型五独立性检验例1 甲、乙、丙、丁四位同学各自对A、B 两变量的线性相关性作试验,并用回归分析方法分别求得相关系数r 与残差平方和m 如下表:则哪位同学的试验结果体现A、B 两变量更强的线性相关性?( ) A.甲B.乙C.丙D.丁【答案】D【解析】D 因为r>0 且丁最接近1,残差平方和最小,所以丁相关性最高【易错点】不理解相关系数和残差平方和与相关性的关系【思维点拨】相关系数r 的绝对值越趋向于1,相关性越强.残差平方和m 越小相关性越强【巩固训练】题型一古典概型151 141 1211. 将一颗质地均匀的骰子(一种各个面上分别标有1,2, 3, 4,5, 6 个点的正方体玩具)先后抛掷2 次,则出现向上的点数之和小于10 的概率是 .【答案】 56【解析】将先后两次点数记为(x , y ),则基本事件共有6 ⨯ 6 = 36 (个), 其中点数之和大于等于10有(4,6),(5,5),(5,6),(6,4),(6,5),(6,6),共6 种, 则点数之和小于10 共有30 种,所以概率为30 = 5. 36 62. 我国数学家陈景润在哥德巴赫猜想的研究中取得了世界领先的成果.哥德巴赫猜想是“每个大于 2 的偶数可以表示为两个素数的和”,如30 = 7 + 23 .在不超过30 的素数中,随机选取两个不同的数,其和等于 30 的概率是( ).A.B .C .D .【答案】C【解析】不超过 30 的素数有 2、3、5、7、11、13、17、19、23、29,共 10 个, 随机选取两数有45 (种)情况,其中两数相加和为 30 的有 7 和 23,11 和19,13 和 17,共 3 故选C .3. 袋中有形状、大小都相同的 4 只球,其中1 只白球,1 只红球, 2 只黄球,从中一次随机摸出【答案】 只球,则这 2 只球颜色不同的概率为 .【解析】1 只白球设为 a ,1 只红球设为 b , 2 只黄球设c 为 , d ,2 P = 56181则摸球的所有情况为(a,b),(a, c),(a, d ),(b,c),(b,d ),(c, d ),共6 件,满足题意的事件为(a,b),(a, c),(a, d ),(b,c),(b,d ),共5.题型二几何概型1.某公司的班车在7:00,8:00,8:30 发车,学.小明在7:50 至8:30 之间到达发车站乘坐班车,且到达发车站的时刻是随机的,则他等车时间不超过10 分钟的概率是().A.F(1) 13B. 12F(1)C.F(2) 23D. 34【答案】B【解析】如图所示,画出时间轴.7:30 7:40 7:50 8:00 8:10 8:20 8:30B小明到达的时间会随机的落在图中线段AB 中,而当他的到达时间落在线段AC 或DB 时,才能保证他等车的时间不超过10 分钟.根据几何概型,所求概率P =10 +10 =1 .故选B.40 22.从区间[0,1]随机抽取2n 个数x1,x2 ,…,x n ,y1 ,y2 ,…,y n ,构成n 个数对(x1, y1),(x2 , y2),…,(xn ,yn),其中两数的平方和小于1 的数对共有m 个,则用随机模拟的方法得到的圆周率π的近似值为().p 2 =p3p 1 =p3p 1 =p2AB4n 2n 4mA.mB. mC.2mnn D. 【答案】C【解析】由题意得:(x i△△△△y i)(i =1 2 ⋅⋅⋅n)在如图所示方格中,而平方和小于1 的π4 =m π =4m点均在如图所示的阴影中,由几何概型概率计算公式知1 n ,所以C.n .故选3.下图来自古希腊数学家希波克拉底所研究的几何图形,此图由三个半圆构成,三个半圆的直径分别为直角三角形ABC 的斜边BC ,直角边,A C ,的三边所围成的区域记为Ⅰ,黑色部分记为Ⅱ,其余部分记为Ⅲ,在整个图形中随机取一点,此点取自Ⅰ,Ⅱ,Ⅲ的概率分别记为p1,,p3,则A.B.C.D.【答案】A【解析】概率为几何概型,总区域面积一定,只需比较Ⅰ,Ⅱ,Ⅲ区域面积即可.设直角三角形ABC 的三个角 A ,B ,C 所对的边长分别为a ,b ,c ,则区域Ⅰ的面积为S1=1ab ,2p 2p 1 =p2+p3△ABC⎝ ⎭ ⎝ ⎭ ⎝ ⎭2区域Ⅱ的面积为 1 ⎛ 1 ⎫2 1 ⎛ 1 ⎫2 1 1 ⎛ 1 ⎫21S 2 = 2 π 2 c ⎪ + 2 π 2 b ⎪ + 2 ab - 2 π 2 a ⎪ = 2 ab ,2 区域Ⅲ的面积为 S = 1 π⎛ 1 c ⎫ + 1 π⎛ 1 b ⎫ - 1 ab = 1 πa 2 - 1 ab .3 2 2⎪ 2 2 ⎪ 28 2 ⎝ ⎭ ⎝ ⎭显然 p 1 = p 2 .故选 A .题型三 抽样与样本的数据特征1. 已知一组数据4 ,6 , 5 , 8 ,7 , 6 ,那么这组数据的平均数为 .【答案】10【解析】平均数x = 1 (4 + 6 + 5 + 8 + 7 + 6)= 6 . 62. 某电子商务公司对 10000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3, 0.9] 内,其频率分布直方图如图所示.(Ⅰ)直方图中的a =;(Ⅱ)在这些购物者中,消费金额在区间[0.5, 0.9] 内的购物者的人数为.【答案】3;6000【解析】频率和等于 1 可得0.2 ⨯ 0.1 + 0.8 ⨯ 0.1 + 1.5 ⨯ 0.1 + 2 ⨯ 0.1 + 2.5 ⨯ 0.1 + a ⨯ 0.1 = 1 , 解之得a = 3 .于是消费金额在区间[0.5, 0.9] 内频率为0.2 ⨯ 0.1 + 0.8 ⨯ 0.1 + 2 ⨯ 0.1 + 3 ⨯ 0.1 = 0.6 , 所以消费金额在区间[0.5, 0.9] 内的购物者的人数为: 0.6 ⨯10000 = 6000 ,故应填3;6000.3.我国是世界上严重缺水的国家,某市政府为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨)、一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100 位居民每人的月均用水量(单位:吨),将数据按照[0, 0.5),[0.5,1),⋅⋅⋅,[4, 4.5)分成9 组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30 万居民,估计全市居民中月均用水量不低于3 吨的人数,请说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.【答案】见解析【解析】(1)由频率分布直方图知,月均用水量在[0,0.5)中的频率为0.08⨯0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)中的频率分别为0.08 ,0.20 ,0.26 ,0.06 ,0.04 ,0.02 .由0.04+0.08+0.5⨯a + 0.20 + 0.26 + 0.5⨯a + 0.06 + 0.04 + 0.02 = 1 ,解得 a = 0.30 .(2)由(1),100位居民每人月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计全市30 万居民中月均用水量不低于 3 吨的人数为300000⨯ 0.12 = 36000 .(3)因为前 6 组的频率之和为0.04 - 0.08 - 0.15 - 0.20 - 0.26 - 0.15=0.88 > 0.85 ,而前5 组的频率之和为0.04+0.08+0.15 -0.20 -0.26=0.73 < 0.85 ,所以2.5 …x < 3.由0.3⨯(x - 2.5)= 0.85 - 0.73 ,解得x = 2.9 .题型四回归与分析1.为了解某社区居民的家庭年收入与年支出的关系,随机调查了该社区5 户家庭,得到如下统计数据表:区一户收入为15 万元家庭年支出为()A.11.4 万元B.11.8 万元C.12.0 万元D.12.2 万元【答案】B所以回归直线方程为yˆ=0.76x+0.4.当社区一户收入为15 万元,家庭年支出为(万元).故选B.0.4 = 11.8yˆ=0.76⨯15+y ∑2. 为了研究某班学生的脚长x (单位:厘米)和身高 y (单位:厘米)的关系,从该班随机抽取10 名学生,根据测量数据的散点图可以看出 与x 之间有线性相关关系,设其回归直线方程为 y ˆ= b ˆx + a ˆ.已知∑x i i =110= 225 , y i = 1600 , b ˆ= 4 .该i =1班某学生的脚长为 24,据此估计其身高为( ).A . 160B . 163C . 166D .170【答案】C 【解析】 故选 C .x = 22.5 , y = 160 ,所以a= 160 - 4⨯ 22.5 = 70 , x = 24 时, y = 4 ⨯ 24 + 70 = 166 .3. 某公司为确定下一年投入某种产品的宣传费,需了解年宣传费 x (单位:千元)对年销售量 y (单位: )和年利润 z (单位:千元)的影响,对近 8 年的年宣传费x i和年销售量计量的值.y i (i = 1, 2,⋅⋅⋅,8)数据作了初步处理,得到下面的散点图及一些统万万万万/万万10 t(u 2,v 2 ) (u 1,v 1 ) y = c + d x x = 49表中,,(1) 根据散点图判断, y = a + bx 与y = c + d x 哪一个适宜作为年销售量y 关于年宣传费x 的回归方程类型(给出判断即可,不必说明理由)?(2) 根据(1)的判断结果及表中数据,建立 y 关于x 的回归方程;(3) 已知这种产品的年利润z 与x , y 的关系式为 z = 0.2y - x,根据(2)的结果回答下列问题:(ⅰ)年宣传费 时,年销售量及年利润的预报值是多少?(ⅱ)年宣传费x 为何值时,年利润的预报值最大?附:对于一组数据 ,⋅ ⋅ ⋅ , (u n , v n ),其回归直线v =+ u 的斜率,和截距的最小二乘估计分别为【答案】见解析【解析】(1)由散点图变化情况可知选择 较为适宜.w i = x iˆ =i =1∑(u i - u )(v i - v ) n∑ i =1n(u - u )2i.x yw∑( )2x- x ii =1∑( )( - ) w - w y y i ii =1∑8( )2w- w ii =1 ∑( - )( -) 8x x y yiii =146.6563 6.8289.8 1.6 1469 108.81 8w = ∑w i8 i =1563 - 68⨯ 6.8 = 100.6 c = y - d = ∑(w - w1.6)∑8(w - w )(y - yii) 108.8(2)由题意知d =i =1= = 68 .又82i一定过点(, y ),i =1所以 ,所以 y 与x 的回归方程为 y = 100.6 + 68 x .(3)(ⅰ)由(2)知,当 x = 49 时,y = 100.6 + 68⨯ 49 = 576.6(t ),(千元),所以当年宣传费为 x = 49 时,年销售量为576.6(t ),利润预估为66.32 千元.(ⅱ)由(2)知, z = 0.2 y - x = 0.2 (100.6 + 68 x )- x =-(x - 6.8)2+ 6.82 + 20.12 ,所以当 x = 6.8 时,年利润的预估值最大,即 x = 6.82 = 46.24 (千元). 题型五 独立性检验1. 某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H :“这种血清不能起到预防感冒的作用”,利用 2×2 列联表计算的 K 2≈3.918,则下列表述中正确的是( )A. 有 95℅的把握认为“这种血清能起到预防感冒的作用”B. 若有人未使用该血清,那么他一年中有 95℅的可能性得感冒y = c + d x 66.32 z = 0.2 ⨯ 576.6 - 49 = 20.12 = 13.6 x - x +a a +bc c + dkg C. 这种血清预防感冒的有效率为 95℅D. 这种血清预防感冒的有效率为 5℅【答案】A【解析】由题可知,在假设成立情况下,P (K 2≥ 3.841) 的概率约为 0.05,即在 犯错的概率不错过 0.05 的前提下认为“血清起预防感冒的作用”,即有 95℅的把握认为“这种血清能起到预防感冒的作用”.这里的 95℅是我们判断 不成立的概率量度而非预测血清与感冒的几率的量度,故 B 错误.C ,D 也犯有 B 中的错误.故选 A2. 观察下面频率等高条形图,其中两个分类变量x ,y 之间关系最强的是( )A .B .C .D .【答案】D【解析】在频率等高条形图中, 与 相差很大时,我们认为两个分类变量有关系,四个选项中,即等高的条形图中 x 1, x 2 所占比例相差越大,则分类变量 x , y 关系越强,故选D .3. 淡水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位: )的频率分布直方图如图所示.H H万万万万万万万万万万/k g万万万万(1)设两种养殖方法的箱产量相互独立,记 A 表示事件:旧养殖法的箱产量低于50kg ,新养殖法的箱产量不低于50kg ,估计 A 的概率;(2)填写下面列联表,并根据列联表判断是否有99% 的把握认为箱产量与养殖方法有关;(3)根据箱产量的频率分布直方图,求新养殖法箱产量的中位数的估计值(精确到0.01 ).附:21. 【答案】见解析【解析】(1)记:“旧养殖法的箱产量低于50kg ” 为事件B ,“新养殖法的箱产量不低于50kg ”为事件C ,由题图并以频率作为概率得,, P (A )= P (B )P (C )= 0.4092 .(2)由计算可得 的观测值为 k 2 = 200 ⨯ (62 ⨯ 66 - 38 ⨯ 34)2100 ⨯100 ⨯ 96 ⨯104 = 15.705 ,因为15.705 > 6.635 ,所以P (K 2 ≥ 6.635)≈ 0.001 ,从而有99% 以上的把握认为箱产量与养殖方法有关.(3)1 ÷ 5 = 0.2 , 0.1 - (0.004 + 0.020 + 0.044)= 0.032 , 50 + 2.35 = 52.35 ,所以中位数为52.35 .0.032 ÷ 0.068 = 8 17 , 8 ⨯ 5 ≈ 2.35 , = 0.66 P (C )= 0.068 ⨯ 5 + 0.046 ⨯ 5 + 0.010 ⨯ 5 + 0.008 ⨯ 5K 2 = 0.62 P (B )= 0.040 ⨯ 5 + 0.034 ⨯ 5 + 0.024 ⨯ 5 + 0.014 ⨯ 5 + 0.012 ⨯ 5 17K 2= n (ad - bc )2 (a + b )(c + d )(a + c )(b + d )22“”“”At the end, Xiao Bian gives you a passage. Minand once said, "people who learn to learn are very happy people.". In every wonderful life, learning is an eternal theme. As a professional clerical and teaching position, I understand the importance of continuous learning, "life is diligent, nothing can be gained", only continuous learning can achieve better self. Only by constantly learning and mastering the latest relevant knowledge, can employees from all walks of life keep up with the pace of enterprise development and innovate to meet the needs of the market. This document is also edited by my studio professionals, there may be errors in the document, if there are errors, please correct, thank you!。