高考文科数学二轮复习必考点统计与概率十六
- 格式:doc
- 大小:155.00 KB
- 文档页数:6
高考数学中的概率统计关键知识点总结在高考数学中,概率统计是一个重要的考点之一。
学习概率统计并掌握其关键知识点,不仅有助于我们在考试中拿到好成绩,还可以在日常生活中帮助我们更好地理解和运用概率统计知识。
本文将总结高考数学中概率统计的关键知识点,希望能对广大考生有所帮助。
一、基本概率知识概率是指某个事件在所有可能事件中发生的可能性大小,通常用一个介于0和1之间的小数来表示。
在概率计算中,我们需要掌握以下知识点:1.样本空间和事件:在一个随机试验中,所有可能结果构成的集合称为样本空间。
样本空间中的个体称为样本点。
事件是样本空间的一个子集,是由若干个样本点组成的。
2.事件的概率:事件A发生的概率P(A)定义为A中样本点数与样本空间中样本点总数之比。
3.互斥事件:如果两个事件A、B没有共同的样本点,则称它们是互斥事件。
4.独立事件:如果两个事件A、B的发生互不影响,则称它们是独立事件。
二、离散型随机变量离散型随机变量是指只能取一些有限或者可数个值的变量。
在学习离散型随机变量时,需要注意以下知识点:1.随机变量:设X是一个随机变量,其所有可能取值构成一个集合,称为随机变量X的全体取值,简称X的取值集。
2.概率函数:对于离散型随机变量X,其取值集为{x1,x2,...,xn},其概率函数为f(x)=P(X=xi),i=1,2,...n。
其中,f(x)满足以下两个条件:非负性,即f(x)>=0;归一性,即sum[f(xi)]=1。
3.数学期望:对于离散型随机变量X,其数学期望定义为:E(X)=sum[xi*f(xi)], i=1,2,...,n。
三、连续型随机变量连续型随机变量是指可以取得任意一个实数的变量。
学习连续型随机变量时,有以下知识点需要注意:1.概率密度函数:对于连续型随机变量X,其概率密度函数f(x)满足以下两个条件:非负性,即f(x)>=0;积分为1,即integral(f(x))dx=1。
文科数学专题概率与统计(学案)高考二轮复习资料含答案1.以客观题形式考查抽样方法,样本的数字特征和回归分析,独立性检验的基本思路、方法及相关计算与推断.2.本部分较少命制大题,若在大题中考查多在概率与统计、算法框图等知识交汇处命题,重点考查抽样方法,频率分布直方图和回归分析或独立性检验,注意加强抽样后绘制频率分布直方图,然后作统计分析或求概率的综合练习.3.以客观题形式考查古典概型与几何概型、互斥事件与对立事件的概率计算.4.与统计结合在大题中考查古典概型与几何概型.(1)在频率分布直方图中:频率①各小矩形的面积表示相应各组的频率,各小矩形的高=;②各小矩形面积之和等于1;③中位数组距左右两侧的直方图面积相等,因此可以估计其近似值.(2)茎叶图当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,从总体中逐个抽取少在起始部分抽样时采按事先确定的规则在各用简单随机抽样总体中的个体数较多分层抽样时采用简单总体由差异明显的随机抽样或系统抽样几部分组成即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).3.样本的数字特征(1)众数在样本数据中,频率分布最大值所对应的样本数据(或出现次数最多的那个数据).(2)中位数样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取当中两个数据的平均数作为中位数.(3)平均数与方差-1样本数据的平均数某=(某1+某2++某n).n1-2-2-22方差=[(某1-某)+(某2-某)++(某n-某)].n注意:(1)现实中总体所包含的个体数往往较多,总体的平均数与标准差、方差是不知道(或不可求)的,所以我们通常用样本的平均数与标准差、方差来估计总体的平均数与标准差、方差.(2)平均数反映了数据取值的平均水平,标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定.4.变量间的相关关系(1)利用散点图可以初步判断两个变量之间是否线性相关.如果散点图中的点从整体上看大致分布在一条直线的附近,我们说变量某和y具有线性相关关系.(2)用最小二乘法求回归直线的方程^^^设线性回归方程为y=b某+a,则^b=-某-某^-^-a=y-b某ni=1nii=1--某i-某yi-y=--某iyi-n某yi=1nn22i-n某某2-i=1.--注意:回归直线一定经过样本的中心点(某,y),据此性质可以解决有关的计算问题.5.回归分析n某i-某yi-yi=1--r=n,叫做相关系数.某i-某2yi-y2i=1i=1-n-相关系数用来衡量变量某与y之间的线性相关程度;|r|≤1,且|r|越接近于1,相关程度越高,|r|越接近于0,相关程度越低.6.独立性检验假设有两个分类变量某和Y,它们的取值分别为{某1,某2}和{y1,y2},其样本频数列联表(称为2某2列联表)为某1某2总计2y1aca+c2y2bdb+d总计a+bc+da+b+c+da+b+c+dad-bc则K=,a+bc+da+cb+d若K>3.841,则有95%的把握说两个事件有关;若K>6.635,则有99%的把握说两个事件有关;若K<2.706,则没有充分理由认为两个事件有关.7.随机事件的概率随机事件的概率范围:0≤P(A)≤1;必然事件的概率为1,不可能事件的概率为0.8.古典概型①计算一次试验中基本事件的总数n;②求事件A包含的基本事件的个数m;③利用公式P(A)=计算.9.一般地,如果事件A、B互斥,那么事件A+B发生(即A、B中有一个发生)的概率,等于事件A、B分别发生的概率的和,即P(A+B)=P(A)+P(B).-10.对立事件:在每一次试验中,相互对立的事件A和A不会同时发生,但一定有一个发生,因此有222mnP(A)=1-P(A).11.互斥事件与对立事件的关系-对立必互斥,互斥未必对立.12.几何概型一般地,在几何区域D内随机地取一点,记事件“该点落在其内部区域d内”为事件A,则事件A发生的概率P(A)=考点一几何概型例1.【2022课标1,】如图,正方形ABCD内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是d的测度.D的测度141C.2A.【答案】Bπ8πD.4B.【变式探究】(2022·江苏卷)记函数f(某)=6+某-某的定义域为D.在区间[-4,5]上随机取一个数某,则某∈D的概率是________.5【答案】93--252【解析】由6+某-某≥0,解得-2≤某≤3,则D=[-2,3],则所求概率为=.5--49【变式探究】从区间[0,1]随机抽取2n个数某1,某2,,某n,y1,y2,,yn,构成n个数对(某1,y1),(某2,y2),,(某n,yn),其中两数的平方和小于1的数对共有m个,则用随机模拟的方法得到的圆周率π的近似值为()A.4n2m2nB.mC.4mn2mD.n【答案】Cmπ4m4m【解析】由题意知,=,故π=,即圆周率π的近似值为.n4nn考点二古典概型例2.(2022·全国卷Ⅱ)从分别写有1,2,3,4,5的5张卡片中随机抽取1张,放回后再随机抽取1张,则抽得的第一张卡片上的数大于第二张卡片上的数的概率为()A.B.C.D.【答案】D3102511015【2022山东】从分别标有1,2,,9的9张卡片中不放回地随机抽取2次,每次抽取1张.则抽到的2张卡片上的数奇偶性不同的概率是(A)5475(B)(C)(D)18999【答案】C【解析】标有1,2,,9的9张卡片中,标奇数的有5张,标偶数的有4张,所以抽到的2张卡112C5C45,选C.片上的数奇偶性不同的概率是989【变式探究】袋中共有15个除了颜色外完全相同的球,其中有10个白球,5个红球.从袋中任取2个球,所取的2个球中恰有1个白球,1个红球的概率为()A.51011B.C.D.1212121【变式探究】(2022·天津卷)有5支彩笔(除颜色外无差别),颜色分别为红、黄、蓝、绿、紫.从这5支彩笔中任取2支不同颜色的彩笔,则取出的2支彩笔中含有红色彩笔的概率为()A.B.C.D.【答案】C【解析】从5支彩笔中任取2支不同颜色彩笔的取法有红黄、红蓝、红绿、红紫、黄蓝、黄绿、黄紫、蓝绿、蓝紫、绿紫,共10种,其中取出的2支彩笔中含有红色彩笔的取法有红黄、红蓝、红绿、红紫,共424种,所以所求概率P==.105故选C.考点三概率与其他知识的交汇例3、(2022·全国卷Ⅲ)某超市计划按月订购一种酸奶,每天进货量相同,进货成本每瓶4元,售价每瓶6元,未售出的酸奶降价处理,以每瓶2元的价格当天全部处理完.根据往年销售经验,每天需求量与当天最高气温(单位:℃)有关.如果最高气温不低于25,需求量为500瓶;如果最高气温位于区间[20,25),需求量为300瓶;如果最高气温低于20,需求量为200瓶.为了确定六月份的订购计划,统计了前三年六月份各天的最高气温数据,得下面的频数分布表:最高气温天数[10,15)2[15,20)16[20,25)36[25,30)25[30,35)7[35,40)44 5352515以最高气温位于各区间的频率估计最高气温位于该区间的概率.(1)估计六月份这种酸奶一天的需求量不超过300瓶的概率.(2)设六月份一天销售这种酸奶的利润为Y(单位:元).当六月份这种酸奶一天的进货量为450瓶时,写出Y的所有可能值,并估计Y大于零的概率.【变式探究】某汽车美容公司为吸引顾客,推出优惠活动:对首次消费的顾客,按200元/次收费,并注册成为会员,对会员逐次消费给予相应优惠,标准如下表:消费次数收费比例第1次1第2次0.95第3次0.90第4次0.85第5次及以上0.80该公司从注册的会员中,随机抽取了100位进行统计,得到统计数据如下表:消费次数频数第1次60第2次20第3次10第4次5第5次及以上5假设汽车美容一次,公司成本为150元,根据所给数据,解答下列问题:(1)估计该公司一位会员至少消费两次的概率;(2)某会员仅消费两次,求这两次消费中,公司获得的平均利润;(3)该公司要从这100位里至少消费两次的顾客中按消费次数用分层抽样方法抽出8人,再从这8人中抽出2人发放纪念品,求抽出的2人中恰有1人消费两次的概率.40【解析】(1)100位会员中,至少消费两次的会员有40位,所以估计一位会员至少消费两次的概率为100=0.4.(2)该会员第1次消费时,公司获得的利润为200-150=50(元).50+40第2次消费时,公司获得的利润为200某0.95-150=40(元),所以,公司获得的平均利润为=245(元)。
高考概率统计知识点总结高考数学中的概率统计是一个相对独立的模块,但在学生中有着较高的难度和考查比重。
掌握好概率统计知识点对于提升数学成绩以及应对高考是至关重要的。
本文将从概率和统计两个方面,对高考中常见的概率统计知识点进行总结。
一、概率概率是概率统计中最为核心也是较为抽象的概念之一。
在考试中,概率通常通过计算概率值、事件的互斥、独立以及条件概率作为考点出现。
1. 概率值的计算:概率指某件事情发生的可能性大小。
常见的概率计算方式有两种,一种是频率概率,另一种是几何概率。
频率概率指的是事件发生的次数与总次数之间的比值;几何概率指的是事件发生的可能性与总可能性之间的比值。
2. 互斥事件与对立事件:互斥事件是指在同一次试验中,事件A和事件B不能同时发生;对立事件是指在同一次试验中,事件A发生与事件A不发生是互相对立的。
了解互斥事件和对立事件的性质,能够帮助我们更好地理解概率的计算。
3. 独立事件与非独立事件:独立事件是指在试验之间没有相互影响;非独立事件是指在试验之间相互影响。
对于独立事件和非独立事件,学生需要通过条件概率计算来确定它们之间的关系。
二、统计统计是概率统计中的另一个重要部分,它主要研究如何收集、整理、分析和解释大量数据的方法和技巧。
在高考中,统计通常通过抽样方法、频数分布、统计图表以及样本与总体的关系作为考点出现。
1. 抽样方法:抽样是指从总体中选取个别样本以代表总体。
在高考中,常用的抽样方法有随机抽样、分层抽样和整群抽样等。
了解各种抽样方法及其应用场景,可以帮助我们更好地分析总体特征。
2. 频数分布和统计图表:频数分布是指将一组数据按照数值大小进行整理和分类,以便观察数据的分布情况。
统计图表则是通过图像的方式将数据进行展示,包括直方图、折线图和饼图等。
掌握频数分布和统计图表的制作方法,可以更直观地观察数据特征。
3. 样本与总体的关系:样本是指从总体中选取的一部分数据,总体是指具有某种共同特征的个体或事物的集合。
高中数学统计与概率知识点(文)一、众数: 一组数据中出现次数最多的那个数据。
众数与平均数的区别: 众数表示一组数据中出现次数最多的那个数据;平均数是一组数据中表示平均每份的数量。
二、.中位数: 一组数据按大小顺序排列,位于最中间的一个数据(当有偶数个数据时,为最中间两个数据的平均数)三 .众数、中位数及平均数的求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据的个数,当数据为奇数个时,最中间的一个数就是中位数;当数据为偶数个时,最中间两个数的平均数就是中位数。
③求平均数时,就用各数据的总和除以数据的个数,得数就是这组数据的平均数。
四、中位数与众数的特点。
⑴中位数是一组数据中唯一的,可能是这组数据中的数据,也可能不是这组数据中的数据; ⑵求中位数时,先将数据有小到大顺序排列,若这组数据是奇数个,则中间的数据是中位数;若这组数据是偶数个时,则中间的两个数据的平均数是中位数; ⑶中位数的单位与数据的单位相同; ⑷众数考察的是一组数据中出现的频数;⑸众数的大小只与这组数的个别数据有关,它一定是一组数据中的某个数据,其单位与数据的单位相同;(6)众数可能是一个或多个甚至没有;(7)平均数、众数和中位数都是描述一组数据集中趋势的量。
五.平均数、中位数与众数的异同:⑴平均数、众数和中位数都是描述一组数据集中趋势的量; ⑵平均数、众数和中位数都有单位; ⑶平均数反映一组数据的平均水平,与这组数据中的每个数都有关系,所以最为重要,应用最广; ⑷中位数不受个别偏大或偏小数据的影响;⑸众数与各组数据出现的频数有关,不受个别数据的影响,有时是我们最为关心的数据。
六、对于样本数据x 1,x 2,…,x n ,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离如何计算?思考4:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用s 表示.假设样本数据x 1,x 2,…,x n 的平均数为x ,则标准差的计算公式是:七、简单随即抽样的含义一般地,设一个总体有N 个个体, 从中逐个不放回地抽取n 个个体作为样本(n≤N), 如果每次12||||||n x x xx x x n22212()()()n x x x x x x sn抽取时总体内的各个个体被抽到的机会都相等, 则这种抽样方法叫做简单随机抽样.八、根据你的理解,简单随机抽样有哪些主要特点?(1)总体的个体数有限;(2)样本的抽取是逐个进行的,每次只抽取一个个体;(3)抽取的样本不放回,样本中无重复个体;(4)每个个体被抽到的机会都相等,抽样具有公平性.九、抽签法的操作步骤?第一步,将总体中的所有个体编号,并把号码写在形状、大小相同的号签上.第二步,将号签放在一个容器中,并搅拌均匀第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.十一、抽签法有哪些优点和缺点?优点:简单易行,当总体个数不多的时候搅拌均匀很容易,个体有均等的机会被抽中,从而能保证样本的代表性.缺点:当总体个数较多时很难搅拌均匀,产生的样本代表性差的可能性很大.十一、利用随机数表法从含有N个个体的总体中抽取一个容量为n的样本,其抽样步骤如何?第一步,将总体中的所有个体编号.第二步,在随机数表中任选一个数作为起始数.第三步,从选定的数开始依次向右(向左、向上、向下)读,将编号范围内的数取出,编号范围外的数去掉,直到取满n个号码为止,就得到一个容量为n的样本.简单随机抽样一般采用两种方法:抽签法和随机数表法。
高三数学二轮复习重点高三数学第二轮重点复习内容专题一:函数与不等式,以函数为主线,不等式和函数综合题型是考点函数的性质:着重掌握函数的单调性,奇偶性,周期性,对称性。
这些性质通常会综合起来一起考察,并且有时会考察具体函数的这些性质,有时会考察抽象函数的这些性质。
一元二次函数:一元二次函数是贯穿中学阶段的一大函数,初中阶段主要对它的一些基础性质进行了了解,高中阶段更多的是将它与导数进行衔接,根据抛物线的开口方向,与x轴的交点位置,进而讨论与定义域在x轴上的摆放顺序,这样可以判断导数的正负,最终达到求出单调区间的目的,求出极值及最值。
不等式:这一类问题常常出现在恒成立,或存在性问题中,其实质是求函数的最值。
当然关于不等式的解法,均值不等式,这些不等式的基础知识点需掌握,还有一类较难的综合性问题为不等式与数列的结合问题,掌握几种不等式的放缩技巧是非常必要的。
专题二:数列。
以等差等比数列为载体,考察等差等比数列的通项公式,求和公式,通项公式和求和公式的关系,求通项公式的几种常用方法,求前n项和的几种常用方法,这些知识点需要掌握。
专题三:三角函数,平面向量,解三角形。
三角函数是每年必考的知识点,难度较小,选择,填空,解答题中都有涉及,有时候考察三角函数的公式之间的互相转化,进而求单调区间或值域;有时候考察三角函数与解三角形,向量的综合性问题,当然正弦,余弦定理是很好的工具。
向量可以很好得实现数与形的转化,是一个很重要的知识衔接点,它还可以和数学的一大难点解析几何整合。
专题四:立体几何。
立体几何中,三视图是每年必考点,主要出现在选择,填空题中。
大题中的立体几何主要考察建立空间直角坐标系,通过向量这一手段求空间距离,线面角,二面角等。
另外,需要掌握棱锥,棱柱的性质,在棱锥中,着重掌握三棱锥,四棱锥,棱柱中,应该掌握三棱柱,长方体。
空间直线与平面的位置关系应以证明垂直为重点,当然常考察的方法为间接证明。
专题五:解析几何。
高考文科复习专题——概率知识点梳理2. 常用的统计图表①小长方形的面积=组距×频率组距=频率; ②各小长方形的面积之和等于1; ③小长方形的高=频率组距,所有小长方形的高的和为1组距.3. 用样本的数字特征估计总体的数字特征(1)众数、中位数、平均数(2)方差:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2].标准差:s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. 4. 独立性检验对于取值分别是{x 1,x 2}和{y 1,y 2}的分类变量X 和Y ,其样本频数列联表是:则K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d )(其中n =a +b +c +d 为样本容量).1.(2014广东文)为了解1000名学生的学习情况,采用系统抽样的方法,从中抽取容量为40的样本,则分段的间隔为( )A.50B.40C.25 D .202.(2015年广东文)已知样本数据,,,的均值,则样本数据,,,的均值为 .3、(2016年全国I 卷)为美化环境,从红、黄、白、紫4种颜色的花中任选2种花种在一个花坛中,余下的2种花种在另一个花坛中,则红色和紫色的花不在同一花坛的概率是( C )(A )13(B )12(C )23(D )564. 甲、乙两位运动员在5场比赛的得分情况如茎叶图所示,记甲、乙两人的平均得分分别为 x 甲,x 乙,则下列判断正确的是( )A.x 甲>x 乙;甲比乙成绩稳定B.x 甲>x 乙;乙比甲成绩稳定C.x 甲<x 乙;甲比乙成绩稳定D.x 甲<x 乙;乙比甲成绩稳定5.(2017·全国Ⅰ文)如图,正方形ABCD 内的图形来自中国古代的太极图.正方形内切圆中的黑色部分和白色部分关于正方形的中心成中心对称.在正方形内随机取一点,则此点取自黑色部分的概率是( )A .14B .π8C .12D .π46、(2016年全国II卷)某路口人行横道的信号灯为红灯和绿灯交替出现,红灯持续时间为40秒.若一名行人来到该路口遇到红灯,则至少需要等待15秒才出现绿灯的概率为()(A)710(B)58(C)38(D)3107.(2018全国卷Ⅰ,T3)某地区经过一年的新农村建设,农村的经济收入增加了一倍.实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半8、下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据:(I)请画出上表数据的散点图;(II)请根据上表提供的数据,求出y关于x的线性回归方程;(III)已知该厂技术改造前100吨甲产品能耗为90吨标准煤.试根据(II)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?(参考公式及数据: ,)9.(2012·辽宁)电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),10. (15年广东文科)某城市户居民的月平均用电量(单位:度),以,,,,,,分组的频率分布直方图如图.求直方图中的值;0.0125 0.011 0.0095x 0.005求月平均用电量的众数和中位数;在月平均用电量为,,,的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在的用户中应抽取多少户?。
统计概率考点总结【考点一】分层抽样01,交通治理部门为明白机动车驾驶员(简称驾驶员)对某新法规的知晓情形,对甲,乙,丙,丁四个社N ,其中甲社区有驾驶员区做分层抽样调查;假设四个社区驾驶员的总人数为96 人;如在甲,乙,N 丙,丁四个社区抽取驾驶员的人数分别为12,21,25,43,就这四个社区驾驶员的总人数为()A ,101 B,808 C,1212 D ,202102,某个年级有男生560 人,女生420 人,用分层抽样的方法从该年级全体同学中抽取一个容量为280 的样本,就此样本中男生人数为.03,一支田径运动队有男运动员56 人,女运动员42 人;现用分层抽样的方法抽取如干人,如抽取的男运动员有8 人,就抽取的女运动员有人;04,某单位有840 名职工, 现采纳系统抽样方法抽取42 人做问卷调查, 将840 人按1, 2, , 840 随机,编号, 就抽取的42 人中, 编号落入区间[481, 720] 的人数为()A .11B .12 C.13 D .1405,将参与夏令营的600 名同学编号为:001,002,600,采纳系统抽样方法抽取一个容量为50 的样本,且随机抽得的号码为003.这600 名同学分住在三个营区,从001 到300 在第Ⅰ营区,从301 到495 住在第Ⅱ营区,从496 到600 在第Ⅲ营区,三个营区被抽中的人数依次为()A .26, B.25,17,8 C.25,16,9 D .24,17,916, 8【考点二】频率分布直方图(估量各种特点数据)01,从某小区抽取100 户居民进行月用电量调查, 发觉其用电量都在50 到350 度之间, 频率分布直方图所示.x 的值为;(I) 直方图中(II) 在这些用户中, 用电量落在区间100,250 内的户数为.02,下图是样本容量为200 的频率分布直方图;依据样本的频率分布直方图估量,样本数据落在[6 ,10]内的频数为,数据落在(2,10)内的概率约为03,有一个容量为200 的样本,其频率分布直方图如下列图,依据样本的频率分布直方图估量,样本数据落在区间10,12 内的频数为A .18B .36 C.54 D .7204,如上题的频率分布直方图,估量该组试验数据的众数为,中位数为,平均数为【考点三】数据特点01,抽样统计甲,乙两位设计运动员的 5 次训练成果( 单位: 环), 结果如下:运动员甲乙第 1 次8789第 2 次9190第 3 次9091第 4 次8988第 5 次9392就成果较为稳固( 方差较小) 的那位运动员成果的方差为.02,某单位200 名职工的年龄分布情形如图2,现要从中抽取40 名职工作样本,用系统抽样法,将全体职工随机按1-200 编号,并按编号次序平均分为40 组(1-5 号,6-10 号,196-200 号).如第5 组抽出的号码为22,就第8 组抽出的号码应是;如用分层抽样方法,就40 岁以下年龄段应抽取人.03,在某次测量中得到的 A 样本数据如下:82,84,84,86,86,86,88,88,88,88.如 B 样本数据恰好是 A 样本数据都加 2 后所得数据,就A,B 两样本的以下数字特点对应相同的是(A) 众数(B) 平均数(C)中位数(D) 标准差04,总体由编号为,19,2的020 个个体组成;利用下面的随机数表选取 5 个个体,选取方法是从随01,02,机数表第 1 行第5 列和第6 列数字开头由左到右依次选取两个数字,就选出的第 5 个个体编号为A .08B .07 C.02 D.0105,容量为20 的样本数据,分组后的频数如下表就样本数据落在区间[10,40] 的频率为A B C D06,小波一星期的总开支分布图如图1 所示,一星期的食品开支如图2 所示,就小波一星期的鸡蛋开支占总开支的百分比为% % % D. 不能确定07,对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),就该样本的中位数,众数,极差分别是( )A .46,45,56B . 46,45,53C . 47,45,56D .45,47,5308,考察某校各班参与课外书法小组人数, 在全校随机抽取 5 个班级 , 把每个班级参与该小组的人数作为样本数据. 已知样本平均数为 7, 样本方差为 4, 且样本数据相互不相同 , 就样本数据中的最大值为【考点四】求回来直线,相关系数,相关指数 依据一组样本数据 (x i , 01,设某高校的女生体重y (单位: kg )与身高 x (单位: cm )具有线性相关关系, y y i )(i=1 ,2, , n ),用最小二乘法建立的回来方程为 ,就以下结论中不正确选项A.y 与 x 具有正的线性相关关系 x , )y B. 回来直线过样本点的中心( C.如该高校某女生身高增加 1cm ,就其体重约增加D.如该高校某女生身高为170cm ,就可肯定其体重必为x, y 有观测数据理力争( x 1 , y 1 )( i=1,2, 02,对变量 ,10),得散点图如下左图;对变量 u ,v 有观测数据( u 1 , v 1 )( i=1,2, , 10) ,得散点图如下右图 . 由这两个散点图可以判定; ( A )变量 与 正相关, 与 正相关 x y u v ( B )变量 与 正相关, 与 负相关 x y u v ( C )变量 与 负相关, 与 正相关 x y u v ( D )变量 与 负相关, 与 负相关x y u vx 和y 的n 个样本点,直线l 是由这些样本点通过03,设(x1,y1),(x2,y2),,(x n,y n)是变量最小二乘法得到的线性回来直线(如图),以下结论中正确选项x 和y 的相关系数为直线l 的斜率A .x 和y 的相关系数在B .0 到1 之间C.当n 为偶数时,分布在l两侧的样本点的个数肯定相同D .直线l 过点( x, y)x1,y1),(x2,y2),,(x n,y n)(n≥2,x1,x2, ,x n 不全相等)的散点图中,如所04,在一组样本数据(1有样本点(x i,y i)( i=1,2 ,, n) 都在直线y= x+1 上,就这组样本数据的样本相关系数为2(C)12(A )-1 (B)0 (D)105,如表供应了某厂节能降耗技术改造后生产甲产品过程中记录的产量x ( 吨) 与相应的生产能耗y ( 吨标准煤) 的几组对比数据;请依据表格供应的数据,用最小二乘法求出y 关于x 的线性回来方程为:ny xx i y i nx y ^b^,a^b x ,i 1y343546) (n22x i nxi 106,某产品的广告费用x 与销售额广告费用y 的统计数据如下表x(万元) 4235销售额y(万元) 49 26 39 54 依据上表可得回来方程^y=b^x+a中的b^^,据此模型预报广告费用为 6 万元时销售额为()A .万元B.万元C.万元D.万元07,某地2021 年其次季各月平均气温x (℃)与某户用水量y (吨)y 关于月平均如下表,依据表中数据,用最小二乘法求得用水量气温x 的线性回来方程是A . y.B. y.x C. y.x D . y.5x x08,( 2021 年全国 I 18 题)某公司为确定下一年度投入某种产品的宣扬费,需明白年宣扬费 x(单位:千元 )对年销售量 y(单位:t)和年利润 z(单位:千元 )的影响.对近 8 年的年宣扬费 x i 和年销售量 y i (i = 1,2, , 8)数据作了初步处理,得到下面的散点图及一些统计量的值. ( 1)依据散点图判定, y =a + bx 与 y = c + d x 哪一个相宜作为年销售量 y 关于年宣扬费 x 的回来方程类型? (给出判定即 可,不必说明理由 )( 2)依据 (1) 的判定结果及表中数据, 建立 y 关于 x 的回来方程; ( 3)已知这种产品的年利润z 与 x , y 的关系为 z = - x.依据 (2) 的结果回答以下问题:①年宣扬费 x = 49 时,年销售量及年利润的预报值是多少? ②年宣扬费 x 为何值时,年利润的预报值最大?888822( x ix)( w iw)(w iw)( y iy)( x ix)( y i y)x y wi 1i 1i 1i 15631 46981 附: ( 1)在下 表中 w i = x i , w =w i8 i1( 2)对于一组数据 (u 1, v 1), (u 2,v 2), n, (u n , v n ),其回来直线 v = α+ βu 的斜率和截距的最小二乘法 ( u iu)( v i v) ^ ,α= v -β^运算公式分别为u i 1n2(u iu)i 1【考点五】独立性检验01,通过随机询问 110 名性别不同的高校生是否爱好某项运动,得到如下的列联表:男 40 20 60女 20 30 50总计6050 110爱好 不爱好 总计22n c 2ad d k)bc a 110 40 30 20 20由 算得,.22KK a b P(Kc b d60 50 60 500. 050 0. 010 0. 001 3. 8416. 63510. 828k参照附表,得到的正确结论是 A .再犯错误的概率不超过 0.1% 的前提下,认为“爱好该项运动与性别有关” B .再犯错误的概率不超过0.1% 的前提下,认为“爱好该项运动与性别无关”C .有 99%以上的把握认为“爱好该项运动与性别有关”D .有 99%以上的把握认为“爱好该项运动与性别无关”【考点六】古典概型——列举法( 6 选 3, 5 选 3)1 14, 就 n01,从 n 个正整1,2, n 中任意取出两个不同的数 5 的概率为, 如取出的两数之和等于 m , n ( m 7 , n 9 ) 可以任意选取 , 就 m ,n 都取到奇数的概02,现在某类病毒记作X m Y n , 其中正整数 率为 .03,从个位数与十位数之和为奇数的两位数中任取一个,其个位数为0 的概率是4 91 3291 9A.B.C.D.22x y 3的概率是 ( )04,某同学同时掷两颗骰子,得到点数分别为a ,b ,就椭圆 + b = 1 的离心率 e> 2 2a 21 51 1 A .18B . 36C . 6D . 305,一袋中装有 10 个球 , 其中 3 个黑球 , 7 个白球 , 先后两次从袋中各取一球 (不放回 ). 就其次次取出的是黑球的概率是;已知第一次取出的是黑球 ,就其次次取出的仍是黑球的概率是.06,从装有1A.103 个红球,2 个白球的袋中任取 3 个球,就所取的 3 个球中至少有 1 个白球的概率是()339D.10B.10C.507,从长度分别为2,3,4,5 的四条线段中任意取出三条,就以这三条线段为边可以构成三角形的概率是【考点七】几何概型(显性,隐性)1 2,01,小波通过做嬉戏的方式来确定周末活动,他随机的往单位圆内投掷一点,如此点到圆心的距离大于14就周末去看电影;如此点到圆心的距离小于,就去打篮球;否就,在家看书. 就小波周末不在家看书的概率为.a, 就时间“3a 10 ”发生的概率为02,利用运算机产生0~1 之间的匀称随机数03,在长为12cm 的线段AB 上任取一点 C.现作一矩形,令边长分别等于线段AC ,CB 的长,就该矩形面32cm2 的概率为积小于1 6132345(A) (B) (C) (D)1x , 使得x 1 x 2 1 成立的概率为3,304,在区间上随机取一个数3 05,如图,在圆心角为直角的扇形OAB 中,分别以OA,OB 为直径作两个半圆. 在扇形A .OAB 内随机取一点,就此点取自阴影部分的概率是B.C. D .2π121π2π1π1RT BAC 中, 06,在 A, AB = 1 , BC = 2211 2D ,就 ΔABD 的面积比 ΔABC 的面积的( 1)在 BC 上取一点 仍大的概率为 211 2BC 交于点 D ,就 ΔABD 的面积比 ΔABC 的面积的( 2)过 A 作射线与 仍大的概率为 314A ,B ,C ,就 ΔABC 为锐角三角形的概率为 07,在一个圆上任取三点答案:有注明讲的题目为下次上课必讲对象 【考点一】 5(讲) 【考点二】 4(讲) 702. 643. B 【考点三】 1. 22. 37, 203. D4. D5. B6. C7. A8. 10 【考点四】1. D 8( 讲)2. C3. D4. D5.6. B7 .D【考点五】 1. C 20 633 10 2 9【考点六】 1. 82.4. C5.7.13 16 2 3【考点七】1. 4 讲 6 讲7 讲2. 5. A。
考点过关检测(十六)
1.(2019·东北三省联考)树立和践行“绿水青山就是金山银山,坚持人与自然和谐共生”的理念越来越深入人心,已形成了全民自觉参与,造福百姓的良性循环.据此,某网站推出了关于生态文明建设进展情况的调查,调查数据表明,环境治理和保护问题仍是百姓最为关心的热点,参与调查者中关注此问题的约占80%.现从参与关注生态文明建设的人群中随机选出200人,并将这200人按年龄分组:第1组[15,25),第2组[25,35),第3组[35,45),第4组[45,55),第5组[55,65],得到的频率分布直方图如图所示.
(1)求a的值;
(2)求这200人年龄的平均数( 同一组数据用该区间的中点值作代表)和中位数(精确到小数点后一位);
(3)现在要从年龄较小的第1,2组中用分层抽样的方法抽取5人,再从这5人中随机抽取3人进行问卷调查,求第2组恰好抽到2人的概率.
解:(1)由10×(0.010+0.015+a+0.030+0.010)=1,得a=0.035.
(2)平均数为20×0.1+30×0.15+40×0.35+50×0.3+60×0.1=41.5(岁);
设中位数为x,则10×0.010+10×0.015+(x-35)×0.035=0.5,
解得x≈42.1.
(3)200人中第1,2组的人数分别为20,30,从第1,2组中用分层抽样的方法抽取5人,则第1,2组抽取的人数分别为2,3,分别记为a1,a2,b1,b2,b3.
从5人中随机抽取3人,有(a1,a2,b1),(a1,a2,b2),(a1,a2,b3),(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),(b1,b2,b3),共10个基本事件,
其中第2组恰好抽到2人,包含(a1,b1,b2),(a1,b1,b3),(a1,b2,b3),(a2,b1,b2),(a2,b1,b3),(a2,b2,b3),共6个基本事件.
从而第2组恰好抽到2人的概率为6
10=3 5.
2.(2019·吉林三调)“共享单车”的出现,为我们提供了一种新型的交通方式.某机构为了调查人们对此种交通方式的满意度,在交通拥堵不严重的A城市和交通拥堵严重的B 城市分别随机调查了20个用户,得到了一个用户满意度评分的样本,并绘制出茎叶图如图所示.
(1)根据茎叶图,比较两城市满意度评分的平均值的大小及方差的大小(不要求计算出具体值,给出结论即可);
(2)若得分不低于80分,则认为该用户对此种交通方式“认可”,否则认为该用户对此种交通方式“不认可”,请根据样本完成2×2列联表,并据此分析是否有95%的把握认为城市拥堵与认可共享单车有关;
(3)在A,B城市对此种交通方式“认可”的用户中按照分层抽样的方法抽取6人,若在此6人中推荐2人参加“单车维护”志愿活动,求A城市中至少有1人的概率.
附:K2=n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
,其中n=a+b+c+d.
解:(1)由茎叶图可得,A城市评分的平均值小于B城市评分的平均值;A城市评分的方
差大于B 城市评分的方差.
(2)由题意可得2×2列联表如下:
故K 2=
40×(5×10-10×15)2
20×20×15×25
≈2.667<3.841,
所以没有95%的把握认为城市拥堵与认可共享单车有关. (3)由题意得在A 城市抽取
5
5+10
×6=2人,设为x ,y ; 在B 城市抽取10
5+10
×6=4人,设为a ,b ,c ,d .
则从6人中推荐2人的所有基本事件有(x ,y ),(x ,a ),(x ,b ),(x ,c ),(x ,d ),(y ,a ),(y ,b ),(y ,c ),(y ,d ),(a ,b ),(a ,c ),(a ,d ),(b ,c ),(b ,d ),(c ,d ),共15个.
设“A 城市中至少有1人”为事件M ,则事件M 包含的基本事件有(x ,y ),(x ,a ),(x ,b ),(x ,c ),(x ,d ),(y ,a ),(y ,b ),(y ,c ),(y ,d ),共9个.
由古典概型概率计算公式可得P (M )=915=3
5,
故A 城市中至少有1人的概率为3
5
.
3.(2020届高三·深圳调研)某网店经销某商品,为了解该商品的月销量y (单位:千件)与当月售价x (单位:元/件)之间的关系,收集了5组数据进行了初步处理,得到如下表:
(1)统计学中用相关系数r 来衡量两个变量之间线性相关关系的强弱,若|r |∈[0.75,1],则认为相关性很强;若|r |∈[0.3,0.75),则认为相关性一般;若|r |∈[0,0.25],则认为相关性较弱.请计算相关系数r ,并说明y 与x 之间的线性相关关系的强弱(精确到0.01);
(2)求y 关于x 的线性回归方程;
(3)根据(2)中的线性回归方程,估计当售价x 定为多少时,月销售金额最大?(月销售金额=月销售量×当月售价)
附注:参考数据:165≈12.85.
参考公式:相关系数r =∑i =1
n
(x i -x )(y i -y )
∑i =1n
(x i -x )2
∑i =1
n
(y i -y )2
,
线性回归方程y ^=b ^x +a ^中,b ^
=
∑i =1
n
(x i -x )(y i -y )
∑i =1
n
(x i -x )2
,a ^=y -b ^x .
解:(1)由表中数据和附注中的参考数据得, x =7,y =5,
∑i =15
(x i -x
)2=10,∑i =1
5
(y i -y )2=16.5.
∑i =1
5
(x i -x )(y i -y )=-12.5,r ≈
-12.5
10×16.5
≈-0.97.
因为|r |≈|-0.97|∈[0.75,1],
所以说明y 与x 的线性相关关系很强.
(2)由(1)可知b ^
=
∑i =1
n
(x i -x )(y i -y )
∑i =1
n
(x i -x )2
=
-12.5
10
=-1.25, ∴a ^=y -b ^
x =5-(-1.25)×7=13.75, ∴y ^
=-1.25x +13.75.
(3)由题意可知,月销售额的预报值z ^=1 000·y ^·x =-1 250x 2+13 750x (元)或者z ^=y ^
·x =-1.25x 2+13.75x (千元).
则当x =5.5时,z ^
取到最大值,
∴该店主将售价定为5.5元/件时,可使网店的月销售额最大.
4.(2019·河南名校联考)随着智能手机的普及,手机计步软件迅速流行开来,这类软件能自动记载每个人每日健步的步数,从而为科学健身提供一定的帮助.某市工会为了解该市市民每日健步走的情况,从本市市民中随机抽取了2 000名市民(其中不超过40岁的市民恰好有1 000名),利用手机计步软件统计了他们某天健步的步数,并将样本数据分为[3,5),[5,7),[7,9),[9,11),[11,13),[13,15),[15,17),[17,19),[19,21]九组(单位:千步),将抽取
的不超过40岁的市民的样本数据绘制成频率分布直方图如图,将40岁以上的市民的样本数据绘制成频数分布表如下,并利用该样本的频率分布估计总体的概率分布.
(1)现规定,日健步步数不低于13 000步的为“健步达人”,填写下面列联表,并根据列联表判断能否有99.9%的把握认为是不是“健步达人”与年龄有关;
(2)利用样本平均数和中位数估计该市不超过40岁的市民日健步步数(单位:千步)的平均数和中位数;
(3)若日健步步数落在区间(x-2s,x+2s)内,则可认为该市民“运动适量”,其中x,s分别为样本平均数和样本标准差,计算可求得频率分布直方图中数据的标准差s约为3.64.若一市民某天的健步步数为2万步,试判断该市民这天是否“运动适量”.
参考公式:K2=
n(ad-bc)2
(a+b)(c+d)(a+c)(b+d)
,其中n=a+b+c+d.
参考数据:
解:(1)列联表为
则K 2=
2 000×(520×600-480×400)2
920×1 080×1 000×1 000
≈29>10.828,
所以有99.9%的把握认为是不是“健步达人”与年龄有关.
(2)样本平均数为x =4×0.04+6×0.06+8×0.1+10×0.1+12×0.3+14×0.2+16×0.1+18×0.08+20×0.02=12.16.
由前4组的频率之和为0.04+0.06+0.10+0.10=0.30,前5组的频率之和为0.30+0.30=0.6,知样本中位数落在第5组,设样本中位数为t ,则(t -11)×0.15=0.5-0.3,解得t =37
3
,
故可以估计,该市不超过40岁的市民日健步步数的平均数为12.16,中位数为37
3.
(3)因为(x -2s ,x +2s )=(4.88,19.44), 所以可据此判断该市民这天“运动不适量”.。