众数、中位数、平均数与频率分布直方图的关系
- 格式:ppt
- 大小:390.50 KB
- 文档页数:19
2.2.2 用样本的数字特征估计总体的数字特征第一课时 求众数、中位数、平均数【学习目标】1、会求样本的众数、中位数、平均数、; 3、会用样本的数字特征对总体进行估计; 4、会用相关知识解决简单实际问题。
【重难点】重点:求众数、中位数、平均数 难点:知识的简单应用【学习过程】 复习一、众数、中位数、平均数的概念 1、众数:在一组数据中,出现次数最多的数据叫做这组数据的众数.2、中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.3、 平均数: 一般地,如果n 个数12,,,n x x x ,那么()121n x x x x n=+++叫做这n 个数的平均数。
众数、中位数、平均数都是描述一组数据的集中趋势的特征数,只是描述的角度不同,其中以平均数的应用最为广泛. 练习1、求下列各组数据的众数(1)、1 ,2,3,3,3,5,5,8,8,8,9,9 众数为:(2)、1 ,2,3,3,3,5,5,8,8,9,9 众数为:练习2、求下列各组数据的中位数(1)、1 ,2,3,3,3,4,6,8,8,8,9,9 中位数为:(2)、1 ,2,3,3,3,4,8,8,8,9,9 中位数为: 【新课讲解】知识点一、众数、中位数、平均数与频率分布直方图的关系1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。
2、平均数等于频率分布图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。
人员 经理 管理人员 高级技工 工人 学徒 合计 周工资 2200 250 220 200 100 人数 1 6 5 10 1 23 合计22001500110020001006900指出这个问题中周工资的众数、中位数、平均数。
练习1:(新课程导学P27例2)某小区广场上有甲、乙两组市民正在进行晨练,两组市民的年龄如下(单位:岁):甲组:13,13,14,15,15,15,15,16,17,17;乙组:54,3,4,4,5,5,6,6,6,57。
必修第二册第九章 统计知识点总结知识点一:简单随机抽样1. 全面调查和抽样调查2.简单随机抽样的概念放回简单随机抽样不放回简单随机抽样一般地,设一个总体含有N(N 为正整数)个个体,从中逐个抽取n (1≤n<N)个个体作为样本如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做放回简单随机抽样如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本3.抽签法先把总体中的个体编号,然后把所有编号写在外观、质地等无差别的小纸片(也可以是卡片、小球等)上作为号签,并将这些小纸片放在一个不透明的盒里,充分搅拌.最后从盒中不放回地逐个抽取号签,使与号签上的编号对应的个体进入样本,直到抽足样本所需要的个体数.调查方式全面调查(普查)抽样调查定义对每一个调查对象都进行调查的方法,称为全面调查,又称普查根据一定目的,从总体中抽取一部分个体进行调查,并以此为依据对总体的情况作出估计和推断的调查方法,称为 抽样调查相关概念总体:在一个调查中,我们把调查对象的全体称为总体.个体:组成总体的每一个调查对象称为个体样本:把从总体中抽取的那部分个体 称为样本.样本量:样本中包含的个体数称为 样本量4.随机数法(1)定义:先把总体中的个体编号,用随机数工具产生已编号范围内的整数随机数,把产生的随机数作为抽中的编号,使与编号对应的个体进入样本,重复上述过程,直到抽足样本所需要的个体数.(2)产生随机数的方法:(i)用随机试验生成随机数;(ii)用信息技术生成随机数.5.总体均值和样本均值(1)总体均值:一般地,总体中有N个个体,它们的变量值分别为Y1,Y2,…,Y N,则称Y=Y1+Y2+⋯+Y NN =1N∑i=1NY i为总体均值,又称总体平均数.(2)总体均值加权平均数的形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数f i(i=1,2,…,k),则总体均值还可以写成加权平均数的形式Y=1N ∑i=1kf i Y i.(3)如果从总体中抽取一个容量为n的样本,它们的变量值分别为y1,y2,…,y n,则称y=y1+y2+⋯+y nn =1n∑i=1ny i为样本均值,又称样本平均数.6.分层随机抽样的相关概念(1)分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.(2)比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.(3)进行分层随机抽样的相关计算时,常用到的关系①样本容量n总体容量N =该层抽取的个体数该层的个体数;②总体中某两层的个体数之比等于样本中这两层抽取的个体数之比;③样本的平均数和各层的样本平均数的关系:w=mm+n x+nm+ny=MM+Nx+NM+Ny.1.画频率分布直方图的步骤(1)求极差:极差为一组数据中最大值与最小值的差;(2)决定组距与组数:当样本容量不超过100时,常分成5-12组,为方便起见,一般取等长组距,并且组距应力求“取整”;(3)将数据分组;(4)列频率分布表:一般分四列:分组、频数累计、频数、频率.其中频数合计应是样本容量,频率合计是⑥1;.(5)画频率分布直方图:横轴表示分组,纵轴表示频率组距=频率,各小长方形的面积的总和等于1.小长方形的面积=组距×频率组距2.其他统计图表统计图表主要应用扇形图直观描述各部分数据在全部数据中所占的比例条形图和直方图直观描述不同类别或分组数据的频数和频率反映统计对象在不同时间(或其他合适情形)的发展折线图变化情况1.第p百分位数:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3.四分位数:第25百分位数,第50百分位数,第75百分位数,这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数.知识点四:总体集中趋势的估计1.众数、中位数和平均数的定义(1)众数:一组数据中出现次数最多的数.(2)中位数:一组数据按大小顺序排列后,处于中间位置的数.如果这组数据是偶数个,则取中间两个数据的平均数.(3)平均数:一组数据的和除以数据个数所得到的数.2.众数、中位数、平均数与频率分布直方图的关系(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)众数:众数是最高小矩形底边的中点所对应的数据.2.众数、中位数、平均数与频率分布直方图的关系众数众数是最高小长方形底边的中点所对应的数据,表示样本数据的中心值中位数①在频率分布直方图中,中位数左边和右边的直方图面积相等,由此可以估计中位数的值,但是有偏差;②表示样本数据所占频率的等分线平均数①平均数等于每个小长方形的面积乘小长方形底边中点的横坐标之和;②平均数是频率分布直方图的重心,是频率分布直方图的平衡点1.一组数据x1,x2,…,x n的方差和标准差数据x1,x2,…,x n的方差为1n ∑i=1n(x i-x)2=1n∑i=1nx i2-x2,标准差为√1n∑i=1n(x i-x)2.2.总体方差和总体标准差(1)总体方差和标准差:如果总体中所有个体的变量值分别为Y1,Y2,…,Y N,总体的平均数为Y,则称S2= 1N ∑i=1N(Y i-Y)2为总体方差,S=√S2为总体标准差.(2)总体方差的加权形式:如果总体的N个变量值中,不同的值共有k(k≤N)个,不妨记为Y1,Y2,…,Y k,其中Y i出现的频数为f i(i=1,2,…,k),则总体方差为S2= 1N ∑i=1kf i(Y i-Y)2.3.样本方差和样本标准差如果一个样本中个体的变量值分别为y1,y2,…,y n,样本平均数为y,则称s2= 1n ∑i=1n(y i-y)2为样本方差,s=√s2为样本标准差.4.标准差的意义标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.5.分层随机抽样的方差设样本容量为n,平均数为x,其中两层的个体数量分别为n1,n2,两层的平均数分别为x1,x2,方差分别为s12,s22,则这个样本的方差为s2=n1n [s12+(x1-x)2]+n2n[s22+(x2-x)2].必修第二册第十章概率知识点总结知识点一:有限样本空间与随机事件1.随机试验的概念和特点(1)随机试验:我们把对随机现象的实现和对它的观察称为随机试验,简称试验,常用字母E表示.(2)随机试验的特点:(i)试验可以在相同条件下重复进行;(ii)试验的所有可能结果是明确可知的,并且不止一个;(iii)每次试验总是恰好出现这些可能结果中的一个,但事先不能确定出现哪一个结果.2.样本点和样本空间定义字母表示样本点我们把随机试验E的每个可能的基本结果称为样本点用ω表示样本点样本空间全体样本点的集合称为试验E的样本空间用Ω表示样本空间有限样本空间如果一个随机试验有n个可能结果ω1,ω2,…,ωn,则称样本空间Ω={ω1,ω2,…,ωn}为有限样本空间Ω={ω1,ω2,…,ωn}3.事件的类型我们将样本空间Ω的子集称为随机事件,简称事件,并把只包含一个样本点的事件称为基本事件.随机事件一般用大写字母A,B,C,…表示.在每次试验中,当且仅当A中某个样本点出现时,称为事件A发生.Ω作为自身的子集,包含了所有的样本点,在每次试验中总有一个样本点发生,所以Ω总会发生,我们称Ω为必然事件.而空集⌀不包含任何样本点,在每次试验中都不会发生,我们称⌀为不可能事件.必然事件与不可能事件不具有随机性.为了方便统一处理,将必然事件和不可能事件作为随机事件的两个极端情形.这样,每个事件都是样本空间Ω的一个子集.知识点二:事件的关系和运算1.包含关系定义一般地,若事件A 发生,则事件B 一定发生,我们就称事件B 包含事件A(或事件A 包含于事件B)含义 A 发生导致B 发生 符号表示B ⊇A(或A ⊆B)图形表示特殊情形如果事件B 包含事件A,事件A 也包含事件B,即B ⊇A 且A ⊇B,则称事件A 与事件B 相等,记作A=B2.并事件(和事件)定义一般地,事件A 与事件B 至少有一个发生,这样的一个事件中的样本点或者在事件A 中,或者在事件B 中,我们称这个事件为事件A 与事件B 的并事件(或 和事件)含义 A 与B 至少有一个发生符号表示A ∪B(或A+B)图形表示3.交事件(积事件)定义一般地,事件A 与事件B 同时发生,这样的一个事件中的样本点既在事件A中,也在事件B 中,我们称这样的一个事件为事件A 与事件B 的交事件(或积 事件)含义 A 与B 同时发生 符号表示A ∩B(或AB)图形表示4.互斥(互不相容)一般地,如果事件A与事件B不能同时发生,也就是说A∩B是一个不可能定义事件,即A∩B=⌀,则称事件A与事件B互斥(或互不相容)含义A与B不能同时发生符号表示A∩B=⌀图形表示5.互为对立一般地,如果事件A与事件B在任何一次试验中有且仅有一个发生,即A∪B=定义Ω,且A∩B=⌀,那么称事件A与事件B互为对立.事件A的对立事件记为A 含义A与B有且仅有一个发生符号表示A∩B=⌀,且A∪B=Ω图形表示6.清楚随机事件的运算与集合运算的对应关系有助于解决此类问题.符号事件的运算集合的运算A 随机事件集合A A的对立事件A的补集AB 事件A与B的交事件集合A与B的交集A∪B 事件A与B的并事件集合A与B的并集知识点三:古典概型1.古典概型的定义试验具有如下共同特征:(1)有限性:样本空间的样本点只有有限个;(2)等可能性:每个样本点发生的可能性相等.我们将具有以上两个特征的试验称为古典概型试验,其数学模型称为古典概率模型,简称古典概型.2.古典概型的概率计算公式一般地,设试验E是古典概型,样本空间Ω包含n个样本点,事件A包含其中的k个样本点,则定义事件A的概率P(A)= kn =n(A)n(Ω),其中n(A)和n(Ω)分别表示事件A和样本空间Ω包含的样本点个数.知识点四:概率的基本性质1.概率的基本性质性质1 对任意的事件A,都有P(A)≥0.性质2 必然事件的概率为1,不可能事件的概率为0,即P(Ω)=1,P(⌀)=0.性质3 如果事件A与事件B互斥,那么P(A∪B)=P(A)+P(B).性质4 如果事件A与事件B互为对立事件,那么P(B)=1-P(A),P(A)=1-P(B).性质5 如果A⊆B,那么P(A)≤P(B).性质6 设A,B是一个随机试验中的两个事件,我们有P(A∪B)=P(A)+P(B)-P(A∩B).知识点五:事件的相互独立性1.相互独立事件的定义:对任意两个事件A与B,如果P(AB)=P(A)P(B)成立,则称事件A 与事件B相互独立,简称为独立.2.相互独立事件的性质:当事件A,B相互独立时,则事件A与事件B相互独立,事件A与事件B相互独立,事件A与事件B相互独立.【提示】公式P(AB)=P(A)P(B)可以推广到一般情形:如果事件A1,A2,…,A n相互独立,那么这n个事件同时发生的概率等于每个事件发生的概率的积,即P(A1A2·…·A n)=P(A1)P(A2)·…·P(A n).3. 两个事件是否相互独立的判断方法(1)直接法:由事件本身的性质直接判定两个事件发生是否相互影响.(2)公式法:若P(AB)=P(A)P(B),则事件A,B为相互独立事件.4.求相互独立事件同时发生的概率的步骤:①首先确定各事件之间是相互独立的.②求出每个事件的概率,再求积.5.事件间的独立性关系已知两个事件A,B相互独立,它们的概率分别为P(A),P(B),则有事件表示概率A,B同时发生AB P(A)P(B)A,B都不发生A B P(A)P(B)A,B恰有一个发生(A B)∪(A B) P(A)P(B)+P(A)P(B)A,B中至少有一个发生(A B)∪(A B)∪(AB) P(A)P(B)+P(A)P(B)+P(A)P(B)A,B中至多有一个发生(A B)∪(A B)∪(A B) P(A)P(B)+P(A)P(B)+P(A)P(B)。
专题9.2 用样本估计总体知识储备1.数据的最值、平均数、中位数、百分位数、众数4.频数(率)分布直方图5.用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征.特别地,样本平均数(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大.在容许一定误差存在的前提下,可以用样本的数字特征去估计总体的数字特征,这样就能节省人力和物力等.所以,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.6.分层抽样的均值与方差以分两层抽样的情况为例.假设第一层有m个数,分别为x1,x2,…,x m,平均数为x,方差为s2;第二层有n个数,分别为y1,y2,…,y n,平均数为y,方差为t2.则x=m 11i m =∑x i ,s 2=11m i m =∑(x i -x )2,y =11nii y n=∑,t 2=211()nii y y n=-∑.如果记样本均值为a ,样本方差为b 2,则可以算出a=1m n +(1m i =∑x i +1ni =∑y i )=mx ny m n ++, b 2=2222[()][()]m s x a n t y a m n +-++-+=1m n+222()()mn ms nt x y m n ⎡⎤++-⎢⎥+⎣⎦. 7.常用结论1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2.系统抽样一般也称为等距抽样,入样个体的编号相差分段间隔k 的整数倍.3.分层抽样是按比例抽样,每一层入样的个体数为该层的个体数乘抽样比.4.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数. (2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和. 5.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .(2)数据x 1,x 2,…,x n 的方差为s 2.①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2; ②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.能力检测注意事项:本试卷满分100分,考试时间45分钟,试题共16题.答卷前,考生务必用0.5毫米黑色签字笔将自己的姓名、班级等信息填写在试卷规定的位置. 一、单选题1.(2020·河北高二学业考试)为了解全年级1180名学生的数学成绩分布情况,在一次数学调研测试后,某教师随机抽取了80份试卷并对试卷得分(满分:150分)进行了整理,得到如下频率分布表:若同一组数据用该区间的中点值作代表,则此次数学测试全年级平均分的估计值是( ). A .110 B .108. 5C .105D .102. 5【答案】B【解析】由题意可得,此次数学测试全年级平均分的估计值是650.025750.050850.100950.1251050.2501150.200⨯+⨯+⨯+⨯+⨯+⨯ 1250.1001350.0751450.075108. 5+⨯+⨯+⨯=.故选:B.2.(2020·广东广州市·高三月考)某学校鼓励学生参加社区服务,学生甲2019年每月参加社区服务的时长(单位:小时)分别为1x ,2x ,…,12x ,其均值和方差分别为x 和2s ,若2020年甲每月参加社区服务的时长增加1小时,则2020年甲参加社区服务时长的均值和方差分别为( ) A .x ,2s B .1x +,21s +C .x ,21s +D .1x +,2s【答案】D【解析】由题意可知12121()12x x x x =++⋅⋅⋅+,222121221[()()()]12s x x x x x x =-+-+⋅⋅⋅+-, 设2020年甲参加社区服务时长的均值和方差分别为'x ,'2s ,则'1212121211[(1)(1)(1)][()12]11212x x x x x x x x =++++⋅⋅⋅++=++⋅⋅⋅++=+, '222212121[(11)(11)(11)]12x x x x x x s =+--++--+⋅⋅⋅++--22212121[()()()]12x x x x x x =-+-+⋅⋅⋅+-2s =故选:D 3.(2020·湖北十堰市·高二期中)如图所示茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分),已知甲组数据的中位数为17,乙组数据的平均数为17.6,则,x y 的值分别A .58、B .57、C .78、D .7、7【答案】D 【解析】组数据的中位数为17,7x ∴=,乙组数据的平均数为17.4,()191616102917.45y ∴+++++=, 得8087y +=,则7y =,故选:D .4.(2020·湖北高三学业考试)棉花的纤维长度是棉花质量的重要指标.在一批棉花中随机抽测了50根棉花的纤维长度(单位:mm),其频率分布直方图如图所示.根据频率分布直方图,估计事件“棉花的纤维长度大于275mm”的概率为( )A .0.30B .0.48C .0.52D .0.70【答案】C 【解析】“棉花的纤维长度大于275mm”的概率为500.0040500.0064⨯+⨯0.52=.故选:C5.(2020·湖北高三学业考试)为做好精准扶贫工作,需关注贫困户的年收入情况.经统计,某贫困户近5年的年收分别为1a ,2a ,3a ,4a ,5a .下面给出的指标可以用来评估该贫困户年收入的稳定A .1a ,2a ,3a ,4a ,5a 的平均数B .1a ,2a ,3a ,4a ,5a 的标准差C .1a ,2a ,3a ,4a ,5a 的最大值D .1a ,2a ,3a ,4a ,5a 的中位数【答案】B【解析】标准差反映了各数据对平均数的偏离, 反映了一组数据的离散程度,在本题中即稳定程度, 而其他的统计量则不能反映稳定程度,故选:B6.(2020·全国高三专题练习)中国传统文化是中华民族智慧的结晶,是中华民族的历史遗产在现实生活中的展现.为弘扬中华民族传统文化,某校学生会为了解本校高一1000名学生的课余时间参加传统文化活动的情况,随机抽取50名学生进行调查.将数据分组整理后,列表如下:以下四个结论中正确的是( ). A .表中m 的数值为10B .估计该校高一学生参加传统文化活动次数不高于2场的学生约为180人C .估计该校高一学生参加传统文化活动次数不低于4场的学生约为360人D .若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为25 【答案】C【解析】A 选项,由题意可得,8%10%20%26%18%%4%2%1m +++++++=, 则12m =;故A 错;B 选项,由题意可得,样本中该校高一学生参加传统文化活动次数不高于2场的学生占比为8%12%20%+=,则该校高一学生参加传统文化活动次数不高于2场的学生约为100020%200⨯=人;故B 错; C 选项,由题意,样本中该校高一学生参加传统文化活动次数不低于4场的学生占比为18%12%4%2%36%,则该校高一学生参加传统文化活动次数不低于4场的学生约为360人;故C 正确;D 选项,从若采用系统抽样方法进行调查,从该校高一1000名学生中抽取容量为50的样本,则分段间隔为10002050=;故D 错.故选:C. 7.(2020·山东临沂市·高一期末)某工厂12名工人的保底月薪如下表所示,第80百分位是( )A .3050B .2950C .3130D .3325【答案】A【解析】把这组数据从小到大排序:2710,2755,2850,2860,2880,2890,2920,2940,2950,3050,3130,3325, 所以%1280%9.6i n p =⨯=⨯=,所以第80百分位是3050,故选:A.8.(2020·黑龙江大庆市·大庆实验中学高二月考(文))在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) A .甲地:总体平均值为3,中位数为4B .乙地:总体平均值为1,总体方差大于0C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为2 【答案】D【解析】不妨通过构造特殊值法进行判断,对于甲地:0,0,0,0,4,4,4,4,4,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于乙地:0,0,0,0,0,0,0,0,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丙地,0,0,1,1,2 ,2,3,3,3,10符合条件,但其第10天新增疑似病例超过7人,故不符合题意;对于丁地,当总体平均数是2时,若有一个数据超过7,则方差就超过了2,符合题意,因此,一定没有发生大规模群体感染的是丁地.故选:D.二、多选题9.(2020·河北沧州市·高二期中)甲、乙两名射击运动员在某次测试中各射击20次,两人测试成绩的条形图如图所示,则()A.甲运动员测试成绩的中位数等于乙运动员测试成绩的中位数B.甲运动员测试成绩的众数大于乙运动员测试成绩的众数C.甲运动员测试成绩的平均数大于乙运动员测试成绩的平均数D.甲运动员测试成绩的方差小于乙运动员测试成绩的方差【答案】AD【解析】由图可得甲运动员测试成绩中3次7环,8次8环,5次9环,4次10环,所以甲运动员测试成绩的中位数为8,众数为8,平均数为3788594108.520⨯+⨯+⨯+⨯=,方差2222(78.5)3(88.5)8(98.5)5(108.5)4192020 -⨯+-⨯+-⨯+-⨯=;乙运动员测试成绩中4次7环,7次8环,4次9环,5次10环,所以乙运动员测试成绩的中位数为8,众数为8,平均数为4778495108.520⨯+⨯+⨯+⨯=,方差2222(78.5)4(88.5)7(98.5)4(108.5)5232020 -⨯+-⨯+-⨯+-⨯=,故选项A正确,B不正确,C不正确,D正确,故选:AD10.(2020·河北巨鹿中学高二月考)2020年3月6日,在新加坡举行的世界大学生辩论赛中,中国选手以总分230.51分获得冠军.辩论赛有7位评委进行评分,首先这7位评委给出某对选手的原始分数,评定该队选手的成绩时从7个原始成绩中去掉一个最高分、一个最低分,得到5个有效评分,则5个有效评分与7个原始评分相比,可能变化的数字特征是( ) A .中位数 B .平均数C .方差D .极差【答案】BCD【解析】因为5个有效评分是7个原始评分中去掉一个最高分、一个最低分, 所以中位数不变,平均数、方差、极差可能发生变化, 所以可能变化的数字特征是平均数、方差、极差.故选:BCD.11.(2020·湖南省汨罗市第二中学高三开学考试)气象意义上从春季入夏季的标志为:“连续5天的日平均温度均不低于22℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(记录数据都是正整数):①甲地:5个数据的中位数为24,众数为22; ②乙地:5个数据的中位数为27,总体均值为24;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8. 则肯定进入夏季的地区有( ) A .①②③ B .②C .③D .①【答案】CD【解析】由统计知识,①甲地:5个数据的中位数为24,众数为22,5个数据中2个是22,有2个大于24,一个是24,可知①符合题意;而②乙地:5个数据的中位数为27,总体均值为24,有可能某一天的气温低于22℃,所以不符合题意;③丙地:5个数据中有一个数据是32,总体均值为26,总体方差为10.8.若有某一天的气温低于22℃,则总体方差就大于10.8,所以满足题意,故选:CD. 12.(2020·南京航空航天大学附属高级中学高二开学考试)已知一组数据1x ,2x ,3x ,4x ,5x 的平均数和方差均为2,则下列叙述正确的有( ) A .11x +,21x +,31x +,41x +,51x +的平均数为3 B .11x +,21x +,31x +,41x +,51x +的方差为3 C .12x ,22x ,32x ,42x ,52x 的方差为4D .122x +,222x +,322x +,422x +,522x +的方差为8 【答案】AD【解析】对,A B 选项,将每个数据在原基础上加1,故平均数加1,但是方差保持不变,故其平均数是3,方差是2;故A 正确;B 错误;对C ,将每个数据乘以2,故其方差变为原来的4倍,即为8,故C 错误; 对D ,将每个数据乘以2再加2,故其方差也变为原来的4倍,即为8,故D 正确. 故选:AD . 三、填空题13.(2020·贵溪市实验中学高三月考)甲乙两名链球运动员在比赛中各投掷5次,成绩如表(单位:米)22S S 甲乙、分别表示甲、乙两人比赛成绩的方差,则22S S 甲乙、的大小关系是_____________.(用<、=、>连接)【答案】22S S <甲乙【解析】7880778184805x 甲,()()()()()22222217880808077808180848065S 甲⎡⎤=-+-+-+-+-=⎣⎦,7680858277805x 乙,()()()()()22222217680808085808280778010.85S 乙⎡⎤=-+-+-+-+-=⎣⎦,则22S S <甲乙,故答案为:22S S <甲乙.14.(2020·西城区·北京铁路二中高三期中)我国新冠肺炎疫情进入常态化,各地有序推进复工复产,下面是某地连续11天复工复产指数折线图,给出下列四个结论:①第3天至第11天复工复产指数均超过80%;②这11天期间,复产指数增量大于复工指数的增量;③第9天至第11天复产指数增量大于复工指数的增量;④第1天至第3天复工指数的方差大于第2天至第4天复工指数的方差.其中所有正确结论的序号是____________________.【答案】①①【解析】由图像可得,第3天至第11天复工复产指数均超过80%,故①正确;由图像可得,第1天复产指数与复工指数的差大于第11天复产指数与复工指数的差,所以这11天期间,复产指数增量小于复工指数的增量,故②错误;由图像可得,第9天至第11天复产指数增量大于复工指数的增量;故③正确;由图像可得,第1天至第3天复工指数波动较小,第2天至第4天复工指数波动较大,所以第1天至第3天复工指数的方差小于第2天至第4天复工指数的方差,故④错误.故答案为:①①15.(2020·北京高一期末)某班数学兴趣小组组织了线上“统计”全章知识的学习心得交流:甲同学说:“在频率分布直方图中,各小长方形的面积的总和小于1”;乙同学说:“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”;丙同学说:“扇形图主要用于直观描述各类数据占总数的比例”;丁同学说:“标准差越大,数据的离散程度越小”.以上四人中,观点正确的同学是______.【答案】乙丙【解析】在频率分布直方图中,各小长方形的面积的总和等于1,故甲的观点错误;“简单随机抽样因为抽样的随机性,可能会岀现比较‘极端’的样本,相对而言,分层随机抽样的样本平均数波动幅度更均匀”,故乙的观点正确,“扇形图主要用于直观描述各类数据占总数的比例”,故丙的观点正确;“标准差越大,数据的离散程度越大”,故丁的观点错误.故答案为:乙丙.四、双空题16.(2020·滁州市第二中学高二月考)某高校在2013年的自主招生考试成绩中随机抽取50名学生的笔试成绩,绘制成频率分布直方图如图所示,由图中数据可知a=________;若要从成绩(单位:分)在[85,90),[90,95),[95,100]三组内的学生中,用分层抽样的方法选取12人参加面试,则成绩(单位:分)在[95,100]内的学生中,学生甲被选取的概率为________.【答案】0.04 0.4【解析】由频率分布直方图知,(0.0160.0640.060.02)51a++++⨯=,所以0.04a=.第3组的人数为0.06055015⨯⨯=,第4组的人数为0.04055010⨯⨯=,第5组的人数为0.0205505⨯⨯=,因为第3、4、5组共抽30名学生,所以利用分层抽样在30名学生中抽取12名学生.每组抽取的人数分别为:第3组:15126 30⨯=,第4组:10124 30⨯=第5组:512230⨯=,所以第3、4、5组分别抽取6人、4人、2人.则成绩在[95,100]内的5个学生中抽2个,学生甲被选取的概率为0.4故答案为:0.04;0.4。