高考数学一轮专题精讲19:用样本估计总体及线性相关关系
- 格式:doc
- 大小:491.50 KB
- 文档页数:15
高考一轮复习热点难点精讲精析:10.2用样本估计总体与变量间的相关关系一、用样本估计总体(一)频率分布直方图在总体估计中的应用※相关链接※频率分布直方图反映样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.(4)众数为最高矩形中点的横坐标.(5)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.※例题解析※〖例〗为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图,图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学生全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.思路解析:利用面积求得每组的频率→求样本容量→求频率和→求达标率→分析中位数.解答:(1)由已知可设每组的频率为2x,4x,17x,15x,9x,3x.则2x+4x+17x+15x+9x+3x=1,解得x=0.02.则第二小组的频率为0.02×4=0.08,样本容量为12÷0.08=150.(2)次数在110次以上(含110次)的频率和为17×0.02+15×0.02+9×0.02+3×0.02=0.88,则高一学生的达标率为0.88×100%=88%.(3)在这次测试中,学生跳绳次数的中位数落在第四组.因为中位数为平分频率分布直方图的面积且垂直于横轴的直线与横轴交点的横坐标.注:利用样本的频率分布可近似地估计总体的分布,要比较准确地反映出总体分布的情况,必须准确地作出频率分布表和频率分布直方图,充分利用所给的数据正确地作出估计.(二)用样本的分布估计总体※相关链接※茎叶图刻画数据的优点(1)所有的数据信息都可以从茎叶图中得到.(2)茎叶图便于记录和表示,且能够展示数据的分布情况.注:当数据是两位有效数字时,用茎叶图显得容易、方便.而当样本数据较大和较多时,用茎叶图表示,就显得不太方便.※例题解析※〖例〗在某电脑杂志的一篇目文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17.在某报纸的一篇文章中,每个句子中所含的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)将这两组数据用茎叶图表示;(2)将这两组数据进行比较分析,得到什么结论?思路解析:(1)将十位数字作为茎,个位数字作为叶,逐一统计;(2)根据茎叶图分析两组数据,得到结论.解答:(1)如图:(2)电脑杂志上每个句子的字数集中在10~30之间,中位数为22.5;而报纸上每个句子的字数集中在10~40之间,中位数为27.5.可以看出电脑杂志上每个句子的平均字数比报纸上每个句子的平均字数要少.说明电脑杂志作为读物须通俗易懂、简明.(三)用样本的数字特征估计总体的数字特征〖例〗甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.思路解析:(1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解答:(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.2222222222221013121416==1351314121214==1351=[(1013)(1313)(1213)(1413)(1613)]451[(1313)(1413)(1213)(1213)(1413)]0.85x x s s ++++++++-+-+-+-+-==-+-+-+-+-=甲乙甲乙,(2)由2s 甲>2s 乙可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.注:(1)运用方差解决问题时,注意到方差越大,波动越大,越不稳定;方差越小,波动越小,越稳定.(2)平均数与方差都是重要的数字特征,是对总体的一种简单的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(3)平均数、方差的公式推广①若数据123,,,,n x x x x 的平均数为x ,那么12,,,n mx a mx a mx a +++的平均数是mx a +. ②数据123,,,,n x x x x 的方差为2s . a.22222111[()];n s x x x nx n=+++- b.数据12,,,n x a x a x a +++的方差也为2s ; c.数据12,,,n ax ax ax 的方差为22a s .二、变量间的相关关系(一)利用散点图判断两个变量的相关关系※相关链接※1.散点图在散点图中,如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系,即变量之间具有函数关系.如果所有的样本点都落在某一函数的曲线附近,变量之间就有相关关系.如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系.注:函数关系是一种理想的关系模型,而相关关系是一种更为一般的情况.2.正相关、负相关从散点图可知,即一个变量的值由小变大时,另一个变量的值也由小变大,这种相关称为正相关.如年龄的值由小变大时,体内脂肪含量也在由小变大.反之,如果一个变量的值由小变大时,另一个变量的值由大变小,这种相关称为负相关.※例题解析※〖例〗在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系。
高三新数学第一轮复习第十九讲—用样本估计总体及线性相关关系一.知识整合:1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
2.频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图: 具体做法如下:(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图。
注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图。
总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:bx a y+=ˆ。
其中2121121)())((xn x yx n yx x x y y x xb n i i ni ii ni i ni i i--=---=∑∑∑∑====,x b y a -=。
普通高中课程标准实验教科书—数学 [人教版]高三新数学第一轮复习教案(讲座19)—用样本估计总体及线性相关关系一.课标要求:1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识。
2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程。
二.命题走向“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布。
预测2007年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.要点精讲1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni i x x n S 叫做这n 个数据方差;同时=s)(11∑=-ni i x x n 叫做这n 个数据的标准差。
高一数学用样本估计总体知识点在高一数学学习的过程中,我们接触到了许多知识点,这些知识点构成了数学的基础。
然而,我们是否真正掌握了这些知识点呢?为了回答这个问题,我们可以使用样本估计来推断我们对整个总体知识点的掌握情况。
一、样本的选择在进行样本估计之前,首先需要选择一个合适的样本。
样本的选择应当具备代表性,即能够准确地反映整个总体的特征。
例如,我们可以从不同班级的学生中随机选择一部分作为样本,确保在样本中包含了不同水平的学生。
这样才能保证我们的样本具有代表性。
二、样本量的确定确定样本量的大小是样本估计中的一个重要问题。
样本量过小会导致估计结果不准确,而样本量过大则会浪费时间和资源。
在数学知识点的估计中,我们可以根据样本容量公式来确定样本量的大小。
样本容量公式可以根据总体大小、置信度和误差容忍度来计算,从而得到一个适当的样本量。
三、样本估计的方法在样本量确定之后,我们可以使用不同的样本估计方法来推断总体知识点。
其中常用的方法有点估计和区间估计。
1. 点估计点估计是使用样本数据来估计总体参数的一种方法。
例如,我们可以通过统计样本中掌握某个知识点的比例,来估计整个总体中的掌握情况。
在进行点估计时,需要考虑样本的选取和数据的处理方法,以确保估计结果的准确性。
2. 区间估计区间估计是对总体参数进行估计时使用的方法,它给出了一个估计值的范围。
在数学知识点的估计中,我们可以通过计算置信区间来推断总体知识点的范围。
置信区间是在一定置信水平下,总体参数真值落在估计区间内的概率。
通过选择合适的置信水平和计算方法,我们可以得到一个准确的估计范围。
四、样本估计的应用样本估计的结果可以应用于多个方面。
首先,通过样本估计,我们可以评估学生对数学知识点的整体掌握情况,从而指导教学工作。
其次,样本估计还可以用于制定教学计划和改进教学方法。
通过分析样本估计结果,我们可以找出学生对某些知识点普遍存在的困难,从而有针对性地进行教学。
此外,样本估计还可以用于研究各个学科的发展趋势和差异性,为教育政策提供依据。
高考数学一轮复习考点知识专题讲解用样本估计总体考点要求1.会用统计图表对总体进行估计.2.能用数字特征估计总体集中趋势和总体离散程度.知识梳理1.平均数、中位数和众数(1)平均数:x=1n(x1+x 2+…+x n).(2)中位数:将一组数据按从小到大或从大到小的顺序排列,处在最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时).(3)众数:一组数据中出现次数最多的数据(即频数最大值所对应的样本数据).2.方差和标准差(1)方差:s2=1n i=1n(x i-x)2或1n∑i=1nx2i-x2.(2)标准差:s=1n i=1n(x i-x)2.常用结论巧用三个有关的结论(1)若x1,x2,…,x n的平均数为1,那么mx1+a,mx2+a,…,mx n+a的平均数为m +a ;(2)数据x 1,x 2,…,x n 与数据x 1′=x 1+a ,x 2′=x 2+a ,…,x n ′=x n +a 的方差相等,即数据经过平移后方差不变;(3)若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2. 思考辨析判断下列结论是否正确(请在括号中打“√”或“×”) (1)对一组数据来说,平均数和中位数总是非常接近.(×) (2)方差与标准差具有相同的单位.(×)(3)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.(√)(4)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.(√) 教材改编题1.给出一组数据:1,3,3,5,5,5,下列说法不正确的是() A .这组数据的极差为4 B .这组数据的平均数为3 C .这组数据的中位数为4 D .这组数据的众数为5 答案B解析这组数据的极差为5-1=4,A 正确;平均数为1+3×2+5×36=113,B 错误;中位数为3+52=4,C 正确;众数为5,D 正确.2.下列说法正确的是()A.众数可以准确地反映出总体的情况B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越小答案C解析对于A,众数体现了样本数据的最大集中点,但对其他数据信息的忽略使得无法客观反映总体特征,所以A错误;对于B,一组数的平均数不可能大于这组数据中的每一个数据,所以B错误;对于C,平均数、众数与中位数从不同的角度描述了一组数据的集中趋势,所以C 正确;对于D,方差可以用来衡量一组数据波动的大小,方差越小,数据波动越小,方差越大,数据波动越大,所以D错误.3.设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n 的方差为()A.0.01B.0.1C.1D.10答案C解析∵样本数据x1,x2,…,x n的方差为0.01,根据任何一组数据同时扩大几倍,方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为100×0.01=1.题型一样本的数字特征例1(1)在一次歌咏比赛中,七位裁判为一选手打出的分数如下:90,89,90,95,93,94,93.去掉一个最高分和一个最低分后,所剩数据的平均数与方差分别为()A.92,2.8 B.92,2 C.93,2 D.93,2.8答案A解析由题意得所剩数据为90,90,93,94,93.所以平均数x=90+90+93+94+935=92.方差s2=15[(90-92)2+(90-92)2+(93-92)2+(93-92)2+(94-92)2]=2.8.(2)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x,方差为s2,则()A.x=4,s2<2B.x=4,s2=2C.x>4,s2<2D.x>4,s2>2 答案A解析设7个数为x1,x2,x3,x4,x5,x6,x7,则x1+x2+x3+x4+x5+x6+x77=4,(x1-4)2+(x2-4)2+(x3-4)2+(x4-4)2+(x5-4)2+(x6-4)2+(x7-4)27=2,所以x1+x2+x3+x4+x5+x6+x7=28,(x1-4)2+(x2-4)2+(x3-4)2+(x4-4)2+(x5-4)2+(x6-4)2+(x7-4)2=14,则这8个数的平均数为x=18(x1+x2+x3+x4+x5+x6+x7+4)=18×(28+4)=4,方差为s2=18×[(x1-4)2+(x2-4)2+(x3-4)2+(x4-4)2+(x5-4)2+(x6-4)2+(x7-4)2+(4-4)2]=18×(14+0)=74<2.教师备选某高校分配给某中学一个保送名额,该中学进行校内举荐评选,评选条件除了要求该生获得该校“三好学生”称号,还要求学生在近期连续3次大型考试中,每次考试的名次都在全校前5名(每次考试无并列名次).现有甲、乙、丙、丁四位同学都获得了“三好学生”称号,四位同学在近期连续3次大型考试名次的数据分别为甲同学:平均数为3,众数为2;乙同学:中位数为3,众数为3;丙同学:众数为3,方差小于3;丁同学:平均数为3,方差小于3.则一定符合推荐要求的同学有()A.甲和乙 B.乙和丁 C.丙和丁 D.甲和丁答案D解析对于甲同学,平均数为3,众数为2,则3次考试的成绩的名次为2,2,5,满足要求;对于乙同学,中位数为3,众数为3,可举反例:3,3,6,不满足要求;对于丙同学,众数为3,方差小于3,可举特例:3,3,6,则平均数为4,方差s2=13×[2×(3-4)2+(6-4)2]=2<3,不满足要求;对于丁同学,平均数为3,方差小于3,设丁同学3次考试的名次分别为x1,x2,若x1,x2,x3中至少有一个大于等于6,则方差s2=13[(x1-3)2+(x2-3)2+(x3-3)2]>3,与已知条件矛盾,所以x1,x2,x3均不大于5,满足要求.思维升华平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势,方差和标准差描述其离散程度.跟踪训练1(1)从某小学随机抽取100名同学,将他们的身高(单位:厘米)分布情况汇总如下,由此表估计这100名小学生身高的中位数为(结果保留4位有效数字)() A.119.3 B.119.7 C.123.3 D.126.7答案C解析由题意知身高在(100,110],(110,120],(120,130]内的频率依次为0.05,0.35,0.3,前两组频率和为0.4,组距为10,设中位数为x,则(x-120)×0.3 10=0.1,解得x≈123.3.(2)(2021·新高考全国Ⅰ改编)有一组样本数据x1,x2,…,x n,由这组数据得到新样本数据y1,y2,…,y n,其中y i=x i+c(i=1,2,…,n),c为非零常数,则A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差不同答案C解析设样本数据x1,x2,…,x n的平均数、中位数、标准差、极差分别为x,m,σ,t,依题意得,新样本数据y,y2,…,y n的平均数、中位数、标准差、极差1分别为x+c,m+c,σ,t,因为c≠0,所以C正确,D不正确.题型二总体集中趋势的估计例2棉花是我国纺织工业重要的原料.新疆作为我国最大的产棉区,对国家棉花产业发展、确保棉粮安全以及促进新疆农民增收、实现乡村振兴战略都具有重要意义.准确掌握棉花质量现状、动态,可以促进棉花产业健康和稳定的发展.在新疆某地收购的一批棉花中随机抽测了100根棉花的纤维长度(单位:mm),得到样本的频数分布表如下:[250,300) 40 0.40 [300,350]120.12(1)在图中作出样本的频率分布直方图;(2)根据(1)中作出的频率分布直方图求这一棉花样本的众数、中位数与平均数,并对这批棉花的众数、中位数和平均数进行估计. 解(1)样本的频率分布直方图如图所示.(2)由样本的频率分布直方图, 得众数为250+3002=275(mm);设中位数为x ,(x -250)×0.008=50%-48%, 解得x =252.5,即中位数为252.5mm ;设平均数为x,则x=25×0.04+75×0.08+125×0.1+175×0.1+225×0.16+275×0.4+325×0.12=222(mm),故平均数为222mm.由样本的这些数据,可得购进的这批棉花的众数、中位数和平均数分别约为275mm、252.5mm和222mm.教师备选某城市在创建文明城市的活动中,为了解居民对“创建文明城市”的满意程度,组织居民给活动打分(分数为整数,满分100分),从中随机抽取一个容量为100的样本,发现数据均在[40,100]内.现将这些分数分成6组并画出样本的频率分布直方图,但不小心污损了部分图形,如图所示.观察图形,则下列说法不正确的是()A.频率分布直方图中第三组的频数为10B.根据频率分布直方图估计样本的众数为75分C.根据频率分布直方图估计样本的中位数为75分D.根据频率分布直方图估计样本的平均数为75分答案D解析分数在[60,70)内的频率为1-10×(0.005+0.020+0.030+0.025+0.010)=0.10,所以第三组的频数为100×0.10=10,故A正确;因为众数的估计值是频率分布直方图中最高矩形底边的中点的横坐标,从图中可看出众数的估计值为75分,故B正确;因为(0.005+0.020+0.010)×10=0.35<0.5,(0.005+0.020+0.010+0.030)×10=0.65>0.5,所以中位数位于[70,80)内,设中位数为x,则0.35+0.03(x-70)=0.5,解得x=75,所以中位数的估计值为75分,故C正确;样本平均数的估计值为45×(10×0.005)+55×(10×0.020)+65×(10×0.010)+75×(10×0.030)+85×(10×0.025)+95×(10×0.010)=73(分),故D错误.思维升华频率分布直方图的数字特征(1)众数:最高矩形的底边中点的横坐标.(2)中位数:中位数左边和右边的矩形的面积和应该相等.(3)平均数:平均数在频率分布直方图中等于各组区间的中点值与对应频率之积的和.跟踪训练2首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率分布直方图.(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);(2)估计该校学生联考数学成绩的众数、平均数.解(1)由频率分布直方图的性质,可得(0.004+a+0.013+0.014+0.016)×20=1,解得a=0.003.所以及格率为(0.016+0.014+0.003)×20=0.66=66%.(2)由图可得,众数估计值为100分.平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).题型三总体离散程度的估计例3(12分)(2021·全国乙卷)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7 新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为s21和s22.(1)求x,y,s21,s22;[切入点:方差的公式](2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果y-x≥2s21+s2210,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).[关键点:显著提高的理解]教师备选从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95)[95,105)[105,115)[115,125]频数62638228(1)根据上表补全如图所示的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定?解(1)补全后的频率分布直方图如图所示.(2)质量指标值的样本平均数为x=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+02×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数约为100,方差约为104.(3)质量指标值不低于95的产品所占比例约为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品的80%”的规定.思维升华总体离散程度的估计标准差(方差)反映了数据的离散与集中、波动与稳定的程度.标准差(方差)越大,数据的离散程度越大;标准差(方差)越小,数据的离散程度越小.跟踪训练3(2022·蚌埠质检)某校计划在秋季运动会期间开展“运动与健康”知识大赛,为此某班开展了10次模拟测试,以此选拔选手代表班级参赛,下表为甲、乙两名学生的历次模拟测试成绩.甲、乙两名学生测试成绩的平均数分别记作x,y,方差分别记作s21,s22.(1)求x,y,s21,s22;(2)以这10次模拟测试成绩及(1)中的结果为参考,请你从甲、乙两名学生中选出一人代表班级参加比赛,并说明你作出选择的理由.解(1)x =110(98+94+97+97+95+93+93+95+93+95)=95, y =110(92+94+93+94+95+94+96+97+97+98)=95, s 21=110[32+(-1)2+22+22+0+(-2)2+(-2)2+0+(-2)2+0]=3, s 22=110[(-3)2+(-1)2+(-2)2+(-1)2+0+(-1)2+12+22+22+32]=3.4. (2)答案一:由(1)可知,x =y ,s 21<s 22,甲、乙两人平均分相同,但甲发挥更稳定,所以可以派甲同学代表班级参赛. 答案二:由(1)可知,x =y ,s 21<s 22,甲、乙两人平均分相同,两人成绩的方差差距不大,但从10次测试成绩的增减趋势可以发现,甲的成绩总体呈下降趋势,乙的成绩总体呈上升趋势,说明乙的状态越来越好,所以可以派乙同学代表班级参赛.课时精练1.某机构调査了10种食品的卡路里含量,结果如下:107,135,138,140,146,175,179,182,191,195.则这组数据的中位数是() A .160.5B .146C .175D .135 答案A解析中位数为146+1752=160.5.2.给定一组数据5,5,4,3,3,3,2,2,2,1,则这组数据()A .众数为2B .平均数为2.5C .方差为1.6D .标准差为4 答案C解析由题中数据可得,众数为2和3, 故A 错误;平均数为x =5+5+…+2+110=3,故B 错误;方差s 2=(5-3)2+(5-3)2+…+(2-3)2+(1-3)210=1.6,标准差为 1.6≠4,故C 正确,D 错误.3.若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则4x 1-3,4x 2-3,…,4x n -3的平均数和标准差分别为() A.x ,s B .4x -3,sC .4x -3,4sD .4x -3,16s 2-24s +9 答案C解析因为x =1n(x 1+x 2+…+x n ),s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],所以4x 1-3,4x 2-3,…,4x n -3的平均数为x ′=1n[(4x 1-3)+(4x 2-3)+…+(4x n -3)]=1n[4(x1+x2+…+x n)-3n]=4x-3,标准差为1n[(4x1-3-4x+3)2+(4x2-3-4x+3)2+…+(4x n-3-4x+3)2]=41n[(x1-x)2+(x2-x)2+…+(x n-x)2]=4s2=4s.4.某市为推进垃圾分类工作的实施,开展了“垃圾分类进小区”的评比活动.现对该市甲、乙两个小区进行评比,从中各随机选出20户家庭进行评比打分,每户成绩满分为100分,评分后得到如下茎叶图.通过茎叶图比较甲、乙两个小区成绩的平均数及方差大小()A.x甲<x乙,s2甲<s2乙B.x甲>x乙,s2甲<s2乙C.x甲<x乙,s2甲>s2乙D.x甲>x乙,s2甲>s2乙答案C解析由茎叶图知,乙小区成绩低的户数少于甲小区,且成绩大多高于甲小区,所以乙小区成绩的平均数大于甲小区.因为乙小区成绩分布比较集中,所以乙小区成绩的方差比甲小区小.5.某大学共有12000名学生,为了了解学生课外图书阅读量情况,该校随机地从全校学生中抽取1000名,统计他们每年阅读的书籍数量,由此来估计全体学生当年的阅读书籍数量的情况,下列估计中正确的是(注:同一组数据用该组区间的中点值作为代表)()A.中位数为6B.众数为10C.平均数为6.88D.该校读书不低于8本的人数约为3600答案C解析由图知,中位数x在[4,8)内,所以0.06×4+0.1×(x-4)=0.5,解得x=6.6,A错误;由图知,众数在[4,8)内,故众数为6,B错误;平均数为4×(2×0.06+6×0.1+10×0.07+14×0.015+18×0.005)=6.88,C 正确;由图知,该校读书不低于8本的频率之和为1-0.16×4=0.36,所以该校读书不低于8本的人数约为0.36×12000=4320,D错误.6.(2022·深圳模拟)若甲组样本数据x1,x2,…,x n(数据各不相同)的平均数为2,方差为4,乙组样本数据3x1+a,3x2+a,…,3x n+a的平均数为4,则下列说法不正确的是()A.a的值为-2B.乙组样本数据的方差为36C.两组样本数据的样本中位数一定相同D.两组样本数据的样本极差不同答案C解析由题意可知,3×2+a=4,故a=-2,故A正确;乙组样本数据方差为9×4=36,故B正确;设甲组样本数据的中位数为x i,则乙组样本数据的中位数为3x i-2,所以两组样本数据的样本中位数不一定相同,故C错误;甲组数据的极差为x max-x min,则乙组数据的极差为(3x max-2)-(3x min-2)=3(x max-x min),所以两组样本数据的样本极差不同,故D正确.7.2021年高考某题的第(1)问的得分情况如下:其中得分的众数是________.答案0解析众数是指一组数据中出现次数最多的数据,根据所给表格知,百分率最高的是0.8.已知数据x1,x2,…,x9的方差为5,则数据3x1+1,3x2+1,…,3x9+1的方差为________.答案45解析原数据的方差为5,则线性变换后的数据的方差为32×5=45.9.自中国进入工业化进程以来,个人的文化水平往往影响或在某种程度上决定了个人的薪酬高低,文化水平较高的人往往收入较高.将个人的文化水平用数字表示,记“没有接受过系统学习或自学的成年人”为最低分25分,“顶级尖端人才”为最高分95分.为了分析A市居民的受教育程度,从A市居民中随机抽取1000人的文化水平数据X,将样本分成小学[25,35),初中[35,45),高中[45,55),专科[55,65),本科[65,75),硕士[75,85),博士[85,95]七组,整理后得到如图所示的频率分布直方图.(1)求样本数据的众数和中位数(保留一位小数);(2)请估计该市居民的平均文化水平.(同组中的每个数据用该组区间的中点值代替)解(1)样本数据的众数为65+752=70.0.X∈[25,65)的频率为0.05+0.05+0.15+0.20=0.45<0.50,X∈[25,75)的频率为0.05+0.05+0.15+0.20+0.30=0.75>0.50. 所以中位数在区间[65,75)上,中位数为65+10×0.50-0.450.30=65+53≈66.7.(2)平均文化水平X=30×0.05+40×0.05+50×0.15+60×0.20+70×0.30+80×0.20+90×0.05=64.5.10.某家水果店的店长为了解本店苹果的日销售情况,记录了近期连续120天苹果的日销售量(单位:kg),并绘制频率分布直方图如图.(1)请根据频率分布直方图估计该水果店苹果日销售量的众数、中位数和平均数;(同一组中的数据以这组数据所在区间中点的值作代表)(2)一次进货太多,水果会变得不新鲜;进货太少,又不能满足顾客的需求.店长希望每天的苹果尽量新鲜,又能90%地满足顾客的需求(在10天中,大约有9天可以满足顾客的需求).请问每天应该进多少千克苹果?解(1)由题图可知,区间[80,90)的频率最大,所以众数为85,中位数设为x,则0.025+0.1+(x-80)×0.04=0.5,可得x=89.375.平均数为x=(65×0.0025+75×0.01+85×0.04+95×0.035+105×0.01+115×0.0025)×10=89.75.(2)日销售量[60,100)的频率为0.875<0.9,日销售量[60,110)的频率为0.975>0.9, 故所求的量位于[100,110).由0.9-0.025-0.1-0.4-0.35=0.025, 得100+0.0250.01=102.5, 故每天应该进102.5千克苹果.11.已知一组数据1,2,a ,b ,5,8的平均数和中位数均为4,其中a ,b ∈N *,在去掉其中的一个最大数后,该组数据一定不变的是() A .平均数B .众数 C .中位数D .标准差 答案B解析由题意知,16+a +b6=4,可得a +b =8,又中位数为4, 则⎩⎨⎧ a =3,b =5或⎩⎨⎧ a =4,b =4,或⎩⎨⎧b =3,a =5,当⎩⎨⎧ a =3,b =5或⎩⎨⎧b =3,a =5,时,众数为5,标准差为433; 当⎩⎨⎧a =4,b =4时,众数为4,标准差为 5.∴去掉其中的一个最大数后,数据为1,2,a ,b ,5,当⎩⎨⎧ a =3,b =5或⎩⎨⎧b =3,a =5,时,平均数为165,众数为5,中位数为3,标准差为85; 当⎩⎨⎧a =4,b =4时,平均数为165,众数为4,中位数为4,标准差为365. 综上,数据变化前后一定不变的是众数.12.(2022·东三省四市联考)某同学掷骰子5次,并记录了每次骰子出现的点数,得出平均数为2,方差为2.4的统计结果,则下列点数中一定不出现的是() A .1 B .2 C .5 D .6 答案D解析因为(6-2)25=3.2,根据方差的计算公式知,方差大于2.4,因此不能出现点数6,因为(5-2)25=1.8<2.4,(2-2)25=0<2.4,(1-2)25=0.2<2.4, 则其余的点数1,2,5都有可能出现.13.小华同学每天晚上睡觉前要求自己背诵15个英文单词,若超出记为“+”,不足记为“-”,则上周一至周五,他的完成情况分别为-2,-1,x ,+4,y ,已知这五个数据的平均数是0,方差是5.2,则上周一至周五,小华背诵的单词数量的众数和中位数分别是() A .13,14 B .-2,-1 C .13,13 D .-2,-2 答案A解析因为-2,-1,x ,+4,y 这五个数据的平均数是0,方差是5.2,所以有错误!解得⎩⎨⎧x =-2,y =1或⎩⎨⎧x =1,y =-2,不管取哪一组解,这5天的单词量均是以下几个数,13,14,13,19,16, 所以众数和中位数分别是13,14.14.已知一组数据a ,b ,3,5的中位数为7,平均数为8,则ab =________. 答案135解析因为一组数据a ,b ,3,5的平均数为8, 所以14(a +b +3+5)=8,解得a +b =24,若a =b ,则a =b =12,此时4个数为3,5,12,12,显然中位数不是7, 不妨设a <b ,若a ≤3,则b ≥21,此时4个数排列为a ,3,5,b ,中位数为4,不符合题意,若3<a ≤5,则19≤b <21,此时4个数排列为3,a ,5,b ,显然中位数不是7, 若a >5,则4个数排列为3,5,a ,b ,则中位数为5+a2=7,解得a =9,则b =15, 所以ab =9×15=135.15.某创业公司共有36名职工,为了了解该公司职工的年龄构成情况,随机采访了9位代表,得到的数据分别为36,36,37,37,40,43,43,44,44,若用样本估计总体,则年龄在(x -s ,x +s )内的人数占公司人数的百分比是() (其中x 是平均数,s 为标准差,结果精确到1%)A .14%B .25%C .56%D .67% 答案C解析因为x =36+36+37+37+40+43+43+44+449=40,s 2=19×(16+16+9+9+0+9+9+16+16)=1009,即s =103,所以年龄在(x -s ,x +s ),即⎝ ⎛⎭⎪⎫1103,1303内的人数为5, 所以年龄在(x -s ,x +s )内的人数占公司人数的百分比为59≈56%.16.中国独有的文书工具,即笔、墨、纸、砚,有文房四宝之名,起源于南北朝时期.其中宣纸是文房四宝的一种,宣纸“始于唐代,产于泾县”,因唐代泾县隶属宣州管辖,故因地得名宣纸.宣纸按质量等级分为正牌(优等品)、副牌(合格品)、废品三等.某公司生产的宣纸为纯手工制作,年产宣纸10000刀(1刀=100张),该公司按照某种质量指标x 给宣纸确定等级如表所示:在该公司所生产的宣纸中随机抽取了一刀进行检验,得到频率分布直方图如图所示,已知每张正牌宣纸的利润为15元,副牌宣纸的利润为8元,废品的利润为-20元.(1)试估计该公司的年利润;(2)市场上有一种售价为100万元的机器可以改进宣纸的生产工艺,但这种机器的使用寿命为一年,只能提高宣纸的质量,不能增加宣纸的年产量.据调查这种机器生产的宣纸的质量指标x如表所示:x的范围(x-2,x+2)(x-6,x+6)频率0.68270.9545其中x为质量指标x的平均值,但是由于人们对传统手工工艺的认可,改进后的正牌和副牌宣纸的利润都将下降3元/张,请问该公司是否购买这种机器,请你为公司提出合理建议,并说明理由.(同一组的数据用该组区间的中点值作代表) 解(1)由频率分布直方图得,一刀宣纸有正牌100×0.1×4=40(张),有副牌100×0.05×4×2=40(张),有废品100×0.025×4×2=20(张),∴该公司一刀宣纸的利润的估计值为40×15+40×8-20×20=520(元),∴估计该公司的年利润为520万元.(2)由频率分布直方图得,x=42×0.025×4+46×0.05×4+50×0.1×4+54×0.05×4+58×0.025×4=50.这种机器生产的宣纸的质量指标x如表所示:∴一刀宣纸中正牌的张数估计为100×0.6827=68.27,废品的张数估计为100×(1-0.9545)=4.55,副牌的张数为100×(0.9545-0.6827)=27.18,∴一刀宣纸的利润为68.27×12+27.18×5-4.55×20=864.14(元),∴公司改进后该公司的利润为864.14-100=764.14(万元),∵764.14>520,∴建议该公司购买这种机器.。
2019年高考数学一轮复习精品学案(人教版A 版)用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差; ③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识. 2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程. 二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布.预测2019年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni i x n x 11叫做这n 个数据平均数;如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=n i i x x n S 叫做这n 个数据方差;同时=s )(11∑=-ni i x x n 叫做这n 个数据的标准差。
第19讲用样本估计总体及线性相关关系一.【课标要求】1.用样本估计总体①通过实例体会分布的意义和作用,在表示样本数据的过程中,学会列频率分布表、画频率分布直方图、频率折线图、茎叶图,体会他们各自的特点;②通过实例理解样本数据标准差的意义和作用,学会计算数据标准差;③能根据实际问题的需求合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;④在解决统计问题的过程中,进一步体会用样本估计总体的思想,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性;⑤会用随机抽样的基本方法和样本估计总体的思想,解决一些简单的实际问题;能通过对数据的分析为合理的决策提供一些依据,认识统计的作用,体会统计思维与确定性思维的差异;⑥形成对数据处理过程进行初步评价的意识2.变量的相关性①通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认识变量间的相关关系;②经历用不同估算方法描述两个变量线性相关的过程。
知道最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程二.【命题走向】“统计”是在初中“统计初步”基础上的深化和扩展,本讲主要会用样本的频率分布估计总体的分布,并会用样本的特征来估计总体的分布预测明年高考对本讲的考察是:1.以基本题目(中、低档题)为主,多以选择题、填空题的形式出现,以实际问题为背景,综合考察学生学习基础知识、应用基础知识、解决实际问题的能力;2.热点问题是频率分布直方图和用样本的数字特征估计总体的数字特征。
三.【要点精讲】1.用样本的数字特征估计总体的数字特征 (1)众数、中位数在一组数据中出现次数最多的数据叫做这组数据的众数;将一组数据按照从大到小(或从小到大)排列,处在中间位置上的一个数据(或中间两位数据的平均数)叫做这组数据的中位数;(2)平均数与方差如果这n 个数据是n x x x ,,.........,21,那么∑==ni ix nx 11叫做这n 个数据平均数; 如果这n 个数据是n x x x ,,.........,21,那么)(112∑=-=ni ix x nS 叫做这n 个数据方差;同时=s)(11∑=-ni ix x n叫做这n 个数据的标准差。
2.频率分布直方图、折线图与茎叶图样本中所有数据(或数据组)的频率和样本容量的比,就是该数据的频率。
所有数据(或数据组)的频率的分布变化规律叫做频率分布,可以用频率分布直方图、折线图、茎叶图来表示。
频率分布直方图: 具体做法如下:(1)求极差(即一组数据中最大值与最小值的差); (2)决定组距与组数; (3)将数据分组; (4)列频率分布表; (5)画频率分布直方图注:频率分布直方图中小正方形的面积=组距×组距频率=频率。
折线图:连接频率分布直方图中小长方形上端中点,就得到频率分布折线图总体密度曲线:当样本容量足够大,分组越多,折线越接近于一条光滑的曲线,此光滑曲线为总体密度曲线。
3.线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。
回归直线方程:设x 与y 是具有相关关系的两个变量,且相应于n 个观测值的n 个点大致分布在某一条直线的附近,就可以认为y 对x 的回归函数的类型为直线型:bx a y +=ˆ。
其中2121121)())((xn x yx n y xx x y y x xb ni i ni i ini i ni i i--=---=∑∑∑∑====,x b y a -=。
我们称这个方程为y 对x 的回归直线方程。
四.【典例解析】 题型1:数字特征例1.为了检查一批手榴弹的杀伤半径,抽取了其中20颗做试验,得到这20颗手榴弹的杀伤半径,并列表如下:(1)在这个问题中,总体、个体、样本和样本容量各是什么?(2)求出这20颗手榴弹的杀伤半径的众数、中位数和平均数,并估计这批手榴弹的平均杀伤半径.解析: (1)总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取的20颗手榴弹的杀伤半径;样本容量是20。
(2)在20个数据中,10出现了6次,次数最多,所以众数是10(米)20个数据从小到大排列,第10个和第11个数据是最中间的两个数,分别为9(米)和10(米),所以中位数是21(9+10)=9.5(米)。
样本平均数4.9)112311610495817(201=⨯+⨯+⨯+⨯+⨯+⨯=x (米)所以,估计这批手榴弹的平均杀伤半径约为9.4米。
点评:(1)根据总体、个体、样本、样本容量的概念答题.要注意:总体、个体和样本所说的考察对象是一种数量指标,不能说成考察的对象是手榴弹,而应说是手榴弹的杀伤半径。
(山东卷理)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100), [100,102),[102,104),[104,106],已知样本中产品净重小于 100克的个数是36,则样本中净重大于或等于98克并且 小于104克的产品的个数是 ( ). A.90 B.75 C. 60 D.45 答案 A解析 产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n , 则300.036=n,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本 中净重大于或等于98克并且小于104克的产品的个数是 120×0.75=90.故选A.【命题立意】:本题考查了统计与概率的知识,读懂频率分布直方图,会计算概率以及样本中有关的数据.第8题图(2)读懂表格的意义,利用概念求众数、中位数,用样本平均数估计这批手榴弹的平均杀伤半径.另外在这里要会简便计算有多个重复数据的样本的平均数。
例2.为估计一次性木质筷子的用量,1999年从某县共600家高、中、低档饭店抽取10家作样本,这些饭店每天消耗的一次性筷子盒数分别为:0.6 3.7 2.2 1.5 2.8 1.7 1.2 2.1 3.2 1.0(1)通过对样本的计算,估计该县1999年消耗了多少盒一次性筷子(每年按350个营业日计算);(2)2001年又对该县一次性木质筷子的用量以同样的方式作了抽样调查,调查的结果是10个样本饭店,每个饭店平均每天使用一次性筷子2.42盒.求该县2000年、2001年这两年一次性木质筷子用量平均每年增长的百分率(2001年该县饭店数、全年营业天数均与1999年相同);(3)在(2)的条件下,若生产一套学生桌椅需木材0.07m 3,求该县2001年使用一次性筷子的木材可以生产多少套学生桌椅。
计算中需用的有关数据为:每盒筷子100双,每双筷子的质量为5g ,所用木材的密度为0.5×103kg/m 3;(4)假如让你统计你所在省一年使用一次性筷子所消耗的木材量,如何利用统计知识去做,简要地用文字表述出来。
解析:(1)0.2)0.12.31.22.17.18.25.12.27.36.0(101=+++++++++=x所以,该县1999年消耗一次性筷子为2×600×350=420000(盒)。
(2)设平均每年增长的百分率为X ,则2(1+X )2=2.42, 解得X 1=0.1=10%,X 2=-2.1(不合题意,舍去)。
所以,平均每年增长的百分率为10%; (3)可以生产学生桌椅套数为726007.0105.035060010042.2005.03=⨯⨯⨯⨯⨯⨯(套)。
(四川卷文)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形。
黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 A.甲批次的总体平均数与标准值更接近 B.乙批次的总体平均数与标准值更接近 C.两个批次总体平均数与标准值接近程度相同 D.两个批次总体平均数与标准值接近程度不能确定 答案 A解析 甲批次的平均数为0.617,乙批次的平均数为0.613(4)先抽取若干个县(或市、州)作样本,再分别从这些县(或市、州)中抽取若干家饭店作样本,统计一次性筷子的用量.点评:本题是一道统计综合题,涉及的知识点很多,需要灵活运用各种知识分析解决问题.对于第(1)小题,可先求得样本平均数,再利用样本估计总体的思想来求得问题的解.对于第(2)小题,实际是一个增长率问题的应用题,可通过设未知数列方程的方法来解.对于第(3)小题,用到了物理公式m =ρv , 体现了各学科知识之间的联系,让学生触类旁通,在解决实际问题时能综合运用多种知识灵活地解决问题.第(4)小题只要能够运用随机抽样方法,能体会到用样本估计总体的统计思想就可解决,在文字表述上要注意简洁、明了、正确。
题型2:数字特征的应用例3.甲、乙两种冬小麦试验品种连续5年的平均单位面积产量如下(单位:t / hm 2)其中产量比较稳定的小麦品种是 甲 。
解析:x ¯甲 = 1 5( 9.8 + 9.9 + 10.1 + 10 + 10.2) = 10.0,x ¯乙 = 1 5( 9.4 + 10.3 + 10.8 + 9.7 + 9.8) = 10.0;s 2甲 = 1 5( 9.82 + … + 10.22) – 102 = 0.02,s 2甲 = 1 5( 9.42 + … + 9.82) – 102 = 0.244 > 0.02 。
点评:方差与平均数在反映样本的特征上一定要区分开 例4.在一次歌手大奖赛上,七位评委为歌手打出的分数如下: 9.4 8.4 9.4 9.9 9.6 9.4 9.7 去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为(A )9.4, 0.484 (B )9.4, 0.016 (C )9.5, 0.04 (D )9.5, 0.016 答案:D ;解析:7个数据中去掉一个最高分和一个最低分后,余下的5个数为:9.4, 9.4, 9.6, 9.4, 9.5。
则平均数为:5.946.955.94.96.94.94.9≈=++++=x ,即5.9=x 。