高中数学数据的数字特征-例题解析
- 格式:doc
- 大小:24.00 KB
- 文档页数:2
自主广场我夯基我达标1.刻画数据离散程度的统计量有( )A.极差B.方差与标准差C.极差、方差与标准差D.平均数与标准差思路解析:极差、方差与标准差均是刻画数据离散程度的统计量.答案:C2.如果数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则3x 1+5,3x 2+5,…,3x n +5的平均数和方差分别为…( ) A.x 和s2B.3x +5和9s2 C.3x +5和s2D.3x +5和9s 2+30s+25 思路解析:n 1(3x 1+5+3x 2+5+…+3x n +5)=3×n1(x 1+x 2+…+x n )+5=3x+5, n1[(3x 1+5-3x -5)2+(3x 2+5-3x -5)2+…+(3x n +5-3x -5)2] =n9[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=9s 2. 答案:B3.标准差的计算公式是( ) A.∑=ni i x n 11 B.∑=-n i i x x n 12)(1 C.∑=-n i i x x n 12)(1 D.∑=-ni i x x n 1||1 思路解析:s =∑=-=-+⋯+-+-n i i n x x n x x x x x x n 1222221)(1])()()[(1. 答案:C4.某班50名学生右眼视力的检查结果如下表所示.视力 0.10.2 0.3 0.4 0.5 0.6 0.7 0.8 1.0 1.2 1.5 人数 11 3 4 3 4 4 6 8 10 6 则该班学生右眼视力的众数为_______,中位数为_______.思路解析:最中间位置的一个数据(或最中间两个数据的平均数)称为中位数,一组数据中,出现次数最多的数据叫众数.答案:1.2 0.85.已知两组数据:甲:9.9,10.3,9.8,10.1,10.4,10,9.8,9.7.乙:10.2,10,9.5,10.3,10.5,9.6,9.8,10.1.分别计算这两组数据的方差,并判断哪组数据波动大.思路分析:先用公式s 2=∑=-ni i x x n 12)(1计算出两组数据的方差,其中数值大的波动大. 解:s 甲2=0.055,s 乙2=0.105,乙组数据比甲组数据波动大.6.某单位为了寻找高产稳定的油菜品种,选了三个不同的油菜品种进行试验,每一品种在五块试验田上试种,每块试验田的面积为0.7公顷,产量情况如下表.品种 各试验田产量(kg) 1 2 3 4 51 21.5 20.4 22.0 21.2 19.9 2 21.3 23.6 18.9 21.4 19.8 3 17.8 23.3 21.4 19.1 20.9试评定哪一个品种既高产又稳定.思路解析:分别计算出三组数据的平均值,数据大的产量高,再计算出各组数据的方差,值小的为稳定的油菜品种.答案:第一个油菜品种既高产又稳定.我综合我发展7.下列数据是30个不同国家中每100 000名男性患某种疾病的死亡率:27.0 23.9 41.6 33.1 40.6 18.8 13.728.9 13.2 14.5 27.0 34.8 28.9 3.250.1 5.6 8.7 15.2 7.1 5.2 16.513.8 19.2 11.2 15.7 10.0 5.6 1.533.8 9.2(1)作出这些数据分布的频率分布直方图;(2)请由这些数据计算平均数、标准差等,并对它们的含义进行解释.思路分析:先作频率分布表,统计出数据的规律,再根据图示进行解释.解:(1)画频率分布直方图如下图.(2)平均数是19.3;标准差是12.5.说明30个国家中每十万名男性患某种疾病的平均死亡率为19.3%;但各个国家的差异较大.8.在一次人才招聘会上,有一家公司的招聘员告诉你,“我们公司的收入水平很高”“去年,在50名员工中,最高年收入达到了100万,他们年收入的平均数是3.5万”.(1)你是否能够判断自己可以成为此公司的一名高收入者?(2)如果招聘员继续告诉你,“员工收入的变化范围是从0.5万到100万”,这个信息是否足以使你作出自己是否受聘的决定?为什么?(3)如果招聘员继续给你提供如下信息,员工收入的中间50%(即去掉最少的25%和最多的25%后所剩下的)的变化范围是1万到3万,你又该如何使用这条信息来作出是否受聘的决定?(4)为什么平均数比中间50%高很多?你能估计出收入的中位数是多少吗?思路分析:中位数、众数、平均数可以从不同角度反映这组数据的特征.解:(1)不能判断一定能成为此公司的一名高收入者.(2)由此可知员工收入的变化范围及平均数.高收入者只是极少数,不能作为受聘的决定.(3)大部分员工的收入是1万到3万,这也是我们受聘该公司后最有可能的收入状况.(4)收入极高的少数人对平均数影响较大,他们的收入与平均数相差太多,可以估计收入的中位数大约是2万元.9.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表.甲273830373531乙332938342836(1)画出茎叶图,由茎叶图你能获得哪些信息?(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、极差、标准差,并判断选谁参加比赛更合适.思路分析:(1)根据表中数据,可以将十位数字作为茎,个位数字作为叶,画出茎叶图.茎叶图可直观地反映各数据的分布情况.(2)平均数、中位数、极差、标准差这些基本特征量能从不同侧面刻画样本数据的数字信息,以帮助我们用于判断.解:(1)画茎叶图如下图所示,中间数为数据的十位数.从这个茎叶图上可以看出,甲、乙的得分情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此乙发挥比较稳定,总体得分情况比甲好.(2)利用科学计算器:x甲=33,x乙=33;s甲=3.96,s乙=3.56;甲的中位数是33,极差11,乙的中位数是33.5,极差是10.综合比较以上数据可知,选乙参加比赛较为合适.。
5.1.2数据的数字特征(一)必备知识基础练进阶训练第一层1.10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12,则这组数据的最大值和最小值分别是()A.15,17B .10,17C.12,17D .17,102.某学习小组在一次数学测验中,得100分的有1人,95分的有1人,90分的有2人,85分的有4人,80分和75分的各有1人,则该小组成绩的平均数、众数、中位数分别是()A.85,85,85B .87,85,86C.87,85,85D .87,85,903.一组数据为6,47,49,15,42,41,7,39,43,40,36,则这组数据的第一四分位数(25%分位数)是()A.47B .49C .7D .154.一组数据按照从小到大的顺序排列为1,2,2,x ,5,10,其中x ≠5,已知该组数据的中位数是众数的32倍,则该组数据的标准差为()A.9B .4C.3D .25.某班8名学生的体重(单位:kg)分别是:42,48,40,47,43,58,47,45,则这组数据的极差是________,中位数是________,25%分位数是________.6.有一笔统计资料,共有11个数据如下(不完全以大小排列):2,4,4,5,5,6,7,8,9,11,x ,已知这组数据的平均数为6,则这组数据的方差为()A.6B .6C.66D .6.5关键能力综合练进阶训练第二层7.(多选)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,可能发生变化的数字特征是()A.中位数B .平均数C.方差D .极差8.样本中共有五个个体,其值分别为a ,0,1,2,3.若该样本的平均数为1,则样本方差为()A.65B .65C.2D .29.下列关于平均数、中位数、众数的说法中正确的一个是()A.中位数可以准确地反映出总体的情况B.平均数可以准确地反映出总体的情况C.众数可以准确地反映出总体的情况D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况10.(多选)下列说法正确的是()A.在两组数据中,平均数较大的一组极差较大B.平均数反映数据的集中趋势,方差则反映数据波动的大小C.方差的求法是求出各个数据与平均数的差的平方后再求和D.在记录两个人射击环数的两组数据中,方差大说明射击水平不稳定11.一组数据12,34,15,24,39,25,31,48,32,36,36,37,42,50的25%分位数和75%分位数分别是________、________.12.某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄(单位:岁)如下:甲群13,13,14,15,15,15,15,16,17,17;乙群54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?核心素养升级练进阶训练第三层13.(多选)已知数据x1,x2,x3,…,x100是某市100个普通职工2020年7月份的收入(均不超过2万元),设这100个数据的中位数为x,平均数为y,方差为z,如果再加上某人2020年7月份的收入x101(约100万元),则相对x,y,z,这101个数据()A.平均数可能不变,中位数可能不变,方差可能不变B.平均数变大,中位数可能变大,方差变大C.平均数变大,中位数一定变大,方差可能不变D.平均数变大,中位数可能不变,方差变大14.以下是某地在甲、乙两个重要道路交叉口设置的电子监控在连续一周时间里抓拍到的每一天的车辆违章次数情况:甲:6,8,9,10,9,9,12;乙:7,9,8,11,10,9,11.(1)试分别求甲、乙两路口车辆违章次数的平均数、中位数、众数;(2)分别求甲的25%分位数和乙的75%分位数.参考答案与解析1.答案:D解析:这组数据的最大值是17,最小值是10.故选D.2.答案:C 解析:平均分为110(100+95+90×2+85×4+80+75)=87.由众数的定义可知众数为85,中位数为85.3.答案:D解析:将这组数据由小到大排列的结果是:6,7,15,36,39,40,41,42,43,47,49,一共11个.第一四分位数,即25%分位数,由11×25%=2.75,得第一四分位数是第3个数据15.4.答案:C 解析:由题意得该组数据的中位数为12(2+x )=1+x 2;众数为2.∴1+x 2=2×32=3,∴x =4,∴该组数据的平均数为x -=16×(1+2+2+4+5+10)=4,∴该组数据的方差为s 2=16×[(1-4)2+(2-4)2+(2-4)2+(4-4)2+(5-4)2+(10-4)2]=9,∴该组数据的标准差为3.故选C.5.答案:184642.5解析:因为所给数据的最大值是58,最小值是40,所以极差是58-40=18.将所给数据按从小到大的顺序排列是40,42,43,45,47,47,48,58.因为这组数据共8个,处于中间位置的是第4个数和第5个数,故这组数据的中位数是45+472=46.因为8×25%=2,所以这组数据的25%分位数是42+432=42.5.6.答案:A解析:∵x -=111(2+4+4+5+5+6+7+8+9+11+x )=111(61+x )=6,∴x =5.s 2=42+22+22+12+12+02+12+22+32+52+1211=6611=6.7.答案:BCD解析:由于去掉一个最高分与一个最低分后,评委所评的9个分数从小到大排序后,中间一个数字不会改变,故中位数不变.由于最高分和最低分是极端分数,因此会影响平均数、方差和极差.8.答案:D解析:由题可知样本的平均数为1,所以a +0+1+2+35=1,解得a =-1,所以样本的方差为15×[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.9.答案:D解析:根据平均数、中位数、众数的定义可知平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况.10.答案:BD解析:平均数表示一组数据的集中趋势,平均数的大小并不能说明该组数据极差的大小,所以A 错误;平均数反映数据的集中趋势,方差则反映数据波动的大小,所以B 正确;方差公式s 2=1n (x i -x -)2,所以C 错误;方差大说明射击水平不稳定,所以D 正确.11.答案:2539解析:把数据从小到大排序为12,15,24,25,31,32,34,36,36,37,39,42,48,50共14个数,14×25%=3.5,14×75%=10.5,所以25%分位数和75%分位数分别是第4个和第11个数据,即是25,39.12.解析:(1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5.5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.13.答案:BD解析:因为数据x 1,x 2,x 3,…,x 100是某市100个普通职工2020年7月份的收入,而x 101大于x 1,x 2,x 3,…,x 100很多,所以这101个数据中,平均数变大,但中位数可能不变,也可能变大,由于数据的集中程度受到x 101比较大的影响,变得更加离散,所以方差变大.14.解析:(1)甲路口车辆违章次数的平均数为6+8+9+10+9+9+127=9,将各数按从小到大排序为:6,8,9,9,9,10,12,因此中位数为9,众数是9.乙路口车辆违章次数的平均数为7+9+8+11+10+9+117≈9.3,将各数按从小到大排序为:7,8,9,9,10,11,11,因此中位数是9,众数是9和11.(2)将甲组数从小到大排列为:6,8,9,9,9,10,12,共7个数,因为7×25%=1.75,所以甲组数的25%分位数为8.将乙组数从小到大排列为:7,8,9,9,10,11,11,因为7×75%=5.25,所以乙的75%分位数11.。
数学高考复习数据的数字特征专题练习(含解析)知道一个随机变量的散布函数,就掌握了这个随机变量的统计规律性。
以下是数据的数字特征专题练习,请考生经过练习查缺补漏。
一、选择题1.一个样本数据按从小到大的顺序陈列为13,14,19,x,23,27,28,31,其中位数为22,那么x为()A.21B.22C.20D.23[答案] A[解析] 由=22得x=21.2.以下说法正确的选项是()A.在两组数据中,平均值较大的一组方差较大B.平均数反映数据的集中趋向,规范差那么反映数据离平均值的动摇大小C.方差的求法是求出各个数据与平均值的差的平方后再求和D.在记载两团体射击环数的两组数据中,方差大的表示射击水平高[答案] B[解析] 平均数、中位数、众数都是反映一组数据的集中趋向的统计量,方差、规范差、极差都是反映数据的团圆水平的统计量,应选B.3.在一次歌声大奖赛上,七位评委为歌手打出的分数如下:9.4 8.4 9.4 9.9 9.6 9.4 9.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差区分为()A.9.4 0.484B.9.4 0.016C.9.5 0.04D.9.5 0.016[答案] D[解析] 去掉一个最高分和一个最低分后剩余分数为9.4,9.4,9.6,9.4,9.7.其平均数为==9.5.方差s2=(0.12+0.12+0.12+0.12+0.22)=0.08=0.016.4.在某次测量中失掉的A样本数据如下:82,84,84,86,86,86,88,88,88,88.假定B样本数据恰恰是A 样本数据每个都加2后所得数据,那么A,B两样本的以下数字特征对应相反的是()A.众数B.平均数C.中位数D.规范差[答案] D[解析] 此题考察样本的数字特征.A的众数88,B那么为88+2=90.各样本都加2后,平均数显然不同.A的中位数=86,B的中位数=88,而由规范差公式s=知D正确.5.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年竞赛进球个数的规范差为3;乙队平均每场进球数为1.8,全年竞赛进球个数的规范差为0.3,以下说法正确的有()甲队的技术比乙队好;乙队发扬比甲队动摇;乙队简直每场都进球;甲队的表现时好时坏A.1个B.2个C.3个D.4个[答案] D[解析] s甲s乙,说明乙队发扬比甲队动摇,甲乙,说明甲队平均进球多于乙队,但乙队平均进球数为1.8,规范差仅有0.3,说明乙队确实很少不进球.6.期中考试后,班长算出了全班40人数学效果的平均分为M,假设把M当成一个同窗的分数,与原来的40个分数一同,算出这41个分数的平均数为N,那么MN为()A. B.1C. D.2[答案] B[解析] 平均数是用一切数据的和除以数据的总个数而失掉的.设40位同窗的效果为xi(i=1,2,,,40),那么M=,N=.故MN=1.二、填空题7.假定样本x1+2,x2+2,,xn+2的平均值为10,那么样本2x1+3,2x2+3,,2xn+3的平均值为________.[答案] 19[解析] x1+2,x2+2,,xn+2的平均值为10,x1,x2,,xn的平均值为8,2x1+3,2x2+3,,2xn+3的平均值为28+3=19.8.某赛季,甲、乙两名篮球运发动都参与了11场竞赛,他们每场竞赛得分的状况用如下图的茎叶图表示,假定甲运发动的中位数为a,乙运发动的众数为b,那么a-b=________. 甲乙 7 9 8 0 7 8 5 5 7 9 1 1 1 3 3 4 6 2 2 0 2 3 1 0 1 4 0 [答案] 8[解析] 由茎叶图知a=19,b=11,a-b=8.三、解答题9.某校为了了解甲、乙两班的数学学习状况,从两班各抽出10名先生停止数学水平测试,效果如下(单位:分):甲班:82,84,85,89,79,80,91,89,79,74;乙班:90,76,86,81,84,87,86,82,85,83.(1)求两个样本的平均数甲和乙;(2)求两个样本的方差和规范差;(3)比拟两组数据的平均数,并估量哪个班的平均分较高;(4)比拟两组数据的规范差,并估量哪个班的数学效果比拟划一.[解析] (1)甲=(82+84+85+89+79+80+91+89+79+74)=83.2(分),乙=(90+76+86+81+84+87+86+82+85+83)=84(分).(2)s=[(82-83.2)2+(84-83.2)2+(85-83.2)2+(89-83.2)2+( 79-83.2)2+(80-83.2)2+(91-83.2)2+(89-83.2)2+(79-83.2 )2+(74-83.2)2]=26.36(分2),s=[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87 -84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13.2(分2),所以s甲=5.13(分),s乙=3.63(分).(3)由于甲乙,所以据此估量乙班的平均分较高.(4)由于s甲s乙,所以据此估量乙班的数学效果比甲班划一.数据的数字特征专题练习及答案的内容就是这些,查字典数学网预祝广阔考生金榜题名。
高考第5题(数据的数字特征)原题5.(2019·全国卷Ⅱ·理科5)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是A .中位数B .平均数C .方差D .极差 类比 1.(2010·山东卷·文科)在某项体育比赛中一位同学被评委所打出的分数如下:90,89,90,95,93,94,93,去掉一个最高分和一个最低分后,所剩数据的平均分值为和方差分别为A.92,2B.92,2.8C.93,2D.93,2.8 类比2.(2013·辽宁卷·理科)为了考察某校各班参加课外书法小组的人数,在全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为 .类比 3.(2013·山东卷·文科)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场做的9个分数的茎叶图后来有一个数据模糊,无法辨认,在图中以x 表示:8779401091x ,则7个剩余分数的方差为 A.1169 B.367C.36D.7 类比4.(2009·福建卷·理科)某校开展“爱我海西、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算的平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清.若记分员计算失误,则数字x 应该是 .类比5.(2012·山东卷·文科)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是A.众数B.平均数C.中位数D.标准差 作品A 8 8 9 9 9 2 3 x 2 1 4。
1.4数据的数字特征一、选择题1.一个样本数据按从小到大的顺序排列为13,14,19,x,23,27,28,31,其中位数为22,则x 为( )A .21B .22C .20D .23[答案] A[解析] 由x +232=22得x =21.2.下列说法正确的是( )A .在两组数据中,平均值较大的一组方差较大B .平均数反映数据的集中趋势,标准差则反映数据离平均值的波动大小C .方差的求法是求出各个数据与平均值的差的平方后再求和D .在记录两个人射击环数的两组数据中,方差大的表示射击水平高 [答案] B[解析] 平均数、中位数、众数都是反映一组数据的“集中趋势”的统计量,方差、标准差、极差都是反映数据的离散程度的统计量,故选B.3.在一次歌声大奖赛上,七位评委为歌手打出的分数如下: 9.4 8.4 9.4 9.9 9.6 9.4 9.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ) A .9.4 0.484 B .9.4 0.016 C .9.5 0.04 D .9.5 0.016 [答案] D[解析] 去掉一个最高分和一个最低分后剩余分数为9.4,9.4,9.6,9.4,9.7. 其平均数为x =3×9.4+9.6+9.75=9.5.方差s 2=15(0.12+0.12+0.12+0.12+0.22)=15×0.08=0.016. 4.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差[答案] D[解析] 本题考查样本的数字特征. A 的众数88,B 则为88+2=90.“各样本都加2”后,平均数显然不同.A 的中位数86+862=86,B 的中位数88+882=88,而由标准差公式s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]知D 正确. 5.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数为1.8,全年比赛进球个数的标准差为0.3,下列说法正确的有( )①甲队的技术比乙队好; ②乙队发挥比甲队稳定; ③乙队几乎每场都进球; ④甲队的表现时好时坏 A .1个 B .2个 C .3个 D .4个[答案] D[解析] s 甲>s 乙,说明乙队发挥比甲队稳定,x 甲>x 乙,说明甲队平均进球多于乙队,但乙队平均进球数为1.8,标准差仅有0.3,说明乙队的确很少不进球.6.期中考试后,班长算出了全班40人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均数为N ,那么M ∶N 为( )A.4041 B .1 C.4140 D .2[答案] B[解析] 平均数是用所有数据的和除以数据的总个数而得到的.设40位同学的成绩为x i (i =1,2,,…,40),则M =x 1+x 2+…+x 4040,N =x 1+x 2+…+x 40+M 41.故M ∶N =1.二、填空题7.若样本x1+2,x2+2,…,x n+2的平均值为10,则样本2x1+3,2x2+3,…,2x n+3的平均值为________.[答案]19[解析]∵x1+2,x2+2,…,x n+2的平均值为10,∴x1,x2,…,x n的平均值为8,∴2x1+3,2x2+3,…,2x n+3的平均值为2×8+3=19.8.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,若甲运动员的中位数为a,乙运动员的众数为b,则a-b=________.甲乙798078 5579111 33462202310140[答案]8[解析]由茎叶图知a=19,b=11,∴a-b=8.三、解答题9.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82,84,85,89,79,80,91,89,79,74;乙班:90,76,86,81,84,87,86,82,85,83.(1)求两个样本的平均数x甲和x乙;(2)求两个样本的方差和标准差;(3)比较两组数据的平均数,并估计哪个班的平均分较高;(4)比较两组数据的标准差,并估计哪个班的数学成绩比较整齐.[解析](1)x甲=110(82+84+85+89+79+80+91+89+79+74)=83.2(分),x乙=110(90+76+86+81+84+87+86+82+85+83)=84(分).(2)s2甲=110[(82-83.2)2+(84-83.2)2+(85-83.2)2+(89-83.2)2+(79-83.2)2+(80-83.2)2+(91-83.2)2+(89-83.2)2+(79-83.2)2+(74-83.2)2]=26.36(分2),s2乙=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13.2(分2),所以s 甲=26.36≈5.13(分), s 乙=13.2≈3.63(分).(3)因为x 甲<x 乙,所以据此估计乙班的平均分较高. (4)因为s 甲>s 乙,所以据此估计乙班的数学成绩比甲班整齐.一、选择题1.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9,已知这组数据的平均数为10,方差为2,则|x -y |的值为( )A .1B .2C .3D .4[答案] D[解析] 依题意,可得⎩⎨⎧10=x +y +10+11+95,2=15[(x -10)2+(y -10)2+(10-10)2+(11-10)2+(9-10)2],⇒⎩⎪⎨⎪⎧ x +y =20,(x -10)2+(y -10)2=8,⇒⎩⎪⎨⎪⎧ x =12y =8,或⎩⎪⎨⎪⎧x =8y =12, 所以|x -y |=4.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分值的中位数为m e ,众数为m o ,平均值为x ,则( )A .m e =m o =xB .m e =m o <xC .m e <m o <xD .m o <m e <x[答案] D[解析] 30个数中第15个数是5,第16个数是6,故中位数为5+62=5.5,众数为5,x -=3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230=17930,所以m o <m e <x -,故选D. 二、填空题3.某企业职工的月工资数统计如下:元.如何选取该企业的月工资代表数呢?企业法人主张用平均值,职工代表主张用众数,监督部门主张用中位数.请你站在其中一立场说明理由:________________________________________. [答案] 1200 900 企业法人主张用平均值是为了显示本企业员工的收入高 [解析] 用中位数与众数的定义易求得答案.4.已知样本7,8,9,x ,y 的平均数是8,标准差是2,则xy 的值为________. [答案] 60[解析] 由已知得7+8+9+x +y =5×8, 则x +y =16, 所以x 2+y 2+2xy =256.又15[(7-8)2+(8-8)2+(9-8)2+(x -8)2+(y -8)2]=2, 整理,得x 2+y 2=16(x +y )-120=136, 所以136+2xy =256,则xy =60. 三、解答题5.给出以下10个数据:12 9 9 10 8 10 12 9 14 7写出这组数据的平均数、中位数、众数、极差、方差. [解析] 这组数据的平均数是12+9+9+10+8+10+12+9+14+710=10,将这组数据按从小到大的顺序排列: 7 8 9 9 9 10 10 12 12 14则中位数是9+102=9.5,众数是9,极差是14-7=7,方差是s 2=110[(12-10)2+(9-10)2+(9-10)2+(10-10)2+(8-10)2+(10-10)2+(12-10)2+(9-10)2+(14-10)2+(7-10)2]=4.6.个体户李某经营一家快餐店,下面是快餐店所有人员8月份的工资表:(2)计算出的平均工资能否反映打工人员这个月收入的一般水平?为什么?(3)去掉李某的工资后,再计算平均工资.这个平均工资能代表打工人员这个月的收入水平吗?(4)根据以上计算,以统计的观点,你对(3)的结果有什么看法?[解析] (1)这7人8月份的平均工资是x 1=17×(30 000+4 500+3 500+4 000+3 200+3 200+4 100)=7 500(元).(2)计算出的平均工资不能反映打工人员这个月收入的一般水平.理由:可以看出,打工人员的工资都低于该平均工资,因为李某的工资特别高,所以他的工资对平均工资的影响较大,同时他也不是打工人员.(3)去掉李某的工资后的平均工资x 2=16×(4 500+3 500+4 000+3 200+3 200+4 100)=3 750(元).这个平均工资能代表打工人员这个月的收入水平.(4)从本题的计算可以看出,个别特殊值对平均数有很大的影响,因此选择样本时,样本中尽量不用特殊数据.7.某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验. 选取两大块地,每大块地分成n 小块地,在总共2n 小块地中,随机选n 小块地种植品种甲,另外n 小块地种植品种乙.试验时每大块地分成8小块,即n =8,试验结束后得到品种甲和品种乙在各小块地上的每公顷产量(单位:kg/hm 2)如下表:你认为应该种植哪一品种?[解析] 品种甲的每公顷产量的样本平均数和样本方差分别为: x -甲=18(403+397+390+404+388+400+412+406)=400,s 2甲=18(32+(-3)2+(-10)2+42+(-12)2+02+122+62)=57.25. 品种乙的每公顷产量的样本平均数和样本方差分别为: x -乙=18(419+403+412+418+408+423+400+413)=412,s 2乙=18(72+(-9)2+02+62+(-4)2+112+(-12)2+12)=56. 由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.。
5.1.2数据的数字特征(二)必备知识基础练进阶训练第一层1.在一次“爱心互助”捐款活动中,高一某班第一小组8名同学捐款的金额(单位:元)如下表所示:金额/元56710人数2321则这8名同学捐款金额的最大值、最小值、平均数分别为()A.10,5,3.5B.10,5,6C.10,5,6.5D.10,5,72.在某次考试中,10名同学的得分如下:84,77,84,83,68,78,70,85,79,95.则这一组数据的众数、中位数和75%分位数分别为()A.84,68,83B.84,78,83C.84,81,84D.78,81,843.在某项比赛中,七位评委给某位选手打出的分数如下:90,89,90,95,93,94,93.若计分规则是:去掉一个最高分,去掉一个最低分,然后把其他分数的平均数作为选手的最后得分,则该选手的最后得分为()A.90分B.91分C.92分D.93分4.若x-是x1,x2,…,x100的平均数,a1为x1,x2,…,x40的平均数,a2为x41,x42,…,x100的平均数,则下列式子中正确的是()A.x-=40a1+60a2100B.x-=60a1+40a2100C.x-=a1+a2D.x-=a1+a225.一个样本数据按从小到大的顺序排列为:13,14,19,x,23,27,28,31,中位数为22,则x=________.6.某鞋店试销一种新女鞋,销售情况如下表:鞋号3435363738394041数量/双259169532如果你是鞋店经理,那么下列统计量中对你来说最重要的是________.①平均数;②众数;③中位数;④方差.关键能力综合练进阶训练第二层7.已知一组数据x1,x2,x3,x4,x5的平均数是x-=2,方差是13,那么另一组数据3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均数和方差分别为()A.2,13B.2,1C.4,13D.4,38.为了解我国13岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m;从南方抽取了200个男孩,平均身高为1.50m,由此可推断我国13岁男孩的平均身高为()A.1.54m B.1.55mC.1.56m D.1.57m9.在某次测量中得到的A数据如下:82,84,84,86,86,86,88,88,88,88.若B 数据恰好是A数据每个都加2后所得的数据,则A,B两组数据的下列数字特征对应相同的是()A.众数B.平均数C.中位数D.标准差10.若一组数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为()A.8B.15C.16D.3211.近年来,某市私家车数量持续增长,2015年至2019年该市私家车数量依次为15,19,22,26,30(单位:万辆),则该组数据的中位数是________,10%分位数是________,20%分位数是________.12.甲、乙两位同学某学科的连续五次考试成绩如下:甲:6869707172乙:6368696971则平均分数较高的是________,成绩较为稳定的是________.核心素养升级练进阶训练第三层13.一次数学知识竞赛中,两组学生成绩如下:分数5060708090100人数甲组251013146乙组441621212经计算,已知两个组的平均分都是80分,请根据所学过的统计知识,进一步判断这次竞赛中哪个组更优秀,并说明理由.14.据报道,某销售公司有33名职工,他们所在部门及相应每人所创年利润如下表所示(单位:万元):部门A B C D E F G人数11215320每人所创年利润 5.55 3.53 2.52 1.5(1)求该公司职工每人所创年利润的平均数、中位数、众数、极差;(2)假设部门A所创年利润从5.5万元提高到30万元,部门B所创年利润由5万元提高到20万元,那么新的平均数、中位数、众数、极差又是多少?(3)你认为哪个统计量更能反映这个公司职工每人所创年利润的平均水平?参考答案与解析1.答案:C解析:这8名同学捐款金额的最大值为10,最小值为5,平均数为5×2+6×3+7×2+10×12+3+2+1=6.5.2.答案:C解析:将所给数据按从小到大的顺序排列是68,70,77,78,79,83,84,84,85,95,显然众数为84,而本组数据共10个,中间两个是79,83,它们的平均数为81,即中位数为81.因为10×75%=7.5,所以这一组数据的75%分位数为84.3.答案:C解析:去掉一个最高分95分与一个最低分89分后,所得的5个得分分别是90,90,93,94,93,所以该选手的最后得分为90+90+93+94+935=4605=92(分).故选C .4.答案:A解析:由于x 1+x 2+…+x 100=100x -,而x 1+x 2+…+x 40=40a 1,x 41+x 42+…+x 100=60a 2,于是,x -=40a 1+60a 2100.5.答案:21解析:由题意知x +232=22,则x =21.6.答案:②解析:鞋店经理最关心的是哪种鞋号的鞋销量最大,即数据的众数.由表可知,鞋号为37的鞋销量最大,共销售了16双,所以这组数据的众数为37.7.答案:D解析:平均数为x -′=3x --2=3×2-2=4,方差为s′2=9s 2=9×13=3.8.答案:C 解析:x -=300×1.60+200×1.50300+200=1.56.9.答案:D解析:当每个数据都加上2后,众数、平均数、中位数都会发生变化,不变的是数据的波动情况,即标准差不变.10.答案:C解析:一组数据x 1,x 2,…,x 10的标准差为8,所以方差为64,数据2x 1-1,2x 2-1,…,2x 10-1的方差为4×64,所以标准差为4×64=16.11.答案:221517解析:这组数据从小到大排列后,22处于最中间的位置,故这组数据的中位数是22.∵5×10%=0.5,∴该组数据的10%分位数是15,∵5×20%=1,∴该组数据的20%分位数是15+192=17.12.答案:甲甲解析:x -甲=70,x -乙=68,s 2甲=15×(22+12+12+22)=2,s 2乙=15×(52+12+12+32)=7.2.13.解析:(1)甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数这一角度看,甲组成绩好些.(2)甲、乙两组成绩的中位数、平均数都是80,其中甲组成绩在80分以上(含80分)的有33人,乙组成绩在80分以上(含80分)的有26人,从这一角度看,甲组成绩总体较好.(3)从成绩统计表看,甲组成绩大于或等于90分的有20人,乙组成绩大于或等于90分的有24人,所以乙组成绩在高分段的人数多.同时,乙组满分比甲组多6人,从这一角度看,乙组成绩较好.14.解析:(1)x-=5.5+5+3.5×2+3+2.5×5+2×3+1.5×2033≈2.1,中位数为1.5,众数为1.5,极差为4.(2)x-=30+20+3.5×2+3+2.5×5+2×3+1.5×20≈3.3,中位数为1.5,众数为1.5,33极差为28.5.(3)中位数或众数均能反映该公司职工每人所创年利润的平均水平.这是因为公司中少数人每人所创年利润与大多数人每人所创年利润差别较大,这样导致平均数与中位数或众数偏差较大,所以平均数不能反映这个公司职工每人所创年利润的平均水平.。
§4数据的数字特征1.某班一次语文测验的成绩如下:得100分的3人,得95分的5人,得90分的6人,得80分的2人,70分的16人,60分的5人,则该班这次语文测验的众数是()A.70分B.80分C.16人D.10人2.一组数据为168,170,165,172,180,163,169,176,148,则这组数据的中位数是()A.168 B.169 C.168。
5 D.1703.已知容量为40的样本方差s2=4,则其标准差s等于() A.4 B.3 C.2 D。
错误!4.已知下列一组数据:10 20 80 40 30 90 50 40 50 40试分别求出该组数据的众数、中位数与平均数.答案:1.A 众数即出现次数最多的数.由题意知,该班这次语文测验的众数是70分.故选A.2.B 将一组数据按从小到大的顺序依次排列,处在中间位置的一个(或最中间两个数据的平均数)即为该组数据的中位数,所以169是所求的中位数.3.C s=s2=2.4.解:将数据由小到大排列得:10 20 30 40 40 40 50 50 80 90在上面数据中,40出现了3次,是出现次数最多的,所以这组数据的众数为40;最中间的两个数均为40,所以中位数为40;平均数错误!=错误!(10+20+30+40+40+40+50+50+80+90)=45.1.下列说法错误的是( )A .一组数据的众数、中位数和平均数不可能是同一个数B .极差、方差和标准差都是刻画数据离散程度的统计量C .一组数据的平均数既不可能大于,也不可能小于这组数据中的所有数据D .众数、中位数和平均数从不同角度描述了一组数据的集中趋势 2.期中考试结束以后,班长算出了全班40个人数学成绩的平均分为M ,若把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N,则MN 等于( )A 。
错误!B .1 C.错误! D .23.某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为… ( )A .85,85,85B .87,85,86C .87,85,85D .87,85,904.5个数1,2,3,4,a 的平均数是3,则a =______,这5个数的标准差是________.5.在一次歌手大奖赛中,6位评委现场给每位歌手打分,然后去掉一个最高分和一个最低分,其余分数的平均数作为该歌手的成绩.已知6位评委给某位歌手的打分是:9.2 9。
数据的数字特征-课文知识点解析要点提炼1.众数、中位数、平均数在教材所给问题中,甲组数据的中位数是21(18+22)=20;众数是10、18、30;平均数是22.2.乙组数据的中位数是21(27+31)=29;众数是23、24;平均数是28.6. 我们再看下面的例子:假设我们通过抽样,获得了某城市100位居民2003年的月均用水量(单位:t ). 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.3.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0.3 0.3.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.64.3.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.2.6 2.72.4 2.1 1.7 1.4 1.2 1.5 0.5 2.2.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.2.82.52.22.01.51.01.21.80.62.作出这些样本数据的频率直方图.频率 组距月均用水量(t )0.500.400.300.200.100.5 1 1.5 2 2.5 3 3.5 4 4.5图1-5-1 从图1-5-1中可以看出月均用水量的众数是2.25 t (最高矩形的中点).这组数据的中位数可经计算求得为2,那能否从频率分布直方图中估计中位数呢?我们知道在这组数据中有50%的数小于或等于中位数,也有50%的数大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.由此可以估计中位数的值(如图1-5-2虚线处代表中位数的估计值).由图1-5-2显示,大部分居民的月均用水量在中部,但也有少数居民的月均用水量特别高,因此,应该对这部分居民的用水量作出合理限制.如果有n 个数x1,x2,…,xn ,那么它们的平均数为x =n 1(x1+x2+…+xn ).全析提示一组数据的众数、中位数、平均数既可以由计算得出,也可以在数据的频率直方图中显现出来.在图1-5-1中我们能更容易地理解它们的意义和作用.思维拓展中位数不受少数几个极端值的影响.频率 组距月均用水量(t )0.500.400.300.200.100.5 1 1.5 2 2.5 3 3.5 4 4.5图1-5-2 居民月均用水量的平均数可由公式x =1001(x1+x2+…+x100)求得x =1.973.在频率分布直方图中,平均数是“重心”,也可以显示出来,如图1-5-3.频率组距月均用水量(t )0.500.400.300.200.100.5 1 1.5 2 2.5 3 3.5 4 4.5图1-5-3 平均数与每一个数据都有关,因此,任何一个数据的改变都会引起平均数的改变,这是中位数、众数都不具有的性质.由图1-5-3可以看出,用水量最多的几个居民对平均数影响较大,因为他们的用水量与平均数相差太大了.作为刻画一组数据集中趋势的统计量,平均数、中位数、众数,它们各有各自代表的角度,各有优缺点,也各有各的用处.平均数是刻画一组数据集中趋势最常用的统计量. 2.标准差有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲 7 8 7 9 5 4 9 10 7 4 乙 9 5 7 8 7 6 8 6 7 7如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择? 如果看两人本次射击的平均成绩,由于 x 甲=7,x 乙=7,两人射击的平均成绩是一样的,那么,是否两个人的水平就没有什么差异呢?频率 0.40.30.20.1环数4 5 6 7 8 9 10频率 0.40.30.20.1环数4 5 6 7 8 9 10(1) (2)00图1-5-4思维拓展与中位数、众数比起来,平均数可以反映出更多的关于数据全体的信息. 全析提示从不同的角度出发,对同一组数据所表达的信息也不同.教练员要分析两名运动员的优缺点,以便有针对性地训练;若是选拔性考核,就要看两名运动员谁的成绩更好一些.直观上看,还是有差异的.例如,甲成绩比较分散,乙成绩相对集中(如图1-5-4所示).因此,我们还需要从另外的角度来考察这两组数据.例如,在作统计图、表时提到过的极差. 甲的环数极差=10-4=6, 乙的环数极差=9-5=4.它们在一定程度上表明了该组数据的分散程度.显然,极差对极端值非常敏感,注意到这一点,我们就可以理解“去掉一个最高分,去掉一个最低分”的统计策略.考察一组数据的分散程度的大小,最常用的统计量是标准差.标准差是数据到平均数的平均距离,一般用S 表示.假设一组数据是x1,x2,…,xn ,x 表示这组数据的平均数.xi 到x 的距离是|xi -x |(i=1,2,…,n ).于是x1,x2,…,xn 到x 的“平均距离”是 S=n x x x x x x n ||||||21-++-+- .由于上式含有绝对值,运算不太方便,因此,常改用如下公式来计算标准差.S=])()()[(122221x x x x x x n n -++-+- .一组数据中每个数与平均数之间的距离关系可用图1-5-5表示.x x x x x xmm n m = 221 11S图1-5-5显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.用计算机电子表格软件(如Excel )或科学计算器可以求得 S 甲=2,S 乙=1.095.由S 甲>S 乙,可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙的射击成绩比甲的稳定.此外,上面两组数据的离散程度与标准差之间可用图1-5-6直观地表示出来.21.095S S = = 甲 乙4 5 6 7 8 9 10********************要点提炼计算数据x1,x2,…,xn 的标准差的算法:(1)算出数据的平均数x ; (2)算出每个数据与平均数x 的差xi -x ;(3)算出(2)中xi -x 的平方; (4)算出(3)中n 个平方数的平均数,即为方差;(5)算出(4)中平均数的算术平方根,即为标准差.图1-5-6高中数学数据的数字特征课文知识点解析。
数据的数字特征-例题解析
刻画数据集中趋势的统计量有平均数、中位数和众数,它们作为一组数据的代表各有优缺点,也各有各的用处.
平均数是将所有的数据都考虑进去得到的度量,它是反映数据集中趋势最常用的统计量;中位数将观测数据分成相同数目的两部分,其中一部分都比这个数小,而另一部分都比这个数大,对于非对称的数据集,中位数更实际地描述了数据的中心;当变量是分类变量时,众数往往经常被使用.
刻画数据离散程度的统计量有极差、方差和标准差.虽然极差没有充分利用数据,不能提供更确切的信息,但由于只涉及两个数据,便于计算,所以极差在实际中也经常用到.方差虽然充分利用了所得到的数据,提供了更确切的信息,但方差的单位是原始观测数据的单位的平方,在统计中,我们通常用标准差来刻画数据的离散程度.
【例题】 从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下: 甲:7,8,6,8,6,5,9,10,7,4. 乙:9,5,7,8,7,6,8,6,7,7.
(1)计算甲、乙两人射击命中环数的平均数和标准差; 答案:计算得x 甲=7,x 乙=7,s 甲=1.73,s 乙=1.10. (2)比较两人的成绩,然后决定选择哪一个人参赛. 分析:数据x1,x2,…,xn 的平均数
x =n x x x n +⋅⋅⋅++21.
标准差s=n x x x x x x n 2
2221)()()(-+⋅⋅⋅+-+-.
根据计算得平均数和标准差,分析甲、乙两人成绩的集中和离散程度,从而选择一人参赛.
答案:由(1)可知,甲、乙两人的平均成绩相等,但s 乙<s 甲,这表明乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参赛.
【例题】 某企业员工的月工资资料如下:(单位:元)
800 800 800 800 800 1000 1000 1000 1000 1000 1000 1000 1000 1000 1000 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1200 1500 1500 1500 1500 1500 1500 1500 2000 2000 2000 2000 2000 2500 2500
2500
(1)计算该公司员工月工资的平均数、中位数和众数;
解:经计算公司员工的月工资的平均数为x =502500
800800+⋅⋅⋅++=1320元,中位数为1200,众数为1200. (2)假如你去这家企业应聘职位,你会如何看待员工的收入情况?
解:你应该考虑月工资的平均数1320元作为月工资的代表,因为,一般来讲,月平均工资水平可以用来
与同类企业的工资待遇作比较.
点评:平均数、中位数和众数都是用来描述数据集中趋势的统计量,它们又有各自的特点,平均数是将所有的数据都考虑进去得到的度量,它是反映数据集中趋势最常用的量,中位数可靠性较差,当一组数据中个别数据变动较大时,常用中位数表示数据的集中趋势.而众数求法较简便,也经常被用到.。