统编人教A版高中必修第二册《9.2 用样本估计总体》名校精品导学案
- 格式:doc
- 大小:476.00 KB
- 文档页数:10
人教A 版数学必修第二册第九章《统计》同步讲义9.2 用样本估计总体一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积= =频率.(二)频率分布直方图的性质1.因为小矩形的面积= = ,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。
3.直方图主要用于直观描述不同类别或分组数据的频数和频率,直方图适用于描述连续型数据.4.折线图主要用于描述数据随时间的变化趋势.三.总体百分位数的估计1.百分位数定义:一般地,一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有p %的数据小于或等于这个值,且至少有(100-p )%的数据大于或等于这个值.2.常用的百分位数(1)四分位数:第25百分位数,第50百分位数,第75百分位数.(2)其它常用的百分位数:第1百分位数,第5百分位数,第95百分位数,第99百分位数.3.计算一组n 个数据的第p百分位数的一般步骤如下:第1步,按从小到大排列原始数据;第2步,计算i =n ×p %;第3步,若i 不是整数,而大于i 的比邻整数为j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第(i +1)项数据的平均数.四.总体集中趋势的估计(一)众数、中位数、平均数1.众数:一组数据中出现次数最多的数.2.中位数:如果一组数有奇数个数,且按照从小到大排列后为x 1,x 2,…,x 2n +1,则称x n +1为这组数的中位数;如果一组数有偶数个数,且按照从小到大排列后为x 1,x 2,…,x 2n ,则称x n +x n +12为这组数的中位数.3.平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n(x 1+x 2+…+x n )叫做这n 个数的平均数.(二)频率分布直方图中平均数、中位数、众数的求法(1)众数:取最高小长方形底边中点的横坐标作为众数.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x 轴交点的横坐标称为中位数.(3)平均数:平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和. 五.总体离散程度的估计1.假设一组数据为x 1,x 2,…x n ,则这组数据的平均数= ,方差为标准差2.如果总体中所有个体的变量值分别为Y 1,Y 2,…,Y N ,总体平均数为,则称为总体方差,S =S 2为总体标准差.3.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小.4.分层随机抽样的方差设样本中不同层的平均数分别为x 1,x 2,…,x n ,方差分别为s 21,s 2,…,s 2n ,相应的权重分别为w 1,w 2,…,w n,则这个样本的方差为x s =Y n22i i 11S (Y Y)N ==-∑n222ii i i 1S w [S(x x)]==+-∑题型一 总体取值规律的估计【例1-1】(2023·全国·高一专题练习)在2022年某地销售的汽车中随机选取1000台,对销售价格与销售数量进行统计,这1000台车辆的销售价格都不小于5万元,小于30万元,将销售价格分为五组:(单位:万元).统计后制成的频率分布直方图如图所示.在选取的1000台汽车中,销售价格在内的车辆台数为( )A .800B .600C .700D .750【例1-2】(2023天津)从某小区抽取100户居民用户进行月用电调查,发现他们的用电量都在之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.在被调查的用户中,用电量落在区间内的户数为( )A .45B .46C .54D .70【例1-3】(2023·江苏)党的二十大报告指出:“全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之.”某区域教育部门为提高学生的创新能力,组织了200名学生参与研究性学习,每人仅参加1个课题组,参加各课题组的人数占比的扇形统计图如图所示,则参加数学类的人数比参加理化类的人数多()[)[)[)[)[)5,1010,1515,2020,2525,30,,,,[)10,2050350kW h ⋅:[100,200)A .16B .30C .32D .62【例1-4】(2023云南)下图是国家统计局发布的我国最近10年的人口出生率(单位:‰),根据下图,则( )A .这10年的人口出生率逐年下降B .这10年的人口出生率超过12‰的年数所占比例等于45%C .这10年的人口出生率的80%分位数为13.57‰D .这10年的人口出生率的平均数小于12‰题型二 总体百位分数的估计【例2-1】(2023·辽宁)某地有9个快递收件点,在某天接收到的快递个数分别为360,284,290,300,402,188,240,260,288,则这组数据的第72百分位数为( )A .290B .295C .300D .330【例2-2】(2023·全国·高一专题练习)《中国居民膳食指南(2022)》数据显示,6岁至17岁儿童青少年超重肥胖率高达19.0%.为了解某地中学生的体重情况,某机构从该地中学生中随机抽取100名学生,测量他们的体重(单位:千克),根据测量数据,按分成六组,得到的频率分布直方图如图所示.根据调查的数据,估计该地中学生体重的第75百分位数是()[40,45),[45,50),[50,55),[55,60),[60,65),[65,70]A .55B .57.25C .58.75D .60题型三 总体集中趋势的估计【例3-1】(2023上海徐汇)军训时,甲、乙两名同学进行射击比赛,共比赛10场,每场比赛各射击四次,且用每场击中环数之和作为该场比赛的成绩.数学老师将甲、乙两名同学的10场比赛成绩绘成如图所示的茎叶图(成绩的十位数为“茎”,个位数为“叶”),并给出下列三个结论:①甲的成绩的极差是29;②乙的成绩的中位数是18;③乙的成绩的众数是22.则三个结论中,正确结论个数为( ).A .3B .2C .1D .0【例3-2】(2023秋·内蒙古包头·高三统考期末)某公司为了解用户对其产品的满意度,从使用该产品的用户中随机调查了100个用户,根据用户对产品的满意度评分,得到如图所示的用户满意度评分的频率分布直方图.若用户满意度评分的中位数、众数、平均数分别为a ,b ,c ,则( )A .B .C .D .【例3-3】(2023春·浙江温州)(多选)《国家学生体质健康标准》是国家学校教育工作的基础性指导文件和教育质a b c <<b a c <<a c b <<b<c<a量基本标准,它适用于全日制普通小学、初中、普通高中、中等职业学校、普通高等学校的学生.某高校组织名大一新生进行体质健康测试,现抽查200名大一新生的体测成绩,得到如图所示的频率分布直方图,其中分组区间为,,,,,.则下列说法正确的是( )A .估计该样本的众数是B .估计该样本的均值是C .估计该样本的中位数是D .若测试成绩达到分方可参加评奖,则有资格参加评奖的大一新生约为人题型四 总体离散程度的估计【例4-1】(2023·高一课时练习)两名运动员在某次测试的6次成绩如图所示,则两人平均数与方差的关系是( )A .甲的平均数大,方差小B .平均数相等,甲方差大C .平均数相等,甲方差小D .平均数和方差都相等【例4-2】(2023 浙江湖州 )(多选)为响应自己城市倡导的低碳出行,小李上班可以选择公交车、自行车两种交通工具,他分别记录了100次坐公交车和骑车所用时间(单位:分钟),得到下列两个频率分布直方图:基于以上统计信息,则()4000[70,75)[75,80)[80,85)[85,90)[90,95)[95,100)87.58086852200A .骑车时间的中位数的估计值是22分钟B .坐公交车时间的40%分位数的估计值是19分钟C .坐公交车时间的平均数的估计值小于骑车时间的平均数的估计值D .坐公交车时间的方差的估计值小于骑车时间的方差的估计值【例4-3】(2023内蒙古赤峰·)甲、乙两名同学12次考试中数学成绩的茎叶图如图所示,则下列说法正确的是( )A .甲同学比乙同学发挥稳定,且平均成绩也比乙同学高B .甲同学比乙同学发挥稳定,但平均成绩比乙同学低C .乙同学比甲同学发挥稳定,且平均成绩也比甲同学高D .乙同学比甲同学发挥稳定,但平均成绩比甲同学低【例4-4】(2023 北京·高一校考期末)经过简单随机抽样获得的样本数据为,且数据的平均数为,方差为,则下列说法正确的是( )A .若数据,方差,则所有的数据都为0B .若数据,的平均数为,则的平均数为6C .若数据,的方差为,则的方差为12D .若数据,的分位数为90,则可以估计总体中有至少有的数据不大于9012,,,n x x x 12,,,n x x x x 2s 12,,,n x x x 20s =()1,2,,i x i n = 12,,,n x x x 3x =()211,2,,i i y x i n =+= 12,,,n x x x 23s =()211,2,,i i y x i n =+= 12,,,n x x x 25%75%答案解析一.总体取值规律的估计(一)作频率分布直方图的步骤1.求极差:极差为一组数据中最大值与最小值的差.2.决定组距与组数将数据分组时,一般取等长组距,并且组距应力求“取整”,组数应力求合适,以使数据的分布规律能较清楚地呈现出来.3.将数据分组4.列频率分布表:各小组的频率=小组频数样本容量.5.画频率分布直方图纵轴表示频率组距,频率组距实际上就是频率分布直方图中各小长方形的高度,小长方形的面积=组距×频率组距=频率.(二)频率分布直方图的性质1.因为小矩形的面积=组距×频率组距=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小.2.在频率分布直方图中,各小矩形的面积之和等于1.3.频数相应的频率=样本容量.二.常见统计图表的特点与区别1.扇形图:用于直观描述各类数据占总数的比例,易于显示每组数据相对于总数的大小2.条形图:主要用于直观描述不同类别或分组数据的频数和频率,适用于描述离散型数据。
【新教材】9.2.2 总体百分数的估计(人教A版)1.理解百分位数的统计含义.2.会求样本数据的第p百分位数.1.数学抽象:百分位数的统计含义;2.数学运算:求样本数据的第p百分位数.重点:①百分位数的统计含义;②求样本数据的第p百分位数.难点:求样本数据的第p百分位数.一、预习导入阅读课本201-203页,填写。
1.第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.2.计算第p百分位数的步骤第1步,按从到排列原始数据.第2步,计算i=.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的.3.四分位数常用的分位数有第百分位数、第百分位数、第百分位数,这三个分位数把一组由小到大排列后的数据分成份,因此称为四分位数.其中第百分位数也称为第一四分位数或下四分位数等,第百分位数也称为第三四分位数或上四分位数等.1.一组数据的中位数相当于是()A.第25百分位数B.第50百分位数C.第75百分位数D.第95百分位数2.求下列一组数据1,2,2,3,4,4,5,6,6,7的第30 百分位数()A.2B.3C.4 D.2.53.对某自行车赛手在相同条件下进行了12次测试,测得其最大速度(单位:m/s)的数据如下:27,38,30,36,35,31,33,29,38,34,28,36.则他的最大速度的第一四分位数是()A.27.5 B.28.5C.29.5 D.30.54.下表所给数据的第85百分位数为________.2 3 4 5 62 9503 0502 8802 7552 710891011123 1302 9403 3252 9202 880题型一百分位数在具体数据中的应用例1有一样本的数据为3310,3355,3450,3480,3490,3520,3540,3550,3650,3730,3925,求这组数据的第50百分位数和第75百分位数.跟踪训练一1.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107.乙:83,86,93,99,88,103,98,114,98,79,78,106,101.计算出学生甲、乙的第25,50的百分位数.题型二百分位数在统计表或统计图中的应用例2根据表1或图1,估计月均用水量的样本数据的80%和95%分位数.分组频数累积频数频率[1.2,4.2)正正正正230.23[4.2,7.2)正正正正正正320.32[7.2,10.2)正正130.13[10.2,13.2)正90.09[13.2,16.2)正90.09[16.2,19.2)正50.05[19.2,22.2)30.03[22.2,25.2)40.04[25.2,28.2]20.02合计100 1.00表1跟踪训练二1.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?1.已知100个数据的第75百分位数是9.3,则下列说法正确的是()A. 这100个数据中一定有75个数小于或等于9.3B. 把这100个数据从小到大排列后,9.3是第75个数据C. 把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D. 把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数2.高二(1)班7人宿舍中每个同学的身高分别为170,168,172,172,175,176,180,求这7人的第40的百分位数为()A.168B.170C.172 D.1713.以下数据为参加数学竞赛决赛的15人的成绩:78,70,72,86,88,79,80,81,94,84,56,98,83,90,91,则这15人成绩的第80百分位是()A.90B.90.5C.91D.91.54.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为.5.从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,75,95百分位数.(2)请你找出珍珠质量较小的前15%的珍珠质量.(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.答案小试牛刀1. B.2.A.3.C.4.3130自主探究例1【答案】第50百分位数和第75百分位数分别为3520,3650.【解析】(1)∵i=50%×11=5.5,∴第50百分位数是第6项的值3520.= 8.25,(2)∵i=0.75×11=334∴第75百分位数是第9项的值,即3650.所以第50百分位数和第75百分位数分别为3520,3650.跟踪训练一1.【答案】学生甲的第25,50的百分位数为76,88.学生乙的第25,50的百分位数为86,98.【解析】把甲、乙两名学生的数学成绩从小到大排序,可得甲:65,71,75,76,81,86,88,89,91,94,95,107,110.乙:78,79,83,86,88,93,98,98,99,101,103,106,114.由13×25%=3.25,13×50%=6.5.可得数据的第25,50百分位数为第4,7项数据,即学生甲的第25,50的百分位数为76,88.学生乙的第25,50的百分位数为86,98.例2【答案】月均用水量的样本数据的80%分位数约为14.2.月均用水量的样本数据的95%分位数约为22.95.【解析】由表1可知,月均用水量在13.2 t 以下的居民用户所占比例为23%+32%+13%+9%=77%. 在16.2 t 以下的居民用户所占的比例为 77%+9%=86%.因此,80%分位数一定位于[13.2,16.2)内.由 13.2+3×0.80-0.770.86-0.77=14.2,可以估计月均用水量的样本数据的80%分位数约为14.2. 类似地,由22.2+3×0.95-0.940.98-0.94=22.95,可以估计月均用水量的样本数据的95%分位数约为22.95. 跟踪训练二1.【答案】第50百分位数和第75百分位数分别估计为103.3 cm,112.5 cm .. 【解析】 由题意知分别落在各区间上的频数为在[80,90)上有60×0.15=9, 在[90,100)上有60×0.25=15, 在[100,110)上有60×0.3=18, 在[110,120)上有60×0.2=12, 在[120,130]上有60×0.1=6.从以上数据可知第50百分位数一定落在区间[100,110)上,由100+10×0.5-0.40.7-0.4=100+103≈103.3;第75百分位数一定落在区间[110,120)上,由110+10×0.75-0.70.9-0.7=110+104=112.5;综上可知,第50百分位数和第75百分位数分别估计为103.3 cm,112.5 cm . 当堂检测1-3. CCB 4.1009. 5.【答案】 (1)第25百分位数是8.15,第75百分位数是8.75,第95百分位数是9.9.(2)产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)质量小于或等于8.15 g 的珍珠为次品,质量大于8.15 g 且小于或等于8.5 g 的珍珠为合格品,质量大于8.5 g 且小于等于9.9的珍珠为优等品,质量大于9.9 g 的珍珠为特优品. 【解析】(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×75%=9,12×95%=11.4, 则第25百分位数是8.0+8.32=8.15,第75百分位数是8.6+8.92=8.75,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9. 即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15 g ,第50百分位数为8.5 g, 第95百分位数是9.9,所以质量小于或等于8.15 g 的珍珠为次品,质量大于8.15 g 且小于或等于8.5 g 的珍珠为合格品,质量大于8.5 g 且小于等于9.9的珍珠为优等品,质量大于9.9 g 的珍珠为特优品.。
9.2.2总体百分位数的估计一、内容和内容解析内容:总体百分位数的估计.内容解析:本节课选自《普通高中课程标准数学教科书-必修第二册》(人教A版)第九章第2节第2课时的内容.本节内容是抽样的基础上,对统计的数据进行分析,同时,利用样本数据估计总体情况,主要针对频率分布表和频率分布直方图进行统计分析的学习.通过对百分位数概念的学习,让学生尝试运用总体百分位数的估计来解决实际问题,体会总体百分位数的估计的意义和作用,体会用样本估计总体的思想与方法。
从而发展学生的直观想象、逻辑推理、数学建模的核心素养.二、目标和目标解析目标:(1)理解百分位数的统计含义.(2)会求样本数据的第p百分位数.目标解析:(1)百分位数直观上比较容易理解,它把一组按大小排列的数据分成相应百分比的两部分.不管是对有限总体,还是从总体中抽取的样本,观测得到的都是一组数据.(2)数学核心素养是数学教学的重要目标,但数学核心素养需要在每一堂课中寻找机会去落实.在本节的教学中,利用电子表格进行求解百分位数,同时在具体问题中学习百分位数,也是进行数学建模教学的好机会.基于上述分析,本节课的教学重点定为:结合实例,能用样本估计百分位数.三、教学策略分析本节课的教学目标与教学问题为我们选择教学策略提供了启示.为了让学生通过观察、实践理解并会求百分位数,应该为学生创造积极探究的平台.因此,在教学过程中使用情境教学.既可以帮助学生理解,也可以让学生从被动学习状态转到主动学习状态中来.在教学设计中,采取问题引导方式来组织课堂教学.问题的设置给学生留有充分的思考空间,让学生围绕问题主线,通过自主探究达到突出教学重点,突破教学难点.在教学过程中,重视百分位数统计含义,让学生体会到应用知识解决问题的基本过程,同时,求具体问题百分位数的过程其实就是数学模型的建立与应用的典范.因此,本节课的教学是实施数学具体内容的教学与核心素养教学有机结合的尝试.四、教学过程与设计估计参赛学生的成绩的25%,90%分位数.[课堂练习1]某中学从高一年级中抽取了30名男生,测量其体重,数据如下(单位:千克):62 60 59 59 59 58 58 57 57 5756 56 56 56 56 56 55 55 55 5454 54 53 53 52 52 51 50 49 48(1)求这30名男生体重的25%,75%分位数;(2)估计本校高一男生体重的第80百分位数.[课堂练习2]为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,你能估计一下60株树木的第50百分位数和第75百分位数吗?教师10:提出问题7.学生10:学生11:学生课后进行思考,并完成课后练习.答案:1.C 2.8.4 3.100 9排列后,9.3是第75个数据和第74个数据的平均数 2.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数是________. 3.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________.答案:1.C 2.8.4 3.1009。
9.2.2总体百分数的估计一、教学目标1.通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养.2.掌握求一组数据的百分位的基本步骤:3.通过对总体百分数的估计的学习,培养学生数学抽象、数学运算、数学建模等数学素养。
二、教学重难点1.理解百分位数的概念及其简单应用2.求样本数据的第p百分位数.三、教学过程:(1)创设情景阅读课本,完成下列填空。
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有________的数据小于或等于这个值,且至少有_________的数据大于或等于这个值.(2)新知探究问题1:计算一组n个数据的第p百分位数有哪些具体步骤?学生回答,教师点拨并(提出本节课所学内容)(3)新知建构第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.计算第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第项与第(i+1)项数据的平均数.(4)数学运用例1.现有甲、乙两组数据如下表所示.组试求甲、乙两组数的25%分位数与75%分位数.【解析】因为数据个数为20,而且20×25%=5,20×75%=15. 因此,甲组数的25%分位数为x 5+x 62=2+32=2.5;甲组数的75%分位数为x 15+x 162=9+102=9.5.乙组数的25%分位数为x 5+x 62=1+12=1,乙组的75%分位数为x 15+x 162=10+142=12.变式训练1:某所学校在一个学期的开支分布的饼图如图1所示,在该学期的水、电、交通开支(单位:万元)如图2所示,则该学期的水电费开支占总开支的百分比为( )A .12.25%B .16.25%C .11.25%D .9.25%【答案】B【解析】由图2知,水、电支出占水、电、交通支出的比例为2004501320045015016+=++,由图1知,水、电、交通支出占学校一个学期总开支的比例为15,因此,该学期的水电费开支占总开支的百分比为1311316.25%16580⨯==,故选:B 。
9.2.2总体百分位数的估计一、教学目标1.结合实例,理解百分位数的定义,会求一组数据的第p百分位数,发展数据分析的核心素养.2.让学生体会用样本百分位数估计总体百分位数的思想,提高分析问题和解决问题的能力.3.通过具体实例,让学生体会百分位数在实际生活中的应用.引导学生用数学的眼光观察世界,用数学的思维思考世界,会用数学的语言表达世界.4.学会利用Excel软件计算百分位数的方法,体会信息技术是学习统计的有效辅助手段.二、教学重点用样本百分位数估计总体百分位数.三、教学难点百分位数的统计含义,以及统计图、表中百分位数的计算方法.四、教学过程(一)创设情境,引入新知师:同学们,你们知道家里每月用多少吨水吗?你们知道家里的水费按照什么标准收取吗?课后大家可以去调查一下。
平时打开水龙头用水很方便,但实际上,我国是世界上严重缺水的国家之一,为了减少水资源的浪费,很多地方都实施阶梯水价制度。
问题:如果某市政府希望使80%的居民用户生活用水支出不受影响,根据前面100户居民用户的月均用水量数据,你能给市政府提出确定居民用户月均用水量标准的建议吗?追问:如何理解使80%的居民用户生活用水支出不受影响?师生活动:教师引导,学生思考.根据市政府的要求确定居民用户月均用水量标准,就是要寻找一个数a,使全市居民用户月均用水量中不超过a的占80%,超过a的占20%.如何确定这个数a呢?【设计意图】结合前面的学习,继续对居民用户月均用水量的样本数据进行分析处理,引导学生经历分析一个案例的完整过程,进一步发展学生的数据分析意识与能力.思考1:在前面的100个样本数据中,怎么去找这个数a呢?在我们以往的学习过程中遇到过类似的问题吗?(中位数)思考2:一组数据的中位数怎么找?举例:求1,2,4,5 和1,2,2,4,5的中位数.师生活动:教师引导学生思考分析,求相应的中位数.【设计意图】通过问题链的形式将原问题转化为求100个数据的某个位置的数,利用已有的知识探究新知.(二)独思共议,探究新知师:中位数是有50%的数据不超过这个数,50%的数据超过这个数.中位数又称为第50百分位数,或者50%分位数.对于前面问题中要找的数a,即有80%的数据不超过这个数,20%的数据超过这个数,数a称为第80百分位数,或者80%分位数.进一步,你能归纳第p百分位数的定义吗?师生活动:教师板书“1.百分位数的定义”,学生小组讨论,归纳第p百分位数的定义,由学生在黑板上展示想法.预设:学生可能不会想到百分位数定义中的“至少”,师生活动:提示学生1,2,2,4,5的中位数为2,小于等于2的有60%,大于等于2的有80%,引导学生得到百分位数定义中“至少”的概念.百分位数定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.【设计意图】结合实例,在学生理解中位数所在位置的基础上,引出第80百分位数,进一步归纳第p百分位数的定义,体会由特殊到一般的数学思想.追问:除了中位数外,还有哪些重要的百分位数呢?师生活动:教师引导给出结论.在实际应用中除了中位数外,常用的百分位数还有第25百分位数和第75百分位数.这三个百分位数把一组由小到大排列的数据分成四等份,因此称为四分位数.其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数。
9.2.1总体取值规律的估计知识点一频率分布表与频率分布直方图1.一般地,当总体很大或不便获取时,用□01样本的频率分布估计□02总体的频率分布.把反应总体频率分布的表格称为□03频率分布表.2.把表示□04样本数据分布规律的图形称为□05频率分布直方图.3.制作频率分布表与频率分布直方图的一般步骤:(1)求极差,即计算□06最大值与最小值的差.(2)决定□07组距与组数.(3)将数据□08分组.(4)列□09频率分布表.(5)画频率分布直方图.知识点二常用的统计图1.条形图条形图能清楚地表示出每个项目的□01具体数量.2.折线图折线图能够清晰地反映数据的□02变化趋势或情况.3.扇形图扇形图能直观、生动地反映各部分在总体中所占的□03比例情况.1.频率分布直方图能够直观、形象地反映样本的分布规律,可以大致估计出总体的分布,但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.在频率分布直方图中,由于长方形的面积S=组距×频率组距=频率,所以各个小长方形的面积表示相应各组的频率,这样频率分布直方图就以面积的形式反映了数据在各个小组的频率的大小,各个小长方形的面积总和等于1.2.一般地,样本量越大,这种估计就越精确.总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图).提醒:直方图的纵轴(小长方形的高)一般是频率除以组距的商,横轴一般是数据的大小,小长方形的面积表示频率.1.判一判(正确的打“√”,错误的打“×”)(1)频率分布直方图的纵轴表示频率.()(2)数据落在各小组内的频率用各小组频数样本量来表示.()(3)频率分布直方图把样本数据落在各小组的比例大小直观化,更有利于我们从整体上把握数据分布的特点.()答案(1)×(2)√(3)√2.做一做(1)将容量为100的样本数据分为8个组,如下表:组号12345678频数1013x 141513129 则第A.0.03 B.0.07C.0.14 D.0.21(2)一个容量为n的样本,分成若干组,已知某组的频率和频数分别为0.125和40,则n的值为()A.640 B.320C.240 D.160(3)一个容量为20的样本,分组后,组距与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则样本在[10,50)上的频率为()A.120 B.14 C.12 D.710(4)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有______株树木的底部周长小于100 cm.答案(1)C(2)B(3)D(4)24题型一频率分布直方图的画法例1从某校高一年级1002名新生中随机抽取一个容量为100的身高样本,数据如下(单位:cm),试作出该样本的频率分布表和频率分布直方图.168165171167170165170152175174165170168169171166164155164158170155166158155160160164156162160170168164174171165179163172180174168164174171165179163169151168158168176155165165169162177158175165169151163166163167178165158170169159155163153155167163164158168167161162167168161165174156167166162161164166[解](1)在全部数据中找出最大值180,最小值151,计算极差=180-151=29.(2)取组距为3,则组数为293≈10.(3)从第一组[150.5,153.5)开始,统计出各组的频数,再计算各组的频率,并将结果填入下表:频率分布直方图如图.绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.美国历届总统中,就任时年龄最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年龄最大的是特朗普,他于2016年就任,当时70岁.下面按时间顺序(从1789年的华盛顿到2016年的特朗普,共45任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,47,70.(1)将数据分为7组,列出频率分布表,并画出相应的频率分布直方图;(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.解(1)以4为组距,列频率分布表如下:分组频数频率[42,46)20.0444[46,50)70.1555[50,54)80.1778[54,58)160.3556[58,62)50.1111[62,66)40.0889[66,70]30.0667合计45 1.0000画出相应的频率分布直方图,如图所示.(2)从频率分布表中可以看出,将近60%的美国总统就任时的年龄在50岁至60岁之间,45岁及45岁以下和65岁以上就任的总统所占的比例相对较小.题型二频率分布直方图的应用例2为了迎接某市作为全国文明城市的复查,爱卫会随机抽取了60位路人进行问卷调查,调查项目是自己对该市各方面卫生情况的满意度(假设被问卷的路人回答是客观的),以分数表示问卷结果,并统计他们的问卷分数,把其中不低于50分的分成五段:[50,60),[60,70),…,[90,100]后画出如图所示的部分频率分布直方图,观察图形信息,回答下列问题:(1)求出问卷调查分数低于50分的被问卷人数;(2)估计全市市民满意度在60分及以上的百分比.[解](1)因为各组的频率之和等于1,故低于50分的频率为f=1-(0.015×2+0.030+0.025+0.005)×10=0.1,故低于50分的人数为60×0.1=6.(2)依题意,60分及以上的频率和为(0.015+0.030+0.025+0.005)×10=0.75,所以抽样满意度在60分及以上的百分比为75%.于是,可以估计全市市民满意度在60分及以上的百分比为75%.频率分布直方图的应用频率分布指的是一个样本数据在各个小范围内所占比例的大小,一般用频率分布直方图反映样本的频率分布,其中:(1)频率分布直方图中纵轴表示频率组距;(2)频率分布直方图中,各个小长方形的面积等于频率,各个小长方形的面积之和为1;(3)长方形的高的比也就是频率之比.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图所示),由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.答案0.030 3解析因为频率分布直方图中各小长方形的面积之和为1,所以10×(0.005+0.035+a+0.020+0.010)=1,解得a=0.030.由图可知身高在[120,150]内的学生人数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内的学生中选取的人数为1860×10=3.题型三统计图表的应用例3某省有关部门要求各中小学要把“每天锻炼一小时”写入课程表,为了响应这一号召,某校围绕着“你最喜欢的体育活动项目是什么?(只写一项)”的问题,对在校学生进行了随机抽样调查,从而得到一组数据.图1是根据这组数据绘制的柱形图.请结合柱形图回答下列问题:(1)该校对多少名学生进行了抽样调查?(2)本次抽样调查中,最喜欢篮球活动的有多少人?占被调查人数的百分比是多少?(3)若该校九年级共有200名学生,图2是根据各年级学生人数占全校学生总人数的百分比绘制的扇形图,请你估计全校学生中最喜欢跳绳活动的人数约为多少?[解](1)由图1知4+8+10+18+10=50(名),所以该校对50名学生进行了抽样调查.(2)本次调查中,最喜欢篮球活动的有18人,占被调查人数的1850×100%=36%.(3)1-(30%+26%+24%)=20%,200÷20%=1000(人),850×100%×1000=160(人),所以估计全校学生中最喜欢跳绳活动的人数约为160.(1)柱形图是用一个单位长度表示一定的数量,根据数量的多少画成高度不同的小矩形,然后把这些小矩形按照一定的顺序排列起来.其特点是便于看出和比较各种数量的多少,即柱形图能清楚地表示出每个项目的具体数目.(2)扇形图是用整个圆面积表示总数(100%),用圆内的扇形面积表示各部分所占总数的百分数.总之,用图表来表示数量关系更生动形象、具体,使人一目了然.下表给出了2018年A,B两地的降水量(单位:mm):(1)根据统计表绘制折线图;(2)根据折线图比较A,B两地的降水量,分析哪个地方的降水量较大?解(1)建立直角坐标系,用横坐标上的点表示月份,用纵坐标上的点表示降水量,描出每个月份对应的点,然后用直线段顺次连接相邻的点,得到折线统计图如图表示.(2)观察折线图,从整体上看,B地降水量较大.1.反映某种股票的涨跌情况,应选择()A.条形图B.折线图C.扇形图D.三种图均可答案 B解析条形图主要用于直观描述不同类别或分组数据的频数,折线图主要用于描述数据随时间变化的趋势,扇形图主要用于直观描述各类数据占总数的比例.故选B.2.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,…,第五组,如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6 B.8C.12 D.18答案 C解析志愿者的总人数为20(0.24+0.16)×1=50,所以第三组的人数为50×0.36×1=18,所以有疗效的人数为18-6=12.3.一个频率分布表(样本量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为()A.14 B.15C.16 D.17答案 B解析∵样本中数据在[20,60)内的频率为0.8,∴样本数据在[20,60)内的频数为30×0.8=24,∴样本在[40,50),[50,60)内的数据个数共为24-4-5=15.4.某电子商务公司对10000名网络购物者2019年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为________.答案(1)3.0(2)6000解析由频率分布直方图及频率和等于1可得0.2×0.1+0.8×0.1+1.5×0.1+2.0×0.1+2.5×0.1+a×0.1=1,解得a=3.0,消费金额在区间[0.5,0.9]内的频率为0.2×0.1+0.8×0.1+2.0×0.1+3.0×0.1=0.6,所以消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10000=6000.5.从高三参加数学竞赛的学生中抽取50名学生的成绩,成绩的分组及各组的频数如下(单位:分):[40,50),2;[50,60),3;[60,70),10;[70,80),15;[80,90),12;[90,100],8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计成绩在[60,90)分的学生比例;(4)估计成绩在80分以下的学生比例.解(1)频率分布表如下:成绩分组频数频率[40,50)20.04[50,60)30.06[60,70)100.2[70,80)150.3[80,90)120.24[90,100]80.16合计50 1(2)频率分布直方图如图所示.(3)样本中成绩在[60,90)分的学生比例为0.20+0.30+0.24=0.74=74%.由样本估计总体,成绩在[60,90)分的学生约占74%.(4)样本中成绩在80分以下学生比例为1-(0.24+0.16)=1-0.4=0.6=60%.由样本估计总体,成绩在80分以下的学生约占60%.。
那么x=1那么x=19.2.3总体集中趋势的估计1.结合实例,能用样本估计总体的集中趋势参数(众数、中位数、平均数).2.会求样本数据的众数、中位数、平均数.3.理解集中趋势参数的统计含义.重点:会求样本数据的众数、中位数、平均数.难点:理解集中趋势参数的统计含义.一、温故知新1、定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2、计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.3、根据频率分布直方图(频率分布表)计算样本数据的百分位数:首先要理解频率分布直方图中各组数据频率的计算,其次估计百分位数在哪一组,再应用方程的思想方法,设出百分位数,解方程可得.(①唯一;②不一定是样本数据中的某个数)平均数:一般地,如果有n个数,x,x,...x,12nx+x+...+x2n n叫这n个数的平均数.众数:在一组数据中,出现次数最多的数据.中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数).g平均数:一般地,如果有n个数,x,x,...x,12nx+x+...+x2n n叫这n个数的平均数.1∑nx(x f+x f+L x f)=1∑k x fn n1122k k若其中x出现的频率为p,则x=x p+x p+L x p=∑k x pi i1122k k.(1)算术平均数:=x+x+...+x12n=n ni=1xi(2)加权平均数:如果n个数据中,不同的值有k(k≤n)个,记为x,x,...x,其中x出现的频数为f,12k i i则x=1i=1i ii ii=1做一做1.判断下列说法是否正确.(正确的打“√”,错误的打“×”)(1)改变一组数据中的一个数,则这些数据的平均数一定会改变.()(2)改变一组数据中的一个数,则其中位数也一定会改变.()(3)在频率分布直方图中,众数是最高矩形中点的横坐标.()2、求下列各组数据的众数(1)、1,2,3,3,3,5,5,8,8,8,9,9(2)、1,2,3,3,3,5,5,8,8,9,93、求下列各组数据的中位数(1)、1,2,3,3,3,4,6,8,8,8,9,9(2)1,2,3,3,3,4,8,8,8,9,94.在一次中学生田径运动会上,参加男子跳高的17名运动员的成绩如下表所示:成绩(米)人数1.5021.6031.6521.7031.7541.8011.8511.901分别求这些运动员成绩的众数,中位数与平均数。
【新教材】9.2.3 总体集中趋势的估计(人教A版)1.结合实例,能用样本估计总体的集中趋势参数(众数、中位数、平均数).2.会求样本数据的众数、中位数、平均数.3.理解集中趋势参数的统计含义.1.数学运算:求样本数据的众数、中位数、平均数;2. 数据分析:频率分布直方图中的众数、中位数、平均数.重点:求样本数据的众数、中位数、平均数.难点:求样本数据的众数、中位数、平均数.一、预习导入阅读课本203-207页,填写。
1.众数、中位数、平均数定义(1)众数:一组数据中重复出现次数的数.(2)中位数:把一组数据按的顺序排列,处在位置(或中间两个数的)的数叫做这组数据的中位数.(3)平均数:如果n个数x1,x2,…,x n,那么x=1n(x1+x2+…+x n)叫做这n个数的平均数.2.频率分布直方图中的众数、中位数、平均数①在频率分布直方图中,众数是最高矩形中点的横坐标;②中位数左边和右边的直方图的面积应该相等;③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.1.判断下列说法是否正确.(正确的打“√”,错误的打“×”)(1)改变一组数据中的一个数,则这些数据的平均数一定会改变.()(2)改变一组数据中的一个数,则其中位数也一定会改变.()(3)在频率分布直方图中,众数是最高矩形中点的横坐标.()2.已知一组数据为20,30,40,50,50,60,70,80.其中平均数、中位数和众数的大小关系是() A.平均数>中位数>众数B.平均数<中位数<众数C.中位数<众数<平均数D.众数=中位数=平均数3.已知一组数据为-3,5,7,x,11,且这组数的众数为5,那么该组数据的中位数是()A.7 B.5C.6 D.114.如果5个数x1,x2,x3,x4,x5的平均数为7,那么x1+1,x2+1,x3+1,x4+1,x5+1这5个数的平均数是________.题型一平均数、中位数、众数在具体数据中的应用例1 某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群:13,13,14,15,15,15,15,16,17,17;乙群:54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映甲群市民的年龄特征?(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好地反映乙群市民的年龄特征?跟踪训练一1.某校在一次考试中,甲、乙两班学生的数学成绩统计如下:选用平均数与众数、中位数评估这两个班的成绩.题型二在频率分布直方图中求平均数、中位数、众数例2某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数;(3)求这次测试数学成绩的平均分.解题技巧(知频率分布直方图中求平均数、中位数、众数)(1)众数:频率分布直方图中,最高矩形的底边中点的横坐标.(2)中位数:在频率分布直方图中,把频率分布直方图划分为左右两个面积相等的部分的分界线与x轴交点的横坐标称为中位数.(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.跟踪训练二1.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间分别是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均数、众数和中位数(要求写出计算过程,结果保留一位小数).1.期中考试以后,班长算出了全班40人数学成绩的平均分为M,如果把M当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N,那么M∶N的值为()A.4041B.1 C.4140D.22.在某次考试中,共有100个学生参加考试,如果某题的得分情况如表:得分0分1分2分3分4分百分率37.0 8.6 6.0 28.2 20.2那么这些得分的众数是()A.37.0% B.20.2% C.0分D.4分3.一组样本数据10,23,12,5,9,a,21,b,22的平均数为16,中位数为21,则a b-=________.4.某校从参加高一年级期末考试的学生中抽出60名学生,将其成绩(均为整数)分成六段[40,50),[50,60),…[90,100]后画出如下频率分布直方图.估计这次考试的平均分为________.5.一次数学测验中,全班N名学生的数学成绩的频率分布直方图如下,已知分数在110~120的学生数有14人.(1)求总人数N和分数在120~125的人数n;(2)利用频率分布直方图,估算该班学生数学成绩的众数和中位数,平均数各是多少?答案小试牛刀1. ( 1)√ (2)×( 3)√ . 2. D. 3. B. 4. 8 自主探究例1 【答案】(1)甲中位数为15岁,众数为15岁.都能较好地反映甲群市民的年龄特征.(2)中位数为5.5岁,众数为6岁.中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差. 【详细解析】(1)甲群市民年龄的平均数为13+13+14+15+15+15+15+16+17+1710=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+3+4+4+5+5+6+6+6+5710=15(岁),中位数为5.5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差. 跟踪训练一1. 【答案】见详细解析【详细解析】甲班平均数79.6分,乙班平均数80.2分,从平均分看成绩较好的是乙班; 甲班众数为90分,乙班众数为70分,从众数看成绩较好的是甲班;按从高到低(或从低到高)的顺序排列之后,甲班的第25个和第26个数据都是80,所以中位数是80分,同理乙班中位数也是80分,但是甲班成绩在中位数以上(含中位数)的学生有31人,占全班学生的62%,同理乙班有27人,占全班学生的54%,所以从中位数看成绩较好的是甲班.如果记90分以上(含90分)为优秀,甲班有20人,优秀率为40%,乙班有24人,优秀率为48%,从优秀率来看成绩较好的是乙班.可见,一个班学生成绩的评估方法很多,需视要求而定.如果不考虑优秀率的话,显然以中位数去评估比较合适.例2 【答案】(1) 75.(2) 73.3.(3)72. 【详细解析】(1)由图知众数为70+802=75.(2)由图知,设中位数为x ,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x -70),所以x ≈73.3. (3)由图知这次数学成绩的平均分为:40+502×0.005×10+50+602×0.015×10+60+702×0.02×10+70+802×0.03×10+80+902×0.025×10+90+1002×0.005×10=72. 跟踪训练二1.【答案】(1)a =0.005.(2)平均数73(分),众数65(分).中位数71.7(分).【详细解析】 (1)由频率分布直方图中所有小矩形面积之和为1,得10(2a +0.02+0.03+0.04)=1,解得a =0.005.(2)这100名学生语文成绩的平均数为55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73(分), 众数为60+702=65(分).∵这100名学生语文成绩在[50,70)的频率为(0.005+0.04)×10=0.45, 这100名学生语文成绩在[70,80)的频率为0.03×10=0.3,∴这100名学生语文成绩的中位数为70+10×0.5-0.450.3≈71.7(分).当堂检测1-2. BC 3. 0 4. 71分.5.【答案】( 1)40,4( 2)众数为107.5,中位数分别是110,平均数为111【详细解析】( 1)分数在110~120内的学生的频率为1(0.040.03)50.35P =+⨯=, 所以该班总人数为14400.35N ==. 分数在120~125内的学生的频率为:21(0.010.040.050.040.030.01)50.10P =-+++++⨯=,分数在120~125内的人数为400.104n =⨯=.( 2)由频率直方图可知众数是最高的小矩形底边中点的横坐标,即为105110107.52+=. 设中位数为a ,∵0.0150.0450.055=0.50⨯+⨯+⨯,∴110a =. ∴众数和中位数分别是107.5,110.⨯+⨯+⨯+⨯+⨯平均数为[97.50.01102.50.04107.50.05112.50.04117.50.03 +⨯+⨯⨯=.122.50.02127.50.01]5111。
9.2.4总体离散程度的估计知识点一一组数据的方差与标准差知识点二总体方差与总体标准差知识点三 样本方差与样本标准差知识点四 标准差、方差描述数据的特征标准差刻画了数据的□01离散程度或□02波动幅度,标准差越大,数据的离散程度□03越大;标准差越小,数据的离散程度□04越小.在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.知识点五 分层随机抽样估计总体方差设层数为2层的分层随机抽样,第1层和第2层包含的样本变量由x 1,x 2,…,x n 及y 1,y 2,…,y n 表示.样本数 总体数 方差 平均数 第1层 m M s 2x x -第2层 nNs 2yy -则总体方差s 2=M [s 2x +(x --z -)2]+N [s 2y+(y --z -)2]M +N1.方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x -2],或写成s 2=1n (x 21+x 22+…+x 2n )-x -2.即方差等于原数据平方的平均数减去平均数的平方.2.平均数、方差公式的推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数是m x -+a .(2)若数据x 1,x 2,…,x n 的方差为s 2,那么 ①数据x 1+a ,x 2+a ,…,x n +a 的方差也是s 2; ②数据ax 1,ax 2,…,ax n 的方差是a 2s 2.1.判一判(正确的打“√”,错误的打“×”) (1)方差越大,数据的稳定性越强.( )(2)在两组数据中,平均值较大的一组方差较大.( )(3)样本的平均数和标准差一起反映总体数据的取值信息.一般地,绝大部分数据落在[x --2s ,x -+2s ]内.( )(4)平均数反映数据的集中趋势,方差则反映数据离平均值的波动大小.( ) 答案 (1)× (2)× (3)√ (4)√ 2.做一做(1)下列说法不正确的是( ) A .方差是标准差的平方 B .标准差的大小不会超过极差C .若一组数据的值大小相等,没有波动变化,则标准差为0D .标准差越大,表明各个样本数据在样本平均数周围越集中;标准差越小,表明各个样本数据在样本平均数周围越分散(2)某学员在一次射击测试中射靶10次,命中环数如下: 7,8,7,9,5,4,9,10,7,4.则:①平均命中环数为________; ②命中环数的标准差为________.(3)样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则该样本的方差为________.答案 (1)D (2)①7 ②2 (3)2题型一 样本的标准差与方差的求法例1 从甲、乙两种玉米中各抽10株,分别测得它们的株高如下: 甲:25,41,40,37,22,14,19,39,21,42; 乙:27,16,44,27,44,16,40,40,16,40; 试计算甲、乙两组数据的方差和标准差.[解] x -甲=110×(25+41+40+37+22+14+19+39+21+42)=30, s 2甲=110×[(25-30)2+(41-30)2+(40-30)2+(37-30)2+(22-30)2+(14-30)2+(19-30)2+(39-30)2+(21-30)2+(42-30)2]=104.2,s 甲=104.2≈10.208.x -乙=110×(27+16+44+27+44+16+40+40+16+40)=31, 同理s 2乙=128.8, s 乙=128.8≈11.349.对标准差与方差概念的理解(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据的离散程度越小.(2)标准差、方差的取值范围:[0,+∞).标准差、方差为0时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性.(3)因为方差与原始数据的单位不同,且平方后可能放大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实际问题时,一般多采用标准差.某班40名学生平均分成两组,两组学生某次考试成绩情况如下表所示:求这次考试成绩的平均数和标准差.⎝ ⎛⎭⎪⎪⎫注:标准差s = 1n [(x 1-x -)2+…+(x n -x -)2]= 1n[(x 21+x 22+…+x 2n )-n x -2] 解 设第一组数据为x 1,x 2,…,x 20,第二组数据为x 21,x 22,…,x 40,全班平均成绩为x -.根据题意,有x -=90×20+80×2040=85,42=120(x 21+x 22+…+x 220-20×902),62=120(x 221+x 222+…+x 240-20×802),∴x 21+x 22+…+x 240=20×(42+62+902+802)=291040.再由变形公式,得s 2=140(x 21+x 22+…+x 240-40x -2)=140(x 21+x 22+…+x 240-40×852)=140×(291040-289000)=51, ∴s =51.题型二 样本标准差、方差的实际应用例2 某工厂甲、乙两名工人参加操作技能培训,他们在培训期间参加的8次测试成绩记录如下:甲:95 82 88 81 93 79 84 78 乙:83 92 80 95 90 80 85 75 (1)试比较哪个工人的成绩较好;(2)甲、乙成绩位于x --s 与x -+s 之间有多少?[解] (1)x -甲=18×(95+82+88+81+93+79+84+78)=85, x -乙=18×(83+92+80+95+90+80+85+75)=85.s 2甲=18×[(95-85)2+(82-85)2+(88-85)2+(81-85)2+(93-85)2+(79-85)2+(84-85)2+(78-85)2]=35.5,s 2乙=18×[(83-85)2+(92-85)2+(80-85)2+(95-85)2+(90-85)2+(80-85)2+(85-85)2+(75-85)2]=41.∵x -甲=x -乙,s 2甲<s 2乙,∴甲的成绩较稳定. 综上可知,甲的成绩较好. (2)∵s 甲=s 2甲=35.5≈5.96,x -甲-s 甲=79.04,x -甲+s 甲=90.96, ∴甲位于[x --s ,x -+s ]之间的数据有4个. 又s 乙=s 2乙=41≈6.4,x -乙-s 乙=78.6,x -乙+s 乙=91.4,∴乙的成绩位于[x --s ,x -+s ]之间的有5个.比较两组数据的异同点,一般情况是从平均数及标准差这两个方面考虑.其中标准差与样本数据单位一样,比方差更直观地刻画出与平均数的平均距离.从甲、乙两名学生中选拔一人参加射箭比赛,为此需要对他们的射箭水平进行测试.现这两名学生在相同条件下各射箭10次,命中的环数如下:甲 8 9 7 9 7 6 10 10 8 6 乙 10986879788(1)计算甲、乙两人射箭命中环数的平均数和标准差; (2)比较两个人的成绩,然后决定选择哪名学生参加射箭比赛. 解 (1)根据题中所给数据,可得甲的平均数为 x -甲=110×(8+9+7+9+7+6+10+10+8+6)=8,乙的平均数为x -乙=110×(10+9+8+6+8+7+9+7+8+8)=8, 甲的标准差为 s 甲=110×[(8-8)2+(9-8)2+…+(6-8)2]=2,乙的标准差为 s 乙=110×[(10-8)2+(9-8)2+…+(8-8)2]=305,故甲的平均数为8,标准差为2,乙的平均数为8,标准差为305. (2)∵x -甲=x -乙,且s 甲>s 乙,∴乙的成绩较为稳定,故选择乙参加射箭比赛. 题型三 标准差、方差的图形分析例3 样本数为9的四组数据,他们的平均数都是5,条形图如下图所示,则标准差最大的一组是( )A .第一组B .第二组C .第三组D .第四组[解析] 第一组中,样本数据都为5,数据没有波动幅度,标准差为0;第二组中,样本数据为4,4,4,5,5,5,6,6,6,标准差为63;第三组中,样本数据为3,3,4,4,5,6,6,7,7,标准差为253;第四组中,样本数据为2,2,2,2,5,8,8,8,8,标准差为22,故标准差最大的一组是第四组.[答案] D由图形分析标准差、方差的大小从四个图形可以直观看出第一组数据没有波动性,第二、三组数据的波动性都比较小,而第四组数据的波动性相对较大,利用标准差的意义也可以直观得到答案.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差答案 C解析由题图可得,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9,所以甲、乙的成绩的平均数均是6,故A不正确;甲、乙成绩的中位数分别为6,5,故B不正确;甲、乙成绩的极差都是4,故D不正确;甲的成绩的方差为12×2+12×2)5×(2=2,乙的成绩的方差为12×3+32)=2.4.故C正确.5×(11.下列选项中,能反映一组数据的离散程度的是()A.平均数B.中位数C.方差D.众数答案 C解析由方差的定义,知方差反映了一组数据的离散程度.2.样本数据2,4,6,8,10的标准差为()A.40 B.8C .210D .2 2答案 D解析 x -=15×(2+4+6+8+10)=6,则标准差为15×[(2-6)2+(4-6)2+(6-6)2+(8-6)2+(10-6)2]=2 2. 3.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:若要从这四人中选择一人去参加该运动会射击项目比赛,最佳人选是________.(填“甲”“乙”“丙”“丁”中的一个)答案 丙解析 分析题中表格数据可知,乙与丙的平均环数最多,又丙的方差比乙小,说明丙成绩发挥得较为稳定,所以最佳人选为丙.4.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________. 答案 0.1解析 这组数据的平均数x -=4.7+4.8+5.1+5.4+5.55=5.1,则方差s 2=(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)25=0.16+0.09+0+0.09+0.165=0.1.5.甲、乙两机床同时加工直径为100 cm 的零件,为检验质量,各从中抽取6件测量,数据为:甲:99 100 98 100 100 103 乙:99 100 102 99 100 100(1)分别计算两组数据的平均数及方差;(2)根据计算结果判断哪台机床加工零件的质量更稳定. 解 (1)x -甲=16×(99+100+98+100+100+103)=100, x -乙=16×(99+100+102+99+100+100)=100.s 2甲=16×[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16×[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均数相同,又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定.。