14 数据的数字特征 1北师大版必修3新 ppt课件
- 格式:ppt
- 大小:560.50 KB
- 文档页数:11
§4数据的数字特征知识梳理1.数据的信息除了通过用各种统计图表来加工整理和表达之外,还可以通过一些统计量来表达.常用的统计量有平均数、中位数、众数、极差、方差、标准差等,它们都反映一组数据的集中趋势和离散程度.2.平均数是刻画一组数据集中趋势最常用的统计量.极差只是利用了数据中最大和最小的两个值,对极值过于敏感;方差的单位是原始数据的单位的平方,其算术平方根,即标准差与原始数据的单位相同,所以我们在实际统计中常用标准差来刻画数据的离散程度.知识导学样本的基本数字特征主要包括:众数、中位数、平均数、标准差.其中这些概念在初中已学过,因此学习本节前可先回顾表达样本中数字特征的有关概念,复习表达样本数据分布的频率分布直方图和频率分布表的结构特征.由于样本的数字特征定量地反映了数据的集中趋势与离散程度,所以学习时首先要明确各种基本数字特征量(如平均数、标准差等)的概念、含义及它们各自的特点;其次注意与样本的频率分布表和直方图结合起来理解用样本的基本数字特征如何估计总体的数字特征;尽可能地使用计算器、计算机来处理数据,以便更好地体会统计思想.计算数据x1,x2,…,x n的标准差的算法步骤如下:1.算出数据的平均数x;2.算出每个数据与平均数x的差x i-x;3.算出(2)中x i-x的平方;4.算出(3)中n个平方数的平均数,即为方差;5.算出(4)中平均数的算术平方根,即为标准差.学习中建议大家始终结合具体实例理解基本数字特征的概念和含义及用法.疑难突破1.方差、极差和标准差在表示数据的特征时分别具有什么特点?怎样根据这些数据的值理解数据的特征?剖析:刻画数据离散程度的统计量有极差、方差和标准差.方差、极差和标准差是从不同角度描述一组数据的离散趋势的.它们各自的特点及应用如下:虽然极差没有充分利用数据,不能提供更确切的信息,但由于只涉及两个数据,计算非常简便,所以极差在实际现场检查时经常利用,但极差没有考虑各中间值.方差虽然充分利用了所得到的数据,提供了更确切的信息.在统计中,方差能够较好地区别出不同组数据的分散情况或程度,但方差的单位是原始观测数据的单位的平方.而标准差能够和方差一样区分数据的分散情况,且其单位与原始观测数据的单位相同.2.刻画数据离散程度的方式是多种多样的,那么要比较准确地刻画数据的离散程度,应该注意哪些主要问题?剖析:刻画数据离散程度的度量,其理想形式应满足以下三条原则:首先,应充分利用所得到的数据,以便提供更确切的信息;其次,仅用一个数值来刻画数据的离散程度;另外,对于不同的数据集,当离散程度大时,该数值亦大.极差不满足上面的第一条原则.方差虽然满足上面的三条原则,但它的单位是原始观测数据的单位的平方,而刻画离散程度的一种理想度量应当具有与原数据相同的单位,解决这一局限性的方法是取方差的正的平方根,即标准差,因此我们通常用标准差来刻画数据的离散程度. 典题精讲例1 从甲、乙两名学生中选拔一人参加射击比赛,对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下:甲:7,8,6,8,6,5,9,10,7,4.乙:9,5,7,8,7,6,8,6,7,7.(1)计算甲、乙两人射击命中环数的平均数和标准差;(2)比较两人的成绩,然后决定选择哪一个人参赛.思路分析:数据x 1,x 2,…,x n 的平均数x =.21nx x x n +⋯++ 标准差s=.)()()(2222n x x x x x x n i -+⋯+-+-根据计算得平均数和标准差,分析甲、乙两人成绩的集中和离散程度,从而选择一人参赛. 解:(1)计算得x 甲=7,x 乙=7,s 甲=1.73,s 乙=1.10.(2)由(1)可知,甲、乙两人的平均成绩相等,但s 乙<s 甲,这表明乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参赛.黑色陷阱:对于常用的平均数、方差、标准差的公式要能够熟练记忆,不能将公式记错,造成计算上的失误,使得统计的结果失去真实的意义.另外应用求得的标准差的结论始终要特别注意标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.变式训练 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲 60 80 70 90 70 乙 80 60 70 80 75 问:甲、乙谁的平均成绩最好?谁的各门功课发展较平衡?思路分析:根据一组数据x 1,x 2,…,x n 的平均数nx x x x n +⋯++=21和标准差s=.)()()(22221nx x x x x x n -+⋯+-+- 计算得平均数和标准差的值,再分析甲、乙两人的学习情况. 解:x 甲=51(60+80+70+90+70)=74, x 乙=51(80+60+70+80+75)=73, s 甲2=51(142+62+42+162+42)=104, s 乙2=51(72+132+32+72+22)=56. ∵x 甲>x 乙,s 甲2>s 乙2.∴甲的平均成绩较好,乙的各门功课发展较平衡.例2 某企业员工的月工资资料如下(单位:元):800 800 800 800 800 1 0001 000 1 000 1 000 1 000 1 000 1 0001 000 1 000 1 000 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 2001 200 1 200 1 200 1 200 1 200 1 5001 500 1 500 1 500 1 500 1 500 1 5002 000 2 000 2 000 2 000 2 000 2 5002 500 2 500(1)计算该公司员工月工资的平均数、中位数和众数.(2)假如你去这家企业应聘职位,你会如何看待员工的收入情况?思路分析:平均数、中位数和众数都是用来描述数据集中趋势的统计量,它们又有各自的特点.平均数是将所有的数据都考虑进去得到的度量,它是反映数据集中趋势最常用的量;中位数可靠性较差,当一组数据中个别数据变动较大时,常用中位数表示数据的集中趋势;而众数求法较简便,也经常被用到.解:(1)经计算,公司员工的月工资的平均数为x=50500 2800800+⋯++=1 320(元),中位数为1 200,众数为1 200.(2)应该考虑用月工资的平均数1 320元作为月工资的代表,因为,一般来讲,月平均工资水平可以用来与同类企业的工资待遇作比较.绿色通道:大多情况下人们会把眼光仅停留在工资表中的最大与最小值处,把最高工资作为一个单位工资的评价,这是一种错误的评价方式.变式训练某学校高一(1)(2)班各有49名学生.两班在一次数学测验中的成绩统计如下: 班级平均分众数中位数标准差(1)班79708719.8(2)班797079 5.2 (1)请你对下面的一段话给予简要分析:(1)班的小刚回家对妈妈说:“昨天的数学测验,全班平均分79分,得70分的人最多,我得了85分,在班里算是上游了!”(2)请你根据表中的数据,对这两个班的数学测验情况进行简要分析,并提出教学建议.解:(1)由中位数可知,85分排在第25位之后,从位次上讲,不能说85分是上游;但也不能以位次来判断学习的好坏,小刚得了85分,说明他对这段的学习内容掌握得较好,从掌握学习的内容上讲,也可以说属于上游.(2)(1)班的成绩的中位数是87分,说明高于87分的人数占一半以上,而平均分为79分,标准差又很大,说明低分也多,两极分化严重,建议加强对学习困难学生的帮助.(2)班的中位数和平均数都是79分,标准差又小,说明学生之间差别较小,学习很差的学生少,但学习优异的也很少,建议采取措施提高优秀率.例3画出下列四组数据的直方图,并说明它们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.思路分析:比较四组数据的异同可从它们的平均数、标准差这些基本特征入手,分析它们的集中趋势或离散程度.解:四组数据的直方图如图1-4-1.图1-4-1四组数据的平均数都是5.0,标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们的标准差不同,说明数据的分散程度是不一样的.绿色通道:直方图可以将我们所要求得的平均数、众数、中位数、标准差等数据一一用图形直观显示出来,帮助我们获取有用的信息,特别是在进行两组数据间的比较中,应用非常方便. 变式训练甲、乙两人数学成绩的茎叶图如图1-4-2:图1-4-2(1)求出这两名同学数学成绩的平均数和标准差;(2)比较这两名同学的成绩,谈谈你的看法.思路分析:首先由茎叶图读出数据,计算平均数,注意用简便方法,然后求出标准差,最后依据结果比较.解:(1)x甲=87,s甲=12.7;x乙=95,s乙=9.7.(2)由于x甲<x乙,s甲>s乙可知,甲的学习状况不如乙的学习状况.问题探究问题平均数真的很平均吗?导思:平均数又称均值,它是刻画一组数据平均状况的量.那么平均值真能如实反映一组数据的平均水平吗?可结合一个具体的实际问题来研究.探究:我们不妨通过一个具体的例子来探究这个问题.以下是某企业员工工资情况调查表:某企业员工及工资构成人员经理管理人员高级技工工人学徒周工资 2 200250220200100人数165101合计 2 200 1 500 1 100 2 000100(1)计算这个问题中工资的平均数;(2)在这个问题中,工资的平均数能客观地反映该企业的工资水平吗?为什么?本问题应着眼于平均数的特点及适应对象.一组数据的总和除以数据的个数所得的商就是平均数.由表格数据可知,平均数为(2 200+1 500+1 100+2 000+100)÷23=300.虽然平均数为300元/周,但由表格中所列出的数据可以看出,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.该问题说明平均数受数据中的极端值的影响较大,妨碍了对总体估计的可靠性.因此不能说平均值就一定能反映一组数据的平均水平.。