极差方差标准差
- 格式:doc
- 大小:28.50 KB
- 文档页数:2
极差.方差与标准差(知识点讲解)极差、方差与标准差一、本节知识导学本节以自主探索为主,并初步体验:对图的观察和分析是科学研究的重要方法。
通过例题发现极差(最大值-最小值)的作用:用来表示数据高低起伏的变化大小;同时也希望同学们通过深入思考发现极差的不足之处:极差只能反应一组数据中两个极端值之间的差异情况,对其他数据的波动情况不敏感。
因此有必要重新找一个对整组数据的波动情况更敏感的指标, 构造方差前请同学们注意以下几个方面: 1.为什么要用“每次成绩”和“平均成绩”相减。
2.为什么要“平方”。
3.为什么“求平均数”比“求和”更好。
同时请同学们意识到:比较两组数据的方差有一个前提条件是,两组数据要一样多。
对于方差的学习,重点在于方差公式的导出和对于方差概念的理解,而不是数字的计算,应充分利用计算器和计算机去完成繁杂的计算。
对于方差与标准差之间除了计算公式不一样,数量单位也不一样但通过求算术平方根运算又可以将他们联系在一起。
二、例题1.不通过计算,比较图中(1)(2)两组数据的平均值和标准差分析:平均值是反映一组数据的平均水平,标准差是反映一组数据与其平均值的离散程度。
本例不通过计算,从折线图来估算标准差,应先估算平均值的大小。
解:从图(1)(2)中可以看出,两组数据的平均值相等。
(图(1)中数据与图(2)中前10个数据相等, 且图(2)中后几个数据不影响平均值)。
图(1)的标准差比图(2)的标准差大。
(因为图(1)中各数据与其平均值离散程度大,图(2)中前10个数据与其平均值的离散程度与图(1)相同,而后几个数据与其平均值的离散程度小。
因此整体上说图(2)所有数据与其平均值的离散程度小于图(1)。
)2.求下列数据的方差(小数点后保留两位):5,7,9,9,10,11,13,14。
分析:要求方差,必须先求平均数。
解:= (5+7+9+9+10+11+13+14)=9.75方差s 2= =7.69[(5-9.75)2+(7-9.75)2+……+(14-9.75) 2]3.求下列一组数据的极差、方差和标准差(小数点后保留两位):50,55,96,98,65,100,70,90,85,100分析:由于标准差是方差的变形所以一般情况下先求方差解:极差为100-50=50平均数为=(50+55+96+98+65+100+70+90+85+100)=80.9方差为:s 2= =334.69 标准差为:s=[(50-80.9)2+(55-80.9)2+……+(100-80.9) 2]=18.294.在某次数学竞赛中,甲、乙两班的成绩如下已经算出两班的平均数都是80分,请你根据已有的统计知识分析两个班的成绩。
极差方差标准差极差是指一组测量值内最大值与最小值之差,又称范围误差或全距,以R表示。
它是标志值变动的最大范围,它是测定标志变动的最简单的指标。
极差没有充分利用数据的信息,但计算十分简单,仅适用样本容量较小(n<10)情况。
方差是各个数据与平均数之差的平方和的平均数。
在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。
方差,通俗点讲,就是和中心偏离的程度!用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)并把它叫做这组数据的方差。
在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。
标准差(Standard Deviation),中文环境中又常称均方差,但不同于均方误差(mean squared error,是各数据偏离平均数的距离平方的平均数,也即误差平方和的平均数,计算公式形式上接近方差,它的开方叫均方根误差,均方根误差才和标准差形式上接近),标准差是离均差平方和平均后的方根,用σ表示。
标准差是方差的算术平方根。
标准差能反映一个数据集的离散程度。
平均数相同的,标准差未必相同。
简单来说,标准差是一组数据平均值分散程度的一种度量。
一个较大的标准差,代表大部分数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
例如,两组数的集合{0,5,9,14} 和{5,6,8,9} 其平均值都是7 ,但第二个集合具有较小的标准差。
标准差可以当作不确定性的一种测量。
例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。
当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。
这很容易理解,因为如果测量值都落在一定数值范围之外,可以合理推论预测值是否正确。
标准差应用于投资上,可作为量度回报稳定性的指标。
标准差数值越大,代表回报远离过去平均数值,回报较不稳定故风险越高。
描述统计学:极差、⽅差、标准差变异程度的度量(离散程度的度量)交货时间的变异性造成按时完成⽣产任务的不确定性极差极差=最⼤值-最⼩值最简单的变异程度的度量但很少单独⽤来度量变异程度。
仅有两个观测值,异受极端值的影响四分位数间距能够克服极端值的影响,因为四分位数是中间的50%数据的极差.⽅差是⽤所有数据对变异程度所做的⼀种度量。
对于样本平均数的离差=对于总体平均数的离差=总体⽅差样本⽅差样本⽅差是总体⽅差的点估计,平均数的离差之和永远为0。
例⼦:第⼀组的鸡的⽄数分别是 2.5,3,3.5第⼆组的鸡的⽄数分别是 1,3,5很显然我们能看出第⼀组鸡看起来重量的差别不⼤,第⼆组鸡的差别就很⼤,因为鸡本⾝重量并不⼤,相差两⽄的话⼀下⼦就能看出来可是我们发现这两组鸡重量的平均数是⼀样的,但是这两组鸡却有明显的差别,这是平均数就不能体现⼆者的差别,所以我们引⼊了⽅差的概念⽅差越⼤,说明数据的差别越⼤。
反应了⼀组数据的稳定性。
标准差⽅差的平⽅根样本标准差:总体标准差标准差更容易与平均数等其他统计量进⾏⽐较,这是由于它们的单位与原始数据是相同的。
标准差系数(标准差/平均数)*100%在变量的标准差和平均数都不相同时,⽐较它们的变异程度,标准差系数是⼀个有⽤的统计量。
练习1. 考虑数据值为10,20,12,17和16的⼀个样本,计算⽅差和标准差。
new_list = [10,20,12,17,16]data = Series(new_list)# ⽅差data.var()3.125# 标准差data.std()1.7677669529663689new_list = [182,168,184,190,170,174]data = Series(new_list)# ⽅差data.var()75.2# 标准差data.std()8.67179335547152# 平均数data.mean()178.0# 极差data.max()-data.min()22# 标准差系数(data.std()/data.mean())*100%4.87%# 平均数car.mean()38.0# 标准差car.std()9.848857801796104# ⽅差car.var()97.0虽让东西部的租车费⽤的平均数相同,但是标准差东部的数值远远⼤于西部的,可见东部的各个城市间的租车费⽤差异性⽐较⼤,离散度较⾼,西部的各个城市间的租车费⽤相对来说差别不⼤,⽐较稳定。
八年级数学《极差、方差和标准差》知识点极差、方差、标准差都是用来研究一组数据的离散程度,表示一组数据离散程度的指标.一、定义理解1极差极差是用来反映一组数据变化范围的大小. 我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围,用这种方法得到的差就称为极差.极差=最大值-最小值极差仅只表示一组数据变化范围的大小,只对极端值较为敏感,而不能表示其它更多的意义.2、方差方差是反映一组数据的整体波动大小的指标,它是指一组数据中各数据与这组数据的平均数的差的平方的平均数,它反映的是一组数据偏离平均值的情况.求一组数据的方差可以简记为:“先平均,再求差,然后平方,最后再平均•"通常用S表示一组数据的方差,用X表示一组数据的平均数,x“ x2、… X n表示各数据.方差计算公式是:s2=1[(x 1- x) 2+(x2- x) 2+—+(X n- x) 2];3、标准差在计算方差的过程中,可以看出S2的数量单位与原数据的不一致,因而在实际应用时常常将求出的方差再幵平方,这就是标准差.标准差=..方差,方差=标准差2.一组数据的标准差计算公式是S j1~xi~x X2—"X ~ xn~x ,其中X为n个数据X i, X2,…,X n的平均数.方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.方差较大的波动较大,方差较小的波动较小,方差的单位是原数据的单位平方,标准差的单位与原数据的单位相同.在解决实际问题时,常用样本的方差来估计总体方差方法去考察总体的波动情况.二、例题讲析例1、甲、乙两支篮球队在一次联赛中,各进行10次比赛得分如下:甲队:100,97,99,96,102,103,104,101,101,100乙队:97,97,99,95,102,100,104,104,103,102(1)求甲、乙两队的平均分和极差?(2)计算甲、乙两队的方差与标准差,并判断哪支球队发挥更为稳定?解:(1) x= (100 97 99 96 102 103 104 101 101 100)= 100.3?10甲队的极差=104-96= 8; 甲队的极差=104-95= 9(2) S 甲2丄[(100 100.3)2(99 100.3)2(100 100.3)2 ]=5.6110甲队的标准差:-.5.61 2.37 ; 乙队的标准差:.9.21 3.03 所以,由此可以判断甲队的得分方差小,标准差也相应较小,因此他们在联赛中发挥更为稳定一些.例2、对10盆同一品种的花施用甲、乙两种花肥,把10盆花分成两组,每组5盆,记录其花期:甲组:25, 23, 28, 22, 27乙组:27, 24, 24, 27, 23(1)10盆花的花期最多相差几天?(2)施用何种花肥,花的平均花期较长?(3)施用哪种保花肥效果更好?分析:花期的极差就是花期最多相差的天数,花的平均花期就是分别求得甲、乙两组数据的平均数,而看哪种保花肥效果好,关键是比较方差,方差越小,波动越小,效果越好!解:(1) 28- 22= 6 (天) 所以,10盆花的花期最多相差6天._ 1(2)由平均数公式得:x= -(25 23 28 22 27)= 25?5得站=心,所以,无论用哪种花肥,花的平均花期相等.(3)由方差公式得:得S B2 s乙故施用乙种花肥,效果比较可靠三、反馈练习1. 一组数据5, 8, x, 10, 4的平均数是2x,则这组数据的方差是____________ .2. 五名同学目测同一本教科书的宽度时,产生的误差如下(单位:cm): 2,-2, —1, 1, 0,则这组数据的极差为______ cm.方差是_________ ,标准差是______3. 若样本1, 2, 3, x的平均数为5,又样本1, 2, 3, x, y的平均数为6,则样本1, 2, 3, x, y的极差是 _________ ,方差是_______ ,标准差是______ .4. 已知一组数据0, 1, 2, 3, 4的方差为2,则数据20, 21, 22, 23, 24的方差为 ____ ,标准差为________ .5. 一组数据—8,- 4, 5, 6, 7, 7, 8, 9的极差是 ________ ,方差是______ ,标准6. 若样本X1,X2,……,X n的平均数为 =5,方差S2= 0.025,贝肪羊本4X I,4X2,4X n的平均数X /= _______ ,方差S7 2= _______ .。
北京四中撰稿:张扬责编:姚一民数据的波动一.基本知识点讲解:1.极差:是指一组数据中最大数据与最小数据的差。
极差=数据中的最大数-数据中的最小数2. 方差与标准差:S^2=[(x1-x的平均数)^2+(x2-x的平均数)^2+...+(xn-x的平均数)^2]设在一组数据x1 x2 x3……x n中各数据与它们的平均数的差的平方分别是(x1-)2, (x2-)2……(x n-)2,则他们的平均数:方差可以用来衡量这组数据的波动的大小,一组数据的方差越大,就说明这组数据的波动也越大,这波动的大小是指偏离平均数的大小。
3. 标准差:一组数据的方差的算术平方根叫做这组数据的标准差,用S来表示,即:标准差也只是来衡量一组数据波动大小的量,它虽然比计算方差多开一次平方,但它的度量单位与原数据的度量单位是一致的,所以有时用标准差比较方便。
4. 计算方差的三个公式公式①是方差的定义,一组数据的每个数都减去它们的平均数的平方,再求这些平方的和,比较麻烦,因此可用公式②以使计算过程较为简单,当不是整数时尤为简单。
接近这组数据的平均数的一个常数。
二.例题解析:(1)应用公式①例1. 计算数据9.9、9.7、10.3、9.8、9.8、10、10.1、10.4的方差与标准差。
解:例2. 甲乙两组进行投篮比赛,每组选派10名队员参加,每人投10次,每次投中的人数如下:甲组:7、6、8、8、5、9、7、7、6、7乙组:6、7、8、4、10、9、7、6、6、7求:甲、乙两组哪一组的投篮情况比较稳定解:∴甲乙两组的平均命中率相同,但甲组的投篮比较稳定,所以甲组的投篮情况较好。
(2)应用公式②例3. 甲、乙两人在相同条件下各射靶10次,各次命中环数如下:甲:4、7、10、9、5、6、8、6、8、8乙:7、8、6、6、7、8、7、8、5、9求甲、乙两人谁的射击成绩比较稳定解:(3)应用公式③例4. 求以下数据的方差(精确到0.1)10、13、9、11、8、10、11、12、8、14、10、9解:设a=10,每个数都减去10,有三:小结:1. 方差是以平均数为基数,揭示数据波动的大、小,所以首先要把平均数算准确。
极差方差标准差一个有趣的现象,现在我发现人们常常把方差和极差混为一谈。
很多同学也许根本就没注意到这两个概念是不一样的。
那么什么是方差?又如何应用?带着问题我们看一下教材。
1、用于平均数时。
方差:方差又叫离差平方和,是所有观察值的离差平方和。
用于计算时,计算公式:F(x)=frac{n(x-1)(x+1)}{n(x)(n-1)(n+1)}其中, n(x)和n-1(x)、n(x+1)、n(x+2)……… n个观察值分别对应相应的指标,可以用数字或字母表示。
例:某学校男生占20%,女生占80%。
即该学校的总人数为200人。
该指标的方差=200×100=20000(人)=2(人);由此可见,方差是计算平均数的基础。
极差:所谓极差,就是指观察值最大值与最小值之间的差值。
通俗点说,也就是最大值减去最小值。
例:某班级人数为35人,占全年级人数的20%,则该班级人数占全年级人数的比重为多少?即:35×20%=5(人)。
该指标的方差=35×100=1750(人)=2(人)。
由此可见,极差是计算中位数的基础。
2、用于中位数时。
方差:方差=中位数的方差+极差方差是用于计算平均数、中位数、众数等指标的基础,而极差是用于计算极端值、离差平方和、百分位数、百分率等指标的基础。
但它们的方向是不一样的,也就是在于使用的目的不同。
从应用上讲,方差只是用来计算平均数、众数等指标的基础,极差才是用来计算极端值、离差平方和、百分位数、百分率等指标的基础。
3、极差:极差是衡量数据波动程度的指标,也就是指最大值减去最小值。
极差越大,波动程度越大;反之亦然。
4、方差的大小不仅取决于离差的绝对值大小,还与所取的数据排列位置有关。
假定N个数据离差的绝对值都为1,那么位置越靠前,离差越大,方差越大。
二者均值相等,但方差不一定相等。
例:某地区2010年发展规划GDP总量按第一产业增加值占全部地区生产总值的18%计算,则2010年该地区GDP总量约为8000亿元。
20.2 数据的波动程度
20.2.1极差
教学目标
1、理解极差的定义,知道极差是用来反映数据波动范围的一个量
2、会求一组数据的极差
重点、难点和难点的突破方法
1、重点:会求一组数据的极差
2、难点:本节课内容较容易接受,不存在难点。
例习题的意图分析
教材P151引例的意图
(1)、主要目的是用来引入极差概念的
(2)、可以说明极差在统计学家族的角色——反映数据波动范围的量
(3)、交待了求一组数据极差的方法。
课堂引入:
引入问题可以仍然采用教材上的“乌鲁木齐和广州的气温情”为了更加形象直观一些的反映极差的意义,可以画出温度折线图,这样极差之所以用来反映数据波动范围就不言而喻了。
例习题分析
本节课在教材中没有相应的例题,教材P152习题分析
问题1 可由极差计算公式直接得出,由于差值较大,结合本题背景可以说明该村贫富差距较大。
问题 2 涉及前一个学期统计知识首先应回忆复习已学知识。
问题3答案并不唯一,合理即可。
随堂练习:
1、一组数据:473、865、368、774、539、474的极差是,一组数据1736、1350、-2114、-1736的极差是 .
2、一组数据
3、-1、0、2、X的极差是5,且X为自然数,则X= .
3、下列几个常见统计量中能够反映一组数据波动范围的是()
A.平均数
B.中位数
C.众数
D.极差
4、一组数据X
1、X
2
…X
n
的极差是8,则另一组数据2X
1
+1、2X
2
+1 (2)
n
+1
的极差是()
A. 8
B.16
C.9
D.17
答案:1. 497、3850 2. 4 3. D 4.B
七、课后练习:
1、已知样本9.9、10.3、10.3、9.9、10.1,则样本极差是()
A. 0.4
B.16
C.0.2
D.无法确定
在一次数学考试中,第一小组14名学生的成绩与全组平均分的差是2、3、-5、
10、12、8、2、-1、4、-10、-2、5、5、-5,那么这个小组的平均成绩是()
A. 87
B. 83
C. 85 D无法确定
3、已知一组数据2.1、1.9、1.8、X、2.2的平均数为2,则极差是。
4、若10个数的平均数是3,极差是4,则将这10个数都扩大10倍,则这组数据的平均数是,极差是。
5、某活动小组为使全小组成员的成绩都要达到优秀,打算实施“以优帮困”计划,为此统计了上次测试各成员的成绩(单位:分)
90、95、87、92、63、54、82、76、55、100、45、80
计算这组数据的极差,这个极差说明什么问题?
将数据适当分组,做出频率分布表和频数分布直方图。
答案:1.A ; 2.D ; 3. 0.4 ; 4.30、40. 5(1)极差55分,从极差可以看出这个小组成员成绩优劣差距较大。
(2)略
【教学反思】。