第24课时6.3.2方差与标准差
- 格式:doc
- 大小:196.50 KB
- 文档页数:4
第9课时方差与标准差分层训练1.以下可以描述总体稳定性的统计量是( ) (A)样本均值x (B)样本中位数 (C)样本方差2s (D)样本最大值x(n)则下列选项正确的是 ( )(A)22乙甲乙甲>,=s s x x (B )22乙甲乙甲<,=s s x x(C)22乙甲乙甲=,=s s x x (D)22乙甲乙甲=,s s x x ≠3.设一组数据的方差是2s ,将这组数据的每个数据都乘10,所得到的一组新数据的方差是( ) (A)0.12s (B) 2s (C)102s (D)1002s 4.已知,,21x x …,6x 的方差为2,则21x +3, 22x +3,…,26x +3的标准差是___________ 5.某医院急诊中心关于其病人等待急诊的时间记录如下: 计值x =_______,病人等待时间标准差的估计值s=___________6.已知样本99,100,101,x ,y 的平均数是100,方差是2,则y x ⋅=________7.(1)美国加利福尼亚州州长提出给所有的州政府雇员月薪增加70美元。
这对于州政府雇员的平均月薪将会有何影响?对于月薪的标准差呢?(2)整个政府部门的月薪递增5%将对平均月薪有何影响?对于月薪的标准差呢?8.甲、乙两机床同时加工直径为100mm 的零件,为检验质量,从中抽取6件测量数据为(1)分别计算两组数据的平均数及方差; (2)根据计算说明哪台机床加工零件的质量更稳定。
拓展延伸9.假定以下数据是甲、乙两个供货商的交货天数:估计两个供货商的交货情况,并问哪个供货商交货时间短一些,哪个供货商交货时间比较具有一致性与可靠性。
10.已知样本90, 83, 86, 85, 83, 78, 74, 73, 71, 70的方差为 2s ,且关于x 的方程03)1(2=-++-k x k x 的两根的平方和恰好是2s ,求k 的值。
本节学习疑点:1.C 2.B 3.D 4.22 5.9.25,5.4 6.99967.(1)这将使平均数增大70美元,但不影响标准差 (2)这将使月薪的平均数和标准差都增大5%8.(1) 100100==乙甲,x x ,13722==乙甲,s s(2) 22乙甲s s >,故乙更稳定。
3.3方差和标准差教学设计一、教学目标1、了解方差,标准差公式的产生过程2、熟练掌握方差和标准差的计算方法及其运用。
3、能通过实例学会用样本方差分析总体方差二、教学重点方差、标准差的概念、计算及其运用三、教学难点方差概念的理解和应用四、教材分析《方差与标准差》这节课是选自浙教版八年级上第三章第三节,是在学生学会用平均数,中位数,众数来表示数据集中程度的统计量后的另一种反映数据离散程度的统计量。
是对数据进行分析的另一重要指标。
这节课是七年纪上册“数据与图表”内容的延续,在数据与图表中是着重用图表的形式来反映数据的特征和变化。
而本章则是用统计量来反映数据的特征和变化。
学好本节课,不仅为进一步学好数据分析打好基础,而且在日常生活和实际生产中有着广泛的应用。
计算方差、标准差时,首先要求平均数,因此,求方差、标准差也是求平均数的练习和巩固的过程。
但平均数与方差的最本质的区别是:平均数是反映一组数据的集中程度的统计量而方差是反映一组数据的离散程度的统计量。
五、学情分析根据我自己对所带两个班级学生的了解,他们在分析,推导能力上不是特别强,所以本节的内容我准备按课本的要求来,不做较大的改变,不要求学生解决复杂或生僻的问题。
对于八年级的学生要根据实际选择统计量,并通过数据分析作出判断或预测。
不仅需要学生有教高的综合分析能力,而且要有较丰富的生活实践经验,对于这个年龄段的学生来说,是比较薄弱的。
因此,我在教学中会把握好教学要求,给学生留有充分的时间思考和小组讨论,用集体的智慧来解决难题。
在这堂新课中,我放较大的比重在公式的产生上,既公式的推导过程。
因为中考不允许学生使用计算器,所以在数据的选择上要便于计算,不允许学生使用计算器。
六、教学过程 (一)情景引入 学生观看射击比赛视频提问:一年一度的比赛又要开始了,所有的学员都这么优秀选谁? 设计意图:1、通过视频吸引学生的注意力,让学生的注意力集中到课堂上 2、每个学员都很优秀有自己的特点,所以我们要有一个合理的选拔 标准,从而引出了本堂课的学习内容 (二)合作学习甲、乙两人的测试成绩统计如下:(1)分别算出甲、乙两人的平均成绩. (2)根据这两人的成绩,再画出折线统计图.(3)现要从甲、乙两人中挑选一人参加比赛,你认为挑选哪一位比较适宜?为什么?提问:1、哪组数据围绕其平均数波动较大,波动大反映了什么? 2、谁射击成绩比较稳定?设计意图:1、1,2两个小题学生根据自己现有的知识能够解决,通过给出两个 问题,引导学生仔细观察折线图,因为折线图能够直观反应两人成24 68 成绩(环)10 0 1 2 3 4 5绩水平的高低以及稳定性。
方差和标准差方差和标准差学习目标1、了解方差,标准差的公式的产生过程。
2、熟练掌握方差和标准差的计算方法及其运用。
3、能通过实例学会用样本方差分析数据的离散程度。
导学过程预习课本P62-64思考:选拔射击手参加比赛时,我们应该挑选测试成绩中曾达到最好成绩的选手,还是成绩最稳定的选手?合作学习甲、乙两名射击手的测试成绩统计如下:(1)甲、乙两名射击手的极差分别是多少?(2)请分别计算两名射击手的平均成绩;(3)请分别计算两名射击手的成绩与平均数的差(即偏差)。
(4)甲、乙两人成绩的偏差的平均数是多少?(5)现要挑选一名射击手参加比赛,若你是教练,你能根据偏差的平均数挑选射击手参加比赛吗?为什么?归纳总结方差的概念:例:为了考察甲、乙两种小麦的长势,分别从中抽出10株苗,测得苗高如下(单位:cm):甲: 12 13 14 15 10 16 13 11 15 11乙: 11 16 17 14 13 19 6 8 10 16哪种小麦长得比较整齐?归纳总结标准差的概念:自我检测已知数据a1,a2,a3,…,a n的平均数为X,方差为Y标准差为Z。
则①数据a1+3,a2 + 3,a3 +3 ,…,a n +3的平均数为____,方差为______,标准差为______。
②数据3a1,3a2 ,3a3 ,…,3a n的平均数为______,方差为______,标准差为______。
③数据2a1-3,2a2 -3,2a3 -3 ,…,2a n -3的平均数为______,方差为______,标准差为______。
自我反思你有什么收获?你还有什疑问?。
方差、标准差、协方差和Pearson相关系数及其间的关系方差、协方差和Pearson相关系数在机器学习的理论概念中经常出现,本文主要理一下这几个概念及其相互间的关系。
(一)方差:方差是每个样本值与全体样本值的平均数之差的平方值的平均数,公式如下:上式中mui为样本均值。
方差可以反应样本数据的离散程度,由上式可以看出,方差越大,样本离散程度也越大。
机器学习中,如果某一特征值的离散程度很小,即表示该特征取值很少,可以认为样本在这个特征上基本没有差异,那这个特征对于样本区分没有什么作用,可以将这个特征去除,从而做到特征选择。
(二)标准差:标准差即方差的开平方,不展开了,下面是公式:(三)协方差:协方差描述的是两个变量间的相关性,计算公式如下:也可以用以下公式表示,两者是等价的:cov(X, Y) = E[(X-E[X])(Y-E[Y])]上式中E[ ]表示求期望,其中E[X]为X特征期望或均值,E[Y]为Y 特征期望或均值。
对比方差和协方差的公式可以看出两者很像,但方差的结果是大于等于0的,当等于0时,说明样本的x特征取值唯一,反应的样本的x特征的离散程度;协方差的取值则可以大于零也可以小于零,当大于零时,说明对应的两个变量x和y与其均值相比都同大于或同小于,即两个变量的变化趋势相同(正相关);当小于零时,说明对应的两个变量x和y不同时大于或小于其均值,即两个变量的变化趋势相反(负相关);而当均方根接近零时,说明两个变量基本没有相关性,接近相互独立。
从以上描述可以看出,协方差可以衡量两个变量相关性大小,绝对值越大,说明越相关。
但是,却不好比较多个变量与另外同一个变量间相关性的相对大小,因为量纲没有统一。
为了便于比较不同变量与另外同一个变量间相关性的相对大小,Pearson相关系数被提出了。
Pearson相关系数:如上所述,Pearson相关性系数是为了比较不同变量与另外同一变量间相关性的相对大小,这里要注意的是:Pearson相关性系数衡量的是定距变量间的线性关系,可以用Pearson相关系数来进行特征特征选择。
方差§ 方差数学期望是随机变量的一个重要数字特征,它表示了随机变量的平均水平,但有时仅用数学期望来描述随机变量是不够的,如:有两名射击选手,他们每次射击命中的环数分别为21,X X ,对应的分布列为:由于9)()(21==X E X E ,可见从数学期望这个角度无法分出两射击选手水平的高低,故还需考虑其它的因素,通常做法是:比较两选手射击技术的稳定性,研究随机变量和均值偏离程度.首先看)(X E X -,但这种偏差有正有负,可能出现正负抵消情况,常考虑)(X E X -来描述随机变量的波动大小,但绝对值在数学上处理不方便,故改用2)]([X E X -来消去符号,然后再求均值2)]([X E X E -来度量随机变量取值的波动大小.此例中,4.0)]([211=-X E X E ,8.0)]([222=-X E X E ,由此可见第一名选手的技术更稳定一些.本节将引进另一个数字特征--方差。
用它来度量随机变量取值在其均值附近的平均偏离程度。
4.2.1方差的概念定义 4.3 设随机变量X ,若2{[()]}E X E X -存在,则称其为X 的方差,记为()D X 或Var()X ,即2Var()(){[()]}D X E E X X X ==-.X 的均方差或标准差,也记为()X σ.4.2.2方差的计算由定义知,方差实际上是随机变量X 的函数2()[()]g X X E X =-的数学期望. 注 (1)方差是随机变量与其均值的离差平方的数学期望,仍是一种期望,它反映了随机变量取值与其均值的偏差程度;(2))(X D 越大,则随机变量X 的取值越分散;)(X D 越小,则随机变量X 的取值越集中;(3)既然方差是一种期望,且是随机变量函数2)]([)(X E X X g -=的数学期望,故:⎪⎪⎩⎪⎪⎨⎧--=-=⎰∑∞+∞-222,)()]([,)]([)]([)(为连续型随机变量为离散型随机变量X dx x f X E x X p X E x X E X E X D i i i(4))(X E 可正可负,但0)(≥X D ;(5))(X E 存在时,)(X D 不一定存在;但当)(X D 存在时,)(X E 一定存在./ 另外,方差既然是期望,则利用期望的性质,有:})]([)(2{)]([)(222X E X XE X E X E X E X D +-=-=2222)]([)()]([)()(2)(X E X E X E X E X E X E -=+-=在计算方差时,除用定义法外有时也用22)]([)()(X E X E X D -=计算,应根据实际情况而定.例4.24((0-1)分布)设随机变量X 服从参数为p 的(01)-分布,求()D X . 解 X 的分布律为{1}P X p ==, (0)1P X p ==-.由于()E X p =,且222()10(1)E X p p p =⨯+⨯-=,因而222()()[()](1)D X E X E X p p p p =-=-=-.例4.25 二项分布 ),(~p n B X随机变量X 的分布列为:n k p p C k X P kn k k n ,,1,0,)1()( =-==-k n knk k n kn knk k nkn knk k np p kC p p C k k p p C k X E -=-=-=-+--=-=∑∑∑)1()1()1()1()(022npqp n p np p n npp n n np p p Cpn n k n k nk k n +=-+=+-=+--=--=--∑2222222222)1()1()1()1(故npq np npq p n X E X E X D =-+=-=22222)()]([)()(例4.26(泊松分布)设随机变量X 服从参数为λ的泊松分布,求()D X . 解X 的分布律为{}e ,0,1,2,,0!kP X k k k λλλ-===>.因()E X λ=,且2()[(1)][(1)]()E X E X X X E X X E X =-+=-+1(1)e!kk k k k λλλ∞-==-+∑222e(2)!k k k λλλλ-∞-==+-∑22ee λλλλλλ-=⋅+=+从而2222()()[()]D X E X E X λλλλ=-=+-=例4.27(均匀分布)设随机变量X 在区间(,)a b 上服从均匀分布,求()D X . 解 随机变量X 的概率密度为1,,()0,a x b f x b a⎧<<⎪=-⎨⎪⎩其他. 由()2a bE X +=,且 3322211()()d d 3bab a E X x f x x x x b a b a +∞-∞-==⋅=⋅--⎰⎰223b ab a ++=因而22()()[()]D X E X E X =-223b ab a ++=22a b +⎛⎫- ⎪⎝⎭2()12b a -=.例4.28(指数分布)设随机变量X 服从指数分布,其概率密度为11e 0()00x x f x x θθ-⎧>⎪=⎨⎪≤⎩,, 0θ>,求()D X .解 11101()()d ed eed 0xxxE X xf x x x x x x θθθθ---+∞+∞+∞-∞+∞===-+⎰⎰⎰exθθθ-+∞=-=.且12221()()d ed xE Xx f x x xx θθ-+∞+∞-∞==⎰⎰112e2ed xxx x x θθ+∞--+∞=-+⎰22θ=.因而22222()()[()]2D X E X E X θθθ=-=-=.例4.29(正态分布)设随机变量2~(,)X N μσ,求()D X .解 由()E X μ=,从而22()222(){[()]}()d x D X E X E X x xμσμ--+∞-∞=-=-⎰2222e d ()t x t t t μσ+∞--∞-==⎰令22222(e )e d t t t t +∞+∞---∞-∞⎡⎤⎢⎥=-+⎢⎥⎣⎦⎰22σ== 将上面的常见的随机变量的数学期望和方差总结如下:例4.30 若],[~b a U X 且3)(=X E ,3)(=X D ,求:b a ,. 解:由],[~b a U X 得)(X E 2ba +=,)(X D 12)(2ab -=故32=+ba ,3112)(2=-a b 解上得,4,2==b a例4.31 已知随机变量X 服从二项分布,且4.2)(=X E ,44.1)(=X D ,求二项分布的参数p n ,。
2.3.2 方差与标准差1.理解样本数据方差与标准差的意义和作用,会计算数据的方差、标准差.(重点、难点)2.掌握通过合理抽样对总体的稳定性水平作出科学估计的思想.(难点)[基础·初探]教材整理方差与标准差阅读教材P69~P70“例4”上边的内容,并完成下列问题.1.极差的概念我们把一组数据的最大值与最小值的差称为极差.2.方差与标准差的概念(1)设一组样本数据x1,x2,…,x n,其平均数为x-,则称s2=1n∑i=1n(x i-x-)2为这个样本的方差.(2)方差的算术平方根s=1n∑i=1n(x i-x-)2为样本的标准差.填空:(1)已知样本方差为s2=110∑i=1n(x i-5)2,则样本的平均数x-=________;x1+x2+…+x10=________. 【导学号:11032048】【解析】由题意得x=5,n=10,∴x =x 1+x 2+x 3+…+x 1010=5,∴x 1+x 2+x 3+…+x 10=50.【★答案★】 5 50(2)数据10,6,8,5,6的方差s 2=________. 【解析】 5个数的平均数x =10+6+8+5+65=7,所以s 2=15×[(10-7)2+(6-7)2+(8-7)2+(5-7)2+(6-7)2]=3.2. 【★答案★】 3.2[小组合作型]方差与标准差的计算(1)某学校一名篮球运动员在五场比赛中所得分数的茎叶图如图2-3-7, 则该运动员在这五场比赛中得分的方差为________.图2-3-7(2)设样本数据x 1,x 2,…,x 10的均值和方差分别为1和4,若y i =x i +a (a 为非零常数,i =1,2,…,10),则y 1,y 2,…,y 10的均值和标准差分别为________、________.【精彩点拨】 根据方差和均值的定义进行计算.【自主解答】 (1)依题意知,运动员在5次比赛中的分数依次为8,9,10,13,15,其平均数为8+9+10+13+155=11.故方差为s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=15(9+4+1+4+16)=6.8.(2)样本数据x 1,x 2,…,x 10的均值x =110(x 1+x 2+…+x 10)=1,方差s′2=110[(x1-1)2+(x2-1)2+…+(x10-1)2]=4,新数据x1+a,x2+a,…,x10+a的均值x=110(x1+a+x2+a+…+x10+a)=110(x1+x2+…+x10)+a=1+a.新数据x1+a,x2+a,…,x10+a的方差s2=110[(x1+a-1-a)2+(x2+a-1-a)2+…+(x10+a-1-a)2]=110[(x1-1)2+(x2-1)2+…+(x10-1)2]=4.∴s=2.【★答案★】(1)6.8(2)1+a 2求样本方差或标准差的步骤:(1)求样本的平均数x-=1n∑i=1nx i;(2)利用公式s2=1n∑i=1n(x i-x-)2求方差s2;(3)利用s=s2求标准差s.[再练一题]1.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为________.【解析】由题意知15(a+0+1+2+3)=1,解得a=-1,所以样本方差为s2=15[(-1-1)2+(0-1)2+(1-1)2+(2-1)2+(3-1)2]=2.【★答案★】 2方差与标准差的应用加工的零件中抽取6件测量,所得数据为:甲:9910098100100103乙:9910010299100100(1)分别计算两组数据的平均数与方差;(2)根据计算的结果判断哪台机床加工零件的质量更稳定. 【精彩点拨】 求平均数→计算方差 →根据方差的大小进行判断【自主解答】 (1)x 甲=16(99+100+98+100+100+103)=100, x 乙=16(99+100+102+99+100+100)=100.s 2甲=16[(99-100)2+(100-100)2+(98-100)2+(100-100)2+(100-100)2+(103-100)2]=73,s 2乙=16[(99-100)2+(100-100)2+(102-100)2+(99-100)2+(100-100)2+(100-100)2]=1.(2)两台机床所加工零件的直径的平均值相同.又s 2甲>s 2乙,所以乙机床加工零件的质量更稳定.1.方差和标准差都是反映一组数据波动情况的特征数,常用来比较两组数据的波动大小.方差、标准差越大,数据的离散程度越大;方差、标准差越小,数据的离散程度越小或数据越集中,稳定.2.比较两组数据的异同点,一般情况是从平均数及方差或标准差这两个方面考虑.[再练一题]2.甲、乙两位学生参加数学竞赛培训,在培训期间他们参加5次测试,成绩记录如下:甲:78 76 74 90 82 乙:90 70 75 85 80现要从中选派一人参加数学竞赛,从统计学的角度考虑,应选择________同学.(填“甲”或“乙”)【解析】 x 甲=80,x 乙=80,而s 2甲=15×[(78-80)2+(76-80)2+(74-80)2+(90-80)2+(82-80)2]=32.s 2乙=15×[(90-80)2+(70-80)2+(75-80)2+(85-80)2+(80-80)2]=50. ∵x 甲=x 乙,s 2甲<s 2乙,∴从统计学的角度考虑,选甲参加更合适. 【★答案★】 甲[探究共研型]平均数、方差的性质 探究1 何?s =0表示怎样的意义?【提示】 由于方差进行了平方运算,故方差的单位是原始数据单位的平方,从而标准差的单位与原始数据的单位相同.由标准差的定义知s ≥0,当s =0时,表示所有的样本数据都相同.探究2 所有样本数据均加上一个常数,其平均数、方差改变吗?若所有样本数据均乘以一个非零常数时,结果又会怎样?【提示】 设样本x 1,x 2,…,x n 的平均数为x -,方差为s 2,则样本x 1+b ,x 2+b ,…,x n +b 的平均数为x -+b ,方差为s 2;样本ax 1,ax 2,…,ax n 的平均数为a x -,方差为a 2s 2.从某班抽取5名学生测量身高(单位:cm)数据如下:161,163,162,165,164.求这5名学生身高的平均数及标准差. 【精彩点拨】 本题可用两种解法. 方法一是直接套公式计算.方法二把原数据统一减去一个常数160,通过新数据的平均数、方差求解. 【自主解答】 法一:身高的平均数x -= 161+163+162+165+1645=163(cm),标准差s =15[(161-163)2+(163-163)2+(162-163)2+(165-163)2+(164-163)2] =2(cm).法二:将原数据都减去160之后得到一组新数据为1,3,2,5,4, 新数据的平均数x -′=15(1+3+2+5+4)=3,新数据的方差s ′2=15[(1-3)2+(3-3)2+(2-3)2+(5-3)2+(4-3)2]=2, 由平均数及方差的性质得原数据的平均数x -=160+3=163(cm), 原数据的标准差s =s ′2=2(cm).1.平均数、方差具有以下性质.(1)数据x 1,x 2,…,x n 与数据x 1′=x 1+a ,x 2′=x 2+a ,…,x n ′=x n +a 的方差相等,即数据经过平移后方差不变.(2)若x 1,x 2,…,x n 的平均数为x -,方差为s 2,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a ,方差为m 2s 2.2.利用以上性质可使平均数,方差的计算变得简单.[再练一题]3.已知k 1,k 2,…,k n 的方差为5,则3(k 1-4),3(k 2-4),…,3(k n -4)的方差为________.【导学号:11032049】【解析】 设k 1,k 2,…,k n 的平均数为k ,则3(k 1-4),3(k 2-4),…,3(k n -4)的平均数为3(k -4),∴s 2=1n ∑i =1n [3(k i -4)-3(k -4)]2=1n ∑i =1n [3(k i -k )]2=9×1n ∑i =1n (k i -k )2=9×5=45.【★答案★】 451.下列叙述不正确的是________.(填序号) ①样本的平均数可以近似地描述总体的平均水平; ②极差描述了一组数据变化的幅度;③样本的方差描述了一组数据围绕平均数波动的大小; ④一个班级的数学成绩的方差越大说明成绩越稳定.【解析】 选项①②③都是对三个基本概念的正确描述,方差越大说明一组数据围绕平均数的波动越大,所以,一个班级的数学成绩的方差越大,说明成绩越不稳定,因此选项④是不正确的.故选④.【★答案★】 ④2.甲、乙、丙、丁四人参加奥运会射击项目选拔赛,四人的平均成绩和方差见表:甲 乙 丙 丁 平均数x - 8.5 8.8 8.8 8 方差s 23.53.52.18.7【解析】 由平均数及方差的定义知,丙的平均成绩较高且较稳定. 【★答案★】 丙3.若1,2,3,x 的平均数是5,而1,3,3,x ,y 的平均数是6,则1,2,3,x ,y 的方差是________.【解析】 由5=1+2+3+x4得x =14. 同理y =9.由s 2=15(12+22+32+142+92)-5.82=24.56. 【★答案★】 24.564.已知样本9,10,11,x ,y 的平均数是10,方差是4,则xy =________.【导学号:11032050】【解析】 由题意得:⎩⎪⎨⎪⎧9+10+11+x +y 5=10,15()92+102+112+x 2+y 2-102=4,整理得⎩⎨⎧x +y =20, ①x 2+y 2=218, ②①2-②得2xy =182, ∴xy =91. 【★答案★】 915.假定下述数据是甲、乙两个供货商的交货天数, 甲:10,9,10,10,11,11,9,11,10,10; 乙:8,10,14,7,10,11,10,8,15,12.根据两个供货商的交货情况.并计算哪个供货商交货时间短一些,哪个供货商交货时间较具一致性与可靠性?【解】 x -甲=110(10+9+…+10)=10.1, s 2甲=110(102+92+…+102)-10.12=0.49, x -乙=110(8+10+…+12)=10.5, s 2乙=110(82+…+122)-10.52=6.05. ∴s 2甲<s 2乙.从交货天数的平均值来看,甲供货商的供货天数短一些,从方差来看,甲供货商的交货天数较稳定,因此甲是较具一致性与可靠性的厂商.。
第24课时 方差与标准差
【学习导航】 学习要求 1.体会方差与标准差也是对调查数据的一种简明的描述,要求熟练记忆公式,并能用于生产实际和科学实验中; 2.体会方差与标准差对数据描述中的异同。
【课堂互动】 自学评价 案例 有甲乙两种钢筋现从中各抽取一个样本(如下表)检查它们的抗拉强度(单位:kg/mm 2
),通过计算发现,两个样本的平均数均为125.
【分析】
在平均数相同的情况下,观察上述数据表,发现乙样本的最小值100低于甲样本的最小值110,最大值145高于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.
在平均数相同的情况下,比较两组数据的极差能大概判断它们的稳定程度. 极差: 我们把一组数据的最大值与最小值的差称为极差. 从数据表上可以看出,乙
的极差较大,数据较分散;甲的极差小,数据较集中,这就说明甲比乙稳定. 运用极差对两组数据进行比较,操作简单方便,但如果
两组数据的集中程度差异不大时,就不容易得出结论.这时,我们考虑用更为精确的方法——方差. 在上一课时中,学习了总体平均数的估计,其中提到平均数是“最理想”近似值的缘
由.同样我们可以考虑每一抗拉强度与平均抗拉强度的离
差,
离差越小,稳定性就越高. 那么,怎样来刻画一组数据的稳定程度呢? 在上一课时中,设n 个实验值i
a (i =1,2,…,n)的近似值为x ,那么它与这n 个实验值i
a (i =1,2,…,n)的离差分别为1
a x -,2
a x -,…,n
a x -.由于上述离差有正有负,故不宜直接相加.可以考虑将各个离差的绝对值相加,研究|1
a x -|+|2
a x -|+…+|n
a x -|取最
小值时x 的值.但由于含绝对值,运算不太方便,所以考虑离差的平方和,即
(1
a x -)2+(2
a x -)2+…+(n
a x -)2
,当
此和最小时,对应的x 的值作为
近似值,因为
(1
a x -)2
+(2
a x -)2
+…+(
n
a x -)2
=
222
21
212
)(2n
n a
a a x a a a nx +⋅⋅⋅++++⋅⋅⋅++-,
所以当
)
(1
21n a a a n
x +⋅⋅⋅++=时离差的平方和最小,故可用)(12
1
n
a a a n
+⋅⋅⋅++作为表示这个物理量的理想近似值,称其为这n 个数据1
a ,2
a ,…,n
a 的平均数或均值,
一般记为 )(121n
a a a n
a +⋅⋅⋅++=. 在上述过程中,可以发
现,一组数据与其平均数的离差的平方和最小,考虑用
与其平均数的离差的平方和
来刻画一组数据的稳定程度
是可行的.即本案例中,可
用各次抗拉强度与平均抗拉
强度的差的平方和表示.由
于比较的两组数据的容量可
能不同,因此应将上述平方
和除以数据的个数,我们把
由此所得的值称为这组数据
的方差.
因为方差与原始数据的
单位不同,且平方后可能夸
大了离差的程度,我们将方
差开方后的值称为这组数据
的标准差.标准差也可以刻
画数据的稳定程度.
一般地,设一组样本数
据n
x x x ,,,2
1
⋅⋅⋅,其平均数为x ,则称∑=-=n
i i
x x n
s 1
2
2
)(1
为这个样本的方差,其算术平
方根∑=-=n
i i x x n s 1
2
)(1 为样本的标
准差,分别简称样本方差,样本标准差.
根据上述方差计算公式可算得甲、乙两个样本的方差分别为50和165,故可认为甲种钢筋的质量好于乙种钢筋.
【精典范例】 例1 甲、乙两种冬水稻试验品
种连续5年的平均单位面积产
量如下(单位:t/hm 2
), 试根
据这组数据估计哪一种水稻品
种的产量比较稳定:
【解】
甲品种的样本平均数为10,样
本方差为
222)101.10()109.9()108.9[(-+-+-
])102.10()1010(22-+-+5÷
=0.02
乙品种的样本平均数也为10,
样本方差为
222)108.10()103.10()104.9[(-+-+-
5])108.9()107.9(22÷-+-+
=0.24
例2 为了保护学生的视力,教室内的日光灯在使用一段
时间后必须更换。
已知某校
使用的100只日光灯在必须
换掉前的使用天数如下,试
估计这种日光灯的平均使用
寿命和标准差
寿命,再求平均寿命。
【解】
各组中值分别为
165,195,225,2
55,285,315,
345,375,由此算得平均数
约为
%
20255%18225%11195%1165⨯+⨯+⨯+⨯
%
2375%7345%16315%25285⨯+⨯+⨯+⨯+ =267.9268≈ 将各组中值对于此平均数求方差得 +
-⨯+-⨯⨯2
2)268195(11)268165(1[100
1
+-⨯+-⨯22)268255(20)268225(18 +-⨯+-⨯2
2)268315(16)268285(25 ])268375(2)268345(722-⨯+-⨯
=2128.60(天2
)
故标准差约为4660.2128≈
答:估计这种日光灯的平均使
用寿命约为268天,标准差约
为46天。
(2)比较计算结果,各组方差
和标准差的关系是什么?
【解】
(1) 甲:6.7,2.6; 乙:
6.7,2.6
丙:666.7,25.8 丁:26.7,5.2 (2) 乙的方差与标准差分别
与甲的相同;
丙的方差是甲的方差的100倍,标准差是甲的10倍;
丁的方差是甲的方差的4倍,标准差是甲的2倍
例4某市共有50万户居民,城市调查队按千分之一的比例进行入户调查,抽样调查的结果如下
月收入的估计
1
x及其方差的估计2
1
s;
(2)管理人员家庭人均月收入的估计
2
x及其方差的估计
2
2
s
(3)平均数的估计x及总体方差的估计2s
【解】分组数据用组中值作为本组数据的代表。
(1)
1
x=995,21s=83475 (2)
2
x=1040,22s=90900 (3) x=1004 2s=85284
追踪训练
1.若样本
1
a,2a,3a,...,n a的平均数5
x=,方差20.025
S=,则样本
1
4a,24a,34a,...,4n a 的平均数x'=______20_____ ,2S'=____0.4_____.
2.若
2
1
,k
k,…,8k的方差为3,则)3
(2
1
-
k,)3
(2
2
-
k,…,)3
(2
8
-
k 的方差为12。
3.计算下列两组数据的平均数
甲的平均数为:0.66
标准差:0.21
乙的平均数为:10
标准差:0.92。