高中数学2.3.2方差与标准差
- 格式:ppt
- 大小:649.00 KB
- 文档页数:24
2.3.2 离散型随机变量的方差1.问题导航(1)离散型随机变量的方差及标准差的定义是什么?(2)方差具有哪些性质?两点分布与二项分布的方差分别是什么? (3)如何计算简单离散型随机变量的方差? 2.例题导读(1)例4求随机变量的均值和方差、标准差,请试做教材P 68练习1题. (2)例5是均值和方差的实际应用,请试做教材P 68练习3题.1.方差、标准差的定义及方差的性质 (1)方差及标准差的定义:设离散型随机变量X 的分布列为①方差D (X )=∑n i =1(x i -E (X ))2p i . ②标准差为________D (X ).(2)方差的性质:D (aX +b )=________a 2D (X ). 2.两个常见分布的方差(1)若X 服从两点分布,则D (X )=________p (1-p ). (2)若X ~B (n ,p ),则D (X )=________np (1-p ).1.判断(对的打“√”,错的打“×”)(1)离散型随机变量的方差越大,随机变量越稳定.( ) (2)若a 是常数,则D (a )=0.( )(3)离散型随机变量的方差反映了随机变量偏离于期望的平均程度.( ) 答案:(1)× (2)√ (3)√2.一批产品中,次品率为13,现连续抽取4次,其次品数记为X ,则D (X )的值为( )A.43B.83C.89D .1答案:C3.如果X 是离散型随机变量,E (X )=6,D (X )=0.5,X 1=2X -5,那么E (X 1)和D (X 1)分别是( )A .E (X 1)=12,D (X 1)=1B .E (X 1)=7,D (X 1)=1C .E (X 1)=12,D (X 1)=2 D .E (X 1)=7,D (X 1)=2 答案:D4.已知随机变量X ________.答案:3.561.方差与标准差的作用随机变量的方差与标准差一样,都是反映随机变量的取值的稳定与波动、集中与离散程度的,方差越小,取值越集中,稳定性越高,波动性越小;反之,方差越大,取值越不集中,稳定性越差,波动性越大.2.随机变量的方差与样本方差的关系随机变量的方差是总体的方差,它是一个常数,样本的方差则是随机变量,是随样本的变化而变化的.对于简单随机样本,随着样本容量的增加,样本的方差越来越接近于总体的方差.求离散型随机变量的方差袋中有20个大小相同的球,其中记上0号的有10个,记上n 号的有n 个(n =1,2,3,4).现从袋中任取一球,ξ表示所取球的标号.求ξ的分布列、均值和方差;[解] 由题意得,ξ的所有可能取值为0,1,2,3,4,P (ξ=0)=1020=12,P (ξ=1)=120,P (ξ=2)=220=110,P (ξ=3)=320,P (ξ=4)=420=15.故ξ的分布列为所以E (ξ)=0×12+1×120+2×110+3×320+4×15=1.5,D (ξ)=(0-1.5)2×12+(1-1.5)2×120+(2-1.5)2×110+(3-1.5)2×320+(4-1.5)2×15=2.75.[互动探究] 在本例条件下,若η=aξ+b ,E (η)=1,D (η)=11,试求a ,b 的值. 解:由D (aξ+b )=a 2D (ξ)=11,E (aξ+b )=aE (ξ)+b =1,及E (ξ)=1.5,D (ξ)=2.75,得2.75a 2=11,1.5a +b =1,解得a =2,b =-2或a =-2,b =4.1.求离散型随机变量X 的均值、方差的步骤: (1)理解X 的意义,写出X 的所有可能的取值; (2)求X 取每一个值的概率; (3)写出随机变量X 的分布列;(4)由均值、方差的定义求E (X ),D (X ).2.对于变量间存在关系的方差,在求解过程中应注意方差性质的应用,如D (aξ+b )=a 2D (ξ),这样处理既避免了求随机变量η=aξ+b 的分布列,又避免了繁杂的计算,简化了1.(1)已知随机变量ξ若E (ξ)=23,则D (ξ)的值为________.解析:由分布列的性质,得 12+13+p =1,解得p =16. ∵E (ξ)=0×12+1×13+16x =23,∴x =2.D (ξ)=⎝⎛⎭⎫0-232×12+⎝⎛⎭⎫1-232×13+⎝⎛⎭⎫2-232×16=1527=59. 答案:59(2)甲、乙两人进行定点投篮游戏,投篮者若投中,则继续投篮,否则由对方投篮,第一次由甲投篮;已知每次投篮甲、乙命中的概率分别为13,34.在前3次投篮中,乙投篮的次数为ξ,求ξ的分布列、期望.解:乙投篮的次数ξ的取值为0,1,2.P (ξ=0)=13×13=19;P (ξ=1)=13×23+23×14=718.P (ξ=2)=23×34=12.故ξ的分布列为E (ξ)=0×19+1×718+2×12=2518,D (ξ)=(0-2518)2×19+(1-2518)2×718+(2-2518)2×12=149324.两点分布与二项分布的方差一出租车司机从某饭店到火车站途中有六个交通岗,假设他在各交通岗遇到红灯这一事件是相互独立的,并且概率是13.(1)求这位司机遇到红灯数ξ的期望与方差;(2)若遇上红灯,则需等待30 s ,求司机总共等待时间η的期望与方差. [解] (1)易知司机遇上红灯次数ξ服从二项分布,且ξ~B (6,13),故E (ξ)=6×13=2,D (ξ)=6×13×(1-13)=43.(2)由已知η=30ξ,故E (η)=30E (ξ)=60(s),D (η)=900D (ξ)=1 200.解决此类问题的第一步是判断随机变量ξ服从什么分布,第二步代入相应的公式求解.若ξ服从两点分布,则D (ξ)=p (1-p );若ξ服从二项分布,即ξ~B (n ,p ),则D (ξ)=np (1-p ).2.(1)(2015·高考广东卷)已知随机变量X 服从二项分布B (n ,p ).若E (X )=30,D (X )=20,则p =________.解析:由E (X )=30,D (X )=20,可得⎩⎪⎨⎪⎧np =30,np (1-p )=20,解得p =13.答案:13(2)在某地举办的射击比赛中,规定每位射手射击10次,每次一发.记分的规则为:击中目标一次得3分;未击中目标得0分;并且凡参赛的射手一律另加2分.已知射手小李击中目标的概率为0.8,求小李在比赛中得分的数学期望与方差.解:用ξ表示小李击中目标的次数,η表示他的得分,则由题意知ξ~B(10,0.8),η=3ξ+2.因为E(ξ)=10×0.8=8,D(ξ)=10×0.8×0.2=1.6,所以E(η)=E(3ξ+2)=3E(ξ)+2=3×8+2=26(分),D(η)=D(3ξ+2)=32×D(ξ)=9×1.6=14.4.均值、方差的综合应用甲、乙两名射手在一次射击中得分为两个相互独立的随机变量X与Y,且X,Y 的分布列如下:(1)求a,b的值;(2)计算X,Y的期望与方差,并以此分析甲、乙技术状况.[解](1)由离散型随机变量的分布列的性质可知a+0.1+0.6=1,得a=0.3.同理0.3+b+0.3=1,得b=0.4.(2)E(X)=1×0.3+2×0.1+3×0.6=2.3,E(Y)=1×0.3+2×0.4+3×0.3=2,D(X)=(1-2.3)2×0.3+(2-2.3)2×0.1+(3-2.3)2×0.6=0.81,D(Y)=(1-2)2×0.3+(2-2)2×0.4+(3-2)2×0.3=0.6.由于E(X)>E(Y),说明在一次射击中,甲的平均得分比乙高,但D(X)>D(Y),说明甲得分的稳定性不如乙,因此甲、乙两人技术水平都不够全面,各有优势与劣势.离散型随机变量的期望反映了离散型随机变量取值的平均水平,而方差反映了离散型随机变量取值的稳定与波动、集中与离散的程度.因此在实际决策问题中,需先运算均值,看一下谁的平均水平高,然后再计算方差,分析一下谁的水平发挥相对稳定,当然不同的模型要求不同,应视情况而定.3.甲、乙两个野生动物保护区有相同的自然环境,且野生动物的种类和数量也大致相试评定这两个保护区的管理水平.解:甲保护区违规次数ξ的数学期望和方差分别为E (ξ)=0×0.3+1×0.3+2×0.2+3×0.2=1.3;D (ξ)=(0-1.3)2×0.3+(1-1.3)2×0.3+(2-1.3)2×0.2+(3-1.3)2×0.2=1.21.乙保护区的违规次数η的数学期望和方差分别为E (η)=0×0.1+1×0.5+2×0.4=1.3; D (η)=(0-1.3)2×0.1+(1-1.3)2×0.5+(2-1.3)2×0.4=0.41.因为E (ξ)=E (η),D (ξ)>D (η),所以两个保护区内每个季度发生的违规事件的平均次数相同,但甲保护区的违规事件次数相对分散和波动性大,乙保护区的违规事件次数更集中和稳定,说明乙保护区的管理水平较好.试求D (X )和D (2X -1).[解] E (X )=0×0.2+1×0.2+2×0.3+3×0.2+4×0.1=1.8,所以D (X )=(0-1.8)2×0.2+(1-1.8)2×0.2+(2-1.8)2×0.3+(3-1.8)2×0.2+(4-1.8)2×0.1=1.56.所以D (2X -1)=4D (X )=4×1.56=6.24.[错因与防范] (1)解答本例易将方差的性质用错,即D (aZ +b )=aD (Z )+b . (2)解决此类问题方法,应利用公式E (aX +b )=aE (X )+b ,D (aX +b )=a 2D (X ),将求E (aX +b ),D (aX +b )的问题转化为求E (X ),D (X )的问题,从而可以避免求aX +b 的分布列的繁琐的计算,解题时可根据两者之间的关系列出等式,进行相关计算.4.已知随机变量X ~B (100,0.2),那么D (4X +3)的值为( ) A .64 B .256 C .259 D .320解析:选B.由X ~B (100,0.2)知n =100,p =0.2, 由公式得D (X )=np (1-p )=100×0.2×0.8=16, 因此D (4X +3)=42D (X )=16×16=256.1.设一随机试验的结果只有A 和A ,且P (A )=m ,令随机变量ξ=⎩⎪⎨⎪⎧1,A 发生,0,A 不发生,则ξ的方差D (ξ)等于( )A .mB .2m (1-m )C .m (m -1)D .m (1-m ) 解析:选D.随机变量ξ∴E (ξ)=0×(1-m )+1×m =m .∴D (ξ)=(0-m )2×(1-m )+(1-m )2×m =m (1-m ).2.已知随机变量X +Y =8,若X ~B (10,0.6),则E (Y ),D (Y )分别是( ) A .6和2.4 B .2和2.4 C .2和5.6 D .6和5.6解析:选B.由已知随机变量X +Y =8,所以有Y =8-X . 因此,求得E (Y )=8-E (X )=8-10×0.6=2, D (Y )=(-1)2D (X )=10×0.6×0.4=2.4.3.有两台自动包装机甲与乙,包装质量分别为随机变量X 1,X 2,已知E (X 1)=E (X 2),D (X 1)>D (X 2),则自动包装机________的质量较好.解析:因为E (X 1)=E (X 2),D (X 1)>D (X 2),故乙包装机的质量稳定. 答案:乙4.若随机变量X 的分布列为:(1)求m 的值;(2)求E (X )和D (X ).解:(1)由随机变量分布列的性质,得0.1+0.2+0.4+m +0.1=1,解得m =0.2.(2)E (X )=-2×0.1+(-1)×0.2+0×0.4+1×0.2+2×0.1=0,D (X )=(-2-0)2×0.1+(-1-0)2×0.2+(0-0)2×0.4+(1-0)2×0.2+(2-0)2×0.1=1.2.[A.基础达标]1.下列说法正确的是( )A .离散型随机变量ξ的数学期望E (ξ)反映了ξ取值的概率的平均值B .离散型随机变量ξ的方差D (ξ)反映了ξ取值的平均水平C .离散型随机变量ξ的数学期望E (ξ)反映了ξ取值的平均水平D .离散型随机变量ξ的方差D (ξ)反映了ξ取值的概率的平均值解析:选C.由离散型随机变量的数学期望与方差的定义可知,C 正确.故选C. 2.设X ~B (n ,p ),若D (X )=4,E (X )=12,则n 和p 分别为( ) A .18和23B .16和12C .20和13D .15和14解析:选A.∵X ~B (n ,p ),∴⎩⎪⎨⎪⎧np =12,np (1-p )=4,解得p =23,n =18.3.已知X 的分布列如下表所示,则下列式子:①E (X )=-13;②D (X )=2327;③P (X =0)=13.其中正确的有( )A.0个 B .1个 C .2个D .3个解析:选C.E (X )=(-1)×12+0×13+1×16=-13,D (X )=(-1+13)2×12+(0+13)2×13+(1+13)2×16=59,故只有①③正确. 4.设随机变量ξ的分布列为P (ξ=k )=C k n (23)k ·(13)n -k ,k =0,1,2,…,n ,且E (ξ)=24,则D (ξ)的值为( ) A .8B .12 C.29D .16解析:选A.由题意可知ξ~B (n ,23),∴23n =E (ξ)=24.∴n =36. ∴D (ξ)=n ×23×(1-23)=29×36=8.5.(2015·滨州高二期末检测)若随机变量X 的分布列为:P (X =m )=13,P (X =n )=a ,若E (X )=2,则D (X )的最小值等于( )A .0B .2C .4D .无法计算解析:选A.依题意有a =1-13=23,所以E (X )=13m +23n =2,即m +2n =6.又D (X )=13(m-2)2+23(n -2)2=2n 2-8n +8=2(n -2)2,所以当n =2时,D (X )有最小值为0.6.(2014·高考浙江卷)随机变量ξ的取值为0,1,2.若P (ξ=0)=15,E (ξ)=1,则D (ξ)=________.解析:设P (ξ=1)=a ,P (ξ=2)=b ,则⎩⎪⎨⎪⎧15+a +b =1,a +2b =1,解得⎩⎨⎧a =35,b =15,所以D (ξ)=15+35×0+15×1=25.答案:257.(2015·扬州高二检测)设一次试验成功的概率为p ,进行100次独立重复试验,当p =________时,成功次数的标准差的值最大,其最大值为________.解析:由独立重复试验的方差公式可以得到 D (ξ)=np (1-p )≤n (p +1-p 2)2=n4,等号在p =1-p =12时成立,所以D (ξ)max =100×12×12=25,D (ξ)max =25=5.答案:1258.随机变量ξ的分布列如下,其中a ,b ,c 成等差数列.若E (ξ)=53,则D (ξ)的值为________.解析:因为a ,b ,c 成等差数列,所以a +c =2b .又因为a +b +c =1,所以b =13.又因为E (ξ)=a +2b +3c =53,所以a =12,b =13,c =16,所以ξ的分布列为所以D (ξ)=(1-53)2×12+(2-53)2×13+(3-53)2×16=59.答案:599.设在12个同类型的零件中有2个次品,抽取3次进行检验,每次抽取1个,并且取出不再放回,若以ξ表示取出次品的个数,求ξ的分布列、期望值及方差.解:ξ的可能值为0,1,2,P (ξ=0)=C 02C 310C 312=611;P (ξ=1)=C 12C 210C 312=922;P (ξ=2)=C 22C 110C 312=122.∴ξ的分布列为∴E (ξ)=0×611+1×922+2×122=12,D (ξ)=(0-12)2×611+(1-12)2×922+(2-12)2×122=322+988+988=1544.10.为防止风沙危害,某地决定建设防护绿化带,种植杨树、沙柳等植物.某人一次种植了n 株沙柳,各株沙柳成活与否是相互独立的,成活率为p ,设ξ为成活沙柳的株数,数学期望E (ξ)=3,标准差D (ξ)=62. (1)求n ,p 的值并写出ξ的分布列;(2)若有3株或3株以上的沙柳未成活,则需要补种,求需要补种沙柳的概率.解:因为每一株沙柳成活率均为p ,种植了n 株沙柳,相当于做n 次独立重复试验,因此ξ服从二项分布ξ~B (n ,p ).(1)由E (ξ)=np =3,D (ξ)=np (1-p )=32,得1-p =12,从而n =6,p =12.ξ的分布列为:(2)记“需要补种沙柳”为事件A ,则P (A )=P (ξ≤3), 得P (A )=1+6+15+2064=2132.[B.能力提升]1.有甲、乙两名学生,经统计,他们在解答同一份数学试卷时,各自的成绩在80分、90分、100分的概率分布列大致如下表所示:甲:乙:试分析两名学生的成绩水平.解:∵E (X )=80×0.2+90×0.6+100×0.2=90,D (X )=(80-90)2×0.2+(90-90)2×0.6+(100-90)2×0.2=40,E (Y )=80×0.4+90×0.2+100×0.4=90,D (Y )=(80-90)2×0.4+(90-90)2×0.2+(100-90)2×0.4=80, ∵E (X )=E (Y ),D (X )<D (Y ),∴甲生与乙生的成绩均值一样,甲的方差较小,因此甲生的学习成绩较稳定.2.如表,左边为四大名著,右边为名著作者,一位小学语文教师为了激发学生阅读名著的热情,在班内进行名著和其作者的连线游戏,作为奖励,参加连线的同学每连对一个奖励一朵小红花.假定一名小学生对四大名著没有了解,只是随机地连线,试求该学生得到小红花数X 的分布列及其均值、方差.解:可能为0个,1个,2个,4个.P (X =0)=9A 44=924,P (X =1)=C 14×2A 44=824, P (X =2)=C 24×1A 44=624,P (X =4)=1A 44=124. 故X 的分布列为:∴E (X )=0×924+1×824+2×624+4×124=1, D (X )=924×(0-1)2+824×(1-1)2+624×(2-1)2+124×(4-1)2=9+0+6+924=1. 3.某学校为高二年级开展第二外语选修课,要求每位同学最多可以选报两门课程.已知有75%的同学选报法语课,有60%的同学选报日语课.假设每个人对课程的选报是相互独立的,且各人的选报相互之间没有影响.(1)任选1名同学,求其选报过第二外语的概率;(2)任选3名同学,记ξ为3人中选报过第二外语的人数,求ξ的分布列、期望和方差. 解:设事件A :选报法语课;事件B :选报日语课.由题设知,事件A 与B 相互独立,且P (A )=0.75,P (B )=0.6.(1)法一:任选1名同学,该同学一门课程都没选报的概率是P 1=P (A -B -)=P (A )·P (B )=0.25×0.4=0.1.所以该人选报过第二外语的概率是P 2=1-P 1=1-0.1=0.9.法二:任选1名同学,该同学只选报一门课程的概率是P 3=P (AB )+P (AB )=0.75×0.4+0.25×0.6=0.45,该人选报两门课程的概率是P 4=P (AB )=0.75×0.6=0.45.所以该同学选报过第二外语的概率是P 5=P 3+P 4=0.45+0.45=0.9.(2)因为每个人的选报是相互独立的,所以3人中选报过第二外语的人数ξ服从二项分布B (3,0.9),P (ξ=k )=C k 3×0.9k ×0.13-k ,k =0,1,2,3, 即ξ的分布列是ξ的期望是E(ξ)=(或ξ的期望是E(ξ)=3×0.9=2.7),ξ的方差是D(ξ)=3×0.9×(1-0.9)=0.27.。
庖丁巧解牛知识·巧学一、样本方差与样本标准差1.极差(全距)是数据组的最大值与最小值的差.它反映了一组数据的变化的最大幅度,它对一组数据中的极端值非常敏感.2.方差是各数据与平均数的差x i -x (i=1,2,…,n )平方的平均数.它反映了一组数据围绕平均数波动的大小.一般地,设样本数据分别是x 1,x 2,x 3,…,x n ,样本的平均数为x ,则方差s 2=nx x x x x x n 22221)()()(-++-+- .3.标准差是各个样本数据到平均数的一种平均距离.一般用s 表示.标准差s=nx x x x x x n 2221)()()(-++-+- .深化升华 标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,标准差越大,表明各个样本数据在样本平均数的两边越分散.在实际应用中,标准差常被理解为稳定性.例如,在比较两人的成绩时,标准差小就意味着成绩稳定;在描述产品的质量时,标准差越小,说明产品的质量越稳定. 二、计算标准差的计算步骤 (1)算出样本数据的平均数;(2)算出每个样本数据与样本平均数的差x i -x (i=1,2,…,n ); (3)算出(x i -x )2(i=1,2,…,n );(4)算出(x i -x)2(i=1,2,…,n )这n 个数的平均数,即为样本方差s 2=nx x x x x x n 2221)()()(-++-+- ;(5)算出方差的算术平方根,即为样本标准差s=nx x x x x x n 22221)()()(-++-+- .说明:①标准差的大小受样本中每个数据的影响,如数据之间变化大,求得的标准差也大,反之则小.标准差、方差都较好地反映了一组数据的离散程度,标准差、方差越大,数据的离散程度越大,反之,标准差、方差越小,数据的离散程度越小.②在计算标准差时,在各数据上加上或减去一个常数,其数值不变.③当每个数据乘以或除以一个常数a ,则所得的标准差是原来标准差的a 倍或1/a.④标准差的大小不会超过极差,其取值范围是[0,+∞),若一组数据的值大小相等,没有波动变化,则标准差为0.⑤若对数据处理时的计算量较大,要借助科学计算器或计算机,一般科学计算器上都设有计算平均数、方差、标准差的按键,使用时要看说明书(不同的计算机,参数可能不同)进入统计状态就可以求值了.因为方差与原始数据的单位不一致,且平方后可能夸大了偏差的程度,所以虽然标准差、方差都较好地反映了一组数据的离散程度,但在解决实际问题时标准差应用广泛. 联想发散(1)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2;特别地,当a=1时,则有x 1+b ,x 2+b ,…,x n +b 的方差为s 2,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性; (2)方差的另一表示形式:s 2=n1(x 12+x 22+…+x n 2-2nx ). 三、对总体平均数、标准差的估计如何获得总体的平均数与标准差呢?通常的做法是用样本的平均数与标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,只要样本的代表性强就可以用来对总体作出客观的判断. 如要考察一批灯泡的质量,我们可以从中随机抽取一部分作为样本;要分析一批钢筋的强度,可以随机抽取一定数目作为样本.误区警示 需要注意的是,同一个总体,抽取的样本可以是不同的.如一个总体包含6个个体,现在要从中抽出3个作为样本,所有可能的样本会有20种不同的结果,若总体与样本容量较大,可能性就更多,而只要其中的个体是不完全相同的,这些相应的样本频率分布与平均数、标准差都会有差异.这就会影响到我们对总体情况的估计. 典题·热题知识点一 方差与标准差的计算例1 求下列各组数据的方差与标准差(结果保留到小数点后一位): (1)1,2,3,4,5,6,7,8,9;(2)11,12,13,14,15,16,17,18,19; (3)10,20,30,40,50,60,70,80,90. 并分析由这些结果可得出什么一般的结论?思路分析:通过三组数据的特点总结出一般规律,利用方差、标准差求解. 解:(1)99321++++= x =5,s 2=91[(1-5)2+(2-5)2+…+(9-5)2]=6.7, s=7.6=2.6. (2)x =919131211++++ =15.s 2=91[(11-15)2+(12-15)2+…+(19-15)2]=6.7, s=7.6=2.6. (3)990302010++++= x =50.s 2=91[(10-50)2+(20-50)2+…+(90-50)2]=666.7, s=7.666=25.8.巧妙变式 一组数据加上相同的数后,方差、标准差不变,都乘以相同的倍数n 后,方差变为原来的n 2倍,标准差变为原来的n 倍.即一组数据x 1,x 2,…,x n ,方差为s 2,标准差为s ,则x 1+a,x 2+a, …,x n +a 方差为s 2,标准差为s ;nx 1,nx 2,…,nx n 方差为n 2s 2,标准差为ns. 知识点二 利用方差、标准差对样本进行分析例2 对自行车运动员甲乙在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如甲 273830373531 乙33 29 38 34 2836试判断选谁参加某项重大比赛更合适.思路分析:可以从平均成绩及方差、标准差方面来考察样本数据的水平及稳定性. 解:他们的平均速度为:甲x =61(27+38+…+31)=33. 乙x =61(33+29+…+36)=33.他们的平均速度相同,再看他们的方差:s 甲2=61[(-6)2+52+(-3)2+42+22+(-2)2]=347. s 乙2=61[(-4)2+52+12+(-5)2+32]=337.则s 甲2>s 乙2,即s 甲>s 乙. 故乙的成绩比甲稳定. 所以选乙参加比赛更合适. 标准差、方差是反映数据波动程度的量,它们取值的大小,说明数据的离散程度.即样本数据对于平均数的平均波动幅度.例3 甲、乙两人数学成绩的茎叶图如图2-3-1:图2-3-1(1)求出这两名同学的数学成绩的平均数、标准差; (2)比较两名同学的成绩,谈谈你的看法.思路分析:首先由茎叶图读出数据,再利用科学计算器求出平均数、标准差,依据结果进行比较,并与茎叶图比较统计作用.解:(1)用科学计算器得甲x =87,s 甲=12.7,乙x =95,s 乙=9.7.(2)由甲x =87<乙x =95,且s 甲=12.7>s 乙=9.7,故甲的数学学习状况不如乙的数学学习状况.“从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是99;甲同学的得分情况除一个特殊得分外,也大致对称,中位数是86.因此乙同学发挥比较稳定,总体得分情况比甲同学好.误区警示 通过以上实例分析,可以看出反映样本数据的基本特征量众数、中位数、平均数、标准差是从不同的方面或角度来“看待”样本数据的,对于不同的样本它们各有优、缺点.在实际问题中平均值使用频率较高,但它受极端值的影响较明显,故容易掩盖实际情况,此时常常用标准差来进一步刻画样本数据的离散程度,以便更准确地反映样本数据的真实情况,在实际生活中,也往往利用这个道理来比较水平的高低、质量好坏等.由于平均数和标准差更容易刻画样本数据的数字特征,所以对求解样本数据的平均数、标准差的运算必须熟练,必要时可使用计算器.例4 甲、乙两工人同时加工一种圆柱零件,在他们所加工的零件中各抽取10个进行直径检测,测得数据如下(单位:mm ):甲:19.9,19.7,19.8,20.0,19.9,20.2,20.1,20.3,20.2,20.1; 乙:20.0,20.2,19.8,19.9,19.7,20.2,20.1,19.7,20.2,20.4. (1)分别计算上面两个样本的平均数和方差; (2)若零件规定直径为20.0±0.5(mm ),根据两个样本的平均数和方差,说明谁加工的零件的质量较稳定.思路分析:此题数据较大,但发现所有数据都在某个数值上下摆动,可利用s 2=nx n x x x n])[(222221'-'++'+' .推导如下:一般地,如果将一组数据x 1,x 2,…,x n 同时减去一个数a , 得到x 1′=x 1-a,x 2′=x 2-a, …,x n ′=x n -a, 所以x =n 1(x 1+x 2+…+x n )=n1(x 1′+x 2′+…+x n ′+na)=x '+a. 得公式s 2=nx n x x x n ])[(222221'-'++'+' 可使计算简便.解:因为样本数据在20.0上下波动,故取a=20.0,列表如下 .甲x =0.02+20.0=20.02(mm ),乙x =0.02+20.0=20.02(mm ),s 甲2=0.1×[0.34-10×0.022]=0.033 6(mm 2), s 乙2=0.1×[0.52-10×0.022]=0.051 6(mm 2). ∵s 甲2<s 乙2,∴甲工人加工零件的质量比较稳定.巧解提示 比较两人加工零件的质量的稳定性,这里通过平均数比较不出来,需要使用方差来比较,方差越大说明波动性较大,质量越不稳定.一般地,方差和标准差通常用来反映一组数据的波动大小,在统计中,样本的方差和标准差通常用来估计总体数据的波动大小.当数据较大且数据都在某个数值上下摆动时可考虑利用s 2=nx n x x x n ])[(222221'-'++'+' .计算方差可减少数据运算量. 问题·探究交流讨论探究 问题估计总体的数字特征过程中,我们经常用到样本均值与样本标准差,这两个有什么差别吗? 探究过程:学生甲:我认为它们两个在表达式上就不同,假设经过随机抽样得到样本为x 1、x 2, …,x n , 则样本均值nx x x x n+++=21.样本标准差s=2s =nx x x x x x n 2221)()()(-++-+- .学生乙:我看出来它们还有一些不同的地方,先来看下面的例子.(1)有两个学生A 和B,两个人两次连续考试的平均分都是60分,A 是40分和80分, B 是65分和55分.显然A 的成绩忽上忽下,而B 的成绩较稳定.(2)有两组学生(每组3人),一次数学考试成绩如下(单位:分): 甲组3人得分分别为60 80 100 乙组3人得分分别为79 80 81显然,甲组学生和乙组学生的平均分都为80,但是这两组学生分数有很大的差异,甲组学生的成绩波动较大,相对于平均分数的差异很大,即分散程度(离中趋势)较大,而乙组学生的成绩波动较小,相对于平均分数的差异较小,即分散程度较小.因此,我们仅用平均值来描述这一组分数的特征是不够的,还要考虑一组分数相对于平均值的差异的大小.在考试研究中,均值反应了考生团体成绩集中的位置,根据以上分析,显然还需有一个刻画考生团体成绩离散程度的量,显然在刚才举的例子(1)中,B A x x =,但s A =2)6080()6040(22-+-=20,s B =2)6055()6065(22-+-=5.在(2)中,甲x =乙x ,甲组学生的s 甲=38003)80100()8080()8060(222=-+-+-. 乙组学生的s 乙=323)8081()8080()8079(222=-+-+-. 探究结论:明显地发现样本平均数能反映总体的水平,而标准差对于衡量分散程度很有用.。
2.3.2 离散型随机变量的方差知识点 方差、标准差的定义及方差的性质(1)设离散型随机变量X 的分布列为X x 1 x 2 … x i … x n Pp 1p 2…p i…p n则称D (X )=□01∑ni =1 (x i -E (X ))2p i 为随机变量X 的方差,其算术平方根D (X )为随机变量X 的□02标准差. (2)随机变量的方差和标准差都反映了随机变量取值偏离于均值的□03平均程度,方差或标准差越小,则随机变量偏离于均值的□04平均程度越小. 知识点 两点分布与二项分布的方差X X 服从两点分布X ~B (n ,p ) D (X ) □01p (1-p )(其中p 为成功概率) □02np (1-p )方差的性质: D (aX +b )=a 2D (X ), D (C )=0(C 是常数).1.判一判(正确的打“√”,错误的打“×”)(1)离散型随机变量的方差越大,随机变量越稳定.( ) (2)若a 是常数,则D (a )=0.( )(3)离散型随机变量的方差反映了随机变量偏离于期望的平均程度.( ) 答案 (1)× (2)√ (3)√ 2.做一做(1)若随机变量X 服从两点分布,且成功的概率p =0.5,则E (X )和D (X )分别为________.(2)设随机变量ξ~B ⎝ ⎛⎭⎪⎫6,12,则D (ξ)=________.(3)如果X 是离散型随机变量,Y =3X +2,那么D (Y )=________D (X ). 答案 (1)0.5和0.25 (2)32 (3)9 解析 (1)因为X 服从两点分布, 所以X 的概率分布为X 0 1 P0.50.5所以E (X )=0×0.5+1×0.5=0.5, D (X )=0.52×0.5+(1-0.5)2×0.5=0.25. (2)因为随机变量ξ~B ⎝ ⎛⎭⎪⎫6,12,所以D (ξ)=6×12×⎝ ⎛⎭⎪⎫1-12=32.(3)由于X 是离散型随机变量,Y =3X +2呈线性关系,代入公式,则D (Y )=32D (X )=9D (X ).探究1 方差及标准差的计算 例1 已知随机变量X 的分布列为X 0 10 20 50 60 P1325115215115(1)求X 的方差及标准差; (2)设Y =2X -E (X ),求D (Y ).[解] (1)E (X )=0×13+10×25+20×115+50×215+60×115=16,D (X )=(0-16)2×13+(10-16)2×25+(20-16)2×115+(50-16)2×215+(60-16)2×115=384.∴D(X)=8 6.(2)∵Y=2X-E(X),∴D(Y)=D(2X-E(X))=4D(X)=4×384=1536.拓展提升求方差和标准差的关键是求分布列,只要有了分布列,就可以依据定义求数学期望,进而求出方差、标准差,同时还要注意随机变量aX+b的方差可用D(aX +b)=a2D(X)求解.[跟踪训练1]已知随机变量ξ的分布列如下表:(1)求ξ的均值、方差和标准差;(2)设η=2ξ+3,求E(η),D(η).解(1)均值E(ξ)=(-1)×12+0×13+1×16=-13;方差D(ξ)=(x1-E(ξ))2·p1+(x2-E(ξ))2·p2+(x3-E(ξ))2·p3=59;标准差D(ξ)=53.(2)E(η)=2E(ξ)+3=73;D(η)=4D(ξ)=209.探究2两点分布与二项分布的方差例2(1)篮球比赛中每次罚球命中得1分,不中得0分.已知某运动员罚球命中的概率为0.7,求他一次罚球得分的方差;(2)将一枚硬币连续抛掷5次,求正面向上的次数的方差;(3)老师要从10名同学中随机抽3名同学参加社会实践活动,其中男同学有6名,求抽到男同学人数的方差.[解](1)设一次罚球得分为X,X服从两点分布,即∴D (X )=p (1-p )=0.7×0.3=0.21.(2)设正面向上的次数为Y ,则Y ~B ⎝ ⎛⎭⎪⎫5,12,D (Y )=np (1-p )=5×12×12=1.25. (3)设抽到男同学的人数为ξ. ξ服从超几何分布,分布列为即∴E (ξ)=0×130+1×310+2×12+3×16=0.3+1+0.5=1.8,D (ξ)=(0-1.8)2×130+(1-1.8)2×310+(2-1.8)2×12+(3-1.8)2×16=0.56.拓展提升解决此类问题的第一步是判断随机变量ξ服从什么分布,第二步代入相应的公式求解.若ξ服从两点分布,则D (ξ)=p (1-p );若ξ服从二项分布,即ξ~B (n ,p ),则D (ξ)=np (1-p ).[跟踪训练2] (1)若随机变量X 的分布列如下表所示则E (X )=________,D (X )=________;(2)若随机变量X ~B (3,p ),D (X )=23,则p =________. 答案 (1)0.6 0.24 (2)13或23解析(1)∵E(X)=0×0.4+1×0.6=0.6,D(X)=0.6×(1-0.6)=0.6×0.4=0.24.(2)∵X~B(3,p),∴D(X)=3p(1-p),由3p(1-p)=23,得p=13或p=23.探究3方差的实际应用例3有甲、乙两名同学,据统计,他们在解答同一份数学试卷时,各自的分数在80分,90分,100分的概率分布大致如下表所示:试分析甲、乙两名同学谁的成绩好一些.[解]在解答同一份数学试卷时,甲、乙两人成绩的均值分别为E(X甲)=80×0.2+90×0.6+100×0.2=90,E(X乙) =80×0.4+90×0.2+100×0.4=90.方差分别为D(X甲)=(80 -90)2×0.2+(90 -90)2×0.6+(100-90)2×0.2 =40,D(X乙)=(80-90)2×0.4+(90-90)2×0.2+(100 -90)2×0.4=80.由上面数据,可知E(X甲)=E(X乙),D(X甲)<D(X乙).这表示甲、乙两人所得分数的均值相等,但两人的分数的稳定程度不同,甲同学分数较稳定,乙同学分数波动较大,所以甲同学的成绩较好.拓展提升离散型随机变量的均值反映了离散型随机变量取值的平均水平,而方差反映了离散型随机变量取值的稳定与波动、集中与离散的程度.因此,在实际决策问题中,需先计算均值,看一下谁的平均水平高,然后再计算方差,分析一下谁的水平发挥相对稳定.因此,在利用均值和方差的意义去分析解决实际问题时,两者都要分析.[跟踪训练3]甲、乙两名射手在一次射击中得分为两个相互独立的随机变量ξ与η,且ξ,η的分布列为:ξ12 3P a 0.10.6η12 3P 0.3 b 0.3(1)求a,b的值;(2)计算ξ,η的期望与方差,并依此分析甲、乙技术状况.解(1)由离散型随机变量分布列的性质得a+0.1+0.6=1,解得a=0.3;同理0.3+b+0.3=1,解得b=0.4.(2)E(ξ)=1×0.3+2×0.1+3×0.6=2.3;E(η)=1×0.3+2×0.4+3×0.3=2;D(ξ)=(1-2.3)2×0.3+(2-2.3)2×0.1+(3-2.3)2×0.6=0.81;D(η)=(1-2)2×0.3+(2-2)2×0.4+(3-2)2×0.3=0.6.由于E(ξ)>E(η),说明在一次射击中,甲的平均得分比乙高,但D(ξ)>D(η),说明甲得分的稳定性不如乙,因此甲、乙两人技术水平都不够全面,各有优势与劣势.1.随机变量的方差和标准差都反映了随机变量取值的稳定与波动、集中与离散的程度,以及随机变量取值偏离于均值的平均程度.方差D (X )或标准差越小,则随机变量X 偏离均值的平均程度越小;方差越大,表明平均偏离的程度越大,说明X 的取值越分散.2.求离散型随机变量X 的均值、方差的步骤 (1)理解X 的意义,写出X 的所有可能的取值; (2)求X 取每一个值的概率; (3)写出随机变量X 的分布列; (4)由均值、方差的定义求E (X ),D (X ).特别地,若随机变量服从两点分布或二项分布,可根据公式直接计算E (X )和D (X ).1.已知随机变量X 的分布列为X 0 1 2 P131313设Y =2X +3,则D (Y )=( ) A.83 B.53 C.23 D.13 答案 A解析 ∵E (X )=0×13+1×13+2×13=1,∴D (X )=(0-1)2×13+(1-1)2×13+(2-1)2×13=23, ∴D (Y )=D (2X +3)=4D (X )=83.2.一批产品中,次品率为14,现有放回地连续抽取4次,若抽取的次品件数记为X ,则D (X )的值为( )A.43B.83C.34D.116 答案 C解析 由题意,次品件数X 服从二项分布,即X ~B ⎝ ⎛⎭⎪⎫4,14,故D (X )=np ·(1-p )=4×14×34=34.3.已知ξ~B (n ,p ),且E (3ξ+2)=9.2,D (3ξ+2)=12.96,则二项分布的参数n ,p 的值为( )A .n =4,p =0.6B .n =6,p =0.4C .n =8,p =0.3D .n =24,p =0.1 答案 B解析 由E (3ξ+2)=3E (ξ)+2,D (3ξ+2)=9D (ξ),及ξ~B (n ,p )时,E (ξ)=np ,D (ξ)=np (1-p )可知⎩⎪⎨⎪⎧ 3np +2=9.2,9np (1-p )=12.96,所以⎩⎪⎨⎪⎧n =6,p =0.4.故选B. 4.袋中有大小相同的三个球,编号分别为1,2,3,从袋中每次取出一个球,若取到球的编号为奇数,则取球停止,用 X 表示所有被取到的球的编号之和,则X 的方差为________.答案 179解析 X 的分布列为则E (X )=1×13+3×12+5×16=83,D (X )=179.5.一出租车司机从某饭店到火车站途中有六个交通岗,假设他在各交通岗遇到红灯这一事件是相互独立的,并且概率都是13.(1)求这位司机遇到红灯数ξ的期望与方差;(2)若遇上红灯,则需等待30秒,求司机总共等待时间η的期望与方差. 解 (1)易知司机遇上红灯次数ξ服从二项分布,且 ξ~B ⎝ ⎛⎭⎪⎫6,13,∴E (ξ)=6×13=2,D (ξ)=6×13×⎝ ⎛⎭⎪⎫1-13=43.(2)由已知η=30ξ,∴E (η)=30E (ξ)=60, D (η)=900D (ξ)=1200.A 级:基础巩固练一、选择题1.已知X 的分布列为X -1 0 1 P131313则①E (X )=13,②D (X )=2327,③P (X =0)=13,其中正确的个数为( ) A .0 B .1 C .2 D .3 答案 B解析 E (X )=(-1)×13+0×13+1×13=0,故①不正确;D (X )=(-1+0)2×13+(0+0)2×13+(1+0)2×13=23,故②不正确;③P (X =0)=13显然正确.2.从装有除颜色外完全相同的3个白球和m 个黑球的布袋中随机摸取1球,有放回地摸取5次,设摸得白球的个数为X ,已知E (X )=3,则D (X )=( )A.85B.65C.45D.25 答案 B解析 由题意知X ~B ⎝ ⎛⎭⎪⎫5,3m +3,所以E (X )=5×3m +3=3,解得m =2,所以X ~B ⎝ ⎛⎭⎪⎫5,35,故D (X )=5×35×25=65.3.设随机变量ξ的分布列为P (ξ=k )=C k n ⎝ ⎛⎭⎪⎫23k ·⎝ ⎛⎭⎪⎫13n -k,k =0,1,2,…,n ,且E (ξ)=24,则D (ξ)的值为( )A .8B .12 C.29 D .16 答案 A解析 由题意可知ξ~B ⎝ ⎛⎭⎪⎫n ,23,∴23n =E (ξ)=24.∴n =36.又D (ξ)=n ×23×⎝ ⎛⎭⎪⎫1-23=29×36=8.4.掷一枚质地均匀的骰子12次,则出现向上的一面是3的次数的均值和方差分别是( )A .2和5B .2和53C .4和83 D.72和1 答案 B解析 由题意知出现向上的一面为3的次数符合二项分布,掷12次骰子相当于做12次独立重复试验,且每次试验出现向上的一面为3的概率是16,∴E (ξ)=12×16=2,D (ξ)=12×16×56=53.故选B.5.随机变量X 的分布列为若a ,b ,c 成等差数列,E (X )=13,则D (X )=( ) A.49 B.59 C.13 D.23 答案 B解析 由题可得⎩⎪⎨⎪⎧a +b +c =1,-a +c =13,2b =a +c ,解得⎩⎪⎨⎪⎧a =16,b =13,c =12,所以D (X )=169×16+19×13+49×12=59.故选B.二、填空题6.设X ~B (n ,p ),且E (X )=15,D (X )=454,则n ,p 的值分别为________和________.答案 60 14 解析由题意,可知⎩⎨⎧E (x )=np =15,D (X )=np (1-p )=454,解得⎩⎨⎧n =60,p =14.7.两封信随机投入A ,B ,C 三个空邮箱中,则A 邮箱的信件数ξ的方差D (ξ)=________.答案 49解析 ξ的所有可能取值为0,1,2,P (ξ=0)=2×29=49,P (ξ=1)=C 12×29=49,P (ξ=2)=19,所以E (ξ)=0×49+1×49+2×19=23,D (ξ)=⎝ ⎛⎭⎪⎫0-232×49+⎝ ⎛⎭⎪⎫1-232×49+⎝ ⎛⎭⎪⎫2-232×19=49. 8.设p 为非负实数,随机变量X 的分布列为则E (X )的最大值为________,D (X )的最大值为________. 答案 32 1解析 E (X )=0×⎝ ⎛⎭⎪⎫12-p +1×p +2×12=p +1.又0≤12-p ≤12,∴0≤p ≤12. ∴E (X )max =32.D (X )=(p +1)2⎝ ⎛⎭⎪⎫12-p +p 2·p +(p -1)2·12=-p 2-p +1=-⎝ ⎛⎭⎪⎫p +122+54≤1, ∴当p =0时,D (X )max =1. 三、解答题9.如图,左边为四大名著,右边为名著作者,一位小学语文教师为了激发学生阅读名著的热情,在班内进行名著和其作者的连线游戏,作为奖励,参加连线的同学每连对一个奖励一朵小红花.假定一名小学生对四大名著没有了解,只是随机地连线,试求该学生得到小红花数X 的分布列及其均值、方差.《三国演义》罗贯中《水浒传》施耐庵《西游记》吴承恩《红楼梦》曹雪芹解该小学生连线的情况有都连错,连对一个,连对二个,连对四个,故其得小红花数可能为0个,1个,2个,4个.P(X=0)=9A44=924=38,P(X=1)=C14×2A44=824=13,P(X=2)=C24×1A44=624=14,P(X=4)=1A44=124.故所以E(X)=0×38+1×13+2×14+4×124=1,D(X)=38×(0-1)2+13×(1-1)2+14×(2-1)2+124×(4-1)2=9+0+6+924=1.B级:能力提升练10.甲、乙两个野生动物保护区有相同的自然环境,且野生动物的种类和数量也大致相等.这两个保护区内每个季度发现违反保护条例的事件次数的分布列分别为:甲保护区:乙保护区:解甲保护区的违规次数ξ1的均值和方差为:E(ξ1)=0×0.3+1×0.3+2×0.2+3×0.2=1.3;D(ξ1)=(0-1.3)2×0.3+(1-1.3)2×0.3+(2-1.3)2×0.2+(3-1.3)2×0.2=1.21.乙保护区的违规次数ξ2的均值和方差为:E(ξ2)=0×0.1+1×0.5+2×0.4=1.3;D(ξ2)=(0-1.3)2×0.1+(1-1.3)2×0.5+(2-1.3)2×0.4=0.41.因为E(ξ1)=E(ξ2),D(ξ1)>D(ξ2),所以两个保护区内每季度发生的违规事件平均次数是相同的,但乙保护区内发生的违规事件次数更集中和稳定,而甲保护区内发生的违规事件次数相对分散和波动.因此乙保护区的管理水平较高.。
2.3.2方差与标准差整体设计教材分析“方差与标准差”这节课在上节课平均数的基础上,从实例“有甲、乙两种钢筋,检查它们的抗拉强度”中平均数不是反映总体质量、水平的唯一特征数,在平均值相差不大的情况下,数据的稳定程度可以作为评价对象质量高低的又一重要因素,从而说明引入方差、标准差的必要性,同时使学生养成从多个角度看问题的习惯,锻炼了学生的创造性思维.为了让学生充分体会“稳定性”的意义,教材中用数轴表示两组数据,形象地表现出数据的“聚散”程度,并用极差反映数据的稳定性.当两组数据的极差相差不大时,就不适宜用极差来表示稳定性,这时可用“方差与标准差”作为比较数据稳定性的特征数.初中已学过方差概念,现在的教学不能停留在原有的水平上,要将用方差刻画数据的稳定程度的理由讲清楚,充分揭示用方差作为比较数据稳定性水平的特征数的思维过程.通过方差的单位与原数据的单位的比较,通过实际问题的分析,让学生了解到用方差反映稳定性水平的不足之处是与原数据单位不一致,且平方后可能夸大偏差的程度等,从而引入“标准差”的概念,这一过程应让学生在形成问题和解决问题的过程中加以探索.三维目标1.通过对具体案例的分析掌握样本数据的平均数、方差与标准差的基本概念和计算方法,培养学生分析问题和解决问题的能力,激发学生探究数学问题的兴趣和动机.2.在解决统计问题的过程中,进一步体会用样本估计总体的思想,形成对数据处理过程进行初步评价的意识.3.引导学生对一些生活中实际问题的学习, 进一步培养学生的数学素养和增强学生的数学应用意识及认真、耐心、细致的学习态度和学习习惯.4.渗透数学来源于实践,反过来又作用于实践的观点.重点难点教学重点:1.通过实例理解样本数据方差与标准差的意义和作用,学会计算数据的样本方差与标准差.2.根据方差与标准差对事件进行科学的决策,形成对数据处理过程进行初步评价的意识.教学难点:1.方差与标准差的计算方法及运算的准确性.2.用样本的基本数字特征估计总体的基本数字特征,从中进一步理解统计的基本思想.课时安排1课时教学过程导入新课平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体的片面判断.某地区的统计报表显示,此地区的年平均家庭收入是10万元,给人的印象是这个地区的家庭收入普遍比较高.但是,如果这个平均数是从200户贫困家庭和20户极富有的家庭收入计算出来的,那么它就既不能代表贫困家庭的年收入,也不能代表极富有家庭的年收入.因为这个平均数掩盖了一些极端情况.而这些极端情况显然是不能被忽视的.因此,只有平均数还难以概括样本数据的实际情况.举例:有甲、乙两种钢筋,现从中各抽取一个样本(如下表)检查他们的抗拉强度(单位:kg/mm2),通过计算发现,两个样本的平均数均为125.哪种钢筋的质量较好?两种钢筋的平均数都是125,那么,它们有没有什么差异呢?推进新课作出图形,作直观比较:直观上看,还是有差异的.乙的强度比较分散,甲的强度相对集中.因此,我们还需要从另外的角度来考察这两组数据.例如,在作统计图、表时提到过的极差甲的强度极差=135-110=25,乙的强度极差=145-100=45.它在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息,显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.新知探究1.方差(variance)的概念:考察样本数据的分散程度的大小,最常用的统计量是方差,一般用s 2表示.假设样本数据是x 1,x 2,…,x n ,x 表示这组数据的平均数.结合上节课有关离差的讨论可知,离差越小,稳定性就越高. 因此,通常用如下公式计算方差:∑=-=ni i x x n s 122)(1. 因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,因此将其算术平方根∑=-=ni i x x n s 12)(1 作为样本的标准差(standard deviation ),分别简称样本方差、样本标准差.2.计算样本数据x 1,x 2,…,x n 的标准差的算法是:S1 算出样本数据的平均数x ;S2 算出每个样本数据与样本平均数的差x i -x(i=1,2,…,n);S3 算出S2中x i -x(i=1,2,…,n)的平方;S4 算出S3中n 个平方数的平均数;S5 算出S4中平均数的算术平方根,即为样本标准差.关于方差、标准差的一点说明:(1)方差、标准差是用来描述样本数据的离散程度的,它反映了各个样本数据聚集于样本平均数周围的程度.方差与标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,方差标准差越大,表明各个样本数据在样本平均数的周围越分散.(2)在实际应用中,方差与标准差常被理解为稳定性.例如在上面的比较两种钢筋的抗拉强度时,方差与标准差越小意味着该产品的质量越稳定;在描述成绩时,方差与标准差越小,说明成绩越稳定.(3)学生思考“标准差的取值范围是什么?标准差为0的样本数据有什么特点?”由标准差的定义容易得出标准差是非负的;标准差为0意味着所有的样本数据都相等的特性,且与样本平均数也相等,可以构造一个样本容量为2的样本:x 1,x 2(x 1<x 2),这样可以体会出两个样本数据分散程度与样本标准差应用示例例1 根据下列四组样本数据,说明它们的异同点.(1) 555555555;(2) 444555666;(3) 334456677;(4) 222258888.分析:从数据的数字特征出发.解:四组数据的平均数都是5.0,标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的.点评:样本的方差、标准差能说明数据的分散程度.例2 甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定.分析:巩固求方差和标准差的方法.解:甲品种的样本平均数为10,样本方差为[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02,乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24.因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.点评:1.本题若仅由x甲=x乙,易产生这两种水稻的产量一样稳定的错觉.这表明在实际问题中,仅靠期望值(即平均数)不能完全反映问题,还要研究其偏离平均值的离散程度(及方差或标准差):标准差大说明取值分散性大,标准差小说明取值分散性小或者说取值比较稳定、集中.2.要对“根据这组数据估计…”的统计意义作必要的说明:第一,统计研究是以一定的样本为依据的,对于确定的样本得到确定的统计结果;第二,统计结果具有随机性,选择不同的样本可能得到不同的统计结果.最后还可让学生思考除了品种的优劣,影响水稻产量还有哪些因素?根据一组数据得到的结果是否可靠?这些问题的提出会激发学生对统计学理论的兴趣.例3 为了保护学生的视力,教室内的日光灯在使用了一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.分析:用每一个区间内的组中值作为相应日光灯的使用寿命,再求平均使用寿命.解:各组中值分别为165.5,195.5,225.5,255.5,285.5,315.5,345.5,375.5,由此算165.5×1%+195.5×11%+225.5×18%+255.5×20%+285.5×25%+315.5×16%+345.5×7%+375.5×2%=268.4≈268(天).这些组中值的方差为1001×[1×(165.5-268.4)2+11×(195.5-268.4)2+18×(225.5-268.4)2+20×(255.5-268.4)2+ 25×(285.5-268.4)2+16×(315.5-268.4)2+7×(345.5-268.4)2+2×(375.5-268.4)2]=2 128.60(天2), 故所求的标准差约为6.2128≈46(天).答:估计这种日光灯的平均寿命约为268天,标准差约为46天.点评:此例的目的是:掌握连续性随机变量的平均值和标准差的一种估计方法,即组中值估计法.因为前一节例3已介绍了连续性随机变量的平均值的估计方法,所以处理此例时应让学生回忆前例并主动探索解决问题的方法.例4 容量是40的样本中各数据与30的差的平方和是250,样本标准差是1.5,求样本平均数.分析:根据样本平均数、样本方差、样本标准差的公式解题.解:∵(x 1-30)2+(x 2-30)2+…+(x 40-30)2=250,所以(x 12+x 22+…+x 402)-60(x 1+x 2+…+x 40)+40×302=250.即(x 12+x 22+…+x 402)-60×40x +40×900=250, ①又∵140[(x 1-x )2+(x 2-x )2+…+(x 40-x )2]=1.52=2.25,即(x 12+x 22+…+x 402)-2x(x 1+x 2+…+x 40)+40x 2=90,即(x 12+x 22+…+x 402)-80x 2+40x 2=90,②①-②得40x 2-2 400x+40×900=160, 即x 2-60x +896=0,( x -32)( x -28)=0, 所以,x =32或x =28.点评:理解样本方差的含义,抓住关键点:x 1+x 2+…+x 40=40x ,通过数形结合,结合消元x 1+x 2+…+x 40合理解决问题.例5 已知一组数据的方差是s 2,将这组数据的每个数据都加上10,求所得新数据的方差.分析:利用方差公式解题.解:设原数据:x 1,x 2,…,x n ,平均数是x ,方差是s 2,则新数据为:x 1+10,x 2+10,…,x n +10,平均数为则方差为n 1[(x 1+10-x -10)2+(x 2+10-x -10)2+…+(x n +10-x -10)2] =n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=s 2.变式训练某班有50名学生,某次数学考试的成绩经计算得到的平均分数是70分,标准差是s ,后来发现登记有误,某甲得70分却记为40分,某乙50分误记为80分,更正后重新计算得标准差为s 1,则s 与s 1之间的大小关系是( )A.s=s 1B.s<s 1C.s>s 1D.不能确定解析:由题意,平均数不变,所以只要看与平均数的离差的平方的变化情况.因为方差刻画了数据相对于平均值的平均偏离程度.s 中有:(40-70)2+(80-70)2=1 000,s 1中有:(70-70)2+(50-70)2=400所以s>s 1.答案:C点评:由本例及变式可推理归纳方差的性质:(1)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1,ax 2,…,ax n 的方差为a 2s 2;(2)若给定一组数据x 1,x 2,…,x n ,方差为s 2,则ax 1+b,ax 2+b,…,ax n +b 的方差为a 2s 2,特别地,当a=1时,则有x 1+b,x 2+b,…,x n +b 的方差为s 2,这说明将一组数据的每一个数据都减去相同的一个常数,其方差是不变的,即不影响这组数据的波动性;(3)方差刻画了数据相对于平均值的平均偏离程度.对于不同的数据集,当离散程度越大时,方差越大;(4)方差的单位是原始测量数据单位的平方,对数据中的极值较为敏感.知能训练课本本节练习解答:1.甲、乙两个班的样本平均数为160,但甲班的极差为3,乙班的极差为30,故甲班的波动较小.2.已知 s 2=3=81[(k 1-k )2+(k 2-k )2+…+(k 8-k )2], 而 883)...(28)3(2...)3(2)3(2821821⨯-+++=-+-+-k k k k k k =2k -3, s 12=18[(2k 1-6-2k+6)2+(2k 2-6-2k+6)2+…+(2k 8-6-2k+6)2]=4s 2=12.3.甲较稳定.4.甲的平均值为10,方差为0.055;乙的平均值为10,方差为0.105.点评:从练习中再次体会数据的离散程度影响对事件的客观判断,体会从平均数、离散程度的角度对事件作出科学判断的方法.课堂小结1.数据的离散程度影响对事件的客观判断,体会从平均数、离散程度的角度对事件作出科学判断的方法,方差与标准差越小,表明各个样本数据在样本平均数的周围越集中;反之,方差与标准差越大,表明各个样本数据在样本平均数的两边越分散;2.衡量离散程度的常用计算方法——方差与标准差,熟悉用计算器计算方差与标准差的方法,切实掌握相关的计算公式、方法、步骤并对有关数据进行合理解释;3.样本的有效选择对判断有重要影响,知道影响判断、决策的因素是多方面的,在对总体作出判断之前,要充分考虑各种因素,切实体会统计的思想方法;4.样本数据既具有随机性又具有规律性,在很广泛的条件下,简单随机抽样样本的数字特征如众数、中位数、平均数、方差与标准差随样本容量的增加及时稳定于总体相应的数字特征,总体的数字特征是一定的,不存在随机性.作业课本习题2.3 3、5、7.设计感想本节课一定要让学生体会平均数反映的是一组数据的平均水平,而方差和标准差则反映了一组数据的波动大小.在实际学习、工作中用得非常多,比如选择运动员参加大型比赛时,要看他以前的每次测试的平均成绩,但成绩的稳定性也非常重要;学习上也是如此,稳定了可以给最后的考试提供稳定心理.用这种与生活的息息相关性激发学生学数学的无限兴趣就是老师最大的收获.习题详解习题2.31. x =301(2×5.1+3×5.2+6×5.3+8×5.4+7×5.5+3×5.6+1×5.7)≈5.39. 该厂这个月的平均日产值约为5.39万元.2.在全部数据中找出最小值4.0和最大值7.4,两者之差为3.4,确定全距为3.5,以组距0.5将区间[4.0,7.5]分成7个组.x =1001(4.25×1+4.75×2+5.25×15+5.75×28+6.25×33+6.75×18+7.25×3)=6.03,估计试验田里麦穗的平均长度约为6.0 cm.3.(1)甲机床次品数的平均值为1.5,乙机床次品数的平均值为1.2,故乙机床次品数的平均值较小;(2)甲的方差为1.65,乙的方差为0.82,故乙机床的生产状况较为稳定.4.估计甲机床平均次品率约为(0×0.7+1×0.1+2×0.1+3×0.1)÷1 000=0.06%,乙机床平均次品率约为(0×0.5+1×0.3+2×0.2+3×0)÷1 000=0.07%,故甲机床的产品质量较好.5.(1)此样本中金属棒的平均长度约为5.99; (2)频率分布表如下:频率直方图如下:(3)6×(1-0.2%)≈5.99,6×(1+0.2%)≈6.01,故合格的金属棒有15根,合格率约为15÷40≈37.5%.6.(1)频率分布表如下:频率分布直方图如下:(2)由组中值估计的总体平均数为(57×5+65×14+73×25+81×11+89×5)×601=72.6,约73次. 实际总体平均数约为72,误差约为1.7.施了新化肥的土地的平均每块土地产量为20.52 kg ,未施新化肥的土地平均每块土地产量为17.36 kg ,且施了新化肥的土地产量的方差约为83.33,未施新化肥的土地产量的方差约为154.88,说明用了新化肥不仅平均产量高,而且产量稳定,故可认为新化肥取得了成功.。
2.3.2 离散型随机变量的方差[目标] 1.理解取有限个值的离散型随机变量的方差及标准差的概念.2.能计算简单离散型随机变量的方差,并能解决一些实际问题.3.掌握方差的性质,以及两点分布、二项分布的方差的求法.[重点] 离散型随机变量的方差和标准差的概念和计算;方差的性质以及两点分布、二项分布的方差的求法.[难点] 离散型随机变量的方差的计算与应用.知识点一 离散型随机变量的方差、标准差[填一填]1.方差及标准差的定义 设离散型随机变量X 的分布列为X x 1 x 2 … x i … x n Pp 1p 2…p i…p n(1)方差D (X )=∑i =1n(x i -E (X ))2·p i . (2)标准差为D (x ). 2.方差的性质 D (aX +b )=a 2D (X ).[答一答]1.方差与标准差有什么实际意义?提示:随机变量X 的方差和标准差都反映了随机变量X 取值的稳定与波动、集中与离散的程度.D (X )越小,稳定性越高,波动越小.显然D (X )≥0,随机变量的标准差与随机变量本身有相同的单位.2.你能类比样本数据方差的计算公式,理解离散型随机变量方差的计算公式吗? 提示:设x 1、x 2、…、x n 为样本的n 个数据,x =x 1+…+x n n ,则该样本数据的方差s 2=∑i =1n(x i -x )2·1n ,由于x 相当于离散型随机变量中的E (X ),而1n相当于每个数据出现的频率(概率)p i ,故离散型随机变量X 的方差可定义为:D (X )=∑i =1n(x i -E (X ))2·p i (i =1,2,…,n ).3.随机变量的方差与样本方差有什么关系?提示:随机变量的方差即为总体的方差,它是一个客观存在的常数,不随抽样样本的变化而变化;样本方差则是随机变量,它是随着样本的不同而变化的.对于简单随机样本,随着样本容量的增加,样本方差越来越接近于总体方差.知识点二 两个常见分布的方差[填一填]1.若X 服从两点分布,则D (X )=p (1-p ). 2.若X ~B (n ,p ),则D (X )=np (1-p ).[答一答]4.两点分布的方差同二项分布的方差存在什么关系?提示:由于两点分布是特殊的二项分布,故两点分布的方差同二项分布的方差存在特殊与一般的关系.1.对随机变量X 的方差、标准差的理解(1)随机变量X 的方差的定义与一组数据的方差的定义是相同的.(2)随机变量X 的方差和标准差都反映了随机变量X 取值的稳定性和波动、集中与离散程度.(3)D (X )越小,稳定性越高,波动越小.(4)标准差与随机变量本身有相同的单位,所以在实际问题中应用更广泛. 2.剖析方差的性质当a ,b 均为常数时,随机变量η=aξ+b 的方差D (η)=D (aξ+b )=a 2D (ξ).特别地: (1)当a =0时,D (b )=0,即常数的方差等于0.(2)当a =1时,D (ξ+b )=D (ξ),即随机变量与常数之和的方差等于这个随机变量的方差本身.(3)当b =0时,D (aξ)=a 2D (ξ),即随机变量与常数之积的方差,等于这个常数的平方与这个随机变量方差的乘积.类型一 离散型随机变量的方差及性质【例1】 已知η的分布列如下:η 0 10 20 50 60 P1325115215115(1)求η(2)设Y =2η-E (η),求D (Y ).【分析】 (1)首先求出均值E (η),然后利用D (η)的定义求方差;(2)由于E (η)是一个常数,所以D (Y )=D [2η-E (η)]=22D (η).【解】 (1)∵E (η)=0×13+10×25+20×115+50×215+60×115=16,∴D (η)=(0-16)2×13+(10-16)2×25+(20-16)2×115+(50-16)2×215+(60-16)2×115=384,∴D (η)=8 6.(2)∵Y =2η-E (η),∴D (Y )=D [2η-E (η)]=22D (η)=4×384=1 536.(1)求离散型随机变量的均值或方差的关键是列分布列,而列分布列的关键是要清楚随机试验中每一个可能出现的结果,同时还要正确求出每一个结果出现的概率.(2)利用离散型随机变量X 的方差的性质:当a ,b 为常数时,随机变量Y =aX +b ,则D (Y )=D (aX +b )=a 2D (X ),可以简化解答过程,提高解题效率.某校从6名学生会干部(其中男生4人,女生2人)中选3人参加市中学生运动会志愿者. (1)所选3人中女生人数为ξ,求ξ的分布列及方差. (2)在男生甲被选中的情况下,求女生乙也被选中的概率. 解:(1)ξ的可能取值为0,1,2. 由题意P (ξ=0)=C 34C 36=15,P (ξ=1)=C 24C 12C 36=35,P (ξ=2)=C 14C 22C 36=15,所以ξ的分布列为ξ 0 1 2 P153515E (ξ)=0×15+1×35+2×15=1,D (ξ)=(0-1)2×15+(1-1)2×35+(2-1)2×15=25.(2)设在男生甲被选中的情况下,女生乙也被选中的事件为C ,男生甲被选中的种数为C 25=10,男生甲被选中,女生乙也被选中的种数为C 14=4,所以P (C )=C 14C 25=410=25,在男生甲被选中的情况下,女生乙也被选中的概率为25.类型二 二项分布的方差【例2】 已知某运动员投篮命中率p =0.6. (1)求一次投篮命中次数ξ的数学期望与方差;(2)求重复5次投篮时,命中次数η的数学期望与方差.【分析】 解本题的关键是正确地判断出第(1)小题属于两点分布,第(2)小题属于二项分布,利用相应的公式计算可得解.【解】 (1)投篮一次命中次数ξ的分布列为:ξ 0 1 P0.40.6则E (ξ)=0×0.4+1×0.6=0.6,D (ξ)=(0-0.6)2×0.4+(1-0.6)2×0.6=0.24.(2)由题意知重复5次投篮,命中的次数η服从二项分布,即η~B (5,0.6). 由二项分布的数学期望与方差的公式得: E (η)=5×0.6=3,D (η)=5×0.6×0.4=1.2.解此类题的一般步骤如下:第一步,判断随机变量X 服从什么分布(两点分布还是二项分布).第二步,代入相应的公式,X 服从两点分布时,D (X )=p (1-p );X 服从二项分布,即X ~B (n ,p )时,D (X )=np (1-p ).甲、乙比赛时,甲每局赢的概率是p =0.51,乙每局赢的概率是p =0.49.甲乙一共进行了10次比赛,当各次比赛的结果是相互独立时,计算甲平均赢多少局,乙平均赢多少局,哪一个技术比较稳定?解:用X 表示10局中甲赢的次数,则X 服从二项分布B (10,0.51).E (X )=10×0.51=5.1,即甲平均赢5.1局.用Y 表示10局中乙赢的次数,则Y 服从二项分布B (10,0.49).E (Y )=10×0.49=4.9,于是乙平均赢4.9局.又D (X )=10×0.51×0.49=2.499,D (Y )=10×0.49×0.51=2.499.所以他们技术一样稳定.类型三 离散型随机变量方差的应用【例3】 某花店每天以每枝5元的价格从农场购进若干枝玫瑰花,然后以每枝10元的价格出售,如果当天卖不完,剩下的玫瑰花作垃圾处理.(1)若花店一天购进16枝玫瑰花,求当天的利润y (单位:元)关于当天需求量n (单位:枝,n ∈N )的函数解析式.(2)花店记录了100天玫瑰花的日需求量(单位:枝),整理得下表:日需求量n 14 15 16 17 18 19 20 频数10201616151310以100①若花店一天购进16枝玫瑰花,X 表示当天的利润(单位:元),求X 的分布列,数学期望及方差.②若花店计划一天购进16枝或17枝玫瑰花,你认为应购进16枝还是17枝?请说明理由.【解】 (1)当n ≥16时,y =16×(10-5)=80. 当n ≤15时,y =5n -5(16-n )=10n -80.得:y =⎩⎨⎧10n -80(n ≤15),80(n ≥16)(n ∈N ).(2)①X可取60,70,80.P(X=60)=0.1,P(X=70)=0.2,P(X=80)=0.7.X的分布列为X 607080P 0.10.20.7E(X)=60×0.1+70×0.2+80×0.7=76,D(X)=162×0.1+62×0.2+42×0.7=44.②购进17枝时,当天的利润的期望值为y=(14×5-3×5)×0.1+(15×5-2×5)×0.2+(16×5-1×5)×0.16+17×5×0.54=76.4.由76.4>76得,应购进17枝.有甲、乙两名同学,据统计,他们在解答同一份数学试卷时,各自的分数在80分,90分,100分的概率分布大致如下表所示:试分析甲、乙两名同学谁的成绩好一些.解:在解答同一份数学试卷时,甲、乙两人成绩的均值分别为E(X甲)=80×0.2+90×0.6+100×0.2=90,E(X乙)=80×0.4+90×0.2+100×0.4=90.方差分别为D (X 甲)=(80-90)2×0.2+(90-90)2×0.6+(100-90)2×0.2=40, D (X 乙)=(80-90)2×0.4+(90-90)2×0.2+(100-90)2×0.4=80. 由上面数据,可知E (X 甲)=E (X 乙),D (X 甲)<D (X 乙).这表示甲、乙两人所得分数的均值相等,但两人的分数的稳定程度不同,甲同学分数较稳定,乙同学分数波动较大,所以甲同学的成绩较好.离散型随机变量期望与方差的综合应用【例4】 设袋子中装有a 个红球,b 个黄球,c 个蓝球,且规定:取出一个红球得1分,取出一个黄球得2分,取出一个蓝球得3分.(1)当a =3,b =2,c =1时,从该袋子中任取(有放回,且每球取到的机会均等)2个球,记随机变量ξ为取出此2球所得分数之和,求ξ的分布列;(2)从该袋子中任取(每球取到的机会均等)1个球,记随机变量η为取出此球所得分数.若E (η)=53,D (η)=59,求abc .【思路分析】 第一问关键是分清取出2个球所得分数之和的所有情况,然后分类讨论,根据情况算出相应的概率、写出分布列;第二问类似地写出分布列,根据期望、方差的公式建立方程求解.【解】 (1)由题意得ξ=2,3,4,5,6. 故P (ξ=2)=3×36×6=14,P (ξ=3)=2×3×26×6=13,P (ξ=4)=2×3×1+2×26×6=518,P (ξ=5)=2×2×16×6=19,P (ξ=6)=1×16×6=136.所以ξ的分布列为ξ 2 3 4 5 6 P141351819136(2)由题意知η的分布列为η 1 2 3 paa +b +cba +b +cca +b +c所以E (η)=a a +b +c +2b a +b +c +3c a +b +c =53,D (η)=(1-53)2·a a +b +c +(2-53)2·b a +b +c +(3-53)2·c a +b +c =59.化简得⎩⎪⎨⎪⎧2a -b -4c =0,a +4b -11c =0,解得a =3c ,b =2c ,故abc =321.【解后反思】 离散型随机变量的分布列和期望是理科数学考题中的高频考点之一,其中,浙江省又多以摸球为背景,以对立事件、相互独立事件、两点分布、二项分布等知识为载体,综合考查事件发生的概率及随机变量的分布列、数学期望与方差.解题时首先要理解关键词,其次要准确无误地找出随机变量的所有可能取值,计算出相应的概率,后面一般就是计算问题.若随机事件A 在1次试验中发生的概率为p (0<p <1),用随机变量ξ表示A 在1次试验中发生的次数.(1)求方差D (ξ)的最大值; (2)求2D (ξ)-1E (ξ)的最大值.解:随机变量ξ的所有可能取值为0,1,并且有P (ξ=1)=p ,P (ξ=0)=1-p ,从而E (ξ)=0×(1-p )+1×p =p , D (ξ)=(0-p )2×(1-p )+(1-p )2×p =p -p 2.(1)D (ξ)=p -p 2=-(p 2-p +14)+14=-(p -12)2+14,∵0<p <1,∴当p =12时,D (ξ)取得最大值,最大值为14.(2)2D (ξ)-1E (ξ)=2(p -p 2)-1p =2-(2p +1p ),∵0<p <1,∴2p +1p≥2 2.当2p =1p ,p =22时,取“=”,因此,当p =22时,2D (ξ)-1E (ξ)取得最大值2-2 2.1.下面说法中正确的是(D)A.离散型随机变量ξ的期望E(ξ)反映了ξ取值的概率的平均值B.离散型随机变量ξ的方差D(ξ)反映了ξ取值的平均水平C.离散型随机变量ξ的期望E(ξ)反映了ξ取值的波动水平D.离散型随机变量ξ的方差D(ξ)反映了ξ取值的波动水平解析:由于离散型随机变量ξ的期望E(ξ)反映的是随机变量的平均取值水平,而不是概率的平均值,故A错.而D(ξ)则反映随机变量的集中(或稳定)的程度,即波动水平.2.若X~B(n,p),且E(X)=1.6,D(X)=1.28,则(A)A.n=8,p=0.2 B.n=4,p=0.4C.n=5,p=0.32 D.n=7,p=0.45解析:由E(X)=np=1.6,D(X)=np(1-p)=1.28,可知1-p=0.8,所以p=0.2,n=8.3.已知随机变量ξ,D(ξ)=19,则ξ的标准差为13.解析:D(ξ)=19=13.4.有两台自动包装机甲与乙,包装质量分别为随机变量ξ1,ξ2,已知E(ξ1)=E(ξ2),D(ξ1)>D(ξ2),则自动包装机乙的质量较好.解析:均值仅体现了随机变量取值的平均大小,如果两个随机变量的均值相等,还要看随机变量的取值如何在均值周围变化,方差大说明随机变量取值较分散;方差小,说明取值较集中.故乙的质量较好.5.已知随机变量X的分布列是X 0123 4P 0.2m n 0.20.1且E(X)=1.8.(1)求D(X);(2)设Y=2X-1,求D(Y).解:(1)由分布列可知0.2+m+n+0.2+0.1=1,且E(X)=0×0.2+1×m+2×n+3×0.2+4×0.1=1.8.即⎩⎪⎨⎪⎧ m +n =0.5,m +2n =0.8,解得m =0.2,n =0.3. ∴D (X )=(0-1.8)2×0.2+(1-1.8)2×0.2+(2-1.8)2×0.3+(3-1.8)2×0.2+(4-1.8)2×0.1=1.56.(2)∵D (X )=1.56,∴D (2X -1)=4D (X )=6.24.。
2.3.2方差与标准差教学目标一、知识与技能:通过实例是学生理解样本数据的方差、标准差的意义和作用;学会计算数据的方差、标准差;使学生掌握通过合理抽样对总体的稳定性水平作出科学估计的思想.二、过程与方法:通过具体例子来说明意义及内涵,并加以计算把握三、情感态度与价值观:体会反应离散程度的量的思想方法教学重点用样本数据的方差和标准差估计总体的方差与标准差.教学难点理解样本数据的方差、标准差的意义和作用,形成对数据处理过程进行初步评价的意识.教学过程一、问题情境1.情境:甲、乙、丙三人入选国家射击运动员,各射击三次,发挥程度如下:人员第一次第二次第三次甲9.2 8 9.8乙9.2 9.4 9.8丙9 9.6 9.6假如你是挑选人,你挑哪一位?为什么?二、学生活动:看平均成绩,但三个平均成绩都是9.4,这样需要看三人发挥的稳定程度1、看极差:甲0.8,乙0.4,丙0.6 乙入选2、看与平均数的差别:甲:02+0.42+0.42=0.32;乙:0.22+02+0.22=0.08;丙:0.42+0.22+0.22=0.24;乙入选三、建构数学1.方差:一般地,设一组样本数据1x ,2x ,…,n x ,其平均数为-x ,则称2211()ni is x x n ==-∑为这个样本的方差. 因为方差与原始数据的单位不同,且平方后可能夸大了离差的程度,我们将方差的算术平方根称为这组数据的标准差.2.标准差:21)(1-=-=∑x x n s ni i 标准差也可以刻画数据的稳定程度. 3.方差和标准差的意义: 描述一个样本和总体的波动大小的特征数,标准差大说明波动大. 四、数学运用1.例题:例1.甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm 2),试根据这组数据估计哪一种水稻品种的产量比较稳定。
品种 第1年 第2年 第3年 第4年 第5年 甲 9.8 9.9 10.1 10 10.2 乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为[(9.8-10)2 +(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]÷5=0.02.乙品种的样本平均数也为10,样本方差为[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]÷5=0.24 因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定。