总体期望值与方差的估计(第二课时)讲解
- 格式:pdf
- 大小:4.21 MB
- 文档页数:23
12.2 总体期望值和方差的估计●知识梳理1.平均数的计算方法(1)如果有n 个数据x 1,x 2,…,x n ,那么x =n1(x 1+x 2+…+x n )叫做这n 个数据的平均数,x 读作“x 拔”.(2)当一组数据x 1,x 2,…,x n 的各个数值较大时,可将各数据同时减去一个适当的常数a ,得到x 1′=x 1-a ,x 2′=x 2-a ,…,x n ′=x n -a ,那么,x =x ' +a .(3)加权平均数:如果在n 个数据中,x 1出现f 1次,x 2出现f 2次,…,x k 出现f k 次(f 1+f 2+…+f k =n ),那么x =nf x f x f x kk +++ 2211.2.方差的计算方法 (1)对于一组数据x 1,x 2,…,x n ,s 2=n1[(x 1-x )2+(x 2-x )2+…+(x n -x )2]叫做这组数据的方差,而s 叫做标准差.(2)公式s 2=n1[(x 12+x 22+…+x n 2)-n x 2]. (3)当一组数据x 1,x 2,…,x n 中的各数较大时,可以将各数据减去一个适当的常数a ,得到x 1′=x 1-a ,x 2′=x 2-a ,…,x n ′=x n -a .则s 2=n1[(x 1′2+x 2′2+…+x n ′2)-n 2x ']. 3.总体平均值和方差的估计人类的长期实践和理论研究都充分证明了用样本的平均数估计总体平均值,用样本方差估计总体方差是可行的,而且样本容量越大,估计就越准确.●点击双基1.描述总体离散型程度或稳定性的特征数是总体方差,以下统计量估计总体稳定性的是A.样本均值xB.样本方差C.样本最大值D.样本最小值 解析:统计学的基本思想是用样本来估计总体.因此选B. 答案:B2.甲、乙两人在相同的条件下,射击10次,命中环数如下: 甲:8,6,9,5,10,7,4,8,9,5; 乙:7,6,5,8,6,9,6,8,7,7.根据以上数据估计两人的技术稳定性,结论是 A.甲优于乙 B.乙优于甲 C.两人没区别 D.两人区别不大 解析:x 甲=101(8+6+…+5)=7.1,x 乙=101(7+6+…+7)=6.9. s 甲2=101[(8-7.1)2+…+(5-7.1)2]=3.69, s 乙2=101[(7-6.9)2+…+(7-6.9)2]=1.29. ∴乙优于甲. 答案:B3.样本a 1,a 2,a 3,…,a 10的平均数为a ,样本b 1,b 2,b 3,…,b 10的平均数为b ,那么样本a 1,b 1,a 2,b 2,…,a 10,b 10的平均数为A.a +b B.21(a +b ) C.2(a +b )D.101(a +b ) 解析:样本a 1,a 2,a 3,…,a 10中a i 的概率为P i ,样本b 1,b 2,b 3,…,b 10中b i 的概率为P i ′,样本a 1,b 1,a 2,b 2,a 3,b 3,…,a 10,b 10中a i 的概率为q i ,b i 的概率为q i ′,则P i =2q i ,故样本a 1,b 1,a 2,b 2,a 3,b 3,…,a 10,b 10的平均数为a 1q 1+b 1q 1′+a 2q 2+b 2q 2′+…+a 10q 10+b 10q 10′=21(a 1P 1+…+a 10P 10)+21(b 1P 1′+21b 2P 2′+…+21b 10P 10′)=21(a +b ).答案:B4.电池厂从某日生产的电池中抽取10个进行寿命测试,得到数据如下(单位:h ):30,35,25,25,30,34,26,25,29,21.则该电池的平均寿命估计为___________,方差估计为___________.解析:x =101(30+35+25+25+30+34+26+25+29+21)=101(0+5-5-5+0+4-4-5-1-9)+30 =28, s 2=101[(30-28)2+(35-28)2+(25-28)2+(25-28)2+(30-28)2+(34-28)2+(26-28)2+(25-28)2+(29-28)2+(21-28)2]=101(4+49+9+9+4+36+4+9+1+49) =17.4.答案:28 17.4 ●典例剖析 【例1】 x 是x 1,x 2,…,x 100的平均数,a 是x 1,x 2,…,x 40的平均数,b 是x 41,x 42,…,x 100的平均数,则下列各式正确的是A.x =1006040ba +B.x =1004060ba +C.x =a +bD.x =2ba + 剖析:这100个数的平均数是a +b 还是21(a +b ),这都很容易让人误解.我们可以从概率及加权平均数的角度来思考.设P i 是x 1,x 2,…,x 100中x i 被抽到的概率,q i 是x 1,x 2,…,x 40中x i 被抽到的概率,r i 是x 41,x 42,…,x 100中x i 被抽到的概率,则P i =10040q i ,P i =10060r i .故x 1,x 2,…,x 100的平均数x =10040(x 1q 1+x 2q 2+…+x 40q 40)+10060(x 41r 41+…+x 100r 100)=10040a +10060b .答案:A评述:除上述解法外,你还有其他解法吗? 特别提示除了上述方法外,我们还可以先分别求出x 1+x 2+…+x 40=40a ,x 41+x 42+…+x 100=60b ,再求x .【例2】 甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环)如果甲、乙两人只有1人入选,则入选的应是___________.剖析:判断谁入选,首先应考虑选手的成绩是否稳定.因此分别求其方差. 甲的平均数为x 1=51(10+8+9+9+9)=9, 乙的平均数为x 2=51(10+10+7+9+9)=9, 甲的方差为s 甲=(10-9)2×51+(8-9)2×51=52, 乙的方差为s 乙=(10-9)2×51×2+(7-9)2×51=56. s 乙>s 甲,说明乙的波动性大,故甲入选. 答案:甲评述:方差的大小可看出成绩的稳定性,平均数的大小可看出成绩的高低.【例3】 某班40人随机分为两组,第一组18人,第二组22人,两组学生在某次数学检测中的成绩如下表:求全班的平均成绩和标准差. 剖析:代入方差公式s 2=n1[(x 12+x 22+…+x n 2)-n x 2]即可求得. 解:设全班的平均成绩为x ,全班成绩的方差为s 2, 则s 12=181[(x 12+x 22+…+x 182)-18×902]=36, s 22=221[(x 192+x 202+…+x 402)-22×802]=16. ∴x =401(90×18+80×22)=2169=84.5, s 2=401[(x 12+x 22+…+x 182)+(x 192+x 202+…+x 402)-40·x 2] =401[18×(36+8100)+22×(16+6400)-40×41692]=401(146448+141152-10×1692) =401×1990=49.75. ∴s =2199≈7.05.评述:平均成绩应为总成绩除以总人数,而总成绩可由每组成绩之和求得. 【例4】 已知c 为常数,s 2=n 1[(x 1-x )2+(x 2-x )2+…+(x n -x )2],s c 2=n1[(x 1-c )2+(x 2-c )2+…+(x n -c )2].证明:s 2≤s c 2,当且仅当c =x 时,取“=”.剖析:证明s c 2≥s 2,可证明s c 2-s 2≥0.因此应用方差公式进行变形即可. 证明:∵s 2=n1[(x 1-x )2+…+(x n -x )2] =n1[(x 12+x 22+…+x n 2)-n x 2], s c 2=n1[(x 1-c )2+(x 2-c )2+…+(x n -c )2] =n1[(x 12+x 22+…+x n 2)-2c (x 1+x 2+…+x n )+nc 2], ∴s c 2-s 2=x 2-nc2(x 1+x 2+…+x n )+c 2 =x 2-2c ·x +c 2=(x -c )2≥0. ∴s c 2≥s 2,当且仅当x =c 时取“=”.评述:作差是比较大小的常用手段. ●闯关训练 夯实基础1.一组数据的方差为s 2,将这组数据中的每一个数都乘以2,所得到的一组新数据的方差是A.21s 2B.2s 2C.4s 2D.s 2解析:由方差公式易求得新数据的方差为4s 2. 答案:C2.某班有48名学生,在一次考试中统计出平均分为70分,方差为75,后来发现有2名同学的成绩有误,甲实得80分却记为50分,乙实得70分却记为100分,更正后平均分和方差分别是A.70,25 B.70,50 C.70,1.04 D.65,25解析:易得x 没有改变,x =70, 而s 2=481[(x 12+x 22+…+502+1002+…+x 482)-48x 2]=75,s ′2=481[(x 12+x 22+…+802+702+…+x 482)-48x 2] =481[(75×48+48x 2-12500+11300)-48x 2] =75-481200=75-25=50. 答案:B2其中产品比较稳定的小麦品种是_______. 解析:x 甲=51(9.8+9.9+10.1+10+10.2)=10, x 乙=51(9.4+10.3+10.8+9.7+9.8)=10, s 甲2=51[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]=0.02,s 乙2=51[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]=0.244.所以,甲比乙稳定. 答案:甲4.为了科学地比较考试的成绩,有些选拔性考试常常会将考试分数转化为标准分,转化关系式为Z =sxx -(其中x 是某位学生的考试分数,x 是该次考试的平均分,s 是该次考试的标准差,Z 称为这位学生的标准分).转化成标准分后可能出现小数和负值,因此,又常常再将Z 分数作线性变换转化成其他分数.例如某次学生选拔考试采用的是T 分数,线性变换公式是T =40Z +60.已知在这次考试中某位考生的考试分数是85分,这次考试的平均分是70分,标准差是25,则该考生的T 分数为___________.解析:由已知Z =257085-=53,∴T =40×53+60=24+60=84.故考生成绩的T 分数为84. 答案:84解:甲、乙两厂上缴利税的季平均值分别为x 甲=41(70+50+80+40)=60, x 乙=41(55+65+55+65)=60; 甲、乙两厂上缴利税的方差为 s 甲2=41[(70-60)2+(50-60)2+(80-60)2+(40-60)2]=250,s 乙2=41[(55-60)2+(65-60)2+(55-60)2+(65-60)2]=25. 经上述结果分析,两厂上缴利税的季平均值相同,但甲厂比乙厂波动大,导致它们生产出现的差异大,乙厂不同季节的缴税量比较接近平均值,生产稳定,而甲厂不稳定.培养能力6.某校从甲、乙两名优秀选手中选拔1名参加全市中学生百米比赛,该校预先对这两名选手测试了8次,成绩如下表:根据成绩,请你作出判断,派哪位选手参加更好,为什么? 解:x 甲=12.4=x 乙,s 甲2=0.12,s 乙2≈0.10,∴甲、乙两人的平均成绩相等,但乙的成绩较稳定,应派乙选手参加比赛.7.某农场为了从三种不同的西红柿品种中选取高产稳定的西红柿品种,分别在五块试验田上试种,每块试验田均为0.5公顷,产量情况如下:解:x 1=51(21.5+20.4+…+19.9)=21, x 2=51(21.3+18.9+…+19.8)=21, x 3=51(17.8+23.3+…+20.9)=20.5, s 1=0.756,s 2=1.104, s 3=1.901.由x 1=x 2>x 3,而s 1<s 2<s 3,说明第1种西红柿品种既高产又稳定.8.甲、乙两台机床在相同的条件下同时生产一种零件,现在从中各抽测10个,它们的尺寸分别为(单位:mm ):甲:10.2 10.1 10.9 8.9 9.9 10.3 9.7 10 9.9 10.1乙:10.3 10.4 9.6 9.9 10.1 10 9.8 9.7 10.2 10分别计算上面两个样本的平均数与方差,如果图纸上的设计尺寸为10 mm ,从计算结果看,用哪台机床加工这种零件较合适?解:x 甲=101(10.2+10.1+…+10.1)=10, x 乙=101(10.3+10.4+…+10)=10, s 甲2=101[(10.2-10)2+(10.1-10)2+…+(10.1-10)2]=0.03,s 乙2=101[(10.3-10)2+(10.4-10)2+…+(10-10)2]=0.06. 由上述结果分析,甲台机床加工这种零件稳定,较合适. 探究创新9.有一个容量为100的样本,数据的分组及各组的频数如下: [12.5,15.5),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图; (3)估计数据小于30.5的概率.(2)频率分布直方图如下图.率距12.5 18.5 24.5 30.5 数据(3)数据大于等于30.5的频率是0.08,∴小于30.5的频率是0.92.∴数据小于30.5的概率约为0.92.探究:解决总体分布估计问题的一般程序如下:(1)先确定分组的组数(最大数据与最小数据之差除组距得组数);(2)分别计算各组的频数及频率(频率=总数频数);(3)画出频率分布直方图,并作出相应的估计.注意直方图与条形图的区别. ●思悟小结1.用样本估计总体,除在整体上用样本的频率分布估计总体分布外,还可以用平均值和方差对总体进行估计,即用样本平均数x 去估计总体平均数μ;用样本方差s 2去估计总体的方差σ2,进一步对总体的分布作出判断.2.进行几次实验,得到样本数据x 1,x 2,…,x n ,设c 是任意常数,k 为任意的正数,作变换y i =k1(x i -c )(i =1,2,…,n ),则有:①x =k y +c ;②s x 2=k 2s y 2.●教师下载中心 教学点睛1.期望反映数据取值的平均水平,期望越大,平均水平越高.2.方差反映数据的波动大小,方差越小,表示数据越稳定. 拓展题例【例1】 如果数据a 1,a 2,…,a 6的方差是6,那么另一组数据a 1-3,a 2-3,…,a 6-3的方差是多少?解:设a 1,a 2,…,a 6的平均数为a ,则(a 1-3),(a 2-3),…,(a 6-3)的平均数为a -3,∴方差为s 2=61{[(a 1-3)-(a -3)]2+…+[(a 6-3)-(a -3)]2}=6.【例2】 已知样本方差由s 2=101∑=101i (x i -5)2求得,求∑∑=101i x i.解:依s 2=n1[(x 1-x )2+…+(x n -x )2] =n1[x 12+x 22+…+x n 2-n x 2]知, ∴101∑=101i x i=5.∴∑=101i x i=50.。