第五章 数理统计的基本概念n
- 格式:ppt
- 大小:4.11 MB
- 文档页数:79
第五章数理统计的基础知识5.1 数理统计的基本概念习题1已知总体X服从[0,λ]上的均匀分布(λ未知),X1,X2,⋯,Xn为X的样本,则().(A)1n∑i=1nXi-λ2是一个统计量;(B)1n∑i=1nXi-E(X)是一个统计量;(C)X1+X2是一个统计量;(D)1n∑i=1nXi2-D(X)是一个统计量.解答:应选(C).由统计量的定义:样本的任一不含总体分布未知参数的函数称为该样本的统计量.(A)(B)(D)中均含未知参数.习题2观察一个连续型随机变量,抽到100株“豫农一号”玉米的穗位(单位:cm),得到如下表中所列的数据. 按区间[70,80),[80,90),⋯,[150,160),将100个数据分成9个组,列出分组数据计表(包括频率和累积频率),并画出频率累积的直方图.解答:分组数据统计表解答:由X∼B(10,3100),得E(X)=10×3100=310,D(X)=10×3100×97100=2911000,所以E(X¯)=E(X)=310,E(S2)=n-1nD(X)=291(n-1)1000n.习题6设某商店100天销售电视机的情况有如下统计资料f(2)(x)=2F(x)f(x)={2λe-λx(1-e-λx),x>00,其它,又X(1)的概率密度为f(1)(x)=2[1-F(x)]f(x)={2λe-2λx,x>00,其它.习题9设电子元件的寿命时间X(单位:h)服从参数λ=0.0015的指数分布,今独立测试n=6元件,记录它们的失效时间,求:(1)没有元件在800h之前失效的概率;(2)没有元件最后超过3000h的概率.解答:(1)总体X的概率密度f(x)={(0.0015)e-0.0015x,x>00,其它,分布函数F(x)={1-e-0.0015x,x>00,其它,{没有元件在800h前失效}={最小顺序统计量X(1)>800},有P{X(1)>800}=[P{X>800}]6=[1-F(800)]6=exp(-0.0015×800×6)=exp(-7.2)≈0.000747.(2){没有元件最后超过3000h}={最大顺序统计量X(6)<3000}P{X(6)<3000}=[P{X<3000}]6=[F(3000)]6=[1-exp{-0.0015×3000}]6=[1-exp{-4.5}]6≈0.93517.习题10设总体X任意,期望为μ,方差为σ2,若至少要以95%的概率保证∣X¯-μ∣<0.1σ,问样本容量n应取多大?解答:因当n很大时,X¯-N(μ,σ2n),于是P{∣X¯-μ∣<0.1σ}=P{μ-0.1σ<X¯<μ+0.1σ}≈Φ(0.1σσ/n)-Φ(-0.1σσ/n)=2Φ(0.1n)-1≥0.95,则Φ(0.1n)≥0.975,查表得Φ(1.96)=0.975,因Φ(x)非减,故0.1n≥1.96,n≥384.16,故样本容量至少取385才能满足要求.5.2 常用统计分布习题1对于给定的正数a(0<a<1),设za,χa2(n),ta(n),Fa(n1,n2)分别是标准正态分布,χ2(n),t(n),F(n1,n2)分布的上a分位点,则下面的结论中不正确的是().(A)z1-a(n)=-za(n);(B)χ1-a2(n)=-χa2(n);(C)t1-a(n)=-ta(n);(D)F1-a(n1,n2)=1Fa(n2,n1).解答:应选(B).因为标准正态分布和t分布的密度函数图形都有是关于y轴对称的,而χ2分布的密度大于等于零,所以(A)和(C)是对的.(B)是错的. 对于F分布,若F∼F(n1,n2),则1-a=P{F>F1-a(n1,n2)}=P{1F<1F1-a(n1,n2)=1-P{1F>1F1-a(n1,n2)由于1F∼F(n2,n1),所以P{1F>1F1-a(n1,n2)=P{1F>Fa(n2,n1)=a,即F1-a(n1,n2)=1Fa(n2,n1). 故(D)也是对的.习题2(1)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (1)X1-X2X32+X42;解答:因为Xi∼N(0,1),i=1,2,⋯,n,所以:X1-X2∼N(0,2),X1-X22∼N(0,1),X32+X42∼χ2(2),故X1-X2X32+X42=(X1-X2)/2X32+X422∼t(2).习题2(2)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (2)n-1X1X22+X32+⋯+Xn2;解答:因为Xi∼N(0,1),∑i=2nXi2∼χ2(n-1),所以n-1X1X22+X32+⋯+Xn2=X1∑i=2nXi2/(n-1)∼t(n-1).习题2(3)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布?(3)(n3-1)∑i=13Xi2/∑i=4nXi2.解答:因为∑i=13Xi2∼χ2(3),∑i=4nXi2∼χ2(n-3),所以:(n3-1)∑i=13Xi2/∑i=4nXi2=∑i=13Xi2/3∑i=4nXi2/(n-3)∼F(3,n-3).习题3设X1,X2,X3,X4是取自正态总体X∼N(0,22)的简单随机样本,且Y=a(X1-2X2)2+b(3X3-4X4)2,则a=?,b=?时,统计量Y服从χ2分布,其自由度是多少?解答:解法一Y=[a(X1-2X2)]2+[b(3X3-4X4)]2,令Y1=a(X1-2X2),Y2=b(3X3-4X4),则Y=Y12+Y22,为使Y∼χ2(2),必有Y1∼N(0,1),Y2∼N(0,1),因而E(Y1)=0,D(Y1)=1,E(Y2)=0,D(Y2)=1,注意到D(X1)=D(X2)=D(X3)=D(X4)=4,由D(Y1)=D[a(X1-2X2)]=aD(X1-X2)=a(D(X1)+22D(X2))=a(4+4×4)=20a=1,D(Y2)=D[b(3X3-4X4)]=bD(3X3-4X4)=b(9D(X3)+16D(X4))=b(4×9+16×4)=100b=1,分别得a=120,b=1100.这时Y∼χ2(2),自由度为n=2.解法二因Xi∼N(0,22)且相互独立,知X1-2X2=X1+(-2)X2∼N(0,20),3X3-4X4=3X3+(-4)X4∼N(0,100),故X1-2X220∼N(0,1),3X3-4X4100∼N(0,1),为使Y=(X1-2X21/a)2+(3X3-4X41/b)2∼χ2(2),必有X1-2X21/a∼N(0,1),3X3-4X41/b∼N(0,1),与上面两个服从标准正态分布的随机变量比较即是1a=20,1b=100,即a=120,b=1100.习题4设随机变量X和Y相互独立且都服从正态分布N(0,32).X1,X2,⋯,X9和Y1,Y2,⋯,Y9是分别取自总体X和Y的简单随机样本,试证统计量T=X1+X2+⋯+X9Y12+Y22+⋯+Y92服从自由度为9的t分布.解答:首先将Xi,Yi分别除以3,使之化为标准正态.令X′i=Xi3,Y′i=Yi3,i=1,2,⋯,9,则X′i∼N(0,1),Y′i∼N(0,1);再令X′=X′1+X′2+⋯+X′9,则X′∼N(0,9),X′3∼N(0,1),Y′2=Y′12+Y′22+⋯+Y′92,Y′2∼χ2(9).因此T=X1+X2+⋯+X9Y12+Y22+⋯+Y92=X1′+X2′+⋯+X9′Y′12+Y′22+⋯+Y′92=X′Y′2=X′/3Y′2/9∼t(9),注意到X′,Y′2相互独立.习题5设总体X∼N(0,4),而X1,X2,⋯,X15为取自该总体的样本,问随机变量Y=X12+X22+⋯+X1022(X112+X122+⋯+X152)服从什么分布?参数为多少?解答:因为Xi2∼N(0,1),故Xi24∼χ2(1),i=1,2,⋯,15,而X1,X2,⋯,X15独立,故X12+X22+⋯+X1024∼χ2(10),X112+X122+⋯+X1524∼χ2(5),所以X12+X22+⋯+X1024/10X112+X122+⋯+X1524/5=X12+X22+⋯+X1022(X112+X122+⋯+X152)=Y习题6证明:若随机变量X服从F(n1,n2)的分布,则(1)Y=1X服从F(n2,n1)分布;(2)并由此证明F1-α(n1,n2)=1Fα(n2,n1).解答:(1)因随机变量X服从F(n1,n2),故可设X=U/n1V/n2,其中U服从χ2(n1),V服从χ2(n2),且U与V相互独立,设1X=V/n2U/n1,由F分布之定义知Y=1x=V/n2U/n1,服从F(n2,n1).(2)由上侧α分位数和定义知P{X≥F1-α(n1,n2)}=1-α,P{1X≤1F1-α(n1,n2)=1-α,即P{Y≤1F1-α(n1,n2)=1-α,1-P{Y>1F1-α(n1,n2)=1-α,故P{Y>1F1-α(n1,n2)=α,而P{Y≥Fα(n2,n1)}=α.又Y为连续型随机变量,故P{Y≥1F1-α(n1,n2)=α,从而Fα(n2,n1)=1F1-α(n1,n2),即F1-α(n1,n2)=1Fα(n2,n1).习题7查表求标准正态分布的上侧分位数:u0.4,u0.2,u0.1与u0.05.解答:u0.4=0.253,u0.2=0.8416,u0.1=1.28,u0.05=1.65.习题8查表求χ2分布的上侧分位数:χ0.952(5),χ0.052(5),χ0.992(10)与χ0.012(10).解答:1.145,11.071,2.558,23.209.习题9查表求F分布的上侧分位数:F0.95(4,6),F0.975(3,7)与F0.99(5,5).解答:0.1623,0.0684,0.0912.习题10查表求t分布的下侧分位数:t0.05(3),t0.01(5),t0.10(7)与t0.005(10).解答:2.353,3.365,1.415,3.169.(2)P{X¯>4.5}=P{Z>4.5-42/9=1-P{Z≤2.25}≈1-Φ(2.25)=1-0.9878=0.0122.习题2设总体X服从正态分布N(10,32),X1,X2,⋯,X6是它的一组样本,设X¯=16∑i=16Xi.(1)写出X¯所服从的分布;(2)求X¯>11的概率.解答:(1)X¯∼N(10,326),即X¯∼N(10,32).(2)P{X¯>11}=1-P{X¯≤11}=1-Φ(11-1032)≈1-Φ(0,8165)≈1-Φ(0.82)=0.2061.习题3设X1,X2,⋯,Xn是总体X的样本,X¯=1n∑i=1nXi,分别按总体服从下列指定分布求E(X¯),D(X¯).(1)X服从0-1分布b(1,p);(2)*X服从二项分布b(m,p);(3)X服从泊松分布P(λ);(4)X服从均匀分布U[a,b];(5)X服从指数分布e(λ).解答:(1)由题意,X的分布律为:P{X=k}=Pk(1-P)1-k(k=0,1).E(X)=p,D(X)=p(1-p).所以E(X¯)=E(1n∑i=1nXi)=1n∑i=1nE(Xi)=1n⋅np=p,D(X¯)=D(1n∑i=1nXi)=1n2∑i=1nD(X1)=1n2⋅np(1-p)=1np(1-p). (2)由题意,X的分布律为:P{X=k}=CmkPk(1-p)m-k(k=0,1,2,⋯,m).同(1)可得E(X¯)=mp,D(X¯)=1nmp(1-p).(3)由题意,X的分布律为:P{X=k}=λkk!e-λ(λ>0,k=0,1,2,⋯).E(X)=λ,D(X)=λ.同(1)可得E(X¯)=λ,D(X¯)=1nλ.(4)由E(X)=a+b2,D(X)=(b-a)212,同(1)可得E(X¯)=a+b2,D(X¯)=(b-a)212n.(5)由E(X)=1λ,D(X)=1λ2,同(1)可得D(X¯)=1λ,D(X¯)=1nλ2.习题4某厂生产的搅拌机平均寿命为5年,标准差为1年,假设这些搅拌机的寿命近似服从正态分布,求:(1)容量为9的随机样本平均寿命落在4.4年和5.2年之间的概率;(2)容量为9的随机样本平均寿命小于6年的概率。
第五章 数理统计的基本概念一. 填空题1. 设X 1, X 2, …, X n 为来自总体N(0, 2), 且随机变量)1(~)(221χ∑==ni iX C Y , 则常数C=___.解.∑=ni iX1~ N(0, n 2),)1,0(~1N n Xni iσ∑=所以21,1σσn c n c ==.2. 设X 1, X 2, X 3, X 4来自正态总体N(0, 22)的样本, 且243221)43()2(X X b X X a Y -+-=,则a = ______, b = ______时, Y 服从2分布, 自由度为______. 解. X 1-2X 2~N(0, 20), 3X 3-4X 4~N(0, 100))1,0(~20221N X X -, )1,0(~1004343N X X -201,201==a a ; 1001,1001==b b . Y 为自由度2的2分布.3. 设X 1, X 2, …, X n 来自总体2(n)的分布,则._____)(______,)(==X D X E解. 因为X 1, X 2, …, X n 来自总体2(n), 所以E(X i ) = n, D(X i ) = 2n (i = 1, 2, …, n),)(n X E = 22)()(221=⋅==∑=nnn nX D X D ni i二. 单项选择题1. 设X 1, X 2, …, X n 为来自总体N(0, 2)的样本,则样本二阶原点矩∑==n i i X n A 1221的方差为 (A)2 (B) n 2σ (C) n 42σ (D) n4σ 解. X 1, X 2, …, X n 来自总体N(0, 2), 所以,1)(),1(~)(222=σχσiiX E X 2)(2=σiX Dnn nn X D nX D A D ni ini i4242214212222))(()()(σσσσ=⋅===∑∑==. (C)是答案.2. 设X 1, X 2为来自正态总体N(,2)的样本, 则X 1 + X 2与X 1-X 2必 (A) 线性相关 (B) 不相关 (C) 相关但非线性相关 (D) 不独立 解. 假设 Y 1 = X 1 + X 2, Y 2 = X 1-X 2 所以 E(Y 2) = E(X 1)-E(X 2) = 0.cov(Y 1, Y 2) = E(Y 1Y 2)-E(Y 1)E(Y 2) = E(0)()()22212221=-=-X E X E X X . (B)是答案.3. 设X 服从正态分布N(0, 22), 而X 1, X 2, …, X 15为来自总体X 的简单随机样本, 则随机变量)(221521121021X X X X Y ++=所服从的分布为 (A) 2(15) (B) t(14) (C) F(10, 5) (D) F(1, 1)解.)10(~4221021χX X +, )5(~42215211χX X + 所以 )5,10(~204021521121021F X X X X ++++ , 即 )5,10(~)(221521121021F X X X X Y ++= (C)是答案.三. 计算题1. 设X 1, X 2, …, X 10为总体N(0, 0.32)的一个样本,求∑=>1012)44.1(i iXP .解. 因为X 1, X 2, …, X 10为总体N(0, 0.32)的一个样本, 所以)10(~3.0101222∑=i i X χ ()44.1(1012P X P i i=>∑=1.0)16)10(()09.044.13.0101222=>=>∑=i i P X χ 2. 从一正态总体中抽取容量为10的一个样本, 若有2的样本均值与总体均值之差的绝对值在4以上, 试求总体的标准差. 解. 因为总体X 服从N(,2),所以)1,0(~10/N X σμ-. 由02.0)4|(|=>-μX P 知 02.0)104|10/(|=>-σσμX P即 99.0)104(,01.0)104(=Φ=-Φσσ查表得.43.533.2104,33.2104===σσ3. 设总体X ~N(72, 100), 为使样本均值大于70的概率不小于0.95 , 问样本容量至少应取多大?解. 假设样本容量为n, 则)1,0(~1072),100,72(~N nX nN X -由 95.0)70(≥>X P 得P(n X 1072->95.0)107270≥-n 所以 0625.68,65.15,95.0)5(≥≥≤Φn nn.4. 设总体X 服从N(, 4), 样本(X 1, X 2, …, X n )来自X, X 为样本均值. 问样本容量至少应取多大才能使i. 1.0)|(|2≤-μX E ii. 95.0)1.0|(|2≥≤-μX P解. i. 1.04)(1)()|(|2≤===-nX D n X D X E μ 所以 n ≥ 40. ii. )1,0(~2),4,(~N nX nN X μμ-. 所以 P X P =≤-)1.0|(|μ(95.0)21.0|2|≥≤-nnX μ975.0)201(≥Φn , 查表得 ,96.1201≥n n ≥ 1537 5. 设∑==ni i X n X 11, 证明:i.∑=-ni iX12)(μ=∑=---ni i X n X X 122)()(μ;ii.∑∑==-=-ni ni i iX n X X X12122)()(.解. i.=-∑=ni iX12)(μ∑=-+-ni iX X X12)(μ=2)(12+-∑=ni iX X∑=+--ni i X X X 1))((μ∑=-ni X 12)(μ=2)(12+-∑=ni iX X∑=+--ni i X n X X 1))((μ2)(μ-X n=∑=---ni iX n X X122)()(μii.=-∑=ni i X X 12)(21121222)2(X n X X X X X X X ni i ni ini i i+-=+-∑∑∑====22122X n X n Xni i+-∑==212)(X n X ni i ∑=-。
第五章数理统计的基础知识在前四章的概率论部分中,我们讨论了概率论的基本概念、思想和方法。
知道随机变量的统计规律性是通过随机变量的概率分布来全面描述的。
在概率论的许多问题中,概率分布通常是已知的或假设为已知的,在这一前提下我们去研究它的性质、特点和规律性,即讨论我们关心的某些概率、数字特征的计算以及对某些问题的判断、推理等。
但在许多实际问题中,所涉及到的某个随机变量服从什么分布我们可能完全不知道,或有时我们能够根据某些事实推断出分布的类型,但却不知道其分布函数中的某些参数。
例如:1、某种电子元件的寿命服从什么分布是完全不知道的。
2、检测一批灯泡是否合格,则每个灯泡可能合格,也可能不合格,则服从(0—1)分布,但其中的参数p 未知。
对这类问题要深入研究,就必须知道与之相应的分布或分布中的参数.数理统计要解决的首要问题就是:确定一个随机变量的分布或分布中的参数.数理统计学是研究随机现象规律性的一门学科,它以概率论为理论基础,研究如何以有效的方式收集、整理和分析受到随机因素影响的数据,并对所考察的问题作出推理和预测,直至为采取某种决策提供依据和建议。
数理统计研究的内容非常广泛,可分为两大类:一是:怎样有效地收集、整理有限的数据资料.二是:怎样对所得的数据资料进行分析和研究,从而对所考察对象的某些性质作出尽可能精确可靠的判断—本书中参数估计和假设检验。
第一节数理统计的基本概念一、总体与总体的分布在数理统计中,我们将研究对象的全体称为总体或母体,而把组成总体的每个元素称为个体。
总体中所包含的个体的个数称为总体的容量. 容量为有限的总体称为有限总体;容量为无限的总体称为无限总体. 总体和个体之间的关系就是集合与元素之间的关系。
在实际问题中,研究对象往往是很具体的事物或现象,而我们所关心的不是每一个个体的种种具体的特征,而是其中某项或某几项数量指标,记为X .例如:研究一批灯泡的平均寿命时,该批灯泡的全体构成了研究的总体,其中每个灯泡就是个体.但在实际问题中,我们仅仅关心灯泡的使用寿命(记X 表示该批灯泡的寿命)。