概率论与数理统计:c6_2 常用统计分布
- 格式:ppt
- 大小:1.37 MB
- 文档页数:34
§6.3常用统计量的分布一、样本均值的分布1、单个正态总体下的样本均值的分布2、两个正态总体下的样本均值的分布3、非正态总体下的样本均值的近似分布二、-分布1、分布定义2、分布的性质3、分布的典型模式4、分布的上α分位点2χ2χ2χ2χ2χ三、t-分布1、t 分布的定义2、t(n)的性质3、t(n)的典型模式4、t(n)分布的上α分位点四、F-分布1、F分布的定义2、F分布的性质3、F分布的典型模式4、F分布的上α分位点五、正态总体样本均值与样本方差的分布1、单个正态总体下样本均值与样本方差的分布2、两个正态总体下样本均值差与样本方差比的分布)2.3(1)(1)1()(1)(1)1()(,,,2,1,)(,)(,,,1)1.3(),(~11,,,,),,(1.31222121112212121212n n nX D n X n D X D n nX E n X n E X E n i X D X E X X X X nN X n X nX n X X X X X N X n i i n i i n i i n i i i i n ni i ni i n σσµµσµσµσµσµ=⋅====⋅========∑∑∑∑∑∑======于是有相互独立同分布,故与:由于注的正态分布,即,方差为服从均值为值的一个样本,则样本均为来自服从正态总体设总体定理本均值的分布、单个正态总体下的样一、样本均值的分布"""这点处。
望取值几乎集中在数学期时且当高的集中程度远比总体要的取值于即倍的方差的的方差却只是但有相同的数学期望与由上述可知注µµX n X nX X X X ,,,1,,:2∞→212(1,0.2),,,,,{0.9 1.1}0.95?n X N n X X X X P X n ≤<≥"例 设总体服从正态分布从中抽取容量为的样本欲使样本均值满足不等式试求样本容量最小应为取多大2110.2:~(1,)1.110.910.95{0.9 1.1}0.20.2()()2()1222ni i X X N nnP X n n n n n==⎛⎞⎛⎞−−≤≤<=Φ−Φ⎜⎟⎜⎟⎝⎠⎝⎠=Φ−Φ−=Φ−∑解由题设知故0.951()0.975; 1.96,15.3664222,16n n n n +Φ≥=≥≥即查表得故因此样本容量最少应取。
统计学中的常用概率分布及其性质概率论是数学中的一个分支,它研究的是随机事件的发生概率以及由随机变量带来的影响。
概率分布则是衡量随机变量取值的可能性的一种方法。
概率分布可以用来得出某些随机变量出现的概率,同时可以用来比较多个随机变量之间的差异。
在统计学中,常用的概率分布有正态分布、伯努利分布、泊松分布、指数分布、二项分布、负二项分布以及几何分布。
正态分布正态分布是一种非常常见的概率分布,也叫高斯分布。
正态分布的概率密度函数是一个钟形曲线,其均值、方差以及标准差的值决定了曲线的位置与形态。
伯努利分布伯努利分布是一种离散概率分布,其只有两个可能结果,即成功或失败。
在伯努利分布中,成功的概率为p,失败的概率为1-p。
伯努利分布可以用来估计投掷硬币等随机事件的概率。
泊松分布泊松分布是一种离散概率分布,它用来衡量独立随机事件在一段时间内发生的次数。
泊松分布的概率密度函数为: P(X=k)= e^-λ * λ^k/k!,其中λ为平均发生次数。
指数分布指数分布是一种连续概率分布,其用途非常广泛,例如在可靠性工程学中,指数分布可以用来描述设备故障发生之间的时间间隔。
指数分布的概率密度函数为: f(x) = λ * e^-λx,其中λ为发生比例。
二项分布二项分布是一种离散概率分布,其表示在n次试验中成功的次数。
二项分布的概率函数为:P(X=k)= (n!/(k!*(n-k)!)) * p^k * (1-p)^(n-k),其中p为成功概率,n为试验次数。
负二项分布负二项分布是一种离散概率分布,其表示在成功x次之前,需要进行n次试验中失败的次数。
负二项分布的概率密度函数为:P(X=k)= (k-1)!((r-1)!*(k-r)!)p^r(1-p)^(k-r)几何分布几何分布是二项分布的一个特例,其表示在n次试验中,首次发生成功的次数。
几何分布的概率密度函数为:P(X=k)=(1-p)^(k-1)* p,其中p为成功概率,k为试验次数。
概率论与数理统计:六大基本分布及其期望和方差绪论:概率论中有六大常用的基本分布,大致可分成两类:离散型(0-1分布、二项分布、泊松分布),连续型(均匀分布、指数分布、正态分布)。
补充:在进入正文之前先讲一下期望和均值的一些区别:期望和均值都具有平均的概念,但期望是指的随机变量总体的平均值,而均值则是指的从总体中抽样的样本的平均值,即前者是理想的均值,而后者则是实际观测出来的数据的均值。
例如:对于一个六面的骰子,其期望E = (1+2+3+4+5+6)/ 6 = 3.5。
然后掷5次骰子,每次掷的点数分别为1,3,5,5,1,则平均值为(1+3+5+5+1)/ 5 = 3。
可以发现两者并不相等。
方差(variance):方差是各个数据与平均数之差的平方的平均数,方差度量了随机变量与期望(也可说均值)之间的偏离程度。
标准差为方差的开根号。
协方差(Covariance):用于衡量两个变量之间的误差,而方差是协方差的特殊情况,即当两个变量相同的情况。
其公式如下:,表示含义为:E(∑(“X与其均值之差” * “Y与其均值之差”))当协方差为正时:表示两变量正相关(即同时变大变下)。
当协方差为负时:表示两变量负相关(即你变大,我变小,反之亦然)。
当协方差为0时:两变量相互独立。
相关系数:其公式如下,表示的含义为用X和Y的协方差除以X 和Y的标准差。
所以相关系数也可以看成协方差,一种剔除两个变量量纲影响,标准化后的特殊协方差。
正文:1、0-1分布已知随机变量X,其中P{X=1} = p,P{X=0} = 1-p,其中 0 < p< 1,则成X服从参数为p的0-1分布。
其中期望为E(X) = p 方差D(X) = p(1-p);2、二项分布n次独立的伯努利实验(伯努利实验是指每次实验有两种结果,每种结果概率恒定,比如抛硬币)。
其中期望E(X) = np 方差D(X) = np(1-p);3、泊松分布表示单位时间内某稀有事件发生k次的概率,其公式为其中方差和期望均为,详细了解请☞戳4、均匀分布若连续型随机变量X具有概率密度,则称X在(a,b)上服从均匀分布其中期望E(X) = (a+b)/ 2 ,方差D(X) = (b-a)^2 / 12。
概率论与数理统计习题集及答案编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(概率论与数理统计习题集及答案)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为概率论与数理统计习题集及答案的全部内容。
《概率论与数理统计》作业集及答案第1章 概率论的基本概念§1 。
1 随机试验及随机事件1. (1) 一枚硬币连丢3次,观察正面H ﹑反面T 出现的情形。
样本空间是:S= ;(2) 一枚硬币连丢3次,观察出现正面的次数。
样本空间是:S= ; 2.(1) 丢一颗骰子. A :出现奇数点,则A= ;B :数点大于2,则B= 。
(2) 一枚硬币连丢2次, A :第一次出现正面,则A= ;B :两次出现同一面,则= ;C :至少有一次出现正面,则C= .§1 .2 随机事件的运算1. 设A 、B 、C 为三事件,用A 、B 、C 的运算关系表示下列各事件:(1)A 、B 、C 都不发生表示为: .(2)A 与B 都发生,而C 不发生表示为: 。
(3)A 与B 都不发生,而C 发生表示为: .(4)A 、B 、C 中最多二个发生表示为: 。
(5)A 、B 、C 中至少二个发生表示为: 。
(6)A 、B 、C 中不多于一个发生表示为: . 2. 设}42:{},31:{},50:{≤<=≤<=≤≤=x B x x A x x S :则(1)=⋃B A ,(2)=AB ,(3)=B A , (4)B A ⋃= ,(5)B A = 。
§1 。
3 概率的定义和性质1. 已知6.0)(,5.0)(,8.0)(===⋃B P A P B A P ,则(1) =)(AB P , (2)()(B A P )= , (3))(B A P ⋃= . 2. 已知,3.0)(,7.0)(==AB P A P 则)(B A P = 。
复制过来让大家都能下载哈第五章数理统计的基础知识5.1 数理统计的基本概念习题1已知总体X服从[0,λ]上的均匀分布(λ未知),X1,X2,⋯,Xn为X的样本,则().(A)1n∑i=1nXi-λ2是一个统计量;(B)1n∑i=1nXi-E(X)是一个统计量;(C)X1+X2是一个统计量;(D)1n∑i=1nXi2-D(X)是一个统计量.解答:应选(C).由统计量的定义:样本的任一不含总体分布未知参数的函数称为该样本的统计量.(A)(B)(D)中均含未知参数.习题2观察一个连续型随机变量,抽到100株“豫农一号”玉米的穗位(单位:cm),得到如下表中所列的数据. 按区间[70,80),[80,90),⋯,[150,160),将100个数据分成9个组,列出分组数据计表(包括频率和累积频率),并画出频率累积的直方图.解答:分组数据统计表求样本容量n,样本均值X¯,样本方差S2.解答:对于抽到的每个居民户调查均收入,可见n=200.这里,没有给出原始数据,而是给出了整理过的资料(频率分布),我们首先计算各组的“组中值”,然后计算X¯和S2的近似值:分别表示样本均值和样本二阶中心矩,试求E(X¯),E(S2).解答:由X∼B(10,3100),得E(X)=10×3100=310,D(X)=10×3100×97100=2911000,所以E(X¯)=E(X)=310,E(S2)=n-1nD(X)=291(n-1)1000n.习题6设某商店100天销售电视机的情况有如下统计资料f(2)(x)=2F(x)f(x)={2λe-λx(1-e-λx),x>00,其它,又X(1)的概率密度为f(1)(x)=2[1-F(x)]f(x)={2λe-2λx,x>00,其它.习题9设电子元件的寿命时间X(单位:h)服从参数λ=0.0015的指数分布,今独立测试n=6元件,记录它们的失效时间,求:(1)没有元件在800h之前失效的概率;(2)没有元件最后超过3000h的概率.解答:(1)总体X的概率密度f(x)={(0.0015)e-0.0015x,x>00,其它,分布函数F(x)={1-e-0.0015x,x>00,其它,{没有元件在800h前失效}={最小顺序统计量X(1)>800},有P{X(1)>800}=[P{X>800}]6=[1-F(800)]6=exp(-0.0015×800×6)=exp(-7.2)≈0.000747.(2){没有元件最后超过3000h}={最大顺序统计量X(6)<3000}P{X(6)<3000}=[P{X<3000}]6=[F(3000)]6=[1-exp{-0.0015×3000}]6=[1-exp{-4.5}]6≈0.93517.习题10设总体X任意,期望为μ,方差为σ2,若至少要以95%的概率保证∣X¯-μ∣<0.1σ,问样本容量n应取多大?解答:因当n很大时,X¯-N(μ,σ2n),于是P{∣X¯-μ∣<0.1σ}=P{μ-0.1σ<X¯<μ+0.1σ}≈Φ(0.1σσ/n)-Φ(-0.1σσ/n)=2Φ(0.1n)-1≥0.95,则Φ(0.1n)≥0.975,查表得Φ(1.96)=0.975,因Φ(x)非减,故0.1n≥1.96,n≥384.16,故样本容量至少取385才能满足要求.5.2 常用统计分布习题1对于给定的正数a(0<a<1),设za,χa2(n),ta(n),Fa(n1,n2)分别是标准正态分布,χ2(n),t(n),F(n1,n2)分布的上a分位点,则下面的结论中不正确的是().(A)z1-a(n)=-za(n);(B)χ1-a2(n)=-χa2(n);(C)t1-a(n)=-ta(n);(D)F1-a(n1,n2)=1Fa(n2,n1).解答:应选(B).因为标准正态分布和t分布的密度函数图形都有是关于y轴对称的,而χ2分布的密度大于等于零,所以(A)和(C)是对的.(B)是错的. 对于F分布,若F∼F(n1,n2),则1-a=P{F>F1-a(n1,n2)}=P{1F<1F1-a(n1,n2)=1-P{1F>1F1-a(n1,n2)由于1F∼F(n2,n1),所以P{1F>1F1-a(n1,n2)=P{1F>Fa(n2,n1)=a,即F1-a(n1,n2)=1Fa(n2,n1). 故(D)也是对的.习题2(1)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (1)X1-X2X32+X42;解答:因为Xi∼N(0,1),i=1,2,⋯,n,所以:X1-X2∼N(0,2),X1-X22∼N(0,1),X32+X42∼χ2(2),故X1-X2X32+X42=(X1-X2)/2X32+X422∼t(2).习题2(2)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布? (2)n-1X1X22+X32+⋯+Xn2;解答:因为Xi∼N(0,1),∑i=2nXi2∼χ2(n-1),所以n-1X1X22+X32+⋯+Xn2=X1∑i=2nXi2/(n-1)∼t(n-1).习题2(3)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布?(3)(n3-1)∑i=13Xi2/∑i=4nXi2.解答:因为∑i=13Xi2∼χ2(3),∑i=4nXi2∼χ2(n-3),所以:(n3-1)∑i=13Xi2/∑i=4nXi2=∑i=13Xi2/3∑i=4nXi2/(n-3)∼F(3,n-3).习题3设X1,X2,X3,X4是取自正态总体X∼N(0,22)的简单随机样本,且Y=a(X1-2X2)2+b(3X3-4X4)2,则a=?,b=?时,统计量Y服从χ2分布,其自由度是多少?解答:解法一Y=[a(X1-2X2)]2+[b(3X3-4X4)]2,令Y1=a(X1-2X2),Y2=b(3X3-4X4),则Y=Y12+Y22,为使Y∼χ2(2),必有Y1∼N(0,1),Y2∼N(0,1),因而E(Y1)=0,D(Y1)=1,E(Y2)=0,D(Y2)=1,注意到D(X1)=D(X2)=D(X3)=D(X4)=4,由D(Y1)=D[a(X1-2X2)]=aD(X1-X2)=a(D(X1)+22D(X2))=a(4+4×4)=20a=1,D(Y2)=D[b(3X3-4X4)]=bD(3X3-4X4)=b(9D(X3)+16D(X4))=b(4×9+16×4)=100b=1,分别得a=120,b=1100.这时Y∼χ2(2),自由度为n=2.解法二因Xi∼N(0,22)且相互独立,知X1-2X2=X1+(-2)X2∼N(0,20),3X3-4X4=3X3+(-4)X4∼N(0,100),故X1-2X220∼N(0,1),3X3-4X4100∼N(0,1),为使Y=(X1-2X21/a)2+(3X3-4X41/b)2∼χ2(2),必有X1-2X21/a∼N(0,1),3X3-4X41/b∼N(0,1),与上面两个服从标准正态分布的随机变量比较即是1a=20,1b=100,即a=120,b=1100.习题4设随机变量X和Y相互独立且都服从正态分布N(0,32).X1,X2,⋯,X9和Y1,Y2,⋯,Y9是分别取自总体X和Y的简单随机样本,试证统计量T=X1+X2+⋯+X9Y12+Y22+⋯+Y92服从自由度为9的t分布.解答:首先将Xi,Yi分别除以3,使之化为标准正态.令X′i=Xi3,Y′i=Yi3,i=1,2,⋯,9,则X′i∼N(0,1),Y′i∼N(0,1);再令X′=X′1+X′2+⋯+X′9,则X′∼N(0,9),X′3∼N(0,1),Y′2=Y′12+Y′22+⋯+Y′92,Y′2∼χ2(9).因此T=X1+X2+⋯+X9Y12+Y22+⋯+Y92=X1′+X2′+⋯+X9′Y′12+Y′22+⋯+Y′92=X′Y′2=X′/3Y′2/9∼t(9),注意到X′,Y′2相互独立.习题5设总体X∼N(0,4),而X1,X2,⋯,X15为取自该总体的样本,问随机变量Y=X12+X22+⋯+X1022(X112+X122+⋯+X152)服从什么分布?参数为多少?解答:因为Xi2∼N(0,1),故Xi24∼χ2(1),i=1,2,⋯,15,而X1,X2,⋯,X15独立,故X12+X22+⋯+X1024∼χ2(10),X112+X122+⋯+X1524∼χ2(5),所以X12+X22+⋯+X1024/10X112+X122+⋯+X1524/5=X12+X22+⋯+X1022(X112+X122+⋯+X152)=Y习题6证明:若随机变量X服从F(n1,n2)的分布,则(1)Y=1X服从F(n2,n1)分布;(2)并由此证明F1-α(n1,n2)=1Fα(n2,n1).解答:(1)因随机变量X服从F(n1,n2),故可设X=U/n1V/n2,其中U服从χ2(n1),V服从χ2(n2),且U与V相互独立,设1X=V/n2U/n1,由F分布之定义知Y=1x=V/n2U/n1,服从F(n2,n1).(2)由上侧α分位数和定义知P{X≥F1-α(n1,n2)}=1-α,P{1X≤1F1-α(n1,n2)=1-α,即P{Y≤1F1-α(n1,n2)=1-α,1-P{Y>1F1-α(n1,n2)=1-α,故P{Y>1F1-α(n1,n2)=α,而P{Y≥Fα(n2,n1)}=α.又Y为连续型随机变量,故P{Y≥1F1-α(n1,n2)=α,从而Fα(n2,n1)=1F1-α(n1,n2),即F1-α(n1,n2)=1Fα(n2,n1).习题7查表求标准正态分布的上侧分位数:u0.4,u0.2,u0.1与u0.05.解答:u0.4=0.253,u0.2=0.8416,u0.1=1.28,u0.05=1.65.习题8查表求χ2分布的上侧分位数:χ0.952(5),χ0.052(5),χ0.992(10)与χ0.012(10).解答:1.145,11.071,2.558,23.209.习题9查表求F分布的上侧分位数:F0.95(4,6),F0.975(3,7)与F0.99(5,5).解答:0.1623,0.0684,0.0912.习题10查表求t分布的下侧分位数:t0.05(3),t0.01(5),t0.10(7)与t0.005(10).解答:2.353,3.365,1.415,3.169.5.3 抽样分布(2)P{X¯>4.5}=P{Z>4.5-42/9=1-P{Z≤2.25}≈1-Φ(2.25)=1-0.9878=0.0122.习题2设总体X服从正态分布N(10,32),X1,X2,⋯,X6是它的一组样本,设X¯=16∑i=16Xi.(1)写出X¯所服从的分布;(2)求X¯>11的概率.解答:(1)X¯∼N(10,326),即X¯∼N(10,32).(2)P{X¯>11}=1-P{X¯≤11}=1-Φ(11-1032)≈1-Φ(0,8165)≈1-Φ(0.82)=0.2061.习题3设X1,X2,⋯,Xn是总体X的样本,X¯=1n∑i=1nXi,分别按总体服从下列指定分布求E(X¯),D(X¯).(1)X服从0-1分布b(1,p);(2)*X服从二项分布b(m,p);(3)X服从泊松分布P(λ);(4)X服从均匀分布U[a,b];(5)X服从指数分布e(λ).解答:(1)由题意,X的分布律为:P{X=k}=Pk(1-P)1-k(k=0,1).E(X)=p,D(X)=p(1-p).所以E(X¯)=E(1n∑i=1nXi)=1n∑i=1nE(Xi)=1n⋅np=p,D(X¯)=D(1n∑i=1nXi)=1n2∑i=1nD(X1)=1n2⋅np(1-p)=1np(1-p). (2)由题意,X的分布律为:P{X=k}=CmkPk(1-p)m-k(k=0,1,2,⋯,m).同(1)可得E(X¯)=mp,D(X¯)=1nmp(1-p).(3)由题意,X的分布律为:P{X=k}=λkk!e-λ(λ>0,k=0,1,2,⋯).E(X)=λ,D(X)=λ.同(1)可得E(X¯)=λ,D(X¯)=1nλ.(4)由E(X)=a+b2,D(X)=(b-a)212,同(1)可得E(X¯)=a+b2,D(X¯)=(b-a)212n.(5)由E(X)=1λ,D(X)=1λ2,同(1)可得D(X¯)=1λ,D(X¯)=1nλ2.习题4某厂生产的搅拌机平均寿命为5年,标准差为1年,假设这些搅拌机的寿命近似服从正态分布,求:(1)容量为9的随机样本平均寿命落在4.4年和5.2年之间的概率;(2)容量为9的随机样本平均寿命小于6年的概率。
§1.4常用的分布及其分位数1.卡平方分布卡平方分布、t 分布及F 分布都是由正态分布所导出的分布,它们与正态分布一起,是试验统计中常用的分布。
当X 1、X 2、…、Xn 相互独立且都服从N(0,1)时,Z=∑ii X 2的分布称为自由度等于n 的2χ分布,记作Z ~2χ(n),它的分布密度p(z⎧--1z n 。
2χn ),Z ~χ证明:,Y=X 21Y+Z=X 2.t X ~P(z)=请注意:t 分布的分布密度也是偶函数,且当n>30时,t 分布与标准正态分布N(0,1)的密度曲线几乎重叠为一。
这时,t 分布的分布函数值查N(0,1)的分布函数值表便可以得到。
3.F 分布若X 与Y 相互独立,且X ~2χ(n ),Y ~2χ(m ),则Z=mY n X 的分布称为第一自由度等于n 、第二自由度等于m 的F 分布,记作Z ~F(n ,m ),它的分布密度p(z)=⎪⎪⎪⎩⎪⎪⎪⎨⎧>++-⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛Γ⎪⎭⎫ ⎝⎛+Γ。
其他,00,2)(1222222z m n z n m n z m n m n m m n n 请注意:F 分布也是非对称分布,它的分布密度与自由度的次序有关,当Z ~F(n ,m )时,Z1~F(m,n )。
4.t 分布与F 分布的关系证:X Y=X 2当y ≤Y=X 因此4.常用分布的分位数1)分位数的定义分位数或临界值与随机变量的分布函数有关,根据应用的需要,有三种不同的称呼,即α分位数、上侧α分位数与双侧α分位数,它们的定义如下:当随机变量X 的分布函数为F(x ),实数α满足0<α<1时,α分位数是使P{X<x α}=F(x α)=α的数x α,上侧α分位数是使P{X>λ}=1-F(λ)=α的数λ,双侧α分位数是使P{X<λ1}=F(λ1)=0.5α的数λ1、使P{X>λ2}=1-F(λ2)=0.5α的数λ2。