数理统计中的三大抽样分布理论系统与题型题法2009
- 格式:doc
- 大小:753.00 KB
- 文档页数:15
常用的三种抽样分布
概述
在统计学中,抽样分布是指从总体中抽取一定数量的样本,并计算样本统计量的分布。
根据中心极限定理,当样本数足够大时,样本的均值和标准差会呈正态分布。
然而,并非所有的抽样分布都符合正态分布。
本文将介绍统计学中常用的三种抽样分布,包括正态分布、t分布和χ²〔卡方〕分布。
1. 正态分布〔Normal Distribution〕
正态分布是最常见的一种抽样分布,也被称为高斯分布。
它具有以下特点: - 均值为μ,标准差为σ; - 对称分布,其曲线呈钟型,两侧尾部逐渐下降; - 总体分布和抽样分布均为正态分布; - 标准正态分布
的均值为 0,标准差为 1。
可以通过标准化计算将任意正态分布转换为标准正态分布。
正态分布在实际应用中非常重要,尤其是在假设检验和置信区间计算中的应用广泛。
2. t分布〔Student’s t-Distribution〕
t分布是由英国统计学家William Sealy Gosset〔也被称为。
. . . .全国2009年10月高等教育自学考试概率论与数理统计(经管类)试题课程代码:04183一、单项选择题(本大题共10小题,每小题2分,共20分)在每小题列出的四个备选项中只有一个是符合题目要求的,请将其代码填写在题后的括号。
错选、多选或未选均无分。
1.某射手向一目标射击两次,A i 表示事件“第i 次射击命中目标”,i =1,2,B 表示事件“仅第一次射击命中目标”,则B =( B ) A .A 1A 2 B .21A A C .21A AD .21A A2.某人每次射击命中目标的概率为p (0<p <1),他向目标连续射击,则第一次未中第二次命中的概率为( D ) A .p 2B .(1-p )2C .1-2pD .p (1-p )3.已知P (A )=0.4,P (B )=0.5,且A ⊂B ,则P (A |B )=( C ) A .0 B .0.4 C .0.8D .1解:(P14)∵A ⊂B ,∴()()P AB P A =,()()()()()0.40.80.5P AB P A P A B P B P B ====。
4.一批产品中有5%不合格品,而合格品中一等品占60%,从这批产品中任取一件,则该件产品是一等品的概率为( D ) A .0.20 B .0.30 C .0.38D .0.57解:(P14)设A 为取到不合格品的事件,B 为取到一等品的事件; 则A 为取到合格品的事件,∴()()()5%,195%P A P A P A ==-= 合格品中一等品概率为:()60%P B A =,显然,()0P B A =. . . .由全概率公式得:()()()()()5%095%60%57%P B P A P B A P A P B A =+=⨯+⨯= 5.设随机变量X 的分布律为,则P {X <1}=( C )A .0B .0.2C .0.3D .0.5解(P?):6.下列函数中可作为某随机变量的概率密度的是( A )A .⎪⎩⎪⎨⎧≤>100,0,100,1002x x xB .⎪⎩⎪⎨⎧≤>0,0,0,10x x xC .⎩⎨⎧≤≤-其他,0,20,1x D .⎪⎩⎪⎨⎧≤≤其他,0,232121x ,解:(P39)∵()1f x dx +∞-∞=⎰∴(A)()210010010010010001100f x dx dx x x +∞+∞+∞-∞⎛⎫==-=--= ⎪⎝⎭⎰⎰; (B)()01010ln 1f x dx dx x x+∞+∞+∞-∞==≠⎰⎰;(D)()33221122111311112222222f x dx dx x +∞-∞===⨯-⨯=≠⎰⎰; 7.设随机变量X 与Y 相互独立,X 服从参数为2的指数分布,Y ~B (6,21),则E(X-Y)= ( A )A .25- B .21 C .2D .5解:(P ?)∵()12E X =,()1632E Y =⨯=,()()()15322E X Y E X E Y -=-=-=-。
抽样分布与理论分布一、抽样分布总体分布:总体中所有个体关于某个变量的取值所形成的分布。
样本分布:样本中所有个体关于某个变量大的取值所形成的分布。
抽样分布:样品统计量的概率分布,由样本统计量的所有可能取值和相应的概率组成。
即从容量为N 的总体中抽取容量为n 的样本最多可抽取m 个样本,m 个样本统计值形成的频率分布,即为抽样分布。
样本平均数的抽样分布:设变量X 是一个研究总体,具有平均数μ和方差σ2。
那么可以从中抽取样本而得到样本平均数x ,样本平均数是一个随机变量,其概率分布叫做样本平均数的抽样分布。
由样本平均数x 所构成的总体称为样本平均数的抽样总体。
它具有参数μx 和σ2x ,其中μx 为样本平均数抽样总体的平均数,σ2x 为样本平均数抽样总体的方差,σx 为样本平均数的标准差,简称标准误。
统计学上可以证明x 总体的两个参数 μx 和σ2x 与X 总体的两个参数μ和σ2有如下关系:μx = μσ2x = σ2 /n 由中心极限定理可以证明,无论总体是什么分布,如果总体的平均值μ和σ2都存在,当样本足够大时(n>30),样本平均值x 分布总是趋近于N (μ,n2σ)分布。
但在实际工作中,总体标准差σ往往是未知的,此时可用样本标准差S 估计σ。
于是,以nS估计σx ,记为X S ,称为样本标准误或均数标准误。
样本平均数差数的抽样分布:二、正态分布2.1 正态分布的定义:若连续型随机变量X 的概率密度函数是⎪⎭⎫ ⎝⎛--=σμπσx e x f 22121)( (-∞<x <+∞)则称随机变量X 服从平均数为μ、方差为σ2的正态分布,记作X~N (μ,σ2)。
相应的随机变量X 概率分布函数为 F (x )=⎰∞-x dx x f )(它反映了随机变量X 取值落在区间(-∞,x )的概率。
2.2 标准正态分布当正态分布的参数μ=0,σ2=1时,称随机变量X 服从标准正态分布,记作X~N (0,1)。
一、 三大抽样分布的分布函数综 述:)a 根据大数定理和中心极限定理,但样本容量n 较大时(数学上一般要求45n >),任何分布都依概率收敛于正态分布()2, N μσ,并可标准化为()0, 1N 。
)b 现实世界和工程技术中的任何数据样本流到目前为止,不外乎()0, 1N 的函数分布,集中表现为3大抽样分布规律。
)c 考研数学中规定:()0, 1N 的分位数定义为下分位数(从图形上看为左边面积),3 大抽样分布的分位数定义都为上分位数(从图形上看为右边面积)1. ()2n χ分布(分布函数不要求掌握)量纲模型:性 质:()1{}i X ()2 可加性 212~()n n χ+++()3证 明()3:由于()()()~0,10; 1i i i X N E X D X ⇒==()()()()()2224421 1,2,,3i i i i x i E X E X E X D X i n E X x edx +∞--∞=-===⎡⎤⎣⎦==()()()()()()()()()224222211222113122iii n ni i i i n n i i i i D X E X E X E n E X E X n D n D X D X nχχ====⎡⎤=-=-=⎣⎦⎛⎫=== ⎪⎝⎭⎛⎫=== ⎪⎝⎭∑∑∑∑样本函数中的必需记住的数字特征()4 上分位点 α定义为()2n χ分布的分位数2. ()t n 分布(分布函数不要求掌握){}i X 独立同分布 2~(0,1), ~();i X N Yn X Y χ和独立 性 质:()1 t 分布密度函数()()~(0,1)t n n f x N →∞⇒()2 上分位点 α定义为()t n 分布的分位数()3 ()0, 22nEX DX n n ==>- ()4 性质 T 分布具有对称性, 1()(); 45t n t n n αα-=->时,()t n Z αα≈3.(), F m n 分布(分布函数不要求掌握)X 、Y 相互独立,2~(); ~()X m Y n χχ;量纲模型:例:假定()12, X X 来自正态整体()2~0, X N σ的一个样本,求()()2122124X X P X X ⎡⎤+<⎢⎥-⎢⎥⎣⎦。
一、 三大抽样分布的分布函数综 述:)a 根据大数定理和中心极限定理,但样本容量n 较大时(数学上一般要求45n >),任何分布都依概率收敛于正态分布()2, N μσ,并可标准化为()0, 1N 。
)b 现实世界和工程技术中的任何数据样本流到目前为止,不外乎()0, 1N 的函数分布,集中表现为3大抽样分布规律。
)c 考研数学中规定:()0, 1N 的分位数定义为下分位数(从图形上看为左边面积),3 大抽样分布的分位数定义都为上分位数(从图形上看为右边面积)1. ()2n χ分布(分布函数不要求掌握)量纲模型:性 质:()1{}i X ()2可加性 ()3证 明()3:由于()()()~0,10; 1i i i X N E X D X ⇒==()()()()()2224421 1,2,,3i i i i x i E X E X E X D X i n E X x edx +∞--∞=-===⎡⎤⎣⎦==()()()()()()()()()224222211222113122iii n n i i i i n n i i i i D X E X E X E n E X E X n D n D X D X nχχ====⎡⎤=-=-=⎣⎦⎛⎫=== ⎪⎝⎭⎛⎫=== ⎪⎝⎭∑∑∑∑样本函数中的必需记住的数字特征()4 上分位点 α定义为()2n χ分布的分位数2. ()t n 分布(分布函数不要求掌握){}i X 独立同分布 2~(0,1), ~();i X N Y n X Y χ和独立 性 质:()1 t 分布密度函数()()~(0,1)t n n f x N →∞⇒()2 上分位点 α定义为()t n 分布的分位数()3 ()0, 22nEX DX n n ==>- ()4 性质 T 分布具有对称性,1()(); 45t n t n n αα-=->时,()t n Z αα≈3.(), F m n 分布(分布函数不要求掌握)X 、Y 相互独立,2~(); ~()X m Y n χχ;量纲模型:例:假定()12, X X 来自正态整体()2~0, X N σ的一个样本,求()()2122124X X P X X ⎡⎤+<⎢⎥-⎢⎥⎣⎦。
解:()()()2221212~0, ~0, 2; ~0, 2i X N X X N X X N σσσ⇒+-()()()()2222~0, 1~0, 1~1; ~1N N χχ⇒()()()()()22122212241220121~1, 124arctan 2.X X F X X X X P X X π+⇒==-⎡⎤+⇒<==⎢⎥-⎢⎥⎣⎦⎰①上分位点 α定义为()t n 分布的分位数② 性 质n● 证明结论 ()()2~1, t n F n ~(0,1)U N 2~()V n χ ~()T t n =22;U T V n= 而 22~(1)U χ时()()22~(1, )~1, T F n t n F n ⇒⇒● 证明结论 11(, )(, )F n m F m n αα-=如下(){}()()()()()()()()()1111~, ~, 1111, 11, 11, 1 , 1111, , , , X F m n Y F n m XP X F m n P X F m n P X F m n P F n m X P P F n m F n m X F m n X F m n αααααααααααα---=--⎧⎫⎪⎪≥=-⇒≤=-⎨⎬⎪⎪⎩⎭⎧⎫⎪⎪⇒>=⎨⎬⎪⎪⎩⎭⎧⎫−−−−−−−−→≥=⎨⎬⎩⎭⎧⎫⎪⎪⎧⎫>=≥⇒=⎨⎬⎨⎬⎩⎭⎪⎪⎩⎭又根据分位数的定义,而连续分布对一点的概率取值为零,则二、数理统计中8大样本函数的分布(枢轴量)的详细证明1. 单个正态总体设2{}~(, )n X N μσ为一系列简单随机样本,则有()1 若σ已知,需要估计μ的范围,则使用枢轴量)证明一:11ni i X X n ==∑111()()n i i E X E X n n nμμ===⋅⋅=∑2222111()()ni i D X D Xn n nn σσ===⋅⋅=∑证明二:()0X E E X μμσ⎛⎫ ⎪-=-= ⎪ ⎪ ⎪⎝⎭2()X n D D X μμσσ⎛⎫ ⎪-=- ⎪ ⎪ ⎪⎝⎭=222[()()]n E X E X μμσ---=()222[20]nE X X μμσ+-- =2222[()2]n E X μμσ+-=2222(()2)nE X μμσ+-=2222[()]1nnσμμσ+-=故~(0,1)X N μσ-公式 ① 是标准化随机变量的手段,也是确定复合随机变量分布的基础。
()2若μ未知,需要估计σ的范围,则使用枢轴量(X 是随机变量) 证 明:已知()()21,2,,~, i X i n Nμσ= ,且相互独立,令 ()()121,2,,,,,~0,1i i n X Y i n Y Y Y N μσ-==⇒ ,且相互独立。
作下列正交变换:11222122212n n n n n nn Z Y Z Y c c c Z Y c c c ⎛⎫⎛⎫ ⎪ ⎪ ⎪ ⎪ ⎪= ⎪ ⎪⎪ ⎪ ⎪⎪⎝⎭⎝⎭⎪⎝⎭正交变换不改变向量组的秩,由于12,,,n Y Y Y 相互独立,则12,,,n Z Z Z 相互独立,且都服从()0,1N 。
记 1111111111nn n n i i i ii i i X XX Y Y X n n nn n n μμμμσσσσσσ====--===⋅-=-⋅⋅=∑∑∑∑ 由上述变换矩阵等式易得:()112~0,1n Z N =+++= 正交变换不改变向量的长度2211nni i i i Y Z ==⇒=∑∑,所以222221122111222121(1)1()() ()()2 ()()2 ()n ni i i i nnni i i i i ni i ni i X n S X X X X X X X X X X n n X X n μμσσσσμμμμσσσσμμμσσσμμσσ=======---=-=-⎛⎫----⎛⎫=+-⎪ ⎪⎝⎭⎝⎭⎛⎫---=+- ⎪⎝⎭⎛⎫--=- ⎝∑∑∑∑∑∑∑()22222221112~1n nni ii i i i Y nY Z Z Z n χ===⎪⎭=-=-=-∑∑∑222221(1)1()~(1)niin SX X nχσσ=-=--∑有重要的应用价值,如计算()()22;E S D S。
()()()()()()()()()()()()() 22222222222222224 222211,121(1)11111(1)(1)2121111E n n D n nn SE S E E n nn n nn S nD S D D n nn n n χχσσσχσσσσσχσσ-=--=-⎛⎫-⇒==-=⋅-=⎪---⎝⎭⎡⎤⎛⎫⎡⎤--⎡⎤==⋅-=⋅-=⎪⎢⎥⎢⎥⎢⎥---⎣⎦⎣⎦⎝⎭⎣⎦∵()3若σ未知,需要估计μ的范围,则使用枢轴量证明:()0,1~1XNXt nSμσμ--==-()4若μ已知,需要估计σ的范围,则使用枢轴量(μ是常量)证明:()()22222111~0,11()()~iin n nii ii i iXY NXX Y nμσμμχσσ===-=--==∑∑∑2.两个正态总体(X和Y独立同分布)21~(,)X Nμσ,222~(,)Y Nμσ11niiX Xn==∑11niiY Yn==∑2222121111(),()11n mi ii iS X X S Y Yn m===-=---∑∑则有:()5 若2212, σσ已知,需要估计12μμ-的范围,则使用枢轴量证明:221212 ()~0, ~(0,1)X Y N N n m σσμμ⎡⎤---+⇒⎢⎥⎣⎦()6若2212, σσ未知,但12σσσ==时,需要估计12μμ-的范围,则使用枢轴量其中:W S=证明:212211()~0,110,X Y N n m N μμσσ⎡⎤⎛⎫---+ ⎪⎢⎥⎝⎭⎣⎦⎡⎤⎛⎫+ ⎪⎢⎥=()2110, 0, 10,10,1 ~2N N N N t n m σσ⎡⎤⎛⎫+ ⎪⎢⎥⋅====+-()7如12, μμ已知,需要估计1222σσ的范围,则使用枢轴量证明:()()()2122122112122221221122()1()~,1()()ni ni i i m ni ii i Xn X n n nF n m m Y Y m mm μχμσσχσμμσ====--==--∑∑∑∑根据F 分布的意义,可以推知222111222221()/~()()/~()n i i m i i X n Y m μσχμσχ==⎧-⎪⎪⎨⎪-⎪⎩∑∑()8如12, μμ未知,需要估计1222σσ的范围,则使用枢轴量证明:()()()()()()()2212221122222221221111~1,11111n S n n S n F n m m S m S m m χσσχσσ----==------ 三、先进题型与求解秘技量纲法求复合统计量的抽样分布。
3种抽样源正态;量纲法则判类型。
根据定义凑模式;标准变量容量值。
【例1】设1234, , , x x x x 来自正态总体()20, 2N 的简单随机样本,求, a b ,使得 ()()2221234234~X a x x b x x χ=-+-。
解:()()))))()[])()()[]()22221234123422122234223423412~0, 220, 2020134~0, 220, 100100~2X a x x b x x x x x x x x N N a a x x N N a b X χ⎤⎤=-+-=-+-⎦⎦⎡⎤-+=⇒=⎢⎥⎣⎦⎡⎤-+=⇒=⎢⎥⎣⎦【例2】2{}~(0,2)i N N ,22212345678910()()()Q aX b X X c X X X d X X X X =+++++++++服从2χ分布,求, , , a b c d 和自由度m 。
解: 2221111111~(0,2)~(0,1)~(1)24X N X X N X xσ⇒=⇒ 同理 23~(0,8),X X N +156~(0,12),X X X N ++78910~(0,16)X X X X N +++ 22231()~(1)8X X χ+ 24561()~(1)12X X X χ++ 278101()~(1)16X X X X χ+++ 由2()n χ的可加性知 2~(4)Q χ 所以 14a =18b = 112c = 116d = 4m = 【例3】设, X Y 相互独立,都服从()20, 3N,则统计量U =服从什么分布。