概率论与数理统计 第六章 样本及抽样分布
- 格式:pdf
- 大小:1001.37 KB
- 文档页数:55
概率论与数理统计-ch6-样本与抽样分布概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质、数字特征等。
在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独⽴的试验得到许多观察值去推断随机变量的种种可能分布。
1、随机样本总体:试验的全部可能的观察值。
=样本空间个体:每⼀个可能观察值。
=样本点容量:总体中所包含的个体的个数。
有限总体⽆限总体⼀个总体对应⼀个随机变量X,对总体的研究就是对随机变量X的研究。
所以将不区分总体与相应的随机变量,统称为总体X。
样本:在数理统计中,⼈们都是通过从总体中抽取⼀部分个体,根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的⼀个样本。
对总体进⾏⼀次观察,就会得到⼀个随机变量X1,对总体进⾏n次重复的、独⽴的观察,就会得到n个随机变量X1,X2,...,Xn,这n个随机变量X1,X2,...,Xn是对总体随机变量X观察的结果。
则X1,X2,...,Xn是相关独⽴且与X具有相同分布,称为来⾃总体X的⼀个简单随机样本。
n称为样本的容量。
进⾏n次观察得到的⼀组实数x1,x2,...,xn是随机变量X1,X2,...,Xn的观察值,称为样本值,也称为X的n个独⽴的观测值。
2、抽样分布样本是统计推断的依据,但往往不直接使⽤样本本⾝,⽽是由样本构造的函数。
统计量:设X1,X2,...,Xn是来⾃总体X的⼀个样本,g(X1,X2,...,Xn)是其函数,且g中不含任何未知参数,则称g(X1,X2,...,Xn)是⼀统计量。
统计量也是⼀个随机变量。
g(x1,x2,...,xn)是统计量的观测值。
常⽤的统计量:经验分布函数:经验分布函数(empirical distribution function)是根据样本得到的分布函数.如设,是总体的样本值,将它们按⼤⼩顺序排列为,则称分布函数为经验分布函数是与总体分布函数相对应的统计量。
总体的分布函数是F(x),统计量的经验分布函数是F n(x),⽤F n(x)去推断F(x),当n⾜够⼤时,F n(x)以概率1收敛于F(x)。
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解: 8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P =2628.0)]25(1[2=Φ-(2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15}=.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10}=.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i i X P 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i i X P解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i ii ii iX P XP χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλnX D ===[六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
第六章样本及抽样分布一、选择题1.设X1 , X 2 ,L , X n是来自总体X的简单随机样本, 则X1, X2,L , X n必然满足 ( )A. 独立但分布不同 ;B. 分布相同但不相互独立 ; C 独立同分布 ; D. 不能确定2.下列关于“统计量”的描述中,不正确的是().A.统计量为随机变量 B. 统计量是样本的函数C. 统计量表达式中不含有参数D. 估计量是统计量3 下列关于统计学“四大分布”的判断中,错误的是() .1~ F (n2 ,n1)A.若 F ~ F ( n1 , n2 ), 则FB.若 T ~ t( n),则 T 2 ~ F (1,n)C .若X ~ N ( 0,1),则X2~ x2(1)n) 2( X iD .在正态总体下i 1 2(n 1)2 ~ x4.设X i , S i2表示来自总体N ( i , i2 ) 的容量为 n i的样本均值和样本方差(i 1,2) ,且两总体相互独立,则下列不正确的是() .A. 22S12~ F (n1 1,n2 1) B.( X 1 X2) (1 2)2 2 2 2 ~ N (0,1) 1S2 1 2n1 n2C. X 1 1~ t(n1 ) D.(n 1)S2 2(n2 1) S1 / n1 2 2 2~ x21nX )25.设X1, X 2,L , X n是来自总体的样本, 则1 i ( X i 是( ).n 1A. 样本矩B. 二阶原点矩C. 二阶中心矩D. 统计量6 X1,X2,L , X n是来自正态总体N (0,1) 的样本, X , S2分别为样本均值与样本方差, 则( ).n X~ t( nA. X ~ N (0,1)B. nX ~ N (0,1)C. X i2 ~ x2 (n)D. 1)i 1 S9 9X i2 285, 则样本方差 S27. 给定一组样本观测值X1, X 2,L , X9且得X i 45,i 1 i 1的观测值为 ( ).A. 7.5B.60C. 20D.65 3 28 设X服从t (n)分布 , P{|X| } a ,则 P{ X } 为( ).A. 1a B. 2a C. 1 a D. 1 1 a2 2 29 设x1, x2,L , x n是来自正态总体N (0, 22 ) 的简单随机样本,若Y a( X 1 2X 2 ) 2 b( X 3 X 4 X 5)2 c( X 6 X 7 X 8 X 9 )2服从 x 2分布,则a, b, c 的值分别为() .A. 1,1,1B.8 12 161,1,1 C. 1,1,1 D. 1,1,120 12 16 3 3 3 2 3 410 设随机变量X和Y相互独立 , 且都服从正态分布N(0,32),设 X1,X2, , X9和9X iY1,Y2, ,Y9分别是来自两总体的简单随机样本,则统计量U i 1 服从分布是92Y ii 1( ).A. t(9)B. t (8)C. N (0,81)D. N (0,9)二、填空题1.在数理统计中,称为样本.2.我们通常所说的样本称为简单随机样本,它具有的两个特点是.3.设随机变量 X1,X2, , X n相互独立且服从相同的分布, EX , DX 2 ,令X 1 nX i ,则 EX ; DX . ni 14. (X1,X2, , X10) 是来自总体X ~ N(0,0.32) 的一个样本,则102P X i 1.44 .i 15.已知样本 X 1 , X 2 , , X 16 取自正态分布总体 N ( 2,1) ,X 为样本均值, 已知 P{ X} 0.5,则.10. 6 设总体 X ~ N(,2) , X 是样本均值, S n 2是样本方差, n 为样本容量,则常用的随2机变量 (n1)S n 服从分布 .2第七章 参数估计一、选择题1.设总体 X~N(, 2), X 1,, X n 为抽取样本,则 1 n ( X iX ) 2 是().n i 1( A) 的无偏估计 ( B)2的无偏估计(C )的矩估计(D )2的矩估计2 设 X 在 [0 , a] 上服从均匀分布, a 0 是未知参数,对于容量为 n 的样本 X 1 , , X n , a的最大似然估计为( )(A ) max{X 1,X 2,, X n }1n(B )X in i 1(C ) max{X 1,X 2, , X n } min{ X 1 , X 2 ,, X n }(D ) 11 n X i ;n i 13 设总体分布为 N ( , 2) ,,2为未知参数,则2的最大似然估计量为( ) .(A ) 1n( X i X ) 2( B ) 1n( X i X )2n i 1n 1 i 1(C ) 1n( X i) 2( D ) 11 i n( X i)2n i 1n 14 设总体分布为 N ( , 2) ,已知,则2的最大似然估计量为() .(A ) S2( B )n 1S 2n(C ) 1n( X i) 2( D ) 11 i n( X i)2n i 1n 15 X 1, X 2, X 3 设为来自总体 X 的样本,下列关于 E( X ) 的无偏估计中, 最有效的为().(A )1(X 1 X 2 )(B ) 1(X 1X 2 X 3 )23(C ) 1(X 1X 2 X 3 )(D ) 2X 12X 2 1 X 3)43336 设 X 1,X 2,, X n (n 2)是正态分布 N( ,2)的一个样本,若统计量n1K( X i 1 X i ) 2 为2的无偏估计,则K 的值应该为()i 1(A )1( B )11( C )1 2 (D )12n2n2nn 17. 设 为总体 X 的未知参数, 1 , 2 是统计量,1,2为 的置信度为 1 a(0a 1) 的置信区间,则下式中不能恒成的是() .A. P{ 12}1 aB.P{2}P{1}aC. P{2}1aD.P{2}P{1}a28设X~N( , 2)且2未知,若样本容量为 n ,且分位数均指定为“上侧分位数”时,则的 95%的置信区间为( )A. ( Xu0.025)B. ( XS t 0 .05(n1))nnC. ( XSD.( X St 0 .025 ( n1))t 0.025 (n))nn9 设 X ~ N ( ,2), ,2均未知,当样本容量为n 时,2的 95%)的置信区间为(A.(( n 1)S 2, (n 1)S 2B. ( (n 1)S 2 ( n 1)S 221) 2)2 (n , 2(n )x 0.975 ( n x 0.025 (n 1)x 0.025 1) x 0.975 1)(( n 1)S 2( n 1)S 2( XSt 0. 025 (n1)) C. 2, 2) D.nt 0. 025 (n 1) t 0.975 ( n 1)二、填空题1. 点估计常用的两种方法是:和.2. 若 X 是离散型随机变量,分布律是 P{ X x} P(x; ) ,( 是待估计参数) ,则似然函数是,X 是连续型随机变量,概率密度是f (x; ) ,则似然函数是.3. 设总体 X 的概率分布列为:X 012 3P p 2 2 p(1 -p ) p2 1- 2p 其中 p (0 p 1/ 2)是未知参数. 利用总体 X 的如下样本值:1 ,3,0,2,3,3,1,3则 p 的矩估计值为__ ___ ,极大似然估计值为.4. 设总体 X 的一个样本如下:,,,,则该样本的数学期望E(X ) 和方差 D(X ) 的矩估计值分别_ ___.5. 设总体 X 的密度函数为: f ( x) ( 1)x 0 x 10 其他,设 X 1 , , X n是X的样本,则的矩估计量为,最大似然估计量为.6. 假设总体 X ~ N( , 2),且 X 1 n X i , X1,X2, , X n 为总体 X 的一个样本,n i 1则 X 是的无偏估计 .7 设总体 X~N( , 2) , X1, X2, , X n为总体X的一个样本,则常数k=, 使nk X i X 为的无偏估计量 .i 18 从一大批电子管中随机抽取100只,抽取的电子管的平均寿命为1000小时,样本均方差为S 40 .设电子管寿命分布未知,以置信度为0.95 ,则整批电子管平均寿命的置信区间为(给定 Z0. 05 1.645 , Z0.025 1.96 ).9设总体X~N( , 2), , 2 为未知参数,则的置信度为 1-的置信区间为.10某车间生产滚珠,从长期实践可以认为滚珠的直径服从正态分布,且直径的方差为20.04 ,从某天生产的产品中随机抽取9 个,测得直径平均值为15 毫米,给定0.05则滚珠的平均直径的区间估计为. ( Z0.05 1.645 , Z 0.025 1.96)11.某车间生产滚珠,从某天生产的产品中抽取6 个,测得直径为:已知原来直径服从N ( ,0.06) ,则该天生产的滚珠直径的置信区间为,(0.05,Z0.05 1.645 , Z0.025 1.96).12.某矿地矿石含少量元素服从正态分布,现在抽样进行调查,共抽取12 个子样算得S 0.2 ,则的置信区间为(, 2 (11) 19.68 ,2 (11) 4.57 ).0.1 12 2第八章假设检验一、选择题1.关于检验的拒绝域W,置信水平, 及所谓的“小概率事件” , 下列叙述错误的是().A.的值即是对究竟多大概率才算“小”概率的量化描述B .事件 {( X1 , X 2 , , X n ) W |H0为真} 即为一个小概率事件C.设 W是样本空间的某个子集,指的是事件{( X1 , X 2 ,L , X n ) | H 0为真 }D.确定恰当的W是任何检验的本质问题2. 设总体 X~N( , 2 ), 2未知 , 通过样本X1, X2, , X n检验假设 H 0 : 0,要采用检验估计量 ( ).X 0B. X 0C.XD.XA.n S / n/ S/ n / n 3. 样本 X1, X 2, , X n来自总体 N ( ,122) ,检验 H 0 : 100 ,采用统计量( ).A. XB.X 100C.X 100D.X12 / n 12 / n S / n 1 S / n4设总体X ~ N( , 2 ), 2 未知 ,通过样本X1,X2, , X n检验假设 H 0 : 0,此问题拒绝域形式为.A. { X100 C} B. {X100 C } C. {X100 C} D. { X C}S / 10 S / n S / 105.设X1, X2, , X n为来自总体N ( ,32 ) 的样本,对于H 0 : 100 检验的拒绝域可以形如() .. { X C} { X 100 C} X 100C} { X 100 C}A B. C. {n D.S /6 、样本来自正态总体N( , 2 ) , 未知 ,要检验H0: 2 100 , 则采用统计量为( ).A. (n 1)S2B.(n 1) S2C.Xn D.nS 22 100 100 1007、设总体分布为N ( , 2),若已知,则要检验H0: 2 100 ,应采用统计量 ( ).n 2 n 2A. XB. (n 1)S2C. i 1 ( X i )D.i 1( Xi X ) S / n 2 100 100二、填空题1.为了校正试用的普通天平 , 把在该天平上称量为 100 克的 10 个试样在计量标准天平上进行称量 , 得如下结果 :, , , 101,2,,假设在天平上称量的结果服从正态分布, 为检验普通天平与标准天平有无显著差异, H0 为.2.设样本X1, X2, , X25来自总体 N( ,9), 未知.对于检验 H 0 : 0,H1: 0,取拒绝域形如X 0 k ,若取a 0.05,则 k 值为.第六章样本及抽样分布答案一、选择题1. ( C )2. ( C ) 注:统计量是指不含有任何未知参数的样本的函数3. ( D )对于答案 D, 由于 X i~ N (0,1), 1,2, , n ,且相互独立,根据 2 分布的定义有i Ln ) 2( X i2i 1(n)2~ x4.(C)注:X 11~ t (n 1 1) 才是正确的 .S 1 / n 15.(D)6C) 注: X ~ N(0,1),X ~ t(n 1)才是正确的 nS nP X 12 1 2PX 12 1 12PX1225 12512(5)1299222X i XX 9 Xi 2859 257.(A)S 2 i 11i 19 17.5 988.(A) 9.(B)解:由题意可知X 1 2X 2 ~ N(0,20) , X 3X 4 X 5 ~ N (0,12) ,X 6 X 7 X 8X 9 ~ N (0,16) ,且相互独立,因此222X 1 2X 2X 3 X 4 X 5X 6 X 7X 8 X 9 ~ 23,201216即 a1, b1, c120121610(A)999解:X i ~ N (0,9 2 )X i 9 ~ N 0,1 , Y i 2 9 ~29i 1i 1i 19X i 9由 t 分布的定义有i 1~t 992Y i 81i 1二、填空题1.与总体同分布,且相互独立的一组随机变量 2. 代表性和独立性 23.,n4. 0.16.2( n 1)第七章 参数估计一、选择题1. 答案: D.222?21 n2?1 n[ 解 ] 因为E(X )A 2X i,E (X) ,E(X )X i ,E( X ) A 1n i 1n i 1所以, ? 2?2?2( X )1n2.E( X) E( X i X )n i 12. 答案: A.[ 解 ] 因为似然函数 11 ,当 amax X i 时, L(a) 最大,L(a)(max X i ) n a nii所以, a 的最大似然估计为max{ X 1 , X 2 , , X n } .3答案A.n[ 解] 似然函数 L( ,2)i 11 exp 12 ( xi) 2 ,22由ln L 0, 2 ln L 0 ,得2A 2 .4. 答案 C.[ 解]在上面第 5题中用取代 X 即可.5答案 B.6. 答案 C. 7 答案 D. 8. 答案 D.9. 答案 B.二、填空题:1. 矩估计和最大似然估计;2.p(x i ; ) ,f ( x i ; );i i.31 , ; 4816/82,令 E(X)[ 解 ] ( 1) p 的矩估计值 X X i 3 4 pX ,i 1得 p的矩估计为p (3 X ) / 4 1/ 4 .?( 2)似然函数为8x i ) P( X 0)[ P( X 1)] 2P( X 2)[ P( X 3)] 4L( p)P( Xi 14 p(1 p) 2 (1 2 p)4ln L( p) ln 46ln p 2 ln(1 p) 4 ln(1 2 p)令 [ ln L ( p)]6 1 2 1 8 0 ,12 p 2 14 p 3 0pp2 pp (7 13) /12 . 由 0 p1/ 2 ,故 p (713) /12 舍去所以 p的极大似然估计值为 p (713) /120.2828 .?4、 ,;?? 2iX i 222[ 解 ]由矩估计有:),又因为 D(X) E( X ) [E(X)],E(X ) X,E(Xn?X 1.7 1.75 1.71.65 1.75 1.71所以 E(X)5?1n2( X iX )0.00138 .且D(X)n i 1n2X 1, n ln X i5、?? i 1 ;1 X n ln Xii 1[ 解 ] ( 1)的矩估计为:11 2 11E(X ) x ( 1) x d x x2 0 2样本的一阶原点矩为:1 nx i Xn i 1所以有:1 X ? 2X 12 1 X( 2)的最大似然估计为:n nL ( X 1 , , X n; ) ( 1) X i ( 1) n ( X i )i 1 i 1nln L n ln( 1) ln X ii 1d ln L n nln X i 0d 1 i 1n得:? n ln X ii 1.nln X ii 16、;[ 解] E(X) 1 nE( X i ) n .nn i 17、;2n(n1)[ 解] 注意到X1, X2, , X n的相互独立性,X i1X1 X2 (n 1) X i X n Xnn 1E( X i X ) 0, D ( X i 2X )n所以, X i X ~ N (0, n1 2),nz21n 1 22E(| X i X |) | z | e n dzn 12nz21 n 12 2 n 12 z e 2 dzn0 n 1 22nn nkn 2n 1因为: E k | X i X | k E | X i X |i 1 i 1 2 n所以, k2n( n 1).8、. [ , ] ;[ 解 ] 这是分布未知,样本容量较大,均值的区间估计,所以有:X 1000, S 40, 0.05 , Z 0.025 1.96 的 95%的置信区间是:[ X SZ0.025 , X S Z0.025 ] [ 992.16,1007.84] . n n9、(X St (n 1), XSt (n 1)) ;n 2 n 2[ 解 ] 这是 2 为未知的情形,所以X ~ t(n 1) .S / n10、 [ , ] ;[ 解 ] 这是方差已知均值的区间估计,所以区间为:[ x Z , xn Z ]n 2 2 由题意得: x 15 2 0.04 0.05 n 9 ,代入计算可得:[15 0.2 1.96,15 0.2 1.96] ,化间得:[14.869,15.131] .9 911、 [ ,];[ 解 ]这是方差已知,均值的区间估计,所以有:置信区间为: [ Xn Z , XnZ ]2 2由题得: X 1 (14.6 15.1 14.9 14.8 15.2 15.1) 14.95 60.05 Z0.025 1.96 n 6代入即得: [14.95 0.06 1.96,14.95 0.06 1.96]6 6所以为: [14.754,15.146]12、.[,];[ 解 ] 由2(n 1)S 2 2 得:1 22 22 (n 1) S2, 2(n 1)S22 2212所以的置信区间为: [ (n 1) S2,(n 1)S22 (11) 2] ,(11)212将 n 12 , S 0.2 代入得[ 0.15 , 0.31 ]. 第八章假设检验一、选择题、、、、、、、二、填空题1.1002.。
第六章 样本及抽样分布 总体与个体:我们将试验的全部可能的观察值称为总体,这些值不一定都不相同,数目上也不一定是有限的,每一个可能观察值称为个体 总体中所包含的个体的个数称为总体的容量 容量为有限的称为有限总体 容量为无限的称为无限总体设X 是具有分布函数F 的随机变量,若,,21X X …n X ,是具有同一分布函数F 的、相互独立的随机变量,则称,,21X X …n X ,为从分布函数F (或总体F 、或总体X )得到的容量为n 的简单随机样本,简称样本,它们的观察值,,21x x …n x ,称为样本值,又称为X 的n 个独立的观察值由定义得:若,,21X X …n X ,为F 的一个样本,则,,21X X …n X ,相互独立,且它们的分布函数都是F ,所以(,,21X X …n X ,)的分布函数为,,(21*x x F …)(),1∏==ni i n x F x又若X 具有概率密度f ,则(,,21X X …n X ,)的概率密度为,,(21*x x f …).(),1∏==ni i n x f x设,,21X X …n X ,是来自总体X 的一个样本,g(,,21X X …n X ,)是,,21X X …n X ,的函数,若g 中不含未知参数,则称g(,,21X X …n X ,)是一统计量设,,21X X …n X ,是来自总体X 的一个样本,n x x x ,^,,21是这一样本的观察值,定义:样本平均值∑==ni i X n X 11样本方差⎪⎭⎫ ⎝⎛--=--=∑∑==n i i n i i X n X n X X n S 12221211)(11样本标准差∑=--==ni i X X n S S 122)(11 样本k 阶(原点)矩,2,1,11==∑=k X n A n i ki k …样本k 阶中心矩,3,2,)(11=-=∑=k X X n B k ni i k …经验分布函数设,,21X X …n X ,是总体F 的一个样本,用∞<<-∞x x S ),(表示,,21X X …n X ,中不大于x 的随机变量的个数。