第六章、数理统计的基本知识解答
- 格式:doc
- 大小:354.00 KB
- 文档页数:8
第六章 数理统计的基本概念§6.1基本概念 §6.2样本数字特征一、填空题1. 若12,,n X X X ,为来自总体X 的容量为n 的样本,则样本均值X = ,样本方差2S = ; 2.设总体(4,40)X N , 1210,,X X X ,是X 的简单随机样本,则X 的概率密度()f x = ; .3.某种灯泡的寿命X 服从参数为(0)λλ>的指数分布,12,,n X X X ,是取自总体X 的简单随机样本,则12(,,)n X X X ,的联合密度函数为 ;4.设总体2(,2)X N μ ,12,,n X X X ,为取自总体的一个样本,X 为样本均值,要使2()0.1E X μ-≤成立,则样本容量n 至少应取多大 ;.5.设n X X X ,,21 ,是来自总体2(,)N μσ的随机样本,,a b 为常数,且0a b <<,则随机区间222211()(),n n i i i i X X b a μμ==⎛⎫-- ⎪⎝⎭∑∑的长度的数学期望为 。
.二、选择题1. 设(1,4)X N ,12,,n X X X ,为X 的样本,则(C )(A )1~(01)2X N -,; (B )1~(01)4X N -,; (C~(01)N ,; (D~(01)N ,. 2.设12,,n X X X ,是总体X 的样本,则有(D )(A )()X E X =; (B )()X E X ≈; (C )1()X E X n=; (D )以上三种都不对. 3.设总体(2,9)X N , 1210,,X X X ,是X 的样本,则(B )(A )(20,90)X N ; (B )(2,0.9)X N ; (C )(2,9)X N; (D )(20,9)X N .4.设总体2(,)X N μσ , 其中μ已知, 1234,,X X X X ,是X 的样本,则不是统计量的是(C ) (A )145X X +; (B )41i i X μ=-∑; (C )1X σ-; (D )421i i X =∑.5.设随机变量X 服从正态分布(0,1)N ,对给定的(01)αα<<,数a u 满足{}a P X u α>=,若{||}P X x α<=,则x 等于(C )(A )2a u ; (B )12a u-;(C )12a u -; (D )1a u -.6.设12,,n X X X ,是来自正态总体2(,)N μσ的简单随机样本,X 与2S 分别是样本均值与样本方差,则(C )(A )2222()E X S μσ-=-; (B )2222()D X S μσ+=+; (C )22()E X S μσ-=-; (D )22()D X S μσ+=+.三、 计算题5. 设1234,,,X X X X 是取自正态总体2(,)N μσ中的一个大小为4的样本,其中μ已知,但2σ未知,指出下面随机变量中哪些是统计量? (1)1234X X X X +++;(2)42211()ii Xμσ=-∑; (3)12max{,}X X ;(4)4X μ+; (5)141()2X X +; (6X . 其中4114i i X X ==∑.6. 12,,n X X X ,是取自正态总体2(,)N μσ中的一个样本,12, m U X X X =+++12 m m n V X X X ++=+++ ( )n m >.求,U V 的联合密度函数。
第六章 样本及抽样分布1.[一] 在总体N (52,6.32)中随机抽一容量为36的样本,求样本均值X 落在50.8到53.8之间的概率。
解:8293.0)78()712(}63.68.163.65263.62.1{}8.538.50{),363.6,52(~2=-Φ-Φ=<-<-=<<X P X P N X2.[二] 在总体N (12,4)中随机抽一容量为5的样本X 1,X 2,X 3,X 4,X 5. (1)求样本均值与总体平均值之差的绝对值大于1的概率。
(2)求概率P {max (X 1,X 2,X 3,X 4,X 5)>15}. (3)求概率P {min (X 1,X 2,X 3,X 4,X 5)>10}.解:(1)⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧>-=>-25541225415412}112{|X P X P X P=2628.0)]25(1[2=Φ- (2)P {max (X 1,X 2,X 3,X 4,X 5)>15}=1-P {max (X 1,X 2,X 3,X 4,X 5)≤15} =.2923.0)]21215([1}15{1551=-Φ-=≤-∏=i i X P (3)P {min (X 1,X 2,X 3,X 4,X 5)<10}=1- P {min (X 1,X 2,X 3,X 4,X 5)≥10} =.5785.0)]1([1)]21210(1[1}10{15551=Φ-=-Φ--=≥-∏=i iXP 4.[四] 设X 1,X 2…,X 10为N (0,0.32)的一个样本,求}.44.1{1012>∑=i iXP解:)5(1.0}163.0{}44.1{),10(~3.0101221012221012查表=>=>∑∑∑===i i i i i i X P X P χX7.设X 1,X 2,…,X n 是来自泊松分布π (λ )的一个样本,X ,S 2分别为样本均值和样本方差,求E (X ), D (X ), E (S 2 ).解:由X ~π (λ )知E (X )= λ ,λ=)(X D∴E (X )=E (X )= λ, D (X )=.)()(,)(2λX D S E nλn X D === [六] 设总体X~b (1,p),X 1,X 2,…,X n 是来自X 的样本。
第六章数理统计的基本概念前面五章我们讲述了概率论的基本内容,随后的五章将讲述数理统计.数理统计是以概率论为理论基础的一个数学分支.它是从实际观测的数据出发研究随机现象的规律性.在科学研究中,数理统计占据一个十分重要的位置,是多种试验数据处理的理论基础.数理统计的内容很丰富,本书只介绍参数估计、假设检验、方差分析及回归分析的部分内容.本章中首先讨论总体、随机样本及统计量等基本概念,然后着重介绍几个常用的统计量及抽样分布.第一节随机样本假如我们要研究某厂所生产的一批电视机显像管的平均寿命.由于测试显像管寿命具有破坏性,所以我们只能从这批产品中抽取一部分进行寿命测试,并且根据这部分产品的寿命数据对整批产品的平均寿命作一统计推断.在数理统计中,我们将研究对象的某项数量指标值的全体称为总体(Population),总体中的每个元素称为个体(Individual).例如上述的一批显像管寿命值的全体就组成一个总体,其中每一只显像管的寿命就是一个个体.要将一个总体的性质了解得十分清楚,初看起来,最理想的办法是对每个个体逐个进行观察,但实际上这样做往往是不现实的.例如,要研究显像管的寿命,由于寿命试验是破坏性的,一旦我们获得实验的所有结果,实用文档这批显像管也全烧毁了,我们只能从整批显像管中抽取一部份显像管做寿命试验,并记录其结果,然后根据这部份数据来推断整批显像管的寿命情况.由于显像管的寿命在随机抽样中是随机变量,为了便于数学上处理,我们将总体定义为随机变量.随机变量的分布称为总体分布.一般地,我们都是从总体中抽取一部分个体进行观察,然后根据所得的数据来推断总体的性质.被抽出的部分个体,叫做总体的一个样本.所谓从总体抽取一个个体,就是对总体X进行一次观察(即进行一次试验),并记录其结果.我们在相同的条件下对总体X进行n次重复的、独立的观察,将n次观察结果按试验的次序记为X1,X2,…,X n.由于X1,X2,…,X n是对随机变量X观察的结果,且各次观察是在相同的条件下独立进行的,于是我们引出以下的样本定义.定义6.1设总体X是具有分布函数F的随机变量,若X1,X2,…,X n是与X具有同一分布F(x),且相互独立的随机变量,则称X1,X2,…,X n为从总体X得到的容量为n的简单随机样本(Random sample),简称为样本.当n次观察一经完成,我们就得到一组实数x1,x2,…,x n.它们依次是随机变量X1,X2,…,X n的观察值,称为样本值.对于有限总体,采用放回抽样就能得到简单样本,当总体中个体的总数N比要得N≥10时),在实际中可将不放回抽样近似地当作到的样本的容量n大得多时(一般当n放回抽样来处理.实用文档实用文档若X 1,X 2,…,X n 为总体X 的一个样本,X 的分布函数为F (x ),则X 1,X 2,…,X n 的联合分布函数为F *(x 1,x 2,…,x n )=∏=ni i x F 1)(.又若X 具有概率密度f ,则X 1,X 2,…,X n 的联合概率密度为f *(x 1,x 2,…,x n )=∏=ni i x f 1)(.我们在搜集资料时,如果未经组织和整理,通常是没有什么价值的,为了把这些有差异的资料组织成有用的形式,我们应该编制频数表(即频数分布表).例6.1 某工厂的劳资部门为了研究该厂工人的收入情况,首先收集了工人的工资资料,表6-1记录了该厂30名工人未经整理的工资数值:表6-1以下,我们以例6.1为例介绍频数分布表的制作方法.表6-1是30个工人月工资的原始资料,这些数据可以记为x1,x2,…,x30,对于这些观测数据,第一步确定最大值x max和最小值x min,根据表6-1,有x max=640,x min=420.第二步分组,即确定每一收入组的界限和组数,在实际工作中,第一组下限一般取一个小于x min的数,例如,我们取400,最后一组上限取一个大于x max的数,例如取650,然后从400元到650元分成相等的若干段,比如分成5段,每一段就对应于一个收入组.表6-1资料的频数分布表如表6-2所示.表6-2实用文档600~650230图6-1为了研究频数分布,我们可用图示法表示.直方图直方图是垂直条形图,条与条之间无间隔,用横轴上的点表示组限,纵轴上的单位数表示频数.与一个组对应的频数,用以组距为底的矩形(长条)的高度表示,表6-2资料的直方图如图6-1所示.上述方法我们对抽取数据加以整理,编制频数分布表,作直方图,画出频率分布曲线,这就可以直观地看到数据分布的情况,在什么范围,较大较小的各有多少,在哪些地方分布得比较集中,以及分布图形是否对称等等,所以,样本的频率分布是总体概率分布的近似.样本是总体的反映,但是样本所含的信息不能直接用于解决我们所要研究的问题,而需要把样本所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题.针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.定义6.2设X1,X2,…,X n是来自总体X的一个样本,g(X1,X2,…,X n)是X1,X2…,X n的函数,若g中不含任何未知参数,则称g(X1,X2,…,X n)是一个统计量(Statistic).实用文档实用文档设x 1,x 2,…,x n 是相应于样本X 1,X 2,…,X n 的样本值,则称g (x 1,x 2,…,x n )是g (X 1,X 2,…,X n )的观察值.下面我们定义一些常用的统计量.设X 1,X 2,…,X n 是来自总体X 的一个样本,x 1,x 2,…,x n 是这一样本的观察值.定义样本平均值∑==ni i X n X 11;样本方差S 2=2221111()11n ni i i i X X X nX n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑; 样本标准差S =∑=--=n i iX X n S 122)(11; 样本k 阶(原点)矩A k =∑=n i ki X n 11,k =1,2,…;样本k 阶中心矩B k =∑=-ni k i X X n 1)(1,k =1,2,….它们的观察值分别为∑==ni i x n x 11;实用文档s 2=2221111()11n n i i i i x x x nx n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑ s =∑=--ni i x x n 12)(11; a k =∑=n i ki x n 11, k =1,2,…;b k =11()nk i i x x n =-∑, k =1,2,….这些观察值仍分别称为样本均值、样本方差、样本标准差、样本k 阶矩、样本k 阶中心矩.第二节 抽样分布统计量是样本的函数,它是一个随机变量.统计量的分布称为抽样分布.在使用统计量进行统计推断时常需知道它的分布.当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的.本节介绍来自正态总体的几个常用的统计量的分布.1.χ2分布设X 1,X 2,…,X n 是来自总体N (0,1)的样本,则统计量2χ=X 12+X 22+…+X n 2所服从的分布称为自由度为n 的2χ分布(2χdistribution ),记为2χ~)(2n χ.实用文档)(2n χ分布的概率密度函数为f (y )=⎪⎩⎪⎨⎧>--.,0,0,)2(212122其他y y n y n n e Γf (y )的图形如图62所示.图622χ分布具有以下性质:(1) 如果21χ~)(12n χ,22χ~)(22n χ,且它们相互独立,则有)(~2122221n n ++χχχ.这一性质称为2χ分布的可加性. (2) 如果2χ~)(2n χ,则有E (2χ)=n ,D (2χ)=2n .证 只证(2)因为X i ~N (0,1)故E (X i 2)=D (X i )=1,D (X i 2)=E (X i 4)E (X i 2)]2=31=2,i =1,2,…,n .于是,)()()(12122n X E X E E ni i ni i ===∑∑==χ图63.2)()()(12122n X D X D D ni i n i i ===∑∑==χ对于给定的正数α,0<α<1,称满足条件实用文档{}⎰∞==>)(222)()(n y y f n P αχααχχd的点)(2n αχ为)(2n χ分布的上α分位点(Percentile of α),如图63所示,对于不同的α,n ,上α分位点的值已制成表格,可以查用(见附表),例如对于α=0.05,n =16,查附表得)16(205.0χ=26.296.但该表只详列到n =45为止.当n >45时,近似地有)(2n αχ≈2)12(21-+n z α,其中z α是标准正态分布的上α分位点.例如)50(205.0χ≈12(1.645+99)2=67.221.2.t 分布设X ~N (0,1),Y ~2()n χ,并且X ,Y 独立,则称随机变量t =nYX服从自由度为n 的t 分布(t distribution ),记为t ~t (n ).t (n )分布的概率密度函数为h (t )=[]2/)1(21)2/(2/)1(+-⎪⎪⎭⎫⎝⎛++n n t n n n ΓΓπ, ∞<t <∞.(证略). 图64中画出了当n =1,10时h (t )的图形.h (t )的图形关于t =0对称,当n充分大时其图形类似于标准正态变量概率密度的图形.但对于较小的n ,t 分布与N (0,1)分布相差很大(见附表).实用文档图6 4 图65对于给定的α,0<α<1,称满足条件P (t >t α(n ))=⎰∞)()(n t t t h αd =α的点t α(n )为t (n )分布的上α分位点(见图65).由t 分布的上α分位点的定义及h (t )图形的对称性知t 1α(n )=t α(n ).t 分布的上α分位点可从附表查得.在n >45时,就用正态分布近似:t α(n )≈z α.3.F 分布设U ~)(12n χ,V ~)(22n χ,且U ,V 独立,则称随机变量F =21//n V n U 服从自由度为(n 1,n 2)的F 分布(F distribution ),记F ~F (n 1,n 2).F (n 1,n 2)分布的概率密度为[][]⎪⎩⎪⎨⎧>++=+-.,0,0,)/(1)2/()2/()/(2/)()(2/)(21211)2/(2/21212111其他y n y n n n y n n n n y n n n n ΓΓΓψ (证略).实用文档)(y ψ的图形如图66所示.图6 6 图67F 分布经常被用来对两个样本方差进行比较.它是方差分析的一个基本分布,也被用于回归分析中的显著性检验.对于给定的α,0<α<1,称满足条件P {F >F α(n 1,n 2)}=⎰∞),(21)(n n F y y αψd =α的点F α(n 1,n 2)为F (n 1,n 2)分布的上α分位点(图67).F 分布的上α分位点有表格可查(见附表).F 分布的上α分位点有如下的性质:F 1α(n 1,n 2)=),(112n n F α.这个性质常用来求F 分布表中没有包括的数值.例如由附表查得F 0.05(9,12)=2.80,则可利用上述性质求得F 0.95(12,9)=1/F 0.05(9,12)=12.80=0.357. 4.正态总体的样本均值与样本方差的分布设正态总体的均值为μ,方差为σ2,X 1,X 2,…,X n 是来自正态总体X 的一个简单实用文档样本,则总有E (X )=μ, D (X )=σ2/n ,X ~N (μ,σ2/n ).对于正态总体N (μ,σ2)的样本方差S 2, 我们有以下的性质.定理6.1 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有(1))1(~)1(222--n S n χσ;(2)X 与S 2独立. (证略).定理6.2 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有)1(~/--n t nS X μ.证 因为)1,0(~/N nX σμ-,)1(~)1(222--n S n χσ且两者独立,由t 分布的定义知实用文档)1(~)1()1(//22----n t n S n nX σσμ. 化简上式左边,即得)1(~/--n t nS X μ.定理6.3 设X 1,X 2,…,1n X 与Y 1,Y 2,…,2n X 分别是来自具有相同方差的两正态总体N (μ1,σ2),N (μ2,σ2)的样本,且这两个样本相互独立.设∑==1111n i i X n X ,∑==2121n i i Y n Y 分别是这两个样本的均值.S 12=∑=--1121)(11n i i X X n ,S 22=∑=--2122)(11n i i Y Y n 分别是这两个样本的样本方差,则有:)2(~/1/1)()(212121-++---n n t n n S Y X W μμ,其中 S W 2=)2()1()1(21222211-+-+-n n S n S n .(证略).本节所介绍的三个分布以及三个定理,在下面各章中都起着重要的作用.应注意,它们都是在总体为正态总体这一基本假定下得到的.例6.2 设总体X 服从正态分布N (62,100),为使样本均值大于60的概率不小于0.95,问样本容量n 至少应取多大?解 设需要样本容量为n ,则)1,0(~/N n X nX ⋅-=-σμσμ,实用文档P (X >60)=⎭⎬⎫⎩⎨⎧⋅->⋅-n n X P 1062601062.查标准正态分布表,得Φ(1.64)≈0.95.所以0.2n ≥1.64,n ≥67.24.故样本容量至少应取68.小 结在数理统计中往往研究有关对象的某一项数量指标,对这一数量指标进行试验和观察,将试验的全部可能的观察值称为总体,每个观察值称为个体.总体中的每一个个体是某一随机变量X 的值,因此一个总体对应于一个随机变量X ,我们笼统称为总体X .随机变量X 服从什么分布就称总体服从什么分布.若X 1,X 2,…,X n 是相同条件下,对总体X 进行n 次重复独立的观察所得到的n 个结果,称随机变量X 1,X 2,…,X n 为来自总体X 的简单随机样本,它具有两条性质.1.X 1,X 2,…,X n 都与总体具有相同的分布;2.X 1,X 2,…,X n 相互独立.我们就是利用来自样本的信息推断总体,得到有关总体分布的种种结论.完全由样本X 1,X 2,…,X n 所确定的函数g =g (X 1,X 2,…,X n )称为统计量,统计量是一个随机变量.它是统计推断的一个重要工具.在数理统计中的地位相当重要,相当于随机变量在概率论中的地位.实用文档样本均值 ∑==ni i X n X 11和样本方差 S 2=∑=--n k k X X n 12)(11是两个最重要的统计量,统计量的分布称为抽样分布,读者需要掌握统计学中三大抽样分布:2χ分布,t 分布,F 分布.读者学习后续内容还需要掌握以下重要结果:1.设总体X 的一个样本为X 1,X 2,…,X n .且X 的均值和方差存在. 记μ=EX ,σ2=DX .则E (X )=μ, D (X )=σ2/n , ES 2=σ2.2.设总体X~N (μ,σ2),X1,X2,…,Xn 是X 的一个样本,则 (1) X ~N (μ,σ2/n ); (2))1(~)1(222--n S n χσ;(3) X 和S 2相互独立; (4))1(~/--n t nS X μ.3.定理6.3的结果. 重要术语及主题总体 样本 统计量实用文档2χ分布、t 分布、F 分布的定义及它们的密度函数图形上的α分位点.习 题 六1.设总体X ~N (60,152),从总体X 中抽取一个容量为100的样本,求样本均值与总体均值之差的绝对值大于3的概率.2.从正态总体N (4.2,52)中抽取容量为n 的样本,若要求其样本均值位于区间(2.2,6.2)内的概率不小于0.95,则样本容量n 至少取多大?3.设某厂生产的灯泡的使用寿命X ~N (1000,σ2)(单位:小时),随机抽取一容量为9的样本,并测得样本均值及样本方差.但是由于工作上的失误,事后失去了此试验的结果,只记得样本方差为S 2=1002,试求P (X >1062).4.从一正态总体中抽取容量为10的样本,假定有2%的样本均值与总体均值之差的绝对值在4以上,求总体的标准差.5.设总体X ~N (μ,16),X 1,X 2,…,X 10是来自总体X 的一个容量为10的简单随机样本,S 2为其样本方差,且P (S 2>a )=0.1,求a 之值.6.设总体X 服从标准正态分布,X 1,X 2,…,X n 是来自总体X 的一个简单随机样本,试问统计量Y =∑∑==-ni ii i XX n 62512)15(,n >5实用文档服从何种分布?7.求总体X ~N (20,3)的容量分别为10,15的两个独立随机样本平均值差的绝对值大于0.3的概率.8.设总体X ~N (0,σ2),X 1,…,X 10,…,X 15为总体的一个样本.则Y =()21521221121022212X X X X X X ++++++ 服从 分布,参数为 . (2001研考)9.设总体X ~N (μ1,σ2),总体Y ~N (μ2,σ2),X 1,X 2,…,1n X 和Y 1,Y 2,…,2n X 分别来自总体X 和Y 的简单随机样本,则⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21121221n n Y Y X X E n j j n i i = . (2004研考) 10.设总体X ~N (μ,σ2),X 1,X 2,…,X 2n (n ≥2)是总体X 的一个样本,∑==ni i X n X 2121,令Y =∑=+-+ni i n iX X X12)2(,求EY . (2001研考)11. 设总体X 的概率密度为f (x )=x-e21 (-∞<x <+∞),X 1,X 2,…,X n 为总体X 的简单随机样本,其样本方差为S 2,求ES 2. (2006研考)。
第六章数理统计的基本知识数理统计的内容主要包括以下两个方面:一、如何收集、整理数据资料;二、如何对所得的数据资料进行分析、研究,从而对所研究的对象的性质、特点作出推断.后者就是我们所说的统计推断问题.本书只讲述统计推断的基本内容,即数理统计的基本知识、参数估计、假设检验、方差分析及回归分析等.在概率论中,我们是在假设随机变量的分布已知的前提下去研究它的性质、特点和规律性,例如介绍常用的各种分布、讨论其随机变量的函数的分布、求出其随机变量的数字特征等.在数理统计中,我们研究的随机变量,其分布是未知的,或者是不完全知道的,人们是通过对所研究的随机变量进行重复独立的观察,得到许多观察值,对这些数据进行分析,从而对所研究的随机变量的分布作出种种推断的.本章我们将介绍总体、随机样本及统计量等基本概念,并着重介绍几个常用统计量及抽样分布.§6.1 随机样本一、总体与总体分布1.总体:将研究对象的某项数量指标的值的全体称为总体.总体中的每个元素称为个体.总体中所包含的个体的个数称为总体的容量.容量为有限的称为有限总体.否则称为无限总体.注:有些有限总体,它的容量很大,我们可以认为它是一个无限总体.例如考察全国正在使用的某种型号灯泡的寿命所形成的总体,由于个体的个数很多,就可以认为是无限总体.在总体中,由于每个个体的出现是随机的,所以研究对象的该项数量指标X的取值就具有随机性,X是一个随机变量.因此,我们所研究的总体,即研究对象的某项数量指标X,它的取值在客观上有一定的分布.我们对总体的研究,就是对相应的随机变量X的分布的研究.X的分布函数和数字特征就称为总体的分布函数和数字特征,今后将不区分总体与相应的随机变量,笼统称为总体X.二、样本与样本分布在实际中,总体的分布一般是未知的,或只知道它具有某种形式,其中包含着未知参数.在数理统计中,人们都是通过从总体中抽取一部分个体,然后根据获得的数据来对总体分布得出推断的,被抽出的部分个体叫做总体的一个样本.从总体抽取一个个体,可以看作是对代表总体的随机变量X 进行一次试验(或观测),得到X 的一个试验数据(或观测值).从总体中抽取一部分个体,就看作是对随机变量X 进行若干次试验(或观测),得到X 的一些试验数据(或观测值).从总体中抽取若干个个体的过程称为抽样.抽样结果得到X 的一组试验数据(或观测值)称为样本.样本中所含个体的数量称为样本容量.为了使样本能很好地反映总体的情况,从总体中抽取样本,必须满足下述两个条件: 1.代表性因抽取样本要反映总体,自然要求每个个体和总体具有相同分布. 2.独立性各次抽取必须是相互独立的,即每次抽样的结果既不影响其他各次抽样的 结果,也不受其他各次抽样结果的影响.这种随机的、独立的抽样方法称为简单随机抽样.由此得到的样本称为简单随机样本.从总体中进行放回抽样,显然是简单随机抽样,得到的是简单随机样本.从 有限总体中进行不放回抽样,显然不是简单随机抽样,但是当总体容量N很大而样本容量n 较小0.1n N ⎛⎫≤ ⎪⎝⎭时,也可以近似地看作是放回抽样,即可以近似地看作是简单随机抽样,得到的样本可以近似地看作是简单随机样本. 注:从总体抽取容量为n 的样本,就是对代表总体的随机变量X在相同条件下随机地、独立地进行n 次试验(或观测),将n 次试验结果按试验的次序记为n X X X ,,,21 .由于n X X X ,,,21 是对随机变量X 试验的结果,且各次试验是在相同条件下独立地进行的,所以可认为n X X X ,,,21 是相互独立的,且与总体X 服从相同的分布.定义1:设总体X 是具有某一分布函数的随机变量,如果随机变量n X X X ,,,21 相互独立,且都与X 具有相同的分布,则称n X X X ,,,21 为来自总体X 的简单随机样本,简称样本.n 称为样本容量.在对总体X 进行一次具体的抽样并做观测之后,得到样本n X X X ,,,21 的确切数值12,,,n x x x ,称为样本观察值(或观测值),简称为样本值.如果总体X 的分布函数为()F X ,则样本n X X X ,,,21 的联合分布函数为*12121(,,,)()()()()nn n i i F x x x F x F x F x F x ===∏如果总体X 是离散型随机变量,且概率分布为{},1,2,i P X x i ==则样本n X X X ,,,21 的联合概率分布为12121{,,,}{}{}{}{}nn n i i i P X x X x X x P X x P X x P X x P X x ∙==========∏如果总体X 是连续型随机变量,且具有概率密度)(x f ,则样本n X X X ,,,21 的联合概率密度为12121(,,,)()()()()nn n i i f x x x f x f x f x f x ∙===∏三、统计推断问题简述总体和样本是数理统计中的两个基本概念. 样本来自总体,自然带有总体的信息,从而可以从这些信息出发去研究总体的某些特征(分布或分布中的参数). 另一方面,由样本研究总体可以省时省力(特别是针对破坏性的抽样试验而言). 我们称通过总体X 的一个样本n X X X ,,,21 对总体X 的分布进行推断的问题为统计推断问题.总体、样本、样本值的关系:总体↙ ↖推断(个体)样本 → 样本值抽样在实际应用中, 总体的分布一般是未知的, 或虽然知道总体分布所属的类型, 但其中包含着未知参数. 统计推断就是利用样本值对总体的分布类型、未知参数进行估计和推断.为对总体进行统计推断, 还需借助样本构造一些合适的统计量, 即样本的函数, 下面将对相关统计量进行深入的讨论.例1:设总体X 服从正态分布),(2σμN ,概率密度为22()2(), x f x x R μσ--=∈则其样本n X X X ,,,21 的联合概率密度为22211()()2212/211(,,,).(2)ni i x nx n n ni f x x x e μμσσπσ=----*=∑==§6.2 抽样分布样本是进行统计推断的依据.在应用时,往往不是直接使用样本本身,而是针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.一、统计量的概念定义1:设12,,,n X X X 是来自总体X 的一个样本,()12,,,n g X X X 是 12,,,n X X X 的函数,若g 中不含未知参数,则称()12,,,n g X X X 是一个统计量.设12,n x x x 是相应于样本12,,,n X X X 的样本值,则12(,)n g x x x 称为()12,,,n g X X X 的观察值.注: 统计量是随机变量.不一定和总体同分布,不同的统计量有不同的分布.二、常用的统计量1. 样本均值 ∑==ni i X n X 11 观测值记为 11nii x xn==∑2. 样本方差 ()2222111111nn i i i i S X X X nX n n ==⎛⎫=-=- ⎪--⎝⎭∑∑ 观测值记为 ()2222111111nn i i i i s x x x nx n n ==⎛⎫=-=- ⎪--⎝⎭∑∑ 3. 样本标准差S ==观测值记为s ==4. 样本(k 阶)原点矩 ,2,1,11==∑=k X n A n i ki k观测值记为 11,1,2,n kk i i a xk n ===∑5. 样本(k 阶)中心矩 ,3,2,)(11=-=∑=k X X n B ni k i k观测值记为 ()11,1,2,knk i i b x x kn ==-=∑注: (1)上述五种统计量可统称为矩统计量,简称为样本矩,它们都是样本的显示函数,它们的观察值仍分别称为样本均值、样本方差、样本标准差、样本(k 阶)原点矩、样本(k 阶)中心矩.(2)样本的一阶原点矩就是样本均值,样本一阶中心矩恒等于零21121,0,n A X B B S n-===, 三、矩估计法的理论根据若总体X 的k 阶矩()k k E X μ=存在,则当n →∞时Pk k A μ−−→ 1,2,k=证:12,,,n X X X 独立且与X 同分布12,,,k k knX X X ∴独立且与k X 同分布.故有 ()()()()12k kkk n k E X E X E X E X μ=====从而由第五章的大数定理知11n P k k i k i A X n μ==−−→∑ 1,2,k=进而由第五章中关于依概率收敛的序列的性质知道()()1212,,,,,,Pk k g A A A g μμμ−−→其中g 为连续函数,这就是下一章所要介绍的矩估计法的理论根据。
第五章、数理统计的基本知识五、证明题:1.证:因为随机变量12,,,n X X X 相互独立,并且与总体X 服从相同的正态分布2(,)N μσ,所以,它们的线性组合11222111111[,()](,)n ni ii i nni i X X X n nN N nnn σμσμ======⋅⋅=∑∑∑∑即样本均值X 服从正态分布2(,)N nσμ.2.证:因为随机变量12,,,n X X X 相互独立,并且与总体X 服从相同的正态分布2(,)N μσ,所以,它们的线性组合11222111111[,()](,)n ni ii i nni i X X X n nN N nnn σμσμ======⋅⋅=∑∑∑∑即样本均值X 服从正态分布2(,)N nσμ。
所以,将X 标准化,即得~(0,1)u N =. 3.证:因为随机变量12,,,n X X X 相互独立,并且与总体X 服从相同的正态分布2(,)N μσ,即2~(,),1,2,i X N i n μσ=所以得~(0,1),1,2,,i X N i n μσ-=又因为12,,,n X X X 相互独立,所以 12,,,n X X X μμμσσσ--- 也相互独立。
于是,22222111()()~()n ni i i i X X n μμσσ==-χ=-=χ∑∑.4.证:由§5.4定理2知,统计量~(0,1)u N=;又由§5.4定理4知,统计量2222(1)~(1)n Snσ-χ=χ-因为X与2S独立,所以统计量u=222(1)n Sσ-χ=也是独立的。
于是,根据§5.3定理2可知,统计量~(1)t t n===-.5.证:由§5.4定理1知:22121212~(,),~(,)X N Y Nn nσσμμ.因为X与Y独立,所以可知:22121212~(,)X Y Nn nσσμμ--+.于是,得~(0,1)U N=.6.证:由§5.4定理6的推论知,统计量~(0,1)U N=.又由§5.4定理4知:2221111222222222(1)~(1),(1)~(1).n Snn Snσσ-χ=χ--χ=χ-因为21S与22S独立所以21χ与22χ也是独立的,由2χ分布的可加性可知,统计量w s =由§5.4定理4知:X 与21S 独立,Y 与22S 独立,所以统计量U 与2χ也是独立的.于是,由§5.3定理2可知,统计量12~(2)T t n n ==+-.其中w s =7.证: 由§5.4定理3知:2221112112222222121()~(),1()~().nii njj Xn Yn μσμσ==χ=-χχ=-χ∑∑因为所有的1(1,2,)i X i n = 与1(1,2,)i Y j n = 都是相互独立的,所以统计量21χ与22χ也是独立的.于是,由§5.3定理3可知,统计量22211111112222222221()/()/~(,)/()/()ni i njj X n nF F n n n Yn μσμσ==-χ==χ-∑∑.8.证:由§5.4定理4知:222111121222222222(1)~(1),(1)~(2).n S x x n n Sx x n σσ-=--=-因为21S 与22S 独立,所以统计量21x 与22x 也是独立的.于是,由§5.3定理3可知,统计量2221111122222222/(1)/~(1,1)/(1)/x n S F F n n x n S σσ-==--- 9.证:由于127,,,X X X 是取自总体X 的样本,故127,,,X X X 相互独立,且~(0,9)1,2,i X N i=从而有1234567123456~(0,27);~(0,36)/~(0,1);36~(0,1)X X X N X X X X N X X X N X X X N ++++++++++故2221234567222123456711()()2727[/[~(2)X X X X X X X X X X X X X X χ=++++++=++++++χ 10.证:由于1215,,,X X X 是取X 的样本,故1215,,,X X X 相互独立,且~(0,4)1,2,,i X N i = 从而有10152222111~(0,1)1,2,,152()~(10);()~(5)22ii i i i X N i X X ===χχ∑∑故101022111515221111()/102~(10,5)2()/52i ii i i i i i X XY F XX ======∑∑∑∑ 11.证:由于1234,,,X X X X 是取自总体X 的样本,故1234,,,X X X X 相互独立,且 2~(0,)1,2,3,4i X N i σ=从而有 ~(0,1)1,2,3,4iX N i σ=故22223124~(0,1);()()()~(3)X X X X N x σσσσ++~(3)Y t ==12.证:由于1210,,,X X X 是取X 的样本,故1210,,,X X X 相互独立,且~(0,1)1,2,,i X N i= 从而2345345~(0,()~(0,1)X X X N X X X N ++++根据§5. 3定理1可知 2222213453121()~(1),~(2)3Y X X X Y X X =++χ=+χ 根据§5. 4定理4可知1010222661[]~(4)5i i i i Y X X ===-χ∑∑根据2χ分布的可加性,得22123~(142)(7)Z Y Y Y =++χ++=χ 17.证:由题设 ,有222222()[()()][()()][()()2()()]()()2[()()]2(,)D X YE X Y E X Y E X EX Y EY E X EX Y EY X EX Y EY E X EX E Y EY E X EX Y EY DX DY Cov X Y +=+-+=-+-=-+-+--=-+-+--=++18.证:由题设 ,有*][]0E X E X E X =⋅-=22***2*222()()[]11()1DX EX EX EX X EX E E DX E X EX DX DX DX=-=-===-=⋅=19.证:由题设~()X t k ,根据定理2可设 2~(0,1),~()U N V k χ 则有X =从而 22/U Y X V k==又 22~(0,1)~(1)U N U ⇒χ故 2/1~(1,)/U Y F k V k=20.由题设 12~(,)X F k k ,根据定理3可设 2212~(),~()U k V k χχ从而 1122/~(,)/U k X F k k V k =故 2211/1~(,)/V k F k k X U k = 从而1212121211212121{(,)}11{}(,)11{}1(,)1(,)(,)1(,)(,)P X F k k P X F k k P X F k k F k k F k k F k k F k k αααααααααα-->=<=≥=-==三、证明题:.1.设总体~()X N μσ2,,证明:样本均值11~()n i i X X N n nσμ==∑2,。
2. 设总体~()X N μσ2,,证明:统计量~(0,1)u N =。
3. 设总体~()X N μσ2,,证明:统计量222211()~()nii Xn μσ=χ=-χ∑。
4. 设总体~()X N μσ2,,证明:统计量~(1)t t n =-。
5. 设总体211~()X N μσ,,总体222~()Y N μσ,,证明:统计量~(0,1)U N=。
6. 设总体211~()X Nμσ,,总体222~()Y Nμσ,,证明:统计量12~(2)T t n n=+-,其中wS=.7. 设总体211~()X Nμσ,,总体222~()Y Nμσ,,证明:统计量12212111122221221()~(,)1()niinjjXnF F n nYnμσμσ==-=-∑∑.8. 设总体211~()X Nμσ,,总体222~()Y Nμσ,,证明:统计量2211122222/~(1,1)/SF F n nSσσ=--.9. 设总体X ~ N(0,9),127,,,X X X是取自总体X的样本,证明:统计量2222123456711()()~(2)2736X X X X X X Xχ=++++++χ。
10. 设总体X ~ N(0,4),1215,,,X X X是取自总体X的样本,证明:统计量2221210222111215~(10,5)2()X X XY FX X X+++=+++。
11. 设总体~(0)X Nσ2,,1234,,,X X X X是取自总体X的样本,证明:统计量~(3)Y t=12. 设总体X ~ N(0,1),1210,,,X X X是取自总体X的样本,213451()3Y X X X=++,101022661[]5i ii iY X X===-∑∑,22312Y X X=+,123Z Y Y Y=++,证明:统计量2~(7)Zχ。
13. 设随机变量~()X t k ,证明:随机变量函数2~(1,)Y X F k =. 14. 若随机变量12~(,)X F k k ,证明:随机变量121~(,)Y F k k X=,从而有 12121(,)1/(,)F k k F k k αα-=.。