多元正态总体均值向量和协差阵的假设检验.
- 格式:doc
- 大小:574.50 KB
- 文档页数:13
第三章多元正态分布均值向量和协方差的检验
1.基本思想和步骤
2.均值向量的检验
(1)分布:设且X与S相互独立,,则称统计量的分布为非中心分布
当时,称服从(中心)分布,记为
(2)转换为F分布:若且X与S相互独立,令,则
3.一个正态总体均值向量的检验
(1)协差阵已知,检验统计量为
(2)协差阵未知,检验统计量为
4.两个正态总体均值向量的检验
设为来自p维正态总体的容量为n的样本,
为来自p维正态总体的容量为m的样本,且两组样本相互独立
①针对共同已知协差阵,检验统计量为
②针对共同未知协差阵,检验统计量为
(2)协差阵不等
①针对n=m的情形,检验统计量为
②针对n≠m的情形,检验统计量为
5.多个正态总体均值向量的检验
(1)单因素方差分析:设k个正态总体分别为,从k个总体中取个独立样本,,假设H0成立,检验统计量为
其中,组间平方和为,组内平方和为,总平方和为,其中,
(2)若,则为X的广义方差,为样本广义方差
(3)Wilks分布:若且二者相互独立,
为Wilks统计量,分布为Wilks分布,简记为
(4)多元方差分析:检验统计量为
其中,,A为组间离差阵,E为组内离差阵,T为总离差阵,且T=A+E
6.协差阵的检验
(1)一个正态总体协差阵的检验:构造检验统计量
(2)多个协差阵相等的检验:构造检验统计量。
第一章 多元正态分布的参数估计一、填空题1。
设X 、Y 为两个随机向量,对一切的u 、v,有 ,则称X 与Y 相互独立。
2。
多元分析处理的数据一般都属于 数据。
3.多元正态向量()'=p X X X ,,1 的协方差阵∑是 ,则X 的各分量是相互独立的随机变量。
4.一个p 元函数()p x x x f ,,,21 能作为pR 中某个随机向量的密度函数的主要条件是和 。
5.若p 个随机变量1X ,2X , ,p X 的联合分布等于 ,则称1X ,2X , ,p X 是相互独立的。
6。
多元正态分布的任何边缘分布为 。
7。
若()∑,~μp N X ,A 为p s ⨯阶常数阵,d 为s 维常数向量,则~d AX + 。
8.多元正态向量X 的任何一个分量子集的分布称为X 的 . 9.多元样本中,不同样品的观测值之间一定是 。
10。
多元正态总体均值向量和协差阵的极大似然估计量分别是 。
11.多元正态总体均值向量μ和协差阵∑的估计量X 、S n 11-具有 、 和 。
12.设X 和S 分别是多元正态总体()∑,μp N 的样本均值向量和离差阵,则~X ,X 和S 。
13。
若()()∑,~μαp N X ,n ,,2,1 =α且相互独立,则样本离差阵()()()()∑='--=nX X X X S 1~ααα .14.若()∑,~i p i n W S ,k i ,,1 =,且相互独立,则~21k S S S S +++= 。
二、判断题1。
多元分布函数()x F 是单调不减函数,而且是右连续的。
2.设X 是p 维随机向量,则X 服从多元正态分布的充要条件是:它的任何组合()p R X ∈'αα都是一元正态分布.3。
μ是一个P 维的均值向量,当A 、B 为常数矩阵时,具有如下性质: (1)E (AX )=AE (X ) (2)E (AXB)=AE (X )B4.若P 个随机变量X 1,…X P 的联合分布等于各自边缘分布的乘积,则称X 1,… X P 是相互独立的。
第三章 多元正态总体均值向量和协差阵的假设检验什么是假设检验及基本思想、计算步骤,在初等数理统计中都已做过介绍。
多元分析也涉及这方面内容,在后面介绍的常用各种统计方法,有时要对总体的均值向量和协差阵做检验,比如,对两个总体做判别分析时,事先就需要对两个总体的均值向量做检验,看看是否在统计上有显著差异,否则做判别分析就毫无意义。
本章类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。
不论做上述任何检验,其基本步骤均可归纳为四步:第一步,提出待检验的假设0H 和1H 。
第二步,给出检验的统计量及它服从的分布。
第三步,给定检验水平a ,查统计量的分布表,确定临界值a λ,从而得到否定域。
第四步根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设检验做出决策(拒绝或接受)。
由于各种检验的计算步骤类似,关键在于对不同的检验给出不同的统计量,而有关统计量的给出大多用似然比方法得到。
本章只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例。
同时为了说明统计量的分布,自然地给出HotellingT 2分布和Wilks 分布的定义,它们分别是一元统计中t 分布和F 分布的推广。
§3.1 均值向量的检验为了对多元正态总体均值向量作检验,首先需要给出HotellingT 2分布的定义。
1 HotellingT 2分布定义 设),(~),,(~∑∑n W S N X p p μ且X 与S 相互独立,p n ≥,则称统计量X S X n T 12-'=的分布为非中心HotellingT 2分布,记为),,(~22μn p T T 。
当0=μ时,称2T 服从(中心)HotellingT 2分布,记为),(2n p T ,由于这一统计量的分布首先由Harold Hotelling 提出来的,故称为HotellingT 2分布,值得指出的是,我国著名统计学家许宝马录先生在1938年用不同方法也导出T 2分布的密度函数,因表达式很复杂,故略去。
在一元统计中,若n X X ,,1 来自总体),(2σμN 的样本,则统计量:)1(~ˆ)(--=n t X n t σμ分布 其中212)(11ˆ∑=--=ni i X X n σ显然,)()ˆ()(ˆ)(12222μσμσμ-'-=-=-X X n X n t 与上边给出的T 2统计量形式类似,且⎪⎪⎭⎫ ⎝⎛-n N X 2,0~σμ。
可见,T 2分布是一元统计中t 分布的推广。
基本性质:在一元统计中,若统计量)1(~-n t t 分布,则)1,1(~2-n F t 分布,即把t 分布的统计量转化为F 统计量来处理,在多元统计分析中T 2统计量也具有类似的性质。
定理 若),(~),,0(~∑∑n W S N X p p 且X 与S 相互独立,令X S X n T 12-'=,则)1,(~12+-+-p n p F T npp n 这个性质在后面经常用到。
2 均值向量的检验设p 元正态总体),(∑μp N ,从总体中抽取容量为n 的样本∑∑=='--==ni ni i i i n X X X X S X n X X X X 11)()()()()2()1())((,1,,,, 。
(1)∑已知时均值向量的检验01000:H )(:μμμμμ≠=为已知向量H检验统计量:)(~)()(201020p X X n T χμμ-∑'-=-(在H 0成立时)给出检验水平a ,查2χ分布表使{}a T P a =>λ20,可确定出临界值a λ,再用样本值计算出20T ,若a T λ>20,则否定H 0,否则H 0相容。
这里要对统计量的选取作两点解释,一是说明它为什么取为这种形式。
二是说明它为什么服从)(2p χ分布。
一元统计中,当2σ已知时,作均值检验所取的统计量为:)1,0(~0N nX U σμ-=显然,)())(()(01202202μσμσμ--=-=-X X n X n U与上边给出的检验统计量20T 形式相同。
另外根据二次型分布定理:若),0(~∑p N X ,则)(~21p X X E X -'。
显然,1001020)()()(--∑'-=-∑'-=μμμX n X X n T )(0μ-X nY Y 1-∑'∆。
其中,),0(~)(0∑-=p N X n Y μ,因此,)(~)()(201020p X X n T χμμ-∑'-=-。
(2)∑未知时均值向量的检验 00:μμ=H 01:μμ≠H 检验统计量: ),(~)1(1)1(2p n p F T p n p n --+--(在H 0成立时)其中[])()()1(01'02μμ---=-X n SX n n T给定检验水平a ,查F 分布表,使a F T p n p n p a =⎭⎬⎫⎩⎨⎧>--2)1(,可确定出临界值a F ,再用样本值计算出2T ,若a F T pn p n >--2)1(,则否定0H ,否则0H 相容。
这里需要解释的是,当∑未知时,自然想到要用样本协差阵S n 11-去代替∑,因(n-1)S -1是1-∑的无偏估计量,而样本离差阵),1(~)()()(1)(∑-'--=∑=n W X X X XS p a nx a),0(~)(0∑-p N X n μ[]),(~)()()1(T 20102p n p T X n S X n n --'--=∴-μμ再根据Hotelling T 2分布性质,所以),(~)1(1)1(2p n p F T p n p n --+--3 协差阵相等时,两个正态总体均值向量的检验 设n ,1, ),(~),,,(121)( =∑'=αμp ap a a a N X X X X m ,1, ),(~),,,(221)( =∑'=αμp ap a a a N Y Y Y Y且两组样本相互独立,∑∑====mi i ni i Y m Y X nX 1)(1)(1,1。
(1)有共同已知协差阵时210:μμ=H211:μμ≠H检验统计量:)(~)()(2_1,2p Y Y X mn m n T X χ----+⋅=∑ (在H 0成立时)给出检验水平a ,查)(2p x 分布表使{}a T P a =>λ2,可确定出临界值a λ,再用样本值计算出20T ,若a T λ>20,则否定H 0,否则H 0相容。
在一元统计中作均值相等检验所给出的统计量:)1,0(~22N mnYX U σσ+-=显然,222222)()()(Y X m n mn mnY X U -+⋅=+-=σσσ )1(~)()()(212,χσY X Y X mn mn --+⋅=- 此式恰为上边统计量当1=p 时的情况,不难看出这里给出的检验统计量是一元情况的推广。
(2)有共同的未知协差阵0>∑时210:μμ=H 211:μμ≠H 检验统计量:)1,(~)2(1)2(2--+-++--+=p m n p F T pm n p m n F(在H 0成立时)其中:⎥⎦⎤⎢⎣⎡-+⋅⎥⎦⎤⎢⎣⎡-+⋅-+=-)()()2(1'2Y X m n m n S Y X m n m n m n T21S S S +='21'1)()(1),,,(X ,))((p na a a X X X X X X X S =--=∑='21'1)()(2),,,(Y ,))((Y Y Y Y Y Y Y S ma a a =--=∑=给定检验水平α,查F 分布表使{}α=>a F F P ,可确定出a F ,再用样本值计算出F ,若αF F 〉,则否定H 0,否则H 0相容。
当两个总体的协差阵未知时,自然想到用每个总体的样本协差阵111S n -和211S m -去代替,而),1(~)()()(1)(1∑-'--=∑=n W X X X X S p na a α),1(~)()()(1)(2∑-'--=∑=m W Y Y Y Y S p ma a α从而),2(~21∑-++=m n W S S S p 所以)1,(~)2(1)2(2--+-++--+p m n p F T m n p m n下述假设检验统计量的选取和前边统计量的选取思路是一样的,以下只提出待检验的假设,然后给出统计量及其分布,为节省篇幅,不做重复的解释。
4 协差阵不等时,两个正态总体均值向量的检验 设n ,1, ),(~),,,(1121)( =∑'=αμp ap a a a N X X X X m ,1, ),(~),,,(2221)( =∑'=αμp ap a a a N Y Y Y Y且两组样本相互独立,0,021>∑>∑210:μμ=H211:μμ≠H分两种情况 (1)n = m 令n ,1,i )()()( =-=i i i Y X ZY X ZnZ ni i -==∑=1)(1∑=--=nj j j Z Z Z Z S 1')()())((∑=+--+--=nj i j i j Y X Y X Y X Y X1')()()()())((检验统计量:),(~)(1'p n p F Z S Z pn p n F --=- (在H 0成立时) (2),m n ≠不妨假设m n < 令∑∑==-⋅+-=nj m j j j i i i Y m Y m n Y m n X Z 11)()()()()(11 n i ,,1 =Y X ZnZ ni i -==∑=1)(1∑='--=ni i i Z Z Z ZS 1)()())((∑∑==⎥⎥⎦⎤⎢⎢⎣⎡---=ni nj j i i Y n Y m n X X 11)()()()1()('⎥⎥⎦⎤⎢⎢⎣⎡---⋅∑=)1()(1)()()(n j j i i Y n Y m nX X 检验统计量:),(~)(1'p n p F Z S Z pn p n F --=- 5 多个正态总体均值向量的检验(多元方差分析)多元方差分析是一元方差分析的推广。
为此先复习一下一元方差分析,之后为了对多个正态总体均值向量作检验,自然地先给出Wilks 分布的定义。
(1)复习一元方差分析(单因素方差分析) 设k 个正态总体分别为),(,),,(221σμσμk N N ,从k 个总体取n i 个独立样本如下:)1(1)1(2)1(1,,,n X X X…… )()(2)(1,,,k nk k k X X Xk H μμμ=== 210: H 1:至少存在j i ≠使j i μμ≠检验统计量:),1(~1k n k F k n SSE k SSA F ----=(在H 0成立时)其中21)(X Xn SSA iki i -=∑=……组间平方和∑∑==-=k i n j i i j iX X SSE 112)()(……组内平方和∑∑==-=ki n j i jiX XSST 112)()(……总平方和∑==in j i ji i Xn X 1)(1 ∑∑===ki n j i jiXnX 11)(1k n n n ++= 1给定检验水平α, 查F 分布表使{}α=>a F F p ,可确定出临界值αF ,再用样本值计算出F 值,若a F F >则否定H 0,否则H 0相容。