多元正态均值向量和协方差矩阵的检验
- 格式:ppt
- 大小:3.99 MB
- 文档页数:94
第一章 多元正态分布的参数估计一、填空题1.设X 、Y 为两个随机向量,对一切的u 、v ,有 ,则称X 与Y 相互独立。
2.多元分析处理的数据一般都属于 数据。
3.多元正态向量()'=p X X X ,,1 的协方差阵∑是 ,则X 的各分量是相互独立的随机变量。
4.一个p 元函数()p x x x f ,,,21 能作为p R 中某个随机向量的密度函数的主要条件是 和 。
5.若p 个随机变量1X ,2X , ,p X 的联合分布等于 ,则称1X ,2X , ,p X 是相互独立的。
6.多元正态分布的任何边缘分布为 。
7.若()∑,~μp N X ,A 为p s ⨯阶常数阵,d 为s 维常数向量,则~d AX + 。
8.多元正态向量X 的任何一个分量子集的分布称为X 的 。
9.多元样本中,不同样品的观测值之间一定是 。
10.多元正态总体均值向量和协差阵的极大似然估计量分别是 。
11.多元正态总体均值向量μ和协差阵∑的估计量X 、S n 11-具有 、 和 。
12.设X 和S 分别是多元正态总体()∑,μp N 的样本均值向量和离差阵,则~X ,X 和S 。
13.若()()∑,~μαp N X ,n ,,2,1 =α且相互独立,则样本离差阵()()()()∑='--=nX X X X S 1~ααα 。
14.若()∑,~i p i n W S ,k i ,,1 =,且相互独立,则~21k S S S S +++= 。
二、判断题1.多元分布函数()x F 是单调不减函数,而且是右连续的。
2.设X 是p 维随机向量,则X 服从多元正态分布的充要条件是:它的任何组合()p R X ∈'αα都是一元正态分布。
3.μ是一个P 维的均值向量,当A 、B 为常数矩阵时,具有如下性质:(1)E (AX )=AE (X ) (2)E (AXB )=AE (X )B4.若P 个随机变量X 1,…X P 的联合分布等于各自边缘分布的乘积,则称X 1,… X P 是相互独立的。
第一章 多元正态分布的参数估计一、填空题1。
设X 、Y 为两个随机向量,对一切的u 、v,有 ,则称X 与Y 相互独立。
2。
多元分析处理的数据一般都属于 数据。
3.多元正态向量()'=p X X X ,,1 的协方差阵∑是 ,则X 的各分量是相互独立的随机变量。
4.一个p 元函数()p x x x f ,,,21 能作为pR 中某个随机向量的密度函数的主要条件是和 。
5.若p 个随机变量1X ,2X , ,p X 的联合分布等于 ,则称1X ,2X , ,p X 是相互独立的。
6。
多元正态分布的任何边缘分布为 。
7。
若()∑,~μp N X ,A 为p s ⨯阶常数阵,d 为s 维常数向量,则~d AX + 。
8.多元正态向量X 的任何一个分量子集的分布称为X 的 . 9.多元样本中,不同样品的观测值之间一定是 。
10。
多元正态总体均值向量和协差阵的极大似然估计量分别是 。
11.多元正态总体均值向量μ和协差阵∑的估计量X 、S n 11-具有 、 和 。
12.设X 和S 分别是多元正态总体()∑,μp N 的样本均值向量和离差阵,则~X ,X 和S 。
13。
若()()∑,~μαp N X ,n ,,2,1 =α且相互独立,则样本离差阵()()()()∑='--=nX X X X S 1~ααα .14.若()∑,~i p i n W S ,k i ,,1 =,且相互独立,则~21k S S S S +++= 。
二、判断题1。
多元分布函数()x F 是单调不减函数,而且是右连续的。
2.设X 是p 维随机向量,则X 服从多元正态分布的充要条件是:它的任何组合()p R X ∈'αα都是一元正态分布.3。
μ是一个P 维的均值向量,当A 、B 为常数矩阵时,具有如下性质: (1)E (AX )=AE (X ) (2)E (AXB)=AE (X )B4.若P 个随机变量X 1,…X P 的联合分布等于各自边缘分布的乘积,则称X 1,… X P 是相互独立的。
多元统计分析——均值向量和协方差阵检验均值向量检验是评估两个或多个总体均值是否相等的方法。
在多元统计分析中,均值向量检验常用于比较不同组别或条件下的均值是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的均值向量可以表示为一个p维的向量。
我们的目标是比较这k个均值向量是否相等。
常用的均值向量检验方法有Hotelling's T-squared统计量和Wilks' Lambda统计量。
Hotelling's T-squared统计量是基于方差-协方差阵的一个推广,它考虑了样本组别的大小和协方差结构。
它的计算公式为:T^2=n(p-k)/(k(n-1))*(x1-x)^TS^(-1)(x1-x)其中,n是每个组别的观测数,p是变量的个数,k是组别的个数,x1是第一个组别的均值向量,x是总体均值向量,S是协方差阵。
T^2的分布是一个自由度为k,维度为p的非中心F分布。
Wilks' Lambda统计量是基于协方差阵的特征值的一个变换,它的计算公式为:Lambda = ,W,/,B其中,W是所有组别的散布矩阵(Within-groups scatter matrix),B是总体的散布矩阵(Between-groups scatter matrix)。
Wilks' Lambda的分布是一个自由度为k和n-k-1的F分布。
协方差阵检验是评估两个或多个总体协方差阵是否相等的方法。
在多元统计分析中,协方差阵检验常用于比较不同组别或条件下的变量之间的协方差结构是否有差异。
假设有k个样本组别,每个组别有n个观测值,那么总共有nk个观测值。
假设每个观测值有p个测量变量,那么每个样本组别的协方差阵可以表示为一个p维的矩阵。
我们的目标是比较这k个协方差阵是否相等。
常用的协方差阵检验方法有Hotelling-Lawley's Trace统计量和Pillai-Bartlett's Trace统计量。
第二章 多元正态分布均值向量和协差阵的检验一、填空题1.在一个正态总体均值向量的假设检验中,在∑已知的情况下,构造的检验统计量为 ,服从 分布;在∑未知的情况下,构造的检验统计量为 ,服从 分布。
2.若()∑,0~p N X ,()∑,~n W S p ,且X 与S 相互独立,令X S X n T 12-'=,则~12T np p n +- 。
3.若()∑,~μp N X ,()∑,~n W S p ,且X 与S 相互独立,p n ≥,则称统计量X S X n T 12-'=的分布为 分布,记为 。
4.在两个正态总体均值向量的假设检验中,假定其协差阵∑相等,则在∑已知的情况下,构造的统计量为 ,服从的分布为 ;在∑未知的情况下,构造的检验统计量为 ,服从的分布为 。
二、判断题1.设()∑,~μp N X ,()∑,~n W Sp ,p n ≥,则称统计量X S X n T 12-'=的分布为非中心2HotellingT 分布,记为()μ,,~22n p T T 。
2.在协差阵∑未知的情况下对均值向量进行检验,需要用样本协差阵S n 1去代替∑。
3.2HotellingT 分布是一元统计分布中t 分布的推广。
4.在一个正态总体均值向量的假设检验中,在∑已知的情况下,构造的检验统计量服从2HotellingT 分布。
5.在一个正态总体均值向量的假设检验中,在∑未知的情况下,构造的检验统计量服从2χ分布。
6.在两个正态总体均值向量的假设检验中,假定其协差阵∑相等,则在∑已知的情况下,构造的统计量服从多元正态分布。
7.在两个正态总体均值向量的假设检验中,假定其协差阵∑相等, 在∑未知的情况下,构造的检验统计量服从2HotellingT分布。
三、简答题1.试述多元统计分析中的各种均值向量和协差阵检验的基本思想和步骤。
2.试述多元统计分析中2HotellingT分布和一元统计中t分布的关系。
第三章 多元正态分布均值向量和协差阵的检验中统计量汇总一、单个正态总体(),p N ∑μ均值向量的检验 (1)已知总体协方差阵∑100::μμμμ≠=H H ,,在0H 成立的条件下,212000()()~()T n p χ-'=--X μΣX μ,拒绝域:220()T p αχ>.(2)未知总体协方差阵∑0100::μμμμ≠=H H ,在0H 成立的条件下,21000(1)()()~(,)()n pT n F p n p n p --'=----X μV X μ.拒绝域:20(1)(,)()n pT F p n p n p α->--.二、两个正态总体(1122(,)(,)p p N N ∑∑μμ和)均值向量的检验 (1) 当协方差阵相等时(12∑=∑),两个正态总体均值向量的检验012112::H H =≠μμμμ,,在0H 成立的条件下210(2)()()(,1)(1)nm n m pT V F p n m p n m n m p -+-'=--+--++--X Y X Y . 拒绝域:2(2)(,1)(1)n m pT F p n m p n m p α+->+--+--.(2) 当协方差阵不相等时,两个正态总体均值向量的检验 n m =(成对检验)012112::H H =≠μμμμ,,令,1,2,,i i i i n =-=Z X Y ,此时假设检验问题转换为01:0:0H H =≠Z Z μμ,,在0H 成立的条件下,210(1)~(,)()n pT n F p n p n p --'=--Z Z V .拒绝域: 20(1)(,)()n pT F p n p n p α->--n m ≠,在此,我们不妨假设m n <,令()()()()()1111nmi i i i i j j n m m n m ===-+-⋅∑∑Z X Y Y Y n i ,,2,1 =. Y X Z Z -==∑=ni i n 1)(1.()()1()()ni i i ='=--∑S Z Z Z Z()()()()()()11111()()()()nnn i i j i i ji j j n n m n m n ==='⎡⎤⎡⎤=---⋅---⎢⎥⎢⎥⎣⎦⎣⎦∑∑∑X X Y Y X X Y Y 假设0H 成立时,构造检验统计量为1()~(,)n p nF F p n p p-'=--Z S Z . 或 210(1)~(,)()n pT n V F p n p n p -'=---Z Z ,这里1V n =-S . 拒绝域: 20(1)(,)()n pT F p n p n p α->--.三、多个正态总体均值向量的检验第一个总体: (1)(1)(1)(1)12(,,,)i i i ip X X X =X ,1,,2,1n i =, 第二个总体: (2)(2)(2)(2)12(,,,)ii i ip X X X =X ,2,,2,1n i =,…… …… …… 第k 个总体: ()()()()12(,,,)k k k k i i i ip X X X =X ,k n i ,,2,1 =, 全部样品的总均值向量:()()111r n k r i r i n ===∑∑X X .各总体样品的均值向量:()()()11r n r r i i r n ==∑X X ,1,2,,r k = .组间离差阵: ()()1()()kr r r r n ='=--∑A XX X X .组内离差阵: ()()()()()()11()()rn k r r r r i i r i =='=--∑∑E X X X X .总离差阵: ()()()()11()()rn k r r i i r i =='=--∑∑T XX X X .012k H ===μμμ :,在0H 成立时,ET∧=服从Wilks 分布(,,1)p n k k ∧--.表 Λ与F 统计量的关系p n k - 1k - F 统计量及分别任意 任意 1()11~(,1)n k p F p n k p p --+-Λ⋅--+Λ任意 任意 2 ()11~(2,2(1))n k p F p n k p p --+-Λ⋅--+Λ1 任意 任意 1~(1,)1n k F k n k k --Λ⋅---Λ 2任意任意11~(2(1),2(1))1n k F k n k k ---Λ⋅----Λ在这里我们特别要注意,Wilks 分布表也可用2χ分布或F 分布来近似,巴特莱特(Bartlett )提出了用2χ分布来近似.设~(,,1)p n k k ΛΛ--,令 (1()2)ln ln t V n p k -=---+Λ=Λ. 则V 近似服从2((1))p k χ-分布。
第二章多兀正态总体均值向量和协差阵的假设检验什么是假设检验及基本思想、计算步骤,在初等数理统计中都已做过介绍。
多元分析也涉及这方面内容,在后面介绍的常用各种统计方法,有时要对总体的均值向量和协差阵做检验,比如,对两个总体做判别分析时,事先就需要对两个总体的均值向量做检验,看看是否在统计上有显著差异,否则做判别分析就毫无意义。
本章类似一元统计分析中的各种均值和方差的检验相应给出多元统计分析中的各种均值向量和协差阵的检验。
不论做上述任何检验,其基本步骤均可归纳为四步:第一步,提出待检验的假设H0和H1。
第二步,给出检验的统计量及它服从的分布。
第三步,给定检验水平a,查统计量的分布表,确定临界值匕,从而得到否定域。
第四步根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设检验做出决策(拒绝或接受) 。
由于各种检验的计算步骤类似,关键在于对不同的检验给出不同的统计量,而有关统计量的给出大多用似然比方法得到。
本章只侧重于解释选取统计量的合理性,而不给出推导过程,最后给出几个实例。
同时为了说明统计量的分布,自然地给出HotellingT 2分布和Wilks分布的定义,它们分别是一元统计中t分布和F分布的推广。
§ 3.1均值向量的检验为了对多元正态总体均值向量作检验,首先需要给出Hotelli ngT2分布的定义。
1 HotellingT2分布定义设X〜N p(~[),S〜W p( n, Z)且X与S相互独立,n _p,则称统计量T2二nXS’X的分布为非中心Hotelli ngT 2分布,记为T2~T2(p ,n』)。
当—0时,称T2服从(中心)Hotelli ngT 2分布,记为T 2( p, n),由于这一统计量的分布首先由Harold Hotelling提出来的,故称为HotellingT 2分布,值得指出的是,我国著名统计学家许宝马录先生在1938年用不同方法也导出T2分布的密度函数,因表达式很复杂,故略去。