- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的分布密度函数为
f (x1, x2 ,, xp )
1
p
1
exp[
1 (x a)' 1(x a)] 2
(2 ) 2 | |2
其中 a a1 a2 ap ' ( i j ) p p 为对称正定矩阵,
则称 服从p维正态分布。记作: ~ N p a,
1、Wishart分布
(1) Wishart分布由Wishart在1928年推导出来。
Def : 设X i X i1, X i2 ,, X ip ~ N p 0, ,i 1,2,, n,
4.多元样本的相关概念
从多元总体中随机抽取n个个体。
X 1, X 2,, X n i.i.d. 简单随机样本
X a1
X a
X
a2
(a 1,2,, n) X1 X2 X p
X ap
观测矩阵(随机)
X11 X12 X1p X 1
(2)协方差矩阵
设 X ( X1, X 2 ,, X p ),Y (Y1,Y2 ,,Yq ) 称
DX
EX
EX X
EX
11 12 1p
21
22
2p
ij
p p
p1 p2 pp
X2
X i1
X1
Xi1 X 1 Xi2 X 2 2
Xi2 X 2
Xi1 X 1
X ip X p
Xi2
X 2 X ip
X
p
Xip X p Xi1 X 1 Xip X p Xi2 X 2 Xip X p Xip X p
X i X
X i X vij p p
(4) 样本相关阵
Rp p rij p p
非负定矩阵
其 中rij
vij
vii v jj
sij sii s jj
----样本相关系数
第二节 多元正态分布
1. 多元正态分布
若随机向量 1 2 p '
2
EX p p
EXi xi f (x1, x2,, xp )dx1dx2 dxp
(i 1,2,, p)
均值向量具有如下性质:
(1)E(AX ) AE(X ); (2)E(AXB) AE(X )B; (3)E(AX BY) AE(X ) BE(Y )
多元统计分析简介
多元统计分析:通过对多个随机变量 观测数据的分析,来研究变量之间的 相互关系以及解释这些变量内在的变 化规律。
一元统计分析——一个随机变量的 统计规律
多元统计分析——多个随机变量之间的 相互依赖关系及内在统计规律性
多元统计分析应用:
经济学、工业、农业、医学、教育学、 生态学、地质学、社会学、考古学、环境 学、气象、文学等许多领域
X 22
X2p
X 2
X n1 X n2 X np
样本平均值是n个 样本点的重心
X 1 n
X n 1 n
n
1
X i n
i 1
1
n i 1 n i 1
n
X i1
Cov( X 2 ,Y1)
Cov( X 2 ,Y2 ) Cov( X 2 ,Yq )
Cov( X p ,Y1) Cov( X p ,Y2 ) Cov( X p ,Yq )
若CovX ,Y 0,则称X和Y不相关,由X和Y相互 独立可以推出CovX ,Y 0,即X和Y不相关;
多元统计分析主要内容:
1、多元正态总体的参数估计和假设检验 2、常用的处理多元数据的统计方法:
1)聚类分析 2)判别分析 3)主成分分析 4)因子分析 5)多重多元回归分析等等
第一章 多元统计中的基本概念
第一节 基本概念 第二节 多元正态分布 第三节 多元统计中的常用分布
第一节 基本概念
1.随机向量
X 1
X
i2
X
2
X
p
n i1 X ip
(2) 样本离差阵
n
S p p X i X X i X sij p p
i 1
n
X i X X i X
但反过来一般不成立。
协差阵具有如下性质:(试证之)
(1)D( X ) 0;即X的协差阵非负定 (2)对常数向量a,有D( X a) D( X ) (3)D( AX ) AD( X ) A (4)Cov( AX , BY) ACov( X ,Y )B
3.多元总体
多元分析研究具有多个(如p个)属性(指标)的对象组成的 总体--多元总体。
Def3:若p个随机变量 X1, X 2,, X p 的联合分布等于 各自的边缘分布的乘积,则称 X1, X 2,, X p 是相互独立的。
2.随机向量的数字特征
(1)数学期望
其中,
X1
X
X2
X p
EX1 1
EX
EX2
从总体中任意抽出一个对象(总体单元),其p个属性的值
为∶
X1
X
X
2
X p
X i 为一维随机变量 (i 1,2,, p)
X 为多维随机变量
(随机向量)
多元总体∶多维随机变量(随机向量)可能取值的全体。
多元分析的任务∶分析各变量之间的关系,推断总体的性质
(样本资料阵) 多元分析的
X
X 21
X 22
X2
p
X 2
研究对象
X n1 X n2 X np X n
(1) 样本平均值
X11 X12 X1p X 1
X
X 21
)
分布密度函数应满足的两个条件?
Def2:设 X ( X1, X 2,, X p ) 是p维随机向量,称由它 的q(q<p)个分量组成的子向量 X i (Xi1, Xi2,, Xiq ) 的
分布为X 的边缘分布,相对的把 X 的分布称为联合分布。
边缘分布函数和边缘分布密度可由联合分布和联合 密度确定。
其 中 ,Z1,Z2,,Zn1i.i.d.N p 0,
(3) X和S相 互 独 立;
分布?
第三节 多元统计中的常用分布
在一元统计中,卡方分布、t分布和F分布 在参数估计和假设检验中起着非常重要的作用。 在多元统计中,他们分别发展为Wishart分布、 Hotelling-T2分布和Wilks分布,在多元参数估 计和假设检验中占有非常重要的地位。
1
2 1 2
1 2
exp{
2(1
1
2
)
[
(
x1
1
2 1
)2
2 ( x1
1)(x2 21 2
2)
(x2 2 )2
2
2 1
]}
2. 多元正态分布的常用性质
和的参数估计
设X 1, X 2,, X n来 自正 态 总 体N p (, )容 量为n的
分布密度函数∶ f (x) f (x1, x2 ,, xp )
x
满足
F(x) f ( y)dy
xp x1
F(x1, x2,, xp ) f ( y1, y2,, yp )dy1dy2 dyp
f
(x1,
x2
,,
xp
)
p
F(x1, x2,, xp x1x2 xp
其数学期望与协方差矩阵分别为: E a D
特
别
,
当a
0,0,,0,
I
时
p
,
称服 从 多 元 标 准 正 态 分 布。
特例1(一元正态分布) a ( 2 )
则
f (x)
1
2
exp[
(x )2 2 2
]
特例2 (二元正态分布)
样本均值和样本离差阵的矩阵表示:
X
p1
1 n
X
1n
S
X
In
1 n
1n1n
X
n
S pp X i X X i X
i 1
X X nX X
(3) 样本协差阵
Vpp
1
n
S
1 n
n i 1
简单样本,每个样品X i X i1, X i2,, X ip ,i 1.2,, n
样本资料阵为:
X11 X12 X1p