- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
P(X ≤ x, Y ≤ y) = P(X ≤ x)P(Y ≤ y)
(1.3)
成立。 对一切(X , Y)成立。若 F(x, y)为(X , Y)的联合分布函 的分布函数, 数, (x) 和H(y)分别为 X 和 Y 的分布函数,则 X 与 Y独立 G ( (x, y) Gg )Hh( y 1.4) 当且仅当 Ff x, y) = = (x(x)( y) ) (1.4) 若 (X , Y)有密度 f (x, y),用g(x) 和h(y) 分别表示 X 和 Y 的分布密度, 的分布密度,则 X 和 Y 独立当且仅当 (1.5) 注意:在上述定义中, 和 Y 的维数一般是不同的。 注意:在上述定义中, 的维数一般是不同的。 X
2011-11-27 14
目录 上页 下页 返回 结束
§1.1.4 随机向量的数字特征
(3)设X为n ) 为 维随机向量,期望和协方差存在记 维随机向量,
µ = E(X), Σ = D(X) , A为 ×n常 阵 则 n 数 ,
E(X A ) =tr(AΣ) +µ' Aµ ' X
来说, 对于任何随机向量 X = (X1, X2,⋯ X p )' 来说, , 其协差阵∑都是对称阵,同时总是非负定( 其协差阵∑都是对称阵,同时总是非负定(也称 半正定) 大多数情形下是正定的。 半正定)的。大多数情形下是正定的。
d(0, p) = (x + x )
2 1
2 1/ 2 2
(1.14)
2011-11-27
19
目录 上页 下页 返回 结束
§1.2 统计距离和马氏距离
但就大部分统计问题而言,欧氏距离是不 能令人满意的。这里因为,每个坐标对欧氏距 离的贡献是同等的。当坐标轴表示测量值时, 它们往往带有大小不等的随机波动,在这种情 况下,合理的办法是对坐标加权,使得变化较 大的坐标比变化小的坐标有较小的权系数,这 就产生了各种距离。 欧氏距离还有一个缺点,这就是当各个分量 为不同性质的量时,“距离”的大小竟然与指 标的单位有关。
第一章
多元正态分布
多元正态分布是最常用的一种多元 概率分布。除此之外, 概率分布。除此之外,还有多元对数正 态分布,多项式分布,多元超几何分布, 态分布,多项式分布,多元超几何分布, 2 χ 、多元 β 分布、 分布、 多元 分布 分布、多元指数 分布等。 分布等。本章从多维变量及多元分布的 基本概念开始, 基本概念开始,着重介绍多元正态分布 的定义及一些重要性质。 的定义及一些重要性质。
cov( X,Y) = (cov( Xi ,Yj )), i =1 ⋯ n; j =1 ⋯ p , , , ,
若cov( X,Y) = 0 称 和 是 相 的 , X Y 不 关 。
(1.10)
当A、B为常数矩阵时,由定义可推出协差阵有如下性质: 为常数矩阵时,由定义可推出协差阵有如下性质:
D(AX) = AD(X)A' = AΣA' cov( AX, B ) = Acov( X,Y)B' Y
j =1 2,⋯p ,
表示对 j 第个变量 x j 的n次观测数值。下面为表1-1 次观测数值。下面为表1
变量 序号 1 2
x np
…
x11 x21
⋮
x12 x22
⋮
… … …
x1p x2 p
⋮
⋮
n
2011-11-27
xn1
xn2
xnp
7
目录 上页 下页 返回 结束
§1.1.1 随机向量
• 因此,样本资料矩阵可用矩阵语言表示为: 因此,样本资料矩阵可用矩阵语言表示为:
2011-11-27 17
目录 上页 下页 返回 结束
§1.2 统计距离和马氏距离
欧氏距离 马氏距离
2011-11-27
18
目录 上页 下页 返回 结束
§1.2 统计距离和马氏距离
欧氏距离
在多指标统计分析中,距离的概念十分重要,样品间的不 少特征都可用距离去描述。大部分多元方法是建立在简单 的距离概念基础上的。即平时人们熟悉的欧氏距离,或称 直线距离.如几何平面上的点p=(x1,x2)到原点O=(0,0) O=(0,0)的 O=(0,0) 欧氏距离,依勾股定理有
称它为 p 维随机向量 X 的协方差阵,简称为 X 的协 方差阵。称 cov( X, X)为 X 的广义方差,它是协差阵的行 列式之值。
2011-11-27 13
目录 上页 下页 返回 结束
§1.1.4 随机向量的数字特征
3、随机向量X 和Y 的协差阵
设 X = (X1, X2 ,⋯, Xn )' 和Y = (Y1,Y2 ,⋯,Yp )' 分别为 n 维和 p 维随机向量, 维随机向量,它们之间的协方差阵定义为一个 n× p矩 , 阵,其元素是 cov( Xi ,Yj ) 即
定义1.1 个随机变量, 定义1.1 设 x1 , x 2 , ⋯ , x p为p个随机变量,由它们组成 个随机变量 称为随机向量。 的向量 ( x1 , x 2 , ⋯ , x p ) ′ 称为随机向量。
2011-11-27 8
目录 上页 下页 返回 结束
§1.1.2 分布函数与密度函数
描述随机变量的最基本工具是分布函数, 描述随机变量的最基本工具是分布函数,类似地描述 随机向量的最基本工具还是分布函数。 随机向量的最基本工具还是分布函数。 定义1.2 是以随机向量, 定义1.2 设 X = (x1 , x 2 ,⋯ , x p )′ 是以随机向量,它的多元分布 函数是
X∗ = j X j − E(X j ) (var X j )
1/2
j =1 ⋯ p , ,
(1.12)
∗ ∗ ∗ X = (X1 , X2 ,⋯ X∗ ) , p
于 是
∗ E(X ) = 0 ∗ D(X ) = corr(X = R )
即 准 数 的 差 正 是 指 的 关 . 标 化 据 协 阵 好 原 标 相 阵 1 ∗ ∗ R= X /X (1.13) n −1
2011-11-27
15
目录 上页 下页 返回 结束
§1.1.4 随机向量的数字特征
4、随机向量X 的相关阵 若随机向量 X = (X1, X2,⋯, X p )' 的协差阵存在,且每 个分量的方差大于零,则X的相关阵定义为:
R = (corr(Xi , X j )) = (r )P×P ij r = ij CO (Xi , X j ) V D(X i) D(X j ) ,i, j =1 2,⋯ p , , (1.11)
多元统计分析
何晓群
中国人民大学出版社
2011-11-27 1
第一章 多元正态分布
§1.1 §1.2 §1.3 §1.4 §1.5 多元分布的基本概念 统计距离和马氏距离 多元正态分布 均值向量和协方差阵的估计 常用分布及抽样分布
2011-11-27
2
目录 上页 下页 返回 结束
第一章
多元正态分布
• 一元正态分布在统计学的理论和实际应 用中都有着重要的地位。同样,在多变 量统计学中,多元正态分布也占有相当 重要的位置。原因是: • 许多随机向量确实遵从正态分布,或近 似遵从正态分布; • 对于多元正态分布,已有一整套统计推 断方法,并且得到了许多完整的结果。
2011-11-27 3
目录 上页 下页 返回 结束
§1.1.2 分布函数与密度函数
, 定义1.3:设 X ~ F(X) = F(x1, x2 ,⋯ xp ) ,若存在一个 非负的函数 f (⋅) ,使得
F(x) = ∫ ⋯∫
−∞ x1 xp −∞
f (t1,⋯ p )dt1⋯dt p , t
(1.2)
p 对一切 x∈R 成立,则称 X(或 F( X) )有分布 成立, 密度 f (⋅) 并称 X 为连续型随机向量。 为连续型随机向量。
假定所讨论的是多个变量的总体, 假定所讨论的是多个变量的总体,所研究的数 个指标(即变量), ),又进行了 据是同时观测 p个指标(即变量),又进行了 n次 观测得到的, , 观测得到的,把这 p 个指标表示为 X1, X2 ,⋯ X p常 用向量
X = (X1, X2,⋯ X p )' ,
个变量。 表示对同一个体观测的 p 个变量。若观测了 n 个个体,则可得到如下表1 的数据, 个个体,则可得到如下表1-1的数据,称每一个个 个变量为一个样品, 体的 p个变量为一个样品,而全体 n个样品形成一 个样本。 个样本。
2011-11-27 6
目录 上页 下页 返回 结束
§1.1.1 随机向量
横看表1 横看表1-1,记 X(α) = (xα1, xα2,⋯ xαp )' , =1 2,⋯ , α , n 个样品的观测值。竖看表1 1,第 它表示第 α个样品的观测值。竖看表1-1,第 j 列的元素
Xj = (x1 j , x2 j ,⋯ xnj )' , ,
பைடு நூலகம்
一个p维变量的函数f( )能作为 R 中某个随机向量 一个p维变量的函数f(·) f( 的分布密度, 的分布密度,当且仅当
P
(i) f (x) ≥ 0 (ii)
2011-11-27
∀x∈Rp
∫
Rp
f (x)dx =1
10
目录 上页 下页 返回 结束
§1.1.3 多元变量的独立性
定义1.4: 称为是相互独立的, 定义 :两个随机向量 X 和 Y称为是相互独立的,若
/ x(1) x11 x12 ⋯ x1p / x(2) x21 x22 ⋯ x2 p X= , = (x1, x2,⋯ xp ) = ⋮ ⋮ ⋮ ⋮ x/ xn1 xn2 ⋯ xnp (n)