- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
的个体构成的集合,如果构成总体的个体是具有p个需要观测
指标的个体, 称这样的总体为p维总体(或p元总体).上面的表示
便于人们用数学方法去研究p维总体的特性.这里“维”(或
“元”)的概念,表示共有几个分量. 若观测了n个个体,则可得到
如表2.1的数据,称每一个个体的p个变量为一个样品,而全体n
个样品组成一个样本.
➢ (2)设A,B,C为常数矩阵,则 E(AXB+C)=AE(X)B+C
➢ 特别地,对于随机向量x,有 E(Ax)=AE(x)
➢ (3)设X1,X2,⋯,Xn为n个同阶的随机矩阵,则 E(X1+X2+⋯+Xn)=E(X1)+E(X2)+⋯+E(Xn)
E(X'AX) tr(AΣ) μ ' Aμ
Chap2 Random Vector 21
Chap2 随机向量 15
五、条件分布
➢ 设 x ( x1, , x p ) 是p维连续型的随机向量,在给定
x(2) ( xq1, , x p )( f(2)( x(2) ) 0)
的条件下,
x(1) ( x1, , xq ) 的条件密度定义为
f x1,
, xq | xq1,
, xp
Chap2 随机向量 1
第二章 随机向量
➢ §2.1 多元分布 ➢ §2.2 数字特征 ➢ §2.3 欧氏距离和马氏距离 ➢ *§2.4 随机向量的变换 ➢ *§2.5 特征函数
亚历山大·尼克斯
Chap2 随机向量 2
一名英国的数据分析师
2014年5月 他利用大数据工具对乌克兰民众实施心理干预
让丑闻不断的亿万富翁波罗申科以54.7%的得票率当选乌克兰新总统 2015年 干扰尼泊尔国民的精神意志帮助尼泊尔王室成功镇压了叛乱... 2016年6月 特朗普给1500万美元让他操纵美国民众的投票意向
二、协方差矩阵
➢ 协方差定义为 Cov( x, y) E x
E
x
y
E
y
E(
xy)
E(
x)E(
y)
若Cov(x,y)=0, 则称x和y不相关.
➢两个独立的随机变量必然不相关,但两个 不相关的随机变量未必独立.
当x=y时,协方差即为方差,也就是
Cov x, x V x
Chap2 Random Vector 22
随机向量
Chap2 随机向量 4
假定所讨论的是多个变量的总体,所研究的数据是同时观
测 p个指标(即变量),又进行了n次观测得到的,把这 p个指标
表示为X1 , X2 ,
,
X
常用向量
p
X (X1, X2, , X p)'
表示对同一个体观测的p个变量. 这里强调,在多元统计分析中,
仍然将所研究对象的全体称为总体,它是由许多(有限和无限)
X2
p
( X1,
X
,
2
,X
p
)
X (2)
X np
X(n)
(2.1)
定义 2.1 将 p 个随机变量 X1, X 2 , , X p 的整体称为 p 维随
机向量,记为 X ( X1, X 2 , , X p ) 。
在对随机向量的研究仍然限于讨论离散型和连续型两类随机
向量。
➢
Chap2 随机向量 7
ap
f
( x1,
, x p )d x1
d xp
p f ( x1, , x p ) x1 x p F ( x1, , x p )
多元密度f (x1, ⋯,xp)的性质
(1) f ( x1, , xp ) 0, 对一切实数x1, , xp;
(2)
f ( x1,
, x p )d x1
d xp 1.
12
Chap2 随机向量 13
定义 2.4 设 X ( X1, X 2 , , X p ) 是 p 维随机向量, 称 由 它 的 q( p) 个 分 量 组 成 的 子 向 量
➢X (i) ( Xi1 , Xi2 , , Xiq ) 的分布为 X 的边缘(或边际) 分布,相对地把 X 的分布称为联合分布.通过变换 X 中 各分量的次序,总可假定 X (1) 正好是 X 的前 q 个分量,
因X和Y各自的概率密度函数在(-1,1)上有值,但是XY的联合概率密度 只在单位圆内有值,所以f(XY)不等于f(x)*f(y),两者不独立.
Chap2 Random Vector 23
例:设X,Y相互独立服从同一分布,记U=X-Y,V=X+Y,则随机 变量U与V是否一定不相关,是否一定独立?
解: 先求U,V的协方差: COV (U ,V ) COV (X Y , X Y ) D(X ) D(Y ) 0 所以,U 与V 一定不相关。
km
k1
km
N
n
ki 0,1, ,min(n, Ni ), i 1, , m, k1 mm n
则称随机变量x 服从多元超几何分布
Chap2 随机向量 11
三、多元概率密度函数
➢
一元的情形: F (a)
a
f
x
d
x,
f
x
d
F d
x
x
多元的情形:
F(a1,
,ap)
a1
Cov
x1, yq
Cov
x2 , yq
Cov xp , yq
E
x1
E x1 y1
E y1
E xp E xp y1 E y1
E x1 E x1 yq E
yq
E xp E xp yq E yq
x11 x12
X
Hale Waihona Puke x21x22xn1 xn2
x1 p
X
(1)
x2
p
def
X
(2)
xnp
X
(n
)
def
( X1, X2 ,, X p )
其中 X(i)( i=1,…,n)是来自p维总体的一个样品.
Chap2 Random Vector 20
随机矩阵X的数学期望的性质
➢ (1)设a为常数,则 E(aX)=aE(X)
补 (1)X与Y独立,则X与Y一定不相关
(2)X与Y不相关,则X与Y不一定独立 证明: (1)由于X与Y独立,所以f(xy)=f(x)f(y),(f为概率密度函数),于是
EXY f xydxdy f x f ydxdy f xdx f ydy EX E(Y)
所以:E(XY)=E(X)E(Y),即X,Y不相关.
x
E
x1
,
E
x2
,
,E
xp
记为 (1, 2 , , p )
➢随机矩阵X=(xij)的数学期望
E
x11
E X E xij
E
x21
E x p1
E x12 E x22
E xp2
E
x1q
E
x2q
E x pq
Chap2 Random Vector 19
变量 序号
1 2
表 2.1 数据
X1
X2
X 11
X 12
X 21
X 22
Chap2 随机向量 5
Xp
X1p X 2p
n
X n1
X n2
X np
在这里横看表 2.1,记为
X ( ) ( X 1, X 2, ,X p ), 1 , 2 , n, 表示第 个样品的观测值。竖看表 2.1,第 j 列的元素
但是U与V 不一定独立。举例如下: (1) 设X与Y 独立,服从正态分布,则(U,V)也服从正态分布,
对于二维正态分布,独立与不相关等价,从而U与V独立。
(2) X ~ b(1, 1 2),(即(0 1)分布) P(U 1,V 0) P( X Y 1, X Y 0) 0 P(U 1) P( X Y 1) P( X 1,Y 0) 1 4, P(V 0) P( X Y 0) P( X 0,Y 0) 1 4, 所以P(U 1,V 0) P(U 1)P(V 0) U与V不独立。
P( X1 x1, , X q xq , X q1 , , X p )
F (x1, x2 , , xq , , , )
当 X 有分布密度 f (x1, x2 ,, x p ) 时(亦称联合分布密度函 数),则 X (1) 也有分布密度,即边缘密度函数为:
➢ f1(x1, x2 ,, xq ) f (x1,, x p )dxq1,, dxp
(2)反例
X=cost,Y=sint,其中t是(0,2π]上的均匀分布随机变量. 易得X和Y不相关,因为: E(XY)=E(cost sint)=(1/2π)*∫sint cost dt = 0 E(X)=(1/2π)* ∫cost dt = 0 E(Y)=(1/2π)* ∫sint dt = 0 所以E(XY)=E(X)E(Y) 但是他们是不独立的.
四、边缘分布
Chap2 随机向量 12
➢ 设x是p维随机向量,由它的q(<p) 个分量组成的向 量x(1)的分布称为x的关于x(1)的边缘分布.
不妨设x(1) ( x1, , xq ), 则对连续型的分布,有
f(1)( x1, , xq ) f ( x1, , x p )d xq1 d x p
f
f2
x1, , x p xq1, , x p
或表达为
f x
f
x1 | x2
f2
x 2
六、独立性
Chap2 随机向量 16
➢ 两个连续型随机向量的独立 f (x, y) fx(x) fy( y)