- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2 误差rmin (1 XY ) DY , 其 中 XY
C ov(X , Y ) 为相关系数 DX DY
相关系数的性质 相关系数满足|ρXY |≤1且
XY 1 常数a, b, 使P{Y a bX } 1
2 证 由 (1 XY )
rmin 0 知 | XY | 1 DY
则称E ( X EX )(Y EY )为随机变量X 与Y的协方差, 记 为Cov( X ,Y ), 即
Cov( X ,Y ) E ( X EX )(Y EY )
将上式展开, 易得公式
Cov( X ,Y ) E ( XY ) ( EX )( EY )
特别, 当X与Y 相互独立时,有
解 Cov(X ,Y ) XY DX DY 0.5 4 16 4 例3 设 ( X , Y ) 服从参数为 1 ,
2 2 , 12 , 2 , 的
二维正态分布 , 求X 与Y 的相关 系数.
概率统计(ZYH)
例3 解 二维正态分布的密度是
f
exp(h) 2σ1σ 2 1 ρ 2
Cov( X , Y ) Cov( X , Y ) EX , b DX DX
2
Cov( X , Y ) Cov( X , Y ) E Y EY EX X DX DX
Cov(X , Y ) X EX E (Y EY ) DX
( σ1 σ 2 u 2 ) e
t2 2
t 2 u2 2
dtdu
u2 2
σ1σ 2
Hale Waihona Puke 1 e 2dt u
2
1 e 2
d u σ1 σ 2
所以 XY
Cov(X , Y ) σ1σ 2 σ1σ 2 DX DY
1 ( x μ1 )2 ( x μ1 )( y μ2 ) ( y μ2 )2 h 2ρ 2 2 2 2(1 ρ ) σ1 σ1σ 2 σ2
1 1 2 2 1
2 2 2 y μ2 x μ1 x μ1 t u σ ρ σ σ 2 2 1 1 2
||
即,如果随机变量 X 和 Y 是相互独立的 , 则必有
E[(X-EX)(Y-EY)]=0 这意味着当 E[(X-EX)(Y-EY)]≠0 时 , X 与 Y 不相互 独立或存在着一定的关系. 为此, 我们引入下面的定义.
概率统计(ZYH)
定义1 对二维( X ,Y ), 若E ( X EX )(Y EY ) 存在,
5.3 协方差与相关系数
一、协方差的定义与性质
二、随机变量的线性逼近与相关系数
概率统计(ZYH)
一、协方差的定义和性质
在5.2节方差性质4°的证明中
协方差
D( X Y ) DX DY 2 E ( X EX )(Y EY )
D( X ) D(Y )
X , Y独立
0
概率统计(ZYH)
得
C ov(X , Y ) EX a EY bEX EY DX E ( XY ) EXEY C ov(X , Y ) b 2 2 EX ( EX ) DX
误差r的最小值:
rmin E[Y (a bX )]2
a EY
2 ( DX σ12 , DY σ2 )
对于二维正态分布, 参数ρ就是X与Y 的相关系
数, 因而二维正态分布可由X与Y 的期望、方差及
它们的相关系数完全确定. 且有如下关系: 相互独立
概率统计(ZYH)
参数ρ=0
不相关
近似程度好 , 我们自然希望误差 |Y-(a+bX)| 越小越 好.或者更方便地,用误差
r E[Y (a bX )]2
来衡量这种逼近的好坏程度.显然,r的值越小,则表 示逼近程度越好.故应取a,b使误差r的值最小. 下面讨论a,b的取值.
概率统计(ZYH)
参数a,b的确定 (设DX 0, DY 0)
r E[Y (a bX )]2
EY 2 a 2 b2 EX 2 2abEX 2aEY 2bE( XY )
r 2a 2bEX 2 EY a
r 2bEX 2 2aEX 2 E ( XY ) b
r 0, a 令 r 0, b
系) 联系不够紧密. 特别当ρXY = 0 时 rmin 达到最大, X与Y 之间无线性关系可言, 这时称 X与Y 不相关. 一般 相互独立 不相关 地 相关系数ρXY刻画了随机变量X与Y 的线性相关性
概率统计(ZYH)
例2 设随机变量 X 和 Y 的方差分别为 4 和 16, 相关系数为-0.5, 求协方差Cov( X ,Y ).
2
[C ov(X , Y )]2 C ov(X , Y ) 2 DY 1 DY DX DX DY
记 XY
C ov(X , Y ) (称其为X 与Y的相关系数) DX DY
2 则 rmin (1 XY ) DY
概率统计(ZYH)
概率统计(ZYH)
2 误差rmin (1 XY ) DY , 其 中 XY
C ov(X , Y ) 为相关系数 DX DY
性质表明:当|ρXY| 较大时rmin较小, 此时X与Y (就线性关系来说) 联系较紧密. 特别当ρXY=±1时, X与Y 之间以概率1存在着线性关系.
当|ρXY| 较小时 rmin 较大, 此时X与Y (就线性关
Cov( X ,Y ) 0 由协方差的定义亦容易推得协方差的如下性质
概率统计(ZYH)
协方差的性质 Cov( X ,Y ) E ( X EX )(Y EY )
设 a , b 是常数, 则当下所遇期望和协方差存在时, 有 1o Cov(a, X ) 0; 2o Cov( X , X ) DX ; 3o Cov( X ,Y ) Cov(Y , X ); 4o Cov(aX , bY ) abCov( X ,Y ); 5o Cov( X Y , Z ) Cov( X , Z ) Cov(Y , Z ). 例1 设X为一随机变量, 其方差为DX, Y=a+bX,
XY 1 rmin 0 常数a, b, 使E[Y (a bX )]2 0
或D[Y (a bX )] { E[Y (a bX )]}2 0
或D[Y (a bX )] 0且E[Y (a bX )] 0 常数a, b, 使P{Y a bX } 1
1 C ov(X , Y ) 2
1 2
概率统计(ZYH)
t
u
( x μ1 )( y μ2 ) e
h
d xd y σ1σ 2 1 ρ 2
t 2 u2 2
(σ1u)σ 2 ( u t 1 ρ2 ) e
dtdu
0
1 C ov(X , Y ) 2
其中a与b均为常数, 求Cov( X ,Y ). 解 Cov( X ,Y ) Cov(a bX , X )
Cov(a , X ) bCov( X , X ) bDX
概率统计(ZYH)
二、随机变量的线性逼近与相关系数 在解决实际问题时,常常需要用随机变量 X的
线性函数a+bX逼近随机变量Y.为了使这种逼近的