随机变量的协方差与相关系数
- 格式:ppt
- 大小:488.50 KB
- 文档页数:20
协方差相关系数公式推导一、协方差公式推导。
1. 定义。
- 设X和Y是两个随机变量,E(X)表示X的期望,E(Y)表示Y的期望。
- 协方差Cov(X,Y)=E[(X - E(X))(Y - E(Y))]。
2. 展开推导。
- 首先将(X - E(X))(Y - E(Y))展开得到XY - XE(Y)-YE(X)+E(X)E(Y)。
- 然后求期望E[(X - E(X))(Y - E(Y))]=E(XY - XE(Y)-YE(X)+E(X)E(Y))。
- 根据期望的线性性质E(A + B)=E(A)+E(B),可得:- E(XY - XE(Y)-YE(X)+E(X)E(Y))=E(XY)-E(XE(Y))-E(YE(X)) +E(E(X)E(Y))。
- 因为E(X)和E(Y)是常数,所以E(XE(Y)) = E(Y)E(X),E(YE(X))=E(X)E(Y),E(E(X)E(Y)) = E(X)E(Y)。
- 最终得到Cov(X,Y)=E(XY)-E(X)E(Y)。
3. 样本协方差推导(对于样本数据x_1,x_2,·s,x_n和y_1,y_2,·s,y_n)- 样本均值¯x=(1)/(n)∑_i = 1^nx_i,¯y=(1)/(n)∑_i = 1^ny_i。
- 样本协方差s_xy=(1)/(n - 1)∑_i = 1^n(x_i-¯x)(y_i - ¯y)。
- 展开(x_i-¯x)(y_i-¯y)=x_iy_i - x_i¯y-y_i¯x+¯x¯y。
- 对其求和并求期望类似前面的推导过程,最终得到样本协方差的表达式。
二、相关系数公式推导。
1. 定义。
- 相关系数ρ_XY=(Cov(X,Y))/(√(D(X))√(D(Y))),其中D(X)是X的方差,D(Y)是Y的方差。
- 方差D(X)=E[(X - E(X))^2]=E(X^2)-E^2(X),同理D(Y)=E[(Y -E(Y))^2]=E(Y^2)-E^2(Y)。
协方差与自相关系数和均值关系推导协方差和自相关系数是度量两个变量的关系强度的统计量,它们与均值之间也有着一定的关系,下面我们将详细介绍它们之间的联系。
1. 协方差协方差是两个随机变量之间关系强度的度量,它表示两个随机变量在同一方向上偏离其均值的程度是否一致。
设$X$和$Y$是两个随机变量,它们的期望值分别为$\mu_X$和$\mu_Y$,则$X$和$Y$的协方差定义为:$$\operatorname{Cov}(X,Y)=\operatorname{E}[(X-\mu_X)(Y-\mu_Y)]$$协方差的符号可以表示变量之间的正相关、负相关或无相关。
当协方差大于0时,表示两个变量正相关;当协方差小于0时,表示两个变量负相关;当协方差等于0时,表示两个变量无关。
在实际应用中,常常需要对协方差进行归一化,以便对不同单位的随机变量进行比较。
对于两个变量$X$和$Y$的协方差为$\sigma_{XY}$,它们的标准差分别为$\sigma_X$和$\sigma_Y$,则它们的相关系数定义为:$$\rho_{XY}=\dfrac{\sigma_{XY}}{\sigma_X\sigma_Y}$$相关系数是一个介于$-1$和$1$之间的值,可以用来度量两个变量之间的线性关系程度。
2. 自相关系数自相关系数是时间序列数据中相邻时间点之间的关系的度量,它表示时间序列数据自身过去和未来之间的联系。
设$X_t$表示第$t$个时间点的观测值,$\mu$表示时间序列的均值,其自相关系数$\rho_k$定义为:其中,$\sigma^2$是时间序列数据的方差。
自相关系数的绝对值越接近1,则表示时间序列中两个值之间的联系越紧密。
当自相关系数为0时,表示时间序列中两个值之间没有联系。
对于$n$个数$x_1,x_2,...,x_n$,它们的均值可以表示为:$$\bar{x}=\dfrac{1}{n}(x_1+x_2+...+x_n)=\dfrac{1}{n}\sum_{i=1}^n x_i$$则它们两两之间的协方差可以表示为:其中,$x_{ik}$表示第$i$个数的第$k$个观测值。