4.3协方差及相关系数及其性质
- 格式:ppt
- 大小:676.00 KB
- 文档页数:28
协方差与相关系数公式详解了解变量之间的关联程度协方差与相关系数公式详解:了解变量之间的关联程度在统计学中,协方差和相关系数是了解变量之间关联程度的重要指标。
它们能够帮助我们判断两个或多个变量之间的关系以及它们对彼此的影响程度。
本文将详细解释协方差和相关系数的公式以及如何使用它们来进行分析。
一、协方差协方差用于衡量两个变量的总体误差。
它的公式如下:协方差= Σ[(Xi- X均) * (Yi - Y均)] / N其中,Xi和Yi是样本的观测值,X均和Y均是样本的均值,N是样本量。
协方差具有以下几个性质:1. 如果两个变量的协方差大于0,则它们正相关;如果协方差小于0,则它们负相关;如果协方差等于0,则它们不相关。
2. 协方差的绝对值大小不能反映出变量之间的强度和方向。
3. 协方差受到变量单位的影响,不便于比较不同数据集之间的关联程度。
二、相关系数相关系数用于衡量两个变量之间的线性关系强度和方向,它可以消除变量单位的影响。
最常用的是皮尔逊相关系数,其计算公式如下:相关系数 = 协方差 / (X标准差 * Y标准差)其中,X标准差和Y标准差分别是X和Y的标准差。
相关系数取值范围在-1到1之间,具有以下特点:1. 相关系数为1时,表示两个变量完全正相关,即存在着线性关系。
2. 相关系数为-1时,表示两个变量完全负相关,即一个变量的增加与另一个变量的减小呈线性关系。
3. 相关系数接近0时,表示两个变量之间关系较弱,接近随机关系。
4. 若相关系数为0,表示两个变量之间不存在线性关系。
通过计算相关系数,我们可以了解到变量之间关联程度的强弱。
然而,需要注意的是相关系数只能衡量线性关系,若变量之间存在非线性关系,则相关系数可能无法准确刻画它们之间的关系。
三、协方差和相关系数的应用协方差和相关系数广泛应用于金融学、经济学、社会科学等领域。
它们能够提供关于变量之间关系的重要信息,有助于数据分析和决策制定。
在金融领域,协方差和相关系数可用于评估资产之间的风险和收益关系。
§4.3 协方差与相关系数还需要讨论X 与Y 之间相互关系的数字特征.本节我们讨论关于这方面的问题.1. 协方差及其性质定义4.3.1 对于二维随机变量(,)X Y ,称()()EX E X Y E Y --为,X Y 的协方差.记作cov (,)X Y 。
即cov (,)()()X Y E X EX Y EY =--.cov 2(,)()()()X X E X EX X EX E X EX DX =--=-=.当(,)X Y 为离散型时,有cov 11(,)()()ij ij i j X Y xEX y EY p ∞∞===--∑∑.当(,)X Y 为连续型时,有cov (,)()()(,)X Y x EX y EY p x y dxdy ∞∞-∞∞=--⎰⎰.计算协方差时,还常用公式cov (,)()()X Y EXY EX EY =-协方差等于乘积的期望减去期望的乘积例4. 3.1 已知二维随机变量(,)X Y 的联合分布如表 4.3.1所示.试求cov (,).X Y .表4.3.1解 先求边缘分布,并记入表4.3.1中,.然后求数学期望与协方差.11523,222EX =⨯+⨯= 1111(4)(1)140,4444EY =-⨯+-⨯+⨯+⨯= 又 []12(4)243(1)310,4EXY =⨯-+⨯+⨯-+⨯=故 cov (,)()()0.X Y EXY EX EY =-=例4.3.2 已知二维随机变量(,)X Y 服从二维正态分布N (ρσσμμ,,,,222121). 求cov (,).X Y解 由例3.2.3知,221122(,),(,),XN Y N μσμσ故1,EX μ= 2.EY μ=于是,协方差为cov (,)X Y 12()()()()E X EX Y EY E X Y μμ=--=--=()()()()dxdyey x y y x x ⎰⎰∞∞-∞∞-⎥⎥⎦⎤⎢⎢⎣⎡⎪⎪⎭⎫⎝⎛-+---⎪⎪⎭⎫ ⎝⎛------22221212112)1(2121221121σμσσμμρσμρμμρσπσ.引入变换u x =-11σμ,v y =-22σμ.于是 cov (,)X Y2222222122(1)u uv v v v uvedudv ρρρρ⎡⎤--++-∞∞⎣⎦--∞-∞⎰⎰=()()[]dudv uvev v u ⎰⎰∞∞-∞∞--+----2221)1(2122112ρρρρπσσ()2222(1)2u v v vedv uedu ρρ--∞∞---∞-∞⎧⎫⎪⎬⎪⎭,()222(1)2u v v vedv du ρρ--∞∞---∞-∞⎧⎫⎪⎪=⎨⎬⎪⎪⎩⎭⎰⎰上式大括号中的积分恰好是服从正态分布2(,1)N v ρρ-的随机变量的数学期望,cov (,)X Y =dv ev v ⎰∞∞--222122πσρσ =12ρσσ. ,X Y ρρ=协方差的性质(1)cov(,)cov(,),X Y Y X =(2) cov 1122((),())a X b a Y b ++=12a a cov (,)X Y , (3)cov 12(,)X X Y +=cov 1(,)X Y +cov 2(,)X Y . (4) ()2cov(,),D X Y DX DY X Y ±=+±并且当X 与Y 相互独立时,cov (,)0.X Y = 2. 相关系数及其性质定义4.3.2 对于二维随机变量(,)X Y ,如果0,0,DX DY ≠≠.则称,X Y ρ=为随机变量X 与Y 的相关系数.相关系数的性质 (1)1.XY ρ≤(2)1XY ρ=的充要条件是{} 1.P Y aX b =+=其中,a b 为常数,且0.a ≠一般地,当|XY ρ|的值越来越大而接近于1时,表明X 与Y 的线性关系程度越密切. 反之,当|XY ρ|的值越来越小而接近于0时,表明X 与Y 的线性关系程度很微弱.特别地当XY ρ=0时, 称X 与Y 不相关.若X 与Y 相互独立,则cov(,)0,X Y =于是0,XY ρ=即X 与Y 不相关。