3.4边缘分布3.5随机变量独立性
- 格式:ppt
- 大小:845.00 KB
- 文档页数:31
随机变量独立性判断随机变量的独立性和相关性随机变量的独立性和相关性是概率论和数理统计中的重要概念。
在实际问题中,我们经常需要判断随机变量之间是否相互独立或者相关。
本文将介绍如何判断随机变量的独立性和相关性。
一、什么是随机变量的独立性和相关性随机变量的独立性和相关性描述了随机变量之间的关系。
独立性:若两个随机变量X和Y的联合分布等于各自的边缘分布之积,即P(X=x, Y=y) = P(X=x)P(Y=y),则称X和Y独立。
相关性:若两个随机变量X和Y之间存在某种依赖关系,即它们的联合分布和边缘分布不相等,称X和Y相关。
二、判断随机变量的独立性和相关性的方法1. 统计方法利用样本数据进行统计分析,可以判断随机变量的独立性和相关性。
对于两个随机变量X和Y,如果它们的样本相关系数接近于0,可以认为X和Y近似独立;如果样本相关系数接近于1或-1,可以认为X和Y相关。
2. 图形方法通过绘制散点图可以直观地观察随机变量的相关性。
对于两个随机变量X和Y,如果它们的散点图呈现出线性关系,则可以认为X和Y相关;如果散点图呈现出无规律的分布,则可以认为X和Y近似独立。
3. 利用协方差和相关系数判断协方差和相关系数是判断随机变量相关性的重要指标。
协方差衡量了两个随机变量之间的线性相关性,若协方差为0,则可以认为两个随机变量不相关。
相关系数除了衡量两个随机变量的线性相关性,还可以衡量非线性相关性,相关系数的范围在-1至1之间,绝对值越接近1表示相关性越强,绝对值越接近0表示独立性越强。
三、应用举例1. 抛硬币问题假设一次抛硬币,X表示正面次数,Y表示反面次数。
在这个例子中,X和Y的取值只能是0或1,它们的联合分布如下:P(X=0, Y=0) = 1/2P(X=1, Y=0) = 1/2P(X=0, Y=1) = 1/2P(X=1, Y=1) = 1/2可以看出,X和Y的联合分布等于各自的边缘分布之积,即P(X=x, Y=y) = P(X=x)P(Y=y),因此X和Y是独立的。
1 引言概率与统计是研究随机现象统计规律的一门数学学科,是对随机现象的统计规律进行演绎和归纳的科学.随着社会的不断发展,概率与统计的知识越来越重要,运用抽样数据进行推断已经成为现代社会一种普遍适用且强有力的思考方式.独立性[5]是随机变量非常重要的性质,其应用也很广泛.在解决很多问题时都有随机变量独立这样的前提,只有这样问题才能得以解决或解决起来比较简单.众所周知,随机变量独立性的判定无论从理论还是在实践中都有着重要意义,因此寻找独立性判断方法显得尤为重要.不少的文献对此进行了深入的研究,给出了一些很好的判断方法[3],但到目前为止人们还没找到简便有效的方法,从而对其深入研究很有必要.2 相关定义定义1离散型随机变量 定义在样本空间Ω上,取值于实数域R ,且只取有限个或可列个值的变量()ξξω=,称做是一维(实值)离散型随机变量,简称离散型随机变量.定义2 n 维离散型随机变量 设12,,,n ξξξ⋅⋅⋅是样本空间Ω上的n 个离散型随机变量,则称n 维向量(12,,,n ξξξ⋅⋅⋅)是Ω上的一个n 维离散型随机变量.定义3 联合分布型 设(,)ξη是一个二维离散型随机变量,它们一切可能取值为(,),,1,2,i j a b i j =⋅⋅⋅,令(,),,1,2,ij i j P P a b i j ξη====⋅⋅⋅称(,1,2,)ij P i j =⋅⋅⋅是二维离散型随机变量(,)ξη的联合分布列.我们容易证明()(1,2,)i i P a P i ξ⋅===⋅⋅⋅是ξ的分布列,同理有()(1,2,)j j P b P j η⋅===⋅⋅⋅是η的分布列,称,ξη的分布列是(,ξη)的联合分布列的边际分布列.定义 4 离散型随机变量独立性 设离散型随机变量ξ的可能取值为(1,2,)i a i =⋅⋅⋅,η的可能取值为(1,2,)j b j =⋅⋅⋅,如果对任意的,i j a b ,有(,)()()i j i j P a b P a P b ξηξη=====成立,则称离散型随机变量ξ和η相互独立.定义5 n 维离散型随机变量独立性 设12,,,n ξξξ⋅⋅⋅是n 个离散型随机变量,i ξ的可能取值为(1,,;1,2,)ik a i n k =⋅⋅⋅=⋅⋅⋅,如果对任意一组11(,,)nk nk a a ⋅⋅⋅,恒有 1(P ξ1111,,)()()n n k n nk k n nk a a P a P a ξξξ=⋅⋅⋅===⋅⋅⋅=成立,则称12,,,n ξξξ⋅⋅⋅是相互独立的.3 随机变量独立性的几种判断方法3.1利用分布函数判断随机变量独立性设二维连续型随机变量(X,Y )的联合分布函数为(,)F x y ,而边缘分布函数为()X F x ,()Y F y ,则X 与Y 相互独立的充要条件是:对一切x 和y ,有(,)F x y =()X F x ()Y F y例1 设二维随机变量(,)ξη具有密度函数2()4,0,0(,)0,x y e x y p x y -+⎧<<+∞<<+∞=⎨⎩其它求分布函数(,)F x y 及边际分布函数(),()F x F y ξη,并判断ξ与η是否独立?解 (,)(,)xy F x y p u v dudv -∞-∞=⎰⎰2()004,0,00,x y u v e dudv x y -+⎧<<+∞<<+∞⎪=⎨⎪⎩⎰⎰其它由此即得22(1)(1),0,0(,)0,x y e e x y F x y --⎧--<<+∞<<+∞=⎨⎩其它()(,)xF x p u v dudv ξ∞-∞-∞=⎰⎰2()004,00,0x u v e dudv x x ∞-+⎧>⎪=⎨⎪≤⎩⎰⎰从而有21,0()0,0x e x F x x ξ-⎧->=⎨≤⎩同理可得,21,0()0,0y e y F y y η-⎧->=⎨≤⎩显然有:(,)()()F x y F x F y ξη=.故ξ与η独立.3.2 利用概率密度函数判断随机变量独立性设二维连续型随机变量(X,Y )联合概率密度函数为(,)f x y ,而关于X 与Y 的边缘概率密度函数分别为()X f x ,()Y f y ,则X 与Y 相互独立的充要条件是:对任意的x 和y ,有:(,)f x y =()X f x ()Y f y例 2 若二维随机变量(,)ξη服从221212(,,,,0)N a a σσ分布,问ξ与η是否独立?解 这时(,)ξη有密度函数22122212()()12121(,)2x a y a p x y e σσπσσ⎡⎤---+⎢⎥⎢⎥⎣⎦=2121()2()(,)x a p x p x y dy σξ--+∞-∞==⎰由对称性可得2222()2()y a p y ση--=显然这时(,)()()p x y p x p y ξη=成立.所以ξ与η相互独立.3.3 利用密度函数可分离变量判断随机变量独立性上述两种方法必须求出边缘分布函数或边缘分布密度[3],下面给出的定理避开了求边缘函数的烦琐过程,使判定随机变量的独立性的工作转化为检查联合概率密度是否为可分离变量的概率密度之积,以及其定义域边界是否为常数的简单工作.定理1设(X,Y)为二维连续型随机变量,其联合密度函数为(,),,,f x y a x b c y d ≤≤≤≤则随机变量X 与Y 相互独立的充要条件为:(1)存在非负连续函数(),()h x g y ,使(,)()()f x y h x g y =,(2),a b c d 和和是分别与,x y 无关的常数. 定理 2 设12(,,,)n X X X ⋅⋅⋅是连续型随机变量,其联合概率密度函数为12(,,,)n f x x x ⋅⋅⋅,满足120,,1,2,,(,,,)0,i i i n a x b i n f x x x >≤≤=⋅⋅⋅⎧⋅⋅⋅=⎨=⎩其它 则随机变量12,,n X X X ⋅⋅⋅,相互独立的充要条件为(1) 存在连续函数i h (),1,2,,i x i n =⋅⋅⋅;满足121 (,,,)()nn i i i f x x x h x =⋅⋅⋅=∏(2),(1)i i a b i n ≤≤均为与12,,,n x x x ⋅⋅⋅无关的实常数推论1 在上述定理2中,如果i a ,1,2,,i n =⋅⋅⋅中有若干个为,,1,2,,i b i n -∞=⋅⋅⋅中有若干个为+∞时,则定理2的结果依然成立.推论2 若定理2的条件成立,则()()i x i i i f x h x 与成正比例关系, 1,2,i n =⋅⋅⋅.实际上,推论2容易从定理2的证明过程中看到.推论3 当n=2时,定理2即为:连续型随机变量12,X X 相互独立的充要条件为(1)121212(,)()()X X f x x f x f x =,i i i a x b ≤≤,1,2i =;(2)1122,,,a b a b 均为与12,x x 无关的实常数.例3设12(,,,)n X X X ⋅⋅⋅联合概率密度为:12(2)112,0,1,2,,!(,,,)0,n x x nx i n e x i n n x f x x x -++⋅⋅⋅+⎧>=⋅⋅⋅⎪⎨⎪⎩⋅⋅⋅==其它试讨论12,,,n X X X ⋅⋅⋅的相互独立性.解 设111111,0()0,0x x e x h x x -⎧>=⎨≤⎩ ,0()2,3,,0,0i ix i i i i ie x h x i n x -⎧>==⋅⋅⋅⎨≤⎩则有121(,,,)()nn i i i f x x x h x =⋅⋅⋅=∏.又因为0,,1,2,,i i a b i n ==+∞=⋅⋅⋅,由推论1知12,,,n X X X ⋅⋅⋅必相互独立.3.4利用条件数学期望判断离散型随机变量独立性下面给出的定理借助于条件数学期望给出了离散型随机变量相互独立[5]的充分必要条件和充分条件.定理3 如果随机变量X 和Y 都只取两个值,那么它们相互独立的充分必要条件是它们不相关,即(1)()()()E XY EX EY =.定理4 若随机变量X 和Y 相互独立,则它们一定不相关.反过来,结论不成2()立定理5 设X 和Y 都是离散型随机变量,分布列分别为:其中,m n 是有限数或无穷大,则X 和Y 相互独立的充分必要条件是,对任何有意义的下标i 和j ,下列二式成立:,)0i j PX a Y b ==>( (2.1)11(/,)(/i i j j i E XY X a a Y b b E X X a ++====或或或11,)(/i j j i a Y b b E Y X a ++==或或11,)i j j a Y b b ++=或 (2.2)很明显,当随机变量X 和Y 都只取两个值是,(2.2)式中的条件数学期望就是期望,所以定理5是对定理3的推广.定理 6 设X 和Y 都是离散型随机变量.如果对于何,a b c d <<,(,)0P a X b c Y d ≤<≤<>,都有(/,)(/,)E XY a X b c Y d E X a X b c Y d ≤<≤<=≤<≤<(/,)E Y a X b c Y d ≤<≤< 成立,那么X 和Y 相互独立.4 判断随机变量独立性应注意的问题我们在判断随机变量独立性时常会产生一些误解,有如下类型的错误推理:()i 随机变量密度函数可分离变量,随机变量就独立;()ii 随机变量1X 与3X ,2X 与4X 独立,则12X X ±与34X X ±独立;()iii 1X 与3X ,2X 与3X 独立,则12X X ±与3X 独立;等等.我们下面将分别举例说明,并且在判断时应该尤其注意.(1) 随机变量密度函数可分离变量但不独立的例子例4 设12(,,...,)n X X X 的联合概率密度为11121212...,0...1(,,...,)0,n n n n n n n Cx x x x x x f x x x --⎧≤≤≤≤≤⎪=⎨⎪⎩其它试讨论12,,...,n X X X 的相互独立性.解 可设1()n i i i i i h x c x -+=1()n i i c C ==∏,则有121(,,...,)()nn i i i f x x x h x ==∏但由边界条件1120...1n n n x x x -≤≤≤≤≤知,边界为12,,...,n x x x 的函数,而非常数,故由定理2结果知,12,,...,n X X X 不是相互独立的.(2)随机变量1234,,,X X X X 每三个独立,但1234,X X X X ±±与不独立的例子例5 设有八块相同的木块,其中一块不写字,其余七块分别写上字母ABCD , AB ,AC ,AD ,BC ,BD ,CD .从其中随机取一块,若木块上有字母A ,称事件A 发生,等等.不难证明事件,,,A B C D 每三个相互独立,但四个事件相互独立.用A I 等表示事件A 等的示性函数,则随机变量,,,A B C D I I I I 每三个独立,但总起来不独立.不难看出,(0,A B P I I +=0)C D I I +=()1/8,P ABCD ==(0)()1/4,A B P I I P AB +===(0)()1/4,C D P I I P CD +=== (0,0)A B C D P I I I I +=+=≠(0)(0)A B C D P I I P I I +=+=,因此A B C D I I I I ++与不独立.10A B C D P I I I I P ABCD +-===(=0,)(),11/4A B C D P I I I I P CD +-===(=0)=1/4,P()()故知A B C D I I I I +-与不独立 .仿之可证A B C D I I I I -+与不独立,A B C D I I I I --与不独立.(3)随机变量123,,X X X 两两独立,但123X X X ±与不独立的例子例 6 设有四块相同的木块分别写上字母,,A B C 和ABC .分别以,,A B C 表示随机取出的一块木板上出现字母,,A B C 的事件(此即著名的别伦师谦例). ,,A B C 三个事件两两独立,但总起来不独立,因而随机变量,,A B C I I I 两两独立,但三个不独立.注意到 (0,0)()0A B C P I I I P ABC +==== (0)()1/4A B P I I P AB +===(0)()1/2C P I P C ===,即知A B C I I I +与不独立,仿之可证A B C I I I -与不独立.5 结束语本文首先定义了随机变量一些相关定义,然后探讨,总结出了判断随机变量独立性的四种方法,前两种方法比较常见也用得较多,但有时求边缘分布函数和边缘密度函数时过程比较繁琐,而且有时无法求出,从而接着给出了后两种方法.后两种方法比较新颖,简便,而且其应用都有一定的范围,通过例题解析给出了它们的应用.我们在应用时要特别注意它的使用条件.最后本文指出了在判断随机变量独立性时应注意的问题以及容易出现的错误,通过例题分析进一步强调,使我们印象更深刻.随机变量独立性无论从理论上还是实践上都有着重大的意义,因此我们应该继续探究随机变量独立性的判定,找出更多更好的方法.致谢:在我写论文期间,感谢我的论文指导老师张老师的悉心指导和帮助,感谢我的同学以及朋友对我的大力支持和帮助!同时还要感谢论文评审小组的各位专家老师及答辩委员会的各位老师对我的指点和帮助!参考文献[1]李裕奇,赵刊.n维随机变量独立性的一个充要条件[J].西南交通大学学报.1998.33(5):513-517.[2]任彪.离散型随机变量独立性的判定[J].河北省科学院学报.1999.16(3):23-26[3]汪建均.随机变量的独立性的简易判别法[J].数学理论与应用.2005.25(1):71-73[4]朱焕然.随机变量独立性判别方法注记[J].大学数学.2003.19(4):107-109[5]殷洪才,黄宇慧,范广慧.随机变量独立性的一个应用.哈尔滨师范大学自然科学学报.1999.15(6):1-4[6]陈永义,王炳章.随机向量的函数的独立性的一个问题[J].工科数学.2000.16(2):113-116[7]傅尚朴.判断两个离散型随机变量相互独立性的一种简便方法[J].教学与科技.1993.3(3):9-13[8]宫平.随机变量独立性初探[J].电大理工.2000.11(4):28-29[9]李裕奇.随机向量的独立性[J].西南交通大学学报.1999.34(5):577-581[10]姚仲明,唐燕玉.随机变量的独立性及其一个充要条件[J].安庆师范学院学报.2004.10(4):71-74。