二维随机变量的数字特征
- 格式:ppt
- 大小:2.18 MB
- 文档页数:40
第四章 随机变量的数字特征㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置. 1、数学期望的定义(1) 定义 离散型和连续型随机变量X 的数学期望定义为{}⎪⎩⎪⎨⎧==⎰∑∞∞- d )( )()( ,,连续型离散型x x xf x X x X kk k P E其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在. ①常见的离散型随机变量的数学期望1、离散型随机变量的数学期望设离散型随机变量的概率分布为,若,则称级数为随机变量的数学期望(或称为均值),记为, 即2、两点分布的数学期望设服从0—1分布,则有,根据定义,的数学期望为.3、二项分布的数学期望设服从以为参数的二项分布,,则。
4、泊松分布的数学期望设随机变量服从参数为的泊松分布,即,从而有。
①常见的连续型随机变量的数学期望1)均匀分布设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a <b ),它的概率密度函数为:= 则=∴ E (ξ)=(a+b )/2. 即数学期望位于区间的中点.2)正态分布设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为:(σ>0,- <μ<+ )则令得∴ E(ξ)=μ .3)指数分布设随机变量服从参数为的指数分布,的密度函数为,则.(2) 随机变量的函数的数学期望设)(xgy=为连续函数或分段连续函数,而X是任一随机变量,则随机变量)(XgY=的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出Y的概率分布再求其数学期望;对于二元函数),(YXgZ=,有类似的公式:(){}⎪⎩⎪⎨⎧===⎰∑∞∞.;(连续型)离散型-d)()()()(xxfxgxXxgXgY kkkPEE()(){}()()()()⎪⎩⎪⎨⎧====⎰⎰∑∑∞∞-∞∞-.;连续型离散型dd,,,,,yxyxfyxgyYxXyxgYXgZi jjijiPEE设(,)X Y为二维离散型随机变量,其联合概率函数(,),,1,2,,i j ijP X a Y b p i j====如果级数(,)i j ijj ig a b p∑∑绝对收敛,则(,)X Y的函数(,)g X Y的数学期望为[(,)](,)i j ijj iE g X Y g a b p=∑∑;特别地();()i ij j iji i j iE X a p E Y b p==∑∑∑∑.设X为连续型随机变量,其概率密度为()f x,如果广义积分()()g x f x dx+∞-∞⎰绝对收敛,则X的函数()g X的数学期望为[()]()()E g X g x f x dx+∞-∞=⎰.设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分(,)(,)g x y f x y dxdy+∞+∞-∞-∞⎰⎰绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为[(,)](,)(,)E g x y g x y f x y dxdy+∞+∞-∞-∞=⎰⎰; 特别地()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。
考研数学一(随机变量的数字特征)模拟试卷2(题后含答案及解析) 题型有:1. 选择题 2. 填空题 3. 解答题选择题下列每题给出的四个选项中,只有一个选项符合题目要求。
1.设二维随机变量(X,Y)满足E(XY)=EXEY,则X与YA.相关.B.不相关.C.独立.D.不独立.正确答案:B解析:因E(XY)=EXEY,故Cov(X,Y)=E(XY)一EXEY=0,X与Y不相关,应选(B).知识模块:随机变量的数字特征2.将一枚硬币重复掷n次,以X和Y分别表示正面向上和反面向上的次数,则X和Y的相关系数等于A.一1.B.0.C.D.1正确答案:A解析:依题意,Y=n—X,故ρXY=-1.应选(A).一般来说,两个随机变量X与Y的相关系数ρXY满足|ρXY|≤1.若Y=aX+b,则当a>0时,ρXY=1,当a<0时,ρXY=-1.知识模块:随机变量的数字特征3.对于任意二随机变量X和Y,与命题“X和Y不相关”不等价的是A.EXY=EXEY.B.Cov(X,Y)=0.C.DXY=DXDY.D.D(X+Y)=DX+DY.正确答案:C解析:由于Cov(X,Y)=EXY—EXEY=0是“X和Y不相关”的充分必要条件,可见(A)与(B)等价.由D(X+Y)=DX+DY的充分必要条件是Coy(X,Y)=0,可见(B)与(D)等价.于是,“X和Y不相关”与(A),(B)和(D)等价.故应选(C).选项(C)不成立是明显的,为说明选项(C)不成立,只需举一反例.设X和Y同服从参数为p(0<p<1)的0-1分布且相互独立,从而X与Y不相关.易见DX=DY=p(1一p);乘积XY服从参数为p2的0-1分布:P{XY=1}=P{X=1,Y=1}=p2,p{ XY=0}=1一p2.因此DXY=P2(1一P2)≠P2(1一p)2=DXDY.知识模块:随机变量的数字特征4.假设随机变量x在区间[一1,1]上均匀分布,则U=arcsinX和V=arccosX 的相关系数等于A.一1.B.0.C.0.5.D.1正确答案:A解析:注意到U=arcsinX和V=arccosX满足下列关系:arcsinX=-arccosX,即U=-V+,由于U是V的线性函数,且其增减变化趋势恰恰相反,所以其相关系数ρ=-1.应选(A).知识模块:随机变量的数字特征5.设随机变量X1,X2,…,Xn(n>1)独立同分布,且方差σ2>0,记的相关系数为A.一1.B.0.C..D.1正确答案:B解析:由于Xi独立同分布,故DXi=σ2,D,Cov(X1,Xi)=0(i≠1),故应选(B).(注:容易计算D(X1一σ2.) 知识模块:随机变量的数字特征填空题6.两名射手各向自己的靶独立射击,直到有一次命中时该射手才(立即)停止射击.如果第i名射手每次命中概率为Pi(0<Pi<1,i=1,2),则两射手均停止射击时脱靶(未命中)总数的数学期望为___________.正确答案:解析:每位射手的射击只有两个基本结果:中与不中,因此两射手的每次射击都是一个伯努利试验.每位射手直到他有一次命中时方停止射击,因此此时的射击次数应服从几何分布;此时的射击次数一1=未击中的次数.以Xi表示第i 名射手首次命中时的脱靶数,则此时他的射击次数Xi+1服从参数为pi的几何分布,因此P{Xi=k}=(1一Pi)kPi,i=1,2,且E(Xi+1)=,i=1,2,于是EXi=E(Xi+1)-1=-1,两射手脱靶总数X=X1+X2的期望为EX=EX1+EX2=一2.知识模块:随机变量的数字特征7.将长度为£的棒随机折成两段,则较短段的数学期望为___________.正确答案:解析:设X为折点到左端点的距离,Y为较短段的长,则X~U(0,L),且知识模块:随机变量的数字特征8.设随机变量X和Y的相关系数为0.9,若Z=2X—1,则Y与Z的相关系数为___________.正确答案:0.9解析:Cov(Y,Z)=Cov(Y,2X一1)=2Cov(X,Y),DZ=D(2X一1)=4DX.Y 与Z的相关系数ρYZ为知识模块:随机变量的数字特征9.设随机变量X和Y的相关系数为0.5,EX=EY=0,EX2=EY2=2,则E(X+Y)2=___________.正确答案:6解析:DX=EX2一(EX)2=2,DY=2,Cov(X,y)=ρXY=1,E(X+Y)=EX+EY=0,E(X+Y)2=D(X+Y)+[E(X+Y)]2=D(X+Y)=DX+2Cov(X,Y)+DY=2+2+2=6.知识模块:随机变量的数字特征解答题解答应写出文字说明、证明过程或演算步骤。
随机变量的数字特征——总结第四章 随机变量的数字特征㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置.1、数学期望的定义(1) 定义 离散型和连续型随机变量X 的数学期望定义为{}⎪⎩⎪⎨⎧==⎰∑∞∞- d )( )()( ,,连续型离散型x x xf x X x X kk k P E 其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在.①常见的离散型随机变量的数学期望1、离散型随机变量的数学期望 设离散型随机变量的概率分布为,若,则称级数为随机变量的数学期望(或称为均值),记为, 即2、两点分布的数学期望 设服从0—1分布,则有,根据定义,的数学期望为. 3、二项分布的数学期望 设服从以为参数的二项分布,,则。
4、泊松分布的数学期望 设随机变量服从参数为的泊松分布,即,从而有。
①常见的连续型随机变量的数学期望1)均匀分布设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a <b ),它的概率密度函数为:随机变量的数字特征——总结= 则=∴ E(ξ)=(a+b)/2.即数学期望位于区间的中点.2)正态分布设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为:(σ>0,- <μ<+)则令得∴ E(ξ)=μ .3)指数分布设随机变量服从参数为的指数分布,的密度函数为 ,则.(2) 随机变量的函数的数学期望设为连续函数或分段连续函数,而X是任一随机变)(xgy=量,则随机变量的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出的概)(XgY=Y率分布再求其数学期望;对于二元函数,有类似的公式:),(YXgZ=(){}⎪⎩⎪⎨⎧===⎰∑∞∞.;(连续型)离散型-d)()()()(xxfxgxXxgXgY kkkPEE()(){}()()()()⎪⎩⎪⎨⎧====⎰⎰∑∑∞∞-∞∞-.;连续型离散型dd,,,,,yxyxfyxgyYxXyxgYXgZi jjijiPEE设(,)X Y为二维离散型随机变量,其联合概率函数(,),,1,2,,i j ijP X a Y b p i j====如果级数(,)i j ijj ig a b p∑∑绝对收敛,则(,)X Y的函数(,)g X Y的数学期望为随机变量的数字特征——总结[(,)](,)ijijjiE g X Y g a b p =∑∑; 特别地();()i ijj ijiij iE X a p E Y b p==∑∑∑∑.设X 为连续型随机变量,其概率密度为()f x ,如果广义积分 ()()g x f x dx+∞-∞⎰绝对收敛,则X 的函数()g X 的数学期望为[()]()()E g X g x f x dx+∞-∞=⎰.设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分(,)(,)g x y f x y dxdy+∞+∞-∞-∞⎰⎰绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为[(,)](,)(,)E g x y g x y f x y dxdy+∞+∞-∞-∞=⎰⎰;特别地()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。
第四章 随机变量的数字特征1. 把刻画随机变量某些方面特征的数值称为随机变量的数字特征,如期望、方差、协方差、相关系数等。
2. 随机变量的期望反映了随机变量取值的集中位置。
离散型随机变量的期望设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…若级数∑ix i p i 绝对收敛(即级数∑i丨x i 丨p i 收敛),则定义X 的数学期望(简称均值或期望)为E (X )=∑ix i p i注:当X 的可能取值为有限多个x 1,x 2,…,x n 时,E (X )=∑=ni 1x i p i 当X 的可能取值为可列多个x 1,x 2,…,x n ,…时,E (X )=∑∞=1i x i p i三种重要离散型随机变量的数学期望:3. 离散型随机变量函数的数学期望 设离散型随机变量X 的分布律为P {X =x k }=p k ,k=1,2,…令Y =g (X ),若级数∑∞=1k g (x k )p k 绝对收敛,则随机变量Y 的数学期望为E (Y )= E[g (X )] =∑∞=1k g (x k )p k4. 连续型随机变量的期望三种重要连续型随机变量的数学期望:5. 连续型随机变量函数的数学期望2017.4单解:6. 二维随机变量的期望二维随机变量函数的期望7. 期望的性质(1)常数的期望等于这个常数,即E (C )=C ,其中C 为常数证明 常数C 作为随机变量,它只可能取一个值C ,即P {X =C }=1,所以E (C )=C ⋅1=C(2)常数与随机变量X 乘积的期望等于该常数与随机变量X 的期望的乘积,即E (C X )=C ⋅E (X ) (3)随机变量和的期望等于随机变量期望之和,即E (X +Y )= E (X )+ E (Y ) 推广:E (C 1X +C 2Y )= C 1E (X )+ C 2E (Y ),其中C 1,C 2为常数 一般地,设X 1,X 2,…,X n ,为n 个随机变量,则有E (∑=ni iX 1)=∑=ni iX E 1)(E (∑=ni ii X C 1)=∑=ni iiX E C 1)( 其中C i(i=1,2,…)为常数(4)两个相互独立的随机变量乘积的期望等于期望的乘积,即若X ,Y 是相互独立的随机变量,则E (XY )= E (X )E (Y )由数学归纳法可证得:当X1,X2,…,X n相互独立时有E(X1,X2,…,X n)= E(X1)E(X2)…E(X n)2018.4单解:指数分布的期望值为 1,故E(X)= E(Y)=21,所以E(X Y)= E(X)E(Y)=412018.4计解:(1)平均收益率E(X)=1%×0.1+2%×0.2+3%×0.1+4%×0.3+5%×0.2+6%×0.1=3.6%(2)预期利润10×3.6%=0.36万元2017.10单解:E(-3X +2)=-3 E(X)+2=-3×51+2=572017.4填解:E(X+Y)= E(X)+ E(Y)=20×0.1+2=48. 方差反映了随机变量偏离中心——期望的平均偏离程度。
第四章 随机变量的数字特征前面讨论了随机变量的分布函数,我们知道分布函数全面地描绘了随机变量的统计特性.但是在实际问题中,一方面由于求分布函数并非易事;另一方面,往往不需要去全面考察随机变量的变化情况而只需知道随机变量的某些特征就够了.例如,在考察一个班级学生的学习成绩时,只要知道这个班级的平均成绩及其分散程度就可以对该班的学习情况作出比较客观的判断了.这样的平均值及表示分散程度的数字虽然不能完好地描绘随机变量,但能更突出地描绘随机变量在某些方面的重要特征,我们称它们为随机变量的数字特征.本章将介绍随机变量的常用数字特征:数学期望、方差、相关系数和矩.第一节 数学期望1.数学期望的定义粗略地说,数学期望就是随机变量的平均值.在给出数学期望的概念之前,先看一个例子.要评判一个射手的射击程度,需要知道射手平均命中环数.设射手A 在同样条件下进展射击,命中的环数X 是一随机变量,其分布律如下:表4-1由X 的分布律可知,假设射手A 共射击N 次,根据频率的稳定性,所以在N 次射击中,大约有0.1×N 次击中10环,0.1×N 次击中9环,0.2×N 次击中8环,0.3×N 次击中7环,0.1×N 次击中6环,0.1×N 次击中5环,0.1×N 次脱靶.于是在N 次射击中,射手A 击中的环数之和约为10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N .平均每次击中的环数约为N1〔10×0.1N +9×0.1N +8×0.2N +7×0.3N +6×0.1N +5×0.1N +0×0.1N 〕 =10×0.1+9×0.1+8×0.2+7×0.3+6×0.1+5×0.1+0×0.1 =6.7〔环〕.由这样一个问题的启发,得到一般随机变量的“平均数〞,应是随机变量所有可能取值与其相应的概率乘积之和,也就是以概率为权数的加权平均值,这就是所谓“数学期望的概念〞.一般地,有如下定义:定义4.1 设离散型随机变量X 的分布律为P {X =x k }=p k k =1,2,…, 假设级数∑∞=1k k kp x绝对收敛,那么称级数∑∞=1k k kp x为随机变量X 的数学期望〔Mathematical expectation 〕,记为E 〔X 〕.即E 〔X 〕=∑∞=1k k kp x. 〔4.1〕设连续型随机变量X 的概率密度为f 〔x 〕,假设积分⎰+∞∞-x x xf d )(绝对收敛,那么称积分⎰+∞∞-x x xf d )(的值为随机变量X 的数学期望,记为E 〔X 〕.即E 〔X 〕=⎰+∞∞-x x xf d )(. 〔4.2〕数学期望简称期望,又称为均值.例4.1 某商店在年末大甩卖中进展有奖销售,摇奖时从摇箱摇出的球的可能颜色为:红、黄、蓝、白、黑五种,其对应的奖金额分别为:10000元、1000元、100元、10元、1元.假定摇箱内装有很多球,其中红、黄、蓝、白、黑的比例分别为:0.01%,0.15%,1.34%,10%,88.5%,求每次摇奖摇出的奖金额X 的数学期望. 解每次摇奖摇出的奖金额X 是一个随机变量,易知它的分布律为因此,E 〔X 〕=10000×0.0001+1000×0.0015+100×0.0134+10×0.1+1×0.885=5.725. 可见,平均起来每次摇奖的奖金额缺乏6元.这个值对商店作方案预算时是很重要的.例4.2 按规定,某车站每天8点至9点,9点至10点都有一辆客车到站,但到站的时刻是随机的,且两者到站的时间互相独立.其分布律为一旅客8点20分到车站,求他候车时间的数学期望.解 设旅客候车时间为X 分钟,易知X 的分布律为表4-4在上表中p k 的求法如下,例如P {X =70}=P 〔AB 〕=P 〔A 〕P 〔B 〕=1/6×3/6=3/36,其中A 为事件“第一班车在8:10到站〞,B 为事件“第二班车在9:30到站〞,于是候车时间的数学期望为E 〔X 〕=10×3/6+30×2/6+50×1/36+70×3/36+90×2/36=27.22〔分钟〕.例4.3 有5个互相独立工作的电子装置,它们的寿命X k 〔k =1,2,3,4,5〕服从同一指数分布,其概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤>-.00,0,1/x ,x x θθe〔1〕 假设将这5个电子装置串联起来组成整机,求整机寿命N 的数学期望;〔2〕 假设将这5个电子装置并联组成整机,求整机寿命M 的数学期望.解 X k 〔k =1,2,3,4,5〕的分布函数为F 〔x 〕=⎩⎨⎧≤>--.0,0,0,1/x x x θe〔1〕 串联的情况由于当5个电子装置中有一个损坏时,整机就停顿工作,所以这时整机寿命为N =min{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5是互相独立的,于是i=min{X 1,X 2,X 3,X 4,X 5}的分布函数为F N 〔x 〕=P {N ≤x }=1-P {N >x }=1-P {X 1>x ,X 2>x ,X 3>x ,X 4>x ,X 5>x }=1-P {X 1>x }·P {X 2>x }·P {X 3>x }·P {X 4>x }·P {X 5>x }=1-[1-)(1x F X ][1- )(2x F X ][1-)(3x F X ][1-)(4x F X ][1-)(5x F X ] =1-[1-F 〔x 〕]5=⎪⎩⎪⎨⎧≤>--.0,0,0,15x x xθe 因此N 的概率密度为f N 〔x 〕=⎪⎩⎪⎨⎧≤>-.0,0,0,55x x xθθe那么N 的数学期望为E 〔N 〕=55)(5θθθ==-∞+∞-∞+∞-⎰⎰x xx x xf xN d ed〔2〕 并联的情况由于当且仅当5个电子装置都损坏时,整机才停顿工作,所以这时整机寿命为M =max{X 1,X 2,X 3,X 4,X 5}.由于X 1,X 2,X 3,X 4,X 5互相独立,类似可得M 的分布函数为F M 〔x 〕=[F 〔x 〕]5=⎪⎩⎪⎨⎧≤>--.0,0,0,)1(5x x x θe因此M 的概率密度为f M 〔x 〕=⎪⎩⎪⎨⎧≤>---.0,0,0,]1[54x x x x θθθe e于是M 的数学期望为E 〔M 〕=.60137)1(5)(0max θθθ=-=-∞+∞-∞+⎰⎰x xx x xf xd e d 这说明:5个电子装置并联联接工作的平均寿命要大于串联联接工作的平均寿命.例4.4 设随机变量X 服从柯西〔Cauchy 〕分布,其概率密度为f 〔x 〕=)1(12x +π,-x <x <+∞, 试证E 〔X 〕不存在.证 由于,)1(1)(2⎰⎰+∞∞-+∞∞-∞=+=x x xx x f x d πd 故E 〔X 〕不存在.2.随机变量函数的数学期望在实际问题与理论研究中,我们经常需要求随机变量函数的数学期望.这时,我们可以通过下面的定理来实现.定理4.1 设Y 是随机变量X 的函数Y =g 〔X 〕〔g 是连续函数〕. 〔1〕 X 是离散型随机变量,它的分布律为P 〔X =x k 〕=p k ,k =1,2,…,假设kk kpx g ∑∞=1)(绝对收敛,那么有E 〔Y 〕=E [g 〔X 〕]=kk kpx g ∑∞=1)(. 〔4.3〕〔2〕 X 是连续型随机变量,它的概率密度为f 〔x 〕,假设⎰+∞∞-x x f x g d )()(绝对收敛,那么有E 〔Y 〕=E [g 〔X 〕]=⎰+∞∞-x x f x g d )()(. 〔4.4〕定理4.4的重要意义在于当我们求E 〔Y 〕时,不必知道Y 的分布而只需知道X 的分布就可以了.当然,我们也可以由的X 的分布,先求出其函数g 〔X 〕的分布,再根据数学期望的定义去求E [g 〔X 〕],然而,求Y =g 〔X 〕的分布是不容易的,所以一般不采用后一种方法.定理4.1的证明超出了本书的范围,这里不证.上述定理还可以推广到二个或二个以上随机变量的函数情形. 例如,设Z 是随机变量X ,Y 的函数,Z =g 〔X ,Y 〕〔g 是连续函数〕,那么Z 也是一个随机变量,当〔X ,Y 〕是二维离散型随机变量,其分布律为P {X =x i ,Y =y j }=p ij 〔i ,j =1,2,…〕时,假设∑∑ijijiipy x g ),(绝对收敛,那么有E 〔Z 〕=E [g 〔X ,Y 〕]=∑∑ijijiipy x g ),(. 〔4.5〕当〔X ,Y 〕是二维连续型随机变量,其概率密度为f 〔x ,y 〕时,假设⎰⎰+∞∞-+∞∞-yx y x f y z g d d ),(),(绝对收敛,那么有E 〔Z 〕=E [g 〔X ,Y 〕]=⎰⎰+∞∞-+∞∞-y x y x f y z g d d ),(),(. 〔4.6〕特别地有E 〔X 〕=⎰⎰+∞∞-+∞∞-y x y x xf d d ),(=⎰+∞∞-.)(x x xf X dE 〔Y 〕=⎰⎰+∞∞-+∞∞-y x y x yf d d ),(=⎰+∞∞-.)(y y yf Y d例4.5 设随机变量X 的分布律为表4-5求E 〔X 〕,E 〔-2x +1〕.解 由〔4.5〕式得E 〔X 2〕=〔-1〕2×18+02×14+22×38+32×14=318, E 〔-2X +1〕=[-2×〔-1〕+1]×18+[-2×0+1]×14+[-2×2+1]×38+[-2×3+1]×14= -74. 例4.6 对球的直径作近似测量,设其值均匀分布在区间[a ,b ]内,求球体积的数学期望.解 设随机变量X 表示球的直径,Y 表示球的体积,依题意,X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b球体积Y =361X π,由〔4.6〕式得 E 〔Y 〕=x a b x X E ba d ππ-=⎰161)61(33=).)((24)(6223b a b a x x a b ba++=-⎰πd π例4.7 设国际市场每年对我国某种出口商品的需求量X 〔吨〕服从区间[2000,4000]上的均匀分布.假设售出这种商品1吨,可挣得外汇3万元,但假设销售不出而囤积于仓库,那么每吨需保管费1万元.问应预备多少吨这种商品,才能使国家的收益最大? 解设预备这种商品y 吨〔2000≤y ≤4000〕,那么收益〔万元〕为g 〔X 〕=⎩⎨⎧<--≥.),(3,,3y X X y X y X y那么 E [g 〔X 〕]=⎰⎰-⋅=+∞∞-40002000200040001)()()(x x g x x f x g d d=[]⎰⎰+--40002000320001)(320001y y x y x x y x d d =)1047000(1000162⨯-+-y y . 当y =3500吨时,上式到达最大值.所以预备3500吨此种商品能使国家的收益最大,最大收益为8250万元.例4.8 设二维随机变量〔X ,Y 〕在区域A 上服从均匀分布,其中A 为x 轴,y 轴及直线x +2y=1所围成的三角区域,求E 〔X 〕,E 〔Y 〕,E 〔XY 〕. 解 由于〔X ,Y 〕在A 内服从均匀分布,所以其概率密度f 〔x ,y 〕=⎪⎩⎪⎨⎧⎩⎨⎧∉∈=∉∈.),(,0,),(,1,),(,0,),(,1A y x A y x A y x A y x A 的面积 E 〔X 〕=12(1)001(,)d d d d d d ;3x Axf x y x y x x y x x y +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E 〔Y 〕=2122(,)d d d d d d ;3y Ayf x y x y y x y y y x +∞+∞--∞-∞===⎰⎰⎰⎰⎰⎰E 〔XY 〕=;61)1(2),()1(2010210⎰⎰⎰⎰⎰+∞∞-+∞∞--=-==x x x x y y x x y x y x xyf d d d d d3.数学期望的性质下面讨论数学期望的几条重要性质.定理4.2 设随机变量X ,Y 的数学期望E 〔X 〕,E 〔Y 〕存在. 1°E 〔c 〕=c ,其中c 是常数; 2°E 〔cX 〕=cE 〔X 〕;3°E 〔X +Y 〕=E 〔X 〕+E 〔Y 〕;4°假设X ,Y 是互相独立的,那么有E 〔XY 〕=E 〔X 〕E 〔Y 〕.证 就连续型的情况我们来证明性质3°、4°,离散型情况和其他性质的证明留给读者. 3°设二维随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕,其边缘概率密度为f X 〔x 〕,f Y 〔y 〕,那么E 〔X +Y 〕=⎰⎰+∞∞-+∞∞-+y x y x f y x d d ),()(=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-+y x y x yf y x y x xf d d d d ),(),(=)()()()(Y E X E y y yf x x xf Y X +=+⎰⎰+∞∞-+∞∞-d d .4°又假设X 和Y 互相独立,此时f 〔x ,y 〕=f X 〔x 〕f Y 〔y 〕,故E 〔XY 〕=⎰⎰⎰⎰+∞∞-+∞∞-+∞∞-+∞∞-=y x y f x xyf y x y x xyf Y X d d d d )()(),(=).()()()(Y E X E y y yf x x xf Y X =⋅⎰⎰+∞∞-+∞∞-d d性质3°可推广到任意有限个随机变量之和的情形;性质4°可推广到任意有限个互相独立的随机变量之积的情形.例4.9 设一电路中电流I 〔安〕与电阻R 〔欧〕是两个互相独立的随机变量,其概率密度分别为g 〔i 〕=⎩⎨⎧≤≤.,0,10,2其他i i h 〔r 〕=⎪⎩⎪⎨⎧≤≤.,0,30,92其他r r试求电压V =IR 的均值.解 E 〔V 〕=E 〔IR 〕=E 〔I 〕E 〔R 〕=2392)()(303102=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡⎥⎦⎤⎢⎣⎡⎰⎰⎰⎰∞+∞-∞+∞-r r i i r r rh i i ig d d d d 〔伏〕. 例4.10 设对某一目的进展射击,命中n 次才能彻底摧毁该目的,假定各次射击是独立的,并且每次射击命中的概率为p ,试求彻底摧毁这一目的平均消耗的炮弹数.解 设X 为n 次击中目的所消耗的炮弹数,X k 表示第k -1次击中后至k 次击中目的之间所消耗的炮弹数,这样,X k 可取值1,2,3,…,其分布律见表4-6.表4-61X =X 1+X 2+…+X n .由性质3°可得E 〔X 〕=E 〔X 1〕+E 〔X 2〕+…+E 〔X n 〕=nE 〔X 1〕. 又 E〔X 1〕=,111pkpq k k =∑∞=- 故 E 〔X 〕=pn . 4.常用分布的数学期望 〔1〕 两点分布 那么X 的数学期望为E 〔X 〕=0×〔1-p 〕+1×p =p .〔2〕 二项分布设X 服从二项分布,其分布律为P {X =k }=kn k k n p p --)1(C , 〔k =0,1,2,…,n 〕,〔0<p <1〕.那么X 的数学期望为E 〔X 〕=∑∑==----=-nk nk k n k kn kknp p k n k n kp p k 0)1()!(!!)1(C=[]∑=----------nk k n k p pk n k n np)]1()1[(1)1(!)1()1()!1()!1(,令k -1=t ,那么E 〔X 〕=[]∑-=------10])1[()1(!)1(!)!1(n t t n t p p t n t n np=np [p +〔1-p 〕]n -1=np .假设利用数学期望的性质,将二项分布表示为n 个互相独立的0-1分布的和,计算过程将简单得多.事实上,假设设X 表示在n 次独立重复试验中事件A 发生的次数,X i 〔i =1,2,…,n 〕表示A 在第i 次试验中出现的次数,那么有X =1nii X=∑.显然,这里X所以E 〔X i 〕=p ,i =1,2,…,n .由定理4.2的性质3°有E 〔X 〕=∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E X E 11)( =np .〔3〕 泊松分布设X 服从泊松分布,其分布律为P {X =k }=λλ-e !k k, 〔k =0,1,2,…〕,〔λ>0〕.那么X 的数学期望为E 〔X 〕=∑∑∞=--∞=--=11)!1(!k k k kk k k λλλλλee,令k -1=t ,那么有E 〔X 〕=.!0λλλλλλλ=⋅=-∞=-∑e e ek tt .〔4〕 均匀分布设X 服从[a ,b ]上的均匀分布,其概率密度函数为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-.,0,,1其他b x a a b那么X 的数学期望为E 〔X 〕=.2)(ba x ab x x x xf ba +=-=⎰⎰+∞∞-d d . 〔5〕 指数分布设X 服从指数分布,其分布密度为f 〔x 〕=⎩⎨⎧<≥-.0,0,0,x x x λλe那么X 的数学期望为E 〔X 〕=1()d e d x xf x x x x λλλ+∞+∞--∞-∞==⎰⎰.〔6〕 正态分布设X ~N 〔μ,σ2〕,其分布密度为f 〔x 〕=222)(21σμσ--x e π,那么X 的数学期望为E 〔X 〕=22()2()d ed ,x xf x x x x μσ--+∞+∞-∞-∞=⎰令σμ-x =t ,那么E 〔X 〕=⎰∞+∞--+t t t d e π22)(21σμ 注意到t t d eπ⎰∞+∞--222μ=μ,t σt t d e π⎰∞+∞--2221=0,故有E 〔X 〕=μ.第二节 方 差1.方差的定义数学期望描绘了随机变量取值的“平均〞.有时仅知道这个平均值还不够.例如,有A ,B 两名射手,他们每次射击命中的环数分别为X ,Y ,X ,Y 的分布律为:由于E 〔X 〕=E 〔Y 〕=9〔环〕,可见从均值的角度是分不出谁的射击技术更高,故还需考虑其他的因素.通常的想法是:在射击的平均环数相等的条件下进一步衡量谁的射击技术更稳定些.也就是看谁命中的环数比较集中于平均值的附近,通常人们会采用命中的环数X 与它的平均值E 〔X 〕之间的离差|X -E 〔X 〕|的均值E [|X -E 〔X 〕|]来度量,E [|X -E 〔X 〕|]愈小,说明X 的值愈集中于E 〔X 〕的附近,即技术稳定;E [|X -E 〔X 〕|]愈大,说明X 的值很分散,技术不稳定.但由于E [|X -E 〔X 〕|]带有绝对值,运算不便,故通常采用X 与E 〔X 〕的离差|X -E 〔X 〕|的平方平均值E [X -E 〔X 〕]2来度量随机变量X 取值的分散程度.此例中,由于E [X -E 〔X 〕]2=0.2×〔8-9〕2+0.6×〔9-9〕2+0.2×〔10-9〕2=0.4, E [Y -E 〔Y 〕]2=0.1×〔8-9〕2+0.8×〔9-9〕2+0.1×〔10-9〕2=0.2.由此可见B 的技术更稳定些.定义4.2 设X 是一个随机变量,假设E [X -E 〔X 〕]2存在,那么称E [X -E 〔X 〕]2为X 的方差〔Variance 〕,记为D 〔X 〕,即D 〔X 〕=E [X -E 〔X 〕]2. 〔4.7〕 称)(X D 为随机变量X 的标准差〔Standard deviation 〕或均方差〔Mean square deviation 〕,记为σ〔X 〕.根据定义可知,随机变量X 的方差反映了随机变量的取值与其数学期望的偏离程度.假设X 取值比较集中,那么D 〔X 〕较小,反之,假设X 取值比较分散,那么D 〔X 〕较大. 由于方差是随机变量X 的函数g 〔X 〕=[X -E 〔X 〕]2的数学期望.假设离散型随机变量X 的分布律为P {X =x k }=p k ,k =1,2,…,那么D 〔X 〕=k k kp X E x∑∞=-12)]([. 〔4.8〕假设连续型随机变量X 的概率密度为f 〔x 〕,那么D 〔X 〕=⎰+∞∞--.)()]([2x x f X E x d 〔4.9〕由此可见,方差D 〔X 〕是一个常数,它由随机变量的分布惟一确定.根据数学期望的性质可得:D 〔X 〕=E [X -E 〔X 〕]2=E [X 2-2X ·E 〔X 〕+[E 〔X 〕]2]=E 〔X 2〕-2E 〔X 〕·E 〔X 〕+[E 〔X 〕]2=E 〔X 2〕-[E 〔X 〕]2.于是得到常用计算方差的简便公式D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2. 〔4.10〕例4.11 设有甲,乙两种棉花,从中各抽取等量的样品进展检验,结果如下表:其中X ,Y 分别表示甲,乙两种棉花的纤维的长度〔单位:毫米〕,求D 〔X 〕与D 〔Y 〕,且评定它们的质量.解 由于E 〔X 〕=28×0.1+29×0.15+30×0.5+31×0.15+32×0.1=30, E 〔Y 〕=28×0.13+29×0.17+30×0.4+31×0.17+32×0.13=30,故得D 〔X 〕=〔28-30〕2×0.1+〔29-30〕2×0.15+〔30-30〕2×0.5+〔31-30〕2×0.15+〔32-30〕2×0.1=4×0.1+1×0.15+0×0.5+1×0.15+4×0.1=1.1,D 〔Y 〕=〔28-30〕2×0.13+〔29-30〕2×0.17+〔30-30〕2×0.4+〔31-30〕2×0.17+〔32-30〕2×0.13=4×0.13+1×0.17+0×0.4+1×0.17+4×0.13=1.38.因D 〔X 〕<D 〔Y 〕,所以甲种棉花纤维长度的方差小些,说明其纤维比较均匀,故甲种棉花质量较好.例4.12 设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧<≤-<≤-+.,0,10,1,01,1其他x x x x求D 〔X 〕.解 E 〔X 〕=⎰⎰-++-11)1()1(x x x x x x d d =0,E 〔X 2〕=⎰⎰-++-12012)1()1(x x x x x x d d =1/6,于是 D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=1/6.2.方差的性质方差有下面几条重要的性质.设随机变量X 与Y 的方差存在,那么 1°设c 为常数,那么D 〔c 〕=0;2°设c 为常数,那么D 〔cX 〕=c 2D 〔X 〕; 3°D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]; 4°假设X ,Y 互相独立,那么D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕; 5°对任意的常数c ≠E 〔X 〕,有D 〔X 〕<E [〔X -c 〕2]. 证 仅证性质4°,5°. 4°D 〔X ±Y 〕=E [〔X ±Y 〕-E 〔X ±Y 〕]2=E [〔X -E 〔X 〕〕±〔Y -E 〔Y 〕〕]2=E [X -E 〔X 〕]2±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]+E [Y -E 〔Y 〕]2 =D 〔X 〕+D 〔Y 〕±2E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕].当X 与Y 互相独立时,X -E 〔X 〕与Y -E 〔Y 〕也互相独立,由数学期望的性质有E [〔X -E 〔X 〕〕〔Y -E 〔Y 〕〕]=E 〔X -E 〔X 〕〕E 〔Y -E 〔Y 〕〕=0.因此有D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕.性质4°可以推广到任意有限多个互相独立的随机变量之和的情况.5°对任意常数c ,有E [〔X -c 〕2]=E [〔X -E 〔X 〕+E 〔X 〕-c 〕2]=E [〔X -E 〔X 〕〕2]+2〔E 〔X 〕-c 〕·E [X -E 〔X 〕]+〔E 〔X 〕-c 〕2=D 〔X 〕+〔E 〔X 〕-c 〕2.故对任意常数c ≠EX ,有DX <E [〔X -c 〕2].例4.13 设随机变量X 的数学期望为E 〔X 〕,方差D 〔X 〕=σ2〔σ>0〕,令Y =σ)(X E X -,求E 〔Y 〕,D 〔Y 〕.解 E 〔Y 〕=[],0)()(1)]([1)(=-=-=⎥⎦⎤⎢⎣⎡-X E X E X E X E X E X E σσσ D 〔Y 〕=.1)(1)]([1)(2222===-=⎥⎦⎤⎢⎣⎡-σσσσσX D X E X D X E X D 常称Y 为X 的标准化随机变量.例4.14 设X 1,X 2,…,X n 互相独立,且服从同一〔0-1〕分布,分布律为P {X i =0}=1-p ,P {X i =1}=p , i =1,2,…,n .证明 X =X 1+X 2+…+X n 服从参数为n ,p 的二项分布,并求E 〔X 〕和D 〔X 〕.解 X 所有可能取值为0,1,…,n ,由独立性知X 以特定的方式〔例如前k 个取1,后n -k 个取0〕取k 〔0≤k ≤n 〕的概率为p k 〔1-p 〕n -k,而X 取k 的两两互不相容的方式共有knC 种,故P {X =k }=kn C p k 〔1-p 〕n -k , k =0,1,2,…,n ,即X 服从参数为n ,p 的二项分布. 由于E 〔X i 〕=0×〔1-p 〕+1×p =p ,D 〔X i 〕=〔0-p 〕2×〔1-p 〕+〔1-p 〕2×p =p 〔1-p 〕, i =1,2,…,n ,故有E 〔X 〕=.)(11np X E X E ni i n i i ==⎪⎭⎫ ⎝⎛∑∑==由于X 1,X 2,…,X n 互相独立,得D 〔X 〕= ).1()(11p np X D X D ni i n i i -==⎪⎭⎫ ⎝⎛∑∑==3.常用分布的方差 〔1〕 〔0-1〕分布设X 服从参数为p 的0-1分布,其分布律为由例4.14知,D 〔X 〕=p 〔1-p 〕. 〔2〕 二项分布设X 服从参数为n ,p 的二项分布,由例4.14知,D 〔X 〕=np 〔1-p 〕. 〔3〕 泊松分布设X 服从参数为λ的泊松分布,由上一节知E 〔X 〕=λ,又E 〔X 2〕=E [X 〔X -1〕+X ]=E [X 〔X -1〕]+E 〔X 〕=∑∑∞=--∞=-+-=+-2220)!2(!)1(k k k kk k k k λλλλλλλee=λ2e -λ·e λ+λ=λ2+λ,从而有D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=λ2+λ -λ2=λ.〔4〕 均匀分布设X 服从[a ,b ]上的均匀分布,由上一节知E 〔X 〕=2ba +,又 E 〔X 2〕=3222b ab a x a b x ba ++=-⎰d , 所以D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=12)()(41)(312222a b b a b ab a -=+-++.〔5〕 指数分布设X 服从参数为λ的指数分布,由上一节知.E 〔X 〕=1/λ,又E 〔X 2〕=222λλλ=⎰-bax x x d e ,所以D 〔X 〕=E 〔X 2〕-[E 〔X 〕]2=.112222λλλ=⎪⎭⎫⎝⎛-〔6〕 正态分布 设X ~N 〔μ,σ2〕,由上一节知E 〔X 〕=μ,从而D 〔X 〕=[]⎰⎰∞+∞--∞+∞--=--d e πd x x x x f X E x x 222)(2221)()()(σμσμ令σμ-x =t 那么D 〔X 〕=)(22222222222⎰⎰∞+∞--∞+∞--∞+∞--+-=t t t t t t t d eeπd eπσσ=)20(22ππ+σ =σ2.由此可知:正态分布的概率密度中的两个参数μ和σ分别是该分布的数学期望和均方差.因此正态分布完全可由它的数学期望和方差所确定.再者,由上一章第五节例3.17知道,假设X i ~N 〔μi ,σi 2〕,i =1,2,…,n ,且它们互相独立,那么它们的线性组合c 1X 1+c 2X 2+…+c n X n 〔c 1,c 2,…,c n 是不全为零的常数〕仍然服从正态分布.于是由数学期望和方差的性质知道:c 1X 1+c 2X 2+…+c n X n ~⎪⎭⎫⎝⎛∑∑==n i ni i i i i c c N 1122,σμ.这是一个重要的结果.例4.15 设活塞的直径〔以cm 计〕X ~N 〔22.40,0.032〕,气缸的直径Y ~N 〔22.50,0.042〕,X ,Y 互相独立,任取一只活塞,任取一只气缸,求活塞能装入气缸的概率. 解按题意需求P {X <Y }=P {X -Y <0}. 令Z =X -Y ,那么E 〔Z 〕=E 〔X 〕-E 〔Y 〕=22.40-22.50=-0.10, D 〔Z 〕=D 〔X 〕+D 〔Y 〕=0.032+0.042=0.052,即Z ~N 〔-0.10,0.052〕, 故有P {X <Y }=P {Z <0}=⎪⎭⎫⎝⎛Φ=⎭⎬⎫⎩⎨⎧--<--05.010.005.0)10.0(005.0)10.0(Z P =Φ〔2〕=0.9772.第三节 协方差与相关系数对于二维随机变量〔X ,Y 〕,数学期望E 〔X 〕,E 〔Y 〕只反映了X 和Y 各自的平均值,而D 〔X 〕,D 〔Y 〕反映的是X 和Y 各自偏离平均值的程度,它们都没有反映X 与Y 之间的关系.在实际问题中,每对随机变量往往互相影响、互相联络.例如,人的年龄与身高;某种产品的产量与价格等.随机变量的这种互相联络称为相关关系,它们也是一类重要的数字特征,本节讨论有关这方面的数字特征.定义4.3 设〔X ,Y 〕为二维随机变量,称E {[X -E 〔X 〕][Y -E 〔Y 〕]}为随机变量X ,Y 的协方差〔Covariance 〕,记为Cov 〔X ,Y 〕,即Cov 〔X ,Y 〕=E {[X -E 〔X 〕][Y -E 〔Y 〕]}. 〔4.11〕 而)()(),cov(Y D X D Y X 称为随机变量X ,Y 的相关系数〔Correlation coefficient 〕或标准协方差〔Standard covariance 〕,记为ρXY ,即ρXY =)()(),cov(Y D X D Y X . 〔4.12〕特别地,Cov 〔X ,X 〕=E {[X -E 〔X 〕][X -E 〔X 〕]}=D 〔X 〕, Cov 〔Y ,Y 〕=E {[Y -E 〔Y 〕][Y -E 〔Y 〕]}=D 〔Y 〕.故方差D 〔X 〕,D 〔Y 〕是协方差的特例.由上述定义及方差的性质可得D 〔X ±Y 〕=D 〔X 〕+D 〔Y 〕±2Cov 〔X ,Y 〕.由协方差的定义及数学期望的性质可得以下实用计算公式Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕E 〔Y 〕. 〔4.13〕假设〔X ,Y 〕为二维离散型随机变量,其结合分布律为P {X =x i ,Y =y j }=p ij ,i ,j =1,2,…,那么有Cov 〔X ,Y 〕=[][]∑∑--ijijiipY E y X E x )()(. 〔4.14〕假设〔X ,Y 〕为二维连续型随机变量,其概率密度为f 〔x ,y 〕,那么有Cov 〔X ,Y 〕=[][]⎰⎰+∞∞-+∞∞---y x y x f Y E y X E x d d ),()()(. 〔4.15〕例4.16 设〔X ,Y 〕的分布律为表4-120<p <1,求Cov 〔X ,Y 〕和XY .解 易知X 的分布律为P {X =1}=p ,P {X =0}=1-p ,故 E 〔X 〕=p , D 〔X 〕=p 〔1-p 〕.同理E 〔Y 〕=p ,D 〔Y 〕=p 〔1-p 〕,因此Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕·E 〔Y 〕=p -p 2=p 〔1-p 〕, 而ρXY =1)1()1()1(),cov(=-⋅--=⋅p p p p p p DY DX Y X例4.17 设〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎩⎨⎧<<<<+.,0,10,10,其他y x y x求Cov 〔X ,Y 〕.解 由于f X 〔x 〕=⎪⎩⎪⎨⎧<<+,,0,10,21其他x x f Y 〔y 〕=⎪⎩⎪⎨⎧<<+.,0,10,21其他y y E 〔X 〕=127)21(10=+⎰x x x d ,E 〔Y 〕=127)21(10=+⎰y y y d ,E 〔XY 〕=31)(10102101021010=+=+⎰⎰⎰⎰⎰⎰y x xy y x y x y x y x xy d d d d d d因此 Cov 〔X ,Y 〕=E 〔XY 〕-E 〔X 〕E 〔Y 〕=144112712731-=⨯-. 协方差具有以下性质:1°假设X 与Y 互相独立,那么Cov 〔X ,Y 〕=0; 2°Cov 〔X ,Y 〕=Cov 〔Y ,X 〕; 3°Cov 〔aX ,bY 〕=ab Cov 〔X ,Y 〕;4°Cov 〔X 1+X 2,Y 〕=Cov 〔X 1,Y 〕+Cov 〔X 2,Y 〕. 证 仅证性质4°,其余留给读者.Cov 〔X 1+X 2,Y 〕 =E [〔X 1+X 2〕Y ]-E 〔X 1+X 2〕E 〔Y 〕=E 〔X 1Y 〕+E 〔X 2Y 〕-E 〔X 1〕E 〔Y 〕-E 〔X 2〕E 〔Y 〕 =[E 〔X 1Y 〕-E 〔X 1〕E 〔Y 〕]+[E 〔X 2Y 〕-E 〔X 2〕E 〔Y 〕] =Cov 〔X 1,Y 〕+Cov 〔X 2,Y 〕.下面给出相关系数ρXY 的几条重要性质,并说明ρXY 的含义.定理4.3 设D 〔X 〕>0,D 〔Y 〕>0,ρXY 为〔X ,Y 〕的相关系数,那么 1°假设X ,Y 互相独立,那么ρXY =0; 2°|ρXY |≤1;3°|ρXY |=1的充要条件是存在常数a ,b 使P {Y =aX +b }=1〔a ≠0〕. 证 由协方差的性质1°及相关系数的定义可知1°成立. 2°对任意实数t ,有D 〔Y -tX 〕=E [〔Y -tX 〕-E 〔Y -tX 〕]2=E [〔Y -E 〔Y 〕〕-t 〔X -E 〔X 〕〕]2 =E [Y -E 〔Y 〕]2-2tE [Y -E 〔Y 〕][X -E 〔X 〕]+t 2E [X -E〔X 〕]2=t 2D 〔X 〕-2t Cov 〔X ,Y 〕+D 〔Y 〕=[])(),cov()()(),cov()(22X D Y X Y D X D Y X t X D -+⎥⎦⎤⎢⎣⎡-. 令t =)(),cov(X D Y X =b ,于是D 〔Y -bX 〕=[][]).1)(()()(),cov(1)()(),cov()(222XY Y D Y D X D Y X Y D X D Y X Y D ρ-=⎥⎦⎤⎢⎣⎡-=-由于方差不能为负,所以1-2XY ρ≥0,从而|ρXY |≤1.性质3°的证明较复杂,从略.当ρXY =0时,称X 与Y 不相关,由性质1°可知,当X 与Y 互相独立时,ρXY =0,即X 与Y 不相关.反之不一定成立,即X 与Y 不相关,X 与Y 却不一定互相独立.例4.18 设X 服从[0,2π]上均匀分布,Y =cos X ,Z =cos 〔X +a 〕,这里a 是常数.求ρYZ .解 E 〔Y 〕=⎰⋅πd π2021cos x x =0, E 〔Z 〕= ⎰+πd π20)cos(21x a x =0, D 〔Y 〕=E {[Y -E 〔Y 〕]2}=21cos 21202=⎰πd πx x , D 〔Z 〕=E {[Z -E 〔Z 〕]2}=21)(cos 21202=+⎰πd πx a x , Cov 〔Y ,Z 〕=E {[Y -E 〔Y 〕][Z -E 〔Z 〕]}= a x a x x cos 21)cos(cos 2120=+•⎰πd π, 因此 ρYZ =.cos 2121cos 21)()(),cov(a a Z D Y D Z Y =⋅=⋅ ① 当a =0时,ρYZ =1,Y =Z ,存在线性关系;② 当a=π时,ρYZ =-1,Y =-Z ,存在线性关系; ③ 当a =2π或23π时,ρYZ =0,这时Y 与Z 不相关,但这时却有Y 2+Z 2=1,因此,Y 与Z不独立.这个例子说明:当两个随机变量不相关时,它们并不一定互相独立,它们之间还可能存在其他的函数关系.定理4.3 告诉我们,相关系数ρXY 描绘了随机变量X ,Y 的线性相关程度,|ρXY |愈接近1,那么X 与Y 之间愈接近线性关系.当|ρXY |=1时,X 与Y 之间依概率1线性相关.不过,下例说明当〔X ,Y 〕是二维正态随机变量时,X 和Y 不相关与X 和Y 互相独立是等价的.例4.19 设〔X ,Y 〕服从二维正态分布,它的概率密度为f 〔x ,y 〕=⨯-221121ρσσπ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------2222212121212)())((2)()1(21exp σμσσμμρσμρy y x x 求Cov 〔X ,Y 〕和ρXY .解 可以计算得〔X ,Y 〕的边缘概率密度为f X 〔x 〕=21212)(121σμσ--x e π,-∞<x <+∞,f Y 〔y 〕=22222)(221σμσ--x e π,-∞<y <+∞,故E 〔X 〕=μ1,E 〔Y 〕=μ2, D 〔X 〕=σ12,D 〔Y 〕=σ22. 而Cov 〔X ,Y 〕=⨯-=--⎰⎰+∞∞-+∞∞-22121121),()()(ρσπσμμy x y x f y x d dy x y x x y x d d ee-2112222121)1(212)(21)()(⎥⎦⎤⎢⎣⎡------∞+∞-∞+∞---⎰⎰σμρσμρσμμμ令t =⎪⎪⎭⎫⎝⎛----1122211σμρσμρx y ,u =11σμ-x ,那么 Cov 〔X ,Y 〕=⎰⎰∞+∞-∞+∞---+-u t u tu t u d d e π2222122122)1(21σρσρσσ =⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛⎰⎰∞+∞--∞+∞--t e u u t u d d e π22221222ρσσ +⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫⎝⎛-⎰⎰∞+∞--∞+∞--t t u u t u d e d eπ222212221ρσσ =.2222121σρσσρσ=⋅πππ于是ρXY=ρ.这说明二维正态随机变量〔X ,Y 〕的概率密度中的参数ρ就是X 和Y 的相关系数,从而二维正态随机变量的分布完全可由X ,Y 的各自的数学期望、方差以及它们的相关系数所确定.由上一章讨论可知,假设〔X ,Y 〕服从二维正态分布,那么X 和Y 互相独立的充要条件是ρ=0,即X 与Y 不相关.因此,对于二维正态随机变量〔X ,Y 〕来说,X 和Y 不相关与X 和Y 互相独立是等价的.第四节 矩、协方差矩阵数学期望、方差、协方差是随机变量最常用的数字特征,它们都是特殊的矩〔Moment 〕.矩是更广泛的数字特征.定义4.4 设X 和Y 是随机变量,假设E 〔X k 〕,k =1,2,…存在,称它为X 的k 阶原点矩,简称k 阶矩.假设 E [X -E 〔X 〕]k , k =1,2,… 存在,称它为X 的k 阶中心矩.假设 E 〔X k Y l 〕, k ,l =1,2,… 存在,称它为X 和Y 的k +l 阶混合矩.假设 E {[X -E 〔X 〕]k [Y -E 〔Y 〕]l } 存在,称它为X 和Y 的k +l 阶混合中心矩.显然,X 的数学期望E 〔X 〕是X 的一阶原点矩,方差D 〔X 〕是X 的二阶中心矩,协方差Cov 〔X ,Y 〕是X 和Y 的1+1阶混合中心矩.当X 为离散型随机变量,其分布律为P {X =x i }=p i ,那么E 〔X k〕=∑∞=1i i kip x,E [X -E 〔X 〕]k=1[()]kii i x E X p ∞=-∑.当X 为连续型随机变量,其概率密度为f 〔x 〕,那么E 〔X k 〕=⎰+∞∞-x x f x k d )(,E [X -E 〔X 〕]k =⎰+∞∞--x x f X E x k d )()]([.下面介绍n 维随机变量的协方差矩阵.设n 维随机变量〔X 1,X 2,…,X n 〕的1+1阶混合中心矩σij =Cov 〔X i ,X j 〕=E {[X i -E 〔X i 〕][X j -E 〔X j 〕]}, i ,j =1,2,…,n都存在,那么称矩阵Σ=⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡nn n n n n σσσσσσσσσ 212222111211 为n 维随机变量〔X 1,X 2,…,X n 〕的协方差矩阵. 由于σij =σji 〔i ,j =1,2,…,n 〕,因此Σ是一个对称矩阵. 协方差矩阵给出了n 维随机变量的全部方差及协方差,因此在研究n 维随机变量的统计规律时,协方差矩阵是很重要的.利用协方差矩阵还可以引入n 维正态分布的概率密度. 首先用协方差矩阵重写二维正态随机变量〔X 1,X 2〕的概率密度. f 〔x 1,x 2〕=221121ρσσ-π×.)())((2)()1(21exp 22222212211212112⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎦⎤⎢⎣⎡-+------σμσσμμρσμρx x x x 令X =⎪⎪⎭⎫⎝⎛21x x ,μ=⎪⎪⎭⎫⎝⎛21μμ,〔X 1,X 2〕的协方差矩阵为 Σ=.2121212122211211⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛σσρσσρσσσσσσ 它的行列式|Σ|=σ12σ22〔1-ρ2〕,逆阵Σ-1=.121212122⎪⎪⎭⎫⎝⎛--σσρσσρσσ∑ 由于 〔X -μ〕T Σ-1〔X -μ〕= .),(12211212121222211⎪⎪⎭⎫⎝⎛--⎪⎪⎭⎫ ⎝⎛----μμσσρσσρσσμμx x x x ∑ =,)())((2)(1122222212211212112⎥⎦⎤⎢⎣⎡-+-----σμσσμμρσμρx x x x , 因此〔X 1,X 2〕的概率密度可写成f 〔x 1,x 2〕=.)()(21exp 211⎭⎬⎫⎩⎨⎧----μ∑μ∑X X T π上式容易推广到n 维的情形.设〔X 1,X 2,…,X n 〕是n 维随机变量,令X =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛n x x x 21, μ=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫ ⎝⎛)()()(2121n n X E X E X E μμμ, 定义n 维正态随机变量〔X 1,X 2,…,X n 〕的概率密度为f 〔x 1,x 2,…,x n 〕=111exp ()().2(2T nX X πμμ-⎧⎫--∑-⎨⎬⎩⎭其中Σ是〔X 1,X 2,…,X n 〕的协方差矩阵.n 维正态随机变量具有以下几条重要性质: 1°n 维随机变量〔X 1,X 2,…,X n 〕服从n 维正态分布的充要条件是X 1,X 2,…,X n的任意的线性组合l 1X 1+l 2X 2+…+l n X n服从一维正态分布.〔其中l 1,l 2,…,l n 不全为零〕.2°假设〔X 1,X 2,…,X n 〕服从n 维正态分布,设Y 1,Y 2,…,Y k 是X 1,X 2,…,X n 的线性函数,那么〔Y 1,Y 2,…,Y k 〕服从k 维正态分布.3°设〔X 1,X 2,…,X n 〕服从n 维正态分布,那么X 1,X 2,…,X n 互相独立的充要条件是X 1,X 2,…,X n 两两不相关.小结随机变量的数字特征是由随机变量的分布确定的,能描绘随机变量某一个方面的特征的常数.最重要的数字特征是数学期望和方差.数学期望E〔X〕描绘随机变量X取值的平均大小,方差D〔X〕=E{[X-E〔X〕]2}描绘随机变量X与它自己的数学期望E〔X〕的偏离程度.数学期望和方差虽不能像分布函数、分布律、概率密度一样完好地描绘随机变量,但它们能描绘随机变量的重要方面或人们最关心方面的特征,它们在应用和理论上都非常重要.要掌握随机变量的函数Y=g〔X〕的数学期望E〔Y〕=E[g〔X〕]的计算公式〔4.3〕和〔4.4〕.这两个公式的意义在于当我们求E〔Y〕时,不必先求出Y=g〔X〕的分布律或概率密度,而只需利用X的分布律或概率密度就可以了,这样做的好处是明显的.我们常利用公式D〔X〕=E〔X2〕-[E〔X〕]2来计算方差D〔X〕,请注意这里E〔X2〕和[E〔X〕]2的区别.要掌握数学期望和方差的性质,提请读者注意的是:〔1〕当X1,X2独立或X1,X2不相关时,才有E〔X1X2〕=E〔X1〕·E〔X2〕;〔2〕设c为常数,那么有D〔cX〕=c2D〔X〕;〔3〕D〔X1±X2〕=D〔X1〕+D〔X2〕±2Cov〔X1,X2〕,当X1,X2独立或不相关时才有D〔X1+X2〕=D〔X1〕+D〔X2〕.例如:假设X1,X2独立,那么有D〔2X1-3X2〕=4D〔X1〕+9D〔X2〕.相关系数ρXY有时也称为线性相关系数,它是一个可以用来描绘随机变量〔X,Y〕的两个分量X,Y之间的线性关系严密程度的数字特征.当|ρXY|较小时X,Y的线性相关的程度较差;当ρXY=0时称X,Y不相关.不相关是指X,Y之间不存在线性关系,X,Y不相关,它们还可能存在除线性关系之外的关系〔参见第3节例4.18〕,又由于X,Y互相独立是指X,Y的一般关系而言的,因此有以下的结论:X,Y互相独立那么X,Y一定不相关;反之,假设X,Y不相关那么X,Y不一定互相独立.特别,对于二维正态变量〔X,Y,〕,X和Y不相关与X和Y互相独立是等价的.而二元正态变量的相关系数ρXY就是参数ρ.于是,用“ρ=0〞是否成立来检验X,Y是否互相独立是很方便的.重要术语及主题数学期望随机变量函数的数学期望数学期望的性质方差标准差方差的性质协方差相关系数相关系数的性质X,Y不相关矩协方差矩阵分布名称分布律或概率密度期望方差参数范围两点分布P{X=1}=p, P{X=0}=q p pq 0<p<1q=1-p二项分布X~B〔n,p〕P{X=k}=knkknqpC〔k=0,1,2,…,n〕np npq 0<p<1q=1-pn为自然数习 题 四求E 〔X 〕,E 〔X 〕,E 〔2X +3〕.2.100个产品中有10个次品,求任意取出的5个产品中的次品数的数学期望、方差. 1234.袋中有N 只球,其中的白球数X 为一随机变量,E 〔X 〕=n ,问从袋中任取1球为白球的概率是多少?5.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤-<≤.,0,21,2,10,其他x x x x求E 〔X 〕,D 〔X 〕.6.设随机变量X ,Y ,Z 互相独立,且E 〔X 〕=5,E 〔Y 〕=11,E 〔Z 〕=8,求以下随机变量的数学期望.〔1〕 U =2X +3Y +1; 〔2〕 V =YZ -4X .7.设随机变量X ,Y 互相独立,且E 〔X 〕=E 〔Y 〕=3,D 〔X 〕=12,D 〔Y 〕=16,求E 〔3X -2Y 〕,D 〔2X -3Y 〕.8.设随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎩⎨⎧<<<<.,0,0,10,其他x y x k试确定常数k ,并求E 〔XY 〕.9.设X ,Y 是互相独立的随机变量,其概率密度分别为f X 〔x 〕=⎩⎨⎧≤≤;,0,10,2其他x x f Y 〔y 〕=⎩⎨⎧>--.,0,0,)5(其他y y e 求E 〔XY 〕.10.设随机变量X ,Y 的概率密度分别为f X 〔x 〕=⎩⎨⎧≤>-;0,0,0,22x x x e f Y 〔y 〕=⎩⎨⎧≤>-.0,0,0,44y y y e 求〔1〕 E 〔X +Y 〕;〔2〕 E 〔2X -3Y 2〕.11.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧<≥-.0,0,0,22x x cx xke求〔1〕 系数c ;〔2〕 E 〔X 〕;〔3〕 D 〔X 〕.12.袋中有12个零件,其中9个合格品,3个废品.安装机器时,从袋中一个一个地取出〔取出后不放回〕,设在取出合格品之前已取出的废品数为随机变量X ,求E 〔X 〕和D 〔X 〕. 13.一工厂消费某种设备的寿命X 〔以年计〕服从指数分布,概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤>-.0,0,0,414x x xe为确保消费者的利益,工厂规定出售的设备假设在一年内损坏可以调换.假设售出一台设备,工厂获利100元,而调换一台那么损失200元,试求工厂出售一台设备赢利的数学期望. 14.设X 1,X 2,…,X n 是互相独立的随机变量,且有E 〔X i 〕=μ,D 〔X i 〕=σ2,i =1,2,…,n ,记∑==n i i S X n X 12,1,S 2=∑=--ni i X X n 12)(11. 〔1〕 验证)(X E =μ,)(X D =n2σ;〔2〕 验证S 2=)(11122∑=--ni i X n X n ; 〔3〕 验证E 〔S 2〕=σ2.15.对随机变量X 和Y ,D 〔X 〕=2,D 〔Y 〕=3,Cov 〔X ,Y 〕=-1, 计算:Cov 〔3X -2Y +1,X +4Y -3〕.16.设二维随机变量〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎪⎩⎪⎨⎧≤+.,0,1122其他y x ,π试验证X 和Y 是不相关的,但X 和Y 不是互相独立的.验证X 和Y 是不相关的,但X 和Y 不是互相独立的. 18.设二维随机变量〔X ,Y 〕在以〔0,0〕,〔0,1〕,〔1,0〕为顶点的三角形区域上服从均匀分布,求Cov 〔X ,Y 〕,ρXY . 19.设〔X ,Y 〕的概率密度为f 〔x ,y 〕=⎪⎩⎪⎨⎧≤≤≤≤+.0,20,20),sin(21其他,y x y x ππ求协方差Cov 〔X ,Y 〕和相关系数ρXY . 20.二维随机变量〔X ,Y 〕的协方差矩阵为⎥⎦⎤⎢⎣⎡4111,试求Z 1=X -2Y 和Z 2=2X -Y 的相关系数. 21.对于两个随机变量V ,W ,假设E 〔V 2〕,E 〔W 2〕存在,证明:[E 〔VW 〕]2≤E 〔V 2〕E 〔W 2〕.这一不等式称为柯西许瓦兹〔Couchy -Schwarz 〕不等式.22.假设一设备开机后无故障工作的时间X 服从参数λ=1/5的指数分布.设备定时开机,出现故障时自动关机,而在无故障的情况下工作2小时便关机.试求该设备每次开机无故障工作的时间Y 的分布函数F 〔y 〕. 〔2002研考〕 23.甲、乙两箱中装有同种产品,其中甲箱中装有3件合格品和3件次品,乙箱中仅装有3件合格品.从甲箱中任取3件产品放乙箱后,求:〔1〕乙箱中次品件数Z 的数学期望;〔2〕从乙箱中任取一件产品是次品的概率. 〔2003研考〕 24.假设由自动线加工的某种零件的内径X 〔毫米〕服从正态分布N 〔μ,1〕,内径小于10或大于12为不合格品,其余为合格品.销售每件合格品获利,销售每件不合格品亏损,销售利润T 〔单位:元〕与销售零件的内径X 有如下关系T =⎪⎩⎪⎨⎧>-≤≤<-.12,5,1210,20,10,1X X X 若若若 问:平均直径μ取何值时,销售一个零件的平均利润最大? 〔1994研考〕25.设随机变量X 的概率密度为f 〔x 〕=⎪⎩⎪⎨⎧≤≤.,0,0,2cos 21其他πx x对X 独立地重复观察4次,用Y 表示观察值大于π/3的次数,求Y 2的数学期望.〔2002研考〕26.两台同样的自动记录仪,每台无故障工作的时间T i 〔i =1,2〕服从参数为5的指数分布,首先开动其中一台,当其发生故障时停用而另一台自动开启.试求两台记录仪无故障工作的总时间T =T 1+T 2的概率密度f T 〔t 〕,数学期望E 〔T 〕及方差D 〔T 〕. 〔1997研考〕 27.设两个随机变量X ,Y 互相独立,且都服从均值为0,方差为1/2的正态分布,求随机变量|X -Y |的方差. 〔1998研考〕 28.某流水消费线上每个产品不合格的概率为p 〔0<p <1〕,各产品合格与否互相独立,当出现一个不合格产品时,即停机检修.设开机后第一次停机时已消费了的产品个数为X ,求E 〔X 〕和D 〔X 〕. 〔2000研考〕 29.设随机变量X 和Y 的结合分布在点〔0,1〕,〔1,0〕及〔1,1〕为顶点的三角形区域上服从均匀分布.〔如图〕,试求随机变量U =X +Y 的方差. 〔2001研考〕 30.设随机变量U 在区间[-2,2]上服从均匀分布,随机变量X =⎩⎨⎧->-≤-,U ,U 1,11,1若若 Y =⎩⎨⎧>≤-.1,11,1U ,U 若若试求〔1〕X 和Y 的结合概率分布;〔2〕D 〔X +Y 〕. 〔2002研考〕 31.设随机变量X 的概率密度为f 〔x 〕=x-e 21,〔-∞<x <+∞〕 〔1〕 求E 〔X 〕及D 〔X 〕;〔2〕 求Cov 〔X ,|X |〕,并问X 与|X |是否不相关?〔3〕 问X 与|X |是否互相独立,为什么? 〔1993研考〕 32.随机变量X 和Y 分别服从正态分布N 〔1,32〕和N 〔0,42〕,且X 与Y 的相关系数ρXY =-1/2,设Z =23YX +. 〔1〕 求Z 的数学期望E 〔Z 〕和方差D 〔Z 〕; 〔2〕 求X 与Z 的相关系数ρXZ ;〔3〕 问X 与Z 是否互相独立,为什么? 〔1994研考〕33.将一枚硬币重复掷n 次,以X 和Y 表示正面向上和反面向上的次数.试求X 和Y 的相关系数ρXY . 〔2001研考〕 Y X -1 0 10 10.07 0.18 0.15 0.08 0.32 0.20试求X 和Y 的相关系数. 〔2002研考〕 35.对于任意两事件A 和B ,0<P 〔A 〕<1,0<P 〔B 〕<1,那么称。
随机变量的数字特征第四章随机变量的数字特征第⼀节基本概念1、概念⽹络图→切⽐雪夫不等式矩⽅差期望⼀维随机变量→协⽅差矩阵相关系数协⽅差⽅差期望⼆维随机变量2、重要公式和结论例4.1:箱内装有5个电⼦元件,其中2个是次品,现每次从箱⼦中随机地取出1件进⾏检验,直到查出全部次品为⽌,求所需检验次数的数学期望。
例4.2:将⼀均匀骰⼦独⽴地抛掷3次,求出现的点数之和的数学期望。
例4.3:袋中装有标着1,2,…,9号码的9只球,从袋中有放回地取出4只球,求所得号码之和X 的数学期望。
例4.4:设随机变量X 的概率密度为,)(21)(||+∞<<-∞=-x e x f x求E (X )及D (X )。
例4.5:设随机变量X~N (0, 4), Y~U (0, 4),且X ,Y 相互独⽴,求E (XY ),D (X+Y )及D (2X-3Y )。
例4.6:罐中有5颗围棋⼦,其中2颗为⽩⼦,另3颗为⿊⼦,如果有放回地每次取1⼦,共取3次,求3次中取到的⽩⼦次数X 的数学期望与⽅差。
例4.7:在上例中,若将抽样⽅式改为不放回抽样,则结果⼜是如何?例4.8:“随机变量X 的数学期望E(X)= µ.”的充分条件:(1)X 的密度函数为f(x)=λµλ--x e21 (λ>0,-∞(2) X 的密度函数为222)(21)(σµσπ--=x ex f ,(+∞<<∞-x )例4.9:利⽤切⽐雪夫不等式估计随机变量与其数学期望之差⼤于3倍标准差的概率。
例4.10:设随机变量X 和Y 的⽅差存在且不等于0,则D (X+Y )=D (X )+D (Y )是X 和Y(A )不相关的充分条件,且不是必要条件;(B )独⽴的充分条件,但不是必要条件;(C )不相关的充分必要条件;(D )独⽴的充分必要条件。
()。
例4.11:设X 与Y 相互独⽴都服从P (λ),令U=2X+Y ,V=2X-Y 。