概率论与数理统计课件(第4章)
- 格式:docx
- 大小:133.68 KB
- 文档页数:22
北京理工大学《概率论与数理统计》分布函数能够完整地描述随机变量的统计特性,但在某些实际问题中,不需要全面考查随机变量的变化,只需知道它的随机变量的某些数字特征也就够了.评定某企业的经营能力时,只要知道该企业例如:年平均赢利水平研究水稻品种优劣时,我们关心的是稻穗的平均粒数及平均重量考察一射手的水平,既要看他的平均环数是否高,还要看他弹着点的范围是否小,即数据的波动是否小.由上面的例子看到,平均盈利水平、平均粒数、平均环数、数据的波动大小等,都是与随机变量有关的某个数值,能清晰地描述随机变量在某些方面的重要特征,这些数字特征在理论和实践上都具有重要意义.另一方面,对于一些常用的重要分布,如二项分布、泊松分布、指数分布、正态分布等,其中的参数恰好就是某些数字特征,因此,只要知道了这些数字特征,就能完全确定其具体的分布.第四章随机变量的数字特征4.1随机变量的平均取值——数学期望4.2随机变量取值平均偏离平均值的情况——方差4.3 描述两个随机变量之间的某种关系的数——协方差与相关系数4.1 数学期望一离散型随机变量的数学期望二连续型随机变量的数学期望三常见分布的数学期望四随机变量函数的数学期望五数学期望的性质六、数学期望的应用一离散型随机变量的数学期望引例射击问题设某射击手在同样的条件下,瞄准靶子相继射击90次,(命中的环数是一个随机变量).射中次数记录如下命中环数Y0 1 2 3 4 5命中次数n k 2 13 15 10 20 30频率n k/n2/90 13/90 15/90 10/90 20/90 30/90试问:该射手每次射击平均命中靶多少环?解:平均命中环数这是以频率为权的加权平均命中环数Y0 1 2 3 4 5命中次数n k2 13 15 10 20 30频率n k /n 2/90 13/90 15/90 10/90 20/90 30/900211321531042053090×+×+×+×+×+×=21315102030012345909090909090=×+×+×+×+×+×50k k n k n =⋅∑ 3.37.==射中靶的总环数射击次数平均射中环数频率随机波动随机波动“平均射中环数”的稳定值?=由频率的稳定性知:当n 很大时:频率n k /n 稳定于概率p k 稳定于50k k n k n =⋅∑50k k k p =⋅∑50k k n k n =⋅∑“平均射中环数”等于射中环数的可能值与其概率之积的累加定义1 设X 是离散型随机变量,它的概率分布是:P {X =x k }=p k , k =1,2,…如果绝对收敛,则称它为X 的数学期望或均值.记为E (X ), 即如果发散,则称X 的数学期望不存在.1k k k x p ∞=∑1()k k k E X x p ∞==∑1||k k k x p∞=∑注意:随机变量的数学期望的本质就是加权平均数,它是一个数,不再是随机变量.注1:随机变量X 的数学期望完全是由它的概率分布确定的,而不应受X 的可能取值的排列次序的影响,因此要求绝对收敛1k k k xp ∞=<+∞∑11111(1)1ln 2234212n n−+−++−→− 1111111(2)1ln 22436852−−+−−+→注2.E (X )是一个实数,而非随机变量,它是一种以概率为权的加权平均,与一般的算术平均值不同,它从本质上体现了随机变量X 取可能值的真正的平均值,也称均值.当随机变量X 取各个可能值是等概率分布时,X 的期望值与算术平均值相等.假设X 1P80 85 90 1/4 1/4 1/21()800.25850.25+900.586.25E X =×+××=X 2P80 85 901/3 1/3 1/32()85.E X =注3.数学期望E(X)完全由随机变量X的概率分布确定,若X服从某一分布,也称E(X)是这一分布的数学期望.乙射手甲射手例1.甲、乙两个射击手,他们射击的分布律如下表所示,问:甲和乙谁的技术更好?击中环数8 9 10概率0.3 0.1 0.6击中环数8 9 10概率0.2 0.5 0.3单从分布列看不出好坏,解:设甲,乙两个射击手击中的环数分别为X 1,X 2E (X 1)=8×0.3+9×0.1+10×0.6=9.3(环)E (X 2)=8×0.2+9×0.5+10×0.3=9.1(环)例2.1654年职业赌徒德.梅尔向法国数学家帕斯卡提出一个使他苦恼很久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注50法郎,每局中无平局.他们约定,谁先赢三局,则得到全部100法郎的赌本.当甲赢了2局,乙赢了1局时,因故要中止赌博.现问这100法郎如何分才算公平?解:假如比赛继续进行下去,直到结束为止. 则需要2局.这时,可能的结果为:甲甲,甲乙,乙甲,乙乙即:甲赢得赌局的概率为3/4,而乙赢的概率为1/4.设:X、Y分别表示甲和乙得到的赌金数. 则分布律分别为:X0 100 P1/4 3/4Y0 100 P3/4 1/4这时,可能的结果为:甲甲,甲乙,乙甲,乙乙即:甲赢得赌局的概率为3/4,而乙赢的概率为1/4.E(X)=0×1/4+100×3/4=75E(Y)=0×3/4+100×1/4=25即甲、乙应该按照3:1的比例分配全部的赌本.例3.确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为30%,可得利润8万元,失败的机会为70%,将损失2万元.若存入银行,同期间的利率为5%,问是否做此项投资?解:设X 为此项投资的利润,则存入银行的利息:故应该选择该项投资.(注:投资有风险,投资须谨慎)X 8 −2P0.3 0.7此项投资的平均利润为:E (X )=8×0.3+(−2)×0.7=1(万元)10×0.05=0.5(万元)设X 是连续型随机变量,密度函数为f (x ).问题:如何寻找一个体现随机变量平均值的量.将X 离散化.二、连续型随机变量的数学期望在数轴上取等分点:…x −2<x −1<x 0<x 1<x 2<…x k +1−x k =∆x ,k =0,±1,….,并设x k 都是f (x )的连续点.则小区间[x i ,x i+1)阴影面积近似为f (x i )∆x i1()i x x f x dx+=∫()i f x x≈∆P {x i <X ≤x i +1}定义一个离散型随机变量X *如下:其数学期望存在,且绝对收敛时,P {X *=x i }=P {x i ≤X <x i +1} ≈f (x i )∆x对于X *,当当分点越来越密,即∆x →0时,可以认为X *=x i 当且仅当x i ≤X <x i +1(*)i i ix P X x =∑(*){*}i i iE X x P X x ==∑()i i ix f x x ≈∆∑0=lim ()i i x ix f x x ∆→∆∑则其分布律为E (X *) →E (X ) *0=lim x EX EX ∆→即有:+()xf x dx∞−∞=∫定义2:设X 是连续型随机变量,其密度函数为f (x ),如果绝对收敛,则称的值为X 的数学期望,如果积分发散,则称随机变量X 的数学期望不存在.+()xf x dx ∞−∞∫+||()x f x dx∞−∞∫即+()()E X xf x dx∞−∞=∫+()xf x dx ∞−∞∫记为E (X ).注意:随机变量的数学期望的本质就是加权平均数,它是一个数,不再是随机变量.三、常见分布的数学期望1.0−1分布设随机变量X服从参数为p的0−1分布,求EX.解:X的分布律为X0 1P1−p p则:E(X)=0×P{X=0}+1×P{X=1}=P{X=1}=p概率是数学期望的特例(第五章)2.二项分布X 的分布律为P {X =k }=C n k p k (1−p )n−k ,k =0,1,…,n .解:设随机变量X ~b (n ,p ),求EX .0{}nk EX kP X k ==∑0(1)n k k n k n k kC p p −=−∑1!(1)!()!n k n kk n k p p k n k −=−−∑1(1)(1)1(1)!(1)(1)!()!nk n k k n np p p k n k −−−−=−−−−∑11(1)1(1)n l k l ln ln l np Cp p −=−−−−=−∑1[(1)]n np p p −=+−np=抛掷一枚均匀硬币100次,能期望得到多少次正面3.泊松分布则解:X 的分布律为设随机变量X ~π(λ),求EX .{},0,1,2,!kP X k e k k λλ−=== 00(){}!k k k e E X kP X k k k λλ−∞∞=====∑∑11(1)!k k ek λλλ−∞−==−∑1!ii k i e i λλλ∞=−−=∑=e e λλλλ−=1!k k e k k λλ−∞==∑泊松分布的参数是λ4.几何分布解:X 的分布律为P {X =k }=q k −1p ,k =1,2,….p+q =1设随机变量X 服从参数为p 的几何分布,求EX .111(){}k k k E X kP Xk k pq∞∞−=====⋅∑∑11k k p k q∞−=⋅∑1=()kk p q ∞=′∑1=()k k p q ∞=′∑()1q p q′=−211(1)p q p=−重复掷一颗骰子平均掷多少次才能第一次出现6点设X ~U (a , b ),求E (X ).解:X 的概率密度为:X 的数学期望为:数学期望位于区间(a ,b )的中点.5.均匀分布1()0a xb f x b a<<=− 其它()()2bax a b E X xf x dx dx b a +∞−∞+===−∫∫设X 服从指数分布,求E (X ).分部积分法6.指数分布当概率密度表示为:对应的数学期望为θ.,0()0,x e x f x x λλ− >=≤ 0xxedx λλ+∞−=∫()()E X xf x dx +∞−∞=∫1λ=1,0()0,0xe xf x x θθ− > = ≤解:X 的概率密度为:设X ~N (μ,σ2),求E (X ).解:X 的概率密度为被积函数为奇函数,故此项积分为0.7.正态分布22()21()2x f x eµσπσ−−=()()E X xf x dx +∞−∞=∫22()212x xedxµσπσ−+∞−−∞=∫221()2x t t t edtµσσµπ−=+∞−−∞+∫ 2222122t t tedt edt σµππ+∞+∞−−−∞−∞+∫∫µ=N (0,1)的密度函数积分为1.注意:不是所有的随机变量都有数学期望例如:Cauchy 分布的密度函数为但发散故其数学期望不存在.21(),(1)f x x x π=−∞<<+∞+2||||()(1)x x f x dx dx x π+∞+∞−∞−∞=+∫∫四随机变量函数的数学期望设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望. 那么应该如何计算呢?一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来. 一旦我们知道了g(X)的分布,就可以按照期望的定义把E[g(X)]计算出来.例4.某商店对某种家用电器的销售采用先使用后付款的方式,记该种电器的使用寿命为X (以年计),规定:X ≤1,一台付款1500元;1<X ≤2,一台付款2000元2<X ≤3,一台付款2500元;X >3,一台付款3000元设X 服从指数分布,且平均寿命为10年,求该商店一台电器的平均收费.解:设该商店一台电器的收费为Y .要求E (Y )X 的分布函数为:1101,()0,0x e x F x x − −>=≤设该商店一台电器的收费为YX ≤1,一台付款1500元1 <X ≤2,一台付款2000元2 <X ≤3,一台付款2500元X >3,一台付款3000元1101,0()0,0x ex F x x − −>=≤P {Y =1500}=P {X ≤1}=F (1)=1−e −0.1=0.0952P {Y =2000}=P {1<X ≤2}=F (2)−F (1)=0.0861P {Y =2500}=P {2<X ≤3}=F (3)−F (2)=0.0779P {Y =3000}=P {X >3}=1−F (3)=0.7408设X 服从指数分布,且平均寿命为10年.Y 的分布律为所以该商店一台电器的平均收费,即Y 的数学期望为Y 1500 2000 2500 3000P0.0952 0.0861 0.0779 0.7408()15000.095220000.086125000.0779 30000.74082732.15E Y =×+×+×+×=使用上述方法必须先求出g(X)的分布,有时这一步骤是比较复杂的.那么是否可以不先求g(X)的分布,而只根据X的分布求E[g(X)]呢?例5.设离散型随机变量X 的概率分布如下表所示,求:Z=X 2的期望.X−11P214141E (Z )= g (0)×0.5+g (-1)×0.25+g (1)×0.25解:=0.5注:这里的.)(2x x g =(1)当X 为离散型随机变量时,分布律为P {X = x k }=p k ,k =1,2,⋯(2)当X 为连续型随机变量时,概率密度函数为f (x ).定理:设Y 是随机变量X 的函数,Y =g (X )(g 是连续函数)若级数绝对收敛,则有若积分绝对收敛,则有1()[()]()kkk E Y E g X g x p∞===∑()[()]()()E Y E g X g x f x dx+∞==∫1()k k k g x p ∞=∑()()g x f x dx+∞−∞∫该公式的重要性在于:当求E [g (X )]时,不必知道g (X )的分布,而只需知道X 的分布就可以了,这给求随机变量函数的期望带来很大方便.k k k g x p X E Y E g X g x f x dx X 1(),()[()]()(),∞=+∞−∞== ∑∫离散型连续型例6.设随机变量X~b(n, p),Y=e aX,求E(Y).解:因为X的分布律为所以有{}(1), 0,1,...,k k n knP X k C p p k n−==−= ()E Y=(1)nak k k n knke C p p−=−∑()(1)nk a k n knkC e p p−=−∑[(1)]a npe p=+−={}nakke P X k==∑例7.设X ~U [0,π],Y=sinX ,求E (Y ).解:因为X 的概率密度为所以有1,0()0,x f x ππ≤≤ =其他()sin ()E Y xf x dx +∞−∞=∫01sin x dx ππ⋅∫2π=定理:设Z 是随机变量X 和Y 的函数,Z =g (X,Y )(g 是连续函数),Z 是一维随机变量(1)若(X,Y )是二维离散型随机变量,概率分布为(2)若(X,Y )是二维连续型随机变量,概率密度为f (x, y ),则有这里假定上两式右边的积分或级数都绝对收敛11()[(,)](,)ijijj i E Z E g X Y g x y p∞∞====∑∑()[(,)](,)(,)E Z E g X Y g x y f x y dxdy+∞+∞−∞−∞==∫∫{,},,1,2,i j ij P X x Y y p i j ====则有几个常用的公式()[(,)](,)(,)E Z E g X Y g x y f x y dxdy+∞+∞−∞−∞==∫∫(,)EX xf x y dxdy+∞+∞−∞−∞=∫∫(,)EY yf x y dxdy+∞+∞−∞−∞=∫∫22()(,)E Y y f x y dxdy+∞+∞−∞−∞=∫∫22()(,)E X x f x y dxdy+∞+∞−∞−∞=∫∫()(,)E XY xyf x y dxdy+∞+∞−∞−∞=∫∫例8.设二维随机变量(X ,Y )的密度函数为求E (X ),E (Y ),E (X +Y ),E (XY ).解:21(13),02,01,(,)40,x y x y f x y +<<<< =其它()(,)E X xf x y dxdy+∞+∞−∞−∞=∫∫212001(13)4x xdx y dy =⋅+∫∫43=()(,)E Y yf x y dxdy+∞+∞−∞−∞=∫∫212001(13)4xdx y y dy +∫∫58=数学期望的性质注意:X ,Y 相互独立()()(,)E X Y x y f x y dxdy+∞+∞−∞−∞+=+∫∫(,)(,)xf x y dxdy yf x y dxdy+∞+∞+∞+∞−∞−∞−∞−∞+∫∫∫∫()()E X E Y +45473824=+=()(,)E XY xyf x y dxdy +∞+∞−∞−∞=∫∫2120011(13)22x xdx y y dy=⋅⋅+∫∫455386=⋅=()()E X E Y ⋅设X =(X 1,…, X n )为离散型随机向量,概率分布为≥ 1nnj j j j n P X =x ,,x =p ,j ,,j .11{()}1Z = g (X 1,…, X n ),若级数绝对收敛,则.<∞∑ nnnj j j j j j g x ,,x p 111()=∑ nnnn j j j jj j E Z =E g X ,,X g x ,,x p 1111()(())()设X =(X 1,…, X n )为连续型随机向量,联合密度函数为 n f x x 1(,,)Z = g (X 1,…, X n ),若积分绝对收敛,则+∞+∞−∞−∞∫∫n n ng x x f x x x x 111(,,)(,,)d d n E Z E g X X 1()=((,,))+∞+∞−∞−∞=∫∫n n ng x x f x x x x 111(,,)(,,)d d五数学期望的性质1.设C 是常数,则E (C )=C 4.设X 、Y 相互独立,则E (XY )=E (X )E (Y );2.若k 是常数,则E (kX )=kE (X )3.E (X +Y )=E (X )+E (Y )注意:由E (XY )=E (X )E (Y )不一定能推出X ,Y 独立推广(诸X i 相互独立时)推广11[]()nni i i i i i E C X C E X ===∑∑11[]()n ni i i i E X E X ===∏∏性质4 的逆命题不成立,即若E (X Y ) = E (X )E (Y ),X ,Y 不一定相互独立.反例XY p ij -1 0 1-10181818181818181810p • j838382p i•838382X Y P-1 0 1828284EX EY ==0;E XY ()=0;=E XY EX EY ()但P X Y 1{=-1,=-1}=8≠=P X P Y 23{=-1}{=-1}8××=30+2103-3+5=92X XY Y X XY Y E(3+2-+5)=3E()+2E()-E()+E(5)性质2和3×××EX EY =310+2-3+5性质4例9.设X ~N (10,4),Y ~U [1,5],且X 与Y 相互独立,求E (3X +2XY -Y +5).解:由已知,有E (X )=10, E (Y )=3.例10: 设X 1 , X 2…,X n 相互独立且都服从B (1, p ),求Z = X 1 + X 2+…+X n 的数学期望E (Z ).解:注: 由二项分布的可加性易知Z = X 1 + X 2+…+X n ~B (n, p ).EZ = E (X 1 + X 2+…+X n )= E (X 1 ) +E ( X 2)+…+E (X n )= p +p +…+p =n p求二项分布的数学期望的又一种方法.例11.(超几何分布的数学期望)设一批同类型的产品共有N 件,其中次品有M 件.今从中任取n (假定n ≤N −M )件,记这n 件中所含的次品数为X ,求E (X ).则有所以解: 引入X =X 1+X 2+…+X n且易知抽签模型,概率与试验次数无关例10和例11:将X 分解成数个随机变量之和,然后利用随机变量和的期望等于期望的和这一性质,此方法具有一定的意义.1,,1,2,,0,i i X i n i ==第件是次品第件不是次品iMP X N{1}==1()ni i EX E X ==∑ni i P X 1{1}==∑1ni M N ==∑nM N =为普查某种疾病,N 个人需验血.有如下两种验血方案:(1)分别化验每个人的血,共需化验N 次;(2)分组化验.每k 个人分为1组,k 个人的血混在一起化验,若结果为阴性,则只需化验一次;若为阳性,则对k 个人的血逐个化验,找出有病者,此时k 个人的血需化验k+1次.设每个人血液化验呈阳性的概率为p ,且每个人化验结果是相互独立的.试说明选择哪一方案较经济.验血方案的选择例13.六、数学期望的应用解:只需计算方案(2)所需化验次数X 的期望.。
解:X 的分布函数为依题意,当x <0时,当0≤x ≤2时,当x >2时,F (x )=P (X ≤x )F (x )=P (X ≤x )=0F (x )=P (X ≤x )=P (X <0)+P (0≤X ≤x )=0+kx 2=kx 2F (x )=P (X ≤x )=1例1.一个靶子是半径为2米的圆盘,设击中靶上任一同心圆盘上的点的概率与该盘的面积成正比,并设射击都能中靶.以X 表示弹着点与圆心的距离,试求随机变量X 的分布函数.当0≤x ≤2时,F (x )=P (X ≤x )=kx 2另外依题意F (2)=P (X ≤2)=k.22=1所以k 14=x x F x x x 20,0(),0241,2<⎧⎪⎪=≤≤⎨⎪>⎪⎩10.80.60.40.2-0.2-2-101234解得说明,存在一个非负可积函数f (x ),使得下式成立易知x x F x x x 20,0(),0241,2<⎧⎪⎪=≤≤⎨⎪>⎪⎩x x F x f x ,02()()20⎧≤≤⎪'==⎨⎪⎩其他()()xF x f t dt-∞=⎰1.定义:设随机变量X 的分布函数为F (x ),如果存在一个非负可积函数f (x ),使对任意的实数x ,均有则称X 是连续型随机变量(Continuous Random Variable ),称f (x )是X 的概率密度函数,简称概率密度(Probability Density Function ).()()xF x f t dt-∞=⎰连续型随机变量X的分布函数F(x)和概率密度f(x)统称为X的概率分布,简称X的分布.易知此时分布函数F(x)是连续函数,即连续型随机变量的分布是连续函数.2.概率密度函数的性质(1)f (x ) ≥ 0(2)这两条性质是判定一个函数f (x )是否为某r.v.X 的概率密度函数的充要条件.f (x )xo 面积为1+()1f x dx ∞-∞=⎰(3)P (a <X ≤b )=F (b )-F (a )如 f (x )xo a b (4)()()GP X G f x dx∈=⎰()()b a f x dx f x dx -∞-∞=-⎰⎰()baf x dx =⎰()()a P X a f x dx+∞>=⎰(5)在f (x )的连续点x 处,有f (x )=F '(x )(6)设x 为f (x )的连续点,当∆x 较小,则有P (x< X ≤x+∆x )故X 的密度f (x )在x 这一点的值,恰好是X 落在区间(x ,x +∆x ]上的概率与区间长度∆x 之比.它反映了X 在x 附近单位长区间上取值的概率.x xx f t dt f x x()()+∆=≈⎰∆连续型随机变量密度函数的性质与离散型随机变量分布律的性质非常相似,但是,密度函数不是概率!(7)P (X =x 0)=F (x 0)-F (x 0-0)P (a <X ≤b )=P (a ≤X ≤b )=P (a <X <b )=P (a ≤X <b )密度函数f (x )在某点处a 的函数值f (a ),并不等于X 取值为a 的概率.但是,这个值f (a )越大,则X 在a 附近取值的概率f (a )∆x 就越大.也可以说,在某点密度曲线的函数值反映了概率集中在该点附近的程度,即X 在该点附近取值的密集程度.=0()ba f x dx=⎰=F (b )-F (a )若X 为连续型随机变量,概率密度f (x )唯一确定了分布函数F (x );若随机变量X 的分布函数F (x )满足:(1)F (x )连续;(2)存在x 1<x 2<…<x n (n ≥0),除这些点外,F (x )可导,且导函数F '(x )连续;令F x F x f x F x (),()()0,()''⎧=⎨'⎩当存在当不存在则f (x )必是X 的概率密度.例2.设随机变量X 的概率密度为求(1)常数k 的值;(2)X 的分布函数;(3)P (1<X <7/2).解:(1)由解得kx x f x x x ,03()2/2,340,≤<⎧⎪=-≤≤⎨⎪⎩其他+1()f x dx ∞-∞=⎰3403(2)2x kxdx dx =+-⎰⎰k 16=k 9124=+解:(2)当x <0时,当0≤x <3时,当3≤x <4时,020()()0612x x t x F x f t dt dt dt -∞-∞==+=⎰⎰⎰03203()()0(2)32624x xt t x F x f t dt dt dt dt x -∞-∞==++-=-+-⎰⎰⎰⎰()()0x F x f t dt -∞==⎰求(2)X 的分布函数;()()xF x f t dt-∞=⎰6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他当x ≥4时,所以()()1xF x f t dt -∞==⎰x x x F x x x x x 220,0/12,03()32/4,341,4<⎧⎪≤<⎪=⎨-+-≤<⎪⎪≥⎩求(2)X 的分布函数;6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他P X F F 7741(1)()(1)2248<<=-=72723113741(1)()(2)26248x x P X f x dx dx dx <<==+-=⎰⎰⎰求(3)P (1<X <7/2)解:(3)6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他在上例中,当x ∉[0,4]时,f (x )=0,所以P (X ∉[0,4])=0,为了方便,我们说X 只在[0,4]上取值.g x a x b f x ()0,()0,>≤≤⎧=⎨⎩其他我们就说X 只在[a , b ]上取值.一般地,若随机变量X 的概率密度f (x )是如下分段函数:6,03()2/2,340,x x f x x x ≤<⎧⎪=-≤≤⎨⎪⎩其他例3.设连续型随机变量X 的分布函数为求(1)常数C 值;(2)X 取值于(0.3,0.7)内的概率;(3)X 的密度函数.解:(1)应用连续型随机变量X 的分布函数的连续性,有所以C =1x F x Cx x x 20,0(),011,1<⎧⎪=≤<⎨⎪≥⎩x F F x C11(1)lim ()→-===x x f x F x 2,01()()0,<<⎧'==⎨⎩其他解:20,0(),011,1x F x x x x <⎧⎪=≤<⎨⎪≥⎩(2)P (0.3<X <0.7)=F (0.7)−F (0.3)=0.72−0.32=0.4求(2)P (0.3<X <0.7);(3)X 的密度函数.(3)随机变量的分类:离散型随机变量连续型随机变量.非离散型随机变量非连续非离散型随机变量.(1)若随机变量X 的概率密度为1.均匀分布(Uniform Distribution )则称X 在[a , b ]上服从均匀分布,记为X~U [a , b ]1,()0,a x b f x b a ⎧≤≤⎪=-⎨⎪⎩其他[,]1a b I b a =-[,][,]1,[,]()0,[,]a b a b x a b I I x x a b ∈⎧==⎨∉⎩区间[a ,b ]上的示性函数类似地,我们可以定义区间[a , b )、(a , b ]和(a , b )上的均匀分布一般地,设D 是数轴上一些不相交的区间之和,若X 的概率密度为x D f x D x D 1()0⎧∈⎪=⎨⎪∉⎩,的长度,则称X 在D 上服从均匀分布.若X ~U [a , b ],X 的分布函数为对于满足a ≤c <d ≤b 的任意的c 、d ,有0(),1,x a x a F x a x bb a<⎧⎪-⎪=≤≤⎨-⎪⎪⎩,其他()d c P c X d b a-<≤=-例1.设公共汽车站从上午7时起每隔15分钟来一班车,如果某乘客到达此站的时间是7:00到7:30之间的均匀随机变量.试求该乘客候车时间不超过5分钟的概率.解:设该乘客于7时X 到达此站,则X 服从[0, 30]上的均匀分布令B ={候车时间不超过5分钟}1530102511130303dx dx =+=⎰⎰()(1015)(2530)P B P X P X =≤≤+≤≤1030()300x f x ⎧≤≤⎪=⎨⎪⎩其它2.指数分布(Exponential Distribution )若随机变量X 的概率密度为其中常数λ>0,则称X 服从参数为λ的指数分布.,0()0,0x e x f x x λλ-⎧>=⎨≤⎩易求得X 的分布函数为1,0()0,0x e x F x x λ-⎧->=⎨≤⎩指数分布的另一种等价定义定义:设连续型随机变量X 的概率密度为1,0()0,0x e x f x x θθ-⎧>⎪=⎨⎪≤⎩其中θ>0为常数,则称X 服从参数为θ的指数分布.服从指数分布的随机变量X 具有以下性质:事实上无记忆性或无后效性(|)()P X s t X s P X t >+>=>(,)(|)()P X s t X s P X s t X s P X s >+>>+>=>()()P X s t P X s >+=>1()1()F s t F s -+=-()s t t s e e e λλλ-+--==1()()F t P X t =-=>1,0()0,0x e x F x x λ-⎧->=⎨≤⎩即对于任意s , t >0,有如果X 表示某仪器的工作寿命,无后效性的解释是:当仪器工作了s 小时后再能继续工作t 小时的概率等于该仪器刚开始就能工作t 小时的概率.说明该仪器的使用寿命不随使用时间的增加发生变化,或说仪器是“永葆青春”的.(|)()P X s t X s P X t >+>=>一般来说,电子元件等具备这种性质,它们本身的老化是可以忽略不计的,造成损坏的原因是意外的高电压等等.3.正态分布(Normal Distribution )若随机变量X 的概率密度为其中μ, σ均为常数,且σ>0,则称X 服从参数为μ和σ的正态分布.记作X ~N (μ, σ2)正态分布最初由高斯(Gauss )在研究偏差理论时发现,又叫高斯分布.22()21(),2x f x e x μσσπ--=-∞<<∞X 的分布函数为22()21()2t xF x e dtμσσπ---∞=⎰N (10, 32)0-50.10.20.30.40.50.60.70.80.910510152025正态分布N(μ,σ2)密度函数图形的特点f(x)μa.正态分布的密度曲线是一条关于μ对称的钟形曲线.f(μ+c)=f(μ−c )特点是“两头小,中间大,左右对称”.b .μ决定了图形的中心位置,称为位置参数;σ决定了图形中峰的陡峭程度,称为形状参数或者刻度参数μ2μ1μ3x f (x )f (x )0xc .在x =μ处达到最大值:1()2f μπσ=d .曲线f (x )向左右伸展时,越来越贴近x 轴,即f (x )以x 轴为渐近线.当x →±∞时,f (x )→0e .x=μ±σ为f (x )的两个拐点的横坐标.说明X 落在μ附件的概率最大,或者说X 的取值在μ附件最密集.22()21(),2x f x e x μσσπ--=-∞<<∞μf (x )年降雨量、同龄人身高、在正常条件下各种产品的质量指标——如零件的尺寸;纤维的强度和张力、农作物的产量,小麦的穗长、株高、测量误差、射击目标的水平或垂直偏差、信号噪声等等,都服从或近似服从正态分布.标准正态分布(Standard Normal Distribution )μ=0,σ=1的正态分布称为标准正态分布.其密度函数和分布函数常用φ(x )和Ф(x )表示:)(x Φ)(x ϕ221(),2x x e x ϕπ-=-∞<<∞221()2t x x e dt π--∞Φ=⎰注意:Φ(0)=0.5,Φ(-x )=1-Φ(x )若X ~N (0, 1),对任意的实数x 1,x 2(x 1< x 2),有人们已编制了Φ(x )的函数表,可供查用.P (X≤x 1)=Φ(x 1)P (X>x 1)=1-Φ(x 1)P (x 1≤X≤x 2)=Φ(x 2)-Φ(x 1)221()2x t x e dt π--∞Φ=⎰−x x Φ(x )x4-40.40.2正态分布的计算()x μσ-=Φ对任意的实数x 1,x 2(x 1< x 2),有211221()()()()()x x P x X x F x F x μμσσ--<≤=-=Φ-Φ222()()22()22x t xu F x e dt e du μσμσπσπ-----∞-∞==⎰⎰111()()()x P X x F x μσ-≤==Φ111()1()1()x P X x F x μσ->=-=-Φ例2.设X ~N (μ,σ2),求P (|X −μ|<k σ)的值,k =1, 2, 3.解:当k =1时当k =2时当k =3时(||)()P X k P k X k μσμσμσ-<=-<<+()()F k F k μσμσ=+--()()k k μσμμσμσσ+---=Φ-Φ()()k k =Φ-Φ-()[1()]2()1k k k =Φ--Φ=Φ-(||)2(1)10.6826P X μσ-<=Φ-=(||2)2(2)10.9544P X μσ-<=Φ-=(||3)2(3)10.9974P X μσ-<=Φ-=质量控制中的3σ原则设在正常生产的情况下,某零件的尺寸X服从正态分布N(μ,σ2),为了在生产过程中随时检查有无系统性误差出现,人们画了一个质量控制图.每隔一定时间,对产品尺寸进行检查,测量的产品的尺寸应落在上、下控制线之内.如果超出控制线,则很有可能是生产出现了异常情况,应该暂停生产进行检查.当然也可能虚报,但虚报的可能性比较小.214y x=π因此,需要求某些随机变量的函数的分布.在某些实际问题中,我们所关心的随机变量不能直接测量得到,而它却是某个能够直接测量的随机变量的函数.例如,考察一批圆轴的截面面积Y ,我们能够直接测量的是直径X ,且当直径X 取x 值时,截面面积Y 的取值为一般地,设X、Y是两个随机变量,y=g(x)是一个已知函数,如果当X取值x时,Y取值为g(x),则称Y是随机变量X的函数,记为Y=g(X).问题是:如何由已知的随机变量X的概率分布去求它的函数Y=g(X)的概率分布.解:求Y =(X –1)2的分布律.Y 所有可能的取值为0,1,4,而且(0)(1)0.1P Y P X ====(1)(0)(2)0.7P Y P X P X ===+==(4)(1)0.2P Y P X ===-=例1.设随机变量X 的分布律为X −10 1 2P0.20.3 0.1 0.4一、离散型随机变量X 的函数Y =g (X )的分布所以,Y 的分布律为Y0 1 4P0.10.7 0.2X−1 0 1 2 Y= (X–1)24101 P0.20.3 0.1 0.4所以,Y 的分布律为Y0 1 4P0.10.7 0.2一般地,若X 的分布律为则Y =g (X )的分布律为如果g (x k )中有一些值是相等的,则它们是Y 可能取的同一个值.此时,在Y 的分布律中,只需列出一个,然后把对应于这些相同值的概率相加,作为Y 取这个可能值的概率.X x 1 x 2 … x k …Pp 1 p 2 … p k…Y g (x 1) g (x 2)… g (x k ) …Pp 1 p 2 … p k…二、连续型随机变量X 的函数Y =g (X )的分布例2.设随机变量X 的概率密度为令求Y 的分布.解:2,01()0,x x f x <<⎧=⎨⎩其他1,1/20,1/2X Y X ≤⎧=⎨>⎩(1)P Y =(1/2)P X =≤1/2124xdx ==⎰所以Y 的分布为13(0)1(1)144P Y P Y ==-==-=Y0 1P 3/4 1/4例3.设连续型随机变量X 的概率密度函数为求Y =2X +8的概率密度.解:设X 和Y 的分布函数分别为F X (x )和F Y (y ).F Y (y )=P (Y≤y )=P (2X +8≤y )于是Y 的密度函数/8,04()0,X x x f x <<⎧=⎨⎩其它88()()22X y y P X F --=≤=()81()()22Y Y X dF y y f y f dy -==⋅故当8<y <16时,当y ≤8或y ≥16时,81()()22Y X y f y f -=⋅/8,04()0,X x x f x <<⎧=⎨⎩其它88()216X y y f --=8()02X y f -=8,816()320,Y y y f y -⎧<<⎪=⎨⎪⎩其它方法:1.先求Y=g(X)分布函数F(y);Y2.求分布函数F Y (y)的导数,即为密度函数f Y(y).关键步骤:F(y)=P(Y≤y)=P(g(X)≤y)=P(X∈D)Y。
第4章随机变量的数字特征指联系于分布函数的某些数,如平均值,离散程度等.本章介绍随机变量的常用数字特征:数学期望、方差、相关系数、矩等4. 1随机变量的数学期望例4. 1甲、乙两射击手击中目标的环数用随机变量X、Y表示,它们的分布分别如下:试比较甲、乙两射击手射击技术的优劣解假设甲、乙两射击手分别射击N次,则射击手甲击中的总环数为N 0.3 8 N 0.1 9 N 0.6 10,N 0.3 8 N 0.1 9 N 0.6 10平均环数为9.3 ;N射击手乙击中的总环数为N 0.1 8 N 0.4 9 N 0.5 10,N 0.1 8 N 0.4 9 N 0.5 10平均环数为---------------------------------------- 9.4N上述平均环数可以告诉我们,射击手乙的射击技术优于射击手甲从例4.1可以看出,在大量次独立重复试验中,离散型随机变量的平均值总是稳定在一个常数附近,这个常数就是将分布列表中各组对应数据相乘所得乘积的总和,据此, 我们给出随机变量数学期望的定义.定义4.1设离散型随机变量X的分布律为P(X X j) p i,i 1,2 .如果X k P kk 1则称(4. 1)E(X)= X j P i .i 1为随机变量X的数学期望,或称为该分布的数学期望,简称期望或均值.若|x k | p k不收敛,则称X的数学期望不存在类似地给出连续型随机变量的数学期望的定义 定义4.2设连续型随机变量 X 的密度函数为f (X ).E(X)= xf (x)dx .为随机变量X 的数学期望,或称为该分布的数学期望,简称期望或均值•若| x | f (x)dx 不收敛,则称 X 的数学期望不存在•例4.2设在某一规定的时间间隔里,某电气设备用于最大负荷的时间求 E(X).4. 1.2随机变量函数的数学期望 按照随机变量 X 的数学期望的定义,E(X)由其分布唯一确定,如今若要求随机变量的一个函数 g(X)的数学期望,可以通过下面的一个定理来求得定理4. 1设Y 是随机变量 X 的函数:Y g(X)( g 为连续函数)(1)X 是离散型随机变量,它的分布律为 P(X X i ) P i ,i 1,2 ,若 g(X i )p ii 1绝对收敛,则有如果| x| f (x)dx则称计)是一个随机变量, 其密度函数为f(x)1 2x,15002J(x 1500 0,3000),1500其他1500 3000,(4. 2)X (以分种E(X) =xf (x)dx15001x------- xdx 0150030001 …x 15002 (x 15003000)dx500 1000 1500 ( min )4.3柯西分布的密度函数为f (x)丄 1 1 X 2' .求 E(X).因为|x|f(x)dx1 1|x|—厂严,故E(X)不存在.20 04.1的重要意义在于当求 E(Y)时,不必先算出 Y 的分布.类似于一维随机变量的数学期望,此定理还可以推广到多维随机变量函数的数学期(X ,Y )的函数:Z g(X,Y)( g 为连续函数)这里,假设(4.5),(4. 6)的右端都是绝对收敛的 例4. 4设随机变量X 的概率密度为求 E(e 3X )2 21e 2 dxdy22e rdr则有(2) E(Y) Eg(X) X 是连续型随机变量, E(Y) E g(X)g(xjP i(4. 3)它的密度函数为f (x).若 g(x)f (x)dx 绝对收敛,g(x) f (x)dx .(4. 4)定理 定理4.2设Z 是二维随机变量(1)若二维随机变量(X ,Y )的分布律P(X x i ,Y y j )Pij , i, j1,2,E(Z) E(g(X,Y))g(X i ,y j )P j .j 1 i 1(4. 5)(2)若二维随机变量(X ,丫 ) 的密度函数为 f (x, y),则有E(Z) E(g(X,Y)) g(x, y)f (x,y)dxdy(4. 6)f(x)xxe解 E(e 3X )e 3x f(x)dx o e 3x xe x dx o xe 4xdx_1 16例4.5设随机变量(X ,Y )服从二维正态分布,其密度函数为1f (x,y) e,求Z X 2 Y 2的数学期望E(Z).解 E(Z)x 2 y 2易知X i X 1 X 2 X 10.12 2r 2r 2 e 2 dr21e“r • 2 1 、 •22 Y 24.1.3数学期望的性质 以下假设所涉及的随机变量的数学期望存在性质1设C 是常数,则有E(C) C .性质2设X 是一个随机变量, C 是常数,则有 E(CX) CE(X). 性质3设X,Y 是两个随机变量,则有 E(X Y) E(X) E(Y).nn推论 设有随机变量 X ,,X 2, X n ,则有E( X i ) E(X i ).i 1i 1性质4设X,Y 是两个独立的随机变量,则有 E(XY) E(X)E(Y) 性质1和性质2可以自己证明.下面就连续情形给出性质3和性质4的证明,对于离散情形,读者只要将证明中的“积分”用“和式”代替,就能得到证明证明(性质3) 设二维随机变量(X,Y )的密度函数为 f (x, y),其边缘密度函 数为f X (x), f Y (x).由随机变量函数的数学期望知道,E(X Y) (x y)f(x, y)dxdy xf(x, y)dxdyyf (x, y)dxdyE(X) E(Y).证明(性质4)因X,Y 是两个独立的随机变量,于是xf x (x) f Y (y)dxdy=[Xf x (x)dx][yf Y (y)dy]=E(X)E(Y).例4.6机场大巴载有 20位旅客自起点站开出,途经 10个站点•设每位旅客在各个解引入随机变量X i °,在第i站没有人下车,i 1,2, ,10.i1, 在第i 站有人下车。
E(XY)xy f (x, y)dxdy 站点下车是等可能的,且各旅客是否下车相互独立.以X 表示停车的次数,求 E(X).209,因此20位旅客都不在第i 站下车的概率10E(X 1) E(X 2) E(X 10)20910 18.784.10本题是将X 分解成若干个随机变量之和,然后利用数学期望的性质来求数学期望, 这种处理方法具有一定的普遍意义4. 2随机变量的方差4. 2. 1方差的定义例4.1曾用平均环数来评判甲、乙两个射击手射击技术的优劣,如果二者平均环数相同,那么仅用平均环数就无法科学地评判两个射击手射击技术的优劣,如下例例4.7甲、乙两射击手击中目标的环数用随机变量 X 、Y 表示,它们的分布分别如下:试比较甲、乙两射击手射击技术的优劣解 假设甲、乙两射击手分别射击N 次,则射击手甲击中的平均环数为N 0.3 8 N 0.1 9 N 0.6 10N射击手乙击中的平均环数为N 0.2 8 N 0.3 9 N 0.5 109.3.N其实,还可以进一步考察射击手环数与平均环数的偏离程度,若偏离程度较小,则表示 成绩比较稳定.从这个意义上说,我们认为甲射击手相对于乙射击手较稳定.由此可见,按题意, 任一旅客在第i 站不下车的概率是为110,在第i 站有人下车的概率为 120P(X i 0)10, p (X i1)20,也就是209-9 ,i 1,2, ,10. 10进而,有E(X) E(X 1 X 2X®)讨论随机变量与其均值的偏离程度是十分有必要的.那么用怎样的量去度量这个偏离程20度呢?因为X E(X)可能为正,也可能为负,为了避免正负偏离相互抵消,自然而然会考虑取X E(X),但是绝对值运算不方便•为了便于运算方便,通常是取2 2X E(X),然后求其均值E((X E(X))2)就可以作为刻画随机变量X的“波动”程度,这个量被称作为随机变量X的方差•定义4.3设X是一个随机变量,若E[(X E(X)]2存在,则称E[(X E(X)]2为随机变量X的方差,记为D(X)或Var(X),即D(X) Var(X) E[(X E(X)]2. ( 4.7)称方差的算术平方根..D(X)为随机变量X的标准差或均方差,记为(X).方差和标准差的功能相似,它们都是用来描述随机变量取值的集中与分散程度的两个特征数,若X的取值比较集中,则D(X)较小,若X的取值比较分散,则D(X)较大.方差与标准差的区别主要在量纲上,由于标准差与所讨论的随机变量的数学期望有相同的量纲,所以在实际中,人们比较喜欢选用标准差,但标准差的计算必须通过方差才能计算•由定义4.3知道,方差实际上就是随机变量X的函数g(X) (X E(X))2的数学期望,于是,对于离散型随机变量,按( 4. 7)式有D(X)iX i1E(X) P i,(4.8)其中P(X X i) P i,i1,2为X的分布律•对于连续型随机变量,按( 4. 7)式有D(X)X E(X) 2f (x)dx,(4.9) 其中f(x)为X的密度函数.随机变量X的方差可按下面公式计算:2 2D(X) E(X2) E(X) . ( 4.10)事实上,由数学期望的性质1、性质2、性质3得D(X) E[X E(X)]2 E(X2 2XE(X) [E(X)]2)2E(X2) 2E(X)E(X) E(X)E(X2) E(X)4.2. 2 方差的性质下面给出数学期望的几个常用性质,以下假设随机变量的数学期望是存在的性质 1 D(X) 0.性质2设C是常数,则有D(C) 0.性质 3 X 是一个随机变量,C 是常数,则有D(CX d) C2D(X) .性质 4 设X,Y 是两个随机变量,则有D(X Y) D(X ) D(Y)2E[X E(X)][Y E(Y)].特别地, 若X,Y 相互独立,则有D(X Y)D(X)D(Y).证明D(X Y) E[( X Y) E(X Y)]2E[( X E(X)2(Y E(Y)]22E[X E(X)][Y E(Y)]E[X2E(X)]2E[Y2E(Y)]2D(X)D(Y)2E[X E(X)][Y E(Y)]E[X E(X )][Y E(Y)]E[XY YE(X) XE(Y) E(X)E(Y)]E(XY) E(X)E(Y) E(Y)E(X) E(X)E(Y)E(XY) E(X)E(Y).若X,Y 相互独立,由数学期望的性质4知道E(XY) E(X)E(Y) 0 ,于是有D(X Y) D(X) D(Y).同理可证明D(X Y) D(X) D(Y) .这一性质可推广到任意有限多个相互独立的随机变量之和的情况.例如,若X j~N( i, i2),i 1,2, ,n,且它们相互独立,则它们的线性组合:C1X1 C2X2 C n X n( C i,C2, ,C n是不全为0的常数)仍服从正态分布,于是由数学期望和方差的性质知道:n nk 0 k 0这是一个重要的结果Z 2X 4Y 的分布.故 Z ~ N( 8,676).4.3常见随机变量的数学期望和方差1. 两点分布的数学期望和方差证明 E(X) 0 q 12. 二项分布的数学期望和方差所以nk _ k. n kk C n p qK 0n■ /1\1 /k k n kk(k 1) k C np q~ B(n, p),0 p 1,则 E(X) np , D(X) npq证明 由于随机变量 X ~ B(n, p),C :p k q n k , (k0,1,2, , n;qp),n (n 1)! (k k1)!(n k)! pnpk 1(n 1)! (k 1)!(n k)!np(p \ n 1q) np .C n X nN( C ii 12 2c 2 2) iii例 4.8 若 X ~ N(2,52),Y ~ N(3,62)们相互独立,求随机变量函数解 E(Z) 2 24 3 8,D(Z)22 52 42 62 676,设随机变量X ~ 01,q p1,q 1p ,则 E(X) p ,D(X) pqE(X 2)02 (1 P) 12由公式(4. 10)知D(X)E(X 2)E(X)p 2P(1 p) pq .E(X)E(X 2)n2 k k n kk C n pqnnk 0k 0n(n 1)p 2(p q)n 2 np n(n 1) p 2 np .D(X) E(X 2) E(X)2 npq .3. 泊松分布的数学期望和方差 设 X ~ P(),贝U E(X) , D(X) 证明由于随机变量X 的分布律为即 E(X)2所以随机变量X 的方差为D(X) E(X 2) E(X)2由此,泊松分布的数学期望与方差相等,都等于 只要知道它的数学期望或方差就能完全确定它的分布了k k n kk(k 1)C n Pqk k n kC np qk(kk 0k k n k1)C np qnpk(k 1)n!k 2k!(nnp n(nn1)p 2 k 2(n 2)! (k 2)!(nk)!2q (n 2) (k 2)np于是所以随机变量P(X k)k^,k0,1,2L , 0.X 的数学期望为ke E(X) ko kFk1(k 1)!2E(X ) E X(X1)E X(X1) E(X)k(kk 1k 22 2ee ek 2(k 2)!.又泊松分布只含有一个参数2所以随机变量X 的方差为D(X) E(X 2) [E(X)]25.均匀分布的数学期望和方差证明 由于随机变量 X 的密度函数为所以X 的数学期望为4.几何分布的数学期望和方差1设 X ~G(p),则 E(X )—,D(X)P1 p T~p证明 由于随机变量 X 的分布律为kP(X k) pq则称随机变量X 的数学期望为kE(X) kpqk 1kq k12 2E(X ) k pqk 1k 2qp[ k(kk 1k 11)qkq k 1]2 pq(1 q)3 p2q 2p设 X ~ U(a,b),则 E(X)--2D(X)(b a)2 12f(x)b a 0,其他。