随机变量的统计特性共31页
- 格式:ppt
- 大小:2.71 MB
- 文档页数:31
北京理工大学《概率论与数理统计》分布函数能够完整地描述随机变量的统计特性,但在某些实际问题中,不需要全面考查随机变量的变化,只需知道它的随机变量的某些数字特征也就够了.评定某企业的经营能力时,只要知道该企业例如:年平均赢利水平研究水稻品种优劣时,我们关心的是稻穗的平均粒数及平均重量考察一射手的水平,既要看他的平均环数是否高,还要看他弹着点的范围是否小,即数据的波动是否小.由上面的例子看到,平均盈利水平、平均粒数、平均环数、数据的波动大小等,都是与随机变量有关的某个数值,能清晰地描述随机变量在某些方面的重要特征,这些数字特征在理论和实践上都具有重要意义.另一方面,对于一些常用的重要分布,如二项分布、泊松分布、指数分布、正态分布等,其中的参数恰好就是某些数字特征,因此,只要知道了这些数字特征,就能完全确定其具体的分布.第四章随机变量的数字特征4.1随机变量的平均取值——数学期望4.2随机变量取值平均偏离平均值的情况——方差4.3 描述两个随机变量之间的某种关系的数——协方差与相关系数4.1 数学期望一离散型随机变量的数学期望二连续型随机变量的数学期望三常见分布的数学期望四随机变量函数的数学期望五数学期望的性质六、数学期望的应用一离散型随机变量的数学期望引例射击问题设某射击手在同样的条件下,瞄准靶子相继射击90次,(命中的环数是一个随机变量).射中次数记录如下命中环数Y0 1 2 3 4 5命中次数n k 2 13 15 10 20 30频率n k/n2/90 13/90 15/90 10/90 20/90 30/90试问:该射手每次射击平均命中靶多少环?解:平均命中环数这是以频率为权的加权平均命中环数Y0 1 2 3 4 5命中次数n k2 13 15 10 20 30频率n k /n 2/90 13/90 15/90 10/90 20/90 30/900211321531042053090×+×+×+×+×+×=21315102030012345909090909090=×+×+×+×+×+×50k k n k n =⋅∑ 3.37.==射中靶的总环数射击次数平均射中环数频率随机波动随机波动“平均射中环数”的稳定值?=由频率的稳定性知:当n 很大时:频率n k /n 稳定于概率p k 稳定于50k k n k n =⋅∑50k k k p =⋅∑50k k n k n =⋅∑“平均射中环数”等于射中环数的可能值与其概率之积的累加定义1 设X 是离散型随机变量,它的概率分布是:P {X =x k }=p k , k =1,2,…如果绝对收敛,则称它为X 的数学期望或均值.记为E (X ), 即如果发散,则称X 的数学期望不存在.1k k k x p ∞=∑1()k k k E X x p ∞==∑1||k k k x p∞=∑注意:随机变量的数学期望的本质就是加权平均数,它是一个数,不再是随机变量.注1:随机变量X 的数学期望完全是由它的概率分布确定的,而不应受X 的可能取值的排列次序的影响,因此要求绝对收敛1k k k xp ∞=<+∞∑11111(1)1ln 2234212n n−+−++−→− 1111111(2)1ln 22436852−−+−−+→注2.E (X )是一个实数,而非随机变量,它是一种以概率为权的加权平均,与一般的算术平均值不同,它从本质上体现了随机变量X 取可能值的真正的平均值,也称均值.当随机变量X 取各个可能值是等概率分布时,X 的期望值与算术平均值相等.假设X 1P80 85 90 1/4 1/4 1/21()800.25850.25+900.586.25E X =×+××=X 2P80 85 901/3 1/3 1/32()85.E X =注3.数学期望E(X)完全由随机变量X的概率分布确定,若X服从某一分布,也称E(X)是这一分布的数学期望.乙射手甲射手例1.甲、乙两个射击手,他们射击的分布律如下表所示,问:甲和乙谁的技术更好?击中环数8 9 10概率0.3 0.1 0.6击中环数8 9 10概率0.2 0.5 0.3单从分布列看不出好坏,解:设甲,乙两个射击手击中的环数分别为X 1,X 2E (X 1)=8×0.3+9×0.1+10×0.6=9.3(环)E (X 2)=8×0.2+9×0.5+10×0.3=9.1(环)例2.1654年职业赌徒德.梅尔向法国数学家帕斯卡提出一个使他苦恼很久的分赌本问题:甲、乙两赌徒赌技相同,各出赌注50法郎,每局中无平局.他们约定,谁先赢三局,则得到全部100法郎的赌本.当甲赢了2局,乙赢了1局时,因故要中止赌博.现问这100法郎如何分才算公平?解:假如比赛继续进行下去,直到结束为止. 则需要2局.这时,可能的结果为:甲甲,甲乙,乙甲,乙乙即:甲赢得赌局的概率为3/4,而乙赢的概率为1/4.设:X、Y分别表示甲和乙得到的赌金数. 则分布律分别为:X0 100 P1/4 3/4Y0 100 P3/4 1/4这时,可能的结果为:甲甲,甲乙,乙甲,乙乙即:甲赢得赌局的概率为3/4,而乙赢的概率为1/4.E(X)=0×1/4+100×3/4=75E(Y)=0×3/4+100×1/4=25即甲、乙应该按照3:1的比例分配全部的赌本.例3.确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为30%,可得利润8万元,失败的机会为70%,将损失2万元.若存入银行,同期间的利率为5%,问是否做此项投资?解:设X 为此项投资的利润,则存入银行的利息:故应该选择该项投资.(注:投资有风险,投资须谨慎)X 8 −2P0.3 0.7此项投资的平均利润为:E (X )=8×0.3+(−2)×0.7=1(万元)10×0.05=0.5(万元)设X 是连续型随机变量,密度函数为f (x ).问题:如何寻找一个体现随机变量平均值的量.将X 离散化.二、连续型随机变量的数学期望在数轴上取等分点:…x −2<x −1<x 0<x 1<x 2<…x k +1−x k =∆x ,k =0,±1,….,并设x k 都是f (x )的连续点.则小区间[x i ,x i+1)阴影面积近似为f (x i )∆x i1()i x x f x dx+=∫()i f x x≈∆P {x i <X ≤x i +1}定义一个离散型随机变量X *如下:其数学期望存在,且绝对收敛时,P {X *=x i }=P {x i ≤X <x i +1} ≈f (x i )∆x对于X *,当当分点越来越密,即∆x →0时,可以认为X *=x i 当且仅当x i ≤X <x i +1(*)i i ix P X x =∑(*){*}i i iE X x P X x ==∑()i i ix f x x ≈∆∑0=lim ()i i x ix f x x ∆→∆∑则其分布律为E (X *) →E (X ) *0=lim x EX EX ∆→即有:+()xf x dx∞−∞=∫定义2:设X 是连续型随机变量,其密度函数为f (x ),如果绝对收敛,则称的值为X 的数学期望,如果积分发散,则称随机变量X 的数学期望不存在.+()xf x dx ∞−∞∫+||()x f x dx∞−∞∫即+()()E X xf x dx∞−∞=∫+()xf x dx ∞−∞∫记为E (X ).注意:随机变量的数学期望的本质就是加权平均数,它是一个数,不再是随机变量.三、常见分布的数学期望1.0−1分布设随机变量X服从参数为p的0−1分布,求EX.解:X的分布律为X0 1P1−p p则:E(X)=0×P{X=0}+1×P{X=1}=P{X=1}=p概率是数学期望的特例(第五章)2.二项分布X 的分布律为P {X =k }=C n k p k (1−p )n−k ,k =0,1,…,n .解:设随机变量X ~b (n ,p ),求EX .0{}nk EX kP X k ==∑0(1)n k k n k n k kC p p −=−∑1!(1)!()!n k n kk n k p p k n k −=−−∑1(1)(1)1(1)!(1)(1)!()!nk n k k n np p p k n k −−−−=−−−−∑11(1)1(1)n l k l ln ln l np Cp p −=−−−−=−∑1[(1)]n np p p −=+−np=抛掷一枚均匀硬币100次,能期望得到多少次正面3.泊松分布则解:X 的分布律为设随机变量X ~π(λ),求EX .{},0,1,2,!kP X k e k k λλ−=== 00(){}!k k k e E X kP X k k k λλ−∞∞=====∑∑11(1)!k k ek λλλ−∞−==−∑1!ii k i e i λλλ∞=−−=∑=e e λλλλ−=1!k k e k k λλ−∞==∑泊松分布的参数是λ4.几何分布解:X 的分布律为P {X =k }=q k −1p ,k =1,2,….p+q =1设随机变量X 服从参数为p 的几何分布,求EX .111(){}k k k E X kP Xk k pq∞∞−=====⋅∑∑11k k p k q∞−=⋅∑1=()kk p q ∞=′∑1=()k k p q ∞=′∑()1q p q′=−211(1)p q p=−重复掷一颗骰子平均掷多少次才能第一次出现6点设X ~U (a , b ),求E (X ).解:X 的概率密度为:X 的数学期望为:数学期望位于区间(a ,b )的中点.5.均匀分布1()0a xb f x b a<<=− 其它()()2bax a b E X xf x dx dx b a +∞−∞+===−∫∫设X 服从指数分布,求E (X ).分部积分法6.指数分布当概率密度表示为:对应的数学期望为θ.,0()0,x e x f x x λλ− >=≤ 0xxedx λλ+∞−=∫()()E X xf x dx +∞−∞=∫1λ=1,0()0,0xe xf x x θθ− > = ≤解:X 的概率密度为:设X ~N (μ,σ2),求E (X ).解:X 的概率密度为被积函数为奇函数,故此项积分为0.7.正态分布22()21()2x f x eµσπσ−−=()()E X xf x dx +∞−∞=∫22()212x xedxµσπσ−+∞−−∞=∫221()2x t t t edtµσσµπ−=+∞−−∞+∫ 2222122t t tedt edt σµππ+∞+∞−−−∞−∞+∫∫µ=N (0,1)的密度函数积分为1.注意:不是所有的随机变量都有数学期望例如:Cauchy 分布的密度函数为但发散故其数学期望不存在.21(),(1)f x x x π=−∞<<+∞+2||||()(1)x x f x dx dx x π+∞+∞−∞−∞=+∫∫四随机变量函数的数学期望设已知随机变量X的分布,我们需要计算的不是X的期望,而是X的某个函数的期望,比如说g(X)的期望. 那么应该如何计算呢?一种方法是,因为g(X)也是随机变量,故应有概率分布,它的分布可以由已知的X的分布求出来. 一旦我们知道了g(X)的分布,就可以按照期望的定义把E[g(X)]计算出来.例4.某商店对某种家用电器的销售采用先使用后付款的方式,记该种电器的使用寿命为X (以年计),规定:X ≤1,一台付款1500元;1<X ≤2,一台付款2000元2<X ≤3,一台付款2500元;X >3,一台付款3000元设X 服从指数分布,且平均寿命为10年,求该商店一台电器的平均收费.解:设该商店一台电器的收费为Y .要求E (Y )X 的分布函数为:1101,()0,0x e x F x x − −>=≤设该商店一台电器的收费为YX ≤1,一台付款1500元1 <X ≤2,一台付款2000元2 <X ≤3,一台付款2500元X >3,一台付款3000元1101,0()0,0x ex F x x − −>=≤P {Y =1500}=P {X ≤1}=F (1)=1−e −0.1=0.0952P {Y =2000}=P {1<X ≤2}=F (2)−F (1)=0.0861P {Y =2500}=P {2<X ≤3}=F (3)−F (2)=0.0779P {Y =3000}=P {X >3}=1−F (3)=0.7408设X 服从指数分布,且平均寿命为10年.Y 的分布律为所以该商店一台电器的平均收费,即Y 的数学期望为Y 1500 2000 2500 3000P0.0952 0.0861 0.0779 0.7408()15000.095220000.086125000.0779 30000.74082732.15E Y =×+×+×+×=使用上述方法必须先求出g(X)的分布,有时这一步骤是比较复杂的.那么是否可以不先求g(X)的分布,而只根据X的分布求E[g(X)]呢?例5.设离散型随机变量X 的概率分布如下表所示,求:Z=X 2的期望.X−11P214141E (Z )= g (0)×0.5+g (-1)×0.25+g (1)×0.25解:=0.5注:这里的.)(2x x g =(1)当X 为离散型随机变量时,分布律为P {X = x k }=p k ,k =1,2,⋯(2)当X 为连续型随机变量时,概率密度函数为f (x ).定理:设Y 是随机变量X 的函数,Y =g (X )(g 是连续函数)若级数绝对收敛,则有若积分绝对收敛,则有1()[()]()kkk E Y E g X g x p∞===∑()[()]()()E Y E g X g x f x dx+∞==∫1()k k k g x p ∞=∑()()g x f x dx+∞−∞∫该公式的重要性在于:当求E [g (X )]时,不必知道g (X )的分布,而只需知道X 的分布就可以了,这给求随机变量函数的期望带来很大方便.k k k g x p X E Y E g X g x f x dx X 1(),()[()]()(),∞=+∞−∞== ∑∫离散型连续型例6.设随机变量X~b(n, p),Y=e aX,求E(Y).解:因为X的分布律为所以有{}(1), 0,1,...,k k n knP X k C p p k n−==−= ()E Y=(1)nak k k n knke C p p−=−∑()(1)nk a k n knkC e p p−=−∑[(1)]a npe p=+−={}nakke P X k==∑例7.设X ~U [0,π],Y=sinX ,求E (Y ).解:因为X 的概率密度为所以有1,0()0,x f x ππ≤≤ =其他()sin ()E Y xf x dx +∞−∞=∫01sin x dx ππ⋅∫2π=定理:设Z 是随机变量X 和Y 的函数,Z =g (X,Y )(g 是连续函数),Z 是一维随机变量(1)若(X,Y )是二维离散型随机变量,概率分布为(2)若(X,Y )是二维连续型随机变量,概率密度为f (x, y ),则有这里假定上两式右边的积分或级数都绝对收敛11()[(,)](,)ijijj i E Z E g X Y g x y p∞∞====∑∑()[(,)](,)(,)E Z E g X Y g x y f x y dxdy+∞+∞−∞−∞==∫∫{,},,1,2,i j ij P X x Y y p i j ====则有几个常用的公式()[(,)](,)(,)E Z E g X Y g x y f x y dxdy+∞+∞−∞−∞==∫∫(,)EX xf x y dxdy+∞+∞−∞−∞=∫∫(,)EY yf x y dxdy+∞+∞−∞−∞=∫∫22()(,)E Y y f x y dxdy+∞+∞−∞−∞=∫∫22()(,)E X x f x y dxdy+∞+∞−∞−∞=∫∫()(,)E XY xyf x y dxdy+∞+∞−∞−∞=∫∫例8.设二维随机变量(X ,Y )的密度函数为求E (X ),E (Y ),E (X +Y ),E (XY ).解:21(13),02,01,(,)40,x y x y f x y +<<<< =其它()(,)E X xf x y dxdy+∞+∞−∞−∞=∫∫212001(13)4x xdx y dy =⋅+∫∫43=()(,)E Y yf x y dxdy+∞+∞−∞−∞=∫∫212001(13)4xdx y y dy +∫∫58=数学期望的性质注意:X ,Y 相互独立()()(,)E X Y x y f x y dxdy+∞+∞−∞−∞+=+∫∫(,)(,)xf x y dxdy yf x y dxdy+∞+∞+∞+∞−∞−∞−∞−∞+∫∫∫∫()()E X E Y +45473824=+=()(,)E XY xyf x y dxdy +∞+∞−∞−∞=∫∫2120011(13)22x xdx y y dy=⋅⋅+∫∫455386=⋅=()()E X E Y ⋅设X =(X 1,…, X n )为离散型随机向量,概率分布为≥ 1nnj j j j n P X =x ,,x =p ,j ,,j .11{()}1Z = g (X 1,…, X n ),若级数绝对收敛,则.<∞∑ nnnj j j j j j g x ,,x p 111()=∑ nnnn j j j jj j E Z =E g X ,,X g x ,,x p 1111()(())()设X =(X 1,…, X n )为连续型随机向量,联合密度函数为 n f x x 1(,,)Z = g (X 1,…, X n ),若积分绝对收敛,则+∞+∞−∞−∞∫∫n n ng x x f x x x x 111(,,)(,,)d d n E Z E g X X 1()=((,,))+∞+∞−∞−∞=∫∫n n ng x x f x x x x 111(,,)(,,)d d五数学期望的性质1.设C 是常数,则E (C )=C 4.设X 、Y 相互独立,则E (XY )=E (X )E (Y );2.若k 是常数,则E (kX )=kE (X )3.E (X +Y )=E (X )+E (Y )注意:由E (XY )=E (X )E (Y )不一定能推出X ,Y 独立推广(诸X i 相互独立时)推广11[]()nni i i i i i E C X C E X ===∑∑11[]()n ni i i i E X E X ===∏∏性质4 的逆命题不成立,即若E (X Y ) = E (X )E (Y ),X ,Y 不一定相互独立.反例XY p ij -1 0 1-10181818181818181810p • j838382p i•838382X Y P-1 0 1828284EX EY ==0;E XY ()=0;=E XY EX EY ()但P X Y 1{=-1,=-1}=8≠=P X P Y 23{=-1}{=-1}8××=30+2103-3+5=92X XY Y X XY Y E(3+2-+5)=3E()+2E()-E()+E(5)性质2和3×××EX EY =310+2-3+5性质4例9.设X ~N (10,4),Y ~U [1,5],且X 与Y 相互独立,求E (3X +2XY -Y +5).解:由已知,有E (X )=10, E (Y )=3.例10: 设X 1 , X 2…,X n 相互独立且都服从B (1, p ),求Z = X 1 + X 2+…+X n 的数学期望E (Z ).解:注: 由二项分布的可加性易知Z = X 1 + X 2+…+X n ~B (n, p ).EZ = E (X 1 + X 2+…+X n )= E (X 1 ) +E ( X 2)+…+E (X n )= p +p +…+p =n p求二项分布的数学期望的又一种方法.例11.(超几何分布的数学期望)设一批同类型的产品共有N 件,其中次品有M 件.今从中任取n (假定n ≤N −M )件,记这n 件中所含的次品数为X ,求E (X ).则有所以解: 引入X =X 1+X 2+…+X n且易知抽签模型,概率与试验次数无关例10和例11:将X 分解成数个随机变量之和,然后利用随机变量和的期望等于期望的和这一性质,此方法具有一定的意义.1,,1,2,,0,i i X i n i ==第件是次品第件不是次品iMP X N{1}==1()ni i EX E X ==∑ni i P X 1{1}==∑1ni M N ==∑nM N =为普查某种疾病,N 个人需验血.有如下两种验血方案:(1)分别化验每个人的血,共需化验N 次;(2)分组化验.每k 个人分为1组,k 个人的血混在一起化验,若结果为阴性,则只需化验一次;若为阳性,则对k 个人的血逐个化验,找出有病者,此时k 个人的血需化验k+1次.设每个人血液化验呈阳性的概率为p ,且每个人化验结果是相互独立的.试说明选择哪一方案较经济.验血方案的选择例13.六、数学期望的应用解:只需计算方案(2)所需化验次数X 的期望.。
第四章随机变量的数字特征前面讨论了随机变量的分布函数, 从中知道随机变量的分布函数能完整地描述随机变量的统计规律性.但在许多实际问题中, 人们并不需要去全面考察随机变量的变化情况, 而只要知道它的某些数字特征即可.例如, 在评价某地区粮食产量的水平时, 通常只要知道该地区粮食的平均产量;又如, 在评价一批棉花的质量时, 既要注意纤维的平均长度, 又要注意纤维长度与平均长度之间的偏离程度, 平均长度较大, 偏离程度小, 则质量就较好. 等等实际上, 描述随机变量的平均值和偏离程度的某些数字特征在理论和实践上都具有重要的意义, 它们能更直接、更简洁更清晰和更实用地反映出随机变量的本质.本章将要讨论的随机变量的常用数字特征包括: 数学期望、方差、相关系数、矩.第一节数学期望内容分布图示★引言★离散型随机变量的数学期望★例1 ★例2 ★例3★连续型随机变量的数学期望★例4★例5 ★例6 ★例7★随机变量函数的数学期望★例8★例9 ★例10 ★例11★数学期望的性质★例12 ★例13 ★例14★内容小结★课堂练习★习题4-1 ★返回内容要点:一、离散型随机变量的数学期望平均值是日常生活中最常用的一个数字特征, 它对评判事物、作出决策等具有重要作用.定义设X是离散型随机变量的概率分布为,2,1,}{===ipxXP ii如果∑∞=1iiipx绝对收敛, 则定义X的数学期望(又称均值)为.)(1∑∞==iiipxXE二、连续型随机变量的数学期望定义设X是连续型随机变量, 其密度函数为)(xf,如果⎰∞∞-dxx xf) (绝对收敛, 定义X 的数学期望为 .)()(⎰∞∞-=dx x xf X E三、 随机变量函数的数学期望设X 是一随机变量, )(x g 为一实函数,则)(X g Y =也是一随机变量, 理论上, 虽然可通过X 的分布求出)(X g 的分布, 再按定义求出)(X g 的数学期望)]([X g E . 但这种求法一般比较复杂. 下面不加证明地引入有关计算随机变量函数的数学期望的定理.定理1 设X 是一个随机变量, )(X g Y =,且)(Y E 存在, 则(1) 若X 为离散型随机变量, 其概率分布为,2,1,}{===i p x X P i i则Y 的数学期望为.)()]([)(1∑∞===i i i p x g X g E Y E(2) 若X 为连续型随机变量, 其概率密度为)(x f , 则Y 的数学期望为.)()()]([)(⎰∞∞-==dx x f x g X g E Y E注: (i)定理的重要性在于:求)]([X g E 时, 不必知道)(X g 的分布, 只需知道X 的分布即可. 这给求随机变量函数的数学期望带来很大方便;(ii) 上述定理可推广到二维以上的情形, 即有定理2 设),(Y X 是二维随机向量, ),(Y X g Z =,且)(Z E 存在, 则 (1)若),(Y X 为离散型随机向量, 其概率分布为),2,1,(},{ ====j i p y Y x X P ij j i则Z 的数学期望为,),()],([)(11∑∑∞=∞===j i ij j i p y x g Y X g E Z E(2) 若),(Y X 为连续型随机向量, 其概率密度为),(y x f 则Z 的数学期望为.),(),()],([)(⎰⎰∞∞-∞∞-==dx y x f y x g Y X g E Z E四、数学期望的性质1. 设C 是常数, 则;)(C C E =2.若k 是常数,则);()(X kE kX E =3. );()()(2121X E X E X X E +=+4. 设Y X ,独立, 则)()()(Y E X E XY E =;注: (i) 由)()()(Y E X E XY E =不一定能推出Y X ,独立,例如,在例10中,已计算得 49)()()(==Y E X E XY E , 但 81}0{},431{,0}0,1{=======Y P X P Y X P ,显然}0{}1{}0,1{=⋅=≠==Y P X P Y X P 故X 与Y 不独立(ii) 这个性质可推广到有限个随机变量之和的情形.例题选讲:离散型随机变量的数学期望例1 (讲义例1) 甲, 乙两人进行打靶, 所得分数分别记为21,X X , 它们的分布律分别为,8.02.002101i p X1.03.06.02102ip X试评定他们的成绩的好坏.例2 (讲义例2) 某种产品的每件表面上的疵点数服从参数8.0=λ的泊松分布, 若规定疵点数不超过1个为一等品, 价值10元; 疵点数大于1个不多于4个为二等品, 价值8元; 疵点数超过4个为废品. 求:(1) 产品的废品率; (2) 产品价值的平均值.例3 按规定,某车站每天8:00~9:00和9:00~10:00之间都恰有一辆客车到站, 但到站的时刻是随机的, 且两者到站的时间相互独立. 其规律为一旅客8:20连续型随机变量的数学期望例4 (讲义例3) 已知随机变量X 的分布函数 ⎪⎩⎪⎨⎧>≤<≤=4,140,4/0,0)(x x x x x F , 求).(X E例5 (讲义例4) 某商店对某种家用电器的销售采用先使用后付款的方式. 记使用寿命为X (以年计), 规定:.3000,3;2500,32;2000,21;1500,1元一台付款元一台付款元一台付款元一台付款>≤<≤≤X X X X设寿命X 服从指数分布, 概率密度为()⎪⎩⎪⎨⎧≤>=-.0,00,10110/x x e x f x试求该商店一台电器收费Y 的数学期望.例6 (讲义例5) 设随机变量,127)(),(~=X E x f X 且 ⎩⎨⎧≤≤+=其它,010,)(x b ax x f求a 与b 的值, 并求分布函数)(x F .例7 有2个相互独立工作的电子装置, 它们的寿命)2,1(=k X k 服从统一指数分布,其概率密度为⎪⎩⎪⎨⎧≤>=-0,00,1)(/x x e x f x θθ,.0>θ若将这2个电子装置串联联接组成整机, 求整机寿命(以小时计)N 的数学期望.随机变量函数的数学期望例8 (讲义例6) 设),(Y X 的联合概率分布为:求).(),(),(XY E Y E X E例9 (讲义例7) 设随机变量X 在],0[π上服从均匀分布, 求)(),(sin 2X E X E 及.)]([2X E X E -例10 (讲义例8) 设随机变量),(Y X 的概率密度⎪⎩⎪⎨⎧><<=.,0,1,1,23),(23其它x x y x yx y x f 求数学期望.1),(⎪⎭⎫⎝⎛XY E Y E例11 (讲义例9) 设某商店经营一种商品, 每周的进货量X 和顾客对该种商品的需求量Y 是两个相互独立的随机变量, 均服从[10,20]上的均匀分布. 此商店每售出一个单位的商品可获利1000元, 若需求量超过进货量, 可从其他商店调剂供应, 此时售出的每单位商品仅获利500元. 求此商店经销这种商品每周获利的期望.例12 设)(),(2X E X E 均存在,证明222)]([)()]([X E X E X E X E -=-. 例13 (二项分布的数学期望)若),,(~p n b X 求).(X E 数学期望的性质例14 (讲义例10) 一民航送各车载有20位旅客自机场开出, 旅客有10个车站可以下车. 如到达一个车站没有旅客下车就不停车. 以X 表示停车的次数, 求E (X ) (设每位旅客在各个车站下车是等可能的, 并设各旅客是否下车相互独立).课堂练习1. 设甲、乙两人玩必分胜负的赌博游戏, 假定游戏的规则不公正, 以致两人获胜的概率不等,甲为p , 乙为q ,,q p >1=+q p . 为了补偿乙的不利地位, 另行规定两人下的赌注不相等, 甲为a , 乙为b , b a >. 现在的问题是: a 究竟应比b 大多少, 才能做到公正?2. 某种新药在400名病人中进行临床试验有一半人服用,一班人未服,经过5天后,有210人痊愈,其中190人是服了新药的.试用概率统计方法说明新药的疗效.3. 把数字n ,,2,1 任意地排成一列, 如果数字k 恰好出现在第k 个位置上, 则称为一个巧合, 求巧合个数的数学期望.第二节 方差随机变量的数学期望是对随机变量取值水平的综合评价, 而随机变量取值的稳定性是判断随机现象性质的另一个十分重要的指标.内容分布图示★ 引言 ★ 方差的定义★ 方差的计算 ★ 例1 ★ 例2★ 例3 ★ 例4 ★ 例5 ★ 例6★ 例7★ 方差的性质 ★ 例8 ★ 例9 ★ 例10★ 补充说明 ★ 例11 ★ 例12 ★ 条件期望与条件方差简介★ 例13★ 内容小结 ★ 课堂练习 ★ 习题4-2 ★ 返回内容要点:一、 方差的定义定义1 设X 是一个随机变量, 若2)]([(X E X E -存在,则称它为X 的方差, 记为.)]([)(2X E X E X D -=方差的算术平方根)(X D 称为标准差或均方差, 它与X 具有相同的度量单位, 在实际应用中经常使用.方差刻划了随机变量X 的取值与数学期望的偏离程度,它的大小可以衡量随机变量取值的稳定性.从方差的定义易见:(1)若X 的取值比较集中,则方差较小; (2)若X 的取值比较分散,则方差较大;(3)若方差0)(=X D , 则随机变量X 以概率1取常数值,此时X 也就不是随机变量了.二、 方差的计算若X 是离散型随机变量,且其概率分布为,2,1,}{===i p x X P i i则 ;)]([)(12∑∞=-=i i i p X E x X D若X 是连续型随机变量,且其概率密度为),(x f 则.)()]([)(2⎰∞∞--=dx x f X E x X D i利用数学期望的性质, 易得计算方差的一个简化公式:22)]([)()(X E X E X D -=.三、方差的性质1. 设C 常数, 则0)(=C D ;2. 若X 是随机变量, 若C 是常数, 则);()(2X D C CX D =3. 设Y X ,是两个随机向量,则)));())((((2)()()(Y E Y X E X E Y D X D Y X D --±+=± 特别地, 若Y X ,相互独立, 则).()()(Y D X D Y X D +=±注: 对n 维情形, 有: 若n X X X ,,,21 相互独立, 则.)(,)(12111∑∑∑∑=====⎥⎦⎤⎢⎣⎡=⎥⎦⎤⎢⎣⎡n i i i n i i i n i i n i i X D C X C D X D X D四、 条件数学期望和条件方差简介由于随机变量之间存在相互联系, 一个随机变量的取值可能会对另一随机变量的分布产生影响, 这种影响会在数字特征上得到反映. 下面要讨论的是:在某个随机变量取某值的条件下,求另一个与之相关的随机变量的数字特征. 作为简介,这里我们直接给出它们的定义.1. 设),(Y X 是离散型随机向量, 其概率分布为),,2,1,,2,1(},{ =====j i p y Y x X P ijj i定义2 (i) 称}|{)|(i j jj i x X y Y P y x X Y E ====∑(绝对收敛)为在 i x X =条件下Y 的条件数学期望.类似地,称 }|{)|(j i ii i y Y x X P x y Y X E ====∑(绝对收敛)为在 i y Y =条件下X 的条件数学期望;(ii) 称}|{)]|([)|(2i j ji j i x X y Y P x X Y E y x X Y D ===-==∑(绝对收敛)为在 i x X =条件下Y 的条件方差.类似地,称}|{)]|([)|(2j i ij i i y Y x X P y Y X E x y Y X D ===-==∑(绝对收敛)为在j y Y =条件下X 的条件方差.2.设),(Y X 是连续型随机向量, )|(|x y f X Y 是在x X =条件下的概率密度,)|(|y x f Y X 是在y Y =条件下X 的概率密度.定义3 (i) 称 ⎰+∞∞-==dy x y yf x X Y E X Y )|(]|[|(绝对收敛)为在 x X =条件下Y 的条件数学期望;类似地,称⎰+∞∞-==dx y x xf y Y X E Y X )|(]|[|(绝对收敛)为在 y Y =条件下X 的条件数学期望;(ii) 称dy x y f x X Y E y x X Y D X Y )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在x X =条件下Y 的条件方差;类似地,称dx y x f y Y X E x y Y X D Y X )|()]|([)|(|2⎰+∞∞-=-==(绝对收敛)为在y Y =条件下X 的条件方差.例题选讲:方差的计算例 1 (讲义例1) 设随机变量X 具有数学期望,)(μ=X E 方差.0)(2≠=σX D 记,*σμ-=X X 则;0])([1)(1)(*=-=-=μσμσX E X E X E.1])[(1])[()]([)()(222222*2**==-=-=-=σσμσσμX E X E X E XE X D即σμ-=X X *的数学期望为0, 方差为1. *X 称为X 的标准化变量.例2 (讲义例2) 设随机变量X 具有)10(-分布, 其分布律为,}1{,1}0{p X P p X P ==-==求),(X E ).(X D例3 (讲义例3) 设),(~λP X 求),(X E ).(X D 例4 (讲义例4) 设),,(~b a U X 求),(X E ).(X D例5 (讲义例5) 设随机变量X 服从指数分布, 其概率密度为⎪⎩⎪⎨⎧≤>=-.0,0,0,1)(/x x e x f x θθ其中,0>θ 求).(),(X D X E例6 (讲义例6) 设随机变量X 服从几何分布, 概率函数n k p p k X P k ,,2,1,)1(}{1 =-==-其中10<<p , 求)(),(X D X E .例7 (讲义例7) 设随机变量Y X ,的联合点分布在以点(0,1), (1,0), (1,1)为顶点的三角形区域上服从均匀分布, 试求随机变量Y X Z +=的期望与方差.方差的性质例8 (讲义例8) 设,,)()(2R x x X E x f ∈-= 证明当)(X E x =时, )(x f 达到最小值. 注:本例子说明了数学期望)(X E 是随机变量X 取值的集中位置, 反映了X 的平均值. 例9 (讲义例9) 设),(~p n b X , 求).(),(X D X E 例10 (讲义例10) 设),,(~2σμN X 求).(),(X D X E例11 (讲义例11) 设活塞的直径(以cm 计),40.22(~N X )03.02,气缸的直径,50.22(~N Y ),04.02 Y X ,相互独立, 任取一只活塞, 任取一只气缸, 求活塞能装入气缸的概率.例12 设随机变量X 和Y 相互独立, 试证).()]([)()]([)()()(22X D Y E Y D X E Y D X D XY D ++=条件数学期望和条件方差简介例 13 (讲义例12) 设),,,,(~),(222121ρσσμμN Y X ,求),|(x X Y E = )|(x X Y D =.课堂练习1. 设随机变量X 的密度函数为⎪⎩⎪⎨⎧≤≤-<≤=.,021,210,)(其它x x x x x f 求).(X E2. 设随机变量X 的概率分布律为4/112/16/16/13/1212/101i p X -试求1+-=X Y 及2X Z =的期望与方差.第三节 协方差及相关系数对多维随机变量, 随机变量的数学期望和方差只反映了各自的平均值与偏离程度,并没能反映随机变量之间的关系. 本节将要讨论的协方差是反映随机变量之间依赖关系的一个数字特征.内容分布图示★ 引言★ 协方差的定义★ 协方差的性质★ 例1 ★ 例2★ 相关系数的定义 ★ 相关系数的性质★ 例3 ★ 例4 ★ 例5 ★ 例6★ 矩的概念 ★ 协方差矩阵 ★ n 维正态分布的概率密度★ n 维正态分布的几个重要性质 ★ 例7★ 内容小结 ★ 课堂练习 ★ 习题4-3 ★ 返回内容要点:一、 协方差的定义定义 设),(Y X 为二维随机向量,若)]}()][({[Y E Y X E X E --存在, 则称其为随机变量X 和Y 的协方差, 记为),(Y XC o v ,即 )]}.()][({[),cov(Y E Y X E X E Y X --=按定义, 若),(Y X 为离散型随机向量,其概率分布为),2,1,(},{ ====j i p y Y x X P ijj i则 ∑--=ji j i Y E y X E x E Y X ,)]}.()][({[),cov(若),(Y X 为连续型随机向量, 其概率分布为),,(y x f 则⎰⎰+∞∞-+∞∞---=dxdy y x f Y E y X E x E Y X ),()]}()][({[),cov(.此外, 利用数学期望的性质, 易将协方差的计算化简.).()()()()()()()()()()]}()][({[),cov(Y E X E XY E Y E X E X E Y E Y E X E XY E Y E Y X E X E Y X -=+--=--=特别地, 当X 与Y 独立时, 有 .0),cov(=Y X二、协方差的性质1. 协方差的基本性质 );(),cov()1(X D X X = );,cov(),cov()2(X Y Y X =),cov(),cov()3(Y X ab bY aX =,其中b a ,是常数; C X C ,0),cov()4(=为任意常数;).,cov(),cov(),cov()5(2121Y X Y X Y X X +=+(6) 若X 与Y 相互独立时,则.0),cov(=Y X2. 随机变量和的方差与协方差的关系),,cov(2)()()(Y X Y D X D Y X D ++=+ 特别地, 若X 与Y 相互独立时, 则)()()(Y D X D Y X D +=+.三、相关系数的定义与性质定义 设),(Y X 为二维随机变量,,0)(,0)(>>Y D X D 称)()(),(Y D X D Y X Cov XY =ρ为随机变量X 和Y 的相关系数.有时也记XY ρ为ρ. 特别地,当0=XY ρ时,称X 与Y 不相关. 相关系数的性质1. ;1||≤XY ρ2. 若X 和Y 相互独立, 则0=XY ρ.3. 若0,0>>DY DX ,则1||=XY ρ当且仅当存在常数).0(,≠a b a 使1}{=+=b aX Y P , 而且当0>a 时, 1=XY ρ;当0<a 时, 1-=XY ρ.注: 相关系数XY ρ刻画了随机变量Y 与X 之间的“线性相关”程度. ||XY ρ的值越接近1, Y 与X 的线性相关程度越高; ||XY ρ的值越近于0, Y 与Y 的线性相关程度越弱.当1||=XY ρ时, Y 与X 的变化可完全由X 的线性函数给出. 当0=XY ρ时, Y 与X 之间不是线性关系.4. 设,)]([2b aX Y E e +-=称为用b aX +来近似Y 的均方误差,则有下列结论. 设,0)(,0)(>>Y D X D 则)()(,)(),cov(000X E a Y E b X D Y X a -==使均方误差达到最小.注: 我们可用均方误差e 来衡量以b aX +近似表示Y 的好坏程度, e 值越小表示b aX +与Y 的近似程度越好.且知最佳的线性近似为.0b X a +而其余均方误差)1)((2XY Y D e ρ-=. 从这个侧面也能说明. ||XY ρ越接近1, e 越小.反之, ||XY ρ越近于0, e 就越大.Y 与X 的线性相关性越小.四、矩的概念定义 设X 和Y 为随机变量, l k ,为正整数, 称)(k X E 为k 阶原点矩(简称k 阶矩阵); ))](([k X E X E - 为k 阶中心矩; )|(|k X E 为k 阶绝对原点矩; )|)((|k X E X E - 为k 阶绝对中心矩; )(l k Y X E 为X 和Y 的l k +阶混合矩;})]([)]({[l k Y E Y X E X E -- 为X 和Y 的l k +阶混合中心矩;注: 由定义可见:(1) X 的数学期望)(X E 是X 的一阶原点矩; (2) X 的方差)(X D 是X 的二阶中心矩;(3)协方差),(Y X Cov 是X 和Y 的二阶混合中心矩.五、协方差矩阵将二维随机变量),(21X X 的四个二阶中心矩)]}.()][({[)]},()][({[},)]({[},)]({[1122212211122222221111X E X X E X E c X E X X E X E c X E X E c X E X E c --=--=-=-=排成矩阵的形式: ⎪⎪⎭⎫⎝⎛22211211c c c c (对称矩阵),称此矩阵为),(21X X 的协方差矩阵. 类似定义n 维随机变量),,,(21n X X X 的协方差矩阵.若n j i X E X X E X E X X Cov c j j i i j i ij ,,2,1,)]}()][({[),( =--==都存在, 则称⎪⎪⎪⎪⎪⎭⎫⎝⎛=nn n n n n c c cc c cc c c C212222111211 为),,,(21n X X X 的协方差矩阵.六、n 维正态分布的概率密度七、n 维正态分布的几个重要性质例题选讲:协方差的性质例1 (讲义例1) 已知离散型随机向量),(Y X 的概率分布为求),cov(Y X .例2 (讲义例2) 设连续型随机变量),(Y X 的密度函数为⎩⎨⎧≤≤≤=其它,010,8),(y x xy y x f求),cov(Y X 和)(Y X D +.相关系数的性质例3 (易知,0)(=X E 于是XY 不相关. 这表示Y X ,不存在线性关系. 但},1{}2{0}1,2{=-=≠==-=Y P X P Y X P 知Y X ,不是相互独立的. 事实上, X 和Y 具有关系: ,2X Y =Y 的值完全可由X 的值所确定.例4 (讲义例4) 设θ服从],[ππ-上的均匀分布, ,sin θ=X θcos =Y 判断X 与Y 是否不相关, 是否独立.例5 (讲义例5) 已知)3,1(~2N X , ),4,0(~2N Y 且X 与Y 的相关系数 .21-=XY ρ 设,23YX Z -=求)(Z D 及.XZ ρ 例6 (讲义例6) 设),(Y X 服从二维正态分布, 它的概率密度为,)())((2)()1(21exp 121),(2222212121212221⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⎥⎥⎦⎤⎢⎢⎣⎡-+-------=σμσσμμρσμρρσπσy y x x y x f 求X 和Y 的相关系数XY ρ.注:在上一章中我们已经得到:若),(Y X 服从二维正态分布, 那么X 和Y 相互独立的充要条件为0=ρ. 现在知道ρ即为X 与Y 的相关系数, 故有下列结论:“若),(Y X 服从二维正态分布,则X 与Y 相互独, 立当且仅当X 与Y 不相关”.n 维正态分布的几个重要性质例7 (讲义例7) 设随机变量X 和Y 相互独立且),.2,1(~N X )1,0(~N Y ,试求32+-=Y X Z 的概率密度.课堂练习1. 对不同品牌的某种机械的两项重要指标评分, 设21,X X 为其所得分数(百分制). 已知,9.68)(1=X E 8.72)(2=X E ; ,81)(1=X D ;49)(2=X D .36),cov(21=X X现以服从正态分布的综合分21167169X X Y +=来决定各参评品牌的名次 .(1) 试求Y 的分布; (2) 如果对综合分85≥Y 的品牌颁奖, 试计算获奖者的百分比.第四节 大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示★大数定理的引入 ★依概率收敛 ★切比雪夫不等式 ★例1 ★例2★切比雪夫大数定理 ★例3★泊努力大数定理★辛钦大数定理 ★例4★例5大数定理★中心极限定理的引入 ★林德伯格—勒维定理★棣莫佛—拉普拉斯定理 ★例6 ★例7 ★例8 ★例9★例10 ★例11 ★用频率估计概率的误差 ★例12 ★李维普诺夫定理★高尔顿钉板试验中心极限定理★内容小结 ★课堂练习 ★习题4-4★返回内容要点:一、依概率收敛与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性. 定义1 设 ,,,,21n X X X 是一个随机变量序列, a 为一个常数,若对于任意给定的正数ε,有 ,1}|{|lim =<-∞→εa X P n n 则称序列 ,,,,21n X X X 依概率收敛于a , 记为).(∞→−→−n a X Pn定理1 设,,b Y a X Pn P n −→−−→−又设函数),(y x g 在点),(b a 连续, 则),(),(b a g Y X g Pn n −→−.二、切比雪夫不等式定理2设随机变量X 有期望μ=)(X E 和方差2)(σ=X D ,则对于任给0>ε, 有22}|{|εσεμ≤≥-X P .上述不等式称切比雪夫不等式.注:(i) 由切比雪夫不等式可以看出,若2σ越小, 则事件}|)({|ε<-X E X的概率越大, 即, 随机变量X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度.(ii) 当方差已知时,切比雪夫不等式给出了X 与它的期望的偏差不小于ε的概率的估计式.如取,3σε= 则有.111.09}3|)({|22≈≤≥-σσσX E X P故对任给的分布,只要期望和方差2σ存在, 则随机变量X 取值偏离)(X E 超过σ3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3 (切比雪夫大数定律)设 ,,,,21n X X X 是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即,,2,1,)( =≤i K X D i 则对任意0>ε, 有1)(11lim 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-∑∑==∞→εn i i n i i n X E n X n P 注: 定理表明: 当n 很大时,随机变量序列}{n X 的算术平均值∑=ni i X n 11依概率收敛于其数学期望∑=ni i X E n 1)(1.2.伯努利大数定理定理4 (伯努利大数定律)设A n 是n 重伯努利试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率, 则对任意的0>ε, 有1lim =⎭⎬⎫⎩⎨⎧<-→∞εp n n P A n 或 0l i m =⎭⎬⎫⎩⎨⎧≥-→∞εp n n P A n . 注:(i) 伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n 充分大时, 事件A 发生的频率nn A依概率收敛于事件A 发生的概率p .定理以严格的数学形式表达了频率的稳定性. 在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii) 如果事件A 的概率很小,则由伯努利大数定律知事件A 发生的频率也是很小的,或者说事件A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛. 但应注意到,小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生.3.辛钦大数定理定理5 (辛钦大数定律) 设随机变量 ,,,,21n X X X 相互独立, 服从同一分布,且具有数学期望,,2,1,)( ==i X E i μ 则对任意0>ε, 有11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P . 注: (i) 定理不要求随机变量的方差存在;(ii) 伯努利大数定律是辛钦大数定律的特殊情况;(iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n 块,计算其平均亩产量, 则当n 较大时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式,但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE Bδδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1 (讲义例1) 已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700. 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.例2 (讲义例2) 在每次试验中, 事件A 发生的概率为0.75, 利用切比雪夫不等式求: 事件A 出现的频率在0.74~0.76之间的概率至少为0.90? 切比雪夫大数定律例3 (讲义例3) 设}{k X 为相互独立的随机变量序列, 且,212112120212212++--k kk kk k pX ,2,1=k 试证}{k X 服从大数定律.辛钦大数定理例4 (讲义例4) 设}{k X 为相互独立且同分布的随机变量序列, 并且k X 的概率分布为),,2,1(2}2{ln 2 ===--i X P ii i k试证}{k X 服从大数定律.中心极限定理例5 在一个罐子中,装有10个编号为0-9的同样的球,从罐中放回地抽取若干次,每次抽一个,并记下号码. 设⎩⎨⎧=否则次取到号码第,00,1k X k , n k ,2,1=问对序列}{k X 能否应用大数定律?例6 (讲义例5) 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g 标准差是10g, 一盒螺丝钉的重量超过10.2kg 的概率.例7 (讲义例6)一船舶在某海区航行,已知每遭受一次波浪的冲击,纵摇角大于 3的概率为,3/1=p 若船舶遭受了90000次波浪冲击,问其中有29500~30500次纵摇角度大于 3的概率是多少?例8 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15. 若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布.(1)求参加会议的家长数X 超过450的概率;(2)求有1名家长来参加会议的学生数不多于340的概率.例9 (讲义例7)(供电问题)某车间有200台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车. 设开工率为0.6,并设每台车床的工作是独立的, 且在开工时需电力1千瓦. 问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?例10 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9. 以95%概率估计, 在一次行动中:(1)至少有多少人能进入掩蔽体; (2)至多有多少人能进入掩蔽体.例11 (讲义例8) 设一大批产品中一级品率为10%, 现从中任取500件.(1) 分别用切比雪夫不等式估计和中心极限定理计算: 这500件中一级品的比例与10%之差的绝对值小于2%的概率;(2) 至少应取多少件才能使一级品的比例与10%之差的绝对值小于2%的把握大于95%?用频率估计概率的误差例12 (讲义例9 现从某厂生产的一批同型号电子元件中抽取395件, 由于次品率未知,需要通过次品的相对频率来估计, 这时估计的可靠性大于95%. (1)求绝对误差ε;(2)如果样品中有十分之一是次品, 应对p 怎样估计?李雅普诺夫定理例13 (讲义例10高尔顿钉板试验如图4-4-2是高尔顿钉板, 常常在赌博游戏中见到, 庄家常常在两边放置值钱的东西来吸引顾客, 现在可用中心极限定理来揭穿这个赌博中的奥秘.设n 为钉子的排数, 记随机变量。
第四章随机变量的数字特征总结(总15页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--第四章 随机变量的数字特征㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置. 1、数学期望的定义(1) 定义 离散型和连续型随机变量X 的数学期望定义为{}⎪⎩⎪⎨⎧==⎰∑∞∞- d )( )()( ,,连续型离散型x x xf x X x X kk k P E 其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在. ①常见的离散型随机变量的数学期望1、离散型随机变量的数学期望设离散型随机变量的概率分布为,若,则称级数为随机变量的数学期望(或称为均值),记为, 即2、两点分布的数学期望设服从0—1分布,则有,根据定义,的数学期望为.3、二项分布的数学期望设服从以为参数的二项分布,,则。
4、泊松分布的数学期望设随机变量服从参数为的泊松分布,即,从而有。
①常见的连续型随机变量的数学期望1)均匀分布设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a <b ),它的概率密度函数为:= 则=∴ E(ξ)=(a+b)/2.即数学期望位于区间的中点.2)正态分布设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为:(σ>0, - <μ<+ )则令得∴ E(ξ)=μ .3)指数分布设随机变量服从参数为的指数分布,的密度函数为,则.(2) 随机变量的函数的数学期望设)(xgy=为连续函数或分段连续函数,而X是任一随机变量,则随机变量)(XgY=的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出Y的概率分布再求其数学期望;对于二元函数),(YXgZ=,有类似的公式:(){}⎪⎩⎪⎨⎧===⎰∑∞∞.;(连续型)离散型-d)()()()(xxfxgxXxgXgY kkkPEE()(){}()()()()⎪⎩⎪⎨⎧====⎰⎰∑∑∞∞-∞∞-.;连续型离散型dd,,,,,yxyxfyxgyYxXyxgYXgZi jjijiPEE设(,)X Y为二维离散型随机变量,其联合概率函数(,),,1,2,,i j ijP X a Y b p i j====如果级数(,)i j ijj ig a b p∑∑绝对收敛,则(,)X Y的函数(,)g X Y的数学期望为[(,)](,)i j ijjiE g X Y g a b p =∑∑; 特别地();()i ij j ijiijiE X a p E Y b p ==∑∑∑∑.设X 为连续型随机变量,其概率密度为()f x ,如果广义积分 ()()g x f x dx+∞-∞⎰绝对收敛,则X 的函数()g X 的数学期望为[()]()()E g X g x f x dx+∞-∞=⎰.设(,)X Y 为二维连续型随机变量,其联合概率密度为(,)f x y ,如果广义积分(,)(,)g x y f x y dxdy+∞+∞-∞-∞⎰⎰绝对收敛,则(,)X Y 的函数(,)g X Y 的数学期望为[(,)](,)(,)E g x y g x y f x y dxdy+∞+∞-∞-∞=⎰⎰;特别地()(,)E x xf x y dxdy +∞+∞-∞-∞=⎰⎰,()(,)E Y yf x y dxdy+∞+∞-∞-∞=⎰⎰.注:求E(X,Y)是无意义的,比如说二维(身高,胖瘦)的数学期望是无意义的,但是二维随机变量函数Z= E(X,Y)是有意义的,他表示的是函数下的另一个一维意义。
第四章随机变量的数字特征知道了随机变量的概率分布也就知道了它的全部统计特性.然而,在许多实际问题中,随机变量的概率分布往往不易求得,也有不少实际问题并不需要我们知道随机变量的全部统计特性,而只需要知道它的某些主要统计特征.举例:学生成绩.首先要知道平均成绩,其次又要注意各个学生的成绩与平均成绩的偏离程度. 平均成绩越高,偏离程度越小,学生学习成绩就越好。
我们把表示随机变量某些特征的数值称为随机变量的数字特征,它们反映了随机变量的某些本质属性.许多重要的分布往往由这些数字特征唯一确定.本章主要介绍数学期望、方差、相关系数和矩.第一节数学期望一数学期望的定义1. 引例设有十个数字1,1,2,2,2,3,3,3,3,4 以表示平均值,则有又可以写成。
显然,这里的实际上是数字1,2,3,4在这十个数字中所占的份额,我们可以称之为这四个数字的“权重”,所以上式又可称为是1,2,3,4这四个数字的加权平均数。
再换一个角度,设想这是十张写有数字的卡片,随机从中取出一张,观察到的数值为,则它是一个随机变量,它的可能取值为1,2,3,4,而它的分布律为:因此,实质上就是随机变量的取值的平均数。
受此问题的启发,引出如下数学期望的定义.2.数学期望(Mathematical expectation)或均值(Mean的定义1)[定义] 设是离散型随机变量,其概率函数为如果级数绝对收敛,则定义的数学期望为;2)[定义] 设为连续型随机变量,其概率密度为,如果广义积分绝对可积,则定义的数学期望为.【注1】数学期望即随机变量的平均取值,它是所有可能取值以概率为权重的加“权”平均.考察随机变量的平均取值.【注2】连续型随机变量的数学期望和离散型随机变量的数学期望的实质是相同的:相当于;相当于;相当于.【注3】物理解释:数学期望——重心.设有总质量为的个质点构成的质点系,记点在轴上的坐标为,质量为,求该质点系的重心坐标.解:记质点系的重心坐标为,于是,这里是在点处的质量占总质量的比重,因此是以为权的加“权”平均.例1甲、乙两人作射击比赛,命中环数分别为,它们的分布律分别为问:哪一个射手的本领较好?解(环)(环)显然,,因此甲比乙的本领要好些.例2 设随机变量X的密度函数为:,求.解:. 二随机变量函数的数学期望1.[定义] 设为离散型随机变量,其概率函数,为连续函数,且级数绝对收敛,则的函数的数学期望为2.[定义] 设为连续型随机变量,其概率密度为,如果广义积分绝对收敛,则的函数的数学期望为:.例3.设离散型随机变量X的分布律如下,求:.X 0 1 2P 3/10 6/10 1/10解:.例4.设风速X是一个随机变量,在[0,]上服从均匀分布,而飞机的两机翼受到的压力Y与风速X的平方成正比,即,,求:.解:X的密度函数为,而,所以.三数学期望的性质1. (其中c为常数;2. (其中c为常数;3. ;4. 如果X与Y相互独立,则.例4. 若X的数学期望E(X)存在,求:解:第二节方差与标准差一方差(Variance)与标准差(Standard deviation的概念1.方差与标准差的定义[定义] 设是随机变量,若存在,则称为的方差,记为或,即.随机变量的标准差定义为方差的算术平方根,记为.从定义中可清楚地看出:方差实际上是随机变量X 的函数的数学期望,于是当为离散型随机变量,其方差为;当为连续型随机变量,其方差为.【注1】方差描述的是随机变量取值的波动程度,或随机变量偏离均值的程度.2.计算方差的简便公式:利用数学期望的性质,可以得到:.因此,方差的计算常常用简便公式:例1 设,求:解:=0;;所以:.二方差的性质1. (c是常数;2. (c是常数;3. (c是常数;4. 如果与独立,则这个结论可以推广到有限个相互独立的随机变量的情况:设相互独立,则有.例2.设两个相互独立的随机变量与,它们的方差分别为4和2,求解:.例3. 随机变量X有,且已知求解:由∴,故:. 三常用分布的数学期望与方差分布名称数学期望方差0-1 分布p p(1p二项分布np n p (1p泊松分布π(均匀分布指数分布Exp(正态分布N(, 2 2例4. 设随机变量X在区间上服从均匀分布,求解:,;;∴.例5. 设随机变量X服从参数为的二项分布,求解:由二项分布的定义可知:随机变量X表示重贝努里试验中事件A发生的次数,且在每次试验中A发生的概率为.现在引进随机变量,表示在第次试验中A发生;表示在第次试验中A不发生,则.由于各次试验的独立性,且,可得:,,,所以:;.【注2】当直接求某个随机变量的数学期望或方差有困难或计算麻烦时,一个较为有效的处理技巧是把它分解成若干容易求数学期望或方差的随机变量的和,从而可以方便地求出该随机变量的数学期望或方差。