概率论与数理统计第二章(浅色背景)
- 格式:ppt
- 大小:3.43 MB
- 文档页数:91
第2章 随机变量及其分布为了更深刻地揭示随机现象的统计规律性,有必要将随机试验的结果数量化,即把随机试验的结果及实数对应起来,可以凭借更多的数学工具研究随机试验的结果,因此需要引入随机变量的概念.2.1 随机变量及其分布函数随机变量的概念定义 2.1 设E 是随机试验,Ω是其样本空间. 如果对每个Ω∈e ,总有一个实值函数)(e X X =及之对应,则称Ω上的实值函数)(e X 为E 的一个随机变量.随机变量常用大写字母Z Y X ,,等表示,其取值用小写字母z y x ,,等表示.若一个随机变量仅取有限个或可列个值,则称其为离散随机变量.若一个随机变量取值充满数轴上的一个区间),(b a ,则称其为连续随机变量,其中a 可以是∞-,b 可以是∞+.通过以下几个例子,可以很好地理解上述随机变量抽象的定义.(1) 掷一颗骰子,出现的点数X . (2) 单位时间内某手机被呼叫的次数Y .(3)某品种杨树的寿命T . (4)测量某物理量的误差ε.(5)若某个试验只有两个结果,例如,播种一颗银杏种子,可以定义随机变量.值得注意的是:(1)对任意实数x ,}{x X ≤表示随机事件;(2)可以求出概率)(x XP ≤.在上面的例子中,,316161)6()5()4(=+==+==>X P X P X P 等;但是不能求得以下概率,如)100(=Y P ,)1500(>T P ,5.1|(|≤εP 等,因此还需要引入随机变量分布函数的概念.随机变量的分布函数定义2.2 设X 是一个随机变量,对任意实数x ,称)()(x X P x F ≤= ()为随机变量X 的分布函数.且称X 服从)(x F ,记为)(~x F X .有时也可用)(x F X (把X 作为F 的下标)以表明是X 的分布函数. 例2.1 向半径为r 的圆内随机抛一点,求此点到圆心之距离X 的分布函数)(x F ,并求.解 事件“x X ≤”表示所抛之点落在半径为)0(r x x ≤≤的圆内,故由几何概率知222)()()(r x rx x X P x F ==≤=ππ,从而43)21(1)2(1)2(1)2(2=-=-=≤-=>r F r X p r Xp . 从分布函数的定义可以看出,任一随机变量X (离散的或连续的)都有一个分布函数.有了分布函数,就可据此计算得及随机变量X 有关事件的概率.下面先给出分布函数的3个基本性质.定理 2.1 任一随机变量的分布函数)(x F 都具有如下三条基本性质:(1)单调性 )(x F 是定义在整个实数轴),(∞+-∞上的单调非减函数,即对任意的21x x <,有)()(21x F x F ≤.(2)有界性 对任意的x ,有1)(0≤≤x F ,且 0)(lim )(==-∞-∞→x F F x ,1)(lim )(==+∞+∞→x F F x . (3)右连续性 )(x F 是x 的右连续函数,即对任意的0x ,有 )()0(00x F x F =+.值得注意,满足这3个性质的函数一定是某个随机变量的分布函数.例2.2 设随机变量X 的分布函数为 +∞<<-∞+=x x B A x F ,arctan )(,试求:⑴待定系数B A ,;⑵随机变量X 落在(-1,1)内的概率.解 ⑴ 由0)(=-∞F ,1)(=+∞F , 可得 , 解得 ,于是+∞<<-∞+=x x x F ,arctan 121)(π.⑵ )1()1()11()11(--=≤<-=<<-F F X P X P .利用随机变量X 的分布函数,可以计算有关X 的各种事件的概率.例如,对任意的实数b a ,,有 )()()(a F b F b X a P -=≤<,)0()()(--==a F a F a XP ,)0(1)(--=≥b F b X P , )(1)(b F b XP -=>, )()0()(a F b F b X a P --=<<, )0()()(--=≤≤a F b F b Xa P ,)0()0()(---=<≤a F b F b X a P . 特别当)(x F 在a 及b 连续时,有 )()0(a F a F =-,)()0(b F b F --. 例2.3 设随机变量X 的分布函数为 ,试求:(1))31(≤<X P ;(2))2(>XP ;(3))5.1(=X P . 解 (1)6.04.01)1()3()31(=-=-=≤<F F X p ; (2)4.06.01)2(1)2(=-=-=>F X p ; (3)04.04.0)05.1()5.1()5.1(=-=--==F F X p .§2.2 离散型随机变量的分布律定义2.3 设X 是一个离散型随机变量,其所有可能的取值是 ,,,,21i x x x ,则称X 取i x 的概率 ,2,1,)(===i x X P p i i()为X 的概率分布律或简称为分布律,记为}{~i p X ,分布律也可用列表的方法来表示:或记成⎪⎪⎭⎫ ⎝⎛ii p p px x x X 2121~ 分布律的基本性质: (1) ,2,1,0=≥i p i ;(2).由离散型随机变量X 的分布律很容易写出X 的分布函数:∑≤=≤=xx i i p x X P x F )()(.它的图形是有限级(或无穷级)的阶梯函数.在离散场合,常用分布律来描述分布,很少用到分布函数.因为求离散随机变量X 的有关事件的概率时,用分布律比用分布函数来得更方便.例 设离散型随机变量X 的分布律为试求)5.0(≤X P ,)5.25.1(≤<XP 并写出X的分布函数.解 25.0)1()5.0(=-==≤X P XP ,5.0)2()5.25.1(===≤<X P XP ,⎪⎪⎩⎪⎪⎨⎧≥=++<≤=+<≤-<=3,125.05.025.021,75.05.025.010,25.01,0)(x x x x x F .)(x F 的图形如图2—1所示._x特别地,常量c 可看作仅取一个值的随机变量X ,即 1)(==c XP .这个分布常称为单点分布或退化分布,它的分布函数是 . () 其图形如图2—2.以下例子说明,已知离散型随机变量的分布函数,可以求出它的分布律.例2.5 设随机变量X 的分布函数为 , 则X 的分布律为2.3 常见离散型随机变量分布1.两点分布_ 图 2 — 2_x若离散型随机变量X 的分布律为则称随机变量X 服从参数为p 的两点分布(或10-分布),记为),1(~p B X .例 播种一颗银杏种子,银杏的发芽率为0.9,定义随机变量,则)9.0,1(~B X . 2.二项分布若离散型随机变量X 的分布律为kn k p p k n k X P --⎪⎪⎭⎫ ⎝⎛==)1()(,n k ,,2,1,0 =. (2.4)则称随机变量X 服从参数为p 的二项分布,记为),(~p n B X .两点分布是二项分布中当1=n 时的特例.例2.7 假设银杏移栽的成活率为,现移栽10颗,问至少有8颗成活的概率是多少?解 设移栽银杏的颗数为X ,则)95.0,10(~B X ,而所求概率为)10()9()8()8(=+=+==≥X P X P X P XP9885.005.095.01010010=⎪⎪⎭⎫ ⎝⎛. 3.泊松分布若离散型随机变量X 的分布律为, ,2,1,0=k , (2.5)其中参数0>λ,则称随机变量X 服从参数为λ的泊松分布,记为)(~λP X.例 已知某种产品表面上的疵点数服从参数5.0=λ的泊松分布,若规定疵点数不超过一个的产品为合格品,疵点数至少为两个的产品为不合格品.试求此产品为不合格品的概率. 解 设X 为此产品表面上的疵点数,则)5.0(~P X,即, ,2,1,0=k .于是有)1()0(1)2(1)2(=-=-=<-=≥X P X P X P X P. 4.几何分布若离散型随机变量X 的分布律为 1)(-==k pq k XP , ,2,1=k , (2.6)其中p q p -=<<1,10,则称随机变量X 服从参数为p 的几何分布,记为)(~p G X.设E 为一随机试验,A 为其事件,p A P =)(,q p A P =-=1)(,现作独立重复试验直到A 出现为止. 以X 表示事件A 出现的总次数,则随机变量X 可取值 ,,,2,1k .以k A 表示在第k 重试验中事件A 出现的事件,则 )()(121k k A A A A P k XP -===)()()()()(A P A P A P A P A A A A P = =1-k pq , ,2,1=k . 5. 超几何分布若离散型随机变量X 的分布律为, (2.7) 其中N n N M ≤≤≤≤0,0,k 是满足不等式 ),min(),0max(M n k m N n ≤≤+-的所有整数,则称随机变量X 服从参数为N M n ,,的超几何分布,记为),,(~N M n H X.例 设一批木工板共N 张,其中有M 张次品(N M ≤≤0),M N -n (N n ≤≤0)张,以X表示所取得的次品数,试求随机变量X 的分布律.解 若M N n -=,则X 可取的最小数显然为0;若M N n ->,则X 可取的最小数为)(M N n --. 这样,X 可取的最小数是 ),0max(m N n +-.若M n ≤,则X 可取的最大数为n ;若M n >,则X 可取的最大数为)(M N n --. 这样,X 可取的最大数是 ),min(M n . 按古典概型计算得 ,其中,N n N M ≤≤≤≤0,0,k 是满足不等式),min(),0max(M n k m N n ≤≤+-的所有整数.2.4 连续型随机变量的概率密度函数定义 2.4 设随机变量X 的分布函数为)(x F ,如果存在实数轴上的一个非负可积函数)(x f ,使得对任意实数x ,有⎰∞-=xdt t f x F )()(,(2.8)则称X 为连续型随机变量,称)(x f 为X的概率密度函数,简称为密度函数.在)(x F 的可导点处有 ()()F x f x '=.(2.9)密度函数的基本性质: (1)0)(≥x f ; (2)⎰∞+∞-=1)(dx x f .(3)若X 的密度函数为)(x f ,则 ,其中I 为某一区间.(4)若X 为连续型随机变量,则=<<)(b X a P =<≤)(b X a P =≤<)(b X a P )(b X a P ≤≤.注意及离散情形的区别.例 已知随机变量X 的密度函数为,求(1)常数c ;(2))3/10(<<X p ;(3)分布函数)(x F . 解 (1)由⎰∞+∞-=dx x f )(1,得2=c ; (2)912)3/10(3/1023/10===<<⎰x xdx X p ; (3)根据x 的取值情况来确定积分⎰∞-=x dt t f x F )()(.当0<x 时,00)(==⎰∞-xdt x F ;当10<≤x 时,⎰∞-=00)(dt x F 202x dt t x=+⎰; 当1≥x 时,⎰∞-=00)(dt x F ⎰+102dt t 101=+⎰xdt . 从而得随机变量X 的密度函数为 ,_x)(x F 的图形如图2—3.例2.11 设随机变量X 的密度函数为⎪⎩⎪⎨⎧<≤-<≤=其他,021,210,)(x x x x x f ,试求随机变量X 的分布函数)(x F .解 当0<x 时,0)()(==⎰∞-xdt t f x F ; 当10<≤x 时,;当21<≤x 时,122)2()(2110-+-=-+=⎰⎰x x dt t dt t x F x;当2≥x 时,1)2()(2110=-+=⎰⎰dt t dt t x F . 综上所述,得X 的分布函数为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤-+-<≤<=2,121,12210,20,0)(22x x x x x x x x F)(x F 的图形如图2—4.2.5 常见连续型随机变量分布1.均匀分布若连续型随机变量X 的密度函数(见图2—5(1))为⎪⎩⎪⎨⎧≤≤-=其他,0,1)(b x a ab x f , (0) 则称X 服从区间],[b a 上的均匀分布,记为),(~b a U X ,其分布函数为(见图2—5(2))._ 图 2 — 4_x0,(),1,x a x aF x a x b b ax b <⎧⎪-⎪=≤<⎨-⎪≥⎪⎩.(2.11)例1 设随机变量X 服从区间]1,0[上的均匀分布,现对X 进行4次独立观测,试求至少有3次观测值大于1/2的概率. 解 设Y 是3次独立观测中观测值大于1/2的次数,则),4(~p B Y ,其中.由)1,0(~U X ,知X的密度函数为.所以211)21(121==>=⎰dx X p p ,于是0413)1(44)1(34)4()3()3(p p p p Y P Y P Y P -⎪⎪⎭⎫ ⎝⎛+-⎪⎪⎭⎫ ⎝⎛==+==≥ 165)21()21()21(443=+⨯=.2.指数分布若连续型随机变量X 的密度函数为(0>θ), (2.12)1/(b-a)a图2—7(1)p(x)x图2—7(2)F(x)x则称X 服从参数为θ的指数分布,记为.例2 设某电子产品的使用寿命X (h )服从参数为500=θ的指数分布,试求该电子产品的使用寿命超过1000h 的概率. 解 由,知 ⎪⎩⎪⎨⎧≤>=-0,00,5001)(500x x e x f x. 于是1353.05001)1000(210005005001000≈===>-∞+--∞+⎰e e dx e X p xx.3.正态分布正态分布是概率论及数理统计中最重要的一个分布,后面还要指出正态分布是一切分布的中心.1)正态分布的密度函数和分布函数 若连续型随机变量X 的密度函数为, +∞<<∞-x , (2.13)则称X 服从参数为2,σμ的正态分布,记为),(~2σμN X.其中参数+∞<<∞-μ,0>σ.其密度函数)(x f 图形如图2—6(1)所示.)(x f 的图形是一条钟形线,其对称轴为μ=x .)(x f 在μ=x 处取最大值,曲线上对应于图2—8(1)x图2—8(2)σμ±=x 的点为拐点.正态分布),(2σμN 的分布函数为⎰∞---=xt dtex F 222)(21)(σμσπ.(2.14)它是一条光滑上升的S 形曲线,见图2—6(2).图2—7给出了在μ和σ变化时,相应正态密度曲线的变化情况.(1)从图2—7(1)中可以看出:如果固定σ,改变μ的值,则图形沿x 轴平移,而不改变其形状.也就是说正态密度函数的位置由参数μ所确定,因此也称μ为位置参数.(2)从图2—7(2)中可以看出:如果固定μ,改变σ的值,则σ越小,曲线越陡峭;σ越大,曲线越扁平.也就是说正态函数的尺度由参数σ所确定,因此也称σ为尺度参数.2)标准正态分布称0=μ,1=σ的正态分布)1,0(N 为标准正态分布. 记标准正态分布的密度函数为)(x ϕ,分布函数为)(x Φ,即,+∞<<∞-x ,图2—9(1)图2—9(2))(x Φ,+∞<<∞-x .由于标准正态分布的分布函数不含任何未知参数,故其值)()(x X P x ≤=Φ完全可以算出,附表2对0≥x 给出了)(x Φ的值,利用这张表可以算得(1)-=-Φ1)(x )(x Φ. (2))(1)(x x XP Φ-=>. (3))()()(a b x Xa P Φ-Φ=<<.(4)1)(2)|(|-Φ=<c c X P . 例3 设)1,0(~N X,利用附表1,求下列事件的概率:(1)8944.0)25.1()25.1(=Φ=≤X p .(2)1056.08944.01)25.1(1)25.1(=-=Φ-=>X p .(3)1056.08944.01)25.1(1)25.1()25.1(=-=Φ-=-Φ=-<X p . (4)7888.018944.021)25.1(2)25.1(=-⨯=-Φ=≤X p . 3)一般正态分布的标准化为了计算及一般正态变量有关的事件的概率,需要将一般正态分布进行标准化,然后再查标准正态分布函数表. 若),(~2σμN X,则(1). (2.15) (2))()()(σμσμ-Φ--Φ=≤<a b b X a P .(2.16)例4 设)4,86(~N X ,试求 (1))9282(<<X p ; (2)常数a ,使得95.0)(=<a XP .解 (1))28682()28692()9282(-Φ--Φ=<<X p1)2()3()2()3(-Φ+Φ=-Φ-Φ= 9759.019772.09987.0=-+=. (2)由95.0)286()(=-Φ=<a a X p ,或,其中1-Φ为Φ的反函数.从附表1由里向外反查得 9495.0)64.1(=Φ,9505.0)65.1(=Φ,再利用线性内插法可得95.0)645.1(=Φ,即645.1)95.0(1=Φ-,故 , 从中解得29.89=a .2.6 随机变量函数的分布设)(x g y =是定义在直线上的一个函数,X 是一个随机变量,那么)(X g Y=作为X 的一个函数,同样也是一个随机变量. 我们所要研究的问题是:已知X 的分布,如何求)(X g Y=的分布.2.6.1 离散型随机变量函数的分布设X 是一个离散型随机变量,X 的分布律为则)(X g Y =也是一个离散型随机变量,此时Y 的分布律可表示为Y)()()(21i x g x g x gPip p p 21当 ),(,),(),(21i x g x g x g 中有某些值相等时,则把那些相等的值分别合并,并将对应的概率相加即可.例2.15 已知X 的分布律为(1)求121+=X Y 的分布律;(2)求X X Y -=32的分布律. 解 (1)121+=X Y 的分布律为(2) X X Y -=32的分布律为再将相等的值合并得2.6.2 连续型随机变量函数的分布通过以下几则例子,介绍求连续型随机变量函数的分布的一种方法,称之为分布函数法.例2.16 设随机变量X 的密度函数为⎩⎨⎧<<=其他,010,2)(x x x f X , 试求随机变量12+=X Y 的密度函数)(y f Y .解 )12()()(y X P y Y P y F Y ≤+=≤=))1(21(21)()(-='=y p y F y f X Y Y.一般地,还可以利用分布函数法证明以下定理. 定理 设X 是连续型随机变量,其密度函数为)(x f X .)(X g Y=是另一个随机变量.若)(x g y =严格单调,其反函数)(y h 有连续导函数,则)(X g Y=的密度函数为⎩⎨⎧<<'=其他,0,|)(|)]([)(b y a y h y h f y f X Y .(2.17)其中)}(),(min{+∞-∞=g g a ,)}(),(max{+∞-∞=g g b .证明 不妨设)(x g y =是严格单调递增函数,这时它的反函数)(y h 也是严格单调递增函数,且)(>'y h .记)(-∞=g a ,)(+∞=g b ,这就意味着)(x g y =仅在区间),(b a 取值,于是当a y <时,0)()(=≤=y Y P y F Y ; 当b y >时,1)()(=≤=y Y P y F Y ; 当b y a ≤≤时,))(()()(y X g P y Y P y F Y ≤=≤= =dt t f y h X P y h X ⎰∞-=≤)()())((. 由此得Y 的密度函数为⎩⎨⎧<<'=其他,0,)()]([)(by a y h y h f y f X Y .同理可证当)(x g y =是严格单调递减函数时,结论也成立.但此时应注意0)(<'y h ,所以要加绝对值符号,这时,)(+∞=g a ,)(-∞=g b .利用上述定理,可以证明以下一个很有用的结论. 定理2.3 若),(~2σμN X,则.证明 是严格递增函数,仍在),(∞+-∞上取值,其反函数为μσ+==y y h x )(,σ=')(y h ,由定理可得2221)()()]([)(y X X Y e y f y h y h f y f -=+='=πσμσ,所以.定理 设随机变量X 服从正态分布),(~2σμN X ,则当0≠a 时,有~b aX Y +=),(~22σμa b a N X +.证明 当)0(0<>a 时,b ax y +=是严格递增(减)函数,仍在),(∞+-∞上取值,其反函数为a b y y h x /)()(-==,a y h /1)(=',由定理可得|1|)(|)(|)]([)(aa b y f y h y h f y f X X Y -='= }2)]([exp{)|(|21222σμσπa b a y a +--=. 这是正态分布),(22σμa b a N +的密度函数,结论得证.这个定理表明:正态变量的线性函数仍为正态变量.特别地,取σ/1=a ,σμ/-=b ,则~b aX Y +=)1,0(N ,此即定理2.3.定理 若X 的分布函数)(x F X 为连续严格递增的连续函数,则)(X F YX =服从区间)1,0(上均匀分布)1,0(U .证明 由于分布函数)(x F X 仅在区间]1,0[上取值,所以 当0<y 时,0))(()()(=≤=≤=y X F P y Y P y F X Y . 当1≥y 时,1))(()()(=≤=≤=y X F P y Y P y F X Y . 当10<≤y 时,))(()()(y X F P y Y P y F X Y ≤=≤= y y F F y F X P X X X ==≤=--)(()((11.从而⎩⎨⎧<<='=其他,010,1)()(x y F y f Y Y ,所以~Y )1,0(U .前面的例子及定理,都要求)(x g 严格单调,这在有些场合不能满足.以下的两个例子是更一般的情形.例 设随机变量X 服从标准正态分布)1,0(N ,试求2X Y =的分布.解 由于02≥=X Y ,所以当0≤y 时,0)()(=≤=y Y P y F Y . 当0>y 时,)()()()(2y X y P y X P y Y P y F Y ≤≤-=≤=≤= , 从而21)()21)((21)()()(-=---='=yy yy yy y F y f Y Y ϕϕϕ,于是 ⎪⎩⎪⎨⎧≤>=--0,00,21)(221y y e y y f y Y π.(2.6.2)具有上述密度函数的分布称为自由度为1的卡方分布,记为)1(~2χY .例 设随机变量X 的密度函数为 ⎪⎩⎪⎨⎧<<=其他,00,2)(2ππx x x f X ,求X Y sin =的密度函数)(y f Y .解 由于X 在区间),0(π内取值,所以X Y sin =的可能取值为区间)1,0(.在Y 的可能取值区间外,0)(=y F Y .当10<<y 时,)(sin )()(y X P y Y P y F Y ≤=≤=)arcsin ()arcsin 0(ππ≤≤-+≤≤=X y P y X Pdt t f y X )(arcsin 0⎰=dt t f y X )(arcsin ⎰-+ππ 从而 22222121)arcsin (21arcsin 2)()(y y y y y y F y f Y Y -=--+-='=ππππ.综合得 ⎪⎩⎪⎨⎧<<-=其他,010,12)(2y yy f Y π.。