第二节 常见离散型随机变量的分布
- 格式:ppt
- 大小:174.50 KB
- 文档页数:18
第二节离散型随机变量及其分布如果随机变量所有可能的取值为有限个或可列无穷多个,则称这种随机变量为离散型随机变量.容易知道,要掌握一个离散型随机变量X 的统计规律,必须且只须知道X 的所有可能取的值以及取每一个可能值的概率.设离散型随机变量X 所有可能的取值为x k (k =1,2,…),X 取各个可能值的概率,即事件{X =x k }的概率P {X =x k }=p k , k =1,2,… (2.2)我们称(2.2)式为离散型随机变量X 的概率分布或分布律.分布律也常用表格来表示(表2-1):表2-1由概率的性质容易推得,任一离散型随机变量的分布律{pk},都具有下述两个基本性质: 1°p k ≥0,k =1,2,…; (2.3) 2°11=∑∞=k kp. (2.4)反过来,任意一个具有以上两个性质的数列{Pk},一定可以作为某一个离散型随机变量的分布律.为了直观地表达分布律,我们还可以作类似图2-1的分布律图.图2-1图2-1中x i 处垂直于x 轴的线段高度为p i ,它表示X 取x i 的概率值.例2.1 设一汽车在开往目的地的道路上需通过4盏信号灯,每盏灯以0.6的概率允许汽车通过,以0.4的概率禁止汽车通过(设各盏信号灯的工作相互独立).以X 表示汽车首次停下时已经通过的信号灯盏数,求X 的分布律.解 以p 表示每盏灯禁止汽车通过的概率,显然X 的可能取值为0,1,2,3,4,易知X 的分布律为或写成P {X =k }=(1-p )p ,k =0,1,2,3.P {X=4}=(1-p )4.将p =0.4,1-p =0.6代入上式,所得结果如表2-3所示.表2-3下面介绍几种常见的离散型随机变量的概率分布: (1)两点分布若随机变量X 只可能取x 1与x 2两值,它的分布律是P {X =x 1}=1-p (0<p <1),P {X =x 2}=p ,则称X 服从参数为p 的两点分布.特别,当x 1=0,x 2=1时两点分布也叫(0-1)分布,记作X ~(0-1)分布.写成分布律表形式见表2-4.对于一个随机试验,若它的样本空间只包含两个元素,即Ω={e 1,e 2},我们总能在Ω上定义一个服从(0-1)分布的随机变量,,,1,0)(21e e e e e X X ==⎩⎨⎧==当当用它来描述这个试验结果.因此,两点分布可以作为描述试验只包含两个基本事件的数学模型.如,在打靶中“命中”与“不中”的概率分布;产品抽验中“合格品”与“不合格品”的概率分布等等.总之,一个随机试验如果我们只关心某事件A 出现与否,则可用一个服从(0-1)分布的随机变量来描述.(2)二项分布若随机变量X 的分布律为P {X =k }=k n C p k (1-p )n -k, k =0,1,…,n , (2.5)则称X 服从参数为n ,p 的二项分布(Binomial distribution ),记作X ~b (n ,p ).易知(2.5)满足(2.3)、(2.4)两式.事实上,P (X =k )≥0是显然的;再由二项展开式知n k n k nk k nn k p p p p k X P )]1([)1(C}{0-+=-==-==∑∑=1.我们知道,P {X =k }=kn k k n p p --)1(C 恰好是[p +(1-p )]n 二项展开式中出现p k 的那一项,这就是二项分布名称的由来.回忆n 重贝努里试验中事件A 出现k 次的概率计算公式P n (k )=k n C p k (1-p )n-k, k =0,1,…,n ,可知,若X ~b (n ,p ),X 就可以用来表示n 重贝努里试验中事件A 出现的次数.因此,二项分布可以作为描述n 重贝努里试验中事件A 出现次数的数学模型.比如,射手射击n 次中,“中的”次数的概率分布;随机抛掷硬币n 次,落地时出现“正面”次数的概率分布;从一批足够多的产品中任意抽取n 件,其中“废品”件数的概率分布等等.不难看出,(0-1)分布就是二项分布在n =1时的特殊情形,故(0-1)分布的分布律也可写成P {X =k }=p k q 1-k (k =0,1)(q =1-p ).例2.2 某大学的校乒乓球队与数学系乒乓球队举行对抗赛.校队的实力较系队为强,当一个校队运动员与一个系队运动员比赛时,校队运动员获胜的概率为0.6.现在校、系双方商量对抗赛的方式,提了三种方案: (1)双方各出3人;(2)双方各出5人;(3)双方各出7人.三种方案中均以比赛中得胜人数多的一方为胜利.问:对系队来说,哪一种方案有利?解 设系队得胜人数为X ,则在上述三种方案中,系队胜利的概率为(1) P {X ≥2}=kkk k -=∑3323)6.0()4.0(C ≈0.352;(2) P {X ≥3}=kkk k -=∑5535)6.0()4.0(C ≈0.317;(3) P {X ≥4}=kkk k -=∑7747)6.0()4.0(C ≈0.290.因此第一种方案对系队最为有利.这在直觉上是容易理解的,因为参赛人数越少,系队侥幸获胜的可能性也就越大.例2.3 某一大批产品的合格品率为98%,现随机地从这批产品中抽样20次,每次抽一个产品,问抽得的20个产品中恰好有k 个(k =1,2,…,20)为合格品的概率是多少?解 这是不放回抽样.由于这批产品的总数很大,而抽出的产品的数量相对于产品总数来说又很小,那么取出少许几件可以认为并不影响剩下部分的合格品率,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大.我们将抽检一个产品看其是否为合格品看成一次试验,显然,抽检20个产品就相当于做20次贝努里试验,以X 记20个产品中合格品的个数,那么X ~b (20,0.98),即P {X =k }=k k k -2020)02.0()98.0(C ,k =1,2,…,20. 若在上例中将参数20改为200或更大,显然此时直接计算该概率就显得相当麻烦.为此我们给出一个当n 很大而p (或1-p )很小时的近似计算公式.定理2.1(泊松(Poisson)定理) 设np n =λ(λ>0是一常数,n 是任意正整数),则对任意一固定的非负整数k ,有e lim (1)!k k k n knn n n C p p k λλ-→∞-=-.证 由p n =λ/n ,有().111121111!)1()(!)1()1(1C knk kn k kn n kn k n n n n k n n k nn k k n n n p p ---⎪⎭⎫⎝⎛-⎪⎭⎫⎝⎛-⋅⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅=-+--=-λλλλλ对任意固定的k ,当n →∞时,11121111→⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅n k n n ,11,e 1→⎪⎭⎫ ⎝⎛-→⎪⎭⎫ ⎝⎛---kn n n λλλ故e lim (1).!k kk n knn n n C p p k λλ--→∞-=由于λ=np n 是常数,所以当n 很大时p n 必定很小,因此,上述定理表明当n 很大p 很小时,有以下近似公式,!e )1(C k p p k kn k k nλλ--≈- (2.6)其中λ=np .从表2-5可以直观地看出(2.6)式两端的近似程度.表2-5由上表可以看出,两者的结果是很接近的.在实际计算中,当n ≥20,p ≤0.05时近似效果颇佳,而当n ≥100,np ≤10时效果更好.!e k k λλ-的值有表可查(见本书附表3)二项分布的泊松近似,常常被应用于研究稀有事件(即每次试验中事件A 出现的概率p 很小),当贝努里试验的次数n 很大时,事件A 发生的次数的分布.例2.4 某十字路口有大量汽车通过,假设每辆汽车在这里发生交通事故的概率为0.001,如果每天有5000辆汽车通过这个十字路口,求发生交通事故的汽车数不少于2的概率.解 设X 表示发生交通事故的汽车数,则X ~b (n,p ),此处n =5000,p =0.001,令λ=np =5, P {X ≥2}=1-P {X <2}=1-{}∑==1k k X P=1-(0.999)5000-5(0.999)4999≈1!e 50!e 51550----. 查表可得P {X ≥2}=1-0.00674-0.03369=0.95957.例2.5某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率.解将一次射击看成是一次试验.设击中次数为X,则X~b(400,0.02),即X的分布律为P{X=k}=k400C(0.02)k(0.98)400-k, k=0,1, (400)故所求概率为P{X≥2}=1-p{X=0}-p{X=1}=1-(0.98)400-400(0.02)(0.98)399=0.9972.这个概率很接近1,我们从两方面来讨论这一结果的实际意义.其一,虽然每次射击的命中率很小(为0.02),但如果射击400次,则击中目标至少两次是几乎可以肯定的.这一事实说明,一个事件尽管在一次试验中发生的概率很小,但只要试验次数很多,而且试验是独立地进行的,那么这一事件的发生几乎是肯定的.这也告诉人们决不能轻视小概率事件.其二,如果在400次射击中,击中目标的次数竟不到两次,由于P{X<2}≈0.003很小,根据实际推断原理,我们将怀疑“每次射击的命中率为0.02”这一假设,即认为该射手射击的命中率达不到0.02.(3)泊松分布若随机变量X的分布律为P{X=k} =e!kkλλ-,k=0,1,2,…,(2.7)其中λ>0是常数,则称X服从参数为λ的泊松分布(Poisson distribution),记为X~P(λ). 易知(2.7)满足(2.3)、(2.4)两式,事实上,P{X=k}≥0显然;再由∑∞=-0!ekkkλλ=e-λ·eλ=1,可知∑∞==} {kkXP=1.由泊松定理可知,泊松分布可以作为描述大量试验中稀有事件出现的次数k=0,1,…的概率分布情况的一个数学模型.比如:大量产品中抽样检查时得到的不合格品数;一个集团中生日是元旦的人数;一页中印刷错误出现的数目;数字通讯中传输数字时发生误码的个数等等,都近似服从泊松分布.除此之外,理论与实践都说明,一般说来它也可作为下列随机变量的概率分布的数学模型:在任给一段固定的时间间隔内,①由某块放射性物质放射出的α质点,到达某个计数器的质点数;②某地区发生交通事故的次数;③来到某公共设施要求给予服务的顾客数(这里的公共设施的意义可以是极为广泛的,诸如售货员、机场跑道、电话交换台、医院等,在机场跑道的例子中,顾客可以相应地想象为飞机).泊松分布是概率论中一种很重要的分布.例2.6由某商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述.为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?解设该商店每月销售这种商品数为X,月底进货为a件,则当X≤a时不脱销,故有P{X≤a}≥0.95.由于X~P(5),上式即为∑=-ak kk 05!5e ≥0.95. 查表可知∑=-95!5e k kk ≈0.9319<0.95, ∑=-105!10e k kk ≈0.9682>0.95 于是,这家商店只要在月底进货这种商品10件(假定上个月没有存货),就可以95%以上的把握保证这种商品在下个月不会脱销.下面我们就一般的离散型随机变量讨论其分布函数.设离散型随机变量X 的分布律如表2-1所示.由分布函数的定义可知F (x )=P {X ≤x }=∑∑≤≤==xx kxx kk k px X P }{,此处的∑≤xx k 和式表示对所有满足x k ≤x 的k 求和,形象地讲就是对那些满足x k ≤x 所对应的p k 的累加.例2.7 求例2.1中X 的分布函数F (x ). 解 由例2.1的分布律知 当x <0时,F (x )=P {X ≤x }=0;当0≤x <1时,F (x )=P {X ≤x }=P {X =0}=0.4;当1≤x <2时,F (x )=P {X ≤x }=P ({X =0}∪{X =1})=P {X =0}+P {X =1}=0.4+0.24=0.64; 当2≤x <3时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2})=P {X =0}+P {X =1}+P {X =2} =0.4+0.24+0.144 =0.784;当3≤x <4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3})=0.4+0.24+0.144+0.0864=0.8704;当x ≥4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3}∪{X =4}) =0.4+0.24+0.144+0.0864+0.1296=1.综上所述F (x )=P {X ≤x }=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<.4,1,43,8704.0,32,784.0,21,64.0,10,4.0,0,0x x x x x x F (x )的图形是一条阶梯状右连续曲线,在x =0,1,2,3,4处有跳跃,其跳跃高度分别为0.4,0.24,0.144,0.0864,0.1296,这条曲线从左至右依次从F (x )=0逐步升级到F (x )=1.对表2-1所示的一般的分布律,其分布函数F (x )表示一条阶梯状右连续曲线,在X =x k (k =1,2,…)处有跳跃,跳跃的高度恰为p k =P {X =x k },从左至右,由水平直线F (x )=0,分别按阶高p 1,p 2,…升至水平直线F (x )=1.以上是已知分布律求分布函数.反过来,若已知离散型随机变量X 的分布函数F (x ),则X 的分布律也可由分布函数所确定:p k =P {X =x k }=F (x k )-F (x k -0).。
常见的离散型随机变量的分布列、均值与方差【知识要点】一、离散型随机变量及其分布列 1、随机变量如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。
长用希腊字母ηξ,来表示。
若ξ是随机变量,b a +=ξη,其中b a ,是常数,则η也是随机变量。
2、离散型随机变量如果对于随机变量可能取的值,可以一一列出,这样的随机变量叫做离散型随机变量。
3、离散型随机变量的分布列(1)若离散型随机变量X 可能取的不同值为n i x x x x ,,,,,⋅⋅⋅⋅⋅⋅21,X 取每一个值)21(n i x i ,,,⋅⋅⋅=的概率i i p x X P ==)(,以表格的形式表示如下:此表称为离散型随机变量X 的分布列,简称X 的分布列。
有时为了表达简单,也用等式i i p xX P ==)(,n i ,,,⋅⋅⋅=21,表示X 的分布列。
(2)性质:①n i p i ,,,,⋅⋅⋅=≥210;②11=∑=ni i p ;③在某个范围内取值的概率等于这个范围内每个随机变量值的概率的总和。
4、常见离散型随机变量 (1)两点分布若随机变量X 的分布列是则这样的分布列称为两点分布列。
如果随机变量X 的分布列为两点分布列,就称X 服从两点分布(也称伯努利分布),而称)1(==x P p 为成功概率。
其EX=p ,DX=p(1-p). (2)超几何分布一般地,在含有M 件次品的N 件产品中,任取n 件,其中恰有X 件次品数,则事件{X=k}发生的概率为m k C C C X P nNkn MN k M ,,,,,⋅⋅⋅=⋅==--210)k (,其中}min{n M m ,=,且*∈≤≤N N M n N M N n 、、,,,称分布列为超几何分布列。
如果随机变量X 的分布列为超几何分布列,则称随机变量X 服从超几何分布。
记作:1)1()(---•==N nN N M N nM DX N nM EX n M N H X ,,其,,—。