第二章随机变量讲义
- 格式:ppt
- 大小:1.63 MB
- 文档页数:13
第二章 随机变量及其概率分布1. 离散型随机变量()01k K K KP X x p p ==≥⎧⎪⎨=⎪⎩∑ 例1 设 ,则3.02.05.01=--=c2.常见离散型随机变量(1)0—1分布:设X ~),1(p B ,则应用背景:一次抽样中,某事件A 发生的次数X ~),1(p B ,其中EX X P A P p ====)1()(例2 设某射手的命中率为p ,X 为其一次射击中击中目标的次数,则X ~),1(p B(2)二项分布:设X ~),(p n B ,则()(1),0,1,2,,k k n k n P X k C p p k n -==-=应用背景:n 次独立重复抽样中某事件A 发生的次数X ~),(p n B ,其中()p P A =为事件A 在一次抽样中发生的概率。
例3 某射手的命中率为0.8,X 为其5次射击中命中目标的次数,则X 取的可能值为5,,1,0 ,52()0.80.2k k k P X k C -==,即X ~)8.0,5(B记住:若X ~),(p n B ,则np EX =,)1(p np DX -=(3)泊松(Poisson )分布 若(),0,1,2,!KP X k e k k λλ-===则称X 服从参数λ的泊松分布,且DX EX ==λ,记X ~)(λB ,0>λ应用背景:偶然性事件发生的次数X 一般服从某个参数的泊松分布,如某地的降雨的次数,车祸发生的次数等等。
另外,当Y ~),(p n B ,且n 很大,P 很小时,令np =λ,则()!kP Y k e k λλ-=≈例4 一个工厂生产的产品中的次品率0.005,任取1000件,计算解:设X 表任取的1000件产品中的次品数,则X ~)005.0,100(B ,由于n 很大,p 很小,令5==np λ则(1)55551506151!15!051)1()0(1)2(------=--=--≈=-=-=≥e e e e e X P X P X P (2)5505(5)!kk P X e k -=≤≈∑3.随机变量的分布函数:X 的分布函数为)()(x X P X F ≤=,+∞<<∞-x)(x F 的性质:①1)(0≤≤x F②若21x x <,则0)()(12≥-x F x F③1)(,0)(=+∞=-∞F F④)()(b F b X P =≤,)(1)(),()()(b F b X P a f b F b X a P -=>-=≤<例5 设X 的分布函数⎩⎨⎧≤>+=-0,00,)(x x be a x F x λ,其中0>λ,则______=a b=______. 解:由1)(=+∞F 知1=a (因为a be a F x x =+=+∞-+∞→)(lim )(λ)由0)(=-∞F ,及题设0≤x 时0)(=x F ,故0)1()()(lim 0=+=+=-→+b be a x F x x λ综上有⎩⎨⎧≤>-=-0,00,1)(x x e x F x λ,即1,1-==b a例6 设X 的分布函数⎪⎩⎪⎨⎧≥<≤<=e x e x x x x F ,11,ln 1,0)(求 )5.22(),30(),2(≤<≤<≤X P X P X P解:2ln )2()2(==≤F X P101)0()3()30(=-=-=≤<F F X P25.1ln 2ln 5.2ln )2()5.2()5.22(=-=-=≤<F F X P4. 连续型随机变量若((,))()b a P X a b f x dx ∈=⎰,其中b a <任意,则称X 为连续型随机变量。
第二章随机变量及其分布第一节随机变量1. 为什么引入随机变量?概率论是从数量上来研究随机现象统计规律性的,为了更方便有力的研究随机现象,就要用数学分析的方法来研究,因此为了便于数学上的推导和计算,就需将任意的随机事件数量化.当把一些非数量表示的随机事件用数字来表示时,就建立起了随机变量的概念.2. 随机变量的引入实例1 在一装有红球、白球的袋中任摸一个球,观察摸出球的颜色.实例2 抛掷骰子,观察出现的点数.二、随机变量的概念定义设随机试验E的样本空间是S = {e}, X = X (e)是定义在样本空间S 上的实值单值函数, 则我们称X = X (e)为随机变量.2.说明(1)随机变量与普通的函数不同随机变量是一个函数 , 但它与普通的函数有着本质的差别 ,普通函数是定义在实数轴上的,而随机变量是定义在样本空间上的 (样本空间的元素不一定是实数).(2)随机变量的取值具有一定的概率规律随机变量随着试验的结果不同而取不同的值, 由于试验的各个结果的出现具有一定的概率, 因此随机变量的取值也有一定的概率规律.(3)随机变量与随机事件的关系随机事件包容在随机变量这个范围更广的概念之内.或者说 : 随机事件是从静态的观点来研究随机现象,而随机变量则是从动态的观点来研究随机现象.下面我们举几个随机变量的例子:(1) n次射击命中目标的次数X (或随意抽验n件产品, 其中不合格品的件数), 它有n + 1个可能取值: 0, 1, 2, …, n.(2) 灯泡寿命X, 可以取[0, +∞)上的任意值.(3) 测量误差X, 可以取(-∞, +∞)上的任意值.有了随机变量, 随机试验中的各种事件, 就可以通过随机变量的关系式表达出来.例如, 从一批产品中任意取出10件, 若用X表示其中的废品数, 这时, {少于2件废品}、{恰有1件废品}两个事件, 就可以分别用{X < 2}、{X = 1}来表示.又如单位时间内电话交换台接到的呼唤次数用X 表示, 此时{接到不少于1次呼唤}、{没有接到呼唤}两个事件, 可以分别用{X ≥ 1}、{X = 0}来表示.再如, 上面(2)中事件{寿命不少于200小时而不超过1000小时}的事件, 就可用{200 ≤ X ≤ 1000}来表示.例1 “掷一颗骰子”是随机现象, 用随机变量X 表示出现的点数, 求(1) X 的取值范围; (2) 概率P{X ≤ 4}及P{X < 4}; (3) 概率P{X > 4}及P{2 ≤ X < 4}.引进了随机变量, 就可以通过随机变量来描述随机试验中各种事件, 全面反映试验的情况. 因此, 我们对随机现象统计规律性的研究, 就可以由对事件与事件的概率的研究扩大为对随机变量的研究.-∞第二节 离散型随机变量极其分布律如果随机变量它所有可能取的值是有限个或可列个值, 则我们就称之为离散型随机变量.设离散型随机变量X 的所有可能取值为x k (k = 0, 1, 2, ...), X 取各个可能值的概率, 即事件{X = x k }概率为 P{X = x k }= p k , k = 0, 1, 2, (1)则我们称(1)式为离散型随机变量X 的分布律或概率分布. 分布律也可以用表格的形式来表示:k 1︒ 0 ≤ p k ≤ 1, k = 0, 1, 2, …; 2︒ 11=∑∞=k k p .(2) 注: 凡满足(2)的函数p k 一定是某个离散型随机变量的分布律. 例1 (1) 设随机变量X 的分布律为k c k X P ⎪⎭⎫ ⎝⎛⋅==32}{, k = 1, 2, 3, 求常数c 的值. 3827 (2) 设随机变量X 的分布律为!}{k c k X P k λ⋅==, k = 0, 1, 2, …, λ > 0, 求常数c 的值. 1)1(--λe下面介绍三种重要的离散型随机变量.一、(0 - 1)分布(或两点分布)设随机变量X 只可能取0或1两个值, 它的分布律为k k p p k X P --==1)1(}{, k = 0, 1, (0 < p < 1), 或则称X 服从(0 - 1)分布 凡是只有两个结果的试验都可以用(0 - 1)分布来描述.二、伯努利试验、二项分布在实践中, 我们经常遇到下列类型的重复试验:(1) 每次试验的条件都相同, 且试验结果; 只有两个: A 及A , 且P(A) = p, P(A ) = q = 1 - p (0 < p < 1),(2) 每次试验的结果(即基本事件)是相互独立的.我们称之为n 重伯努利(Bernoulli)试验, 或伯努利概型.由于它是一个常见的、十分有用的概型, 所以在这里着重对它进行讨论.对于伯努利概型, 可以得到如下结果: 在n 次试验中事件A 出现k 次的概率为()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n. (3)事实上, 如将“第i 次试验中A 出现”的事件记为A i (i = 1, 2, …, n), 则由伯努利概型知, 在n 次试验中事件A 在指定的k 次试验中出现(如在前k 次出现), 其余n - k 次试验中不出现的概率为=+)(11n k k A A A A P =+)()()()(11n k k A P A P A P A P k k k k q p p p --=-11)1(.由于n 次试验中A 出现k 次的方式很多(在前k 次出现只是其中一种方式), 其总数相当于k 个相同的质点安排在n 个位置(每个位置只能安排一个质点)上的所有可能方式, 易知共应有k n C 种方式, 而它所对应的这k n C 个事件(即“n 次试验中A 出现k 次”这一事件)是不相容的, 故由概率的可加性得()(,,)k k n k n n P k b k n p C p q-==, k = 0, 1, 2, …, n.例3 设由四门高射炮同时独立地向一架敌机各发射一发炮弹, 若低机被不少于两发炮弹击中时, 就被击落. 设每门高射炮击中敌机地概率为0.6, 球敌机被击落地概率.解: 所求概率为 P = 1 - P 4(0) - P 4(1) = 0.8208.例4 甲、乙两乒乓球运动员实力相等, 连赛数局, 问哪一种结果的可能性大: 赛3局甲胜2局; 赛5局甲胜3局.解: 赛3局甲胜2局 83)2(3=P ; 赛5局甲胜3局 165)3(5=P .例5 某人有两盒火柴, 用时从任一盒中取一根火柴, 经过若干时间以后发现一盒火柴已经用完, 如果最初两盒中各有n 根火柴, 求这时另一盒中还有r 根火柴的概率.解: 发现一盒火柴已经用完, 而另一盒中还有r 根火柴, 这种情况一定是在第n + (n - r) + 1= 2n - r + 1次用时发现的. 设在前2n - r 次中此人恰有n 次取了第一盒, n - r 次取了第二盒, 而在第2n - r + 1次又取了第一盒, 发现它是空的, 这一事件的概率为 21)(21⋅=-n P p r n =2121212⋅⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛--r n n n r n C =12221+--⎪⎭⎫ ⎝⎛r n n r n C 同理, 设在前2n - r 次中此人恰有n 次取了第二盒, n - r 次取了第一盒, 而在第2n - r + 1次又取了第二盒, 发现它是空的, 这一事件的概率为 122221+--⎪⎭⎫ ⎝⎛=r n n r n C p . 因此, 所求事件的概率为 r n n r n C p p P --⎪⎭⎫ ⎝⎛=+=222121.设X 表示n 重伯努利试验中事件A 发生的次数, 则X 是一个随机变量, 它的可能取值为0、1、2、…、n, 由前面的讨论, 我们有 {}k k n k n P X k C p q -==, k = 0, 1,2, …, n. (4) 显然, P{X = k} ≥ 0, k = 0, 1, 2, …, n; 0()1n k k n k n n k C p q p q -==+=∑即P{X = k}满足条件(2), 注意到k k n k n C p q -刚好是二项式n q p )(+的展开式中出现p k 的项,故我们称随机变量X 服从参数为n 、p 的二项分布, 记为X ~b (n, p).特别地, 当n = 1时, 二项分布即为(0 - 1)分布.例6 设有12台独立运转的机器, 在一小时内每台机器停机的概率为0.1, 试求在一小时内停机台数不超过2的概率.解: 设X 表示一小时内停机台数, 则X ~b (12, 0.1). 从而所求概率为P{X ≤ 2} = P{X= 0} + P{X= 1} + P{X= 2} = 0.2824 + 0.3766 + 0.2301 = 0.8891.例7 某车间有10台电机各为7.5千瓦的机床, 如果每台机床的工作情况是相互独立的, 且每台机床平均每小时开动12分钟, 问全部机床用电超过48千瓦的可能性有多少?解: 设X 表示正在工作的机床台数, 则)51,10(~b X , 用电超过48千瓦即有7台或7台以上的机床在工作, 则所求概率为377105451}7{⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛=≥C X p +288105451⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛C +⎪⎭⎫ ⎝⎛⎪⎭⎫ ⎝⎛54519910C +10101051⎪⎭⎫ ⎝⎛C 11571≈. 从此例可看出, 当n 很大时, 计算k k k n q p C k X P -==1}{是十分麻烦的.为此, 我们有泊松(Poisson)定理 设λ > 0是一个常数, n 是任意正整数, 设np n = λ , 则对于任一固定的非负整数k, 有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 证: 由n p n λ=, 有 k n k k n n k n k n n n k n n n k p p C --⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛+--=-λλ1)1()1(!1)1( k n k n n n k n n k -⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛----⋅-⋅=λλλ11)]11()21()11(1[! . 对于任意固定的k, 当n →∞时, 有 1)]11()21()11(1[→---⋅-⋅n k n n , λλ-→⎪⎭⎫ ⎝⎛-e n n 1, 11→⎪⎭⎫ ⎝⎛--k n λ. 故有 !)1(lim k e p p C k k n n k n k n n λλ--∞→=-. 可见, 当n 很大, p 很小时, 二项分布就可以用下列公式来近似计算: !)1(1k e p p C k k k k n λλ--≈- (λ = np) (5) 这就是著名的二项分布的泊松逼近公式.例8 某人进行射击, 每次命中率为0.02, 独立射击400次, 求命中次数X ≥ 2的概率.解: 显然, X ~ b(400, 0.02), 则P{X ≥2} = 1 - P{X = 0} - P{X =1}9970.091)98.0()02.0()98.0()02.0(183991140040000400≈-≈--=-e C C .这个概率接近于1, 它说明, 一个事件尽管它在一次试验中发生的概率很小, 但只要试验次数很多, 而且试验是独立进行的, 那么这一事件的发生几乎是肯定的, 所以不能轻视小概率事件. 另外, 如果在400次射击中, 击中目标的次数竟不到2次, 根据实际推断原理, 我们将怀疑“每次命中率为0.02”这一假设.例9 为保证设备正常工作, 需要配备适量的维修工人(工人配备多了就浪费, 配备少了要影响生产). 现有同类型设备300台, 各台工作与否是相互独立的, 发生故障的概率都是0.01, 在通常情况下, 一台设备的故障可由一人来处理(我们也只考虑这种情况), 问至少需配备多少工人, 才能保证当设备发生故障但不能维修的概率小于0.01?解: 设需要配备N 人, 记同一时刻发生故障的设备台数为X, 则X ~ b(300, 0.01), 所要解决的问题是确定N, 使得 P{X > N} < 0.01. 由泊松定理, λ = np = 3, }{1}{N X P N X P ≤-=>=∑=-⋅-N k k k k C 0300300)99.0()01.0(1∑∑∞+=-=-=-≈1303!3!31N k k N k k k e k e < 0.01. 查表知, 满足上式的最小的N 是8, 因此需配备8个维修工人.例10 在上例中, 若由一人负责维修20台设备, 求设备发生故障而不能及时处理的概率. 若由3人共同负责维修80台呢?解: 在前一种情况, 设备发生故障而不能及时处理, 说明在同一时刻设备有2台以上发生故障. 设X 为发生故障设备的台数, 则X ~ b(20, 0.01)且n = 20, λ = 0.2, 于是, 设备发生故障而不能及时处理的概率为 }2{1)99.0()01.0(}2{2020220<-==≥-=∑X P C X P k k k k ∑=--=102020)99.0()01.0(1k k k k C 0175.0!)2.0(1102.0=-≈∑=-k k k e . 若由3人共同负责维修80台, 设同一时刻发生故障的设备台数为X, 则X ~ b(80, 0.01), λ = 0.8, 故同一时刻至少有4台设备发生故障的概率为 k k k k C X P -=∑=≥8080480)99.0()01.0(}4{0091.0!)8.0(8048.0≈≈∑=-k k k e . 计算结果表明, 后一种情况尽管任务重了(平均每人维修27台), 但工作质量不仅没有降低, 相反还提高了, 不能维修的概率变小了, 这说明, 由3人共同负责维修80台, 比由一人单独维修20台更好, 既节约了人力又提高了工作效率, 所以, 可用概率论的方法进行国民经济管理, 以便达到更有效地使用人力、物力资源的目的. 因此, 概率方法成为运筹学的一个有力工具.三、泊松分布设随机变量X 的所有可能取值为0, 1, 2, …, 而取各个值的概率为 !}{k e k X P k λλ-==, k = 0, 1, 2, … 其中λ > 0是常数, 则称X 服从参数为λ的泊松分布, 记为X ~ π (λ).易验证, P{X = k}满足条件(2).例11 有一汽车站, 每天都有大量汽车通过. 设每辆汽车在一天中的某段时间内发生事故的概率为0.0001, 而在某天的该段时间内有1000辆汽车通过, 试求发生事故的次数X < 2的概率.解: 显然X ~ b(1000, 0.0001). 因n = 1000较大, p = 0.0001较小, 故可用泊松分布来计算, λ = np = 0.1, 从而 }1{}0{}2{=+==<X P X P X P 1.01.00!11.0!0)1.0(--+=e e 9953.01.11.0≈=-e . 泊松定理指明了以n 、p(np = λ)为参数的二项分布, 当n →∞时趋于以λ为参数的泊松分布, 这一事实也显示了泊松分布在理论上的重要性.具有泊松分布的随机变量在实际中存在相当广泛. 例如, 纺纱车间大量纱锭上的纺线在一个时间间隔内被扯断的次数; 纺织厂生产的一批布匹上的疵点个数; 电话总机在一段时间内收到的呼唤次数; 种子中杂草种子的个数; 一本书某页(或某几页)上印刷错误的个数; 在一个固定时间内从某块放射物质中发射出的α粒子的数目等都服从泊松分布.泊松分布通常适用于描绘大量重复试验中稀有事件(即每次试验中出现的概率很小的事件, 例如不幸事件、意外事故、非常见病、自然灾害等)出现的次数的概率分布.第三节 随机变量的分布函数对于非离散型随机变量X, 由于其取值不能一个个列举出来, 因此在一般情况下, 需研究随机变量取值落在任意区间(x 1, x 2)中的概率, 即求 P{x 1< X ≤ x 2}. 由于事件{x 1< X ≤ x 2}与事件{X ≤ x 1}互不相容, 且{x 1< X ≤ x 2}∪{X ≤ x 1}= {X ≤ x 2}, 因此有P{x 1< X ≤ x 2} = P{X ≤ x 2} - P{X ≤ x 1}.由此可见, 若对任何给定的实数x, 事件{X ≤ x}的概率P{X ≤ x}确定的话, 概率P{x 1< X ≤ x 2}也就确定了, 但概率P{X ≤ x}随着不同的x 而变化, 这个概率是x 的函数, 于是引进下面的分布函数的概念.定义 设X 是一个随机变量, x 是任意实数, 函数 F(x) = P{X ≤ x}(1)称为分布函数.注: 1︒ F(x)是一个普通实函数, 它的定义域是整个数轴, 故求分布函数时要就x 落在整个数轴上讨论, F(x)的值域是区间[0, 1]. 如果将X 看成是数轴上的随机点的坐标, 则分布函数F(x)在x 处的函数值就表示X 落在(-∞, x ]上的概率.2︒ 由上面的讨论, 有P{x 1< X ≤ x 2}= F(x 2) - F(x 1).例1 接连进行两次射击, 以X 表示命中目标的次数, 假设已知每次射击命中目标的概率为0.4, 求X 的分布律与分布函数.解: XX 的分布函数为 ⎪⎪⎩⎨≥<≤=.2,1,21,84.0)(x x x F 一般地, 设离散型随机变量X 的分布律为 P{X = x k }= p k , k = 1, 2, …, 则X 的分布函数为∑∑≤≤===≤=x x k x x k k k p x X P x X P x F }{}{)( (2)这里和式是对所有满足x k ≤ x 的k 求和. 此外, 分布函数F(x)在x = x k (k = 1, 2, …)处有跳跃, 其跳跃值为p k = P{X = x k }.例2求X 的分布函数}2{≤X P }21{≤<X P }21{≤≤X P 例3 向区间[a, b]上均匀地投掷一随机点, 以X 表示随机点的落点坐标, 求X 的分布函数. 解: ⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 分布函数F(x)具有以下一些性质:1︒ 0 ≤ F(x) ≤ 1 (-∞ < x < +∞);2︒ F(x)是单调不减函数, 即若x 1 < x 2, 则F(x 1) ≤ F(x 2);3︒ 0)(lim )(==-∞-∞→x F F x , 1)(lim )(==+∞+∞→x F F x ; 4︒ )()(lim )0(0000x F x F x F x x ==++→ (-∞ < x 0 < +∞), 即F(x)是右连续的.第四节 连续型随机变量极其概率密度在实际问题中, 除了离散型随机变量以外, 还有非离散型随机变量, 其中常用的是连续型随机变量. 如炮弹落地点和目标之间的距离. 尽管分布函数是描述各种类型随机变量变化规律的最一般的共同形式, 但由于它不够直观, 往往不常用. 如对于离散型随机变量, 用分布律来描述既简单又直观. 对于连续型随机变量我们也希望有一种比分布函数更直观的描述方式.定义 如果对于随机变量X 的分布函数F(x), 存在非负函数f (x), 使对任意实数x, 有 ⎰∞-=x dt t f x F )()( (1) 则称X 为连续型随机变量, 其中函数f (x)称为X 的概率密度函数, 简称概率密度.概率密度f (x)在几何上表示一条曲线, 称之为分布曲线. 分布函数F(x)的几何意义是分布曲线f (x)下从-∞到x 的一块面积, 这块面积随x 而改变.可以证明: 连续型随机变量的分布函数F(x)是连续函数.易知, 概率密度f (x)具有下列性质:1︒ f (x) ≥ 0; 2︒ 1)(=⎰∞+∞-dx x f ; 3︒ P{x 1< X ≤ x 2}= F(x 2) - F(x 1) =⎰21)(x x dx x f (x 1 ≤ x 2); 4︒ 若f (x)在点x 处连续, 则有)()(x f x F ='.注: (1) 若函数f (x)满足性质1︒、2︒, 则f (x)一定是某个连续型随机变量的概率密度.(2) 对于连续型随机变量X 来说, 它取任一指定实数a 的概率为0, 即P{X = a}= 0.事实上, 设X 的分布函数为F(X), ∆x > 0, 则由{X = a}⊂ {a - ∆x < X ≤ a}得 ⎰∆+=∆--=≤<∆-≤=≤x a a dx x f x a F a F a X x a P a X P )()()(}{}{0. 又0)(lim 0=⎰∆+→∆x a a x dx x f , 所以, P{X = a}= 0. 因此 P{a < X ≤ b} = P{a < X < b} = P{a ≤ X < b} = P{a ≤ X ≤ b} = F(b) - F(a).(3) 概率为0的事件不一定是不可能事件, 同样, 概率为1的事件也不一定是必然事件.(4) 连续型随机变量X 落在小区间(x, x + ∆x) (∆x > 0)上的概率为 =∆+≤<}{x x X x P dx x f dx x f x x x )()(≈⎰∆+. 乘积f (x)dx 称为概率微分, 上式表明, 连续型随机变量X 落在小区间(x, x + ∆x)上的概率近似地等于概率微分. f (x)dx 在连续型随机变量理论中所起的作用与概率P{X = x k } = p k 在离散型随机变量理论中所起的作用是类似的. 如果把x 看成质点的坐标, f (x)看成在x 处的线密度, 则P{x 1< X ≤ x 2}=⎰21)(x x dx x f 就可看成是分布在线段x 1x 2上的质量, 这就是称f (x)为概率密度的理由.例1 确定常数A, 使x Ae x f -=)((-∞ < x < +∞)为某一随机变量的概率密度. 21 例2 设随机变量X 的概率密度为 ⎪⎩⎪⎨⎧<≤-<≤=,,0,21,2,10,)(其它x x x x x f ⎪⎪⎪⎩⎪⎪⎪⎨⎧><≤-+-<≤<=.2,1,21,122,10,2,0,0)(22x x x x x x x x F 求X 的分布函数F(x). 例3 设随机变量X 的概率密度x x e e A x f -+=)( (-∞ < x < +∞). 求 (1) 常数A; (2) 概率}3ln 210{<<X P ; (3) X 的分布函数F(x). 解: (1) 由12arctan )(===+∞∞-∞+∞-⎰A e A dx x f x π, 得 π2=A . (2) }3ln 210{<<X P =61arctan 23ln 0=x e π. (3) X 的分布函数F(x)为 x e x F arctan 2)(π= (-∞ < x < +∞). 例4 设连续型随机变量X 的分布函数为⎪⎩⎪⎨⎧><≤-+-<=,,1,,arcsin ,,0)(a x a x a a x B A a x x F 其中a > 0, 求 (1) 常数A 、B; (2) 概率}2{a X P <; (3) X 的概率密度f (x). 注: 若已知X 的概率密度f (x), 要求分布函数F(x), 用积分方法⎰∞-=x dt t f x F )()(, 当f (x)是分段函数时, 积分要分段讨论; 若已知X 的分布函数F(x), 要求概率密度f (x), 则用微分方法)()(x f x F =', 当F(x)是分段函数时, 在分段点处用导数定义求导, 当)(x F '不存在(个别点), 则可任意规定)(x F '的值(个别点的值不影响积分结果).下面介绍几个重要的连续型随机变量.一、均匀分布如果随机变量X 的取值范围是有限区间(a, b), 并且落在[a, b]中的任一小区间的概率只与这个区间的长度成正比, 而与该小区间的位置无关, 则称X 在(a, b)上服从均匀分布, 它的概率密度为 ⎪⎩⎪⎨⎧<<-=.,0,,1)(其它b x a a b x f 分布函数为⎪⎩⎪⎨⎧≥<≤--<=.,1,,,,0)(b x b x a a b a x a x x F 记为X ~ U (a, b). 例5 设随机变量X ~ U (0, 10), 求方程012=++Xx x 有实根的概率.解: ∆=042≥-X , X ≤ -2或X ≥ 2, 所以 P{X ≤ -2} + P{X ≥ 2} = 0.8.二、指数分布 如果连续型随机变量X 的概率密度为⎪⎩⎪⎨⎧>=-.,0,0,1)(其它x e x f xθθ 其中θ > 0是常数, 则称X 服从参数为θ 指数分布, 其分布函数为⎪⎩⎪⎨⎧>-=-.,0,0,1)(其它x e x F x θ 指数分布有重要应用, 常用它来作为各种“寿命”分布的近似. 例如无线电元件的寿命、动物的寿命、电话问题中的通话时间、随机服务系统中的服务时间等都常假定服从指数分布.服从指数分布的随机变量X 具有以下有趣的性质:对于任意的s 、t > 0, 有P{X > s + t ∣X > s} = P{X > t}. 事实上 P{X > s + t ∣X > s} =}{}{}{)}(){(s X P t s X P s X P s X t s X P >+>=>>+> =}{)(1)(1t X P e e e s F t s F t s t s >===-+---+-θθθ. 此性质称为无记忆性. 如果X 是某一元件的寿命, 那么上式表明: 已知元件已使用了s 小时, 它总共能使用至少s + t 小时的条件概率, 与从开始使用时算起它至少能使用t 小时的概率相等. 这就是说, 元件对它已使用过s 小时没有记忆. 具有这一性质是指数分布有广泛应用的原因.三、正态分布 设连续型随机变量X 的概率密度为 222)(21)(σμσπ--=x e x f , (-∞ < x < +∞). 其中μ、σ (σ > 0)为常数, 则称X 服从参数为μ、σ 的正态分布或高斯(Gauss)分布, 记为X ~ N (μ、2σ). 其分布函数为 ⎰∞---=x t dt e x F 222)(21)(σμσπ (-∞ < x < +∞).可以证明, f (x)满足概率密度的两个性质. 事实上 ⎰∞+∞---dx e x 222)(21σμσπ(令σμ-=x t )= I dt e t =⎰∞+∞--2221π. 而=2I 22221⎪⎪⎪⎭⎫ ⎝⎛⎰∞+∞--dt e t π=⎰⎰∞+∞-∞+∞---⋅dy e dx e y x 22222121ππ=⎰⎰∞+∞-∞+∞-+-dxdy e y x )(212221π. 利用极坐标, 令x = rcos θ, y = rsin θ, 则 =2I ⎰⎰∞+-02021221πθπrdrd e r =1022=⎰∞+-dr re r , 由于I ≥ 0, 故有 1)(=⎰∞+∞-dx x f .正态分布的概率密度f (x)的图形称为正态曲线, 它具有以下性质:1︒ 曲线位于x 轴的上方, 以直线x = μ为对称轴, 即f (μ + x) = f (μ - x). 这表明对于任意的h > 0, 有P{μ - h < X ≤ μ}= P{μ < X ≤ μ + h}. 2︒ 当x = μ 时, 曲线处于最高点(σπμ21)(=f ), 当x < μ 时, f (x)单调增加; 当x > μ 时, f (x)单调减少, 即当x 向左右远离μ 时, 曲线逐渐降低, 整条曲线呈现“中间高, 两边低”的形状. 这表明对于同样长度的区间, 当区间离μ 越远, X 落在这个区间上的概率越小. 3︒ 在x = μ ±σ 处曲线有拐点, 并以x 轴为渐近线.4︒ 参数μ 确定了曲线的位置, σ 确定了曲线的形状. σ 越大, 曲线越平坦; σ 越小, 曲线越集中.特别地, 当μ = 0, σ = 1时, 称X 服从标准正态分布, 其概率密度和分布函数分别用ϕ(x)和Φ(x)表示, 即 2221)(x e x -=πϕ, ⎰∞--=Φx t dt e x 2221)(π.我们知道, 利用分布函数F(x)可以计算事件“X ≤ x ”的概率. 但当X ~ N (0, 1)时, 就无法用初等方法计算, 因此, 为计算方便, 人们编制了Φ(x)的函数表, 从表中可查出服从N (0, 1)的随机变量小于指定值x(x > 0)的概率P{X ≤ x} = Φ(x).因⎰⎰-∞--∞----==-Φx x t d t dt t x )()()()(ϕϕ=)(1)(1)(x dt t dt t x x Φ-=-=⎰⎰∞-∞+ϕϕ(ϕ(x)是偶函数), 所以, 当x < 0时, 只要查得Φ(-x), 即可求得Φ(x)的值.对一般的正态分布, 可利用变换σμ-=x t , 将其化成标准正态分布, 即有(){}x F x P X x μσ-⎛⎫=≤=Φ ⎪⎝⎭. 事实上, }{)(x X P x F ≤==⎰∞---x t dt e 222)(21σμσπ(令σμ-=t y )=⎰-∞--⎪⎭⎫ ⎝⎛-Φ=σμσμπx y x dy e 2221.对任意区间[x 1, x 2], 有 ⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=≤-≤=≤<σμσμ121221}{}{}{x x x X P x X P x X x P .例6 设X ~ N (0, 1), 求:(1) P{X ≤ 1.15}; 0.8749 (2) P{X ≤ -2.35}; 0.0094(3) P{0.02 < X ≤ 1.15}; 0.4821 (4) P{-1.85 < X ≤ 0.04}; 0.4838例7 设X ~ N (108, 9), 求: (1) P{101.1 < X < 117.6}; 0.9886(2) 求常数a, 使P{X < a} = 0.90; 111.84 (3) 求常数a, 使P{∣X - a ∣> a} = 0.01. 57.50例8 设),(~2σμN X , 求:(1) P{μ - σ < X < μ + σ}; 0.6826 (2) P{μ - 2σ < X < μ + 2σ}; 0.9544 (3) P{μ - 3σ < X < μ + 3σ}. 0.9974此例表明, 当时, X 以99.74%的概率落入区间(μ - 3σ , μ + 3σ)内, 即X 的可取值几乎全部在(μ - 3σ , μ + 3σ)内, 这就是统计中的3σ 原则.例9 公共汽车车门的高度是按男子与车门顶碰头的机会在0.01以下来设计的. 设男子身长X 服从μ = 170cm, σ = 6cm 的正态分布, 即)6,170(~2N X , 问车门高度应如何确定?解: 设车门高度为hcm. 按设计要求, P{X ≥ h} ≤ 0.10或P{X < h} ≥ 0.99. 因)6,170(~2N X , 故99.06170)(}{≈⎪⎭⎫ ⎝⎛-Φ==<h h F h X P , 查表得 Φ(2.33) = 0.9901 > 0.99, 所以, 33.26170=-h , h = 184cm.为了便于今后应用, 对于标准正态随机变量, 我们引入α分位点的概念.设X ~ N (0, 1), 对给定的数α, 0 < α < 1, 称满足条件 αϕαα==>⎰∞+z dx x z X P )(}{ 的数z α为标准正态分布的上(侧) α分位点(如图).对于给定的α, z α的值可这样求得; P{X > z α} = 1 - Φ( z α) = α , 从而, Φ( z α) = 1 - α , 查表可得. 如, z 0.05 = 1.645, z 0.3 = 0.52.一般地, 对随机变量X, 若对给定的数α, 0 < α < 1, 称满足条件P{X ≥ z α}= 1 - F(z α)的数z α为此概率分布的上(侧) α分位点(数).在自然现象和社会现象中, 大量随机变量服从或近似服从正态分布. 一般地, 只要某个随机变量是由大量相互独立、微小的偶然因素的总和所构成, 而且每一个别偶然因素对总和的影响都均匀地微小, 则可断定这个随机变量必近似服从正态分布.第五节 随机变量的函数的分布在微积分中, 函数y = g(x)是一个最基本的概念, 同样, 在概率论与数理统计中, 也常遇到随机变量的函数. 例如, 在测量圆轴截面面积的试验中, 所关心的随机变量−圆轴截面面积A 不能直接测量得到, 只能直接测量圆轴截面的直径d 这个随机变量, 再根据关系式 得到A, 这里随机变量A 是随机变量d 的函数.一般地, 设g(x)是定义在随机变量X 的一切可能取值x 的集合上的函数, 如果当X 取值为x 时, 随机变量Y 的取值为y = g(x), 则称Y 是随机变量X 的函数, 记为Y = g(X). 下面我们讨论如何由已知的随机变量X 的分布去求得它的函数的分布.一、X 是离散型随机变量设求 当X 取得它的某一可能值x i 时, 随机变量Y = g(X)取值y i = g(x i ) (i = 1, 2, …).如果诸i i i , 则把那些相等的值分别合并起来, 并根据概率可加性把对应的概率相加,就得到函数Y = g(X)的分布律.例求)2(-X 例求⎪⎭ ⎝=X Y 2sin 解: 因⎪⎩⎪⎨⎧-==-=-=⎪⎭⎫ ⎝⎛.34,1,2,0,14,12sin k n k n k n n π 所以, ⎪⎭⎫ ⎝⎛=X Y 2sin π只有三个可能取值: -1, 0, 1. 而取得这些值的概率分别是 152********}1{141173=+++++=-=- k Y P , 3121212121}0{2642=+++++== k Y P , 158********}1{3495=+++++==- k Y P . 所以, Y二、X 是连续型随机变量若X 是连续型随机变量. Y = g(X)是X 的函数, 则Y 也是随机变量, 这时如何求出Y = g(X)的分布呢? 先看一个例子.例3 已知),(~2σμN X , 求σμ-=X Y 的概率密度. 解: 设Y 的分布函数为F Y (y), 于是 F Y (y) = P{Y = y}=}{y X P ≤-σμ= P{X ≤ σ y + μ} = F X (σ y + μ). 其中F X (x)为X 的分布函数. 将上式两边对y 求导, 并利用概率密度是分布函数的导数的关系得 []σμσμσ⋅+='+==')()()()(y f y F y f y F y X Y Y . 再将222)(21)(σμσπ--=x e x f 代入, 有 22])[(2222121)(y y Y e e y f --+-=⋅=πσσπσμμσ, 这表明Y ~ N(0, 1).在以上推导过程中, 除去用到分布函数的定义以及分布函数和概率密度的关系之外, 还用到这样一个等式}{y X P ≤-σμ= P{X ≤ σ y + μ}. 表面上看, 只是把不等式“y X ≤-σμ”变形为“X ≤ σ y + μ”, 它们是同一个随机事件, 因而概率相等. 实质上关键在于把σμ-=X Y 的分布函数在y 的值F Y (y)转化为X 的分布函数在σ y + μ 的值F X (σ y + μ). 这样就建立了分布函数之间的关系, 然后通过求导得到Y 的概率密度. 这种方法叫做“分布函数法”, 按照上例的解题思路, 可得到下面的定理:定理 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 又设函数g (x)处处可导且有)(x g '> 0 (或恒有)(x g '< 0), 则Y = g(X)是连续型随机变量, 其概率密度为 ⎩⎨⎧<<'⋅=.,0,,)()]([)(其它βαy y h y h f y f XY 其中α = min{g(-∞), g(+∞)}, β =max{g(-∞), g(+∞)}, h(y)是g(x)的反函数.证: 对于任意x 有)(x g '> 0 (或)(x g '< 0). 因而g(x)单调增加(或单调减少), 它的反函数h(y)存在, 并且h(y)在(α,.β)内单调增加(或单调减少)且可导.设g(x)单调增加, Y 的分布函数为 ⎰∞-=≤=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F , 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '='=, g(-∞) < g(+∞), )0)((>'y h 设g(x)单调减少, Y 的分布函数为 ⎰∞+=≥=≤=≤=)()()}({})({}{)(y h X Y dx x f y h X P y X g P y Y P y F . 于是Y 的概率密度为 )()]([)()(y h y h f y F y f X Y Y '-='=, g(+∞) < g(-∞), )0)((<'y h 综合以上两种情形, 即得所要结论.注: 若f X (x)在有限区间[a, b]以外等于零, 则只需设在[a, b]上有> 0 (或< 0)., 此时α = min{g(a), g(b)}, β =max{g(a), g(b)}.例4 设随机变量X 具有概率密度f X (x), -∞ < x < +∞, 求线性函数Y = a + bX (a 、b 为常数, 且b ≠ 0)的概率密度.解: 因y = g(x) = bx + a, 故b a y y h x -==)(. 而b y h 1)(=', 由定理得⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(,-∞ < y < +∞. 若),(~2σμN X , 则=)(x f X 222)(21σμσπ--x e (-∞ < x < +∞), 故Y 的概率密度为 ⎪⎭⎫ ⎝⎛-=b a y f b y f Y 1)(2222)(21σμσπb b a y e b ---. 因而),(~22σμb b a N Y +, 这就是说正态随机变量X 的线性函数仍服从正态分布, 只是参数不同而已.例5 设X 具有概率密度f X (x), -∞ < x < +∞, 求2X Y =的概率密度.解: 2x y =不是单调函数, 故不能用定理来求. 但可划分为两个单调区间(-∞, 0)和(0, +∞), 在这两个单调区间上它的反函数分别为y x -=与y x =. 对于y > 0, Y 的分布函数为 ⎰-=≤≤-=≤=y y X Y dx x f y X y P y Y P y F )(}{}{)( 由于02≥=X Y , 且P{Y = 0} = 0, 所以当y ≤ 0时, 其分布函数F Y (y) = 0, 于是Y 的概率密度为 ⎪⎩⎪⎨⎧≤>-+='=.0,0,0)],()([21)()(y y y f y f y y F y f X X Y Y 例如, 设X ~ N (0, 1), 其概率密度为2221)(x e x -=πϕ(-∞ < x < +∞), 则的概率密度为 ⎪⎩⎪⎨⎧≤>=⎪⎩⎪⎨⎧≤>+=----.0,0,0,21.0,0,0),2121(21)(22122y y e y y y e e y y f y y y Y πππ 称Y 服从自由度为1的分布.习 题 课一、要点与要求本章主要内容是把随机事件数量化, 使得随机事件极其概率能够用随机变量极其分布函数来表示, 以便使用微积分等数学工具研究随机现象. 这一章是本课程的重点.1︒ 求离散型随机变量X 的分布律时, 首先要确定X 的取值, 然后求出对应于各取值的事件的概率, 要注意验证∑∞===11}{n k x X P , 否则不正确.两点分布、二项分布、泊松分布是三种常用离散型随机变量的概率分布.2︒ 使用概率密度f (x)描述连续型随机变量X, f (x)满足f (x) ≥ 0, ⎰∞+∞-=1)(dx x f . 对于任意(a, b), 有 ⎰=<<b a dx x f b X a P )(}{. 均匀分布、正态分布、指数分布是三种常用连续型随机变量的分布.3︒ 可以使用分布函数统一描述离散型随机变量和连续型随机变量. 当分布函数F(x)中含有待定常数时, 常利用0)(lim =-∞→x F x , 1)(lim =+∞→x F x 或F(x + 0) = F(x)来确定该常数. 而当概率密度f (x)及分布律中含有待定常数时, 常利用⎰∞+∞-=1)(dx x f 或∑∞===11}{n k x X P 来确定该常数. 有概率密度f (x)求分布函数F(x), 要在相应的区间段把F(x)写成f (x)的变上限积分, 利用公式)()(x f x F =', 可由分布函数F(x)求概率密度f (x).离散型随机变量的分布函数为分段函数, 若随机变量X 的取值为n 个, 则要分为n + 1段, 其图形是右连续的阶梯曲线.4︒ 对正态随机变量, 我们有Φ(-x) = 1 - Φ(x). 若),(~2σμN X , 则⎪⎭⎫ ⎝⎛-Φ-⎪⎭⎫ ⎝⎛-Φ=<<σμσμa b b X a P }{. 5︒ 随机变量的函数是一个重要概念. 对连续型随机变量X 的函数Y = g(X), 要了解求Y 的分布的原理和方法, 当g(x)是严格单调函数时, Y 的概率密度可使用公式计算出来.本章中的概念比第一章少, 并且多数概念容易理解, 重点是计算问题. 对离散型随机变量, 求它的分布律实质上是第一章内容的继续, 要用到第一章中的许多内容; 对连续型随机变量, 在进行各种计算时, 涉及到高等数学中的知识, 主要是定积分的计算(其中包括无穷限的广义积分), 要牢记积分的基本公式, 掌握简单的换元积分法和分部积分法, 同时要掌握简单的极限计算.二、典型例题例1 选择题1. 设F 1(x)与F 2(x)分别为随机变量X 1与X 2的分布函数, 为使F(x) = a F 1(x) - b F 2(x)是某一随机变量的分布函数, 在下列给定的各组数值中应取(98数三)( ) A (A) 52,53-==b a ; (B) 32,32==b a ; (C) 23,21=-=b a ; (D) 23,21-==b a . 2.设X 1与X 2是任意两个相互独立的连续型随机变量, 它们的概率密度分别为f 1 (x)与f 2 (x), 分布函数分别为F 1(x)与F 2(x), 则(2002数一)( ) D(A) f 1 (x) + f 2 (x)必为某一随机变量的概率密度; (B) f 1 (x) f 2 (x)必为某一随机变量的概率密度;(C) F 1(x) + F 2(x)必为某一随机变量的分布函数; (D) F 1(x) F 2(x)必为某一随机变量的分布函数.3. 设随机变量X 服从正态分布),(2σμN , 则随σ 的增大, 概率P{|X - μ| < σ}(95)( ) C(A) 单调增大; (B) 单调减小; (C) 保持不变; (D) 增减不定.4. 设随机变量X 与Y 均服从正态分布, )4,(~2μN X , )5,(~2μN Y . 记p 1 = P{X ≤ μ - 4}, p 2 = P{Y ≥ μ + 5}, 则(93)。
第二章 随机变量及其分布上一章研究内容: 事件(集合A )→ 概率(数).本章将用函数研究概率,函数是数与数的关系,即需要用数反映事件——随机变量.事件(数)→ 概率(数).§2.1 随机变量及其分布2.1.1.随机变量的概念随机试验的样本点有些是定量的:如掷骰子掷出的点数,电子元件使用寿命的小时数.有些是定性的:如掷硬币正面或反面,检查产品合格或不合格.对于定性的结果也可以规定其数量性质:如掷硬币,正面记为1,反面记为0;检查产品,合格记为1,不合格记为0.随机试验中,可将每一个样本点ω 都对应于一个实数X (ω),称为随机变量(Random Variable ),常用大写英文字母X , Y , Z 等表示随机变量,而随机变量的具体取值通常记为小写英文字母x , y , z .对于随机变量首先应掌握它的全部可能取值:如掷硬币,⎩⎨⎧=反面正面,0,1X ,X 的全部可能取值为0, 1;掷两枚骰子,X 表示掷出的点数之和,X 的全部可能取值为2, 3, 4, … , 12 ;观察某商店一小时内的进店人数X ,X 的全部可能取值为0, 1, 2, … ;电子元件使用寿命,用X 表示使用的小时数,X 的全部可能取值为 ),0[∞+; 一场足球比赛(90分钟),用X 表示首次进球时间(分钟),若为0:0,记X = 100,X 的全部可能取值为 (0, 90 )∪{100};注意:1. 每个样本点都必须对应于一个实数,2.不同样本点可以对应于同一个实数,3.随机变量的每一取值或取值范围都表示一个事件.应掌握将随机变量的取值或取值范围描述为事件,又能将事件用随机变量表达的方法. 例 掷一枚骰子,用X 表示出现的点数,则 X = 1表示出现1点;X > 4表示点数大于4,即出现5点或6点;X ≤ 0为不可能事件.又出现奇数点,即X = 1, 3, 5;点数不超过3,即X ≤ 3. 例 X 表示商店一天中某商品的销售件数(顾客的需求件数), 则 X = 0表示没有销售;X ≤ 10表示销售不超过10件.又销售5件以上(不含5件)即X > 5;若该商店准备了a 件该商品,事件“能满足顾客需要”,即X ≤ a . 例 X 表示一只电子元件的使用寿命(小时), 则 X = 1000表示该元件恰好使用了1000小时,X ≥ 800表示该元件使用寿命在800小时以上. 例 90分钟足球比赛,X 表示首次进球时间(分钟),且0:0时,记X = 100, 则 X = 10表示上半场第10分钟首次进球.又上半场不进球即X > 45;开场1分钟内进球即X ≤ 1.如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.(注:可列个即可以排成一列,一个一个往下数,如非负整数0, 1, 2, 3, … )离散型随机变量的全部可能取值是实数轴上一些离散的点,而连续型随机变量的全部可能取值是实数轴上一个区间或多个区间的并,如电子元件使用寿命X (小时),全部可能取值是),0[∞+.下面按离散型和连续型分别进行讨论.2.1.2. 离散随机变量的概率分布列对于随机变量还应该掌握它的每一取值或取值范围表示事件的概率.定义 如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.设离散型随机变量X 的全部可能取值为x 1, x 2, …, x k , …,则X 取值x k 的概率p k = p (x k ) = P {X = x k }, k = 1, 2, …… 称为离散型随机变量的概率分布函数(Probability Distribution Function ,PDF ),简称概率分布或概率函数.直观上,又写为L LLL)()()(2121k kx p x p x p Px x x X 或 ⎟⎟⎠⎞⎜⎜⎝⎛L L L L)()()(~2121k k x p x p x p x x x X , 称为X 的概率分布列.如掷一枚骰子,X 表示出现的点数,X 的分布列为616161616161654321PX . 概率函数基本性质:(1)非负性 p (x k ) ≥ 0 , k = 1, 2, ……; (2)正则性1)(1=∑∞=k kxp .这是因为事件X = x 1 , X = x 2 , … , X = x k , … 是一个完备事件组, 故P {X = x 1} + P {X = x 2} + … + P {X = x k } + … = P (Ω) = 1,即p (x 1) + p (x 2) + … + p (x k ) + … = 1. 例 设盒中有2个红球3个白球,从中任取3球,以X 表示取得的红球数.求X 的分布列. 解:X 的全部可能取值0, 1, 2 ,样本点总数为1035=⎟⎟⎠⎞⎜⎜⎝⎛=n ,X = 0表示“取到3个白球”,所含样本点个数为1330=⎟⎟⎠⎞⎜⎜⎝⎛=k ,有1.0101)0(==p , X = 1表示“取到1个红球2个白球”,所含样本点个数为612231=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有6.0106)1(==p , X = 2表示“取到2个红球1个白球”,所含样本点个数为322132=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有3.0103)2(==p . 故X 的分布列为3.06.01.0210P X.求离散型随机变量X 的概率分布步骤: (1)找出X 的全部可能取值,(2)将X 的每一取值表示为事件, (3)求出X 的每一取值的概率.例 现有10件产品,其中有3件不合格.若不放回抽取,每次取一件,直到取得合格品为止.用X 表示抽取次数,求X 的概率分布. 解:X 的全部可能取值1, 2, 3, 4 ,X = 1表示“第1次就取得合格品”,有107)1(=p , X = 2表示“第2次取得合格品且第1次是不合格品”,有30797103)2(=⋅=p , X = 3表示“第3次取得合格品且前两次是不合格品”,有12078792103)3(=⋅⋅=p , X = 4表示“第4次取得合格品且前三次是不合格品”,有1201778192103)4(=⋅⋅⋅=p , 故X 的分布列为120112073071074321PX . 例 上例若改为有放回地抽取,又如何? 解:X 的全部可能取值1 , 2 , … , n , … ,7.0107)1(==p ,21.0107103)2(=⋅=p ,7.03.0)3(2×=p ,…,7.03.0)(1×=−k k p ,…, 故X 的概率函数为L ,2,1,7.03.0)(1=×=−k k p k ;X 的分布列为LL L L 7.03.07.03.021.07.032112××−k PkX .例 若离散型随机变量的概率函数为kCk p =)(,k = 1, 2, 3, 4,且C 为常数. 求:(1)C 的值,(2)P {X = 3},(3)P {X < 3}.解:(1)由正则性知:1432)4()3()2()1(=+++=+++CC C C p p p p ,即11225=C ,故2512=C .(2)254)3(}3{===p X P , (3)25182562512)2()1(}3{=+=+=<p p X P . 2.1.3.随机变量的分布函数连续型随机变量在单个点取值概率为零,如电子元件使用寿命恰好为1000小时这个事件的概率就等于零,因此连续型随机变量不能考虑概率函数.为了用单独一个变量表示一个区间,特别地取区间 (−∞, x ].定义 随机变量X 与任意实数x ,称F (x ) = P {X ≤ x },−∞ < x < +∞为X 的累积分布函数(Cumulative Distribution Function ,CDF ),简称分布函数.P {a < X ≤ b } = P {X ≤ b } − P {X ≤ a } = F (b ) − F (a ),P {X > a } = 1 − P {X ≤ a } = 1 − F (a ),由概率的连续性知)0()(lim }{lim }{−==≤=<−−→→a F x F x X P a X P ax ax ,且P {X = a } = P {X ≤ a } − P {X < a } = F (a ) − F (a – 0),可见X 在任一区间上或任一点取值的概率都可用分布函数表示. 例 已知随机变量X 的分布列为3.05.02.0210PX ,求X 的分布函数.解:X 的全部可能取值为0, 1, 2,当x < 0时,F (x ) = P {X ≤ x } = P (∅) = 0, 当0 ≤ x < 1时,F (x ) = P {X ≤ x } = p (0) = 0.2,当1 ≤ x < 2时,F (x ) = P {X ≤ x } = p (0) + p (1) = 0.7, 当x ≥ 2时,F (x ) = P {X ≤ x } = P (Ω ) = 1,故⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.2,1,21,7.0,10,2.0,0,0)(x x x x x F若离散型随机变量的全部可能取值为x 1, x 2, ……,概率函数p (x k ) = p k ,k = 1, 2, ……,则分布函数∑≤=≤=xx kk xp x X P x F )(}{)(.且离散型随机变量的分布函数F (x )是单调不减的阶梯形函数,X 的每一可能取值x k 是F (x )的跳跃点,跳跃高度是相应概率p (x k ).例 已知某离散型随机变量X 的分布函数为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤−−<=,5,1,52,6.0,20,4.0,01,3.01,0)(x x x x x x F 求X 的分布列. 解:X 的全部可能取值是F (x )的跳跃点,即 −1, 0, 2, 5,跳跃高度依次为:p (−1) = 0.3 − 0 = 0.3; p (0) = 0.4 − 0.3 = 0.1; p (2) = 0.6 − 0.4 = 0.2; p (5) = 1 − 0.6 = 0.4.故X 的分布列为4.02.01.03.05201PX −.分布函数的基本性质:(1)单调性,F (x ) 单调不减,即x 1 < x 2时,F (x 1) ≤ F (x 2); (2)正则性,F (−∞) = 0,F (+∞) = 1;(3)连续性,F (x ) 右连续,即)()(lim 00x F x F x x =+→. 证:(1)当x 1 < x 2时,{X ≤ x 1} ⊂ {X ≤ x 2},有F (x 1) ≤ F (x 2);(2)F (−∞) = P {X < −∞} = P (∅) = 0,F (+∞) = P {X < +∞} = P (Ω ) = 1;(3)任取单调下降且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n ≤=≤=≤∞=∞→I ,根据概率的连续性知}{}{}{lim 01x X P x X P x X P n n n n ≤=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→I ,即)()(lim 00x F x F x x =+→. 但F (x )不一定左连续,任取单调增加且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n <=≤=≤∞=∞→U ,得}{}{}{lim 01x X P x X P x X P n n n n <=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→U , 故}{)(}{)(lim 0000x X P x F x X P x F x x =−=<=−→.2.1.4. 连续随机变量的概率密度函数离散型随机变量的全部可能取值是有限或可列个点,连续型随机变量的全部可能取值是实数区间.但连续型随机变量在单独一个点取值的概率为0,其概率函数无实际意义,对于连续随机变量通常考虑其在某个区间上取值的概率,这就需要讨论分布函数.连续型随机变量的分布函数是连续函数. 注意:概率为0的事件不一定是不可能事件.定义 随机变量X 的分布函数F (x ),若存在函数p (x ),使 ∫∞−=xdu u p x F )()(,则称X 为连续型随机变量,p(x )为X 的概率密度函数(可以理解为:p (u )为概率密度,p (u )du 为X 在该小区间内取值的概率,∫∞−x 为从−∞ 到x 无限求和.几何意义:在平面上作出密度函数p (x )的图形,则阴影部分的面积即为F (x )的值.密度函数基本性质:(1)非负性 p (x ) ≥ 0;(2)正则性 1)(=∫∞+∞−dx x p .因)()(x F du u p x =∫∞−,有1)()(=+∞=∫∞+∞−F dx x p .连续型随机变量的性质:设连续型随机变量X 的概率密度函数为p (x ),分布函数为F (x ),则有 (1)∫=−=≤<21)()()(}{1221x x dx x p x F x F x X x P ;(2)当p (x ) 连续时,p (x ) = F ′(x ); 因∫∞−=x du u p x F )()(,当p (x ) 连续时,有)(])([)(x p du u p x F x=′=′∫∞−(3)X 在单独一个点取值的概率为0,其分布函数为连续函数;(4)P {x 1 < X ≤ x 2} = P {x 1 ≤ X ≤ x 2} = P {x 1 < X < x 2} = P {x 1 ≤ X < x 2},即连续型...随机变量在某区间内的概率与区间开闭无关,离散型则不成立;(5)只在有限个点上取值不相同的密度函数对应于同一个分布函数,一般,只在概率为0的数集上取值不相同的密度函数都对应于同一个分布函数.例 设F (x ) = A + B arctan x 为某连续型随机变量X 的分布函数. 求:(1)A , B ; (2)}31{≤≤−X P ; (3)密度函数p (x ). 解:(1)由正则性 F (−∞) = 0,F (+∞) = 1,得:02π)arctan (lim =−=+−∞→B A x B A x ,12π)arctan (lim =+=++∞→B A x B A x ,故21=A ,π1=B ;(2)x x F arctan π121)(+=,得1274ππ1213ππ121)1()3(}31{=⎥⎦⎤⎢⎣⎡⎟⎠⎞⎜⎝⎛−⋅+−⎟⎠⎞⎜⎝⎛⋅+=−−=≤≤−F F X P . (3)密度函数)1π(1)()(2x x F x p +=′=.例 已知⎩⎨⎧<<−=,,0,10),()(32其它x x x C x p是某连续型随机变量X 的密度函数,求:(1)C , (2)}211{<<−X P , (3)分布函数F (x ).解:(1)由正则性:1)(=∫∞+∞−dx x p ,得1120)4131()43()(10431032==−−=−=−∫C C x x C dx x x C ,故C = 12;(2)165)641241(12)43(12)(12)(}211{2104321032211=−=−=−==<<−∫∫−x x dx x x dx x p X P ;(3)X 的全部可能取值为 [0, 1],分段点0, 1,当x < 0时,0)()(==∫∞−xdu u p x F ,当0 ≤ x < 1时,4304303234)43(12)(12)()(x x u u du u u du u p x F xxx−=−=−==∫∫∞−,当x ≥ 1时, 1)(12)()(132=−==∫∫∞−du u u du u p x F x,故⎪⎩⎪⎨⎧≥<≤−<=.1,1,10,34,0,0)(43x x x x x x F例 已知⎩⎨⎧<<−=,,0,11|,|)(其它x x x p是某连续型随机变量X 的密度函数,求分布函数F (x ).解:分段点−1, 0, 1,当x < −1时,0)()(==∫∞−xdu u p x F ;当−1 ≤ x < 0时, 212122)()()(22121x x u du u du u p x F xxx−=+−=−=−==−−∞−∫∫; 当0 ≤ x < 1时,21221022)()()(220212001x x u u udu du u du u p x F xxx+=++=+−=+−==−−∞−∫∫∫;当x ≥ 1时, 1)()()(101=+−==∫∫∫−∞−udu du u du u p x F x.故⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤+<≤−−<=.1,1,10,21,01,21,0,0)(22x x x x xx x F§2.2 随机变量的数学期望对于随机变量,还应当掌握反映其平均值、分散程度等的指标,这就需要引入数学期望和方差等概念. 2.2.1.数学期望的概念例 甲、乙两个射击选手,在射击训练中甲射了10次,其中3次10环,1次9环,4次8环,2次7环;乙射了15次,其中2次10环,9次9环,2次8环,2次7环.问谁的表现更好? 分析:比较他们射中的平均环数甲共射中3 × 10 + 1 × 9 + 4 × 8 + 2 × 7 = 85环,平均每次射中5.81085=环; 乙共射中2 × 10 + 9 × 9 + 2 × 8 + 2 × 7 = 131环,平均每次射中73.815131=&环. 故乙的表现更好.一般地,若在n 次试验中,出现了m 1次x 1,m 2次x 2,…,m k 次x k ,(其中m 1 + m 2 + … + m k = n ),则平均值为∑==+++ki i i k k n mx n x m x m x m 12211L ,即平均值等于取值与频率乘积之和.因n 很大时,频率稳定在概率附近,即平均值将稳定在取值与概率乘积之和附近. 2.2.2.数学期望的定义定义 设离散型随机变量X 的分布列是⎟⎟⎠⎞⎜⎜⎝⎛L L L L )()()(~2121k kx p x p x p x x x X ,如果级数∑∞=1)(k k k x p x 绝对收敛,则称之为X 的数学期望(Expectation ),记为E (X ). 数学期望的实际意义是反映随机变量的平均取值,是其全部可能取值以相应概率为权数的加权平均.如X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−2.04.01.03.04102,则E (X) = (−2) × 0.3 + 0 × 0.1 + 1 × 0.4 + 4 × 0.2 = 0.6. 例 某人有4发子弹,现在他向某一目标射击,若命中目标就停止射击,否则直到子弹用完为止.设每发子弹命中率为0.4,以X 表示射击次数,求E (X ). 解:先求X 的分布列,X 的全部可能取值为1, 2, 3, 4,X = 1,第一枪就命中, p (1) = 0.4;X = 2,第一枪没有命中,第二枪命中,p (2) = 0.6 × 0.4 = 0.24; X = 3,前两枪没有命中,第三枪命中,p (3) = 0.6 2 × 0.4 = 0.144; X = 4,前三枪没有命中, p (4) = 0.6 3 = 0.216.则X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛216.0144.024.04.04321,故E (X ) = 1 × 0.4 + 2 × 0.24 + 3 × 0.144 + 4 × 0.216 = 2.176.例 若X 的概率函数为L ,2,1,21)2(==⎟⎟⎠⎞⎜⎜⎝⎛−k kp k k,求E (X ). 解:因∑∑∞=∞=−=⋅−11)1(21)2(k kk k k k k 收敛但不是绝对收敛,故E (X ) 不存在.离散型随机变量的数学期望是取值乘概率求和:∑∞=1)(k k k x p x ,类似可定义连续型随机变量的数学期望是取值乘密度积分:∫+∞∞−dx x xp )(.定义 设连续型随机变量X 的密度函数为p (x ).如果广义积分∫+∞∞−dx x xp )(绝对收敛,则称之为X 的数学期望,记为E (X ).例 已知连续型随机变量X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其它x x x p 求E (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xp X E . 例 已知X 的密度函数为⎩⎨⎧<<+=.,0,20,)(其它x bx a x p 且32)(=X E ,求a , b . 解:由正则性得122)2()()(2220=+=⋅+=+=∫∫∞+∞−b a x b ax dx bx a dx x p ,又32382)32()()()(20322=+=⋅+⋅=+==∫∫∞+∞−b a x b x a dx bx a x dx x xp X E ,故21,1−==b a . 例 已知X 的密度函数为+∞<<∞−+=x x x p ,)1π(1)(2,求E (X ).解:因+∞∞−+∞∞−+∞∞−+∞∞−+=⋅+=+=∫∫∫)1ln(π21)(21)1π(1)1π()(2222x x d x dx x x dx x xp 发散, 故E (X )不存在. 2.2.3.数学期望的性质设X 为随机变量,g (x ) 为函数,则称Y = g (X ) 为随机变量函数,Y 也是一个随机变量.下面不加证明地给出随机变量函数的数学期望计算公式.定理 设X 为随机变量,Y = g (X ) 为随机变量函数,则(1)若X 为离散型随机变量,概率函数为p(x k ), k = 1, 2, …,则∑∞===1)()()]([)(k k k x p x g X g E Y E ;(2)若X 为连续型随机变量,密度函数为p (x ),则∫+∞∞−==dx x p x g X g E Y E )()()]([)(.数学期望具有以下性质:(1)常数的期望等于其自身,即E (c ) = c ;(2)常数因子可移到期望符号外,即E (aX ) = a E (X );(3)随机变量和的期望等于期望的和,即E [g 1 (X ) + g 2 (X )] = E [g 1 (X )] + E [g 2 (X )]. 证明:(1)将常数c 看作是单点分布p (c ) = 1,故E (c ) = c p (c ) = c ;(2)以连续型为例加以证明,)()()()(X aE dx x xp a dx x axp aX E ===∫∫+∞∞−+∞∞−;(3)以连续型为例加以证明,∫∫∫+∞∞−+∞∞−+∞∞−+=+=+dx x p x g dx x p x g dx x p x g x g X g X g E )()()()()()]()([)]()([212121= E [g 1 (X )] + E [g 2 (X )].由性质(2)、(3)知随机变量线性组合的期望等于期望的线性组合,可见数学期望具有线性性质. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−3.04.01.02.02101, 求E (2X +1),E (X 2).解:E (2X +1) = −1 × 0.2 + 1 × 0.1 + 3 × 0.4 + 5 × 0.3 = 2.6;E (X 2) = 1 × 0.2 + 0 × 0.1 + 1 × 0.4 + 4 × 0.3 = 1.8. 例 已知圆的半径X 是一个随机变量,密度函数为⎪⎩⎪⎨⎧<<=.,0,31,21)(其他x x p 求圆面积Y 的数学期望. 解:圆面积Y = π X 2,故3π1332π21π)(π)(3133122=⋅=⋅==∫∫∞+∞−xdx x dx x p x Y E . 例 设国际市场对我国某种出口商品的需求量X (吨)的密度函数为⎪⎩⎪⎨⎧<<=.,0,40002000,20001)(其他x x p 设每售出一吨,可获利3万美元,但若销售不出,每积压一吨将亏损1万美元,问如何计划年出口量,能使国家获利的期望最大.解:设计划年出口量为a 吨,每年获利Y 万美元.当X ≥ a 时,销售a 吨,获利3a 万美元;当X < a 时,销售X 吨,积压a − X 吨,获利3X − (a − X ) = 4X − a 万美元;即⎩⎨⎧<≤−≤≤==.2000,4,4000,3)(a X a X X a a X g Y则4000200024000200020003)2(2000120001320001)4()()()(aa a a x a ax x dx a dx a x dx x p x g Y E +−=⋅+⋅−==∫∫∫+∞∞− 8250)3500(10001400071000122+−−=−+−=a a a , 故计划年出口量为3500吨时,使国家获利的期望最大.§2.3 随机变量的方差与标准差数学期望反映平均值,方差反映波动程度.如甲、乙两台包装机,要求包装重量为每袋500克,现各取5袋,重量为甲:498,499,500,501,502; 乙:490,495,500,505,510.二者平均值相同都是500克,但显然甲比乙好.此时比较的是它们的偏差(即取值与平均值之差).偏差:甲:−2,−1,0,1,2;乙:−10,−5,0,5,10. 2.3.1.方差的定义定义 随机变量X 与其数学期望E (X ) 之差X − E (X ) 称为偏差.偏差有大有小,可正可负,比较时需要去掉符号,但绝对值函数进行微积分处理不方便,因此考虑偏差平方的数学期望.定义 随机变量X ,若E [X − E (X )]2存在,则称之为X 的方差(Variance ),记为Var (X ) 或D (X ).即Var (X ) = E [X − E (X )]2.显然方差Var (X ) ≥ 0,称)Var(X 为X 的标准差(Standard Deviation ).在实际问题中,标准差与随机变量有相同的量纲.方差与标准差反映波动程度.方差越大,取值越分散;方差越小,取值越集中. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求E (X ), Var (X ).解:E (X ) = 1 × 0.2 + 2 × 0.4 + 3 × 0.4 = 2.2;Var (X ) = (−1.2)2 × 0.2 + (−0.2)2 × 0.4 + 0.82 × 0.4 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p求E (X ), Var (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xf X E ; 181949821949842)98382()()32()Var(1023410232=+−=⎟⎠⎞⎜⎝⎛+−=+−=−=∫∫∞+∞−x x x dx x x x dx x p x X .例 已知X 的全部可能取值为0, 1, 2,且E (X ) = 1.3,Var (X ) = 0.81.求X 的分布列.解:设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛c b a 210,由正则性得:a + b + c = 1,且E (X ) = 0 × a + 1 × b + 2 × c = b + 2c = 1.3,Var (X ) = (−1.3)2 × a + (−0.3)2 × b + 0.72 × c = 1.69a + 0.09b + 0.49c = 0.81, 解得a = 0.3,b = 0.1,c = 0.6,故X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛6.01.03.0210.2.3.2. 方差的性质方差具有以下性质:(1)方差计算公式:Var (X ) = E (X 2) − [E (X )]2; (2)常数的方差等于零,即Var (c ) = 0;(3)设a , b 为常数,则Var (a X + b ) = a 2 Var (X ). 证:(1)Var (X ) = E [X − E (X )]2 = E [X 2 − 2X ⋅ E (X ) + E (X )2] = E (X 2 ) − 2E (X ) ⋅ E (X ) + [E (X )]2.= E (X 2) − [E (X )]2;(2)Var (c ) = E [c − E (c )]2 = E (c − c )2 = E (0) = 0;(3)Var (a X + b ) = E [(a X + b ) − E (a X + b )]2 = E [a X + b − a E (X ) − b ]2 = a 2 E [X − E (X )]2 = a 2 Var (X ). 由性质(1),显然有以下推论:推论 对于随机变量X ,如果E (X 2) 存在,则E (X 2) ≥ [E (X )]2.以后常利用方差计算公式Var (X ) = E (X 2) − [E (X )]2计算随机变量的方差.通常用公式计算比直接用定义计算方差要方便. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求Var (X ).解:前面已求得E (X ) = 2.2,因E (X 2) = 1 2 × 0.2 + 2 2 × 0.4 + 3 2 × 0.4 = 5.4, 故Var (X ) = E (X 2) − [E (X )]2 = 5.4 − 2.22 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p 求Var (X ).解:前面已求得32)(=X E , 因21422)(141022=⋅=⋅=∫x xdx x X E , 故1813221)]([)()Var(222=⎟⎠⎞⎜⎝⎛−=−=X E X E X . 对于随机变量X ,若方差Var (X ) 存在,且Var (X ) > 0.令)Var()(*X X E X X −=,有0)]()([)Var(1)]([)Var(1)Var()(*)(=−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=X E X E X X E X E X X X E X E X E ; 1)Var()Var(1)](Var[)Var(1)Var()(Var *)Var(==−=⎟⎟⎠⎞⎜⎜⎝⎛−=X X X E X X X X E X X .称X *为X 的标准化随机变量.2.3.3. 切比雪夫不等式方差反映随机变量的分散程度,切比雪夫不等式给出其定量标准.切比雪夫不等式表明大偏差概率的上限与方差成正比.定理 设X 为随机变量,且方差Var (X ) 存在,则对于任何正数ε ,都有2)Var(}|)({|εεX X E X P ≤≥−.证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫≥−=≥−εε|)(|)(}|)({|X E x dx x p X E X P ,且∫∞+∞−−=−=dx x p X E x X E X E X )()]([)]([1)Var(22222εεε,故222|)(|22)Var()()]([)()]([}|)({|εεεεεX dx x p X E x dx x p X E x X E X P X E x =−≤−≤≥−∫∫∞+∞−≥−,得证.注:切比雪夫不等式的等价形式2)Var(1}|)({|εεX X E X P −≥<−.如随机变量X 的数学期望为E (X ) = 10,方差Var (X ) = 1,则由切比雪夫不等式可得43211}2|10{|}128{2=−≥<−=<<X P X P . 例 设随机变量X 的全部可能取值为),0[∞+,且数学期望E (X ) 存在,试证:对任何正数a ,都有)(1}{X E aa X P ≤≥. 证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫+∞=≥a dx x p a X P )(}{,且∫∫+∞+∞∞−==0)()(1)(1dx x p a x dx x xp a X E a ,故)(1)()(}{0X E adx x p a x dx x p a x a X P a =≤≤≥∫∫+∞+∞,得证.定理 设随机变量X 的方差存在,则Var (X ) = 0的充分必要条件是存在常数b ,使得X 几乎处处收敛于b ,即P {X = b } = 1.证:充分性,设存在常数b ,使得P {X = b } = 1,有P {X ≠ b } = 0,即E (X ) = b P {X = b } = b ,故Var (X ) = E [X − E (X )]2 = E (X − b )2 = 0 × P {X = b } = 0; 必要性,设X 的方差Var (X ) = 0,因事件U +∞=+∞→⎭⎫⎩⎨⎧≥−=⎭⎬⎫⎩⎨⎧≥−=>−11|)(|lim 1|)(|}0|)({|n n n X E X n X E X X E X ,则01)Var(lim 1|)(|lim 1|)(|}0|)({|21=⎟⎠⎞⎜⎝⎛≤⎭⎬⎫⎩⎨⎧≥−=⎟⎟⎠⎞⎜⎜⎝⎛⎭⎬⎫⎩⎨⎧≥−=>−+∞→+∞→+∞=n X n X E X P n X E X P X E X P n n n U , 可得P {| X − E (X )| > 0} = 0,即P {| X − E (X )| = 0} = 1,取b = E (X ),有b 为常数, 故P {X = b } = 1.注:如果P {X = b } = 1,记为X = b , a.e.(或a.s.),称为X = b 几乎处处成立(或几乎必然成立).这里,a.e.就是almost everywhere 的缩写,a.s.就是almost surely 的缩写.意味着不成立的情况是一个测度(或概率)等于零的集合(或事件).§2.4 常用离散分布对于一个给定的函数,只要满足概率函数的两条基本性质:非负性、正则性,都可以成为某个离散随机变量的概率函数.但绝大多数在实际工作中并不常见,下面是几种常用的概率函数. 2.4.1.两点分布与二项分布一.两点分布两点分布只可能在两个点取值,通常就是0或1.定义 随机变量的可能取值只有两个:0或1,且概率函数为p (0) = 1 − p ,p (1) = p , 其中0 < p < 1,称X 服从两点分布(Two-point Distribution )或0-1分布,记为X ~ (0-1).分布列为⎟⎟⎠⎞⎜⎜⎝⎛−p p110. 两点分布实际背景是一次伯努利试验.通常描述为:X 表示一次伯努利试验中事件A 发生的次数.非负性:p (0) = 1 − p > 0,p (1) = p > 0; 正则性:(1 − p ) + p = 1. 两点分布的数学期望为E (X ) = 0 × (1 − p ) + 1 × p = p .又因E (X 2 ) = 02 × (1 − p ) + 12 × p = p ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = p − p 2 = p (1 − p ).二.二项分布在n 重伯努利试验中,以X 表示事件A 的发生次数,则X 的全部可能取值为0, 1, 2, …, n ,且kn k p p k n k X P −−⎟⎟⎠⎞⎜⎜⎝⎛==)1(}{. 定义 若离散型随机变量X 的概率函数为kn k p p k n k p −−⎟⎟⎠⎞⎜⎜⎝⎛=)1()(, k = 0, 1, 2, …, n ;0 < p < 1, 则称X 服从二项分布(Binomial Distribution ),记为X ~ b (n , p ).二项分布的实际背景是n 重伯努利试验. 当n = 1时,二项分布就是两点分布.非负性:0)1()(>−⎟⎟⎠⎞⎜⎜⎝⎛=−kn k p p k n k p ; 正则性:1)]1([)1()(11=−+=−⎟⎟⎠⎞⎜⎜⎝⎛=∑∑=−=nnk k n k nk p p p p k n k p . 例 掷三枚硬币,X 表示正面朝上的次数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3 ,将掷每一枚硬币看作一次试验.每次试验两种结果:正面A ,反面A ;每次试验相互独立;每次试验概率5.0)(=A P . 即n 重伯努利试验,n = 3,5.0=p ,有X ~ b (3, 0.5),p (0) = 0.5 3 = 0.125,375.05.05.013)1(21=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 375.05.05.023)2(12=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (3) = 0.5 3 = 0.125.例 现有5台机床,每台机床一小时内平均开动18分钟,且是否开动相互独立,以X 表示同一时刻开动的机床数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3, 4, 5 ,将每台机床是否开动看作一次试验.每次试验两种结果:开动A ,不开动A ;每次试验相互独立;每次试验概率P (A ) = 0.3. 即n 重伯努利试验,n = 5,p = 0.3,有X ~ b (5, 0.3).p (0) = 0.7 5 = 0.16807,36015.07.03.015)1(41=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 3087.07.03.025)2(32=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 1323.07.03.035)3(23=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 02835.07.03.045)4(14=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (5) = 0.3 5 = 0.00243 .一般地,如果随机变量X 服从二项分布,概率函数值p (k ) 将随着k 的增加,先逐渐增加,达到最大值后,又逐渐减少.通常,一个随机变量X 的概率函数或密度函数的最大值点称为X 的最可能值.二项分布b (n , p )的最可能值为⎩⎨⎧+−++++=.)1(,1)1()1(,)1(],)1[(0是正整数时当或不是正整数时当p n p n p n p n p n k 这里[x ]表示不超过x 的最大整数.如[2.3] = 2,[3.14] = 3,[−1.2] = −2.证:若X ~ b (n , p ),有n k p p k n k n p p k n k p k n k kn k ≤≤−−=−⎟⎟⎠⎞⎜⎜⎝⎛=−−0,)1()!(!!)1()(, 则11)1()!1()!1(!)1()!(!!)1()(+−−−−+−−−−−=−−k n k k n k p p k n k n p p k n k n k p k p ⎟⎠⎞⎜⎝⎛+−−−⋅−−−=−−11)1()!()!1(!1k n p k pp p k n k n k n k)1()1()1()!()!1(!1+−−+⋅−−−=−−k n k k p n p p k n k n k n k , 当k < (n + 1) p 时,有p (k ) > p (k − 1);当k > (n + 1) p 时,有p (k ) < p (k − 1).如果(n + 1) p 不是正整数,取k 0 = [(n + 1) p ],有k 0 < (n + 1) p ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > (n + 1) p ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果(n + 1) p 是正整数,取k 0 = (n + 1) p ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值.如X ~ B (3, 0.5),有(n + 1) p = 4 × 0.5 = 2是正整数,最可能值k 0 = 2或1;X ~ B (5, 0.3),有(n + 1) p = 6 × 0.3 = 1.8不是正整数,最可能值k 0 = [1.8] = 1.三.二项分布的数学期望和方差组合数公式⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=−⋅−−⋅=−⋅=⎟⎟⎠⎞⎜⎜⎝⎛11)!()!1()!1()!(!!k n k n k n k n k n k n k n k n , (n ≥ k > 0). 二项分布b (n , p )的数学期望为∑∑∑=−−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅⋅=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k kn k nk k n k p p k n np p p k n k n k p p k n k X E 1110)1(11)1(11)1()( = np [ p + (1 − p )]n − 1 = np .又因∑∑∑=−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k k n k nk k n k p p k n k p p k n k k p p k n k X E 002022)1()1(11)()1()( )()1(22)1()1()(22X E p p k n k k n n k k nk k n k+−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=∑=− np p p k n pn n nk kn k +−⎟⎟⎠⎞⎜⎜⎝⎛−−−=∑=−−222)1(22)1( = n (n − 1) p 2 [ p + (1 − p )]n − 2 + np = (n 2 − n ) p 2 + np ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = (n 2 − n ) p 2 + np − (np )2 = − np 2 + np = np (1 − p ).2.4.2.泊松分布一.泊松分布泊松分布是一种理论推导的极限分布(成立的条件和推导过程见附录). 定义 若随机变量X 的概率函数为λλ−=e !)(k k p k, k = 0, 1, 2, …… ;λ > 0,则称X 服从参数为 λ 的泊松分布(Poisson’s Distribution ),记为X ~ P (λ).泊松分布的实际背景是已知平均发生次数为常数λ ,实际发生次数的概率分布.如足球比赛进球数,商店进店人数,电话接听次数等.非负性:λ > 0时,0e !>−λλk k;正则性:1e e e !=⋅=⋅−∞=−∑λλλλk kk .例 已知一场足球比赛的进球数X 服从参数λ = 2.3的泊松分布,求比分为0:0, 1:0以及总进球数超过5个的概率.解:因X ~ P(2.5),则3.2e !3.2)(−=k k p k , k = 0, 1, 2, …….比分0:0,即X = 0,100.0e e !03.2)0(3.23.20===−−p (查表);比分1:0,即X = 1,231.0100.0331.0e 3.2e !13.2)1(3.23.21=−===−−p (查表);总进球数超过5个,即X > 5,030.0970.01e !3.21e!3.2}5{53.263.2=−=−==>∑∑=−∞=−k k k k k k X P (查表). 例 已知某公用电话每小时内打电话的人数X 服从参数为λ = 8的泊松分布.求某一小时内无人打电话的概率,恰有10人打电话的概率,至少有10人打电话的概率.解:因X ~ P(8),有8e !8}{−==k k X P k . 无人打电话的概率0003.0e e !08}0{880====−−X P ,恰有10人打电话的概率099.0717.0816.0e !108}10{810=−===−X P (查表),至少有10人打电话的概率283.0717.01}9{1e !8}10{108=−=≤−==≥∑∞=−X P k X P k k (查表). 例 已知某商店一天中某种贵重商品的销售件数X 服从泊松分布P (7),问该商店每天应该准备多少件该商品才能以99.9%以上的概率满足顾客需要?解:设准备了a 件该商品,X ~ P(7),则7e !7)(−=k k p k .事件“满足顾客需要”,即X ≤ a ,有P {X ≤ a } ≥ 0.999,故查表可得a = 16. 泊松分布P (λ )的最可能值为⎩⎨⎧−=.,1,],[0是正整数时当或不是正整数时当λλλλλk 证:若X ~ P(λ),有L ,2,1,0,e !)(==−k k k p kλλ,故k k k k k k k k p k p k k k k−⋅−=⎟⎠⎞⎜⎝⎛−⋅−=−−=−−−−−−−−−λλλλλλλλλλe )!1(1e )!1(e)!1(e !)1()(111,当k < λ 时,有p (k ) > p (k − 1);当k > λ 时,有p (k ) < p (k − 1).如果λ 不是正整数,取k 0 = [λ ] ,有k 0 < λ ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > λ ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果λ 是正整数,取k 0 = λ ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值. 二.泊松分布的数学期望和方差泊松分布P (λ )的数学期望为λλλλλλλλλλλ=⋅=−⋅=−=⋅=−∞=−−∞=−∞=−∑∑∑e e )!1(e e)!1(e!)(111k k k kk kk k k k X E ,即泊松分布的参数 λ 反映平均发生次数.又因)()!2(e e!e!)(e!)(222222X E k k k k k k k k X E k k k kk kk k+−⋅=⋅+⋅−=⋅=∑∑∑∑∞=−−∞=−∞=−∞=−λλλλλλλλλ= λ 2 e −λ ⋅ e λ + λ = λ 2 + λ ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = λ 2 + λ − (λ )2 = λ .三.二项分布的泊松近似二项分布与泊松分布的实际背景都是反映发生次数问题.下面的定理说明了二者之间的联系,泊松分布是二项分布的一种极限分布. 定理 (泊松定理)在n 重伯努利试验中,记事件A 在每次试验中发生的概率为与试验次数n 有关的数p n ,如果当n → +∞ 时,有n p n → λ ,则λλ−−+∞→=−⎟⎟⎠⎞⎜⎜⎝⎛e !)1(lim k p p k n k k n n k n n . 证:记λ n = n p n ,有λλ=+∞→n n lim ,因nk n n n kn n k n n n n n n p )(11)1(−−⋅−−−⎟⎠⎞⎜⎝⎛−+=⎟⎠⎞⎜⎝⎛−=−λλλλ,且e 1lim =⎟⎠⎞⎜⎝⎛−+−+∞→nnn n n λλ,λλ−=−−+∞→n k n n n )(lim , 则λλλλ−−−⋅−+∞→−+∞→=⎟⎠⎞⎜⎝⎛−+=−e 1lim )1(lim )(n k n n n n k n n n n n n p ,又因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛n k n k n k k n n n k n k 1111!!)1()1(L L ,且11111lim =⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−+∞→n k n n L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→−+∞→n k n p p k n p p k n k n nk n k n k n n k n n 1111)1(!lim )1(lim L λλ−+∞→−+∞→+∞→=⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅=e !1111lim )1(lim !)(lim k n k n p k np k n k n n n k n n L . 此定理表明对于二项分布b (n , p ),当n 很大,p 很小时,可用泊松分布P (λ ) 近似,其中λ = n p .例 某地区每年人口意外死亡率为0.0001,现有60000人投保人身意外保险,求一年内因投保人意外死亡恰好赔付8人的概率以及赔付不超过5人的概率.解:设X 表示“一年内因投保人意外死亡而赔付的人数”,X ~ B (60000, 0.0001).则5999289999.00001.0860000}8{××⎟⎟⎠⎞⎜⎜⎝⎛==X P ,∑=−××⎟⎟⎠⎞⎜⎜⎝⎛=≤50600009999.00001.060000}5{k kk k X P , 但显然计算很繁琐,为便于计算,用泊松分布近似.因n = 60000很大,p = 0.0001很小,λ = np = 6,有)6(~P X &,故103.0744.0847.0e !86}8{68=−=≈=−X P ,446.0e !6}5{506=≈≤∑=−k k k X P .2.4.3. 超几何分布一.超几何分布在N 件产品中,有M 件次品,从中不放回地取n 件,以X 表示取得的次品数.设X 取值为k ,一方面,显然有k ≤ n 且k ≤ M ,即k ≤ min{n , M },另一方面,有k ≥ 0且n − k ≤ N − M ,可得k ≥ M + n − N ,即k ≥ max{0, M + n − N }.这样X 的全部可能取值为l , l + 1, …, L ,其中l = max{0, M + n − N },L = min{n , M },且⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛==n N k n M N k M k X P }{.定义 若随机变量X 的概率函数为⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=n N k n M N k M k p )(,k = l , l + 1, …, L ,l = max(0, n + M − N ),L = min(M , n ),M < N ,n < N , 则称X 服从超几何分布(Hypergeometric Distribution ),记为X ~ h (n , N , M ).超几何分布的实际背景是古典概型中的不放回抽样检验问题. 注:有放回检验抽样问题对应的是二项分布.非负性:0>⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛n N k n M N k M ;正则性:10=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑∑==n N n N n N k n M N k M n N k n M N k M Ll k L k .注:比较(1 + x )M(1 + x )N − M与(1 + x )N中x n的系数可以证明⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑=n N k n M N k M Ll k .例 一袋中有3个红球,2个白球,不放回地取出3个球,X 表示取得的红球数.求X 的概率分布.解:不放回抽样,N = 3,M = 2,n = 3,则X ~ h (3, 5, 3).故X 的全部可能取值为1, 2, 3, (l = max (0, n + M − N ) = 1,L = min(n , M ) = 3),3.0352213}1{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,6.0351223}2{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,1.0350233}3{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P . 超几何分布h (n , N , M )的最可能值为⎪⎩⎪⎨⎧+++−++++++++++++=.21)1(,121)1(21)1(,21)1(],21)1[(0是正整数时当或不是正整数时当N M n N M n N M n N M n N M n k证:若X ~ h (n , N , M),有)!()!()!()!(!!1)(k n M N k n M N k M k M n N n N k n M N k M k p +−−−−⋅−⋅⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=, 故p (k ) − p (k − 1))!1()!1()!1()!1()!(!)!()!()!(!)!(!−+−−+−+−−⎟⎟⎠⎞⎜⎜⎝⎛−−+−−−−⎟⎟⎠⎞⎜⎜⎝⎛−=k n M N k n k M k n N M N M k n M N k n k M k n N M N M)]()1)(1[()!()!1()!1(!)!(!k n M N k k n k M k n M N k n k M k n N M N M +−−−+−+−+−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=)]2()1)(1[()!()!1()!1(!)!(!+−+++−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=N k n M k n M N k n k M k n N M N M .当21)1(+++<N M n k 时,有p (k ) > p (k − 1);当21)1(+++>N M n k 时,有p (k ) < p (k − 1). 如果21)1(+++N M n 不是正整数,取21)1[(0+++=N M n k ,有21)1(0+++<N M n k ,即p (k 0) > p (k 0 − 1);且21)1(10+++>+N M n k ,即p (k 0 + 1) < p (k 0).故p (k 0) 为最大值.如果21)1(+++N M n 是正整数,取21)1(0+++=N M n k ,即p (k 0) = p (k 0 − 1),故p (k 0) 和p (k 0 − 1) 都是最大值. 二.超几何分布的数学期望和方差超几何分布h (n , N , M )的数学期望为N nM n N k n M N k M N nM n N n N k n M N k M k M k n N k n M N k M k X E Ll k L lk L l k =⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=∑∑∑===11111111)(, 又因∑∑∑===⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=L lk L l k Ll k n N k n M N k M k n N k n M N k M k k n N k n M N k M k X E )()(222 ∑=+⎟⎟⎠⎞⎜⎜⎝⎛−−−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=Llk X E n N n n N N k n M N k M k k M M k k )(22)1()1(22)1()1()(2N nM N N M M n n N nM n N k n M N k M N N M M n n Ll k +−−−=+⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−−−=∑=)1()1()1(2222)1()1()1(, 故方差为)1())(()1()1)(1()]([)()Var(222222−−−=−+−−−=−=N N n N M N nM N M n N nM N N M n nM X E X E X . 为了便于记忆,可将超几何分布与二项分布的数学期望和方差进行比较.二项分布b (n , p ):数学期望E (X ) = np ,方差Var (X ) = np (1 − p );超几何分布h (n , N , M ):数学期望N M nX E =)(,方差11)Var(−−⎟⎠⎞⎜⎝⎛−=N n N N M N M n X ; 可见分布h (n , N , M )中的N M 相当于二项分布b (n , p )中的p ,方差修正因子为1−−N nN . 三.超几何分布的二项近似直观上,当抽样个数n 远小于M 及N − M 时,不放回抽样问题可近似看作有放回抽样问题,也就是此时超几何分布可用二项分布近似.定理 如果当N → +∞ 时,p NM→, (0 < p < 1),则k n k N p p k n n N k n M N k M −+∞→−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛)1(lim . 证:因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛N n N n N n n N N N n N n 1111!!)1()1(L L , 且⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛M k M k M k M k 1111!L ,⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−=⎟⎟⎠⎞⎜⎜⎝⎛−−−M N k n M N k n M N k n M N kn 1111)!()(L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→+∞→N n N n N M N k n M N k n M N M k M k M n N k n M N k M n k n k N N 1111!1111)!()(1111!lim lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅−=−+∞→N n N M N k n M N M k M N M N M k n k n nk n k N 111111111111)()!(!!lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛=+∞→−+∞→N n N M N k n M N M k M N M N M k n N kn k N 111111111111lim 1lim L L L。
2.1 随机变量及其概率分布学习目标核心素养1.了解取有限值的离散型随机变量及其分布列的概念,了解分布列刻画随机现象的重要性,会求某些简单离散型随机变量的分布列.(重点、难点)2.掌握离散型随机变量分布列的性质,掌握两点分布的特征.(重点)1.通过对离散型随机变量的学习,提升数学抽象素养.2.借助随机变量的分布列,提升逻辑推理素养.1.随机变量如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量.通常用大写拉丁字母X,Y,Z(或小写希腊字母ξ,η,ζ)等表示.思考1:随机变量是自变量吗?[提示] 不是,它是随试验结果变化而变化的,不是主动变化的.思考2:离散型随机变量的取值必须是有限个吗?[提示] 不一定.离散型随机变量的取值可以一一列举出来,所取值可以是有限个,也可以是无限个.2.概率分布列假定随机变量X有n个不同的取值,它们分别是x1,x2,…,x n,且P(X=x i)=p i,i=1,2,…,n,①则称①为随机变量X的概率分布列,简称为X的分布列.称表X x1x2…x nP p1p2…p np i(i =1,2,…,n)满足条件:①p i≥0(i=1,2,…,n);②p1+p2+…+p n=1.思考3:在离散型随机变量分布列中,每一个可能值对应的概率可以为任意的实数吗?[提示] 错误.每一个可能值对应的概率为[0,1]中的实数.思考4:离散型随机变量的分布列中,各个概率之和可以小于1吗?[提示] 不可以.由离散型随机变量的含义与分布列的性质可知不可以.思考5:离散型随机变量的各个可能值表示的事件是彼此互斥的吗?[提示] 是.离散型随机变量的各个可能值表示的事件不会同时发生,是彼此互斥的.3.两点分布如果随机变量X的分布表为X 10P p q其中0<p<1,q=1-p,这一类分布称为01分布或两点分布,并记为X~01分布或X~两点分布.1.掷均匀硬币一次,随机变量为( )A.掷硬币的次数B.出现正面向上的次数C.出现正面向上的次数或反面向上的次数D.出现正面向上的次数与反面向上的次数之和B[掷一枚硬币,可能出现的结果是正面向上或反面向上,以一个标准如正面向上的次数来描述这一随机试验,那么正面向上的次数就是随机变量ξ,ξ的取值是0,1.A项中,掷硬币的次数就是1,不是随机变量;C项中的标准模糊不清;D项中,出现正面向上的次数和反面向上的次数的概率的和必是1,对应的是必然事件,所以不是随机变量.] 2.设离散型随机变量ξ的分布列如下:ξ-1012 3P 0.100.200.100.200.40 Pξ0.40 [P(ξ<1.5)=P(ξ=-1)+P(ξ=0)+P(ξ=1)=0.10+0.20+0.10=0.40.] 3.设某项试验的成功率是失败率的2倍,用随机变量X描述一次试验成功与否(记X=0为试验失败,记X=1为试验成功),则P(X=0)等于________.1 3[设试验失败的概率为p,则2p+p=1,∴p=13.]随机变量的概念【例1】(1)国际机场候机厅中2019年5月1日的旅客数量;(2)2019年1月1日至5月1日期间所查酒驾的人数;(3)2019年6月1日某某到的某次列车到站的时间;(4)体积为1 000 cm3的球的半径长.[思路探究] 利用随机变量的定义判断.[解] (1)旅客人数可能是0,1,2,…,出现哪一个结果是随机的,因此是随机变量.(2)所查酒驾的人数可能是0,1,2,…,出现哪一个结果是随机的,因此是随机变量.(3)列车到达的时间可在某一区间内任取一值,是随机的,因此是随机变量.(4)球的体积为1 000 cm3时,球的半径为定值,不是随机变量.随机变量的辨析方法(1)随机试验的结果具有可变性,即每次试验对应的结果不尽相同.(2)随机试验的结果具有确定性,即每次试验总是恰好出现这些结果中的一个,但在一次试验之前却不能肯定这次试验会出现哪一个结果.如果一个随机试验的结果对应的变量具有以上两点,则该变量即为随机变量.1.(1)下列变量中,是随机变量的是________.(填上所有正确的序号)①某人掷硬币1次,正面向上的次数;②某音乐歌曲《小苹果》每天被点播的次数;③标准大气压下冰水混合物的温度;④你每天早晨起床的时间.(2)一个口袋中装有10个红球,5个白球,从中任取4个球,其中所含红球的个数为X,则X的可能取值构成集合________.事件{X=k}表示取出________个红球,________个白球,k=0,1,2,3,4.(1)①②④(2){0,1,2,3,4} k4-k[(1)①②④中每个事件的发生是随机的,具有可变性,故①②④是随机变量;标准大气压下冰水混合物的温度为0 ℃,是必然的,不具有随机性.(2)由题意可知,X的可能取值为0,1,2,3,4.{X=k}表示取出的4个球中含k个红球,4-k个白球.]随机变量的分布列及应用【例2】ξ表示取出的3只球中的最大,写出随机变量ξ的概率分布.[思路探究] 由本例中的取球方式可知,随机变量ξ与球的顺序无关,其中球上的最大只有可能是3,4,5,可以利用组合的方法计算其概率.[解] 随机变量ξ的可能取值为3,4,5.当ξ=3时,即取出的三只球中最大为3,则其他两只球的编号只能是1,2,故有P(ξ=3)=C22C35=110;当ξ=4时,即取出的三只球中最大为4,则其他两只球只能在编号为1,2,3的3只球中取2只,故有P(ξ=4)=C23C35=310;当ξ=5时,即取出的三只球中最大为5,则其他两只球只能在编号为1,2,3,4的4只球中取2只,故有P(ξ=5)=C24C35=610=35.因此,ξ的分布列为ξ34 5P11031035利用分布列及其性质解题时要注意以下两个问题:(1)X的各个取值表示的事件是互斥的.(2)不仅要注意∑i=1np i=1,而且要注意p i≥0,i=1,2,…,n.2.设随机变量ξ的概率分布为P⎝⎛⎭⎪⎫ξ=k5=ak(k=1,2,3,4,5).求:(1)常数a的值;(2)P ⎝ ⎛⎭⎪⎫ξ≥35; (3)P ⎝ ⎛⎭⎪⎫110<ξ<710.[解] 题目所给的ξ的概率分布表为ξ 15 25 35 45 55 Pa2a3a4a5a(1)由a +2a +3a +4a +5a =1,得a =15.(2)P ⎝ ⎛⎭⎪⎫ξ≥35=P ⎝ ⎛⎭⎪⎫ξ=35+P ⎝ ⎛⎭⎪⎫ξ=45+P ⎝ ⎛⎭⎪⎫ξ=55=315+415+515=45或P ⎝⎛⎭⎪⎫ξ≥35=1-P ⎝⎛⎭⎪⎫ξ≤25=1-⎝ ⎛⎭⎪⎫115+215=45.(3)因为110<ξ<710,所以ξ=15,25,35.故P ⎝ ⎛⎭⎪⎫110<ξ<710=P ⎝ ⎛⎭⎪⎫ξ=15+P ⎝ ⎛⎭⎪⎫ξ=25+P ⎝ ⎛⎭⎪⎫ξ=35=a +2a +3a =6a =6×115=25.随机变量的可能取值及试验结果[1.抛掷一枚质地均匀的硬币,可能出现正面向上、反面向上两种结果.这种试验结果能用数字表示吗?[提示] 可以.用数字1和0分别表示正面向上和反面向上.2.在一块地里种10棵树苗,设成活的树苗数为X ,则X 可取哪些数字? [提示] X =0,1,2,3,4,5,6,7,8,9,10.3.抛掷一枚质地均匀的骰子,出现向上的点数为ξ,则“ξ≥4”表示的随机事件是什么?[提示] “ξ≥4”表示出现的点数为4点,5点,6点.【例3】 写出下列随机变量可能取的值,并说明随机变量所取的值和所表示的随机试验的结果.(1)袋中有大小相同的红球10个,白球5个,从袋中每次任取1个球,直到取出的球是白球为止,所需要的取球次数;(2)从标有1,2,3,4,5,6的6X卡片中任取2X,所取卡片上的数字之和.[思路探究] 分析题意→写出X可能取的值→分别写出取值所表示的结果[解] (1)设所需的取球次数为X,则X=1,2,3,4,…,10,11,X=i表示前i-1次取到红球,第i次取到白球,这里i=1,2, (11)(2)设所取卡片上的数字和为X,则X=3,4,5, (11)X=3,表示“取出标有1,2的两X卡片”;X=4,表示“取出标有1,3的两X卡片”;X=5,表示“取出标有2,3或标有1,4的两X卡片”;X=6,表示“取出标有2,4或1,5的两X卡片”;X=7,表示“取出标有3,4或2,5或1,6的两X卡片”;X=8,表示“取出标有2,6或3,5的两X卡片”;X=9,表示“取出标有3,6或4,5的两X卡片”;X=10,表示“取出标有4,6的两X卡片”;X=11,表示“取出标有5,6的两X卡片”.用随机变量表示随机试验的结果问题的关键点和注意点(1)关键点:解决此类问题的关键是明确随机变量的所有可能取值,以及取每一个值时对应的意义,即一个随机变量的取值可能对应一个或多个随机试验的结果.(2)注意点:解答过程中不要漏掉某些试验结果.3.写出下列各随机变量可能取的值,并说明随机变量所取的值表示的随机试验的结果.(1)在2018年大学的自主招生中,参与面试的5名考生中,通过面试的考生人数X;(2)射手对目标进行射击,击中目标得1分,未击中目标得0分,该射手在一次射击中的得分用ξ表示.[解] (1)X可能取值0,1,2,3,4,5,X=i表示面试通过的有i人,其中i=0,1,2,3,4,5.(2)ξ可能取值为0,1,当ξ=0时,表明该射手在本次射击中没有击中目标;当ξ=1时,表明该射手在本次射击中击中目标.1.本节课重点是随机变量的概念及随机变量的分布列及其性质,以及两点分布,难点是随机变量的取值及概率.2.判断一个试验是否为随机试验,依据是这个试验是否满足以下三个条件:(1)试验在相同条件下是否可以重复;(2)试验的所有可能结果是否是明确的,并且试验的结果不止一个;(3)每次试验的结果恰好是一个,而且在一次试验前无法预知出现哪个结果.3.本节课的易错点:在利用分布列的性质解题时要注意:①X=xi的各个取值所表示的事件是互斥的;②不仅要注意i=1np i=1,而且要注意0≤p i≤1,i=1,2,…,n.1.判断(正确的打“√”,错误的打“×”)(1)随机变量的取值可以是有限个,也可以是无限个.( )(2)在概率分布列中,每一个可能值对应的概率可以为任意的实数.( )(3)概率分布列中每个随机变量的取值对应的概率都相等.( )(4)在概率分布列中,所有概率之和为1.( )[解析] (1)√因为随机变量的每一个取值,均代表一个试验结果,试验结果有限个,随机变量的取值就有有限个,试验结果有无限个,随机变量的取值就有无限个.(2)×因为在概率分布列中每一个可能值对应随机事件的概率均在[0,1]X围内.(3)×因为分布列中的每个随机变量能代表的随机事件,并非都是等可能发生的事件.(4)√由分布列的性质可知,该说法正确.[答案] (1)√(2)×(3)×(4)√2.下列叙述中,是随机变量的为( )A.某人早晨在车站等出租车的时间B.把一杯开水置于空气中,让它自然冷却,每一时刻它的温度C.射击十次,命中目标的次数D .袋中有2个黑球,6个红球,任取2个,取得1个红球的可能性 C [根据随机变量的含义可知,选C.] 3.随机变量η的分布列如下:则x 0 0.55 [由分布列的性质得 0.2+x +0.35+0.1+0.15+0.2=1,解得x =0.故P (η≤3)=P (η=1)+P (η=2)+P (η=3)=0.2+0.35=0.55.] 4.袋中有相同的5个球,其中3个红球,2个黄球,现从中随机且不放回地摸球,每次摸1个,当两种颜色的球都被摸到时,即停止摸球,记随机变量X 为此时已摸球的次数,求随机变量X 的概率分布列.[解] 随机变量X 可取的值为2,3,4, P (X =2)=C 12C 13C 12C 15C 14=35;P (X =3)=A 22C 13+A 23C 12C 15C 14C 13=310;P (X =4)=A 33C 12C 15C 14C 13C 12=110;所以随机变量X 的概率分布列为:。
第二章随机变量及其概率分布内容简介1.本章引入随机变量及其分布函数概念,讨论了离散型和连续型两种随机变量,介绍了几种常用的随机变量。
2.本章重点内容包括:离散型随机变量及其分布律,连续型随机变量及其概率密度,二项分布与正态分布。
内容讲解§2.1离散型随机变量1.随机变量的概念(1)引入随机变量的理由:① “常量”到“变量”;② 全面研究随机试验的需要。
(2)如何引入:一类:随机试验的结果用数量表示的,直接数量化。
如:掷骰子,设出现的点数为随机变量X,则X=1,2,3,4,5,6分别表示事件“出现一点”,“出现二点”,…,“出现六点”。
另一类:试验结果不是用数量表示的,如:掷硬币,双方比赛的结果等,可以人为赋值,如掷硬币,设结果为随机变量Y,“出现正面”用“Y=1”表示,“出现反面”用“Y=0”表示。
如果双方比赛结果使用记分法,可以用分数表示,“Z=3”表示“胜”,“Z=1”表示“平”,“Z=0”表示“负”,等等。
(3)定义:设E是随机试验,样本空间为Ω,如果对于每一个样本点ω∈Ω,有一个实数X(ω)与之对应,则称X=X(ω)为随机变量,记做X, Y, Z,…。
(4)解释:① 随机变量不是普通变量,它的取值不是任意的,它是以一定的可能性(概率)取某一个值的,即具有随机性,因此称为“随机变量”;② 在一次随机试验中,可以根据不同的需要来定义不同的随机变量。
③ 引入随机变量后,可用随机变量来描述事件,如掷骰子,设出现的点数为随机变量X,则“出现4点”可表示为{X=4},“不少于4点”可表示为{X≥4},等等。
所以,其概率可表示为P{X=4}=1/6, P{X≥4}=1/2。
2.离散型随机变量及其分布律(1)离散型随机变量定义:若随机变量X只取有限多个或可列无限多个值,则称X为离散型随机变量。
如掷骰子出现的点数,医院门诊一天接待的患者数,某停车场内停放的车辆数,等等,都是离散型随机变量。
(2)离散型随机变量的分布律:设X为离散型随机变量,可能取值为x1,x2,…,x k,…,且P{X =x k }=p k,k=1,2,…,则称{ p k }为X的分布律(或分布列,概率分布)。
第二章随机变量第一节随机变量及其分布函数上一章中我们讨论的随机事件中有些是直接用数量来标识的,例如,抽样检验灯泡质量试验中灯泡的寿命;而有些则不是直接用数量来标识的,如性别抽查试验中所抽到的性别.为了更深入地研究各种与随机现象有关的理论和应用问题,我们有必要将样本空间的元素与实数对应起来.即将随机试验的每个可能的结果e都用一个实数X来表示.例如,在性别抽查试验中用实数“1”表示“出现男性”,用“0”表示“出现女性”.显然,一般来讲此处的实数X值将随e的不同而变化,它的值因e的随机性而具有随机性,我们称这种取值具有随机性的变量为随机变量.定义2.1设随机试验的样本空间为Ω,如果对Ω中每一个元素e,有一个实数X(e)与之对应,这样就得到一个定义在Ω上的实值单值函数X=X(e),称之为随机变量(Random variable).随机变量的取值随试验结果而定,在试验之前不能预知它取什么值,只有在试验之后才知道它的确切值;而试验的各个结果出现有一定的概率,故随机变量取各值有一定的概率.这些性质显示了随机变量与普通函数之间有着本质的差异.再者,普通函数是定义在实数集或实数集的一个子集上的,而随机变量是定义在样本空间上的(样本空间的元素不一定是实数),这也是二者的差别.本书中,我们一般以大写字母如X,Y,Z,W,…表示随机变量,而以小写字母如x,y,z,w,…表示实数.为了研究随机变量的概率规律,并由于随机变量X的可能取值不一定能逐个列出,因此我们在一般情况下需研究随机变量落在某区间(x1,x2]中的概率,即求P{x1<X≤x2},但由于P{x1<X≤x2}=P{X≤x2}-P{X≤x1},由此可见要研究P{x1<X≤x2}就归结为研究形如P{X≤x}的概率问题了.不难看出,P{X≤x}的值常随不同的x而变化,它是x的函数,我们称这函数为分布函数.定义2.2设X是随机变量,x为任意实数,函数F(x)=P{X≤x}称为X的分布函数(Distribution function).对于任意实数x1,x2(x1<x2),有P{x1<X≤x2}=P{X≤x2}-P{X≤x1}=F(x2)-F(x1),(2.1)因此,若已知X的分布函数,我们就能知道X落在任一区间(x1,x2]上的概率.在这个意义上说,分布函数完整地描述了随机变量的统计规律性.如果将X看成是数轴上的随机点的坐标,那么,分布函数F(x)在x处的函数值就表示X落在区间(-∞,x]上的概率.分布函数具有如下基本性质:1°F(x)为单调不减的函数.事实上,由(2.1)式,对于任意实数x1,x2(x1<x2),有F(x2)-F(x1)=P{x1<X≤x2}≥0.2°0≤F (x )≤1,且)(lim x F x +∞→=1,常记为F (+∞)=1.)(lim x F x -∞→=0,常记为F (-∞)=0.我们从几何上说明这两个式子.当区间端点x 沿数轴无限向左移动(x →-∞)时,则“X 落在x 左边”这一事件趋于不可能事件,故其概率P {X ≤x }=F (x )趋于0;又若x 无限向右移动(x →+∞)时,事件“X 落在x 左边”趋于必然事件,从而其概率P {X ≤x }=F (x )趋于1.3°F (x +0)=F (x ),即F (x )为右连续. 证略.反过来可以证明,任一满足这三个性质的函数,一定可以作为某个随机变量的分布函数. 概率论主要是利用随机变量来描述和研究随机现象,而利用分布函数就能很好地表示各事件的概率.例如,P {X >a }=1-P {X ≤a }=1-F (a ),P {X <a }=F (a -0),P {X =a }=F (a )-F (a -0)等等.在引进了随机变量和分布函数后我们就能利用高等数学的许多结果和方法来研究各种随机现象了,它们是概率论的两个重要而基本的概念.下面我们从离散和连续两种类别来更深入地研究随机变量及其分布函数,另有一种奇异型随机变量超出本书范围,就不作介绍了.第二节离散型随机变量及其分布如果随机变量所有可能的取值为有限个或可列无穷多个,则称这种随机变量为离散型随机变量.容易知道,要掌握一个离散型随机变量X 的统计规律,必须且只须知道X 的所有可能取的值以及取每一个可能值的概率.设离散型随机变量X 所有可能的取值为x k (k =1,2,…),X 取各个可能值的概率,即事件{X =x k }的概率P {X =x k }=p k , k =1,2,… (2.2)我们称(2.2)式为离散型随机变量X 的概率分布或分布律.分布律也常用表格来表示(表2-1):表2-1由概率的性质容易推得,任一离散型随机变量的分布律{pk},都具有下述两个基本性质: 1°p k ≥0,k =1,2,…; (2.3) 2°11=∑∞=k kp. (2.4)反过来,任意一个具有以上两个性质的数列{Pk},一定可以作为某一个离散型随机变量的分布律.为了直观地表达分布律,我们还可以作类似图2-1的分布律图.图2-1图2-1中x i 处垂直于x 轴的线段高度为p i ,它表示X 取x i 的概率值.例2.1 设一汽车在开往目的地的道路上需通过4盏信号灯,每盏灯以0.6的概率允许汽车通过,以0.4的概率禁止汽车通过(设各盏信号灯的工作相互独立).以X 表示汽车首次停下时已经通过的信号灯盏数,求X 的分布律.解 以p 表示每盏灯禁止汽车通过的概率,显然X 的可能取值为0,1,2,3,4,易知X 的分布律为或写成P {X =k }=(1-p )p ,k =0,1,2,3.P {X=4}=(1-p )4.将p =0.4,1-p =0.6代入上式,所得结果如表2-3所示.下面介绍几种常见的离散型随机变量的概率分布: (1)两点分布若随机变量X 只可能取x 1与x 2两值,它的分布律是P {X =x 1}=1-p (0<p <1),P {X =x 2}=p ,则称X 服从参数为p 的两点分布.特别,当x 1=0,x 2=1时两点分布也叫(0-1)分布,记作X ~(0-1)分布.写成分布律表形式见表2-4.表2-4对于一个随机试验,若它的样本空间只包含两个元素,即Ω={e 1,e 2},我们总能在Ω上定义一个服从(0-1)分布的随机变量,,,1,0)(21e e e e e X X ==⎩⎨⎧==当当用它来描述这个试验结果.因此,两点分布可以作为描述试验只包含两个基本事件的数学模型.如,在打靶中“命中”与“不中”的概率分布;产品抽验中“合格品”与“不合格品”的概率分布等等.总之,一个随机试验如果我们只关心某事件A 出现与否,则可用一个服从(0-1)分布的随机变量来描述.(2)二项分布若随机变量X 的分布律为P {X =k }=k n C p k (1-p )n -k, k =0,1,…,n , (2.5)则称X 服从参数为n ,p 的二项分布(Binomial distribution ),记作X ~b (n ,p ).易知(2.5)满足(2.3)、(2.4)两式.事实上,P (X =k )≥0是显然的;再由二项展开式知n k n k nk k nn k p p p p k X P )]1([)1(C}{0-+=-==-==∑∑=1.我们知道,P {X =k }=kn k k n p p --)1(C 恰好是[p +(1-p )]n 二项展开式中出现p k 的那一项,这就是二项分布名称的由来.回忆n 重贝努里试验中事件A 出现k 次的概率计算公式P n (k )=k n C p k (1-p )n-k, k =0,1,…,n ,可知,若X ~b (n ,p ),X 就可以用来表示n 重贝努里试验中事件A 出现的次数.因此,二项分布可以作为描述n 重贝努里试验中事件A 出现次数的数学模型.比如,射手射击n 次中,“中的”次数的概率分布;随机抛掷硬币n 次,落地时出现“正面”次数的概率分布;从一批足够多的产品中任意抽取n 件,其中“废品”件数的概率分布等等.不难看出,(0-1)分布就是二项分布在n =1时的特殊情形,故(0-1)分布的分布律也可写成P {X =k }=p k q 1-k (k =0,1)(q =1-p ).例2.2 某大学的校乒乓球队与数学系乒乓球队举行对抗赛.校队的实力较系队为强,当一个校队运动员与一个系队运动员比赛时,校队运动员获胜的概率为0.6.现在校、系双方商量对抗赛的方式,提了三种方案: (1)双方各出3人;(2)双方各出5人;(3)双方各出7人.三种方案中均以比赛中得胜人数多的一方为胜利.问:对系队来说,哪一种方案有利?解 设系队得胜人数为X ,则在上述三种方案中,系队胜利的概率为(1) P {X ≥2}=kkk k -=∑3323)6.0()4.0(C ≈0.352;(2) P {X ≥3}=kkk k -=∑5535)6.0()4.0(C ≈0.317;(3) P {X ≥4}=kkk k -=∑7747)6.0()4.0(C ≈0.290.因此第一种方案对系队最为有利.这在直觉上是容易理解的,因为参赛人数越少,系队侥幸获胜的可能性也就越大.例2.3 某一大批产品的合格品率为98%,现随机地从这批产品中抽样20次,每次抽一个产品,问抽得的20个产品中恰好有k 个(k =1,2,…,20)为合格品的概率是多少?解 这是不放回抽样.由于这批产品的总数很大,而抽出的产品的数量相对于产品总数来说又很小,那么取出少许几件可以认为并不影响剩下部分的合格品率,因而可以当作放回抽样来处理,这样做会有一些误差,但误差不大.我们将抽检一个产品看其是否为合格品看成一次试验,显然,抽检20个产品就相当于做20次贝努里试验,以X 记20个产品中合格品的个数,那么X ~b (20,0.98),即P {X =k }=k k k -2020)02.0()98.0(C ,k =1,2,…,20. 若在上例中将参数20改为200或更大,显然此时直接计算该概率就显得相当麻烦.为此我们给出一个当n 很大而p (或1-p )很小时的近似计算公式.定理2.1(泊松(Poisson)定理) 设np n =λ(λ>0是一常数,n 是任意正整数),则对任意一固定的非负整数k ,有e lim (1)!k k k n knn n n C p p k λλ-→∞-=-.证 由p n =λ/n ,有().111121111!)1()(!)1()1(1C kn k kn k kn n kn k n n n n k n n k nn k k n n n p p ---⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛-⋅⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅=-+--=-λλλλλ对任意固定的k ,当n →∞时,11121111→⎥⎦⎤⎢⎣⎡⎪⎭⎫ ⎝⎛--⎪⎭⎫ ⎝⎛-⎪⎭⎫ ⎝⎛-⋅n k n n ,11,e 1→⎪⎭⎫ ⎝⎛-→⎪⎭⎫ ⎝⎛---kn n n λλλ故e lim (1).!k kk n knn n n C p p k λλ--→∞-=由于λ=np n 是常数,所以当n 很大时p n 必定很小,因此,上述定理表明当n 很大p 很小时,有以下近似公式,!e )1(C k p p k kn k k nλλ--≈- (2.6)其中λ=np .从表2-5可以直观地看出(2.6)式两端的近似程度.表2-5颇佳,而当n ≥100,np ≤10时效果更好.!e k k λλ-的值有表可查(见本书附表3)二项分布的泊松近似,常常被应用于研究稀有事件(即每次试验中事件A 出现的概率p 很小),当贝努里试验的次数n 很大时,事件A 发生的次数的分布.例2.4 某十字路口有大量汽车通过,假设每辆汽车在这里发生交通事故的概率为0.001,如果每天有5000辆汽车通过这个十字路口,求发生交通事故的汽车数不少于2的概率.解 设X 表示发生交通事故的汽车数,则X ~b (n,p ),此处n =5000,p =0.001,令λ=np =5, P {X ≥2}=1-P {X <2}=1-{}∑==1k k X P=1-(0.999)5000-5(0.999)4999≈1!e 50!e 51550----. 查表可得P {X ≥2}=1-0.00674-0.03369=0.95957.例2.5 某人进行射击,设每次射击的命中率为0.02,独立射击400次,试求至少击中两次的概率.解 将一次射击看成是一次试验.设击中次数为X ,则X ~b (400,0.02),即X 的分布律为P {X =k }=k 400C (0.02)k (0.98)400-k, k =0,1,…,400. 故所求概率为P {X ≥2}=1-p {X =0}-p {X =1}=1-(0.98)400-400(0.02)(0.98)399 =0.9972.这个概率很接近1,我们从两方面来讨论这一结果的实际意义.其一,虽然每次射击的命中率很小(为0.02),但如果射击400次,则击中目标至少两次是几乎可以肯定的.这一事实说明,一个事件尽管在一次试验中发生的概率很小,但只要试验次数很多,而且试验是独立地进行的,那么这一事件的发生几乎是肯定的.这也告诉人们决不能轻视小概率事件.其二,如果在400次射击中,击中目标的次数竟不到两次,由于P {X <2}≈0.003很小,根据实际推断原理,我们将怀疑“每次射击的命中率为0.02”这一假设,即认为该射手射击的命中率达不到0.02.(3)泊松分布若随机变量X 的分布律为P {X =k } =e !k k λλ-,k =0,1,2,…, (2.7)其中λ>0是常数,则称X 服从参数为λ的泊松分布(Poisson distribution ),记为X ~P (λ). 易知(2.7)满足(2.3)、(2.4)两式,事实上,P {X =k }≥0显然;再由∑∞=-0!e k k k λλ=e -λ²e λ=1,可知∑∞==0}{k k X P =1.由泊松定理可知,泊松分布可以作为描述大量试验中稀有事件出现的次数k =0,1,…的概率分布情况的一个数学模型.比如:大量产品中抽样检查时得到的不合格品数;一个集团中生日是元旦的人数;一页中印刷错误出现的数目;数字通讯中传输数字时发生误码的个数等等,都近似服从泊松分布.除此之外,理论与实践都说明,一般说来它也可作为下列随机变量的概率分布的数学模型:在任给一段固定的时间间隔内,① 由某块放射性物质放射出的α质点,到达某个计数器的质点数;② 某地区发生交通事故的次数;③ 来到某公共设施要求给予服务的顾客数(这里的公共设施的意义可以是极为广泛的,诸如售货员、机场跑道、电话交换台、医院等,在机场跑道的例子中,顾客可以相应地想象为飞机).泊松分布是概率论中一种很重要的分布.例2.6 由某商店过去的销售记录知道,某种商品每月的销售数可以用参数λ=5的泊松分布来描述.为了以95%以上的把握保证不脱销,问商店在月底至少应进某种商品多少件?解 设该商店每月销售这种商品数为X ,月底进货为a 件,则当X ≤a 时不脱销,故有P {X ≤a }≥0.95.由于X ~P (5),上式即为∑=-ak kk 05!5e ≥0.95. 查表可知∑=-95!5e k kk ≈0.9319<0.95, ∑=-105!10e k kk ≈0.9682>0.95 于是,这家商店只要在月底进货这种商品10件(假定上个月没有存货),就可以95%以上的把握保证这种商品在下个月不会脱销.下面我们就一般的离散型随机变量讨论其分布函数.设离散型随机变量X 的分布律如表2-1所示.由分布函数的定义可知F (x )=P {X ≤x }=∑∑≤≤==xx kxx kk k px X P }{,此处的∑≤xx k 和式表示对所有满足x k ≤x 的k 求和,形象地讲就是对那些满足x k ≤x 所对应的p k 的累加.例2.7 求例2.1中X 的分布函数F (x ). 解 由例2.1的分布律知 当x <0时,F (x )=P {X ≤x }=0;当0≤x <1时,F (x )=P {X ≤x }=P {X =0}=0.4;当1≤x <2时,F (x )=P {X ≤x }=P ({X =0}∪{X =1})=P {X =0}+P {X =1}=0.4+0.24=0.64; 当2≤x <3时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2})=P {X =0}+P {X =1}+P {X =2} =0.4+0.24+0.144 =0.784;当3≤x <4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3})=0.4+0.24+0.144+0.0864=0.8704;当x ≥4时F (x )=P {X ≤x }=P ({X =0}∪{X =1}∪{X =2}∪{X =3}∪{X =4}) =0.4+0.24+0.144+0.0864+0.1296=1.综上所述F (x )=P {X ≤x }=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤<≤<.4,1,43,8704.0,32,784.0,21,64.0,10,4.0,0,0x x x x x x F (x )的图形是一条阶梯状右连续曲线,在x =0,1,2,3,4处有跳跃,其跳跃高度分别为0.4,0.24,0.144,0.0864,0.1296,这条曲线从左至右依次从F (x )=0逐步升级到F (x )=1.对表2-1所示的一般的分布律,其分布函数F (x )表示一条阶梯状右连续曲线,在X =x k (k =1,2,…)处有跳跃,跳跃的高度恰为p k =P {X =x k },从左至右,由水平直线F (x )=0,分别按阶高p 1,p 2,…升至水平直线F (x )=1.以上是已知分布律求分布函数.反过来,若已知离散型随机变量X 的分布函数F (x ),则X 的分布律也可由分布函数所确定:p k =P {X =x k }=F (x k )-F (x k -0).第三节 连续型随机变量及其分布上一节我们研究了离散型随机变量,这类随机变量的特点是它的可能取值及其相对应的概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如,测量一个工件长度,因为在理论上说这个长度的值X 可以取区间(0,+∞)上的任何一个值.此外,连续型随机变量取某特定值的概率总是零(关于这点将在以后说明).例如,抽检一个工件其长度X丝毫不差刚好是其固定值(如 1.824cm )的事件{X =1.824}几乎是不可能的,应认为P{X =1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是,对于连续型随机变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子.例2.8 一个半径为2米的圆盘靶,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X 表示弹着点与圆心的距离,试求随机变量X 的分布函数.解 1°若x <0,因为事件{X ≤x }是不可能事件,所以F (x )=P {X ≤x }=0.2°若0≤x ≤2,由题意P {0≤X ≤x }=kx 2,k 是常数,为了确定k 的值,取x =2,有P {0≤X ≤2}=22k ,但事件{0≤X ≤2}是必然事件,故P {0≤X ≤2}=1,即22k =1,所以k =1/4,即P {0≤X ≤x }=x 2/4.于是F (x )=P {X ≤x }=P {X <0}+P {0≤X ≤x }= x 2/4.3°若x ≥2,由于{X ≤2}是必然事件,于是F (x )=P {X ≤x }=1.综上所述F (x )=⎪⎩⎪⎨⎧≥<≤<,2,1,20,41,0,02x x x x 它的图形是一条连续曲线如图2-2所示.图2-2另外,容易看到本例中X 的分布函数F (x )还可写成如下形式:F (x )=t t f xd )(⎰∞-,其中 f (t )=⎪⎩⎪⎨⎧<<.,0,20,21其他t t这就是说F (x )恰好是非负函数f (t )在区间(-∞,x ]上的积分,这种随机变量X 我们称为连续型随机变量.一般地有如下定义.定义2.3 若对随机变量X 的分布函数F (x ),存在非负函数f (x ),使对于任意实数x 有F (x )=⎰∞-xx t f d )(, (2.8)则称X 为连续型随机变量,其中f (x )称为X 的概率密度函数,简称概率密度或密度函数(Density function).由(2.8)式知道连续型随机变量X 的分布函数F (x )是连续函数.由分布函数的性质F (-∞)=0,F (+∞)=1及F (x )单调不减,知F (x )是一条位于直线y =0与y =1之间的单调不减的连续(但不一定光滑)曲线. 由定义2.3知道,f (x )具有以下性质:1°f (x )≥0;2°⎰+∞∞-x x f d )(=1;3°P {x 1<X ≤x 2}=F (x 2)-F (x 1)=⎰21d )(x x x x f (x 1≤x 2);4°若f (x )在x 点处连续,则有F ′(x )=f (x ).由2°知道,介于曲线y =f (x )与y =0之间的面积为1.由3°知道,X 落在区间(x 1,x 2]的概率P {x 1<X ≤x 2}等于区间(x 1,x 2]上曲线y =f (x )之下的曲边梯形面积.由4°知道,f (x )的连续点x 处有f (x )=.}{)()(lim lim00x x x X x P x x F x x F x x ∆∆+≤<=∆-∆+++→∆→∆这种形式恰与物理学中线密度定义相类似,这也正是为什么称f (x )为概率密度的原因.同样我们也指出,反过来,任一满足以上1°、2°两个性质的函数f (x ),一定可以作为某个连续型随机变量的密度函数.前面我们曾指出对连续型随机变量X 而言它取任一特定值a 的概率为零,即P {X =a }=0,事实上,令Δx >0,设X 的分布函数为F (x ),则由{X =a }⊂{a -Δx <X ≤a },得 0≤P {X =a }≤P {a -Δx <X ≤a }=F (a )-F (a -Δx ). 由于F (x )连续,所以)(lim 0x a F x ∆-→∆=F (a ).当Δx →0时,由夹逼定理得P {X =a }=0,由此很容易推导出P {a ≤X <b }=P {a <X ≤b }=P {a ≤X ≤b }=P {a <X <b }.即在计算连续型随机变量落在某区间上的概率时,可不必区分该区间端点的情况.此外还要说明的是,事件{X =a }“几乎不可能发生”,但并不保证绝不会发生,它是“零概率事件”而不是不可能事件.例2.9 设连续型随机变量X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x Ax x 试求:(1)系数A ;(2)X 落在区间(0.3,0.7)内的概率; (3)X 的密度函数.解 (1)由于X 为连续型随机变量,故F (x )是连续函数,因此有1=F (1)=20101lim lim)(Ax x F x x -→-→= =A ,即A =1,于是有F (x )=⎪⎩⎪⎨⎧≥<≤<.1,1,10,,0,02x x x x (2) P {0.3<X <0.7}=F (0.7)-F (0.3)=(0.7)2-(0.3)2=0.4; (3) X 的密度函数为f (x )=F ′(x )=⎩⎨⎧<≤.,0;10,2其他x x由定义2.3知,改变密度函数f (x )在个别点的函数值,不影响分布函数F (x )的取值,因此,并不在乎改变密度函数在个别点上的值(比如在x =0或x =1上f (x )的值).例2.10 设随机变量X 具有密度函数f (x )=⎪⎩⎪⎨⎧≤≤-<≤.,0,43,22,30,其他x x x kx (1) 确定常数k ;(2) 求X 的分布函数F (x );(3) 求P {1<X ≤72}. 解 (1)由⎰∞∞-x x f d )(=1,得x xx kx d )22(d 4330⎰⎰-+=1, 解得k =1/6,故X 的密度函数为f (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≤≤-<≤.,0,43,22,30,6其他x x x x(2) 当x <0时,F (x )=P {X ≤x }=⎰∞-xt t f d )( =0; 当0≤x <3时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰∞-+00d )(d )(xt t f t t f =12d 620x t t x=⎰;当3≤x <4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=0303()()()xf t dt f t dt f t dt -∞++⎰⎰⎰=233(2)23;624x t t x dt dt x +-=-+-⎰⎰当x ≥4时,F (x )=P {X ≤x }=⎰∞-xt t f d )(=⎰⎰⎰⎰∞-+++030434d )(d )(d )(d )(xt t f t t f t t f t t f=t tt t d )22(d 64330⎰⎰-+ =1.即F (x )=⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤-+-<≤<.4,1,43,324,30,12,0,022x x x x x x x(3) P {1<X ≤7/2}=F (7/2)-F (1)=41/48.下面介绍三种常见的连续型随机变量. (1)均匀分布若连续型随机变量X 具有概率密度f (x )=⎪⎩⎪⎨⎧<<-.,0,,1其他b x a ab (2.9)则称X 在区间(a ,b )上服从均匀分布(Uniform distribution ),记为X ~U (a ,b ).易知f (x )≥0且⎰⎰∞∞--=ba x ab x x f d 1d )(=1.由(2.9)可得 1°P {X ≥b }=⎰∞bx d 0 =0,P {X ≤a }=⎰∞-ax d 0=0,即 P {a <X <b }=1-P {X ≥b }-P {X ≤a }=1;2°若a ≤c <d ≤b ,则P {c <X <d }=ab c d x a b dc--=-⎰d 1. 因此,在区间(a ,b )上服从均匀分布的随机变量X 的物理意义是:X 以概率1在区间(a ,b )内取值,而以概率0在区间(a ,b )以外取值,并且X 值落入(a ,b )中任一子区间(c ,d )中的概率与子区间的长度成正比,而与子区间的位置无关. 由(2.8)易得X 的分布函数为F (x )=⎪⎩⎪⎨⎧≥<≤--<.,1,,,,0b x b x a a b ax a x (2.10) 密度函数f (x )和分布函数F (x )的图形分别如图2-3和图2-4所示.图2-3 图2-4在数值计算中,由于四舍五入,小数点后第一位小数所引起的误差X ,一般可以看作是一个服从在[-0.5,0.5]上的均匀分布的随机变量;又如在(a ,b )中随机掷质点,则该质点的坐标X 一般也可看作是一个服从在(a ,b )上的均匀分布的随机变量.例2.11 某公共汽车站从上午7时开始,每15分钟来一辆车,如某乘客到达此站的时间是7时到7时30分之间的均匀分布的随机变量,试求他等车少于5分钟的概率.解 设乘客于7时过X 分钟到达车站,由于X 在[0,30]上服从均匀分布,即有f (x )=⎪⎩⎪⎨⎧≤≤.,0,300,301其他x显然,只有乘客在7∶10到7∶15之间或7∶25到7∶30之间到达车站时,他(或她)等车的时间才少于5分钟,因此所求概率为 P {10<X ≤15}+P {25<X ≤30}=⎰⎰+15103025d 301d 301x x =1/3. (2)指数分布若随机变量X 的密度函数为f (x )=⎩⎨⎧≤>-.00,,0,e x x x λλ (2.11) 其中λ>0为常数,则称X 服从参数为λ的指数分布(Exponentially distribution ),记作X ~E (λ).显然f (x )≥0,且x x x f x d e d )(0⎰⎰∞∞-∞-=λλ=1.容易得到X 的分布函数为F (x )=⎩⎨⎧≤>--.00,,0,e 1x x x λ指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”,即对于任意s ,t >0,有P {X >s +t |X >s }=P {X >t }. (2.12)如果用X 表示某一元件的寿命,那么上式表明,在已知元件已使用了s 小时的条件下,它还能再使用至少t 小时的概率,与从开始使用时算起它至少能使用t 小时的概率相等.这就是说元件对它已使用过s 小时没有记忆.当然,指数分布描述的是无老化时的寿命分布,但“无老化”是不可能的,因而只是一种近似.对一些寿命长的元件,在初期阶段老化现象很小,在这一阶段,指数分布比较确切地描述了其寿命分布情况.(2.12)式是容易证明的.事实上,(){,}{}{}{}{}1()e e {}.1()es t t λs P X s X s t P X s t P X s t X s P X s P X s F s t P X t F s λλ-+->>+>+>+>==>>-+====>--(3)正态分布若连续型随机变量X 的概率密度为f (x )=222)(e π21σμσ--x , -∞<x <+∞, (2.13)其中μ,σ(σ>0)为常数,则称X 服从参数为μ,σ的正态分布(Normal distribution ),记为X ~N (μ,σ2).显然f (x )≥0,下面来证明⎰∞∞-x x f d )(=1.令σux -=t ,得到.d eπ21d e π2122)(222t x t x ⎰⎰∞∞--∞∞---=σμσ记I =t t d e22⎰∞∞--,则有I 2=⎰⎰∞∞-∞∞-+-ds d e222t s t .作极坐标变换:s =r cos θ,t =r sin θ,得到I 2=22π22r redrd πθ∞--∞=⎰⎰,而I >0,故有I,即有.π2d e 22=⎰∞∞--t t于是.1π2π21d e 21222)(=⋅=--∞∞-⎰x x σμσπ 正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从或近似服从正态分布.只要某一个随机变量受到许多相互独立随机因素的影响,而每个个别因素的影响都不能起决定性作用,那么就可以断定随机变量服从或近似服从正态分布.例如,因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响,但这些因素又不能对身高、体重起决定性作用,所以我们可以认为身高、体重服从或近似服从正态分布.参数μ,σ的意义将在第四章中说明.f (x )的图形如图2-5所示,它具有如下性质:图2-5 图2-61°曲线关于x =μ对称;2°曲线在x =μ处取到最大值,x 离μ越远,f (x )值越小.这表明对于同样长度的区间,当区间离μ越远,X 落在这个区间上的概率越小;3°曲线在μ±σ处有拐点; 4°曲线以x 轴为渐近线;5°若固定μ,当σ越小时图形越尖陡(图2-6),因而X 落在μ附近的概率越大;若固定σ,μ值改变,则图形沿x 轴平移,而不改变其形状.故称σ为精度参数,μ为位置参数. 由(2.13)式得X 的分布函数F (x )=t xt d eπ21-2)(22⎰∞--σμσ. (2.14)特别地,当μ=0,σ=1时,称X 服从标准正态分布N (0,1),其概率密度和分布函数分别用)(x ϕ,Φ(x )表示,即有22e π21)(x x -=ϕ, (2.15)Φ(x )=t x t d e π2122⎰∞--. (2.16) 易知,Φ(-x )=1-Φ(x ).人们已事先编制了Φ(x )的函数值表(见本书附录).一般地,若X ~N (μ,σ2),则有σμ-X ~N (0,1).事实上,Z =σμ-X 的分布函数为 P {Z ≤x }=}{x X P ≤-σμ=P {X ≤μ+σx }=t t xd e π21222)(σμσμσ--+∞-⎰,令σμ-t =s ,得P {Z ≤x }=s xs d e π2122⎰∞--=Φ(x ),由此知Z =σμ-X ~N (0,1).因此,若X ~N (μ,σ2),则可利用标准正态分布函数Φ(x ),通过查表求得X 落在任一区间(x 1,x 2]内的概率,即P {x 1<X ≤x 2}=⎭⎬⎫⎩⎨⎧-≤-<-σμσμσμ21x X x P=⎭⎬⎫⎩⎨⎧-≤--⎭⎬⎫⎩⎨⎧-≤-σμσμσμσμ12x X P x X P =⎪⎭⎫⎝⎛-Φ-⎪⎭⎫⎝⎛-Φσμσμ12x x .例如,设X ~N (1.5,4),可得P {-1≤X ≤2}=⎭⎬⎫⎩⎨⎧-≤-≤--25.1225.125.11X P =Φ(0.25)-Φ(-1.25)=Φ(0.25)-[1-Φ(1.25)]=0.5987-1+0.8944=0.4931.设X ~N (μ,σ2),由Φ(x )函数表可得P {μ-σ<X <μ+σ}=Φ(1)-Φ(-1)=2Φ(1)-1=0.6826,P {μ-2σ<X <μ+2σ}=Φ(2)-Φ(-2)=0.9544, P {μ-3σ<X <μ+3σ}=Φ(3)-Φ(-3)=0.9974.我们看到,尽管正态变量的取值范围是(-∞,∞),但它的值落在(μ-3σ,μ+3σ)内几乎是肯定的事,因此在实际问题中,基本上可以认为有|X -μ|<3σ.这就是人们所说的“3σ原则”.例2.12 公共汽车车门的高度是按成年男子与车门顶碰头的机会在1%以下来设计的.设男子身高X 服从μ=170(cm),σ=6(cm)的正态分布,即X ~N (170,62),问车门高度应如何确定?解 设车门高度为h (cm),按设计要求P {X ≥h }≤0.01或P {X <h }≥0.99,因为X ~N (170,62),故P {X <h }=⎪⎭⎫⎝⎛-Φ=⎭⎬⎫⎩⎨⎧-<-617061706170h h X P ≥0.99, 查表得 Φ(2.33)=0.9901>0.99.故取6170-h =2.33,即h =184.设计车门高度为184(cm )时,可使成年男子与车门碰头的机会不超过1%.例2.13 测量到某一目标的距离时发生的随机误差X (单位:米)具有密度函数f (x )=3200)20(2eπ2401--x .试求在三次测量中至少有一次误差的绝对值不超过30米的概率.解 X 的密度函数为f (x )=22402)20(3200)20(eπ2401eπ2401⨯----⨯=x x ,即X ~N (20,402),故一次测量中随机误差的绝对值不超过30米的概率为P {|X |≤30}=P {-30≤X ≤30}=⎪⎭⎫⎝⎛--Φ-⎪⎭⎫⎝⎛-Φ402030402030=Φ(0.25)-Φ(-1.25)=0.5981-(1-0.8944)=0.4931.设Y 为三次测量中误差的绝对值不超过30米的次数,则Y 服从二项分布b (3,0.4931),故P {Y ≥1}=1-P {Y =0}=1-(0.5069)3=0.8698.为了便于今后应用,对于标准正态变量,我们引入了α分位点的定义. 设X ~N (0,1),若z α满足条件P {X >z α}=α,0<α<1, (2.17)则称点z α为标准正态分布的上α分位点,例如,由查表可得z 0.05=1.645,z 0.001=3.16.故1.645与3.16分别是标准正态分布的上0.05分位点与上0.001分位点.第四节 随机变量函数的分布我们常常遇到一些随机变量,它们的分布往往难于直接得到(如测量轴承滚珠体积值Y 等),但是与它们有函数关系的另一些随机变量,其分布却是容易知道的(如滚珠直径测量值X ).因此,要研究随机变量之间的函数关系,从而通过这种关系由已知的随机变量的分布求出与其有函数关系的另一个随机变量的分布.例2.14 设随机变量X 具有表2-6所示的分布律,试求X 2的分布律.表2-6“X 2=2.25”,“X 2=9”等价,所以P {X 2=0}=P {X =0}=0.1, P {X 2=2.25}=P {X =1.5}=0.3, P {X 2=9}=P {X=3}=0.1.事件“X 2=1”是两个互斥事件“X =-1”及“X =1”的和,其概率为这两事件概率和,即P {X 2=1}=P {X =-1}+P {X =+1}=0.2+0.3=0.5.于是得X 2的分布律如表2-7所示.表2-7 例2.15 设连续型随机变量X 具有概率密度f X (x ),-∞<x <+∞,求Y =g (X )=X 的概率密度.解 先求Y 的分布函数F Y (y ),由于Y =g (X )=X 2≥0,故当y ≤0时事件“Y ≤y ”的概率为0,即F Y (y )=P {Y ≤y }=0,当y >0时,有F Y (y )=P {Y ≤y }=P {X 2≤y }=P {-y ≤X ≤y }=x x f yyX d )(⎰-.将F Y (y )关于y 求导,即得Y 的概率密度为f Y (y )=()()[]⎪⎩⎪⎨⎧≤>-+.0,0,0,21y y y f y f yXX例如,当X ~N (0,1),其概率密度为(2.15)式,则Y =X 2的概率密度为f Y (y )=⎪⎩⎪⎨⎧≤>--.0,0,0,e π21221y y y y此时称Y 服从自由度为1的χ2分布.上例中关键的一步在于将事件“Y ≤y ”由其等价事件“-y ≤X ≤y ”代替,即将事件“Y ≤y ”转换为有关X 的范围所表示的等价事件,下面我们仅对Y =g (X ),其中g (x )为严格单调函数,写出一般结论.定理2.2 设随机变量X 具有概率密度f X (x ),-∞<x <+∞,又设函数g (x )处处可导且g ′(x )>0(或g ′(x )<0),则Y =g (X )是连续型随机变量,其概率密度为f Y (y )=⎩⎨⎧<<'.,0,)()]([其他βαx y h y h f X (2.18)其中α=min (g (-∞),g (+∞)),β=max (g (-∞),g (+∞)),h (y )是g (x )的反函数.我们只证g ′(x )>0的情况.由于g ′(x )>0,故g (x )在(-∞,+∞)上严格单调递增,它的反函数h (y )存在,且在(α,β)严格单调递增且可导.我们先求Y 的分布函数F Y (y ),并通过对F Y (y )求导求出f Y (y ).由于Y =g (X )在(α,β)上取值,故 当y ≤α时,F Y (y )=P {Y ≤y }=0; 当y ≥β时,F Y (y )=P {Y ≤y }=1; 当α<y <β时,F Y (y )=P {Y ≤y }=P {g (X )≤y }=P {X ≤h (y )}=⎰∞-)(d )(x h X x x f .于是得概率密度f Y (y )=[()](),,0,X f h y h y x .αβ'<<⎧⎨⎩其他对于g ′(x )<0的情况可以同样证明,即f Y (y )=[()][()],,0,fX h y h y x .αβ'<<⎧⎨⎩其他将上面两种情况合并得f Y (y )=(())(),,0,fX h y h y x .αβ'⎧<<⎨⎩其他注:若f (x )在[a ,b ]之外为零,则只需假设在(a ,b )上恒有g ′(x )>0(或恒有g ′(x )<0),此时α=min{g (a ),g (b )},β=max{g (a ),g (b )}.例2.16 设随机变量X ~N (μ,σ2).试证明X 的线性函数Y =aX +b (a ≠0)也服从正态分布.证 设X 的概率密度f X (x )=,21222)(σμ--x e π-∞<x <+∞.再令y =g (x )=ax +b ,得g (x )的反函数x =h (y )=y ba-. 所以h ′(y )=1/a .由(2.18)式Y =g (X )=aX +b 的概率密度为f Y (y )=⎪⎭⎫ ⎝⎛-a b y f a X 1, -∞<y <+∞, 即。