数理统计作业二--用数学实验的方法验证大数定理和中心极限定理(精编文档).doc
- 格式:doc
- 大小:249.00 KB
- 文档页数:6
中心极限定理与大数定律介绍中心极限定理(Central Limit Theorem)和大数定律(Law of Large Numbers)是概率论中两个重要而基础的定理。
它们在统计学和各个领域的实际应用中起着至关重要的作用。
本文将深入探讨这两个定理的概念、应用和相关证明。
中心极限定理定义中心极限定理是概率论中的一个重要定理,它说明了在特定条件下,一组随机变量的均值的分布会趋近于正态分布。
具体来说,对于任意独立同分布的随机变量的和,当样本容量足够大时,其均值的分布将会接近于正态分布。
证明中心极限定理的证明可以通过多种方法进行推导,其中最为经典的方法是使用特征函数的技巧。
通过对特征函数的逐步展开和极限取证,可以得出中心极限定理的结论。
应用中心极限定理在实际应用中有着广泛的应用。
以下是中心极限定理的几个重要应用:1.抽样分布的近似计算:通过中心极限定理,可以对抽样分布进行近似计算,从而推断总体参数。
2.假设检验:在统计学中,中心极限定理广泛应用于假设检验问题中。
通过对样本均值进行正态分布近似,可以进行对总体均值的假设检验。
3.建立置信区间:中心极限定理可用于建立置信区间。
通过计算样本均值的区间估计,确定总体均值的信心水平。
大数定律定义大数定律是概率论中的另一个重要定理,它说明了当独立同分布的随机变量重复进行实验时,其平均值会收敛于数学期望。
换句话说,随着实验次数的增加,样本均值会趋近于总体均值。
证明大数定律的证明有多种方法,其中最为著名的是切比雪夫不等式和辛钦大数定律。
不同的证明方法都有其特点和适用范围,但最终都能得出大数定律的结论。
应用大数定律在实际应用中也有着广泛的应用。
以下是大数定律的几个重要应用:1.统计估计:大数定律可用于建立统计估计方法,如最大似然估计和矩估计。
2.贝叶斯推断:大数定律在贝叶斯推断中起着重要的作用。
通过重复实验,可以逐渐更新对参数的先验分布,得到后验分布。
3.经济学和金融学:大数定律在经济学和金融学中有广泛的应用。
中心极限定理证明一、例子高尔顿钉板试验.图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布.如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理.二、中心极限定理设是独立随机变量序列,假设存在,若对于任意的,成立称服从中心极限定理.设服从中心极限定理,则服从中心极限定理,其中为数列.解:服从中心极限定理,则表明其中.由于,因此故服从中心极限定理.三、德莫佛-拉普拉斯中心极限定理在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则用频率估计概率时的误差估计.由德莫佛—拉普拉斯极限定理,由此即得第一类问题是已知,求,这只需查表即可.第二类问题是已知,要使不小于某定值,应至少做多少次试验?这时利用求出最小的.第三类问题是已知,求.解法如下:先找,使得.那么,即.若未知,则利用,可得如下估计:.抛掷一枚均匀的骰子,为了至少有0.95的把握使出现六点的概率与之差不超过0.01,问需要抛掷多少次?解:由例4中的第二类问题的结论,.即.查表得.将代入,便得.由此可见,利用比利用契比晓夫不等式要准确得多.已知在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则服从二项分布:的随机变量.求.解:因为很大,于是所以利用标准正态分布表,就可以求出的值.某单位内部有260架电话分机,每个分机有0.04的时间要用外线通话,可以认为各个电话分机用不用外线是是相互独立的,问总机要备有多少条外线才能以0.95的把握保证各个分机在使用外线时不必等候.解:以表示第个分机用不用外线,若使用,则令;否则令.则.如果260架电话分机同时要求使用外线的分机数为,显然有.由题意得,查表得,,故取.于是取最接近的整数,所以总机至少有16条外线,才能有0.95以上的把握保证各个分机在使用外线时不必等候.根据孟德尔遗传理论,红黄两种番茄杂交第二代结红果植株和结黄果植株的比率为3:1,现在种植杂交种400株,试求结黄果植株介于83和117之间的概率.解:将观察一株杂交种的果实颜色看作是一次试验,并假定各次试验是独立的.在400株杂交种中结黄果的株数记为,则.由德莫佛—拉普拉斯极限定理,有其中,即有四、林德贝格-勒维中心极限定理若是独立同分布的随机变量序列,假设,则有证明:设的特征函数为,则的特征函数为又因为,所以于是特征函数的展开式从而对任意固定的,有而是分布的特征函数.因此,成立.在数值计算时,数用一定位的小数来近似,误差.设是用四舍五入法得到的小数点后五位的数,这时相应的误差可以看作是上的均匀分布.设有个数,它们的近似数分别是,.,.令用代替的误差总和.由林德贝格——勒维定理,以,上式右端为0.997,即以0.997的概率有设为独立同分布的随机变量序列,且互相独立,其中,证明:的分布函数弱收敛于.证明:为独立同分布的随机变量序列,且互相独立,所以仍是独立同分布的随机变量序列,易知有由林德贝格——勒维中心极限定理,知的分布函数弱收敛于,结论得证.作业:p222ex32,33,34,35五、林德贝尔格条件设为独立随机变量序列,又令,对于标准化了的独立随机变量和的分布当时,是否会收敛于分布?除以外,其余的均恒等于零,于是.这时就是的分布函数.如果不是正态分布,那么取极限后,分布的极限也就不会是正态分布了.因而,为了使得成立,还应该对随机变量序列加上一些条件.从例题中看出,除以外,其余的均恒等于零,在和式中,只有一项是起突出作用.由此认为,在一般情形下,要使得收敛于分布,在的所有加项中不应该有这种起突出作用的加项.因为考虑加项个数的情况,也就意味着它们都要“均匀地斜.设是独立随机变量序列,又,,这时(1)若是连续型随机变量,密度函数为,如果对任意的,有(2)若是离散型随机变量,的分布列为如果对于任意的,有则称满足林德贝尔格条件.以连续型情形为例,验证:林德贝尔格条件保证每个加项是“均匀地斜.证明:令,则于是从而对任意的,若林德贝尔格条件成立,就有这个关系式表明,的每一个加项中最大的项大于的概率要小于零,这就意味着所有加项是“均匀地斜.六、费勒条件设是独立随机变量序列,又,,称条件为费勒条件.林德贝尔格证明了林德贝尔格条件是中心极限定理成立的充分条件,但不是必要条件.费勒指出若费勒条件得到满足,则林德贝尔格条件也是中心极限定理成立的必要条件.七、林德贝尔格-费勒中心极限定理引理1对及任意的,证明:记,设,由于因此,,其次,对,用归纳法即得.由于,因此,对也成立.引理2对于任意满足及的复数,有证明:显然因此,由归纳法可证结论成立.引理3若是特征函数,则也是特征函数,特别地证明定义随机变量其中相互独立,均有特征函数,服从参数的普哇松分布,且与诸独立,不难验证的特征函数为,由特征函数的性质即知成立.林德贝尔格-费勒定理定理设为独立随机变量序列,又.令,则(1)与费勒条件成立的充要条件是林德贝尔格条件成立.证明:(1)准备部分记(2)显然(3)(4)以及分别表示的特征函数与分布函数,表示的分布函数,那么(5)这时因此林德贝尔格条件化为:对任意,(6)现在开始证明定理.设是任意固定的实数.为证(1)式必须证明(7)先证明,在费勒条件成立的假定下,(7)与下式是等价的:(8)事实上,由(3)知,又因为故对一切,把在原点附近展开,得到因若费勒条件成立,则对任意的,只要充分大,均有(9)这时(10)对任意的,只要充分小,就可以有(11)因此,由引理3,引理2及(10),(11),只要充分大,就有(12)因为可以任意小,故左边趋于0,因此,证得(7)与(8)的等价性.(2)充分性先证由林德贝尔格条件可以推出费勒条件.事实上,(13)右边与无关,而且可选得任意小;对选定的,由林德贝尔格条件(6)知道第二式当足够大时,也可以任意地小,这样,费勒条件成立.其次证明林德贝尔格条件能保证(1)式成立.注意到(3)及(4),可知,当时,当时,因此(14)对任给的,由于的任意性,可选得使,对选定的,用林德贝尔格条件知只要充分大,也可使.因此,已证得了(8),但由于已证过费勒条件成立,这时(8)与(7)是等价的,因而(7)也成立.(3)必要性由于(1)成立,因此相应的特征函数应满足(7).但在费勒条件成立时,这又推出了(8),因此,(15)上述被积函数的实部非负,故而且(16)因为对任意的,可找到,使,这时由(15),(16)可得故林德贝尔格条件成立.八、李雅普诺夫定理设为独立随机变量序列,又.令,若存在,使有则对于任意的,有一,大数定律的证明二,中心极限定理的证明§5.3中心极限定理我们曾特别强调了正态分布在概率论与数理统计中的地位与作用.为什么客观实际中许多随机变量服从正态分布?是经验猜测还是确有科学的理论依据,下面我们就来解释这一问题.我们已经知道,炮弹的弹着点射击误差服从正态分布,我们来分析其原因.要知道误差是什么样的随机变量,有必要研究一下造成误差的原因是什么?每次射击后,炮弹会因为震动而造成很微小的偏差x1,炮弹外形细小的差别而引起空气阻力不同而出现的误差x2,炮弹前进时遇到的空气流的微小扰动而造成的误差x3,……等等,有许多原因,每种原因引起一个微小的误差都是随机的,而弹着点的总误差x 是许多随机误差的总和,即x=?xk,而且xk之间可以看成是相互独立的,因此要讨论x的分布就要讨论这些相互独k立的随机变量之和的分布.在概率论中,我们把研究在一定条件下,大量独立随机变量和的极限分布是正态分布的那些定理通常叫做中心极限定理.本节只介绍两个条件简单,也较常用的中心极限定理.定理4(同分布中心极限定理)设随机变量x1,x2,…,xn…相互独立,服从同一分布,且具有有限的数学期望和方差,e(xk)=?,d(xk)=(k=1,2,…)则随机变量2?xk-n?k=1n的分布函数对任意的x,满足n??nxk-n?k=1?n?x1?2??e-?xt22dt中心极限定理及其应用【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
大数定理与中心极限定理(优选)word资料n , X ,相互独立且具有相同的数学期望和方2,( i 1, 2,)= 个随机变量的算术平均数ni 11X , i n ==∑X 对于任意正数i X |}με-<充分大时,算术平均数必然)独立 ,则 22-1}e dt 2t xπ-∞=⎰)具有怎样的分布,n X +=()50,()i i E X D X ==()50,()25n n E Y n D Y ∴== 由中心极限定理,有(5000)n Y ≤)之和,即,(k p D X =3得n lim P →∞⎧⎪⎨⎪⎩第五章 大数定律与中心极限定理 §5.1 大数定律的概念大数定律以确切的数学形式表达了这种规律性,并论证了它成立的条件,即从理论上阐述了这种大量的、在一定条件下、重复的随机现象呈现的规律性即稳定性。
由于大数定律的作用,大量的随机因素的总体作用必然导致某种不依赖于个别随机事件的结果。
§5.2 切比雪夫不等式§5.2 切比雪夫定理 1、切比雪夫不等式设随机变量X 具有数学期望()E X μ=,方差2()D X σ=,对于任意正数ε有22{}P X σμεε-≥≤成立,这一不等式称为切比雪夫不等式。
它也可以写成22{}1P X σμεε-<≥-。
切比雪夫不等式的意义在于:当知道随机变量X 的数学期望和方差时,我们可以估计X 落在以μ为中心的某一区间内的概率;而且由不等式可以看出,方差2σ越小,{}X με-≥发生的概率也越小。
切比雪夫不等式在理论研究中很有价值,作为一种出略的估计概率的方法在实际中应用也很广泛。
2、依概率收敛 设12,,,,n X X X 是一个随机变量序列,a 是一个常数。
若对任意的正数ε,有lim {}1n n P X a ε→∞-<=,则称序列12,,,,n X X X 依概率收敛于a ,记为pn X a →。
3、切比雪夫大数定律 设12,,,,n X X X 是相互独立的随机变量序列,且2(),(),1,2,i i i E X D X i μσ===存在有限的常数C ,使得2i C σ≤,则对任何的正数ε,皆有1111lim {()}1n ni i n i i P X E X n n ε→∞==-<=∑∑。
大数定律和中心极限定理的证明及应用大数定律和中心极限定理是概率论中的两个重要定理,它们在实际应用中具有重要的作用。
随着21世纪的到来,计算机科学的发展和人工智能技术的不断突破,这些定理在数据分析、机器学习等领域中的应用也越来越广泛。
大数定律是概率论中的一条非常重要的定理,它描述了重复实验的结果会越来越接近于总体的平均值。
具体而言,如果我们对某个随机事件进行了N次实验,并对N个数据点求平均值,那么这个平均值在N变得越来越大时,会趋近于总体的期望值。
在实际中,大数定律可以用于各种数字数据的分析。
例如,我们可以在股市交易中使用大数定律,以预测股市的长期结果。
我们可以通过对每天的股票价格进行记录并验证大数定律是否成立,从而得到预测指数。
另外,在物理学中,大数定律也有重要的应用。
例如,我们可以使用大数定律来确定大量粒子的平均位置。
这种方法可以在许多物理领域中找到应用,如计算电磁场的平均值。
大数定律的证明比较复杂。
一种常用的证明方法是通过上极限和下极限来证明。
上极限和下极限分别代表了随着实验次数增加,平均值逐渐趋向于总体期望值的上限和下限。
根据大数定律的规定,这两个极限应该相等。
证明的核心是要建立一个独立的同分布序列,通过样本与总体一致性的性质,尽可能接近于总体。
中心极限定理是另一个与大数定律相关联的概率论定理。
它描述了当N次独立实验的结果之和趋近于一个标准正态分布时,经过N次标准化后的分布会趋向于一个正态分布。
中心极限定理在实际中的应用非常广泛。
例如,在医学研究中,我们可以使用中心极限定理来估计医疗样本的均值和标准偏差。
我们还可以使用该定理来评估航空公司的航班订购量。
通过使用中心极限定理来计算航班预订量的分布,我们就可以确定需要多少飞机来完成航班任务。
与大数定律的证明相比,中心极限定理的证明相对简单。
它使用了矩母函数和生成函数等概率论方法,通过对傅里叶变换的应用,将一些信息从时域转移到了频域,实现了由多个随机事件的组合到高斯分布的转化。
第 5 章 大数定律与中心极限定理一、填空题:1.设随机变量μξ=)(E ,方差2σξ=)(D ,则由切比雪夫不等式有≤≥-}|{|σμξ3P 91 . 2.设nξξξ,,, 21是n 个相互独立同分布的随机变量,),,,(,)(,)(n i D E i i 218===ξμξ对于∑==ni in1ξξ,写出所满足的切彼雪夫不等式 228εεξεμξn D P =≤≥-)(}|{| ,并估计≥<-}|{|4μξP n 211- . 3. 设随机变量129,,,X X X 相互独立且同分布, 而且有1i EX =,1(1,2,,9)i DX i == , 令91i i X X ==∑, 则对任意给定的0ε>, 由切比雪夫不等式直接可得{}≥<-ε9X P 291ε-. 解:切比雪夫不等式指出:如果随机变量X 满足:()E X μ=与2()D X σ=都存在, 则对任意给定的0ε>, 有22{||}P X σμεε-≥≤, 或者22{||}1.P X σμεε-<≥-由于随机变量129,,,X X X 相互独立且同分布, 而且有 1,1(1,2,9),i i EX DX i === 所以999111()()19,i i i i i E X E X E X μ===⎛⎫===== ⎪⎝⎭∑∑∑9992111()()19.i i i i i D X D X D X σ===⎛⎫===== ⎪⎝⎭∑∑∑4. 设随机变量X 满足:2(),()E X D X μσ==, 则由切比雪夫不等式, 有{||4}P X μσ-≥ 116≤. 解:切比雪夫不等式为:设随机变量X 满足2(),()E X D X μσ==, 则对任意的0ε>, 有22{||}.P X σμεε-≥≤由此得 221{||4}.(4)16P X σμσσ-≥≤=5、设随机变量2σξμξξ==)(,)(,D E ,则≥<-}|{|σμξ2P 43.6、设n ξξξ,,, 21为相互独立的随机变量序列,且),,( 21=i i ξ服从参数为λ的泊松分布,则≤-∑=∞→}{lim x n n P ni in λλξ1⎰∞--xt dt e22 .7、设n η表示n 次独立重复试验中事件A 出现的次数,p 是事件A 在每次试验中出现的概率,则≈≤<}{b a P n η⎰-----)1()1(2221p np np b p np np a t dt e π.8. 设随机变量n ξ, 服从二项分布(,)B n p , 其中01,1,2,p n <<= , 那么, 对于任 一实数x , 有lim {|||}n n P np x ξ→+∞-<= 0 .9. 设12,,,n X X X 为随机变量序列,a 为常数, 则{}n X 依概率收敛于a 是指 {}=<->∀+∞>-εεa X P n n lim ,0 1 ,或{}=≥->∀+∞>-εεa X P n n lim ,0 0 。
大数定理与中心极限定理的应用大数定理和中心极限定理是概率论中最基本也是最重要的两个定理。
它们是求解随机事件的概率分布和预测随机现象的变化趋势的基础。
本文将介绍大数定理和中心极限定理的定义、证明以及应用。
一、大数定理大数定理是概率论中的一个重要原理,描述了随机变量序列平均数的性质。
大数定理表明,随着样本数量逐渐增加,随机变量序列平均数越来越接近随机变量的期望值。
具体来说,如果 $X1,X2, ..., Xn$ 是独立同分布的随机变量,其期望为 $E(X)$,则样本平均数的极限为 $E(X)$,即:$$\lim_{n\to\infty} \frac{X_1+X_2+...+X_n}{n} = E(X)$$大数定理的证明比较复杂,这里不再深入探讨。
但需要注意的是,大数定理只是对随机变量序列平均数的渐近表现进行的描述。
在实际应用中,仍然需要考虑样本数量、样本大小、采样方法等因素带来的误差。
大数定理的应用十分广泛,常见的例子包括赌场游戏、信用评级等。
以赌场游戏为例,假设一家赌场每次赌客可以下注 $1$ 美元,赢得的概率为 $p$。
根据赌场规则,获胜的赌客可以得到$2$ 美元的回报,输掉的赌客则失去所下的 $1$ 美元。
赌场的利润取决于获胜和失败的比例。
利润越高,赌场的经营者就越富有。
而大数定理在此处的应用则在于,当赌客的数量越来越多时,赌场的经营者能够准确预测赌客赢得和输掉的比例,从而达到通过调整赔率保证赌场利润最大的目的。
二、中心极限定理中心极限定理是概率论中的另一个重要概念。
它表明当样本数量增加时样本平均数的分布越来越接近正态分布。
正态分布是概率分布中最常见也最重要的一种分布。
由于中心极限定理具有一定的普适性,因此它在实际应用中十分重要。
中心极限定理的数学表达式为:$$\lim_{n\to\infty} P(\frac{X_1+X_2+...+X_n}{n} \leq x) =\frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-t^2/2}dt$$其中 $X_1,X_2,...,X_n$ 是独立同分布的随机变量,并且有$E(X_1^2)<\infty$,$\mu=E(X_1),\sigma^2=Var(X_1)$,则样本平均数满足:$$\frac{\frac{X_1+X_2+...+X_n}{n} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)$$其中 $N(0,1)$ 表示标准正态分布。
大数定律和中心极限定理大数定律(Law of Large Numbers)是概率论中的一个重要定理,它揭示了在一系列独立随机事件中,随着样本量的增大,样本均值将趋于总体均值的规律。
中心极限定理(Central Limit Theorem)则是统计学中的一项基本定理,它说明了在大样本条件下,一组独立随机变量的和具有近似正态分布的特性。
两个定理在统计分析和推断中都起到了重要作用。
大数定律(Law of Large Numbers)大数定律是概率论中的一个基础定理,它描述了独立随机事件的平均值在大样本条件下会无限接近于事件的真实概率。
根据大数定律,当独立随机事件重复进行时,样本均值将逐渐接近总体均值。
大数定律有两种形式:辛钦大数定律和伯努利大数定律。
辛钦大数定律是指当随机变量的期望存在时,样本均值以概率1收敛于期望值。
也就是说,无论一个事件发生的可能性有多小,只要重复进行足够多的实验,该事件发生的频率将无限接近于其概率。
伯努利大数定律是针对二项分布的情况,它说明了在一系列独立重复的二项试验中,随着试验次数的增加,事件发生的频率将逐渐接近于事件的概率。
大数定律在实际应用中有着广泛的作用。
例如,投资者根据历史数据计算股票收益率的期望,大数定律告诉我们当样本容量足够大时,计算得到的样本均值将逼近真实的期望收益率,从而提供了对未来股票表现的一定参考。
中心极限定理(Central Limit Theorem)中心极限定理是统计学中的一项基本定理,它指出在大样本条件下,一组独立随机变量的和具有近似正态分布的特性。
中心极限定理是统计学中推断的基础,它的重要性在于它使得我们可以利用正态分布的性质进行概率和置信区间的计算。
中心极限定理的表述可以分为两种形式:李雅普诺夫型和林德伯格-李维定理。
李雅普诺夫型定理给出了随机变量和的分布函数收敛到正态分布的条件,其中随机变量可以不是独立同分布的。
林德伯格-李维定理则是对独立同分布随机变量和的和近似服从正态分布的定理。
第四节 大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.教学目标:了解大数定理与中心极限定理。
教学重点:大数定理与中心定理。
教学难点:中心定理。
教学内容:一、依概率收敛与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性.定义1 设 ,,,,21n X X X 是一个随机变量序列, a 为一个常数,若对于任意给定的正数ε,有 ,1}|{|lim =<-∞→εa X P n n 则称序列 ,,,,21n X X X 依概率收敛于a , 记为).(∞→−→−n a X Pn定理1 设,,b Y a X Pn P n −→−−→−又设函数),(y x g 在点),(b a 连续, 则),(),(b a g Y X g Pn n −→−.二、切比雪夫不等式定理2设随机变量X 有期望μ=)(X E 和方差2)(σ=X D ,则对于任给0>ε, 有22}|{|εσεμ≤≥-X P .上述不等式称切比雪夫不等式.注:(i) 由切比雪夫不等式可以看出,若2σ越小, 则事件}|)({|ε<-X E X的概率越大, 即, 随机变量X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度.(ii) 当方差已知时,切比雪夫不等式给出了X 与它的期望的偏差不小于ε的概率的估计式.如取,3σε= 则有.111.09}3|)({|22≈≤≥-σσσX E X P故对任给的分布,只要期望和方差2σ存在, 则随机变量X 取值偏离)(X E 超过σ3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3 (切比雪夫大数定律)设 ,,,,21n X X X 是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即,,2,1,)( =≤i K X D i 则对任意0>ε, 有1)(11lim 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-∑∑==∞→εn i i n i i n X E n X n P 注: 定理表明: 当n 很大时,随机变量序列}{n X 的算术平均值∑=ni i X n 11依概率收敛于其数学期望∑=ni i X E n 1)(1.2.伯努利大数定理定理4 (伯努利大数定律)设A n 是n 重伯努利试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率, 则对任意的0>ε, 有1lim =⎭⎬⎫⎩⎨⎧<-→∞εp n n P A n 或 0l i m =⎭⎬⎫⎩⎨⎧≥-→∞εp n n P A n . 注:(i) 伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n 充分大时, 事件A 发生的频率nn A依概率收敛于事件A 发生的概率p .定理以严格的数学形式表达了频率的稳定性. 在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii) 如果事件A 的概率很小,则由伯努利大数定律知事件A 发生的频率也是很小的,或者说事件A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛. 但应注意到,小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生.3.辛钦大数定理 定理5 (辛钦大数定律) 设随机变量 ,,,,21n X X X 相互独立, 服从同一分布,且具有数学期望,,2,1,)( ==i X E i μ 则对任意0>ε, 有11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P . 注: (i) 定理不要求随机变量的方差存在;(ii) 伯努利大数定律是辛钦大数定律的特殊情况;(iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n 块,计算其平均亩产量, 则当n 较大时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式, 但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE Bδδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1(讲义例1)在每次试验中, 事件A发生的概率为0.75, 利用切比雪夫不等式求: 事件A出现的频率在0.74~0.76之间的概率至少为0.90?中心极限定理例2(讲义例2) 一盒同型号螺丝钉共有100个,已知该型号的螺丝钉的重量是一个随机变量,期望值是100g标准差是10g, 一盒螺丝钉的重量超过10.2kg的概率.例3 (讲义例3)计算机在进行数学计算时,遵从四舍五入原则。
第五章 大数定律与中心极限定理第一节 大数定律在第一章中我们已经指出,人们经过长期实践认识到,虽然个别随机事件在某次试验中可能发生也可能不发生,但是在大量重复试验中却呈现明显的规律性,即随着试验次数的增大,一个随机事件发生的频率在某一固定值附近摆动.这就是所谓的频率具有稳定性.同时,人们通过实践发现大量测量值的算术平均值也具有稳定性.而这些稳定性如何从理论上给以证明就是本节介绍的大数定律所要回答的问题.在引入大数定律之前,我们先证一个重要的不等式——契比雪夫(Chebyshev )不等式. 设随机变量X 存在有限方差D (X ),则有对任意ε>0,P {|X -E (X )|≥ε}≤2)(εX D . (5.1)证 如果X 是连续型随机变量,设X 的概率密度为f (x ),则有P {|X -E (X )|≥ε}=⎰⎰≥-≥--≤εεε)(22)()()()(X E x X E x x x f X E x x x f d d ≤[].)()()(1222⎰+∞∞-=-εεX D x x f X E x d 请读者自己证明X 是离散型随机变量的情况.契比雪夫不等式也可表示成P {|X -E (X )|<ε}≥1-2)(εX D . (5.2)这个不等式给出了在随机变量X 的分布未知的情况下事件{|X -E (X )|<ε}的概率的下限估计,例如,在契比雪夫不等式中,令ε=3)(X D ,4)(X D 分别可得到P {|X -E (X )|<3)(X D }≥0.8889,P {|X -E (X )|<4)(X D }≥0.9375.例5.1 设X 是掷一颗骰子所出现的点数,若给定ε=1,2,实际计算P {|X -E (X )|≥ε},并验证契比雪夫不等式成立.解 因为X 的概率函数是P {X =k }=1/6(k =1,2,…,6),所以E (X )=7/2, D (X )=35/12,P {|X -7/2|≥1=P {X =1}+P {X =2}+P {X =5}+P {X =6}=2/3;P {|X -7/2|}≥2}=P {X =1}+P {X =6}=1/3.ε=1:2)(εX D =35/12>2/3, ε=2:2)(εX D =1/4×35/12=35/48>1/3.可见契比雪夫不等式成立.例5.2 设电站供电网有10000盏电灯,夜晚每一盏灯开灯的概率都是0.7,而假定开、关时间彼此独立,估计夜晚同时开着的灯数在6800与7200之间的概率.解 设X 表示在夜晚同时开着的灯的数目,它服从参数为n =10000,p =0.7的二项分布.若要准确计算,应该用贝努里公式:P {6800<X <7200}=∑=-⨯⨯7199680110000100003.07.0k k k k C .如果用契比雪夫不等式估计: E (X )=np =10000×0.7=7000,D (X )=npq =10000×0.7×0.3=2100,P {6800<X <7200}=P {|X -7000|<200}≥1-22002100≈0.95. 可见,虽然有10000盏灯,但是只要有供应7200盏灯的电力就能够以相当大的概率保证够用.事实上,契比雪夫不等式的估计只说明概率大于0.95,后面将具体求出这个概率约为0.99999.契比雪夫不等式在理论上具有重大意义,但估计的精确度不高.契比雪夫不等式作为一个理论工具,在大数定律证明中,可使证明非常简洁.定义5.1 设Y 1,Y 2,…,Y n ,…是一个随机变量序列,a 是一个常数,若对于任意正数ε有{}1lim =<-∞→εa YP n n ,则称序列Y 1,Y 2,…,Y n ,…依概率收敛于a ,记为Y n P a .定理5.1(契比雪夫(Chebyshev )大数定律) 设X 1,X 2,…是相互独立的随机变量序列,各有数学期望E (X1),E (X2),…及方差D (X 1),D (X 2),…,并且对于所有i =1,2,…都有D (X i )<l ,其中l 是与i 无关的常数,则对任给ε>0,有1)(1111lim =⎭⎬⎫⎩⎨⎧<-∑∑==∞→εn i n i i i n X E n X n P . (5.3) 证因X 1,X 2,…相互独立,所以n l nl n X D n X n D n i i n i i =⋅<=⎪⎭⎫ ⎝⎛∑∑==21211)(11. 又因,)(1111∑∑===⎪⎭⎫ ⎝⎛ni i n i i X E n X n E 由(5.2)式,对于任意ε>0,有2111)(11εεn l X E n X n P n i i n i i -≥⎭⎬⎫⎩⎨⎧<-∑∑==, 但是任何事件的概率都不超过1,即1)(111112≤⎭⎬⎫⎩⎨⎧<-≤-∑∑==εεni i n i i X E n X n P n l,因此1)(1111lim =⎭⎬⎫⎩⎨⎧<-∑∑==∞→εn i n i i i n X E n X n P . 契比雪夫大数定律说明:在定理的条件下,当n 充分大时,n 个独立随机变量的平均数这个随机变量的离散程度是很小的.这意味,经过算术平均以后得到的随机变量n Xn i i∑=1将比较密的聚集在它的数学期望n X E ni i ∑=1)(的附近,它与数学期望之差依概率收敛到0.定理5.2(契比雪夫大数定律的特殊情况) 设随机变量X 1,X 2,…,X n ,…相互独立,且具有相同的数学期望和方差:E (X k )=μ,D (X k )=σ2(k =1,2,…).作前n 个随机变量的算术平均∑==nk k n X n Y 11则对于任意正数ε有 {}1lim =<-∞→εμn n Y P . (5.4)定理5.3(贝努里(Bernoulli )大数定律) 设n A 是n 次独立重复试验中事件A 发生的次数.p 是事件A 在每次试验中发生的概率,则对于任意正数ε>0,有1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n , (5.5) 或 0lim =⎭⎬⎫⎩⎨⎧≥-∞→εp n n P A n . 证 引入随机变量X k =⎩⎨⎧=,,2,1,1,0 k ,A k ,A k 发生次试验中若在第不发生次试验中若在第,显然 n A =∑=n k k X1.由于X k 只依赖于第k 次试验,而各次试验是独立的.于是X 1,X 2,…,是相互独立的;又由于X k 服从(0-1)分布,故有E (X k )=p , D (X k )=p (1-p ), k =1,2,….由定理5.2有111lim n i n k P X p n ε→∞=⎧⎫-<=⎨⎬⎩⎭∑, 即 1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n .贝努里大数定律告诉我们,事件A 发生的频率nn A 依概率收敛于事件A 发生的概率p ,因此,本定律从理论上证明了大量重复独立试验中,事件A 发生的频率具有稳定性,正因为这种稳定性,概率的概念才有实际意义.贝努里大数定律还提供了通过试验来确定事件的概率的方法,即既然频率nn A 与概率p 有较大偏差的可能性很小,于是我们就可以通过做试验确定某事件发生的频率,并把它作为相应概率的估计.因此,在实际应用中,如果试验的次数很大时,就可以用事件发生的频率代替事件发生的概率.定理5.2中要求随机变量X k (k =1,2,…,n )的方差存在.但在随机变量服从同一分布的场合,并不需要这一要求,我们有以下定理.定理5.4(辛钦(Khinchin )大数定律)设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有数学期望E (X k )=μ (k =1,2,…),则对于任意正数ε,有111lim n i n k P X n με→∞=⎧⎫-<=⎨⎬⎩⎭∑. (5.6) 显然,贝努里大数定律是辛钦大数定律的特殊情况,辛钦大数定律在实际中应用很广泛. 这一定律使算术平均值的法则有了理论根据.如要测定某一物理量a ,在不变的条件下重复测量n 次,得观测值X 1,X 2,…,X n ,求得实测值的算术平均值∑=ni i X n 11,根据此定理,当n 足够大时,取∑=ni i X n 11作为a 的近似值,可以认为所发生的误差是很小的,所以实用上往往用某物体的某一指标值的一系列实测值的算术平均值来作为该指标值的近似值.第二节 中心极限定理在客观实际中有许多随机变量,它们是由大量相互独立的偶然因素的综合影响所形成的,而每一个因素在总的影响中所起的作用是很小的,但总起来,却对总和有显著影响,这种随机变量往往近似地服从正态分布,这种现象就是中心极限定理的客观背景.概率论中有关论证独立随机变量的和的极限分布是正态分布的一系列定理称为中心极限定理(Central limit theorem),现介绍几个常用的中心极限定理.定理5.5(独立同分布的中心极限定理) 设随机变量X 1,X 2,…,X n ,…相互独立,服从同一分布,且具有数学期望和方差E (X k )=μ,D (X k )=σ2≠0(k =1,2,…).则随机变量σμn n X X D X E X Y n k k n k k n k k n k k n -=⎪⎭⎫ ⎝⎛-=∑∑∑∑====1111)( 的分布函数F n (x )对于任意x 满足⎰∑∞--=∞→∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=x t n k k n n n t x n n X P x F .21lim )(lim 212d e πσμ (5.7) 从定理5.5的结论可知,当n 充分大时,近似地有Y n =21σμn n Xn k k -∑=~N (0,1).或者说,当n 充分大时,近似地有 ().,~21σμn n N Xn k k ∑= (5.8) 如果用X 1,X 2,…,X n 表示相互独立的各随机因素.假定它们都服从相同的分布(不论服从什么分布),且都有有限的期望与方差(每个因素的影响有一定限度).则(5.8)式说明,作为总和∑=n k k X1这个随机变量,当n 充分大时,便近似地服从正态分布.例5.3 一个螺丝钉重量是一个随机变量,期望值是1两,标准差是0.1两.求一盒(100个)同型号螺丝钉的重量超过10.2斤的概率.解 设一盒重量为X ,盒中第i 个螺丝钉的重量为X i (i =1,2,…,100).X 1,X 2,…,X 100相互独立,E (X i )=1,)(i X D =0.1,则有X =∑=1001i i X,且E (X )=100·E (X i )=100(两),)(i X D =1(两).根据定理5.5,有P {X >102}=}2100{111001021100≤--=⎭⎬⎫⎩⎨⎧->-X P X P ≈1-Φ(2)=1-0.977250=0.022750.例5.4 对敌人的防御地进行100次轰炸,每次轰炸命中目标的炸弹数目是一个随机变量,其期望值是2,方差是1.69.求在100次轰炸中有180颗到220颗炸弹命中目标的概率. 解令第i 次轰炸命中目标的炸弹数为X i ,100次轰炸中命中目标炸弹数X =∑=1001i i X,应用定理5.5,X 渐近服从正态分布,期望值为200,方差为169,标准差为13.所以P {180≤X ≤220}=P {|X -200|≤20}=⎭⎬⎫⎩⎨⎧≤-132013200X P ≈2Φ(1.54)-1=0.87644.定理5.6(李雅普诺夫(Liapunov )定理) 设随机变量X 1,X 2,…相互独立,它们具有数学期望和方差:E (X k )=μk , D (X k )=σk 2≠0 (k =1,2,…).记∑==n k k n B 122σ,若存在正数δ,使得当n →∞时, {}∑=++→-n k k k nX E B 12201δδμ, 则随机变量Z n =n nk k nk k n k k n k n k k k B X X D X E X∑∑∑∑∑=====-=-11111)()(μ的分布函数F n (x )对于任意x ,满足⎰∑∑∞--==∞←∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=x t n n k k n k k n n n t x B X P x F d e π211221lim )(lim μ. (5.9) 这个定理说明,随机变量Z n =n n k kn k k B X ∑∑==-11μ当n 很大时,近似地服从正态分布N (0,1).因此,当n 很大时,∑∑==+=nk k n n n k k Z B X11μ 近似地服从正态分布⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这表明无论随机变量X k (k =1,2,…)具有怎样的分布,只要满足定理条件,则它们的和∑=n k k X1当n 很大时,就近似地服从正态分布.而在许多实际问题中,所考虑的随机变量往往可以表示为多个独立的随机变量之和,因而它们常常近似服从正态分布.这就是为什么正态随机变量在概率论与数理统计中占有重要地位的主要原因.在数理统计中我们将看到,中心极限定理是大样本统计推断的理论基础.下面介绍另一个中心极限定理.定理5.7 设随机变量X 服从参数为n ,p (0<p <1)的二项分布,则(1) (拉普拉斯(Laplace)定理) 局部极限定理:当n →∞时P {X =k }≈⎪⎪⎭⎫ ⎝⎛-=--npq np k npq npq npq np k ϕ1212)(2e π, (5.10)其中p +q =1,k =0,1,2,…,n ,2221)(x x -=e πϕ. (2) (德莫佛-拉普拉斯(De MoivreLaplace)定理) 积分极限定理:对于任意的x ,恒有 ⎰∞--∞→=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--x t n t x p np np X P d e π2221)1(lim . (5.11) 这个定理表明,二项分布以正态分布为极限.当n 充分大时,我们可以利用上两式来计算二项分布的概率.例5.5 10部机器独立工作,每部停机的概率为0.2,求3部机器同时停机的概率. 解 10部机器中同时停机的数目X 服从二项分布,n =10,p =0.2,np =2,npq ≈1.265.(1) 直接计算:P {X =3}=310C ×0.23×0.87≈0.2013; (2) 若用局部极限定理近似计算:P {X =3}=)79.0(265.11265.123265.111ϕϕϕ=⎪⎭⎫ ⎝⎛-=⎪⎪⎭⎫ ⎝⎛-npq np k npq =0.2308. (2)的计算结果与(1)相差较大,这是由于n 不够大.例5.6 应用定理5.7计算§5.1中例5.2的概率.解 np =7000,npq ≈45.83.P {6800<X <7200}=P {|X -7000|<200}=1)36.4(236.483.457000-=⎭⎬⎫⎩⎨⎧<-ΦX P =0.99999.例5.7 产品为废品的概率为p =0.005,求10000件产品中废品数不大于70的概率. 解 10000件产品中的废品数X 服从二项分布,n =10000,p =0.005,np =50,npq ≈7.053.P {X ≤70}=)84.2(053.75070ΦΦ=⎪⎭⎫ ⎝⎛- =0.9977. 正态分布和泊松分布虽然都是二项分布的极限分布,但后者以n →∞,同时p →0,np →λ为条件,而前者则只要求n →∞这一条件.一般说来,对于n 很大,p (或q )很小的二项分布(n p ≤5)用正态分布来近似计算不如用泊松分布计算精确.例5.8 每颗炮弹命中飞机的概率为0.01,求500发炮弹中命中5发的概率.解 500发炮弹中命中飞机的炮弹数目X 服从二项分布,n =500,p =0.01,np =5,npq ≈2.2.下面用三种方法计算并加以比较:(1) 用二项分布公式计算:P {X =5}=5500C ×0.015×0.99495=0.17635.(2) 用泊松公式计算,直接查表可得:np =λ=5,k =5,P 5(5)≈0.175467.(3) 用拉普拉斯局部极限定理计算:P {X =5}=⎪⎪⎭⎫ ⎝⎛-npq np npq 51ϕ≈0.1793. 可见后者不如前者精确.小 结本章介绍了契比雪夫不等式、四个大数定律和三个中心极限定理.契比雪夫不等式给出了随机变量X 的分布未知,只知道E (X )和D (X )的情况下,对事件{|X -E (X )|≤ε}概率的下限估计.人们在长期实践中认识到频率具有稳定性,即当试验次数增大时,频率稳定在一个数的附近.这一事实显示了可以用一个数来表征事件发生的可能性的大小.这使人们认识到概率是客观存在的,进而由频率的三条性质的启发和抽象给出了概率的定义,因而频率的稳定性是概率定义的客观基础.贝努里大数定律则以严密的数学形式论证了频率的稳定性.中心极限定理表明,在相当一般的条件下,当独立随机变量的个数增加时,其和的分布趋于正态分布.这一事实阐明了正态分布的重要性.中心极限定理也揭示了为什么在实际应用中会经常遇到正态分布,也就是揭示了产生正态分布变量的源泉.另一方面,它提供了独立同分布随机变量之和∑=n k k X1(其中X k 的方差存在)的近似分布,只要和式中加项的个数充分大,就可以不必考虑和式中的随机变量服从什么分布,都可以用正态分布来近似,这在应用上是有效和重要的.中心极限定理的内容包含极限,因而称它为极限定理是很自然的.又由于它在统计中的重要性,称它为中心极限定理,这是Polya 在1920年取的名字.本章要求读者理解大数定律和中心极限定理的概率意义,并要求会使用中心极限定理估算有关事件的概率.重要术语及主题契比雪夫不等式 依概率收敛契比雪夫大数定律及特殊情况 贝努里大数定律辛钦大数定律 独立同分布中心极限定律李雅普诺夫中心极限定理 德莫佛拉普拉斯中心极限定理.习 题 五1. 一颗骰子连续掷4次,点数总和记为X .估计P {10<X <18}.2. 假设一条生产线生产的产品合格率是0.8.要使一批产品的合格率达到在76%与84%之间的概率不小于90%,问这批产品至少要生产多少件?3. 某车间有同型号机床200部,每部机床开动的概率为0.7,假定各机床开动与否互不影响,开动时每部机床消耗电能15个单位.问至少供应多少单位电能才可以95%的概率保证不致因供电不足而影响生产.4. 一加法器同时收到20个噪声电压V k (k =1,2,…,20),设它们是相互独立的随机变量,且都在区间(0,10)上服从均匀分布.记V =∑=201k k V,求P {V >105}的近似值.5. 有一批建筑房屋用的木柱,其中80%的长度不小于3m.现从这批木柱中随机地取出100根,问其中至少有30根短于3m 的概率是多少?6. 某药厂断言,该厂生产的某种药品对于医治一种疑难的血液病的治愈率为0.8.医院检验员任意抽查100个服用此药品的病人,如果其中多于75人治愈,就接受这一断言,否则就拒绝这一断言.(1) 若实际上此药品对这种疾病的治愈率是0.8,问接受这一断言的概率是多少?(2) 若实际上此药品对这种疾病的治愈率是0.7,问接受这一断言的概率是多少?7. 用Laplace 中心极限定理近似计算从一批废品率为0.05的产品中,任取1000件,其中有20件废品的概率.8. 设有30个电子器件.它们的使用寿命T 1,…,T 30服从参数λ=0.1[单位:(小时)-1]的指数分布,其使用情况是第一个损坏第二个立即使用,以此类推.令T 为30个器件使用的总计时间,求T 超过350小时的概率.9. 上题中的电子器件若每件为a 元,那么在年计划中一年至少需多少元才能以95%的概率保证够用(假定一年有306个工作日,每个工作日为8小时).10. 对于一个学生而言,来参加家长会的家长人数是一个随机变量,设一个学生无家长、1名家长、2名家长来参加会议的概率分别为0.05,0.8,0.15.若学校共有400名学生,设各学生参加会议的家长数相与独立,且服从同一分布.(1) 求参加会议的家长数X 超过450的概率?(2) 求有1名家长来参加会议的学生数不多于340的概率.11. 设男孩出生率为0.515,求在10000个新生婴儿中女孩不少于男孩的概率?12. 设有1000个人独立行动,每个人能够按时进入掩蔽体的概率为0.9.以95%概率估计,在一次行动中:(1)至少有多少个人能够进入?(2)至多有多少人能够进入?13. 在一定保险公司里有10000人参加保险,每人每年付12元保险费,在一年内一个人死亡的概率为0.006,死亡者其家属可向保险公司领得1000元赔偿费.求:(1) 保险公司没有利润的概率为多大;(2) 保险公司一年的利润不少于60000元的概率为多大?14. 设随机变量X 和Y 的数学期望都是2,方差分别为1和4,而相关系数为0.5试根据契比雪夫不等式给出P {|X -Y |≥6}的估计. (2001研考)15. 某保险公司多年统计资料表明,在索赔户中,被盗索赔户占20%,以X 表示在随机抽查的100个索赔户中,因被盗向保险公司索赔的户数.(1) 写出X 的概率分布;(2) 利用中心极限定理,求被盗索赔户不少于14户且不多于30户的概率近似值.(1988研考)16. 一生产线生产的产品成箱包装,每箱的重量是随机的.假设每箱平均重50千克,标准差为h5千克,若用最大载重量为5吨的汽车承运,试利用中心极限定理说明每辆车最多可以装多少箱,才能保障不超载的概率大于0.977. (2001研考)资料仅供参考!!!资料仅供参考!!!h。
大数定理和中心极限定理大数定理和中心极限定理都是经典的概率论理论,它们解决了概率学中常见的问题,为今后的研究奠定了基础。
本文将简要介绍大数定理和中心极限定理。
一、概率论背景概率论是一门探讨随机事件规律性的学科,它的基础是对随机事件的研究。
随机事件是不确定性的事件,其结果不是唯一确定的,而是具有一定的概率性质。
比如掷骰子,点数可能是1、2、3、4、5、6,每个结果出现的概率相等。
在研究随机事件时,需要引入一些数学工具,比如概率、数学期望、方差等等参数。
二、大数定理在概率论中,大数定理是一种关于随机事件的定理。
其意义是,当样本量增加时,样本均值会趋向于总体均值。
换言之,样本均值值越来越接近总体均值。
这个定理让我们可以推断总体的特征,而不必把总体每个单位都进行观测和测量。
样本越大,越能反映总体特征,而不受随机误差的影响。
大数定理的作用在于,它为我们提供了一种推断总体的方法,更为方便和准确。
而且,随着样本量的增加,误差也会减小。
这样的好处不仅在数据的应用中,在经济学、社会学等领域也有广泛的应用。
中心极限定理是概率论中极为重要的定理之一。
其意义是,当样本量趋向于无限时,样本均值的分布会趋近于正态分布。
换言之,对于符合一定条件的随机变量序列,随着样本量的增加,其标准化样本均值的分布逐渐接近于标准正态分布。
中心极限定理的实际使用价值主要在于其在实际应用中的可靠性以及可扩展性。
在实验设计中,中心极限定理可以用来检验样本数据是否符合正态分布,还可以在样本数量比较少的情况下预测样本数据的分布范围。
四、总结大数定理和中心极限定理一直是概率论中的重点内容。
这两个定理不仅为我们解决了实际问题,还为我们提供了一种方法和思路,能够更加完善和优化统计学和概率论的应用。
希望大家能够掌握这两个定理,了解其基本原理和应用,为今后的学习和研究打好基础。
大数定律和中心极限定理的证明及应用大数定律和中心极限定理是概率论的两个基础定理,它们是理解概率论的重要桥梁,也是进行统计分析的基础。
本文将针对这两个定理进行证明和应用的探讨。
一、大数定律大数定律是概率论的重要定理,它指出在独立、同分布的随机变量序列t1、t2、…、tn中,随着n的增大,它们的算术平均值趋近于它们的数学期望。
设t1、t2、…、tn是n个独立同分布的随机变量,它们的数学期望为μ,方差为σ^2,则对于任意ε>0,有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) → 0(n → ∞)即随着n的无限增大,随机变量序列的样本平均值与总体平均值之间的差值会趋近于0。
大数定律的证明有多种方法,这里介绍一种重要的方式——切比雪夫不等式证明法:对于随机变量序列t1、t2、…、tn,根据切比雪夫不等式有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) ≤ σ^2/nε^2由于随机变量t1、t2、…、tn是独立同分布的,因此其样本方差为:sn^2 = (t1-μ)^2 + (t2-μ)^2 + … + (tn-μ)^2按此可得到:σ^2 = sn^2/n因此有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) ≤ sn^2/nε^2从而有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) ≤ σ^2/nε^2由此,对于任意ε>0,当n很大时,都有:P(|(t1+t2+…+tn)/n - μ| ≥ ε) → 0 (n → ∞)即可证明大数定律成立。
大数定理有广泛的应用。
以森林面积估计为例,若要估算某森林面积,可以随机抽取森林中若干个点,计算这些点所在的小区域内的树木密度,通过求平均值来估算森林的总面积。
根据大数定律,随着抽样点数增加,估算结果会趋近于真实面积。
二、中心极限定理中心极限定理(Central Limit Theorem)是概率论的又一个基础定理,它指出在独立、同分布的随机变量序列t1、t2、…、tn中,随着n的增大,这些随机变量的和的分布趋近于正态分布。
验证大数定理:1、实验原理:证明大数定理即证明样本均值趋近于总体均值。
2、实验步骤:在excel中,用公式 =RAND( )*9+1 生成2000个1到10之间的随机数。
选择样本的前50个,前100个,前150个…前2000个,分别求出均值。
③利用excel作出上述求出值的样本均值折线图(图一)和总体均值折线图(图二):图一图二从图一和图二中可以看出样本均值最终趋于水平,即趋于总体均值,大数定理得证。
验证中心极限定理:1、实验原理:证明中心极限定理即证明N个独立同分布的随机变量和的极限分布为正态分布。
本次实验采用独立同分布于0-1分布B(1,0.5)的随机变量序列Ek,k=1,2,3······来验证中心极限定理。
因为Ek,k=1,2,3······之间是独立同分布,所以。
由中心极限定理可知,当n的取值足够大时,这一随机变量的分布与正太分布具有很好的近似,下面用MATLAB软件分别画出n 取不同值时的分布及对应的正太分布的图像,通过对比这两条曲线的相似度来验证中心极限定理。
2、实验步骤:当n=10时,对应正态分布为N(5,2.5)。
MATLAB结果图:MATLAB源程序:②当n=20时,对应正态分布为N(10,5)。
MATLAB结果图:MATLAB源程序:当n=30时,对应正态分布为N(15,7.5)。
MATLAB结果图:MATLAB源程序:④当n=40时,对应正态分布为N(20,10)。
MATLAB结果图:MATLAB源程序:⑤观察得出,当N足够大时,其密度函数服从正态分布,即满足中心极限定理。
【最新整理,下载后即可编辑】
验证大数定理:
1、实验原理:
证明大数定理即证明样本均值趋近于总体均值。
2、实验步骤:
①在excel中,用公式=RAND( )*9+1 生成2000个1到10之间的随机数。
②选择样本的前50个,前100个,前150个…前2000个,分别求出均值。
③利用excel作出上述求出值的样本均值折线图(图一)和总体均值折线图(图二):
图一
图二
从图一和图二中可以看出样本均值最终趋于水平,即趋于总体均值,大数定理得证。
验证中心极限定理:
1、实验原理:
证明中心极限定理即证明N 个独立同分布的随机变量和的极限分布为正态分布。
本次实验采用独立同分布于0-1分布B(1,0.5)的随机变量序列E k ,k=1,2,3······来验证中心极限定理。
因为E k ,k=1,2,3······之间是独立同分布,所以)5.0,(~E n 1k k n B ∑=。
由中心极限定理可知,当n 的取值足够大时,∑=n 1k k E 这一随机变量的分布与正太分布具有很好的近似,下面用MATLAB 软件分别画出n 取不同值时∑=n 1k k
E 的分布及对应的正太分布的图像,通过对比这两条曲线的相似度来验证中心极限定理。
2、实验步骤:
①当n=10时,对应正态分布为N (5,2.5)。
MATLAB 结果图:
MATLAB 源程序:
②当n=20时,对应正态分布为N(10,5)。
MATLAB结果图:
MATLAB源程序:
③当n=30时,对应正态分布为N(15,7.5)。
MATLAB结果图:
MATLAB源程序:
④当n=40时,对应正态分布为N(20,10)。
MATLAB结果图:
MATLAB源程序:
⑤观察得出,当N足够大时,其密度函数服从正态分布,即
满足中心极限定理。