数理统计作业二--用数学实验的方法验证大数定理和中心极限定理(精编文档).doc
- 格式:doc
- 大小:249.00 KB
- 文档页数:6
中心极限定理与大数定律介绍中心极限定理(Central Limit Theorem)和大数定律(Law of Large Numbers)是概率论中两个重要而基础的定理。
它们在统计学和各个领域的实际应用中起着至关重要的作用。
本文将深入探讨这两个定理的概念、应用和相关证明。
中心极限定理定义中心极限定理是概率论中的一个重要定理,它说明了在特定条件下,一组随机变量的均值的分布会趋近于正态分布。
具体来说,对于任意独立同分布的随机变量的和,当样本容量足够大时,其均值的分布将会接近于正态分布。
证明中心极限定理的证明可以通过多种方法进行推导,其中最为经典的方法是使用特征函数的技巧。
通过对特征函数的逐步展开和极限取证,可以得出中心极限定理的结论。
应用中心极限定理在实际应用中有着广泛的应用。
以下是中心极限定理的几个重要应用:1.抽样分布的近似计算:通过中心极限定理,可以对抽样分布进行近似计算,从而推断总体参数。
2.假设检验:在统计学中,中心极限定理广泛应用于假设检验问题中。
通过对样本均值进行正态分布近似,可以进行对总体均值的假设检验。
3.建立置信区间:中心极限定理可用于建立置信区间。
通过计算样本均值的区间估计,确定总体均值的信心水平。
大数定律定义大数定律是概率论中的另一个重要定理,它说明了当独立同分布的随机变量重复进行实验时,其平均值会收敛于数学期望。
换句话说,随着实验次数的增加,样本均值会趋近于总体均值。
证明大数定律的证明有多种方法,其中最为著名的是切比雪夫不等式和辛钦大数定律。
不同的证明方法都有其特点和适用范围,但最终都能得出大数定律的结论。
应用大数定律在实际应用中也有着广泛的应用。
以下是大数定律的几个重要应用:1.统计估计:大数定律可用于建立统计估计方法,如最大似然估计和矩估计。
2.贝叶斯推断:大数定律在贝叶斯推断中起着重要的作用。
通过重复实验,可以逐渐更新对参数的先验分布,得到后验分布。
3.经济学和金融学:大数定律在经济学和金融学中有广泛的应用。
中心极限定理证明一、例子高尔顿钉板试验.图中每一个黑点表示钉在板上的一颗钉子.每排钉子等距排列,下一排的每个钉子恰在上一排两相邻钉子之间.假设有排钉子,从入口中处放入小圆珠.由于钉板斜放,珠子在下落过程中碰到钉子后以的概率滚向左边,也以的概率滚向右边.如果较大,可以看到许多珠子从处滚到钉板底端的格子的情形如图所示,堆成的曲线近似于正态分布.如果定义:当第次碰到钉子后滚向右边,令;当第次碰到钉子后滚向左边,令.则是独立的,且那么由图形知小珠最后的位置的分布接近正态.可以想象,当越来越大时接近程度越好.由于时,.因此,显然应考虑的是的极限分布.历史上德莫佛第一个证明了二项分布的极限是正态分布.研究极限分布为正态分布的极限定理称为中心极限定理.二、中心极限定理设是独立随机变量序列,假设存在,若对于任意的,成立称服从中心极限定理.设服从中心极限定理,则服从中心极限定理,其中为数列.解:服从中心极限定理,则表明其中.由于,因此故服从中心极限定理.三、德莫佛-拉普拉斯中心极限定理在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则用频率估计概率时的误差估计.由德莫佛—拉普拉斯极限定理,由此即得第一类问题是已知,求,这只需查表即可.第二类问题是已知,要使不小于某定值,应至少做多少次试验?这时利用求出最小的.第三类问题是已知,求.解法如下:先找,使得.那么,即.若未知,则利用,可得如下估计:.抛掷一枚均匀的骰子,为了至少有0.95的把握使出现六点的概率与之差不超过0.01,问需要抛掷多少次?解:由例4中的第二类问题的结论,.即.查表得.将代入,便得.由此可见,利用比利用契比晓夫不等式要准确得多.已知在重贝努里试验中,事件在每次试验中出现的概率为为次试验中事件出现的次数,则服从二项分布:的随机变量.求.解:因为很大,于是所以利用标准正态分布表,就可以求出的值.某单位内部有260架电话分机,每个分机有0.04的时间要用外线通话,可以认为各个电话分机用不用外线是是相互独立的,问总机要备有多少条外线才能以0.95的把握保证各个分机在使用外线时不必等候.解:以表示第个分机用不用外线,若使用,则令;否则令.则.如果260架电话分机同时要求使用外线的分机数为,显然有.由题意得,查表得,,故取.于是取最接近的整数,所以总机至少有16条外线,才能有0.95以上的把握保证各个分机在使用外线时不必等候.根据孟德尔遗传理论,红黄两种番茄杂交第二代结红果植株和结黄果植株的比率为3:1,现在种植杂交种400株,试求结黄果植株介于83和117之间的概率.解:将观察一株杂交种的果实颜色看作是一次试验,并假定各次试验是独立的.在400株杂交种中结黄果的株数记为,则.由德莫佛—拉普拉斯极限定理,有其中,即有四、林德贝格-勒维中心极限定理若是独立同分布的随机变量序列,假设,则有证明:设的特征函数为,则的特征函数为又因为,所以于是特征函数的展开式从而对任意固定的,有而是分布的特征函数.因此,成立.在数值计算时,数用一定位的小数来近似,误差.设是用四舍五入法得到的小数点后五位的数,这时相应的误差可以看作是上的均匀分布.设有个数,它们的近似数分别是,.,.令用代替的误差总和.由林德贝格——勒维定理,以,上式右端为0.997,即以0.997的概率有设为独立同分布的随机变量序列,且互相独立,其中,证明:的分布函数弱收敛于.证明:为独立同分布的随机变量序列,且互相独立,所以仍是独立同分布的随机变量序列,易知有由林德贝格——勒维中心极限定理,知的分布函数弱收敛于,结论得证.作业:p222ex32,33,34,35五、林德贝尔格条件设为独立随机变量序列,又令,对于标准化了的独立随机变量和的分布当时,是否会收敛于分布?除以外,其余的均恒等于零,于是.这时就是的分布函数.如果不是正态分布,那么取极限后,分布的极限也就不会是正态分布了.因而,为了使得成立,还应该对随机变量序列加上一些条件.从例题中看出,除以外,其余的均恒等于零,在和式中,只有一项是起突出作用.由此认为,在一般情形下,要使得收敛于分布,在的所有加项中不应该有这种起突出作用的加项.因为考虑加项个数的情况,也就意味着它们都要“均匀地斜.设是独立随机变量序列,又,,这时(1)若是连续型随机变量,密度函数为,如果对任意的,有(2)若是离散型随机变量,的分布列为如果对于任意的,有则称满足林德贝尔格条件.以连续型情形为例,验证:林德贝尔格条件保证每个加项是“均匀地斜.证明:令,则于是从而对任意的,若林德贝尔格条件成立,就有这个关系式表明,的每一个加项中最大的项大于的概率要小于零,这就意味着所有加项是“均匀地斜.六、费勒条件设是独立随机变量序列,又,,称条件为费勒条件.林德贝尔格证明了林德贝尔格条件是中心极限定理成立的充分条件,但不是必要条件.费勒指出若费勒条件得到满足,则林德贝尔格条件也是中心极限定理成立的必要条件.七、林德贝尔格-费勒中心极限定理引理1对及任意的,证明:记,设,由于因此,,其次,对,用归纳法即得.由于,因此,对也成立.引理2对于任意满足及的复数,有证明:显然因此,由归纳法可证结论成立.引理3若是特征函数,则也是特征函数,特别地证明定义随机变量其中相互独立,均有特征函数,服从参数的普哇松分布,且与诸独立,不难验证的特征函数为,由特征函数的性质即知成立.林德贝尔格-费勒定理定理设为独立随机变量序列,又.令,则(1)与费勒条件成立的充要条件是林德贝尔格条件成立.证明:(1)准备部分记(2)显然(3)(4)以及分别表示的特征函数与分布函数,表示的分布函数,那么(5)这时因此林德贝尔格条件化为:对任意,(6)现在开始证明定理.设是任意固定的实数.为证(1)式必须证明(7)先证明,在费勒条件成立的假定下,(7)与下式是等价的:(8)事实上,由(3)知,又因为故对一切,把在原点附近展开,得到因若费勒条件成立,则对任意的,只要充分大,均有(9)这时(10)对任意的,只要充分小,就可以有(11)因此,由引理3,引理2及(10),(11),只要充分大,就有(12)因为可以任意小,故左边趋于0,因此,证得(7)与(8)的等价性.(2)充分性先证由林德贝尔格条件可以推出费勒条件.事实上,(13)右边与无关,而且可选得任意小;对选定的,由林德贝尔格条件(6)知道第二式当足够大时,也可以任意地小,这样,费勒条件成立.其次证明林德贝尔格条件能保证(1)式成立.注意到(3)及(4),可知,当时,当时,因此(14)对任给的,由于的任意性,可选得使,对选定的,用林德贝尔格条件知只要充分大,也可使.因此,已证得了(8),但由于已证过费勒条件成立,这时(8)与(7)是等价的,因而(7)也成立.(3)必要性由于(1)成立,因此相应的特征函数应满足(7).但在费勒条件成立时,这又推出了(8),因此,(15)上述被积函数的实部非负,故而且(16)因为对任意的,可找到,使,这时由(15),(16)可得故林德贝尔格条件成立.八、李雅普诺夫定理设为独立随机变量序列,又.令,若存在,使有则对于任意的,有一,大数定律的证明二,中心极限定理的证明§5.3中心极限定理我们曾特别强调了正态分布在概率论与数理统计中的地位与作用.为什么客观实际中许多随机变量服从正态分布?是经验猜测还是确有科学的理论依据,下面我们就来解释这一问题.我们已经知道,炮弹的弹着点射击误差服从正态分布,我们来分析其原因.要知道误差是什么样的随机变量,有必要研究一下造成误差的原因是什么?每次射击后,炮弹会因为震动而造成很微小的偏差x1,炮弹外形细小的差别而引起空气阻力不同而出现的误差x2,炮弹前进时遇到的空气流的微小扰动而造成的误差x3,……等等,有许多原因,每种原因引起一个微小的误差都是随机的,而弹着点的总误差x 是许多随机误差的总和,即x=?xk,而且xk之间可以看成是相互独立的,因此要讨论x的分布就要讨论这些相互独k立的随机变量之和的分布.在概率论中,我们把研究在一定条件下,大量独立随机变量和的极限分布是正态分布的那些定理通常叫做中心极限定理.本节只介绍两个条件简单,也较常用的中心极限定理.定理4(同分布中心极限定理)设随机变量x1,x2,…,xn…相互独立,服从同一分布,且具有有限的数学期望和方差,e(xk)=?,d(xk)=(k=1,2,…)则随机变量2?xk-n?k=1n的分布函数对任意的x,满足n??nxk-n?k=1?n?x1?2??e-?xt22dt中心极限定理及其应用【摘要】中心极限定理的产生具有一定的客观背景,最常见的是德莫佛-拉普拉斯中心极限定理和林德贝格-勒维中心极限定理。
大数定理与中心极限定理(优选)word资料n , X ,相互独立且具有相同的数学期望和方2,( i 1, 2,)= 个随机变量的算术平均数ni 11X , i n ==∑X 对于任意正数i X |}με-<充分大时,算术平均数必然)独立 ,则 22-1}e dt 2t xπ-∞=⎰)具有怎样的分布,n X +=()50,()i i E X D X ==()50,()25n n E Y n D Y ∴== 由中心极限定理,有(5000)n Y ≤)之和,即,(k p D X =3得n lim P →∞⎧⎪⎨⎪⎩第五章 大数定律与中心极限定理 §5.1 大数定律的概念大数定律以确切的数学形式表达了这种规律性,并论证了它成立的条件,即从理论上阐述了这种大量的、在一定条件下、重复的随机现象呈现的规律性即稳定性。
由于大数定律的作用,大量的随机因素的总体作用必然导致某种不依赖于个别随机事件的结果。
§5.2 切比雪夫不等式§5.2 切比雪夫定理 1、切比雪夫不等式设随机变量X 具有数学期望()E X μ=,方差2()D X σ=,对于任意正数ε有22{}P X σμεε-≥≤成立,这一不等式称为切比雪夫不等式。
它也可以写成22{}1P X σμεε-<≥-。
切比雪夫不等式的意义在于:当知道随机变量X 的数学期望和方差时,我们可以估计X 落在以μ为中心的某一区间内的概率;而且由不等式可以看出,方差2σ越小,{}X με-≥发生的概率也越小。
切比雪夫不等式在理论研究中很有价值,作为一种出略的估计概率的方法在实际中应用也很广泛。
2、依概率收敛 设12,,,,n X X X 是一个随机变量序列,a 是一个常数。
若对任意的正数ε,有lim {}1n n P X a ε→∞-<=,则称序列12,,,,n X X X 依概率收敛于a ,记为pn X a →。
3、切比雪夫大数定律 设12,,,,n X X X 是相互独立的随机变量序列,且2(),(),1,2,i i i E X D X i μσ===存在有限的常数C ,使得2i C σ≤,则对任何的正数ε,皆有1111lim {()}1n ni i n i i P X E X n n ε→∞==-<=∑∑。
大数定律和中心极限定理的证明及应用大数定律和中心极限定理是概率论中的两个重要定理,它们在实际应用中具有重要的作用。
随着21世纪的到来,计算机科学的发展和人工智能技术的不断突破,这些定理在数据分析、机器学习等领域中的应用也越来越广泛。
大数定律是概率论中的一条非常重要的定理,它描述了重复实验的结果会越来越接近于总体的平均值。
具体而言,如果我们对某个随机事件进行了N次实验,并对N个数据点求平均值,那么这个平均值在N变得越来越大时,会趋近于总体的期望值。
在实际中,大数定律可以用于各种数字数据的分析。
例如,我们可以在股市交易中使用大数定律,以预测股市的长期结果。
我们可以通过对每天的股票价格进行记录并验证大数定律是否成立,从而得到预测指数。
另外,在物理学中,大数定律也有重要的应用。
例如,我们可以使用大数定律来确定大量粒子的平均位置。
这种方法可以在许多物理领域中找到应用,如计算电磁场的平均值。
大数定律的证明比较复杂。
一种常用的证明方法是通过上极限和下极限来证明。
上极限和下极限分别代表了随着实验次数增加,平均值逐渐趋向于总体期望值的上限和下限。
根据大数定律的规定,这两个极限应该相等。
证明的核心是要建立一个独立的同分布序列,通过样本与总体一致性的性质,尽可能接近于总体。
中心极限定理是另一个与大数定律相关联的概率论定理。
它描述了当N次独立实验的结果之和趋近于一个标准正态分布时,经过N次标准化后的分布会趋向于一个正态分布。
中心极限定理在实际中的应用非常广泛。
例如,在医学研究中,我们可以使用中心极限定理来估计医疗样本的均值和标准偏差。
我们还可以使用该定理来评估航空公司的航班订购量。
通过使用中心极限定理来计算航班预订量的分布,我们就可以确定需要多少飞机来完成航班任务。
与大数定律的证明相比,中心极限定理的证明相对简单。
它使用了矩母函数和生成函数等概率论方法,通过对傅里叶变换的应用,将一些信息从时域转移到了频域,实现了由多个随机事件的组合到高斯分布的转化。
第 5 章 大数定律与中心极限定理一、填空题:1.设随机变量μξ=)(E ,方差2σξ=)(D ,则由切比雪夫不等式有≤≥-}|{|σμξ3P 91 . 2.设nξξξ,,, 21是n 个相互独立同分布的随机变量,),,,(,)(,)(n i D E i i 218===ξμξ对于∑==ni in1ξξ,写出所满足的切彼雪夫不等式 228εεξεμξn D P =≤≥-)(}|{| ,并估计≥<-}|{|4μξP n 211- . 3. 设随机变量129,,,X X X 相互独立且同分布, 而且有1i EX =,1(1,2,,9)i DX i == , 令91i i X X ==∑, 则对任意给定的0ε>, 由切比雪夫不等式直接可得{}≥<-ε9X P 291ε-. 解:切比雪夫不等式指出:如果随机变量X 满足:()E X μ=与2()D X σ=都存在, 则对任意给定的0ε>, 有22{||}P X σμεε-≥≤, 或者22{||}1.P X σμεε-<≥-由于随机变量129,,,X X X 相互独立且同分布, 而且有 1,1(1,2,9),i i EX DX i === 所以999111()()19,i i i i i E X E X E X μ===⎛⎫===== ⎪⎝⎭∑∑∑9992111()()19.i i i i i D X D X D X σ===⎛⎫===== ⎪⎝⎭∑∑∑4. 设随机变量X 满足:2(),()E X D X μσ==, 则由切比雪夫不等式, 有{||4}P X μσ-≥ 116≤. 解:切比雪夫不等式为:设随机变量X 满足2(),()E X D X μσ==, 则对任意的0ε>, 有22{||}.P X σμεε-≥≤由此得 221{||4}.(4)16P X σμσσ-≥≤=5、设随机变量2σξμξξ==)(,)(,D E ,则≥<-}|{|σμξ2P 43.6、设n ξξξ,,, 21为相互独立的随机变量序列,且),,( 21=i i ξ服从参数为λ的泊松分布,则≤-∑=∞→}{lim x n n P ni in λλξ1⎰∞--xt dt e22 .7、设n η表示n 次独立重复试验中事件A 出现的次数,p 是事件A 在每次试验中出现的概率,则≈≤<}{b a P n η⎰-----)1()1(2221p np np b p np np a t dt e π.8. 设随机变量n ξ, 服从二项分布(,)B n p , 其中01,1,2,p n <<= , 那么, 对于任 一实数x , 有lim {|||}n n P np x ξ→+∞-<= 0 .9. 设12,,,n X X X 为随机变量序列,a 为常数, 则{}n X 依概率收敛于a 是指 {}=<->∀+∞>-εεa X P n n lim ,0 1 ,或{}=≥->∀+∞>-εεa X P n n lim ,0 0 。
大数定理与中心极限定理的应用大数定理和中心极限定理是概率论中最基本也是最重要的两个定理。
它们是求解随机事件的概率分布和预测随机现象的变化趋势的基础。
本文将介绍大数定理和中心极限定理的定义、证明以及应用。
一、大数定理大数定理是概率论中的一个重要原理,描述了随机变量序列平均数的性质。
大数定理表明,随着样本数量逐渐增加,随机变量序列平均数越来越接近随机变量的期望值。
具体来说,如果 $X1,X2, ..., Xn$ 是独立同分布的随机变量,其期望为 $E(X)$,则样本平均数的极限为 $E(X)$,即:$$\lim_{n\to\infty} \frac{X_1+X_2+...+X_n}{n} = E(X)$$大数定理的证明比较复杂,这里不再深入探讨。
但需要注意的是,大数定理只是对随机变量序列平均数的渐近表现进行的描述。
在实际应用中,仍然需要考虑样本数量、样本大小、采样方法等因素带来的误差。
大数定理的应用十分广泛,常见的例子包括赌场游戏、信用评级等。
以赌场游戏为例,假设一家赌场每次赌客可以下注 $1$ 美元,赢得的概率为 $p$。
根据赌场规则,获胜的赌客可以得到$2$ 美元的回报,输掉的赌客则失去所下的 $1$ 美元。
赌场的利润取决于获胜和失败的比例。
利润越高,赌场的经营者就越富有。
而大数定理在此处的应用则在于,当赌客的数量越来越多时,赌场的经营者能够准确预测赌客赢得和输掉的比例,从而达到通过调整赔率保证赌场利润最大的目的。
二、中心极限定理中心极限定理是概率论中的另一个重要概念。
它表明当样本数量增加时样本平均数的分布越来越接近正态分布。
正态分布是概率分布中最常见也最重要的一种分布。
由于中心极限定理具有一定的普适性,因此它在实际应用中十分重要。
中心极限定理的数学表达式为:$$\lim_{n\to\infty} P(\frac{X_1+X_2+...+X_n}{n} \leq x) =\frac{1}{\sqrt{2\pi}} \int_{-\infty}^x e^{-t^2/2}dt$$其中 $X_1,X_2,...,X_n$ 是独立同分布的随机变量,并且有$E(X_1^2)<\infty$,$\mu=E(X_1),\sigma^2=Var(X_1)$,则样本平均数满足:$$\frac{\frac{X_1+X_2+...+X_n}{n} - \mu}{\sigma/\sqrt{n}} \sim N(0,1)$$其中 $N(0,1)$ 表示标准正态分布。
【最新整理,下载后即可编辑】
验证大数定理:
1、实验原理:
证明大数定理即证明样本均值趋近于总体均值。
2、实验步骤:
①在excel中,用公式=RAND( )*9+1 生成2000个1到10之间的随机数。
②选择样本的前50个,前100个,前150个…前2000个,分别求出均值。
③利用excel作出上述求出值的样本均值折线图(图一)和总体均值折线图(图二):
图一
图二
从图一和图二中可以看出样本均值最终趋于水平,即趋于总体均值,大数定理得证。
验证中心极限定理:
1、实验原理:
证明中心极限定理即证明N 个独立同分布的随机变量和的极限分布为正态分布。
本次实验采用独立同分布于0-1分布B(1,0.5)的随机变量序列E k ,k=1,2,3······来验证中心极限定理。
因为E k ,k=1,2,3······之间是独立同分布,所以)5.0,(~E n 1k k n B ∑=。
由中心极限定理可知,当n 的取值足够大时,∑=n 1k k E 这一随机变量的分布与正太分布具有很好的近似,下面用MATLAB 软件分别画出n 取不同值时∑=n 1k k
E 的分布及对应的正太分布的图像,通过对比这两条曲线的相似度来验证中心极限定理。
2、实验步骤:
①当n=10时,对应正态分布为N (5,2.5)。
MATLAB 结果图:
MATLAB 源程序:
②当n=20时,对应正态分布为N(10,5)。
MATLAB结果图:
MATLAB源程序:
③当n=30时,对应正态分布为N(15,7.5)。
MATLAB结果图:
MATLAB源程序:
④当n=40时,对应正态分布为N(20,10)。
MATLAB结果图:
MATLAB源程序:
⑤观察得出,当N足够大时,其密度函数服从正态分布,即
满足中心极限定理。