大数定理论文
- 格式:doc
- 大小:13.94 KB
- 文档页数:8
概率论基础结课论文题目:独立随机序列的大数事件的定理与应用作者:信计1301班王彩云130350119摘要:概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。
概率论中讨论随机变量序列的算术平均值向常数收敛的定律。
概率论与数理统计学的基本定律之一,又称弱大数理论。
大数定律以严格的数学形式表达了随机现象最根本的性质—平均结果的稳定性,它是概率论中一个非常重要的定律,是随机现象统计规律性的具体表现,应用很广泛。
本文介绍了几种常用的大数定律,并分析了它们在理论与实际中的应用。
关键词:弱大数定理伯努利大数定理随机变量数学期望概率引言:“大数定律”本来是一个数学概念,又叫做“平均法则”。
在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律,通俗的说,这个定律就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。
比如,我们向上抛一枚硬币,硬币落下时哪一面朝上本身是偶然的,但当我们向上抛的硬币的次数足够多时,达到上万次甚至几十万几百万时之后,我们就会发现,硬币朝上的次数大约占总数的二分之一。
偶然之中包含着必然。
从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近,人们在实践中观察其他的一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性。
这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的个别特征无关,而且结果也不再是随机的。
深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么?在什么条件下具有稳定性?这就是我们大数要研究的问题。
概率与统计是研究随机现象的统计规律的学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来。
然而,在大量重复试验或观察中,我们会发现,一个事件发生的频率具有稳定性,它的稳定性会随着试验次数的增多表现得越来越明显。
《大数字法》就像一个神奇的咒语在概率和统计的世界!这是所有的事情当你做同样的实验一大堆。
根据这部法律,如果你做了千分之
十的试验,你所有结果的平均值应该相当接近你的预期。
你做的试验
越多你的平均值就越接近预期值这个法则对各种事物都非常有用,比如在赌博游戏中找出几率,或者预测随机事件的几率。
简言之,你做
的试验越多,你的平均结果就越接近总体平均数。
这就像平均法则总
是在背景中发挥它的魔法!
中央限制定理在概率论中是一个非常重要的想法。
它基本上说,如果把一堆随机数字加起来或平均出来,无论原始数字是什么样子,最终
结果都会接近正常分布。
这是超级方便的,因为它让我们根据较小的
样本,对大裙事物作出有教养的猜测。
当我们不太了解最初的组别时,这特别有用,因为它让我们能够通过只看一个小片来对整个组别是什
么样子作出相当好的估计。
《大数字法》和《中央限制定理》都是概率和统计领域的基本原则,
在金融、经济学、工程学和自然科学等各个领域都有广泛和重大的应用。
对这些定理的理解和利用有助于研究人员和从业者根据数据作出
知情决定,并从实证观测中得出可靠的结论。
实质上,"大数字定律"
在样本大小扩大时对样本行为表示描述,而"中央限制定理"则对大量
独立,相同分布的随机变量的总和或平均值的行为进行描述。
这些定
理共同建立了分析和解释随机现象的有力框架。
毕业论文大数定律在经济学中的应用————————————————————————————————作者:————————————————————————————————日期:学校代码:10206学生学号:051074204白城师范学院毕业论文(设计)大数定律在经济学中的应用Law of large numbers in economics学生姓名:安琦指导教师:邬伟三讲师学科专业:数学与应用数学所在单位:数学系2011年6月摘要摘要概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。
概率论中讨论随机变量序列的算术平均值向常数收敛的定律。
概率论与数理统计学的基本定律之一。
有些随机事件无规律可循,但不少却是有规律的,这些“有规律的随机事件”中在大量重复出现的条件下,往往呈现几乎必然的统计特性,这个规律就是大数定律。
通俗地说,这个定理就是,在试验不变的条件下,重复试验多次,随机事件的频率近似于它的概率。
这种情况下,偶然中包含着必然。
必然的规律与特性在大量的样本中得以体现。
大数定律是概率论中的重要内容,它以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现,在数学应用及经济生活中有着较为重要的作用,较多文献给出了不同条件下存在的大数定律,并利用大数定律和中心极限定理得到较多模型的收敛性,但对于它们的适用范围及在实际生活中的应用涉及较少。
本文就大数定律做了具体的分析,介绍了几种较为常见的大数定律,并结合它们存在的条件的不同,分析了它们各种适用的数学模型的特征,列举了它们在经济生活领域的应用,将理论具体化, ,以使得枯燥的数学理论与实际想结合,使大家对大数定律在实际生活中的应用价值有了更深的认识。
关键词:大数定律特征函数保险银行贷款AbstractAbstractA history of probability limit theorem is Bernoulli, later known as the "law of large numbers." Probability random variables discussed in the arithmetic mean law of convergence to the constant. Probability theory and mathematical statistics one of the basic laws.Some random events without a pattern, but many are regular, these "regular random incident," a large number of recurring conditions, often showing statistics of almost inevitable, this rule is the law of large numbers.In layman's terms, this theorem is that under the same conditions in the test, repeat testing several times, the frequency of random events similar to it probability. In this case, includes the inevitable accident. The regularity and characteristics of the inevitable large number of samples to be reflected.Law of large numbers is an important part of probability theory, its rigorous mathematical form, the most fundamental expression of the random nature of the phenomenon - an average of the stability of results, it is the statistical regularity of random phenomena of specific performance, application and economic life in mathematics has a more important role, more literature exists under different conditions are given law of large numbers, and using law of large numbers and central limit theorem, the convergence of many models, but their scope of application and in real life The applications involve small. This paper made a law of large numbers of specific analysis, introduces some of the more common law of large numbers, combined with their existing conditions, the analysis of their mathematical model for a variety of features, listed them in the field of economic life the application of the theory specific, in order to make the boring mathematical theory and practice was integrated so that people in the law of large numbers of applications in real life have a deeper understanding of the value.Keywords:Law of Large Numbers Characteristic function Insurance Bank loans目录摘要 (I)Abstract (II)绪论 (1)1特征函数 (2)2大数定律 (5)3大数定律的应用 (8)总结 (10)参考文献 (11)致谢 (12)绪论概率论历史上第一个极限定理属于贝努里,后人称之为“大数定律”.1733年,德莫佛——拉普拉斯在分布的极限定理方面走出了根本性的一步,证明了时二项分布的极限分布是正态分布.拉普拉斯改进了他的证明并把二项分布推广为更一般的分布.1900年,李雅普诺夫进一步推广了他们的结论,并创立了特征函数法.这类分布极限问题是当时概率论研究的中心问题,卜里耶为之命名“中心极限定理”.20世纪初,主要探讨使中心极限定理成立的最广泛的条件,二三十年代的林德贝尔格条件和费勒条件是独立随机变量序列情形下的显著进展.在第一章已经指出,随机事件在大量重复试验中呈现明显的统计规律性,即一个事件在大量重复试验中出现的频率具有稳定性.这种稳定性的提法应该说是什么形式? 贝努里是第一个研究这一问题的数学家.他于是1713年首先提出后人称之为“大数定律”的极限定理.在实践中,人们发现事件发生的“频率”具有稳定性。
论文题目:大数定律与中心极限定理的关系及其应用摘要:本文通过对概率论的经典定理——大数定律与中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质——平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示理论依据.关于大数定律方面,较全面地分析和叙述了几种最常用的大数定律.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;另外,叙述了各种大数定律以及中心极限定理各自之间,大数定律与中心极限定理之间的关系.同时通过举出很多相关的反例说明二者的关系.最后给出了一些简便的大数定律与中心极限定理在数理统计、误差、彩票学、近似计算、保险业及数学分析等几个方面的应用,来进一步地阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值.关键词:随机变量序列;大数定律;中心极限定理;应用Title:Law of large numbers and the relationship between the centrallimit theorem and its applicationAbstract: Based on the probability of a classic theorem : the law of large numbers central limit theorem in the independent distribution ; with the different distribution of both cases, it made more systematic exposition, and revealed the phenomenon of the random nature of the most fundamental an average of the results of the Stability . Trough the central limit theorem discussion it will give out the random variables and the distribution of the normal distribution .About the law of large numbers, there are more comprehensive analysis and described several of the most commonly used on it. The content of the same central limit theorem also discussed the independent distribution and independent distribution of the two different perspectives. Also, it will discussed the relationship between the variety of narrative and the law of large numbers between their respective central limit theorem, and that of the law of large numbers and the central limit theorem. At the same time, it demonstrated the relationship between the two aspects through lots of anti-related examples. Finally ,it gave out several aspects of application of a number of simple law of large numbers and the central limit theorem in mathematical statistics, error, lottery school, the approximate calculation, and the insurance industry and mathematical analysis, to further clarify the law of large numbers and the central limit theorem in all branches of the important role and value.Keywords: Random variables ; Law of large numbers; Central limit theorem; Application目录摘要 (I)Abstract (II)第1章引言 (1)第2章大数定律及其证明 (2)2.1 几个相关定义 (2)2.2 大数定律及其证明 (4)第3章中心极限定理 (8)3.1 中心极限定理的提法 (8)第4章大数定律与中心极限定理的关系 (11)4.1 服从大数定律, 但不服从中心极限定理 (11)4.2 服从中心极限定理, 但不服从大数定律 (12)4.3 大数定律与中心极限定理都不服从 (13)4.4 大数定律、中心极限定理都服从 (13)第5章应用 (14)5.1“概率”及“数学期望”的确切定义 (14)5.2 解释测量(随机) 误差 (14)5.3 在数学分析中的应用 (15)5.4 在计算精确的近似概率方面的应用 (16)5.5 在彩票和保险业的应用 (17)结语 (20)参考文献 (21)致谢 (22)附录 (23)第1章引言概率论与数理统计是研究随机现象的统计规律的科学,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来. 从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近. 人们在实践中观察其他一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性. 这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的特征无关,且不再是随机的. 深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么? 在什么条件下具有稳定性? 这就是大数定律要研究的问题.众所周知,中心极限定理是概率论中最重要、最基本的一个定理.中心极限定理揭示了离散型随机变量与连续型随机变量之间的内在联系, 为用连续型随机变量的分布,特别是标准正态分布对离散型随机变量进行概率计算提供了理论基础.基于中心极限定理的概率统计方法在生活中的应用,本文利用中心极限定理,分析了保险业和近似计算中的应用.第2章 大数定律及其证明2.1 几个相关定义定义1[1] 设n (1,2,)n ξ=为概率空间(,,)F P Ω上定义的随机变量序列(简称随机序列),若存在随机变数ξ,使对任意0ε>,恒有:lim {}0n n p ξξε→∞-≥=或lim {}1n n p ξξε→∞-≤=, 则称随机序列{}n ξ概率收敛于随机变量ξ(ξ也可以是一个常数),并用下面的符号表示:lim ()n n p ξξ→∞=或p n ξξ−−→. 定义 2[2][6][8] 设{}n ξ为随机变量序列, 数学期望n E ξ存在()1n ≥,如果对任意的0ε>.恒有:1111lim (())1n n i i n i i p E n n ξξε→∞==-<=∑∑, 则称随机变量序列{}n ξ服从大数定律. 定义 3 设{}n ξ为随机变量序列, 如果存在常数序列{}n a .对任意的0ε>.恒有:11lim ()1ni n n i p a n ξε→∞=-<=∑, 则称随机变量序列{}n ξ服从大数定律. 注:定义2和定义3两种大数定律定义的讨论所谓大数定律, 它是揭示大量随机现象的平均结果稳定于平均值的极限理论.而大量随机现象即{}n ξ的平均结果是11n i i n ξ=∑(n 充分大),其平均值是11()ni i E n ξ=∑.因此, 从这一角度来考虑,定义2是恰当的.定义3与定义2的不同点在于它并不要求随机变量n ξ的期望n E ξ存在(1n ≥),只要存在常数序列{}n a ,使对任意的0ε>.恒有11lim ()1ni n n i p a n ξε→∞=-<=∑即可.为了弄清这两种定义的异同,我们必须讨论数列{}n a 与数列{11()ni i E n ξ=∑}之间的关系. 首先,当n E ξ(1n ≥)存在时,我们不难证明:0δ∀>,11lim (())0nn i n i p a E n ξδ→∞=-≥=∑这个结果表明在n E ξ(1n ≥)异存在时,只需取11()nn i i a E n ξ==∑,(1n ≥).此时, 定义2 与定义3 是等价的.其次,当n E ξ(1n ≥)不存在时, 由定义2知{}n ξ不服从大数定律, 而此时, 存在常数列{}n a 使定义3仍然成立.综合上述定义2与定义3不是等价的.定义3不仅在形式上而且在内涵上比定义2更广泛.定义 4[3] 设{()}n F x 是分布函数序列,若存在一个非将函数()F x ,对于它的每一连续点x ,都有lim ()()n n F x F x →∞=,()()w n F x F x −−→,则称分布函数序列{()}n F x 弱收敛于()F x .定义5 设n ()(1,2,)F x n =, ()F x 分别是随机变量(1,2,)n n ξ=及ξ的分布函数,若()()w n F x F x −−→,则称{}n ξ依分布收敛于ξ,亦记为L n ξξ−−→,且有:(1)若p n ξξ−−→,则L n ξξ−−→; (2)设c 为常数,则p n c ξ−−→的充要条件是L n c ξ−−→. 逆极限定理:设特征函数列{()}n f x 收敛于某一函数()f t ,且()f t 在0t =时连续,则相应的分布函数列{()}n F x 弱收敛于某一分布函数()F x ,而且()f t 是()F x 的特征函数.车比雪夫不等式[4]:设ξ是一个随机变量,它的数学期望为a ,方差为2σ,则对任意的正常数ε恒有:22{},p a σξεε-≥≤ (2-1) 或有22{}1p a σξεε-<≥- (2-2)称(2-1)式或(2-2)式为车比雪夫不等式.以下就连续型随机变量来证明这个不等式.证 设的密度函数为()f x ,则有222()()()()()x EX x EX DX x EX f x dx x EX f x dx f x dx εεε+∞-∞-≥-≥=-≥-≥⎰⎰⎰{}22()x EX f x dx P x EX εεεε-≥==-≥⎰,于是 {}2DXP x EX εε-≥≤这个不等式可解释为:对任意给定的正常数ε,可以作为两个区间(,)a ε-∞-和(,)a ε++∞.(1)式表示,在一次试验中,随机变量ξ的取值落在(,)(,)a a εε-∞-⋃++∞的概率小于等于22σε.不等式说明DX 越小,则X 的取值越集中在EX 附近.这进一步说明了方差是反映随机变量取值的离散程度的.2.2 大数定律及其证明大数定律形式有很多,我们仅介绍几种最常用的大数定律.定理1[5][6] (车比雪夫大数定律)设随机变量12n ,,,,ξξξ相互独立,它们的数学期望依次为12n ,,,,a a a ,方差依次为22212,,,,n σσσ而且存在正常数k ,使得对一切1,2,i =有2i k σ<,则对任意给定的正常数ε,恒有1111lim {}1n ni i n i i p a n n ξε→∞==-<=∑∑ 证 设11ni i n ξξ==∑,则ξ的数学期望和方差分别为: 111111n n n i i i i i i E E E a n n n ξξξ===⎛⎫=== ⎪⎝⎭∑∑∑,222111111n nn i i i i i i D D D n n n ξξξσ===⎛⎫=== ⎪⎝⎭∑∑∑ 由车比雪夫不等式,对任意给定的正数ε,有11111{}n ni i i i p a n n ξε==≥-<∑∑=22221222{}1111n ii D p E nk n k n n σξξξεεεεε=-<≥-=->-=-∑ 即 211111{}1n ni i i i p a k n n n ξεε==≥-<=-∑∑. 对不等式取极限,则得1111lim {}1n ni i n i i p a n n ξε→∞==-<=∑∑ 车比雪夫大数定律表明,在一定条件下,当n 充分大时,n 个随机变量的算术平均值11n i i n ξ=∑偏离其数学期望的可能性很小.这也正是用一系列测量值的平均值来近似代替真值的做法的原则.推论 1 设随机变量12n ,,,,ξξξ相互独立,且它们具有相同的分布及有限的数学期望和方差:E a ξ=,2(1,2,)D i ξσ==,则对任意给定的正数ε,有11lim {}1ni n i p a n ξε→∞=-<=∑. 此推论证明:n 个相互独立的具有相同数学期望和方差的随机变量,当n 很大时,它们的算术平均值几乎是一个常数,这个常数就是它们的数学期望.定理 2[7] (辛钦大数定律)设12n ,,,,ξξξ是相互独立的随机变量,而且有相同是的分布,具有有限的数学期望k ,(1,2,)E a k ξ==,则对任意给定的0ε>,有11lim {}1nk n k p a n ξε→∞=-<=∑. 注:定理2中条件比定理1中的条件要宽,在定理1中要求方差有限,而定理2不需要这个条件.辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学期望值,它为在实际应用中用算术平均值估计数学期望提供了理论依据.证 因为12n ,,,,ξξξ是具有相同分布的随机变量序列,故它们有相同的特征函数.设它们的特征函数为()f t ,由于k E ξ存在,故()f t 有展开式:'()(0)(0)()1()f t f f t t iat t οο=++=++,其中()t ο表示关于t 的高阶无穷小量.再由独立性知,11n k k n ξ=∑的特征函数为:1n nt t t f ia n n n ο⎡⎤⎡⎤⎛⎫⎛⎫=++ ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.对任意取定的数t ,有lim lim 1n niat n n t t t f ia e n n n ο→∞→∞⎡⎤⎡⎤⎛⎫⎛⎫=++= ⎪ ⎪⎢⎥⎢⎥⎝⎭⎝⎭⎣⎦⎣⎦.而iat e 是连续函数,且是单点分布的特征函数,由逆极限定理知:11nk k n ξ=∑的分布函数弱收敛于()F x .其中,1,(),0,x a F x x a >⎧=⎨=⎩因此,11,n L k k a n ξ=−−→∑由(2)式知:11n P k k a n ξ=−−→∑. 定理 3[8] (贝努利大数定律)设n μ是n 次独立试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率,则对任意给定的正数ε,有lim {}1n n p p n με→∞-<= 或 lim {}0n n p p n με→∞-≥=证 令 0,1,2,1n k A Y k k A ⎧==⎨⎩第试验不发生,,第试验发生.显然12n n Y Y Y μ=+++,由于各次试验是独立的,从而12,,,,n Y Y Y 相互独立,又k Y 服从参数为P 的两点分布,所以(),()(1),(1,2,)k k E Y P D Y P P k ==-=. 由定理1有 lim {}1n n p p n με→∞-<=.此定理表明:当n 很大时, n 重贝努利试验中事件A 发生的频率几乎等于事件A 在每次试验中发生的概率,这个定理以严格的数学形式刻画了频率的稳定性,因此,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率.证 作一次观察时n μ是定值, 作多次观察时n μ是随机变量,而且(,),nB n p μ因此:n E np μ=,n D npq μ=,()n E n p μ=,()n D n pq n μ=. 在车比雪夫不等式中,取 n n ξμ=,则a p =,2pq n σ=,于是对任意给定的正数ε,有21{}11()npq p p n n n μεε≥-<≥-→→∞,因而lim {}1n n p p nμε→∞-<=. 定理 4 (泊松大数定律)设12n ,,,,ξξξ是相互独立的随机变量, P{1}n n P ξ==, P{0}n n q ξ== (其中n P 1n q =-) ,则{}n ξ服从大数定律.证 由定理所设可得:11E()nn i n i P P n ξ===∑, 2221111111()()24n n n n n n i i i i i i P q D D Pq n n n nξξ===+⎛⎫==≤= ⎪⎝⎭∑∑∑. 由车比雪夫不等式得,对任意0ε>,有22()10{} 4n n n D P P n ξξεεε≤-≥≤≤. 两边取极限,得lim {}0n n n P P ξε→∞-≥=. 泊松大数定律是贝努利大数定律的推广, 贝努利大数定律证明了事件在完全相同条件下重复进行的随机试验中频率的稳定性;而泊松定理表明,当独立进行的随机试验的条件变化时, 频率仍然具有稳定性:随着n 的无限增大,在n 次独立试验中,事件 A 的频率趋于稳定在各次试验中事件A 出现概率的算术平均值附近.定理5[9][10] 马尔可夫(Marrkov) 大数定律)设{}k ξ是随机变量序列,若211lim ()0nk n k D n ξ→∞==∑,则对任意>0ε,均有1111lim {}1n nk k n k k p E n n ξξε→∞==-<=∑∑,即{}k ξ服从大数定律. 证 车比雪夫不等式得212111()111{}1nk n nk k k k k D n p E n n ξξξεε===≥-<≥-∑∑∑,取极限得:1111lim {}1n nk k n k k p E n n ξξε→∞==-<=∑∑注:车比雪夫大数定律可又马尔可夫大数定律推出,更重要的是马尔可夫大数定律已经没有任何关于独立性的规定.第3章 中心极限定理直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.3.1 中心极限定理的提法定理 6[3][11] (林德贝格——列维定理(Lindeberg-Levy)中心极限定理) 设随机变量12,,ξξ是一列独立同分布的随机变量,并且具有数学期望k E a ξ=和方差22(0),1,2,k D k ξσσ=>=,则对任意实数x ,有22lim ()t n k xn na P x e dt x ξ--∞→∞⎛⎫- ⎪⎪<==Φ⎪⎪⎝⎭∑(3-1) 证 设k a ξ-的特征函数为()t ϕ,1nknk naξ=-=∑的特征函数为nϕ⎡⎤⎢⎥⎣⎦又因为()()20,k k E a D a ξξσ-=-=,所以'''2(0)0,(0)ϕϕσ==-于是特征函数()t ϕ有展开式:2'''22221()()(0)(0)()1()22t t t t t t t ϕϕϕϕοσο=+++=-+,从而对任意固定的t ,有22221(),2nn tt t e n nn ϕο-⎡⎤⎡⎤=-+→→∞⎢⎥⎢⎥⎣⎦⎣⎦ 而22t e -是()0,1N 分布的特征函数,因此由特征函数的连续性定理即知(3-1)成立,定理得证.定理6又称独立同分布的中心极限定理,它表达了正态分布在概率论中的特殊地位,尽管k ξ的分布是任意的,但只要n 充分大,随机变量nknaξ-∑近似服从标准正态分布(0,1)N .或者说,当n 很大时,独立同分布的随机变量k ξ的和1nk k ξ=∑ 近似地服从正态分布2(,)N n n μσ.这就是那些(可以看作有许多微小的、独立的随机因素作用的总结果,而每一个因素的影响却都很小)随机变量,一般都可以近似地服从正态分布的理论依据,因而正态分布在理论上和应用上都具有极大的重要性.若(,)B n p ξ,则当n 很大时,有()P a b ξ⎛⎫⎛⎫≤≤≈Φ-Φ 定理 7 (棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理) 设随机变量n η服从二项分布(,)B n p ,则对于任意区间[,]a b ,恒有22lim t nk b a n na P a b dt ξ-→∞⎛⎫- ⎪ ⎪≤<= ⎪⎪⎝⎭∑⎰二项分布的极限分布是正态分布 即如果(,)X B n p ,则22()()t nk b ana P a b dt b a ξ-⎛⎫- ⎪ ⎪≤<≈=Φ-Φ ⎪⎪⎝⎭∑⎰一般地,如果(,)X B n p ,则()P a X b P ⎛⎫≤<=≤<≈Φ-Φ说明:这个公式给出了n 较大时二项分布的概率计算方法. 引理 设12,,ξξ是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ==,221nnk k B σ==∑,这时:(1) 若{}k ξ是连续型随机变量,密度函数为{}()n P x ,如果对任意0τ>,有2211lim ()()0k n nk k x a B n k n x a P x dx B τ->→∞=-=∑⎰(2) 若{}k ξ是离散型随机变量,k ξ的分布列为(),1,2,n nj nj P x P j ξ===,如果对任意0τ>,有()2211lim 0nj k nnnj k kj n k x a B n x a P B τ→∞=->-=∑∑则称{}k ξ满足林德贝尔格条件.定理 8 (林德贝格定理) 设独立随机变量序列12,,ξξ满足林德贝尔格条件,则当时,对任意的,有()2211lim y n xk k n k n P a x e dy B ξ--∞→∞=⎛⎫-<=⎪⎝⎭∑这个定理证明了由大量微小而且独立的随机因素引起并积累而成的变量,必将是一个正态随机变量,由林德贝尔格条件可看到定理并不要求各个加项“同分布”,因而它比前述的林德贝尔格——勒维定理更强,事实上林德贝尔格——勒维定理可以由它推出.定理 9 (李雅普诺夫定理) 设12,,ξξ是独立随机变量序列,又k k E a ξ=,2(1,2,)k k D k ξσ==,记221nnk k B σ==∑,若存在0δ>,使有22110,nkkk nE a n B δδξ++=-→→∞∑,则对任意的实数x ,有()2211lim y n xk k n k n P a x e dy B ξ--∞→∞=⎛⎫-<= ⎪⎝⎭∑定理9又称独立非同分布的中心极限定理,李雅普诺夫定理可以解释如下:假定被研究的随机变量可以表示为大量独立随机变量的总和,且总和中的每个单独的随机变量对于总和又不起主要作用,那么可以认为这个随机变量近似地服从正态分布.讨论了独立随机变量和的分布的极限问题,在一定条件下,这些分布弱收敛于退化分布,这就是大数定律.凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称为中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.第4章 大数定律与中心极限定理的关系概率论中关于独立随机变量序列的极限理论, 已相当完整, 各种问题已有了令人满意的回答,但由于一般教材中, 特别是工科教材, 只介绍一、二个最简单的基本定理,若弱大数定律只介绍切比契夫定理的特殊情况, 中心极限定理只介绍同分布的林德贝格——列维定理(Lindeberg-Levy)的特殊情况——德莫弗—拉普拉斯(De Moivre-Laplace)定理.仅少数教材提及林德贝格条件. 这几个定理的条件又都是充分条件, 我们容易产生这样的问题: 大数定律与中心极限定理之间究竟有什么关系? 服从大数定律的是否服从中心极限定理? 反之又如何? 是否有两者都服从或都不服从的随机序列?因教材知识所限, 这些问题不太好回答, 现拟补充几个定理, 以简单的例子加以说明.定理10[12] (格涅坚克定理) 设有相互独立的随机变量序列{}k ξ, 则对0ε∀>,11lim {()}1n k k n k p E n ξξε→∞=-<=∑的充要条件是2221()lim []0()nk k n k k kE E n E ξξξξ→∞=-=+-∑. 定理11 (马尔科夫定理) 随机变量序列{}k ξ, 若211()0nk k D n ξ=→∑,则对0ε∀>, 有11lim {()}1nk k n k p E n ξξε→∞=-<=∑. 定理12 (费勒定理) 对相互独立随机变量序列{}k ξ, 若∃常数n M ,使1max k n k nM ξ≤≤≤,且lim0nn nM B →∞=, 则{}k ξ服从中心极限定理.设{}k ξ为相互独立的随机变量序列, 以下在,,()k k j k j P P ξα==中, 令,,,k j k j P α取不同的值, 以说明不同的情形.4.1[12][13]服从大数定律, 但不服从中心极限定理令(),1,1210,121k k P k α==-+,(),2,221,21k k k P k α==+,(),3,321,21k k k P k α==+,1,2,3,k =,即()21(0)11k P k ξ==-+,()21()()21k k P k P k k ξξ===-=+可知0,k E ξ=()2221k k k D E k ξξ==+,()222111n nnk k k k B D k ξ====+∑∑因222110,n B n n n n<⋅→→∞, 由马尔科夫定理知, 大数定律成立, 但中心极限定理不成立. 这是因为12111(0)(0,0,,0)(0)(0)n nk n k k k k k P P P P ξξξξξξ∞==========≥=∑∏∏()2111(1)021nk k ==-=>+∏ 若服从中心极限定理,则取120,0x x <>,有22211211()t n x k x k n P x x e dt B ξ-=<<=∑, 当12,x x 充分靠近 0 时222112t x x e dt -<⎰. 这就出现了矛盾. 所以中心极限定理不成立. 4.2 服从中心极限定理, 但不服从大数定律取,,()k k j k j P P ξα==,为1()2k P k ξ==,1()2k P k ξ=-=,1,2,,k =可知0,k E ξ=2k D k ξ=,221nnk B k ==∑, 又 3333322221(1)(1)lim lim lim 3(1)n n n n n nn n n n n B B B n →∞→∞→∞++-+-===-+, 即 313223lim lim 13n n n nn nB B -→∞→∞==,()12133lim1n nn B -→∞=又 1ax k k nM n ξ≤≤≤,()1213limlim 03n n n n n B n →∞→∞-== 则由费勒定理知中心极限定理成立, 但不服从大数定律, 这是因为2()xx R n x∈+, 为凸函数, 由琴生不等式222222222()k k k k E k E n n E n kξξξξ≥=+++, 而 222222111111,244nnn k k k k k n k n n k n n n n ===+≥==→→∞++∑∑∑ 由格涅坚克定理知, {}k ξ不服从大数定律.4.3 大数定律与中心极限定理都不服从取,,()k k j k j P P ξα==,为1(2)2k k P ξ==,1(2)2k k P ξ=-=,可知0,k E ξ=4k k D ξ=, 21144(41)3nnk n nk k k B D ξ=====-∑∑, 当 n 充分大时24n nB >,即2n n B > 21112222(21)2nnn n n kk k k ξξ+==≤≤+++=-<∑∑ , 112nk k n B ξ=<∑故11lim (2)1(2)(2)1nk n k n P B ξ→∞=<=≠Φ-Φ-<∑ 可知不服从中心极限定理, 又22222222111144()44k knn n nk k k nk k k k k k E E n n E n n ξξξξ====≥=>++++∑∑∑∑ 22111444(41),4433nk n nn k n n n ===⋅-→→∞++∑, 由格涅坚克定理知不服从大数定律.4.4 大数定律、中心极限定理都服从若{}k ξ为同分布且有有限期望及大于零的方差, 则由教材中定理易知两者都服从.这时有11lim (())1nk k n k P E n ξξε→∞=-<=∑.但括号中的事件概率, 究竞有多大? 大数定律未能回答. 而根据中心极限定理有22111(())()x n nk k k kk x P E P E e dx n ξξεξξσ-==≤-<=-<≈∑其中2k D σξ=, 这样看来在所假定的条件下, 中心极限定理比大数定律更精确.第5章 应用大数定律以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现. 因此,大数定律在理论和实际中都有广泛的应用.5.1[3] “概率”及“数学期望”的确切定义在给出二者定义时,都采用“稳定”一词,这是一种不确切的描述.依据大数定律可给出更确切的表达,即:概率——独立重复实验中,事件A 出现的频率11n Pi i P n ξ=−−→∑,则该常数P 即为概率.数学期望——对于任一0ε>,有11lim ()1ni n i p n ξμε→∞=-<=∑,则()k E μξ=称为数学期望.5.2 解释测量(随机) 误差根据大数定律,对于随机误差12,,,n δδδ,应有110n Pi i n δ=−−→∑.这说明当测量次数较多时, 实测数据的平均值11ni i a n δ=+∑和预测真值a 的差值能以很大概率趋于0,因此,用求样本数据平均值的方法来进行测量是可行的.例1[14] 某种仪器测量已知量A 时,设n 次独立得到的测量数据为12,,,n x x x ,如果仪器无系统误差,问:当n 充分大时, 是否可取作为仪器测量误差的方差的近似值?解 把(1,2,,)i x i n = 视作n 个独立同分布的随机变量的观察值,则()i E x μ=,2(),(1,2,,)i D x i n σ==.仪器第i 次测量的误差i x A -的数学期望()i E x A A μ-=-,方差2()i D x A σ-=.设2(),1,2,,i i Y x A i n =-=,则i Y 也相互独立服从同一分布.在仪器无系统误差时()0i E x A -=,即有A μ=,222()()()()(1,2,,)i i i i i E Y E x A E x Ex D x i n σ⎡⎤⎡⎤=-=-===⎣⎦⎣⎦由车比雪夫定律,可得: 211lim {}1ni n i p Y n σε→∞=-<=∑即 ()2211lim {}1n i n i p x A n σε→∞=--<=∑从而确定,当n →∞时,随机变量()211n i i x A n =-∑依概率收敛于2σ,即当n 充分大时可以取()211n i i x A n =-∑作为仪器测量误差的方差. 5.3 在数学分析中的应用例2[1] 假设()22212121,,,:,0,,12n n n n n G x x x x x x x x ⎧⎫=+++≤≤≤⎨⎬⎩⎭,求其极限.解 假设随机变量(1,2,)n n ξ=在[]0,1上有均匀分布,而且相互独立,有112D ξ=,2112E ξ=,易见(){}22111,,2n n n n n G n dx dx P G P ξξξξ⎧⎫=∈=++≤⎨⎬⎩⎭⎰⎰()()222222211111111111266n nni i P P E P E n n n ξξξξξξξ=⎧⎫⎧⎫⎧⎫=++≤=++-≤≥-≤⎨⎬⎨⎬⎨⎬⎩⎭⎩⎭⎩⎭∑由1,,n ξξ独立同分布,可见221,,,n ξξ独立同分布.根据辛钦大数定律知:2111lim ()16n i i n i p E n ξξ→∞=-≤=∑从而1lim 1n n G n dxdx →∞=⎰⎰.例3 用概率方法证明维尔斯特拉斯[weierstrass ]定理.假定()f x 在闭区间[],a b 上是连续的,那么,存在一列多项式12(),(),B x B x ,一致收敛于函数()f x ,[],x a b ∈.证 不妨设0,1a b ==.假设()f x ,[]0,1x ∈是连续函数,那么()f x 在[]0,1上一致连续并且有界.对于任意[]120,0,0,1x x ε>≤∈存在0δ>,使12()()2f x f x ε-<,只要12x x ε-<.此外,对于一切01x ≤≤,有()f x k ≤(常数).现在,建立一多项式:0()(1)nm m n m n n n m m B x Ef f C x x n n ξ-=⎛⎫⎛⎫==- ⎪ ⎪⎝⎭⎝⎭∑,其中n ξ服从二项分布, 参数为1n ≥, 而[]0,1x ∈, 显然(0)(0)n B f =,(1)(1)n B f =.由贝努利大数定律知()limnn x P nξ→∞=,[]0,1x ∈现在证明()n n B x f n ξ⎛⎫= ⎪⎝⎭一致收敛于()f x ,[]0,1x ∈.由于0(1)1nm mn m nm C x x -=-=∑,可见()()0()(1)nm mn m n n m m B x f x f f x C x x n -=⎡⎤⎛⎫-=-- ⎪⎢⎥⎝⎭⎣⎦∑,由此可得:()()0()(1)nm mn mn n m m B x f x f f x C x x n -=⎛⎫-≤-- ⎪⎝⎭∑()()(1)(1)m m n m m m n m n n mmx x nnm m f f x C x x f f x C x x n n δδ---<-≥⎛⎫⎛⎫=--+-- ⎪ ⎪⎝⎭⎝⎭∑∑2(1)222m m n m n n mx nkC x x kP x n δεεξδ--<⎧⎫<+-=+-≥⎨⎬⎩⎭∑. 由于对任意[]0,1x ∈,Pnx n ξ−−→可见存在N ,使当时n N ≥,4n P x n kξεδ⎧⎫-≥≤⎨⎬⎩⎭ 从而,当n N ≥时,对于一切[]0,1x ∈,有:()()22422n B x f x k kεεεεε-<+=+=.即()n B x 关于[]0,1x ∈一致收敛于()f x .5.4 在计算精确的近似概率方面的应用例4[15] 现有一大批种子,其中良种占1/6 ,今在其中任选6000 粒,试分别用切比雪夫不等式估计和用中心极限定理计算在这些种子中良种所占的比例与1/6之差小于1%的概率是多少?解 设取出的种子中的良种粒数为X ,则1(6000,)6XB 于是1600010006EX np ==⨯= 155(1)60001000666DX np p =-=⨯⨯=⨯(1) 要估计的规律为{}1110006060006100X P P X ⎧⎫-<=-<⎨⎬⎩⎭相当于在切比雪夫不等式中取60ε=,于是{}21110006016000610060X DX P P X ⎧⎫-<=-<≥-⎨⎬⎩⎭由题意得 25111100010.23150.76856063600DX -=-⨯⨯=-= 即用切比雪夫不等式估计此概率不小于0.7685.(2) 由拉普拉斯中心极限定理,对于二项分布1(6000,)6B ,可用正态分布5(1000,1000)6N ⨯近似, 于是所求概率为{}11940106060006100X P P X ⎧⎫-<=<<⎨⎬⎩⎭ 2(2.0785)10.9625≈Φ-Φ≈Φ-≈ 从本例看出:用切比雪夫不等式只能得出来要求的概率不小于0.7685,而用中心极限定理可得出要求的概率近似等于0.9625.从而知道由切比雪夫不等式得到的下界是十分粗糙的.但由于它的要求比较低,只要知道X 的期望和方差,因而在理论上有许多运用.当i X 独立同分布(可以是任何分布),计算1()n P a X X b <++≤的概率时,利用中心极限定理往往能得到相当精确的近似概率,在实际问题上广泛运用.5.5[16][17] 在彩票和保险业的应用大数定律和中心极限定理是概率论中两类具有极大意义的重要定理. 大数定律证明了在大样本条件下,样本平均值可以看作是总体平均值(数学期望) ,它是“算术平均值法则”的理论基础;中心极限定理比大数定律更为详细具体,它以严格的数学形式阐明了在大样本条件下,不论总体的分布如何,样本均值总是近似的服从正态分布. 正是这个结论使得正态分布在数理统计和误差分析中占有特殊的地位,是正态分布得以广泛应用的理论基础. 本文通过对彩票学和保险业等几个具体事例的引用展现了大数定律和中心极限定理的实际应用.大数定理在实际生活中应用十分广泛,我们现在以生活中最平常的但都很感兴趣的事情——彩票为例来详细阐述一下大数定理在彩票学中的应用.我们知道概率论是研究现实世界随机现象的科学,是近代数学的重要组成部分. 它在自然科学以及经济工作中都有着广泛的应用,同时也是数理统计的基础. 彩票投注的中奖概率分布完全符合它的原理. 彩票的投注方法是一个玩数字游戏. 彩票号码的摇出是随机事件,也可以说是一随机现象,属概率论的一个基本概念. 首先我们应该先清楚什么是随机现象? 我们说随机现象的特点是:事先不能预言其结果,具有偶然性;另一方面,在相同条件进行大量的重复试验,会呈现出某种规律性(特别是随机开奖次数的不断增多).例如:在相同条件下,多次抛掷质量均匀的同一枚硬币,则出现正面向上的次数约占总抛次数的一半,而且随着抛掷次数的增加,正面向上次数是总抛次数的12.这就是概率论的统计结果.(请看下面5次抛币的试验结果)有人曾经做过抛掷硬币的试验,试验结果记录如下:投掷次数N,正面向上次数M.N M=M0.5181N=1061=2048N M=N=2048=4040M0.5069N M=M0.5016=12000N=6019N M==24000M0.5005N=12012N M=M0.4996N=14984=30000N M=M0.5011N=36124=72088由上述情况可以看出投掷次数很大时,其频率稳定于0.5彩票每期摇出的中奖号码(基本号码和特别号码)是一个随机事件,既然是随机事件,必有其分布规律.1. 2001010期至2001023期“上海风采”电脑福利彩票开奖计14期共摇出14*8112=个球.2. 每个球平均出现3.6次3. 奇数出现59次;偶数出现53次4. 小于或等于15的数47次;大于或等于16的数出现65次由此,我们引入彩票的一对常用语“冷门号码”及“热门号码”.有了“冷门号码”及“热门号码”,我们只要扑捉到这种机会,将会提高中奖纪律.概率分布的四条法则:1. 奇数.偶数出现的次数应占总数的12(由于不确定因素除外).2. 大数.小数出现的次数应占总数的12(由于不确定因素除外).3. 1-10区段,11-20区段,21-31区段,三区段出现的数个占总数的13(由于不确定因素除外).4. 各数出现的次数,随着实验(开奖)次数的增加不断靠近平均值(由于不确定因素除外).综上所述,随机的摇球事件随着实验(开奖)次数的增加都会显示出它的某些规律性,而这种规律性可以借助概率论的知识,利用小概率统计法,分析判断号码.通过数字统计,运用概率论原理来判断冷热号码出现的周期. 分析号码可能出现的区段. 缩小精选号码范围. 为新一期选择号码提供参考依据,从而达到提高中奖得率.实际上,对于彩票而言,也不是完全没有规律可循,只要经过大量的观察,根据大数定律就可以进行统计预测,提高中奖的几率. 概率论是一门系统学科,一般人了解的概率,不是从理论上认识,仅仅限于经验. 时间的表层认识. 与其硬着头皮去盲目猜测,不如运用简单的概率学统计分析方法更简单,更容易掌握. 把每期中奖号码出现的次数累加起来,一一进行统计,累计到一定量后,就能发现奖项及其相关指标的概率波动特性. 彩民再根据这些进行选号投注,就可以大大提高中奖几率.中心极限定理指出:如果一个随机变量有众多的随机因素所引起,每个因素在总的变化里起着不大作用,就可以推断描述这个随机现象的随机变量近似的服从正态分布,所以要求随机变量之和落在某个区间上的概率,只要把它标准化,用正态分布作近似计算即可. 中心极限定理还及时了离散型随机变量与连续型随机变量的内在联系,即离散型随机变量的极限分布是正态分布.中心极限定理对保险业更是具有指导性的意义,一个保险公司的亏盈,是否破产,我们通过学习中心极限定理的知识都可以做到估算和预测. 大数定律是近代保险业赖以建立的基础. 根据大数定律中心极限定理,我们知道承保的危险单位越多,损失概率的偏差越小,反之,承保的危险单位越少,损失概率的偏差越大. 因此,保险人运用大数法则就可以比较精确的预测危险,合理的拟定保险费率. 下面我们以一道具体的有关保险业的实例来阐述一下大数定律和中心极限定理在保险业中的重要作用和具体应用.例 5 已知在某人寿保险公司里有10000个同一年龄段的人参加保险,在同一年里这些人死亡率为0.1% ,参加保险的人在一年的头一天交付保险费10元,死亡是家属可以从保险公司领取2000元的抚恤金. 求保险公司一年中获利不少于40000 元的概率;保险公司亏本的概率是多少?解 设一年中死亡的人数为x 人. 死亡概率为0.001P = ,把考虑10000人在一年里是否死亡看成10000重贝努里试验,保险公司每年收入为10000*10100000= 元,付出2000x 元.(1) P (保险公司获利不少于40000 元){}(1000002000)40000P x =->=。
概率论基础结课论文题目:独立随机序列的大数事件的定理与应用作者:信计1301班王彩云130350119摘要:概率论历史上第一个极限定理属于伯努利,后人称之为“大数定律”。
概率论中讨论随机变量序列的算术平均值向常数收敛的定律。
概率论与数理统计学的基本定律之一,又称弱大数理论。
大数定律以严格的数学形式表达了随机现象最根本的性质—平均结果的稳定性,它是概率论中一个非常重要的定律,是随机现象统计规律性的具体表现,应用很广泛。
本文介绍了几种常用的大数定律,并分析了它们在理论与实际中的应用。
关键词:弱大数定理伯努利大数定理随机变量数学期望概率引言:“大数定律”本来是一个数学概念,又叫做“平均法则”。
在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律,通俗的说,这个定律就是在试验不变的条件下,重复试验多次,随机事件的频率以概率为稳定值。
比如,我们向上抛一枚硬币,硬币落下时哪一面朝上本身是偶然的,但当我们向上抛的硬币的次数足够多时,达到上万次甚至几十万几百万时之后,我们就会发现,硬币朝上的次数大约占总数的二分之一。
偶然之中包含着必然。
从概率的统计定义中可以看出:一个事件发生的频率具有稳定性,即随着试验次数的增多,事件的频率逐渐稳定在某个常数附近,人们在实践中观察其他的一些随机现象时,也常常会发现大量随机个体的平均效果的稳定性。
这就是说,无论个别随机个体以及它们在试验进行过程中的个别特征如何,大量随机个体的平均效果与每一个体的个别特征无关,而且结果也不再是随机的。
深入考虑后,人们会提出这样的问题:稳定性的确切含义是什么?在什么条件下具有稳定性?这就是我们大数要研究的问题。
概率与统计是研究随机现象的统计规律的学科,而随机现象的统计规律性只有在相同条件下进行大量重复试验或观察才呈现出来。
然而,在大量重复试验或观察中,我们会发现,一个事件发生的频率具有稳定性,它的稳定性会随着试验次数的增多表现得越来越明显。
学号: 学号: 08802053大数定律和中心极限定理的应用分 院 计算机科学与技术学院专 业 信息与计算科学班 级 信计本0801姓 名 李耀指 导 教 师 仝伟2012年5月10日商丘学院毕业设计(论文)商丘学院本科毕业设计(论文)摘要大数定律和中心极限定理是概率论中很重要的定理,也是概率论与数理统计联系的关键所在,更是生活中不可缺少的一部分。
较多文献给出了不同条件下存在的大数定律和中心极限定理,并利用大数定律和中心极限定理得到较多模型的收敛性.但对于它们的适用范围及在实际生活中的应用涉及较少.本文介绍了几种较为常见的大数定律和中心极限定理,并列举了它们在经济生活、数学分析、信息论等各个不同领域的应用.将理论具体化、将可行的结论用于具体的数学模型中,以使得枯燥的数学理论与实际相结合,使大家对大数定律与中心极限定理在实际生活中的应用价值有了更深的认识。
关键词:大数定律,中心极限定理,期望,方差,应用AbstractThe law of large numbers and central limit theorem is very important in probability theory theorem,and it is not only the contact key of Probability theory and mathematical statistics,but also an indispensable part of life。
Many literatures have given the dissimilar conditions of the law of large numbers and central limit theorem.Many literatures have given the dissimilar conditions of the law of large numbers,and have obtained the astringent using the law of large numbers and central limiting theorems.But here has no many results in practical life and applicable scope。
探讨大数定理和中心极限定理在统计学中,大数定理和中心极限定理是两个非常基础也非常重要的概念。
它们被广泛地应用于各个领域,从自然科学到社会科学,均有广泛的应用。
本文将探讨大数定理和中心极限定理的原理和应用。
一、大数定理大数定理是指在一系列独立重复随机试验中,随着试验次数的增加,样本平均值的稳定值越来越接近于总体期望。
即在试验次数无限大的情况下,样本平均值趋近于总体期望。
大数定理是描述众多随机变量平均值随机波动在样本容量不断增大的情况下,其平均值逐渐趋于一个确定的常数的数学原理。
大数定理的重要性在于它解释了样本平均值与总体平均值之间的关系。
随机试验中的抽样调查往往就是指对一个总体进行一定规模的随机抽样,从而得到一个代表样本,这时样本平均值通过大数定理,可算得总体平均数的近似值。
大数定理是数学上成立的,但是证明这个定理需要数学推导和分析。
不同的大数定理有不同复杂程度的证明过程,从简单的Bernoulli大数定理(伯努利大数定律)到更为复杂的Khintchine 大数定理。
这些定理在不同情况下有着不同的适用范围。
二、中心极限定理中心极限定理(Central Limit Theorem)是概率论中的一个重要定理,指的是若随机变量的和服从一定的分布,则当变量的个数趋近于无限大时,其标准化后的和的分布趋向于正态分布。
也就是说,样本容量越大,样本均值的分布就会越接近正态分布。
中心极限定理的作用是刻画了随机变量和与正态分布之间的关系,即多个独立随机变量密度函数之和趋近于正态分布。
中心极限定理的证明可使用数学推导和图示法来完成。
图示法通常展示为随机变量和的密度函数曲线,以及随着样本容量的增大,近似正态分布曲线的逐渐出现。
这种图示法将把一个随机变量的分布逐渐转变为一种另外的分布,称为极限分布。
在中心极限定理的情况下,这个极限分布是正态分布。
三、应用和意义大数定理和中心极限定理对于现代科学和理论探索意义重大。
它们能够帮助我们预测未来的结果、分析已知结果、探索性质变化和最小量规模,以及帮助我们理解统计分布和抽样分布分析等。
. 1本科毕业论文( 2013届)题目: 大数定律及其应用学院: 数学与信息科学学院专业: 统计学班级: 09统计姓名:学号:指导老师:完成日期: 2013年4月1日目录§1、引言 (2)§2、大数定律的发展历程 (3)§3、常见的大数定律及中心极限定理 (4)§3.1常见的大数定律 (4)§3.2常见的中心极限定理 (5)§4、大数定律的应用 (6)§4.1大数定律在数学分析中的应用 (6)§4.1.1 在积分方面的应用 (6)§4.1.2 在极限中的应用 (7)§4.2大数定律在生产生活中的应用 (9)§4.2.1 误差方面的应用 (9)§4.2.2 估计数学期望和方差 (13)§4.3大数定律在经济中的应用 (13)§4.3.1 大数定律在保险业中的应用 (13)§4.3.2 大数定律在银行经营管理中的应用 (16)§5、结束语 (18)§6、致 (18)参考文献 (19). .大数定律及其应用(大学数学与信息科学学院09统计)摘要:大数定律顾名思义就是指当样本数据量很大的时候,然后某一变量就会呈现出某种规律性,这一呈现出规律性的变量就是我们经常说的平均值,即当样本数据量很大的时候,平均结果将稳定于某一稳定值。
大数定律在概率论中的重要性不言而喻,而且其在数学领域以及经济生活领域也有着非常重要的作用。
本文列举了我们在大学阶段经常遇到的一些大数定律和中心极限定理,通过一些具体的例题,介绍了常见的大数定律和中心极限定理在一些重要领域的应用,具体包括在数学分析中求极限和积分,预测误差,近似计算,以及在保险业和银行经营管理方面的应用,进一步阐明了大数定律与中心极限定理在各分支学科中的重要作用和应用价值。
关键词:大数定律;中心极限定理;经济生活;应用§1、引言大数定律对于很多人来说都很陌生,即使学过概率论的也说不出个所以然。
大数定律关于相依变量的扩展马尔可
夫
出于扩大极限定理应用范围的目的,马尔科夫在20世纪初开始考虑相依随机变量序列的规律,并从中选出了最重要的一类加以研究。
1906年他在《大数定律关于相依变量的扩展》一文中,第一次提到这种如同锁链般环环相扣的随机变量序列,其中某个变量各以多大的概率取什么值,完全由它前面的一个变量来决定,而与它更前面的那些变量无关。
这就是被后人称作马尔科夫链的著名概率模型,也是在这篇论文里,马尔科夫建立了这种链的大数定律。
用一个通俗的比喻来形容,一只被切除了大脑的白鼠在若干个洞穴间的蹿动就构成一个马尔科夫链。
马尔科夫链在自然科学、工程技术、经济管理等领域都有广泛的应用。
摘要大数定律是概率论中的重要内容,它以严格的数学形式表达了随机现象最根本的性质——平均结果的稳定性,它是随机现象统计规律性的具体表现,在数学应用及经济生活中有着较为重要的作用,较多文献给出了不同条件下存在的大数定律,并利用大数定律得到较多模型的收敛性,但对于它们的适用范围及在实际生活中的应用涉及较少。
本文就不同条件下存在的大数定律做了具体的分析,介绍了几种较为常见的大数定律,并结合它们存在的条件的不同,分析了它们各种适用的数学模型的特征,列举了它们在经济生活、数学分析、信息论等各个不同领域的应用,将理论具体化,将可行的结论用于具体的数学模型中,以使得枯燥的数学理论与实际想结合,使大家对大数定律在实际生活中的应用价值有了更深的认识。
关键字:大数定律;随机变量序列;应用;1引言概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 大数定律是概率论中的两类具有极大意义的重要定理,是概率论与数理统计之间承前启后的重要纽带,大数定律阐明了大量随机现象平均结果具有稳定性,证明了在大样本条件下,样本平均值可以看作总体平均值,它是“算术平均值法则"的基本理论,在现实生活中,经常可见这一类型的数学模型。
例如, 在抛掷硬币的随机试验中, 正面出现频率a,若以x1,x2,x3,…,xn表示抛掷n次硬币的结果,经验告诉我们,当n充分大时,它们的算术平均值与a的偏差就越小。
这种思想,不仅在整个概率论中起着重要的作用,而且在其他数学领域里面也占据着相当重要的地位。
现在,大数定律的相关模型已经被国内外为广大学者研究,特别是应用在实际生活中,如保险业得以存在并不断发展壮大的两个基石中的一个就是大数定理。
在许多数学领域中,广大学者对某些具有特定类型的数学模型,都能利用大数定律的思考方式总结其代表性的性质及结论,使得这些类型的数学模型在进行讨论的时候大大简化了繁琐的论证过程,方便了研究,但是,很多模型由于存在的条件不同,就需要考虑在各种条件下的大数定律它们所适用的范围和对不同模型的处理方式。
很多科研成果虽然给出了存在条件,由于讨论目的及撰写方式的不同,自然缺少一些较为体系的应用模式,使得这些成果不能较好的发挥其真正的作用。
而对大数定律的应用问题的推广是一项非常有价值的研究方向,通过对这些问题的应用推广,不仅能加深对大数定律的理解,而且能使之更为有效的服务于各项知识领域中。
下面就是列举的一些能用大数定律解决的实例,希望能通过这些实例,加深大家对大数定律以及中心极限定理的理解。
1 大数定律1 事件发生的频率具有稳定性;2 大量测量值的算术平均值也具有稳定性。
大数定律就是从这种稳定性的研究中得出的。
定理一(契比雪夫大数定律)设随机变量序列…相互独立,且具有相同的数学期望和方差:前n个随机变量的算术平均:对于任意正数,有=则称{Xn}服从大数定律。
证:由于由契比雪夫不等式可得:在上式中令并注意到概率不能大于1,即得:1 定理一给出了关于平均值稳定性的科学的描述。
2 上式的意义:是一个随机事件,等式表明,当时,这个事件的概率趋于1。
即对于任意正数,当n充分大时,不等式成立的概率很大。
3 还表明,当n很大时,随机变量的算术平均接近于数学期望.这种接近是在概率意义下的接近。
4 说明平均结果渐趋稳定性。
即单个随机现象的行为对大量随机现象共同产生的总平均效果E()几乎不发生影响。
即尽管某个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,这些随机偏差相互抵消、补尚与拉平,致使总平均结果趋于稳定。
例如在分析天平上称量一质量为的物品,以表示n次重复测量结果,经验告知,当n 充分大时,其平均值对的偏差是很小的。
定义:设是一个随机变量序列,a是一个常数。
若对于任意正数,有:则称序列依概率收敛于a,记为:依概率收敛的序列还有以下的性质:设又设函数g(x,y)在点(a,b)连续,则:定理一又可叙述为:设随机变量相互独立,且具有相同的数学期望和方差:则序列前n个随机变量的算术平均依概率收敛于,定理二(伯努利大数定理)设nA是n次独立重复试验中事件A发生的次数,p是事件A在每次试验中发生的概率,则对于任意正数有或:证:因为nA~b(n,p),引入随机变量:由于X1,X2…,Xn相互独立,又知Xk,k=1,2,…,n服从同一(0—1)分布:Xk 0 1Pk 1-p p 已知由定理一得:即伯努利大数定理表明:事件发生的频率依概率收敛于事件的概率P,这个定理以严格的数学形式表达了频率的稳定性。
就是说当n很大时,事件发生的频率与概率有较大偏差的可能性很小。
由实际推断原理,在实际应用中,当试验次数很大时,便可以用事件发生的频率来代替事件的概率。
切比雪夫大数定律的证明要求随机变量具有方差。
但进一步的研究表明,方差存在这个条件有时并不是必要的,定理三就是这种情况。
定理三(辛钦大数定理):设随机变量相互独立,服从同一分布,且具有数学期望,则对于任意正数,有:(证明略)显然,伯努利大数定理是辛钦定理的特殊情况。
大数定理以严格的数学形式表达了随机现象最根本的性质之一:平均结果的稳定性,它是随机现象统计规律的具体表现。
在理论和实际中有广泛的应用。
例如,要测量一个圆柱形工件的直径,由于仪器的测量误差、读数的偏差以及温度的变化等各种原因,使每次测量的结果是随机的。
如果测量n次,得到,其算术平均值为,当n较大时,此平均值就可作为直径的一个估计,其理论依据是大数定理。
例如,要估计某地区水稻的平均亩产量,只要收割一部分有代表性的地块,比如n块,计算它们的平均亩产,在n比较大的情况下,n块的平均亩产量就可以作为全地区的平均亩产量。
其理论依据也是大数定理。
例:设随机变量序列相互独立,且均服从(a,b)区间上的均匀分布,问平均值依概率收敛于何值?解:因为Xk~U(a,b),k=1,2,…,n,则由辛钦大数定理知。
例:设随机变量序列相互独立,且均服从泊松分布,试问当n很大时,可用何值估计?解:因为由辛钦大数定理知即当n很大时,可用值代替λ。
具体的,若有的一组观察值。
附加内容:概率论的简单应用1 池塘内鱼总数的概率估计问题是这样的,为了了解一池塘内鱼的总数,我们先捕捞一次,假定捕出r条,做上记号后放回池塘里(设记号不消失),过一段时间后,即让有记号的鱼与无记号的鱼混合匀称后,再从池塘中捕出s条,(),观察其中有t条()标有记号,试根据如此信息,估计池塘中鱼总数N的值。
对于这个问题,可以有以下几种解法:解法一:依题意,池塘中有记号的鱼的比例应为,即在N条中有r条记号的概率,而在捕出的s条中有记号的鱼为t条,故有记号的鱼的比例为(频率)。
设想捕鱼是完全随机的,每条被捕到的机会相等,于是根据频率来近似概率的道理,便有:即得因N需要为整数,故可取N的估计(最大整数部分),此即为池塘中鱼总数的一种估计。
其它一些类似的问题,如估计一个城市的人口总数,也可用同样的方法去考虑。
2 人寿保险中赔偿金的确定问题保险机构是最早使用概率论的部门之一,保险公司为了恰当地估计企业的收支和风险,需要计算各种各样的概率,下面的赔偿金的确定问题,就是概率论在保险企业中的一个典型应用问题。
据统计,某年龄的健康人在五年内死亡的概率为,某保险公司准备开办该年龄段的五年人寿保险业务,预计有2500人参加保险,条件是参加保险者交保险金12元,若五年内死亡,公司支付赔偿金b元(b待定),便有以下几个问题:确定b,使保险公司期望盈利;确定b,使保险公司盈利的可能性超过99%;确定b,使公司的期望盈利超过1万元;确定b,使保险盈利超过1万元的可能性大于95%;若赔偿金b=2000元,试确定公司盈利的期望值和盈利超过2万元的可能性;若赔偿金为b=2000元,欲使保险公司盈利20万元,每位参保者至少需交保险金a为多少元?若赔偿金b=2000元,欲使保险公司盈利的可能性大于99%时,每位参保者至少需交保险金a为多少元?上述问题的解决是:(1)设X表示保险公司在每一个参保者身上所得的收益,则X为随机变量,服从两点分布,其分布规律为X1212-bPk0.9980.002故保险公司在每一位参保者身上获的平均收益E(X)=12×0.998+(12-b)×0.002=12-0.002b若要使保险公司期望盈利,则应有E(X)=12-0.002b>0于是可得b<6000(元)时,保险公司期望盈利。
(2)设Y表示五年内参保者的死亡人数。
若要使保险公司盈利,则应有2500×12-Yb>0由此可得出死亡人数 Y<2500×=r1将Y视作随机变量,若把参保者是否死亡看成相互独立的随机事件,则2500人在5年内死亡人数服从参数为2500,的二项分布,即其分布律为于是,使保险公司盈利的可能性大于99%,就意味着即考虑泊松近似计算,此处即得而根据不等式,由泊松分布表查得 r1=12即得元(3)由于保险公司从每个人身上获得收益为E(X)=12-0.002b,则公司从2500人身上获期望收益2500×12-2500×0.002b>10000从上解出b<4000元时公司期望盈利可超过1万元。
(4)欲使保险公司盈利超过1万元,须2500×12-Yb>10000由此得出死亡人数故若使保险公司期望盈利超过1万元等价于Y<r2,其可能性大于95%即如(2)中计算,查泊松分布表得r2=9即得元(5)由(1)知,当b=2000时,保险公司从个人身上获期望收益为E(X)=12-0.002×2000=8元于是公司的期望总收益为2500×8=20000元又当赔偿金为2000元时,公司盈利超过2万元等价死亡人数人于是保险公司盈利超过2万元的可能性为(6)现在确定a,而b=2000元固定,设X仍为公司从每个参保者身上获取收益,则X 的分布律为Xaa-2000Pk0.9980.002期望收益E(X)=0.998a+(a-2000)×0.002=a-4(元)欲使保险公司期望盈利2万元时,应有 2500(a-4)>20000由此推得 a>12元(7)仍设随机变量Y为2500中死亡人数,则Y~B(2500,0.002),而公司盈利2万元即 2500a-2000Y>20000等价死亡人数若欲,即查泊松分布表知即得元即要求每位参保者至少交纳17.6元。
保险行业中的其它问题,如家产保险,自行车保险,机动车保险,机动车辆事故保险等问题,本质上与此类似,区别仅在于问题的假定及风险的确定。
一、契比雪夫不等式(Chebyshev inequality)Theorem 4.1 设随机变量的均值及方差存在,则对于任意正数,有不等式或成立。