概率论中的大数定律及中心极限定理
- 格式:doc
- 大小:652.00 KB
- 文档页数:23
中心极限定理与大数定律介绍中心极限定理(Central Limit Theorem)和大数定律(Law of Large Numbers)是概率论中两个重要而基础的定理。
它们在统计学和各个领域的实际应用中起着至关重要的作用。
本文将深入探讨这两个定理的概念、应用和相关证明。
中心极限定理定义中心极限定理是概率论中的一个重要定理,它说明了在特定条件下,一组随机变量的均值的分布会趋近于正态分布。
具体来说,对于任意独立同分布的随机变量的和,当样本容量足够大时,其均值的分布将会接近于正态分布。
证明中心极限定理的证明可以通过多种方法进行推导,其中最为经典的方法是使用特征函数的技巧。
通过对特征函数的逐步展开和极限取证,可以得出中心极限定理的结论。
应用中心极限定理在实际应用中有着广泛的应用。
以下是中心极限定理的几个重要应用:1.抽样分布的近似计算:通过中心极限定理,可以对抽样分布进行近似计算,从而推断总体参数。
2.假设检验:在统计学中,中心极限定理广泛应用于假设检验问题中。
通过对样本均值进行正态分布近似,可以进行对总体均值的假设检验。
3.建立置信区间:中心极限定理可用于建立置信区间。
通过计算样本均值的区间估计,确定总体均值的信心水平。
大数定律定义大数定律是概率论中的另一个重要定理,它说明了当独立同分布的随机变量重复进行实验时,其平均值会收敛于数学期望。
换句话说,随着实验次数的增加,样本均值会趋近于总体均值。
证明大数定律的证明有多种方法,其中最为著名的是切比雪夫不等式和辛钦大数定律。
不同的证明方法都有其特点和适用范围,但最终都能得出大数定律的结论。
应用大数定律在实际应用中也有着广泛的应用。
以下是大数定律的几个重要应用:1.统计估计:大数定律可用于建立统计估计方法,如最大似然估计和矩估计。
2.贝叶斯推断:大数定律在贝叶斯推断中起着重要的作用。
通过重复实验,可以逐渐更新对参数的先验分布,得到后验分布。
3.经济学和金融学:大数定律在经济学和金融学中有广泛的应用。
概率论中的大数定律与中心极限定理概率论是数学中的重要分支,研究随机现象的规律性。
在概率论中,大数定律和中心极限定理是两个基本定理,它们对于理解和应用概率论具有重要意义。
一、大数定律大数定律是概率论中的一项重要成果,它研究的是随机事件重复进行时,随着试验次数的增加,事件的频率趋于稳定的现象。
大数定律的核心思想是:随机事件的频率会趋于其概率。
大数定律有多种形式,其中最著名的是弱大数定律和强大数定律。
弱大数定律指出,当随机事件重复进行时,事件的频率会接近其概率,但不一定完全相等。
而强大数定律则更加严格,它指出,当随机事件重复进行时,事件的频率几乎必定会趋于其概率。
大数定律的应用非常广泛。
例如,在赌场中,赌徒们常常利用大数定律来制定自己的投注策略。
他们相信,通过多次下注,最终能够获得稳定的胜率。
另外,在统计学中,大数定律也是重要的理论基础。
通过对大量样本的观察,我们可以得出对总体的推断。
二、中心极限定理中心极限定理是概率论中的另一个重要定理,它研究的是随机变量的和的分布趋于正态分布的现象。
中心极限定理的核心思想是:随机变量的和趋于正态分布的程度与随机变量的分布无关,只与样本容量有关。
中心极限定理有多种形式,其中最著名的是中心极限定理的拉普拉斯形式和莫尔根-拉普拉斯形式。
中心极限定理的拉普拉斯形式适用于二项分布和泊松分布,而莫尔根-拉普拉斯形式适用于任意分布。
中心极限定理的应用广泛而深入。
在实际生活中,我们常常遇到一些随机现象,如测量误差、人口统计等。
通过应用中心极限定理,我们可以对这些随机现象进行更准确的分析和预测。
三、大数定律与中心极限定理的关系大数定律和中心极限定理是概率论中两个相互关联的定理。
它们都是研究随机现象的规律性,但侧重点不同。
大数定律研究的是随机事件的频率趋于稳定的现象,它关注的是事件本身的概率。
而中心极限定理研究的是随机变量的和的分布趋于正态分布的现象,它关注的是随机变量的分布。
大数定律和中心极限定理的关系可以从两个方面来理解。
概率论中的大数定律与中心极限定理概率论是数学中的一个重要分支,研究随机现象的规律性。
在概率论中,大数定律和中心极限定理是两个基本而又重要的概念。
本文将详细探讨这两个定律,并阐述它们在概率论中的应用。
一、大数定律大数定律是概率论中最为基本的定律之一。
它描述了在独立重复试验的条件下,随着试验次数的增加,随机事件的频率会趋于稳定,即其概率的长期平均值会趋于事件的真实概率。
大数定律可以分为弱大数定律和强大数定律两种形式。
弱大数定律是指在概率分布具有一定条件时,频率收敛到概率的几乎必然成立。
也就是说,如果一个事件发生的概率为p,那么当试验次数增加时,该事件发生的频率会趋于p。
这种定律的典型应用是频率稳定的硬币投掷问题。
当试验次数趋于无穷大时,正面朝上的频率会收敛于0.5,即硬币的正反面概率相等。
强大数定律是指在一般条件下,频率收敛到概率的几乎必然成立。
它比弱大数定律更为强大,可以涵盖更广泛的情况。
例如,当试验次数无限大时,独立同分布随机变量的均值收敛于其数学期望。
这种定律对于实际问题的应用更为广泛,可以用于解释一系列现象,如赌博、股票市场等。
二、中心极限定理中心极限定理是概率论中最为重要的定理之一。
它描述了当独立同分布随机变量的和的样本容量足够大时,这个和的分布会趋近于正态分布。
中心极限定理包括三种形式:李雅普诺夫定理、林德贝格-列维定理和棣莫弗-拉普拉斯定理。
李雅普诺夫定理是中心极限定理的一种形式,描述了独立随机变量和的分布趋近于正态分布的条件。
它要求随机变量具有有限的方差,并且样本容量足够大。
在实际应用中,李雅普诺夫定理可以用于描述大量相互独立事件的和的分布。
林德贝格-列维定理是中心极限定理的另一种形式,描述了独立同分布随机变量和的分布趋近于正态分布的条件。
与李雅普诺夫定理相比,林德贝格-列维定理的条件更为宽松,不再要求有限的方差。
这使得林德贝格-列维定理在实际应用中更为通用。
棣莫弗-拉普拉斯定理是中心极限定理的一种特殊情况,适用于二项分布。
大数定律与中心极限定理总结大数定律与中心极限定理是概率论与数理统计中的两个重要定理,用于描述随机变量序列的性质。
下面我将分别对这两个定理进行总结,并给出相关的参考内容。
一、大数定律大数定律是概率论中的一个基本定理,描述了随机变量序列的极限性质。
大数定律可以分为弱大数定律和强大数定律两种。
1. 弱大数定律弱大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值收敛于某个常数,那么这个序列就满足弱大数定律。
弱大数定律的代表是辛钦大数定律。
具体来说,如果一个随机变量序列X1, X2, ..., Xn,其中Xi是相互独立、同样分布的随机变量序列,它们的均值为μ,方差为σ^2。
那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1这意味着当样本数量趋向于无穷大时,样本均值的概率逼近于1,即样本均值趋近于总体均值μ。
2. 强大数定律强大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值以概率1收敛于某个常数,那么这个序列就满足强大数定律。
强大数定律的代表是伯努利大数定律和切比雪夫大数定律。
伯努利大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其中每个随机变量取值为0或1,概率为p或1-p,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - p| ≤ ε ) = 1切比雪夫大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其具有相同的均值μ和方差σ^2,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1以上的大数定律说明了随机变量序列的均值具有稳定的性质,当样本数量足够大时,样本均值可以准确地反映总体均值。
二、中心极限定理中心极限定理是概率论与数理统计中的一个基本定理,描述了独立随机变量和的分布的极限性质。
大数定律与中心极限定理公式
大数定律和中心极限定理是概率论和统计学中的重要概念,它们描述了在大量重复实验或观察中随机变量的性质。
大数定律是指当试验次数趋于无穷时,随机变量的相对频率趋于其概率。
具体来说,如果一个随机变量序列{ξn, n ∈ N} 的期望存在且等于某个常数ξ,那么对于任意小的正数ε,当 n 趋于无穷时,P( ξn - ξ ≥ ε ) 趋于 0。
中心极限定理则是指无论随机变量 X1, X2,..., Xn 的分布是什么,只要 n 足
够大,那么它们的和 X1 + X2 + ... + Xn 除以 n 的标准化形式就会近似地
服从标准正态分布 N(0, 1)。
也就是说,对于任意x ∈ R,有limn→∞
P(∣∑i=1nxi−nμ∣≤xσn)=Φ(x)\lim_{n \to \infty}
P(\frac{\sum_{i=1}^{n}x_i-n\mu}{\sqrt{n\sigma^2}} \leq x) =
\Phi(x)limn→∞P(∣∣∑i=1nxi−nμ∣∣≤xnσ2)=Φ(x),其中μ 是 X1, X2,...,
Xn 的期望,σ^2 是它们的方差,Φ(x)是标准正态分布 N(0, 1) 的分布函数。
这两个定理在统计学中有着广泛的应用,例如在样本均值的分布、样本比例的分布、回归分析等方面都有重要的应用。
大数定律和中心极限定理一.车贝雪夫不等式若随机变量X 的数学期望EX 和方差DX 存在,则对于任意给定的0>ε,必有 2)(εεDX EX X P ≤≥- 或21)(εεDXEX X P -><-二.大数定律1. 辛钦大数定律设 ,,,,21n X X X 为一列互相独立的随机变量,服从相同的分布,μ=i EX ,2σ=i DX ,),2,1( =i ,则对于任意正数ε,有1}|1{|lim 1=<-∑=∞→εμni i n X n P 2. 贝努利大数定律设n u 是n 次独立重复试验中事件A 出现的次数,p 是事件A 在每次试验中出现的概率,则对于任意给定的0>ε,必有1}|{|lim =<-∞→εp nu P n n 三.中心极限定理1. Levy-Lindeberg 中心极限定理:设 ,,,,21n X X X 为独立同分布的随机变量序列,若μ=i EX ,2σ=i DX ,),2,1( =i ,则当n 充分大时,∑=ni i X 1近似服从正态分布),(2σμn n N , 即lim )n i n X n P x μ→∞-≤=∑du e xu ⎰∞--2221π。
2. 德莫佛尔-拉普拉斯极限定理:在贝努利试验中,若事件A 发生的概率为p 又设X 为n 次独立重复试验中事件A 发生的频数,则当n 充分大时,X 近似服从正态分布),(npq np N 。
例1:某保险公司有10000个同一年龄的人参加人寿保险,在一年里这些人的死亡率为1‰,参加保险的人在一年的头一天交付保险费10元,死亡时,家属可以从保险公司领取元2000抚恤金求(1) 险公司一年中获利不小于40000元的概率。
(2) 保险公司亏本的概率。
(9993.0)163.3(,1)3271.6(=Φ=Φ,9993.0)164.3(,1)654.12(=Φ=Φ)解:一年中死亡的人数为X ,则X ~)001.0,10000(B(1) 保险公司一年中获利不小于40000元的概率}30{≤=X P }3271.6999.0001.01000010{≤⨯⨯-=X P)3271.6(Φ=1=。
大数定律与中心极限定理大数定律和中心极限定理是概率论中两个重要的定理,它们在统计学和概率论中有着广泛的应用。
本文将分别介绍大数定律和中心极限定理的概念、原理以及在实际应用中的意义。
大数定律是概率论中的一个重要定理,它描述了随机变量序列的均值在重复试验中的稳定性。
大数定律告诉我们,随着试验次数的增加,样本均值会趋向于总体均值,即样本均值收敛于总体均值的概率接近于1。
大数定律的核心思想是随机现象的规律性,即在大量独立重复试验中,样本均值会逐渐接近总体均值。
以弱大数定律为例,它指出对于独立同分布的随机变量序列,样本均值以概率1收敛于总体均值。
这意味着在进行大量独立重复试验时,样本均值会逐渐接近总体均值,从而使得我们可以通过样本均值来估计总体均值。
大数定律的应用非常广泛,例如在统计学中,通过样本均值来估计总体均值是一种常用的统计方法。
另一个重要的定理是中心极限定理,它描述了大量独立同分布随机变量的和的分布在适当标准化后近似服从正态分布。
中心极限定理的核心思想是当随机变量的数量足够大时,它们的和的分布会趋近于正态分布。
这个定理在实际应用中具有重要意义,因为正态分布具有许多重要的性质,使得我们可以通过正态分布来进行各种统计推断。
中心极限定理有两种形式,一种是林德伯格-莱维中心极限定理,它适用于具有有限方差的随机变量序列;另一种是李雅普诺夫中心极限定理,它适用于具有有限高阶矩的随机变量序列。
这两种中心极限定理在不同情况下具有不同的适用范围,但它们都揭示了随机变量和的分布在适当标准化后趋近于正态分布的规律。
总的来说,大数定律和中心极限定理是概率论中两个重要的定理,它们揭示了随机现象的规律性,并在统计学和概率论中有着广泛的应用。
通过理解和运用这两个定理,我们可以更好地理解和分析随机现象,从而为实际问题的解决提供有力的工具和方法。
大数定律与中心极限定理大数定律与中心极限定理解析大数定律与中心极限定理是概率论中两个重要的定理。
它们揭示了随机现象的一种普遍性规律,对于我们理解和解释实际问题具有重要的参考价值。
大数定律大数定律是概率论中研究随机现象规律性的重要定理之一。
它表明,随着样本数的增加,样本均值趋近于总体均值,即大概率情况下样本的平均值与总体平均值之间的差异会逐渐减小。
这个定律的重要性在于,它提供了一种从有限样本推断总体特征的方法。
大数定律的直观解释如下:假设我们投掷一颗均匀的骰子,每次投掷的结果是随机的。
我们重复投掷100次,并记录每次投掷的点数。
根据大数定律,当投掷次数足够多时,各个点数出现的次数应该接近均匀分布,即每个点数出现的概率接近1/6。
换句话说,大数定律告诉我们,随着投掷次数的增加,样本的平均点数应该接近3.5,即骰子的期望值。
中心极限定理中心极限定理是概率论中的另一个重要定理。
它表明在一定条件下,大量独立随机变量的和近似服从正态分布。
换句话说,中心极限定理告诉我们,当我们将多个随机变量进行加和时,其分布会趋近于正态分布。
中心极限定理的具体形式有多种,其中最为常见的是离散随机变量的中心极限定理和连续随机变量的中心极限定理。
无论是哪种形式,中心极限定理都具有广泛的应用领域。
例如,在统计学中,我们常常借助中心极限定理来进行假设检验、置信区间估计等。
大数定律与中心极限定理的联系尽管大数定律和中心极限定理是两个独立的定理,但它们在解释随机现象时常常相互联系。
大数定律关注的是样本均值与总体均值的关系,探讨样本均值的稳定性。
而中心极限定理则关注的是多个独立随机变量的和服从正态分布的问题,主要研究总体的分布特征。
当样本数足够大时,根据大数定律,样本均值会趋近于总体均值。
而根据中心极限定理,当随机变量的数量足够多时,随机变量的和的分布会趋近于正态分布。
这两个定理的联系在于,当我们用多个样本均值加和来近似总体时,根据中心极限定理,所得到的和的分布会趋近于正态分布,进而可以应用正态分布的一些性质对总体进行研究和推断。
大数定律和中心极限定理大数定律(Law of Large Numbers)是概率论中的一个重要定理,它揭示了在一系列独立随机事件中,随着样本量的增大,样本均值将趋于总体均值的规律。
中心极限定理(Central Limit Theorem)则是统计学中的一项基本定理,它说明了在大样本条件下,一组独立随机变量的和具有近似正态分布的特性。
两个定理在统计分析和推断中都起到了重要作用。
大数定律(Law of Large Numbers)大数定律是概率论中的一个基础定理,它描述了独立随机事件的平均值在大样本条件下会无限接近于事件的真实概率。
根据大数定律,当独立随机事件重复进行时,样本均值将逐渐接近总体均值。
大数定律有两种形式:辛钦大数定律和伯努利大数定律。
辛钦大数定律是指当随机变量的期望存在时,样本均值以概率1收敛于期望值。
也就是说,无论一个事件发生的可能性有多小,只要重复进行足够多的实验,该事件发生的频率将无限接近于其概率。
伯努利大数定律是针对二项分布的情况,它说明了在一系列独立重复的二项试验中,随着试验次数的增加,事件发生的频率将逐渐接近于事件的概率。
大数定律在实际应用中有着广泛的作用。
例如,投资者根据历史数据计算股票收益率的期望,大数定律告诉我们当样本容量足够大时,计算得到的样本均值将逼近真实的期望收益率,从而提供了对未来股票表现的一定参考。
中心极限定理(Central Limit Theorem)中心极限定理是统计学中的一项基本定理,它指出在大样本条件下,一组独立随机变量的和具有近似正态分布的特性。
中心极限定理是统计学中推断的基础,它的重要性在于它使得我们可以利用正态分布的性质进行概率和置信区间的计算。
中心极限定理的表述可以分为两种形式:李雅普诺夫型和林德伯格-李维定理。
李雅普诺夫型定理给出了随机变量和的分布函数收敛到正态分布的条件,其中随机变量可以不是独立同分布的。
林德伯格-李维定理则是对独立同分布随机变量和的和近似服从正态分布的定理。
大数定律与中心极限定理大数定律和中心极限定理是概率论中两个重要的定理,它们分别描述了随机变量序列的极限行为。
在统计学和概率论中,这两个定理被广泛应用于估计和推断,对于理解随机现象的规律具有重要意义。
一、大数定律大数定律是概率论中的一个基本定理,它描述了独立同分布随机变量序列的均值在概率意义下收敛于其数学期望的现象。
大数定律分为弱大数定律和强大数定律两种形式。
1. 弱大数定律弱大数定律又称为辛钦大数定律,它是概率论中最早被证明的大数定律之一。
弱大数定律指出,对于独立同分布的随机变量序列$X_1, X_2, \cdots, X_n$,如果这些随机变量的数学期望存在且有限,记为$E(X_i)=\mu$,则随着样本量$n$的增大,样本均值$\bar{X}_n=\frac{1}{n}\sum_{i=1}^{n}X_i$以概率1收敛于数学期望$\mu$,即$\lim_{n \to \infty}P(|\bar{X}_n-\mu|<\varepsilon)=1$,其中$\varepsilon$为任意小的正数。
弱大数定律的直观解释是,随着样本量的增加,样本均值会逐渐接近总体均值,即样本的平均表现会趋向于总体的真实情况。
这一定律在统计学中有着广泛的应用,例如在抽样调查、质量控制等领域中被频繁使用。
2. 强大数定律强大数定律是大数定律的另一种形式,它要求更高,即要求随机变量序列的方差有限。
强大数定律指出,对于独立同分布的随机变量序列$X_1, X_2, \cdots, X_n$,如果这些随机变量的方差存在且有限,记为$Var(X_i)=\sigma^2$,则随着样本量$n$的增大,样本均值$\bar{X}_n$以概率1收敛于数学期望$\mu$,即$\lim_{n \to\infty}P(\bar{X}_n=\mu)=1$。
强大数定律相比于弱大数定律更加严格,要求随机变量序列的方差有限,但在实际应用中,强大数定律的条件并不总是成立。
大数定律与中心极限定理大数定律与中心极限定理是概率论中非常重要的两个定理。
它们揭示了随机事件的规律性,对于人们理解概率分布以及进行统计推断都有着重要意义。
首先,让我们来谈谈大数定律。
大数定律是概率论中最基本的定律之一,它描述了当独立随机事件无限重复时,其平均值会趋向于事件的真实概率。
大数定律的核心观点是随着试验次数的增加,样本的平均值会趋向于总体均值。
这个定律在实际中有很多应用,例如舆论调查、市场研究等。
中心极限定理则是描述当随机变量具有一定分布时,其样本均值的分布趋近于正态分布的现象。
中心极限定理分为三种形式:李雅普诺夫定理、林德贝格-列维定理和博雷尔-柯尔莫哥洛夫定理。
其中最常用的是林德贝格-列维定理。
该定理表明,当样本量足够大时,无论总体分布是什么,样本均值的分布都接近于正态分布。
大数定律和中心极限定理的共同点是它们都涉及到随机事件的重复。
大数定律关注的是事件的概率,而中心极限定理关注的是事件的均值。
两者的核心观点都是随着重复次数的增加,样本的统计特征会趋向于总体的特征。
这两个定理在概率论和统计学中的应用非常广泛。
它们为我们研究随机事件提供了基本的理论支持。
在实际应用中,我们经常使用大数定律和中心极限定理来进行参数估计、假设检验以及信号处理等方面的工作。
总之,大数定律和中心极限定理是概率论中两个非常重要的定理。
它们为我们理解随机事件提供了重要的理论基础。
无论是从理论上还是实际应用中,大数定律和中心极限定理都发挥着不可替代的作用。
对于概率分布和统计推断的研究,我们需要深入理解和应用这两个定理。
概率论中的大数定律及中心极限定理唐南南摘要 概率论是从数量上研究随机现象的规律的学科,概率论的特点是先提出数学模型,然后去研究它的性质,特点和规律。
它在自然科学,技术科学和社会科学等科学中有广泛的应用。
而大数定律和中心极限定理的内容是概率论中极限理论极为重要的一部分内容。
在这篇文章中,我们从贝努力试验中的频率出发,讨论了独立随机变量和分布的极限问题。
在一定条件下,这些分布弱收敛于退化分布,这就是大数定律。
在另一些条件下,这些分布弱收敛于N(0,1)分布,这一类收敛于N(0,1)分布的定理统称为中心极限定理.大数定律说明了随机现象都具有稳定性而中心极限定理是研究相互独立随机变量序列{}i x 的部分和∑==ni in xS 1的分布,在适当条件下向正态分布收放的问题。
在这篇文章里,我们只介绍了一些定理的提出,内容以证明以及在其他学科上的应用,而大数定律和中心极限定理还有许多更深入,更广泛的内容,限于篇幅这里就不再介绍了。
掌握定理的结论是重要的,这些结论一方面使频率稳定于概率,n 次观察的算术平均值稳定于数学期望都有了明确的含义和理论依据;另一方面,又将给数理统计中大样本的统计推断等提供理论依据。
关键词 大数定律 中心极限定理 随机现象 随机变量引言大数定律和中心极限定理是概率论中重要的一部分内容,但对读者来说,多数人对于这部分内容感到很难掌握,这篇文章就是对这部分内容进行浅入的分析,但对其内容进行详细的说明,而且进行了归纳性的总结,指出了各定律之间的联系及其差别,希望通过本篇文章内容的介绍,能使读者对于这部分知识有一个清晰的印象,能整体地把握这部分内容。
一 、大数定律(一)、问题的提法(大数定律的提法)重复实验中事件的频率的稳定性,是大量随机现象的统计规律性的典型表现。
人们在实践中认识到频率具有稳定性,进而由频率的稳定性预见概率的存在;由频率的性质推断概率的性质,并在实际应用中(当n充分大时)用频率的值来估计概率的值。
这些都是概率的公理化定义的实际背景。
概率的概念以及在此基础上建立的理论应该与实际相符合。
因此,我们需要对频率的稳定性这一实际作理论的说明。
其实,在大量的随机现象中,不但事件的频率具有稳定性,而且大量随机现象的平均结果一般也具有这稳定性:单个现象的行为对大量随机现象共同产生的总平均效果几乎不发生影响,这就是说,尽管单个随机现象的具体实现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消,补偿和拉平,致使总的平均结果趋于稳定。
例如,在分析天平上称量一质量为u 的物品,以21,ξξ……,n ξ表示n 次重复测量的结果。
经验告诉我们,当n 充分大时,它们的算术平均值()∑==ni i n n 11ξξ对u 的偏差却很小,而且一般n 越大,这种偏差越小。
如果把一连串的观察结果21,ξξ……,n ξ看成随机变量,则上述直观现实表明,当n 充分大时,在一顶的收敛意义下,有u n ni i →∑=11ξ,它就是大量随机现象的平均结果稳定性的数学表达式。
频率的稳定性也可以表达成u n ni i →∑=11ξ这种形式。
为此令⎩⎨⎧=次试验中不出现若在第次试验中出现若在第i i i ,0,1ξ i=1,2……,n 。
那么,()∑==ni i n A u 1ξ是n 次试验中A 出现的频数。
频率的稳定性指的是随着n 无限增大,频率()A P n 趋于稳定概率()A P 附近,即在一定的收敛意义下())(1)(1A P n n A u A P n i i n n →==∑=ξ。
概率论中,一切关于大量随机现象的平均结果稳定性的定理,统称为大数定律,按收敛性的含义不同,大数定律有弱大数定律和强大数定律之分。
(二)、大数定律的内容及证明1、 在证大数定理时,我们经常用到著名的切比雪夫不定式,首先我们来讲这个不定式]2[。
设随机变量X 有期望()x E 和方差()x D ,则对于任意 ε>0,有(){}()2εεx D x E x P ≤≥-或(){}()21εεx D x E x P -≥<-证明:(1):x 是离散型随机变量的情形。
(){}(){}()[]()()[]()22222εεεεεεx D x E X PX E X x x P x E x P k x E x kk kx E x k k =-≤-≤==≥-∑∑∑≥-≥- ({}K K P X x P ==)(2)x 是连续随机变量的情形。
设x 的密度函数是()x P ,则有(){}()εε≥-⎰=≥-x E x x E x P ()dx x P 积分区域如图:P(x)E(x)-ε E(x) E(x)+ε 由于()(),,)(,εεε-≤-≥-≥-x E x x E x x E x 所以 即()().,εε-≤+≥x E x x E x 于是有(){}()()()()[]()()[]()()222221εεεεεεx D dx x P x E x dxx P x E x dx x P x E x P x E x x E x =-≤-⎰≤⎰=≥-⎰∞+∞-≥-≥-切比雪夫不定式给出了在随机变量x 的分布未知的情况下,对事件X(){}ε<-x E x(或事件(){}ε≥-x E x 的概率的一种估计方法。
例如在式子(){}()21εεx D x E x P -≥<-中令σσε43、=,并令()u x E =,则有{}8889.03≥<-σu x P (8889.0989122≈=-σσ){}9375.04≥<-σu x P式子(){}()2εεx D x E x P ≤≥-给出了离差不小于ε的概率的上界,而式子(){}()21εεx D x E x P -≥<-给出了离差不小于ε的概率的下界,而且二个式子对任何具有方差的随机变量都成立。
从第二个式子中又可以看到,()x D 越小,概率(){}ε<-x E x P 就越大,说明x 取值集中于其期望周围的程度越高;()x D 越大,概率(){}ε<-x E x P 就越小,说明x 取值集中于平均值附近的程度越低,这就使我们方差定义的含义有了进一步的理解。
例1. 对小麦品种做发芽试验,种子发芽的概率未知,问要用多少颗小麦做试验才能认为发芽的概率与P 相差不超过1/10的概率达到95%? 解:用S n 表示试验的n 颗种子中发芽的颗数,则发芽的频率是nS n,我们要确定n ,使得n 满足%95101≥⎭⎬⎫⎩⎨⎧<-P nS P n 或%510≤⎭⎬⎫⎩⎨⎧≥-n nP S P n 。
因为S n 服从二项分布,所以,E(Sn)=nP, D(S n )=nP(1-P). 又因为P(1-P)=-P 2+P=-(P-21)2+41故p(1-p)≤41n n p np n nP S P n 2510)1(102≤⎪⎭⎫⎝⎛-≤⎭⎬⎫⎩⎨⎧≥-说明所选的n 要满足≤n255%,即n ≥500 2、现在再讲述一种常见的大数定律的数学定义 假设1ξ,2ξ…,n ξ,…是随机变量的序列,令n ξ=nnξξξ+++ 21, 如果存在这样的一种常数序列α1,α2,…,αn…,对任意的ε>ο,恒有∞→n lim {},1=<-εξnn a p 则称序列{}n ξ(接算术平均值)服从大数定律。
必须指出,更加一般地描述大数定律的形式是:对于随机变量序列{}n ξ,令=n ζf n (ξ1,ξ2,…ξn ),这里ζn 是{}i ξ( ,2,1=i )的对称的函数。
如果存在常数列序列α1,α2,…,αn …,对任意的ε>ο,成立∞→n lim {},1=<-εζn n a p ,则称这种随机变量的序列按函数f n 服从大数定律。
3、下面具体介绍几个大数定律的内容及证明。
(1)切比雪夫大数定律。
①、定义 设X 1,X 2,,…,X n ,…是一个随机变量序列,若存在常数a ,使得对任意0>ε,都有∞→n lim{},1=<-εa X p n 则称随机变量序列{}n X 依概率收敛于a ,记作a X pn −→−。
②、定义 设X 1,X 2,,…,X n ,…是一个随机变量序列,数学期望()(),......2,1=i x E 存在,使得对于任意0>ε,都有∞→n l i m (),11111=⎭⎬⎫⎩⎨⎧<-∑∑==εn i i n i i X E n X n p ,则称随机变量序列{}n X 服从大数定律。
{}n X 服从大数定律,实质是说01111−→−-∑∑==Pn i i n i i X n X n 。
③、定理 若独立随机变量序列X 1,X 2,…,X n ,…,各有数学期望()i i u X E =,方差()()无关的常数是与i c i c X D i ......,2,1==<,则对于任意0>ε,有∞→n lim 11111=⎭⎬⎫⎩⎨⎧<-∑∑==εni i n i i u n X n p 。
④、证明:令∑==ni i n X n X 11,由于X i 相互独立,所以()∑==n i i n u n X E 11()∑==⋅≤=ni i nn cnc nnX D 122211σ由式子(){}()21εεx D x E X P -≥<-可以得到 (){}()2211εεεn c X D X E X P nn n -≥-≥<-当n ∞→时,取极限使得∞→n lim(){},1≥<-εn n X E X p 但由于概率不可能大于1,所以∞→n lim (){},1=<-εn n X E X p ⑤结论:这个定理表明,在定理成立的条件下,当n 充分大时,n 个独立随机变量X 1,X 2,,…,X n ,的算术平均数这一随机变量n X 的分布,对于它的数学期望()∑=ni i X E n 11的附近,而当n 充分大时,与其期望之差依概率收敛到0。
此处所谓大数的“大”是指定理中极限等式右端的“1”。
⑥推论:若X 1,X 2,,…,X n ,,…是独立在同分布的随机变量序列,且E (X i )=u ,D (X i )=2σ(i=1,2,……),则对于任意的0>ε,都有∞→n lim 111=⎭⎬⎫⎩⎨⎧<-∑=εu X n p n i i 这一推论使我们关于算术平均值的法则有了理论依据,经过算术平均后得到的随机变量∑==n i i n X n X 11,其分布随着n 的增大越来越紧密地聚集在它的期望附近。
切比雪夫定理为我们提供了关于用抽样算术平均数估计总体平均数(期望)的理论依据。
假如在相同的条件下进行n 次重复抽样,得到n 个不同的值X 1,X 2,,…,X n ,我们可把这些结果看成独立同分布的随机变量X 1,X 2,,…,X n 的试验数值,且E (X i )=u ,D (X i )=2σ。