第四章正态分布与中心极限定理.
- 格式:ppt
- 大小:658.00 KB
- 文档页数:56
统计学中的正态分布与中心极限定理在统计学中,正态分布和中心极限定理是两个非常重要的概念和原理。
它们在数据分析、推断统计等领域中起着至关重要的作用。
本文将详细介绍正态分布和中心极限定理的概念、特性以及在实际应用中的重要性。
一、正态分布正态分布,又称为高斯分布,是一种连续型概率分布。
它的概率密度函数曲线呈钟形,左右对称,中心点位于均值处,标准差决定了曲线的宽窄。
正态分布的数学表达式为:f(x) = (1 / (σ * √(2π))) * exp(-(x-μ)² / (2σ²))其中,f(x)表示概率密度函数,x表示随机变量的取值,μ表示均值,σ表示标准差,π是圆周率,exp是自然指数。
正态分布的均值决定了曲线的中心位置,而标准差则决定了曲线的宽度。
正态分布具有以下特性:1. 对称性:正态分布的概率密度函数曲线左右对称,均值处为峰值,左右两侧的曲线呈对称分布。
2. 峰度:正态分布的峰度决定了曲线的陡缓程度。
标准正态分布的峰度为3,即呈中等陡峭的钟形曲线。
3. 均值与中位数相等:正态分布的均值和中位数是相等的,即分布的对称性保证了这一点。
4. 标准正态分布:当均值μ为0,标准差σ为1时,称为标准正态分布。
正态分布在实际应用中非常常见,例如自然界的身高分布、考试成绩分布等等。
它在统计推断中有着重要的作用,能够帮助我们进行参数估计、假设检验等统计分析。
二、中心极限定理中心极限定理是统计学中的一组定理,主要描述了在一定条件下,大量随机变量的和或平均值的分布趋近于正态分布。
中心极限定理为统计学的推断提供了基础。
中心极限定理的基本思想是:当测量对象的总体分布未知或不服从正态分布时,从该总体中随机抽取较大样本,计算样本的和或平均值,这些和或平均值的分布趋近于正态分布。
中心极限定理可以形式化地表示为:当样本量n足够大时,样本的和或平均值的分布近似服从正态分布,即:(X₁ + X₂ + ... + Xn - nμ) / (√(nσ)) ~ N(0,1)其中,X₁、X₂、...、Xn是从总体中抽取的随机样本,μ和σ分别是总体的均值和标准差,N(0,1)表示标准正态分布。
中心极限定理是概率论中的一个重要定理,它表明在一定条件下,大量独立同分布随机变量的和的分布会趋近于正态分布。
正态分布在统计学和自然科学中具有重要地位,因此中心极限定理的证明过程对于理解正态分布的性质和应用具有重要意义。
本文将通过以下几个方面解析为什么中心极限定理是正态分布的证明过程。
1. 中心极限定理的概念和表述中心极限定理是指在一定条件下,大量独立同分布随机变量的和的分布会趋近于正态分布。
具体来说,设X1,X2,...,Xn是n个独立同分布的随机变量,它们具有相同的数学期望μ和方差σ^2,那么它们的和Sn=(X1+X2+...+Xn)在n趋向于无穷大时,其分布函数将趋近于正态分布的分布函数。
2. 大数定律与中心极限定理的关系中心极限定理与大数定律都是描述随机变量序列的性质的定理,但它们的对象不同。
大数定律是描述随机变量序列的数学期望的性质,而中心极限定理是描述随机变量序列的和的分布的性质。
在证明过程中,我们会分析这两个定理之间的通联和区别。
3. 极限定理的数学推导为了证明中心极限定理,首先需要利用数学分析和概率论的理论知识,对随机变量序列的和的分布进行推导。
我们将会详细介绍中心极限定理的数学推导过程,包括利用特征函数进行推导、应用Moments生成函数以及利用独立同分布的性质等。
4. 中心极限定理的应用与意义我们将讨论中心极限定理在实际问题中的应用和意义。
正态分布在自然界和社会现象中具有广泛的应用,而中心极限定理为我们理解和应用正态分布提供了重要的理论基础。
我们也将介绍中心极限定理在统计学、金融学、医学等领域中的实际应用,以及它对于风险管理、决策分析和科学研究的重要意义。
5. 总结通过对中心极限定理的证明过程进行分析和讨论,我们将更深入地理解中心极限定理的内在含义和数学原理,以及它在现实生活中的重要应用。
也能够更好地理解正态分布的性质和特点,为进一步深入研究概率论和统计学提供理论基础和指导。
中心极限定理是概率论中的一个基本概念,它向我们展示了独立随机变量的和的分布是如何趋向于正态分布的。
概率论与数理统计第四章正态分布§13 中心极限定理暨南大学电气信息学院苏保河主讲第四章正态分布§13 中心极限定理主要内容一、林德伯格—莱维中心极限定理二、棣莫弗—拉普拉斯中心极限定理三、李雅普诺夫中心极限定理暨南大学电气信息学院苏保河主讲例1炮火轰击敌方防御工事100 次, 每次轰击命中的炮弹数服从同一分布, 其数学期望为2, 均方差为1.5. 若各次轰击命中的炮弹数是相互独立的, 求100 次轰击(1)至少命中180发炮弹的概率;(2)命中的炮弹数不到200发的概率.一、林德伯格—莱维中心极限定理解设X k 表示第k 次轰击命中的炮弹数,2()2,() 1.5,1,,100,k k E X D X k ==="相互独立,12100,,,X X X "苏保河主讲设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理, 例1 解(续1)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则2()200,()15,E X D X ==~(200,225).X N 近似地有{180}P X ≥1((180200)/15)Φ≈−−(1.33)Φ=(1)至少命中180发炮弹的概率;1( 1.33)Φ=−−0.9082.=1{180}P X =−<设X 表示100 次轰击命中的炮弹数, 由独立同分布的中心极限定理,例1 解(续2)2()2,() 1.5,k k E X D X ==苏保河主讲1001,k k X X ==∑则()200,()225,E X D X ==2~(200,15).X N 近似地有(2)命中的炮弹数不到200发的概率.{0200}P X ≤<((200200)/15)((0200)/15)ΦΦ≈−−−(0)(13.33)ΦΦ=−−0.5000.=例2检验员逐个检查某产品, 每查一个需用10秒钟. 但有的产品需重复检查一次,再用去10 秒钟. 若产品需重复检查的概率为0.5, 求检验员在8 小时内检查的产品多于1900 个的概率.解在8 小时内检查的产品多于1900 个,即检查1900 个产品所用时间小于8 小时.设X为检查1900 个产品所用的时间(秒),设Xk 为检查第k个产品所用的时间(单位为秒), k= 1, 2, …, 1900.苏保河主讲例3某车间有200 台车床独立地工作,开工率为0.6, 开工时每台耗电为r 千瓦.问供电所至少要供给这个车间多少电力,才能以99.9% 的概率保证这个车间不会因供电不足而影响生产?解设至少要供给该车间a千瓦的电力, X为开工的车床台数, 则X~ B(200, 0.6),由棣莫弗—拉普拉斯中心极限定理,X~ N(120, 48) (近似),欲求a, 使{0}99.9%.P rX a≤≤=苏保河主讲李雅普诺夫中心极限定理的意义如果随机变量X 可以看成许多相的总和,互独立的起微小作用的因素Xk则X 服从或近似服从正态分布.苏保河主讲苏保河主讲1. 离散型随机变量的数学期望第三章内容小结定义1设X 是离散型随机变量, 其分布律是P {X = x k } = p k (k = 1, 2, …),如果收敛, 定义X 的数学期望1||k k k x p ∞=∑1()k k k E X x p ∞==∑一、数学期望2. 连续型随机变量的数学期望定义2设X 是连续型随机变量,()()d E X x f x x∞−∞=∫收敛, 定义X 的数学期望||()d x f x x ∞−∞∫其密度函数为f (x ), 如果苏保河主讲4. 数学期望的性质1.设C 是常数, 则E (C ) = C .4.设X , Y 独立, 则E (XY ) = E (X )E (Y ).2.若k 是常数, 则E (kX ) = kE (X ).3.E (X 1 + X 2) =E (X 1) + E (X 2).条件: X 1,X 2, …, X n 相互独立.11()().n n i i i i i i E C X C E X ===∑∑推广:11()().n n i i i i E X E X ===∏∏推广:苏保河主讲3. 方差的性质1)设a 是常数, 则D (a ) = 0.2)若a 是常数, 则D (aX ) = a 2D (X ).4)若X 1 与X 2相互独立, 则D (X 1±X 2) = D (X 1) + D (X 2).推广:若X 1, X 2, …, X n 相互独立, 则11[](),n ni i i i D X D X ===∑∑211[]().n n i i i i i i D C X C D X ===∑∑3)若a , b 是常数, 则D (aX + b ) = a 2D (X ).苏保河主讲4. 协方差的定义定义对于二维随机变量(X, Y),称E{[X-E(X)][Y-E(Y)]} 为X与Y 的协方差, 记为Cov(X, Y), 即Cov(X, Y) = E{[X-E(X)][Y-E(Y)]}.5. 协方差的计算公式Cov(X,Y)=E(XY)–E(X)E(Y)推论: 若X 与Y 独立, 则Cov(X,Y) = 0.苏保河主讲6. 协方差的性质(1)Cov(X,Y)=Cov(Y,X)(2)Cov(aX,bY)=ab Cov(X,Y), a,b是常数(3)Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)苏保河主讲若X 1, X 2, …, X n 两两独立, 则D (X +Y ) = D (X )+D (Y )+2Cov(X , Y )7. 随机变量和的方差与协方差的关系11()().n ni i i i D X D X ===∑∑11()()2Cov(,)n ni i i j i i i j D X D X X X ==<=+∑∑∑苏保河主讲9. 相关系数的性质2)|| 1.XY ρ≤0,XY ρ=1) X 和Y 独立时但其逆不真.定义对于随机变量X , 如果E (X k )( k = 1, 2, …) 存在, 则称它为X 的k 阶原点矩或k 阶矩.10. 矩和中心矩如果E {[X -E (X )]k } ( k = 1, 2, …) 存在, 则称它为X 的k 阶中心矩.苏保河主讲三、切比雪夫不等式与大数定理1. 马尔科夫不等式2. 切比雪夫不等式3. 切比雪夫大数定理4. 独立同分布下的大数定理5. 伯努利大数定理苏保河主讲用X 表示n 重伯努利试验中事件A 出现(成功)的次数, 其分布律称r.v. X 服从参数为n 和p 的二项分布, 注当n = 1 时, 称X 服从参数为p 的伯努利分布,或0-1 分布.1. 二项分布{}(1),k k n k n P X k C p p −==−0,1,,k n ="记作X ~ B (n , p ).苏保河主讲四、几个重要的随机变量苏保河主讲(),()(1).E X np D X np p ==−如果X ~ B (n , p ),结论:{}(1),k k n k n P X k C p p −==−0,1,,,k n ="2. 超几何分布定义将N个元素分为2 类, M个属于第一类, N-M个属于第二类, 从中按不放回抽样随机取n个元素. 令X表示这n 个元素中第一类元素的个数, 则称X服从超几何分布, 记为X h n N M~(,,)苏保河主讲。
正态分布与中心极限定理是概率论与数理统计中的核心概念,它们在统计学、自然科学、社会科学以及工程技术等众多领域都有着广泛的应用。
下面将对这两个概念进行详细阐述,并分析它们在实际应用中的重要性。
一、正态分布1. 正态分布的定义正态分布(Normal Distribution)又称高斯分布(Gaussian Distribution),是一种连续型概率分布,描述了实值随机变量的分布规律。
其概率密度函数为f(x|μ,σ2)=(1σ2π)exp[−12σ2(x−μ)2]f(x|\mu, \sigma^2) = \left(\frac{1}{\sigma\sqrt{2\pi}}\right)\exp\left[-\frac{1}{2\sigma^2}(x-\mu)^2\right]f(x|μ,σ2)=(σ2π1)exp[−2σ21(x−μ)2]其中,μμ\mu为均值(Mean),σ2\sigma^2σ2为方差(Variance),σ\sigmaσ为标准差(Standard Deviation)。
正态分布由均值和方差完全确定,这两个参数决定了分布的位置和形状。
2. 正态分布的性质正态分布具有许多优良的性质,如对称性、单峰性、集中性等。
此外,正态分布还具有稳定性,即多个独立同分布的随机变量之和仍服从正态分布,且均值和方差分别为各变量均值之和和方差之和。
这一性质使得正态分布在实际应用中具有广泛的适用性。
3. 正态分布的应用正态分布在实际应用中具有广泛的应用,如测量误差、生物统计、金融分析、信号处理等领域。
例如,在生物统计中,许多生物特征(如身高、体重等)都服从正态分布;在金融分析中,股票价格的波动也常常假设为正态分布。
二、中心极限定理1. 中心极限定理的定义中心极限定理(Central Limit Theorem,CLT)是概率论中的一个基本定理,它指出:对于独立同分布的随机变量序列,其和的分布逐渐逼近正态分布,无论这些随机变量具有何种分布。
中心极限定理与正态分布中心极限定理(Central Limit Theorem,简称CLT)是统计学中的重要概念,它描述了当样本量足够大时,样本均值的分布趋近于正态分布。
正态分布(Normal Distribution),也被称为高斯分布(Gaussian Distribution),在统计学和概率论中具有广泛的应用。
中心极限定理对于理解数据的分布规律以及进行统计推断具有重要意义。
它可以帮助我们进行概率估计、假设检验以及参数估计等统计方法的应用。
一、中心极限定理的概念与原理中心极限定理是基于大样本理论而提出的。
它的核心思想是:当从总体中抽取多个独立随机样本,并计算每个样本的均值时,这些样本均值的分布将近似于一个正态分布。
具体而言,假设我们从一个总体中抽取n个独立随机样本,并计算它们的均值。
根据中心极限定理,当n趋近于无穷大时,这些样本均值的分布将接近于正态分布。
此时,样本均值的平均值等于总体均值,样本均值的方差等于总体方差除以样本量n。
中心极限定理的应用条件包括:总体符合独立同分布、总体的均值与方差存在有限、样本量足够大等。
当这些条件得到满足时,我们可以很好地利用中心极限定理进行统计推断。
二、正态分布的特点与应用正态分布是一种对称的连续概率分布,以钟形曲线为特征。
它的概率密度函数可由两个参数完全描述:均值μ和标准差σ。
当我们知道总体的均值和方差时,就可以完全确定一个正态分布。
正态分布在自然界中广泛存在,很多实际现象都可以近似地服从正态分布。
在统计学和概率论中,正态分布被广泛应用于参数估计、假设检验、置信区间构造等方面。
正态分布有许多重要的性质,例如:68-95-99.7规则、标准正态分布、正态分布的线性组合等。
熟练掌握这些性质,可以在实际问题中更好地利用正态分布进行分析和推断。
三、中心极限定理与正态分布的应用举例1. 样本均值的抽样分布假设我们想要估计某种产品的平均寿命,并从中随机抽取n个样本进行测量。