概论与数理统计 基本极限定理
- 格式:ppt
- 大小:507.00 KB
- 文档页数:16
概率论与数理统计公式定理全总结一、概率论公式:1.基本概率公式:对于随机试验E,事件A的概率可以表示为P(A)=事件A的样本点数/所有样本点数。
2.条件概率公式:对于事件A和事件B,若P(B)>,则事件A在事件B发生的条件下的概率可以表示为P(A,B)=P(A∩B)/P(B)。
3.全概率公式:对于互不相容事件A1,A2,...,An,它们的和事件为全样本空间S,且概率P(Ai)>,则对于任意事件B有P(B)=Σ(P(Ai)×P(B,Ai))。
4.贝叶斯公式:对于互不相容事件A1,A2,...,An,它们的和事件为全样本空间S,且概率P(Ai)>,则对于任意事件B,有P(Ai,B)=(P(B,Ai)×P(Ai))/Σ(P(B,Ai)×P(Ai))。
二、数理统计公式:1.期望:随机变量X的期望E(X)=Σ(Xi×P(Xi)),其中Xi为随机变量X的取值,P(Xi)为随机变量X取值为Xi的概率。
2. 方差:随机变量X的方差Var(X) = Σ((Xi - E(X))^2 ×P(Xi)),其中Xi为随机变量X的取值,E(X)为随机变量X的期望,P(Xi)为随机变量X取值为Xi的概率。
3. 协方差:随机变量X和Y的协方差Cov(X,Y) = E((X - E(X))(Y - E(Y))),其中E(X)和E(Y)分别为随机变量X和Y的期望。
4. 相关系数:随机变量X和Y的相关系数ρ(X,Y) = Cov(X,Y) / √(Var(X) × Var(Y)),其中Cov(X,Y)为随机变量X和Y的协方差,Var(X)和Var(Y)分别为随机变量X和Y的方差。
三、概率论与数理统计定理:1.大数定律:对于独立同分布的随机变量X1,X2,...,Xn,它们的均值X̄=(X1+X2+...+Xn)/n,当n趋向于无穷大时,X̄趋向于X的期望E(X)。
概率论与数理统计第五章大数定律及中心极限定理课前导读概率论是研究大量试验后呈现出的统计规律性的一门理论。
数学中研究大量的工具是极限。
因此这一章学习概率论中的极限定理。
第一节大数定律随着试验次数的增大,事件的频率逐步稳定到事件的概率。
意味着随着试验次数的增多,在其中一种收敛意义下,频率的极限是概率。
大数定律解释了这一结论。
首先介绍切比雪夫不等式。
一、切比雪夫(Chebyshev)不等式随机变量X的取值总是围绕着其期望变动,若X的分布已知时,可以计算事件\{,X-E(X),\geq \epsilon \}的概率。
切比雪夫不等式:对切比雪夫不等式的直观理解:方差越小,X在其期望附近取值的密集程度越高,原理期望的区域的概率上加越小。
进一步说明了方差的概率意义,方差时随机变量取值与其中心位置的偏离程度的一种度量指标。
当随机变量X的分布未知时,可由X的观测数据估计得到X的期望和方差,然后使用切比雪夫不等式估计X关于E(X)的偏离程度。
二、依概率收敛随机变量序列即由随机变量构成的一个序列。
不能用类似定义数列极限的方式定义随机变量序列的极限,因为序列中的每一个元素X_n是随机变量,取值不确定,不可能和一个常数c的距离任意小。
只能说一些事件A发生的频率f_n(A)收敛到A的概率P(A)。
依概率收敛的定义:定理2:三、大数定律三个大数定律:切比雪夫大数定律、辛钦大数定律和伯努利大数定律。
注意这三个大数定律的条件有何异同。
定理3 切比雪夫大数定律:若随机变量序列相互不相关,方差存在且一致有上界,当n充分大时,随机序列的前n项的算术平均值和自身的期望充分接近几乎总是发生的。
定理4 相互独立同分布的大数定律(辛钦大数定律):辛钦大数定律为算术平均值法则提供了理论依据。
伯努利大数定律:伯努利大数定律是相互独立同分布大数定律的特例,限定分布为两点分布。
伯努利大数定律体现了:随着试验次数的增大,事件的频率逐步稳定到时间的概率,这里的稳定即为依概率收敛。
第二节 中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式, 但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE B δδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例1 (讲义例2) 一盒同型号螺丝钉共有100个, 已知该型号的螺丝钉的重量是一个随机变量, 期望值是100g, 标准差是10g, 求一盒螺丝钉的重量超过10.2kg 的概率.解 设为第i 个螺丝钉的重量, ,100,,2,1 =i且它们之间独立同分布, 于是一盒螺丝钉的重量为,1001∑==i i X X且由,100)(==i X E μ,10)(==i X D σ,100=n 知,10000)(100)(=⨯=i X E X E ,100)(=X D由中心极限定理有⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧->-=>∑=n n nn X P X P n i iσμσμ10200}10200{1⎭⎬⎫⎩⎨⎧->-=100100001020010010000X p ⎭⎬⎫⎩⎨⎧≤--=⎭⎬⎫⎩⎨⎧>-=2100100001210010000X P X P.02275.097725.01)2(1=-=Φ-≈例2(讲义例3) 计算机在进行数学计算时, 遵从四舍五入原则. 为简单计. 现在对小数点后面第一位进行舍入运算, 则误差X 可以认为服从]5.0,5.0[-上的均匀分布. 若在一项计算中进行了100次数字计算, 求平均误差落在区间]20/3,20/3[-上的概率.解,100=n 用i X 表示第i 次运算中产生的误差.10021,,,X X X 相互独立, 都服从]5.0,5.0[-上的均匀分布,且,0)(=i X E ,12/1)var(=i X 100,,2,1 =i , 从而).1,0(~5312/100010010011001100N X X Y i ii i 近似∑∑===⨯-=故平均误差∑==10011001i i X X 落在⎥⎥⎦⎤⎢⎢⎣⎡-203,203上的概率为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-∑=20310012032032031001i i X P X P⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-=∑=35331001i i X P )3()3(-Φ-Φ≈.9973.0=例3(讲义例4) 某车间有200台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车. 设开工率为0.6, 并设每台车床的工作是独立的, 且在开工时需电力1千瓦, 问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?解 对每台车床的观察作为一次试验, 每次试验观察台车床在某时刻是否工作, 工作的概率为0.6, 共进行200次试验. 用X 表示在某时刻工作着的车床数, 依题意, 有),6.0,200(~b X现在的问题是: 求满足999.0}{≥≤N X P 的最小的.N 由定理3,)1(p np np X --近似服从),1,0(N 这里,120=np ,48)1(=-p np于是.48120}{⎪⎪⎭⎫⎝⎛-Φ≈≤N N X P 由,999.048120≥⎪⎪⎭⎫ ⎝⎛-ΦN 查正态分布函数表得,999.0)1.3(=Φ故,1.348120≥-N 从中解得,5.141≥N 即所求.142=N 也就是说, 应供应142千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.例4 (讲义例5) 某市保险公司开办一年人身保险业务, 被保险人每年需交付保险费160元, 若一年内发生重大人身事故, 其本人或家属可获2万元赔金. 已知该市人员一年内发生重大人身事故的概率为,005.0 现有5000人参加此项保险, 问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少?解记⎩⎨⎧=事故个被保险人未发生重大若第故个被保险人发生重大事若第i i X i ,0,1 )5000,,2,1( =i于是i X 均服从参数为005.0=p 的两点分布, 且,005.0}1{==i X p .25=np∑=50001i i X 是5000个被保险人中一年内发生重大人身事故的人数, 保险公司一年内从此项业务所得到的总收益为∑=⨯-⨯5000125000016.0i i X 万元.于是⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-⨯≤∑=4025000016.02050001i i X P ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤=∑=302050001i i X P ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⨯-≤⨯-≤⨯-=∑=995.0252530995.02525995.025********1i i X P 6826.0)1()1(=-Φ-Φ≈例 5 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15. 若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布. 求参加会议的家长数X 超过450的概率.解以)400,,2,1( =k X k 记第k 个学生来参加会议的家长数, 则k X 的分布律为15.08.005.0210kk p X易知,1.1)(=k X E ,19.0)(=k X D ,400,,2,1 =k 而,4001∑==k k XX 由定理3, 随机变量),1,0(~19.04001.140019.04001.14004001N X Xk k近似⨯-=⨯-∑= 故⎭⎬⎫⎩⎨⎧⨯->⨯-=>19.04001.140045019.04001.1400}450{X P X P⎭⎬⎫⎩⎨⎧≤⨯--=147.119.04001.14001X P.1357.0)147.1(1=Φ-≈例6 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9. 以95%概率估计, 在一次行动中, 至少有多少人能进入掩蔽体.解用i X 表示第i 人能够按时进入掩蔽体, 令.100021X X X S n +++=设至少有m 人能进入掩蔽体, 则要求,95.0}{≥≤n S m P ⎭⎬⎫⎩⎨⎧-≤⨯⨯⨯-=≤909001.09.010009.01000}{n n S m S m由中心极限定理, 有),1,0(~90900N S n 近似- 所以⎭⎬⎫⎩⎨⎧-≤-=≤9090090900}{n n S m P S m P ⎭⎬⎫⎩⎨⎧-<--=90900909001m S P n查正态分布数值表, 得 ,65.190900-=-m 故88435.88465.15900≈=-=m 人.。