实验四 大数定律与中心极限定理
- 格式:ppt
- 大小:18.82 MB
- 文档页数:82
大数定律和中心极限定理是概率论中的两个重要概念。
大数定律描述了在独立重复试验中,当试验次数趋于无穷时,某一事件发生的频率趋于其概率。
中心极限定理则指出,无论试验中的个体之间的差异有多大,当试验次数足够多时,试验结果的平均值将接近正态分布。
以下是一个简单的R语言实验报告,用于演示大数定律和中心极限定理。
大数定律和中心极限定理的R语言实验
实验目的:通过模拟实验,观察大数定律和中心极限定理的现象。
实验原理:
1.大数定律:在大量独立重复试验中,某一事件的相对频率趋近于该事件的概率。
2.中心极限定理:无论个体之间的差异有多大,当试验次数足够多时,试验结果的平均值将接近正态分布。
实验步骤:
1.生成1000个0到1之间的随机数,模拟1000次掷硬币试验(正面概率为0.5)。
2.计算正面朝上的频率。
3.使用R语言绘制频率直方图和正态分布曲线。
4.重复步骤1-3多次(例如100次),观察频率的稳定性。
5.计算100次试验中每次试验得分的平均值的频数分布,并绘制直方图和正态分布曲线。
实验结果:
1.正面朝上的频率逐渐稳定于0.5。
2.频率直方图接近正态分布。
3.平均值的频数分布也接近正态分布。
实验分析:
实验结果验证了大数定律和中心极限定理。
在大量独立重复试验中,正面朝上的频率趋近于0.5,符合大数定律。
同时,试验结果的平均值分布接近正态分布,符合中心极限定理。
结论:通过R语言模拟实验,我们观察到了大数定律和中心极限定理的现象,加深了对这两个定理的理解。
第四节 大数定理与中心极限定理概率论与数理统计是研究随机现象统计规律性的学科. 而随机现象的规律性在相同的条件下进行大量重复试验时会呈现某种稳定性. 例如, 大量的抛掷硬币的随机试验中, 正面出现频率; 在大量文字资料中, 字母使用频率; 工厂大量生产某种产品过程中, 产品的废品率等. 一般地, 要从随机现象中去寻求事件内在的必然规律, 就要研究大量随机现象的问题.在生产实践中, 人们还认识到大量试验数据、测量数据的算术平均值也具有稳定性. 这种稳定性就是我们将要讨论的大数定律的客观背景. 在这一节中,我们将介绍有关随机变量序列的最基本的两类极限定理----大数定理和中心极限定理.内容分布图示★大数定理的引入 ★切比雪夫不等式 ★例1 ★例2 ★大数定理 ★推论 大数定律 ★中心极限定理的引入 ★林德伯格—勒维定理 ★棣莫佛—拉普拉斯定理★例3 ★例4 ★例5 ★例6 ★例7 ★例8★高尔顿钉板试验 中心极限定理 ★内容小结 ★课堂练习 ★习题4-4内容要点:一、依概率收敛与微积分学中的收敛性的概念类似, 在概率论中, 我们要考虑随机变量序列的收敛性. 定义1 设 ,,,,21n X X X 是一个随机变量序列, a 为一个常数,若对于任意给定的正数ε,有 ,1}|{|lim =<-∞→εa X P n n 则称序列 ,,,,21n X X X 依概率收敛于a , 记为).(∞→−→−n a X Pn定理1 设,,b Y a X Pn P n −→−−→−又设函数),(y x g 在点),(b a 连续, 则),(),(b a g Y X g Pn n −→−.二、切比雪夫不等式定理2设随机变量X 有期望μ=)(X E 和方差2)(σ=X D ,则对于任给0>ε, 有22}|{|εσεμ≤≥-X P .上述不等式称切比雪夫不等式.注:(i) 由切比雪夫不等式可以看出,若2σ越小, 则事件}|)({|ε<-X E X的概率越大, 即, 随机变量X 集中在期望附近的可能性越大. 由此可见方差刻划了随机变量取值的离散程度.(ii) 当方差已知时,切比雪夫不等式给出了X 与它的期望的偏差不小于ε的概率的估计式.如取,3σε= 则有.111.09}3|)({|22≈≤≥-σσσX E X P故对任给的分布,只要期望和方差2σ存在, 则随机变量X 取值偏离)(X E 超过σ3的概率小于0.111.三、大数定理1.切比雪夫大数定律定理3 (切比雪夫大数定律)设 ,,,,21n X X X 是两两不相关的随机变量序列,它们数学期望和方差均存在, 且方差有共同的上界, 即,,2,1,)( =≤i K X D i 则对任意0>ε, 有1)(11lim 11=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-∑∑==∞→εn i i n i i n X E n X n P 注: 定理表明: 当n 很大时,随机变量序列}{n X 的算术平均值∑=ni i X n 11依概率收敛于其数学期望∑=ni i X E n 1)(1.2.伯努利大数定理定理4 (伯努利大数定律)设A n 是n 重伯努利试验中事件A 发生的次数, p 是事件A 在每次试验中发生的概率, 则对任意的0>ε, 有1lim =⎭⎬⎫⎩⎨⎧<-→∞εp n n P A n 或 0l i m =⎭⎬⎫⎩⎨⎧≥-→∞εp n n P A n . 注:(i) 伯努利大数定律是定理1的推论的一种特例, 它表明: 当重复试验次数n 充分大时, 事件A 发生的频率nn A依概率收敛于事件A 发生的概率p .定理以严格的数学形式表达了频率的稳定性. 在实际应用中, 当试验次数很大时,便可以用事件发生的频率来近似代替事件的概率.(ii) 如果事件A 的概率很小,则由伯努利大数定律知事件A 发生的频率也是很小的,或者说事件A 很少发生. 即“概率很小的随机事件在个别试验中几乎不会发生”,这一原理称为小概率原理,它的实际应用很广泛. 但应注意到,小概率事件与不可能事件是有区别的. 在多次试验中,小概率事件也可能发生.3.辛钦大数定理 定理5 (辛钦大数定律) 设随机变量 ,,,,21n X X X 相互独立, 服从同一分布,且具有数学期望,,2,1,)( ==i X E i μ 则对任意0>ε, 有11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P . 注: (i) 定理不要求随机变量的方差存在;(ii) 伯努利大数定律是辛钦大数定律的特殊情况;(iii) 辛钦大数定律为寻找随机变量的期望值提供了一条实际可行的途径. 例如, 要估计某地区的平均亩产量, 可收割某些有代表性的地块, 如n 块,计算其平均亩产量, 则当n 较大时,可用它作为整个地区平均亩产量的一个估计. 此类做法在实际应用中具有重要意义.四、中心极限定理在实际问题中, 许多随机现象是由大量相互独立的随机因素综合影响所形成, 其中每一个因素在总的影响中所起的作用是微小的. 这类随机变量一般都服从或近似服从正态分布. 以一门大炮的射程为例, 影响大炮的射程的随机因素包括: 大炮炮身结构的制造导致的误差, 炮弹及炮弹内炸药在质量上的误差, 瞄准时的误差, 受风速、风向的干扰而造成的误差等. 其中每一种误差造成的影响在总的影响中所起的作用是微小的, 并且可以看成是相互独立的, 人们关心的是这众多误差因素对大炮射程所造成的总影响. 因此需要讨论大量独立随机变量和的问题.中心极限定理回答了大量独立随机变量和的近似分布问题, 其结论表明: 当一个量受许多随机因素(主导因素除外) 的共同影响而随机取值, 则它的分布就近似服从正态分布.1.林德伯格—勒维定理定理6 (林德伯格—勒维) 设 ,,,,21n X X X 是独立同分布的随机变量序列, 且,,,2,1,)(,)(2n i X D X E i i ===σμ则 ⎰∑∞--=∞→=⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-x t n i i n dt e x n n X P 2/1221lim πσμ 注: 定理6表明: 当n 充分大时, n 个具有期望和方差的独立同分布的随机变量之和近似服从正态分布. 虽然在一般情况下, 我们很难求出n X X X +++ 21的分布的确切形式, 但当n 很大时, 可求出其近似分布. 由定理结论有.1),/,(~)1,0(~/1)1,0(~1211∑∑∑====⇒-⇒-n i i ni i ni i X n X n N X N nX n N n n X σμσμσμ近似近似故定理又可表述为: 均值为μ, 方差的02>σ的独立同分布的随机变量 ,,,,21n X X X 的算术平均值X , 当n 充分大时近似地服从均值为μ,方差为n /2σ的正态分布. 这一结果是数理统计中大样本统计推断的理论基础.2. 棣莫佛—拉普拉斯定理在第二章中,作为二项分布的正态近似,我们曾经介绍了棣莫佛—拉普拉斯定理,这里再次给出,并利用上述中心极限定理证明之.定理7(棣莫佛—拉普拉斯定理)设随机变量n Y 服从参数p n ,)10(<<p 的二项分布, 则对任意x , 有)(21)1(lim 22x dt e x p np np Y P x tn n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--⎰∞--∞→π注: 易见,棣莫佛—拉普拉斯定理就是林德伯格—勒维定理的一个特殊情况.3.用频率估计概率的误差设n μ为n 重贝努里试验中事件A 发生的频率, p 为每次试验中事件A 发生的概率,,1p q -=由棣莫佛—拉普拉斯定理,有⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<-<-=⎭⎬⎫⎩⎨⎧<-pq n npqnp pq nP p n P n n εμεεμ .12-⎪⎪⎭⎫ ⎝⎛Φ=⎪⎪⎭⎫ ⎝⎛-Φ-⎪⎪⎭⎫ ⎝⎛Φ≈pq n pq n pq n εεε这个关系式可用解决用频率估计概率的计算问题:4. 李雅普诺夫定理定理8(李雅普诺夫定理) 设随机变量 ,,,,21n X X X 相互独立, 它们具有数学期望和方差: ,2,1,0)(,)(2=>==i X D X E kk k k σμ,记.122∑==nk k nB σ 若存在正数δ, 使得当∞→n 时,,0}|{|1122→-∑=++nk k knXE Bδδμ则随机变量之和∑=n k k X 1的标准化变量:nnk kn k kn k k n k k nk k n B X X D X E X Z ∑∑∑∑∑=====-=⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛-=11111μ的分布函数)(x F n 对于任意x , 满足).(21lim )(lim 2/112x dt e x B X P x F x t n n k k n k k n n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-=⎰∑∑∞--==∞→∞→πμ注:定理8表明, 在定理的条件下, 随机变量.11nnk kn k kn B X Z ∑∑==-=μ当n 很大时,近似地服从正态分布)1,0(N . 由此, 当n 很大时,∑∑==+=nk k n n nk k Z B X 11μ近似地服从正态分布⎪⎪⎭⎫ ⎝⎛∑=21,n n k k B N μ.这就是说,无论各个随机变量),2,1( =k X k 服从什么分布,只要满足定理的条件,那么它们的和∑=nk k X 1当n 很大时,就近似地服从正态分布.这就是为什么正态随机变量在概率论中占有重要地位的一个基本原因.在很多问题中,所考虑的随机变量可以表示成很多个独立的随机变量之和,例如,在任一指定时刻,一个城市的耗电量是大量用户耗电量的总和;一个物理实验的测量误差是由许多观察不到的、可加的微小误差所合成的,它们往往近似地服从正态分布.例题选讲:切比雪夫不等式例1 已知正常男性成人血液中, 每一毫升白细胞数平均是7300, 均方差是700. 利用切比雪夫不等式估计每毫升白细胞数在5200~9400之间的概率.解设每毫升白细胞数为,X 依题意, ,7300=μ,70022=σ所求概率为}94005200{≤≤X P }73009400730073005200{-≤-≤-=X P }21002100{≤-≤-=μX P }.2100|{|≤-=μX P 由切比雪夫不等式22)2100/(1}2100|{|σμ-≥≤-X P 2)2100/700(1-=,9/89/11=-=即每毫升白细胞数在5200 ~ 9400之间的概率不小于8/9.例2 (讲义例1) 在每次试验中, 事件A 发生的概率为0.75, 利用切比雪夫不等式求: 事件A 出现的频率在0.74~0.76之间的概率至少为0.90?解 设X 为次试验中, 事件A 出现的次数, 则)75.0,(~n b X , ,75.0n =μ ,1875.025.075.02n n =⨯=σ所求为满足90.0}76.0/74.0{≥<<n X P 的最小的.n }76.0/74.0{<<n X P 可改写为}76.074.0{n X n P <<}01.075.001.0{n n X n P <-<-=}01.0|{|n X P <-=μ 在切比雪夫不等式中取,01.0n =ε 则}76.0/74.0{<<n X P }01.0|{|n X P <-=μ22)01.0/(1n σ-≥20001.0/1875.01n n -=n /18751-=依题意, 取n 使,9.0/18751≥-n 解得 ,18750)9.01/(1875=-≥n即n 取18750 时, 可以使得在n 次独立重复试验中, 事件A 出现的频率在76.0~74.0之间的概率至少为 0.90.中心极限定理例3 (讲义例2) 一盒同型号螺丝钉共有100个, 已知该型号的螺丝钉的重量是一个随机变量, 期望值是100g, 标准差是10g, 求一盒螺丝钉的重量超过10.2kg 的概率.解 设为第i 个螺丝钉的重量, ,100,,2,1 =i且它们之间独立同分布, 于是一盒螺丝钉的重量为,1001∑==i i X X且由,100)(==i X E μ,10)(==i X D σ,100=n 知,10000)(100)(=⨯=i X E X E ,100)(=X D由中心极限定理有⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧->-=>∑=n n nn X P X P n i iσμσμ10200}10200{1⎭⎬⎫⎩⎨⎧->-=100100001020010010000X p⎭⎬⎫⎩⎨⎧≤--=⎭⎬⎫⎩⎨⎧>-=2100100001210010000X P X P.02275.097725.01)2(1=-=Φ-≈例4 (讲义例3) 计算机在进行数学计算时, 遵从四舍五入原则. 为简单计. 现在对小数点后面第一位进行舍入运算, 则误差X 可以认为服从]5.0,5.0[-上的均匀分布. 若在一项计算中进行了100次数字计算, 求平均误差落在区间]20/3,20/3[-上的概率.解,100=n 用i X 表示第i 次运算中产生的误差.10021,,,X X X 相互独立, 都服从]5.0,5.0[-上的均匀分布,且,0)(=i X E ,12/1)var(=i X 100,,2,1 =i , 从而).1,0(~5312/100010010011001100N XX Y i ii i 近似∑∑===⨯-=故平均误差∑==10011001i i X X 落在⎥⎥⎦⎤⎢⎢⎣⎡-203,203上的概率为⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-∑=20310012032032031001i iX P X P⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤-=∑=35331001i i X P )3()3(-Φ-Φ≈.9973.0=例5(讲义例4) 某车间有200台车床, 在生产期间由于需要检修、调换刀具、变换位置及调换工作等常需停车. 设开工率为0.6, 并设每台车床的工作是独立的, 且在开工时需电力1千瓦, 问应供应多少瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产?解 对每台车床的观察作为一次试验, 每次试验观察台车床在某时刻是否工作, 工作的概率为0.6, 共进行200次试验. 用X 表示在某时刻工作着的车床数, 依题意, 有),6.0,200(~b X现在的问题是: 求满足999.0}{≥≤N X P 的最小的.N由定理3,)1(p np np X --近似服从),1,0(N 这里,120=np ,48)1(=-p np于是.48120}{⎪⎪⎭⎫⎝⎛-Φ≈≤N N X P 由,999.048120≥⎪⎪⎭⎫ ⎝⎛-ΦN 查正态分布函数表得,999.0)1.3(=Φ故,1.348120≥-N 从中解得,5.141≥N 即所求.142=N 也就是说, 应供应142千瓦电力就能以99.9%的概率保证该车间不会因供电不足而影响生产.例6 (讲义例5) 某市保险公司开办一年人身保险业务, 被保险人每年需交付保险费160元, 若一年内发生重大人身事故, 其本人或家属可获2万元赔金. 已知该市人员一年内发生重大人身事故的概率为,005.0 现有5000人参加此项保险, 问保险公司一年内从此项业务所得到的总收益在20万到40万元之间的概率是多少?解记⎩⎨⎧=事故个被保险人未发生重大若第故个被保险人发生重大事若第i i X i ,0,1 )5000,,2,1( =i于是i X 均服从参数为005.0=p 的两点分布, 且,005.0}1{==i X p .25=np∑=50001i i X 是5000个被保险人中一年内发生重大人身事故的人数, 保险公司一年内从此项业务所得到的总收益为∑=⨯-⨯5000125000016.0i i X 万元.于是⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤-⨯≤∑=4025000016.02050001i i X P ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤=∑=302050001i i X P ⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧⨯-≤⨯-≤⨯-=∑=995.0252530995.02525995.025*********i i X P 6826.0)1()1(=-Φ-Φ≈例7 对于一个学校而言, 来参加家长会的家长人数是一个随机变量, 设一个学生无家长, 1名家长, 2名家长来参加会议的概率分别0.05, 0.8, 0.15. 若学校共有400名学生, 设各学生参加会议的家长数相互独立, 且服从同一分布. 求参加会议的家长数X 超过450的概率.解以)400,,2,1( =k X k 记第k 个学生来参加会议的家长数, 则k X 的分布律为15.08.005.0210kk p X易知,1.1)(=k X E ,19.0)(=k X D ,400,,2,1 =k 而,4001∑==k k XX 由定理3, 随机变量),1,0(~19.04001.140019.04001.14004001N X Xk k近似⨯-=⨯-∑= 故⎭⎬⎫⎩⎨⎧⨯->⨯-=>19.04001.140045019.04001.1400}450{X P X P⎭⎬⎫⎩⎨⎧≤⨯--=147.119.04001.14001X P.1357.0)147.1(1=Φ-≈例8 设有1000人独立行动, 每个人能够按时进入掩蔽体的概率为0.9. 以95%概率估计, 在一次行动中, 至少有多少人能进入掩蔽体.解用i X 表示第i 人能够按时进入掩蔽体, 令.100021X X X S n +++=设至少有m 人能进入掩蔽体, 则要求,95.0}{≥≤n S m P ⎭⎬⎫⎩⎨⎧-≤⨯⨯⨯-=≤909001.09.010009.01000}{n n S m S m由中心极限定理, 有),1,0(~90900N S n 近似- 所以⎭⎬⎫⎩⎨⎧-≤-=≤9090090900}{n n S m P S m P ⎭⎬⎫⎩⎨⎧-<--=90900909001m S P n查正态分布数值表, 得 ,65.190900-=-m 故88435.88465.15900≈=-=m 人.课堂练习某地有甲、乙两个电影院竞争当地每天的1000名观众, 观众选择电影院是独立的和随机的,问: 每个电影院至少应设有多少个座位, 才能保证观众因缺少座位而离去的概率小于1%?。
大数定律和中心极限定理1 大数定律这里强调的是总体与样本大数定律就是说:当随机事件发生的次数足够多时,发生的频率趋近于预期的概率大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”2 赌徒缪误:1,2,4,8-----在赌钱时——输了就翻倍,一直到赢为止有人说:如果已经连续4次出现正面,接下来的第5次还是正面的话,就接连有5次“正面”,根据概率论,连抛5次正面的几率是1/25=1/32。
所以,第5次正面的机会只有1/32,而不是1/2。
以上混淆了“在硬币第1次抛出之前,预测接连抛5次均为正的概率”和“抛了4次正之后,第5次为正的概率”,既(11111)---- 1/32,(1111)1 ---- 1/2。
3 中心极限定理3.1 大数定律和中心极限定理的关系:上面通过赌徒谬误介绍了概率论中的大数定律。
大数定律说的是当随机事件重复多次时频率的稳定性,随着试验次数的增加,事件发生的频率趋近于预期的“概率”。
但大数定律并未涉及概率之分布问题。
此外大数定律说明了在一定条件下,当系统的个体足够多时,系统的算数平均值会集中在期望位置。
从这个角度,中心极限定理包含了大数定律。
因为中心极限定理在于揭示系统在期望附近的统计性质,即“以何种方式”集中在期望。
总的来说就是——大数定律反映的是频率->概率(或者认为广义的期望);而中心极限定理反映的是——在整体结果下,结果内部发生各种情况下的一个概率分布情况。
3.2 那什么是中心极限定理?中心极限定理指的是分别适用于不同条件的一组定理,但基本可以用一句通俗的话来概括它们:大量相互独立的随机变量,其求和后的平均值以正态分布(即钟形曲线)为极限。
Eg:以二项分布为例进行解释(抛硬币)对于抛n次硬币,出现正面k次的一个分布情况,如下:但是对于二项分布不一定是对对称的,除了受抛的次数n影响,还受对应的概率p的影响3.3 晋级再后来,中心极限定理的条件逐渐从二项分布推广到独立同分布随机序列,以及不同分布的随机序列。
⼤数定律与中⼼极限定理⽬录随机变量序列的两种收敛性依概率收敛:设{X n}为⼀随机变量序列,X为⼀随机变量,若对于任意ϵ>0,有P(|X n−X|≥ϵ)→0(n→∞)则称序列{X n}依概率收敛于X,记作X n P →X依概率收敛的性质:若X n P →aY n P →b则:X n±Y n P→a±bX n Y n P→abX n÷Y n P→a÷b弱收敛(按分布收敛):随机变量X,X1,X2…的分布函数为F(x),F1(x),F2(x)…,若对于F(x)的任意⼀个连续点x,有lim n→∞F n(x)=F(x)则称分布函数序列{F n(x)}弱收敛于F(x),记作F n(x)W→F(x)也称{X n}按分布收敛于X,记作X n L →X特征函数特征函数:设X是⼀个随机变量,则φ(t)=E(e itX)为X的特征函数。
常⽤分布的特征函数0-1分布:φ(t)=pe it+q泊松分布:φ(t)=∑e itx λk e−λk!=e−λ∑(λe it)kk!=eλ(e it−1)均匀分布:φ(t)=∫b ae itxb−a dx=e itb−e itait(b−a)标准正态分布:φ(t)=e−1 2t2证明:φ(t)=∫∞−∞e itx1√2πe−12x2dx=1√2π∫∞−∞∞∑n=0(itx)nn!e−12x2dx=∞∑n=0(it)nn![∫∞−∞x n1√2πe−12x2]dx=∞∑n=0(it)nn!E(X n)当n为奇数时,E(X n)=∫∞−∞x n1√2πe−12x2dx=0当n为偶数时,E(X n)=E(X2m)=∫∞−∞x2m1√2πe−12x2dx=1√2π∫∞−∞−x2m−1d(e−12x2)=1√2π(2m−1)∫∞−∞x2m−2e−12x2dx=(2m−1)(2m−3)…1∫∞−∞1√2πe−12x2dx=(2m−1)!!=2m!2m(m−1)!故φ(t)=∞∑m=0(it)2m(2m)!E(X2m)=∞∑m=0(it)2m(2m)!2m!2m(m−1)!=∞∑m=0(−t22)mm!=e−1 2t2指数分布的特征函数:φ(t)=(1−it λ)−1证明:φ(t)=∫∞0e itxλe−λx dx=λ[∫∞0cos(tx)e−λx dx+i∫∞0sin(tx)e−λx dx]I=∫∞0cos(tx)e−λx dx=∫∞01t e−λx dsin(tx)=λt∫∞sin(tx)e−λx dx=−λt2[−1+λ∫∞cos(tx)e−λx dx]=−λ2t2I+λt2故I=λλ2+t2φ(t)=λ(λλ2+t2+itλ2+t2)=λλ2+t2(λ+it)=λλ−it=(1−it λ)−1特征函数的性质|φ(t)|≤φ(0)=1证明:|φ(t)|=|∫e itx f(x)dx|≤∫|e itx|f(x)dx=1若Y=aX+b,则φY(t)=e ibtφX(at)证明:φY(t)=∫e it(ax+b)f(x)dx=e itb∫e itax f(x)dx=e ibtφX(at)若X和Y相互独⽴,则有φX+Y(t)=φX(t)φY(t)证明:E(e it(X+Y))=E(e itx e ity)=E(e itx)E(e ity)=φX(t)φY(t)若E(X l)存在,则X的特征函数l次可导,且对1≤k≤l有φ(k)(0)=i k E(X k)证明:φ(k)(t)=∫i k x k e ixt f(x)dx将t=0代⼊得φ(k)(0)=i k∫x k f(x)dx=i k E(X k)⼤数定律 概率是频率的稳定值,其中稳定是什么意思?⼤数定律详细的描述了这个问题。
大数定律与中心极限定理总结大数定律与中心极限定理是概率论与数理统计中的两个重要定理,用于描述随机变量序列的性质。
下面我将分别对这两个定理进行总结,并给出相关的参考内容。
一、大数定律大数定律是概率论中的一个基本定理,描述了随机变量序列的极限性质。
大数定律可以分为弱大数定律和强大数定律两种。
1. 弱大数定律弱大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值收敛于某个常数,那么这个序列就满足弱大数定律。
弱大数定律的代表是辛钦大数定律。
具体来说,如果一个随机变量序列X1, X2, ..., Xn,其中Xi是相互独立、同样分布的随机变量序列,它们的均值为μ,方差为σ^2。
那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1这意味着当样本数量趋向于无穷大时,样本均值的概率逼近于1,即样本均值趋近于总体均值μ。
2. 强大数定律强大数定律是指对于一个随机变量序列,如果序列的均值存在,并且均值以概率1收敛于某个常数,那么这个序列就满足强大数定律。
强大数定律的代表是伯努利大数定律和切比雪夫大数定律。
伯努利大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其中每个随机变量取值为0或1,概率为p或1-p,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - p| ≤ ε ) = 1切比雪夫大数定律是对于一个独立随机变量序列X1, X2, ..., Xn,其具有相同的均值μ和方差σ^2,那么对于任意给定的正数ε,有:lim(n→∞)P( |X1+X2+...+Xn)/n - μ| ≤ ε ) = 1以上的大数定律说明了随机变量序列的均值具有稳定的性质,当样本数量足够大时,样本均值可以准确地反映总体均值。
二、中心极限定理中心极限定理是概率论与数理统计中的一个基本定理,描述了独立随机变量和的分布的极限性质。
大数定律与中心极限定理公式
大数定律和中心极限定理是概率论和统计学中的重要概念,它们描述了在大量重复实验或观察中随机变量的性质。
大数定律是指当试验次数趋于无穷时,随机变量的相对频率趋于其概率。
具体来说,如果一个随机变量序列{ξn, n ∈ N} 的期望存在且等于某个常数ξ,那么对于任意小的正数ε,当 n 趋于无穷时,P( ξn - ξ ≥ ε ) 趋于 0。
中心极限定理则是指无论随机变量 X1, X2,..., Xn 的分布是什么,只要 n 足
够大,那么它们的和 X1 + X2 + ... + Xn 除以 n 的标准化形式就会近似地
服从标准正态分布 N(0, 1)。
也就是说,对于任意x ∈ R,有limn→∞
P(∣∑i=1nxi−nμ∣≤xσn)=Φ(x)\lim_{n \to \infty}
P(\frac{\sum_{i=1}^{n}x_i-n\mu}{\sqrt{n\sigma^2}} \leq x) =
\Phi(x)limn→∞P(∣∣∑i=1nxi−nμ∣∣≤xnσ2)=Φ(x),其中μ 是 X1, X2,...,
Xn 的期望,σ^2 是它们的方差,Φ(x)是标准正态分布 N(0, 1) 的分布函数。
这两个定理在统计学中有着广泛的应用,例如在样本均值的分布、样本比例的分布、回归分析等方面都有重要的应用。