南京大学统计学 ch4概率分布与中央极限定理1课件
- 格式:ppt
- 大小:137.00 KB
- 文档页数:27
概率论与数理统计第5章大数定律和中心极限定理人们在长期的实践中发现◆事件发生的频率具有稳定性◆随着试验次数的增多,事件发生的频率将稳定在一个确定的常数(概率值)附近频率的稳定性是概率定义的客观基础◆在第一章中我们从直观上描述了这一事实本章将用大数定律对频率的稳定性作出理论上的说明◆中心极限定理是讨论随机变量和的分布以正态分布为极限的一组定理.◆我们知道正态分布有一个重要的性质:相互独立的正态随机变量的和仍是正态随机变量◆中心极限定理将给出概率论中的另一个重要结果:在一定条件下,充分多个相互独立的非正态随机变量(不管它们的分布如何)的和近似服从正态分布.◆大数定律和中心极限定理无论在应用上还是理论上都具有极其重要的作用.【吸烟率调查问题】某卫生组织为确定某城市成年男子的吸烟率p,将被调查的成年男子中吸烟的频率作为p的估计.现在要保证有90%以上的把握,使得调查对象吸烟者的频率与该城市成年男子的吸烟率p之间的差异不大于5%.问至少要调查多少对象?本章主要内容◆§5.1大数定律◆§5.2中心极限定理◆对某个随机变量X进行大量的重复观测,所得到的大批观测数据的算术平均具有稳定性.◆这类稳定性是在对随机变量进行大量重复试验条件下呈现出来的,历史上把这种试验次数很大时出现的规律统称为大数定律.◆首先来引进证明大数定律所需要的预备知识:切比雪夫(Chebyshev)不等式.【定理5.1】设随机变量X 的数学期望E (X )及方差D (X )都存在,则对于任意正数ε,有不等式即成立.称上述不等式为切比雪夫(Chebyshev)不等式.2)(}|)({|εεX D X E X P ≤≥-【定理5.1】设随机变量X 的数学期望E (X )及方差D (X )都存在,则对于任意正数ε,有不等式证:(仅对连续型随机变量进行证明) 设f (x )为X 的概率密度,则.⎰≥-=ε)()(X E x dx x f ⎰+∞∞--≤dx x f X E x )()]([122ε}|)({|ε≥-X E X P ⎰≥--≤εε)(22)()]([X E x dx x f X E x )(12X D ⨯=ε.)(2εX D =2)(}|)({|εεX D X E X P ≤≥-⎰∞∞--dx x f X E x )()]([2【定理5.1】从定理中可以看出,◆如果D (X )越小,那么随机变量X 取值于开区间(E (X )–ε,E (X )+ε)中的概率就越大◆此定理进一步说明方差是一个反映随机变量在其分布中心E (X )附近集中程度的数量指标◆利用切比雪夫不等式,可以在随机变量X 的分布未知的情况下估算概率值的界限2)(}|)({|εεX D X E X P ≤≥-【例5.1】若某班某次考试的平均分为80分,标准差为10,试估计及格率至少为多少?解:用随机变量X 表示学生成绩,则数学期望E (X )=80,方差D (X )=100,所以P {60≤X ≤100}≥P {60<X <100}=P {|X –80|<20}所以及格率至少为75%.2)20(1001-≥%7575.0==切比雪夫(Chebyshev,1821—1894)◆俄国数学家,机械学家◆他左脚生来有残疾,童年时代经常独坐家中,养成了在孤寂中看书和思索的习惯,并对数学产生了强烈的兴趣,特别对欧里几得的《几何原本》中关于没有最大素数的证明所深深吸引◆1846年以论文《试论概率论的基础分析》获硕士学位◆1849年他以论文《论同余式》获得彼得堡大学博士学位,并获彼得堡科学院的最高数学荣誉奖◆1859年当选为彼得堡科学院院士切比雪夫(Chebyshev,1821—1894)◆1872年彼得堡大学授予他功勋教授称号,1890年他荣获了法国荣誉团勋章◆切比雪夫在数学的很多方面及其邻近的学科都做出了重要贡献,在数学中以他的姓氏命名的有:切比雪夫集、切比雪夫交错、切比雪夫点、切比雪夫结点,….◆教学成就卓著他在彼得堡大学执教35年间,先后主讲十余门课程他的学生:李雅普诺夫、马尔可夫、格拉韦,…◆1944年,苏联科学院设立了切比雪夫奖金【定义5.1】设X 1,X 2,…,X n ,…是一随机变量序列,a 是一常数,若对任意正数ε,有则称序列X 1,X 2,…,X n ,…依概率收敛于a .记为注:若当n 充分大时,X n 以很大的可能性接近于a ,这种接近是“概率意义下的接近”,与微积分中数列收敛中的“接近”不同.1}|{|lim =<-∞→εa X P n n )(∞→→n a X Pn ),(∞→→n a X Pn【定理5.2】(切比雪夫大数定律)设X 1,X 2,…,X n …是相互独立、服从同一分布的随机变量序列,且具有数学期望E (X i )=μ及方差D (X i )=σ2(i =1,2,…),则依概率收敛于μ,即对于任意正数ε,有证:∑==n i i X n E 1)1(∑==n i i X n D 1)1(∑=n i i X E n 1)(1μμ=⋅=n n 1∑==ni i X D n 12)(122211σσn n n =11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P )(11∞→−→−∑=n X n P ni i μ【定理5.2】(切比雪夫大数定律)设X 1,X 2,…,X n …是相互独立、服从同一分布的随机变量序列,且具有数学期望E (X i )=μ及方差D (X i )=σ2(i =1,2,…),则依概率收敛于μ,即对于任意正数ε,有即证:由切比雪夫不等式}|1{|1εμ<-∑=ni i X n P ./122εσn -≥2)(1}|)({|εεX D X E X P -≥<-≥111lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμni i n X n P ,)1(1μ∑==n i i X n E 211)1(σn X n D n i i ∑==定理得证!【定理5.2】(切比雪夫大数定律)◆定理5.2表明,当n 充分大时,随机变量序列的算术平均接近于数学期望E (X i ) = μ,这种接近是概率意义下的接近.◆通俗地说,在定理条件下,n 个相互独立同分布随机变量的算术平均值,当n 无限增大时,几乎变成了一常数.◆这一定理从理论上说明了大量观测值的算术平均具有稳定性,为实际应用提供了理论依据.11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P )(11∞→−→−∑=n X n P n i i μ【定理5.2】(切比雪夫大数定律)◆这一定理从理论上说明了大量观测值的算术平均具有稳定性,为实际应用提供了理论依据.◆例如,在进行精密测量时,人们为了提高测量的精度,往往要进行若干次重复测量,然后取测量结果的算术平均值.11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P )(11∞→−→−∑=n X n P n i i μ【定理5.3】(伯努利大数定律)设n A 是n 重伯努利试验中事件A 发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意正数ε,有即(5.4)证:引入随机变量X i (i =1,2,…):则其中X i 相互独立且均服从参数为p 的0-1分布,且有E (X i )=p ,D (X i )=p (1–p ),i =1,2,…,n1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n )(∞→−→−n p n n P A ⎩⎨⎧=不发生次试验中第发生次试验中第A i A i X i ,0,1),(~21p n B X X X n n A +++=【定理5.3】(伯努利大数定律)设n A 是n 重伯努利试验中事件A 发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意正数ε,有即(5.4)证:且有E (X i )=p ,D (X i )=p (1–p ),i =1,2,…,n ◆由定理5.2得◆即1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n )(∞→−→−n p n n P A 11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εμn i i n X n P 11lim 1=⎭⎬⎫⎩⎨⎧<-∑=∞→εp X n P n i i n 1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n ),(~21p n B X X X n n A +++=【定理5.3】(伯努利大数定律)设n A 是n 重伯努利试验中事件A 发生的次数,p 是事件A 在每次试验中发生的概率,则对于任意正数ε,有即(5.4)说明:◆伯努利大数定律表明事件A 发生的频率n A /n 依概率收敛于事件A 发生的概率p .◆这也正是在大量重复独立试验中,频率n A /n 接近于概率p 的真正含义,也就是我们所说的频率稳定性的真正含义.1lim =⎭⎬⎫⎩⎨⎧<-∞→εp n n P A n )(∞→−→−n p n n P A【定理5.4】(辛钦大数定律)设X 1,X 2,…,X n ,…是相互独立,服从同一分布的随机变量序列,且具有数学期望E (X i )=μ(i =1,2,…),则依概率收敛于μ,即◆辛钦大数定律提供了求随机变量数学期望E (X )的近似值的方法.◆设想对随机变量X 独立重复地观测n 次,得到结果X 1,X 2,…,X n ,它们应该是相互独立,且均与X 同分布的.∑=n i i X n 11)(11∞→→∑=n X n p ni i μ【定理5.4】(辛钦大数定律)◆设想对随机变量X 独立重复地观测n 次,得到结果X 1,X 2,…,X n ,它们应该是相互独立,且均与X 同分布的.◆所以在E (X )存在的条件下,按照辛钦大数定律,当n 足够大时,可以把的观察值作为E (X )的近似值.◆这样做的好处是不必去管X 的分布究竟是怎样的,目的只是寻求随机变量的数学期望.◆辛钦大数定律是数理统计部分中点估计理论的重要依据.)(11∞→→∑=n X n p ni i μ∑=n i i X n 11【例5.3】设随机变量X 1,X 2,…,X n 独立同分布,且存在,令则 证:因为X 1,X 2,…,X n 独立同分布,所以独立同分布.又存在,由辛钦大数定律),2,1(,11 ==∑=k X n A ni k i k ).(,∞→−→−n A k P k μk nk k X X X ,...,,21k k i X E μ=)(k P n i k i k X n A μ−→−=∑=11),,2,1()(n i X E k ki==μ)(11∞→→∑=n X n p ni i μ小结◆切比雪夫不等式◆大数定律:)(11∞→−→−∑=n X n P n i i μ)(∞→−→−n p nn P A 切比雪夫大数定律伯努利大数定律)(11∞→−→−∑=n X n P n i i μ辛钦大数定律2)(}|)({|εεX D X E X P ≤≥-作业第123页:三、1,2。