当前位置:文档之家› 数学专业毕业论文

数学专业毕业论文

数学专业毕业论文
数学专业毕业论文

数学专业毕业论文

————————————————————————————————作者:————————————————————————————————日期:

数学专业毕业论文

目录

摘要 ......................................................................................................................................... I 1绪论 . (2)

1.1课题的研究意义 (2)

1.2国内外研究现状 (2)

1.3研究目标 (3)

2关于独立分布的中心极限定理的探讨 (4)

2.1中心极限定理的提法 (4)

2.2独立同分布情形的两个定理. (4)

2.2.1 林德伯格-----勒维中心极限定理 (5)

2.2.2隶莫弗——拉普拉斯定理 (6)

2.3独立不同分布情形下的中心极限定理 (7)

2.3.1林德贝格中心极限定理 (7)

2.3.2李雅普诺夫中心极限定理 (12)

2.4本章小结 (13)

3中心极限定理在商业管理中的应用 (15)

3.1水房拥挤问题 (15)

3.2设座问题 (17)

3.3盈利问题 (18)

3.4抽样检验问题 (19)

3.5供应问题 (23)

结语 (24)

参考文献 (25)

附录 (26)

中心极限定理探讨及应用

摘要:本文从随机变量序列的各种收敛与它们间的关系谈起,通过对概率论的经典定理—中心极限定理在独立同分布和不同分布两种情况下的结论作了比较系统的阐述,揭示了随机现象最根本的性质—平均结果的稳定性.经过对中心极限定理的讨论,给出了独立随机变量之和的分布可以用正态分布来表示的理论依据.同样中心极限定理的内容也从独立同分布与独立不同分布两个角度来进行讨论;最后给出了一些中心极限定理在数理统计、管理决策、近似计算、以及保险业等方面的应用,来进一步地阐明了中心极限定理在各分支学科中的重要作用和应用价值.

关键词:弱收敛;独立随机变量;特征函数;中心极限定理.

1绪论

1.1课题的研究意义

概率统计学是一门研究随机现象统计规律性[1]的数学学科,它的应用十分广泛,涉及自然科学、社会经济学科、工程技术及军事科学、农医学科、企业管理部门等.而大数定律和中心极限定理是概率论中最重要的内容之一,甚至可以说概率论的真正历史开始于极限定理的研究,在这以前概率论还仅局限于古典概率的直接计算,而且主要是赌博中的概率计算[2].极限定理最早的成果有:伯努利大数定律,棣莫佛一拉普拉斯定理和泊松定理,这些定理开辟了概率论中的重要研究方向—大数定律、中心极限定理及以正态分布和泊松分布为代表的无穷可分分布的研究.概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理是概率论中最重要的一类定理,有广泛的实际应用背景.在自然界与生产中,一些现象受到许多相互独立的随机因素的影响,如果每个因素所产生的影响都很微小时,总的影响可以看作是服从正态分布的.中心极限定理就是从数学上证明了这一现象.最早的中心极限定理是讨论n重伯努利试验中,某事件A出现的次数渐近于正态分布的问题.1716年前后,棣莫佛对n重伯努利试验中每次试验事件A出现的概率为1/2的情况进行了讨论,随后,拉普拉斯和李亚普诺夫等进行了推广和改进.自莱维在1919-1925年系统地建立了特征函数理论起,中心极限定理的研究得到了很快的发展,先后产生了普遍极限定理和局部极限定理等.无论是在概率论的发展史上还是在现代概率论中,极限定理的研究都占特别重要的地位,也是数理统计学的基石之一,其理论成果也比较完美.长期以来,对于极限定理的研究所形成的概率论分析方法,影响着概率论的发展.同时新的极限理论问题也在实际中不断产生.这样中心极限定理在概率论中占有重要的地位,同时极限定理的研究引起了现代概律论的发展,并且在统计分析和近似计算等方面具有一定的应用,所以中心极限定理的研究具有一定的理论和实际意义.

1.2国内外研究现状

中心极限定理作为概率论的重要内容,其理论成果相对比较完善.这方面的文章较多,它们的结果也比较完美.但是他们注重于研究单一的方向,而几个定律之间的关系和应用方面的较少.出于这种现状本文通过对独立条件下的中心极限定理做系统的分析,主要研究和讨论几个中心极限定理之间的关系以及中心极限定理所揭示的

理论意义和他们的应用.同时对文中出现的定理和结论做系统的分析和证明,所以对教学和科研方面具有一定的参考价值.

1.3研究目标

通过对独立随机序列的中心极限定理做系统的分析,阐明中心极限定理它们之间的关系以及举例说明中心极限定理在实际问题中的应用为教学和科研供参考.

2 关于独立分布的中心极限定理的探讨

凡是在一定条件下断定随机变量之和的极限分布是正态分布的定理,在概率论中统称中心极限定理.具体一点说,中心极限定理回答的是(独立或弱相依)随机变量之和的极限分布在什么条件下是正态的.中心极限定理是揭示产生正态分布的源泉,是应用正态分布来解决各种实际问题的理论基础.

2.1中心极限定理的提法

直观上,如果一随机变量决定于大量(乃至无穷多个)随机.因素的总合,其中每个随机因素的单独作用微不足道,而且各因素的作用相对均匀,那么它就服从(或近似地服从)正态分布,下面我们将按严格的数学形式来表述这一直观.

在许多情形下,一随机变量X 可以表示为或近似地表示为大量独立随机变量

之和,12n X ξξξ=++??? (a)

这里,每个i ξ直观上表示一种随机因素的效应,假如式(a)包含了决定X 的充分多的随机因素的效应(即n 充分大),则1n

i i ξ=∑的分布就近似于X 的分布.中心极限定理就

是要说明,在什么条件下大量独立随机变量之和近似地服从正态分布,即,在什么条件下,当n →∞时,独立随机变量之和的极限分布是正态分布的.

中心极限定理的名称最早是由仆里耶(1920年)提出来的,中心极限定理的一般形式最早是由切比雪夫(1821年—1894年)提出来的下面我们介绍四个主要定理:1)林德伯格一勒维定理2)棣莫弗一拉普拉斯定理2)林德伯格定理3)李雅普诺夫定理.其中林德伯格定理是最一般的,其它情形可以看作它的推论.

2.2独立同分布情形的两个定理.

中心极限定理有多种不同的形式,它们的结论相同,区别仅在于加在各被加项

12,,ξξ???上的条件不同.独立同分布随机变量列的中心极限定理,是中心极限定理最简单又最常用(特别在数理统计中)的一种形式,通常称做林德伯格----勒维定理.历史上最早的中心极限定理一棣莫弗一拉普拉斯(积分)定理是它的特殊情形.

设(1,2,)k k ξ=???的方差D ξ,大于0,令

2

221

,,n

k k k n

k k a E b D B b ξξ====∑ (1)

我们说,随机变数列{}k ξ服从中心极限定理,如果关于1x R ∈均匀的有

2

2

11

1

lim ().2t n

x

k k

n k n

P a x e dt B ξπ-

-∞

→∞

=??-≤=?

???

∑?

(2)

(2)表示:随机变量数

1

1

()n

k

k k n

a B ξ

=-∑的分布函数关于x 均匀的趋于正态分布

(0,1)N 的分布函数.

独立同分布的两个定理:

2.2.1 林德伯格-----勒维中心极限定理

设12,,,,n x x x ??????相互独立,服从同一分布,具有数学期望和方差:

2(),()0.i i E x Var x μσ==>记

12...n n X X X n Y n

μ

σ*+++-=

则对任意实数y ,有

2

2

1

lim ()().2t y

n n p Y y y e dt π

-

*-∞

→+∞≤=Φ=

?

(3)

证明 为证(1)式,只须证{}*n Y 的分布函数列若收敛于标准正态分布.又由定理4.3.4

[3]

,只须证{}*n Y 的特征函数列收敛于标准正态分布的特征函数.为此设

n X μ-的特征函数为()t ?,则*n Y 的特征函数为

*()()n

n

Y t t n ??σ?

?=????

又因为2()0,()n n E X Var X μμσ-=-=,所以有 (0)0?'=, 2(0)?σ''=- 于是特征函数()t ?有展开式

2

2()(0)(0)(0)()2

t t t t ????ο'''=+++

2221

1()2

t t σο=-+

从而有

2

*2222lim ()lim 1()2n n

t Y n n t t t e n

n ?ο-→+∞→+∞??

=-

+=????, 而2

2

t e -正是(0,1)N 分布的特征函数,定理得证.

例1某汽车销售点每天出售的汽车辆数服从参数为2λ=的泊松分布.若一年365天都经营汽车销售,且每天出售的汽车数是相互独立的,求一年中售出700辆以上汽车的概率.

解:设x 某汽车销售点每天出售的汽车辆数,则12365Y x x x =++???+,为一年的总销量.由()()2i i E x Var x ==,知()()3652730E Y Var Y ==?=.利用林德贝格---勒维中心极限定理可得, 700730

(700)1(700)1(

)1(111)0.8665730

P Y P Y ->=-≤≈-Φ=-Φ-= 这表明一年中售出700辆以上汽车的概率为0.8665

2.2.2隶莫弗——拉普拉斯定理

在n 重贝努里试验中,事件A 在每次试验中出现的概率为p (0

n n np

Y npq

μ*-=

且对任意实数y ,有

2

2

1lim ()().2t y

n n p Y y y e dt π

-

*-∞

→+∞≤=Φ=

?

此定理由定理1马上就得出,也就是说定理2是定理1的推论.

例2 某保险公司多年的统计资料表明,在索赔户中被盗索赔户占20%,以x 表示在随意抽查的100个索赔户中因被盗向保险公司索赔的户数.

(1)写出x 的分布列;

(2)求被盗户不少于14户且不多于30户的概率近似值.

解:(1) x 服从100,0.2n p ==的二项分布(100,2)b ,即

100()0.20.8,1,2,,k k

n p x k k n k -??===??? ???

(2)利用隶莫弗---拉普拉斯中心极限定理,有 30.51000.213.51000.2

(1430)(13.530.5)(

)()1000.20.81000.20.8

p x p x -?-?≤≤=<<≈Φ-Φ????

(2.625)( 1.625)(2.625)1(1.625)0.9956510.9480.9437=Φ-Φ-=Φ-+Φ=-+=这表

明被盗户不少于14户且不多于30户的概率近似值为0.9437.

2.3独立不同分布情形下的中心极限定理

对于独立同分布随机变量序列12,,ξξ???只要它们的方差有穷,中心极限定理就成立.而在实际问题中说诸i ξ具有独立性是常见的,但是很难说诸i ξ是“同分布”的随机变量,正如前面提到的测量误差n Y 的产生是由大量“微小的”相互独立的随机因素叠加而成的,即1n

n i i Y ξ==∑则i ξ间具有独立性,但不一定同分布,所以我们有必要讨论

独立不同分布随机变量和的极限分布问题,目的是给出极限分布为正态分布的条件.林德伯格(Lideberg)于1922年找到了独立随机变量服从中心极限定理的最一般的条件,通常称做林德伯格条件.

2.3.1林德贝格中心极限定理

设独立随机变量序列{}n X 满足林德贝格条件,则对任意的x ,有

2

2

11

1

lim ().2t n

x

i i

n i n

P X x e dt B μπ-

-∞

→∞

=??-≤=?

???

∑?

为证此,先证下列三个不等式:对任意实数a ,有

1ia e a -≤; (4)

2

12!

ia

a e ia --≤ (5)

2

2

123!

ia a

a e ia --+

≤ (6) 实际上,对0a =上三式明显.设0a >,则 0

1a

ia

ix e e dx a -=≤?

2

1(1)2!

a

a

ia

ix

a e ia e dx xdx --=

-≤

=?

?

2

1(1)2

a

ia

ix a e ia e ix dx --+=

--?

22

12!3!

a

a

ix

x a e ixdx dx ≤--≤=??

利用cos sin ia e a i a =+,可见(4)(5)(6)方都是a 的偶函数,故他们对0a <也成立.

定理三的证明,先把记号简化.令

k k

nk n

a B ξξ-=

(7)

以()nk t f 、()nk x F 分别表nk ξ的特征函数与分布函数,因而

()()(),nk x k n k k n k F P B x a F B x a ξ=≤+=+ (8) ()20,k

nk nk x nk n

D E xdF D B ξξξ+∞

-∞

==

?

, (9)

2

()

21

1

1

11n

n

n

nk

nk x k k k k n D x dF D B ξ

ξ+∞

-∞

======∑∑∑?

(10) 在这些记号下,由(6)

2

2

()

()2

1

()()k k n

n k

x a k nk x k x x a B B n

n

x a x a dF dF B B ττ-->>--=?

?

2()n

nk y y B y dF τ>=?

故林德贝格条件可化为:对任意0τ>, 2()1lim 0n

nk x x n k x dF τ

>→∞

==∑?

; (11)

而(2)式化为:对τ均匀的有

2

2

11lim .

2t n y

nk n k P x e dt ξπ-

-∞

→∞=??

≤=????∑?

(12)

如果在条件(11)下,能够证明1

n

nk k ξ=∑的特征函数

22

()1

()()t n

n nk t k t f e

n ?-

==→→∞∏亦即

2

()

1

log ()log ,()

2n

n nk t k t t f n ?==→-→∞∑ (13)

那么根据定理3.2.3

[4]

,(12)成立;再由定理3.1.3,(12)中收敛对1

x R ∈还是均匀的,于是定理3得以证明.现在也就是只要证出(13)成立 则问题得证

为了证明(13),分两步.

(甲)先证log ()n t ?可展开为 ()1log ()(1)()n

n nk t n k t f R t ?==-+∑, (14)

其中函数()n R t 在任意有穷t 区间内趋于0 实际上,由(9)中前一式

()()

1(1)itx nk t nk x f e itx dF +∞

-∞-=--?

(15)

根据(5)

2

22

22()()

()()12

2nk t nk x nk x nk x x x t t f x dF x dF x dF εε+∞

-∞

≤>??-≤

=+?

????

?? 2

22()2

nk x x t x dF εε>??≤

+?????. (16)

其中0ε>任意.由(11),对一切充分大的n 有22()(1)nk x x x dF k n ε

ε><≤≤?;从而

关于

(1)k k n ≤≤及任何有限区间[],T T -中的t ,同时有

2222()()11;max 1nk t nk t k n

f T f T εε≤≤-≤-≤

因而对任意[],t T T ∈-,均匀的有

()1lim max 10

nk t n k n

f →∞≤≤-=.

(17)

特别,当[],t T T ∈-时,对一切充分大的n ,下式成立: ()1

12

nk t f -< (18) 因此,在[],T T -中,有展开式

()()11

log ()log log 1(1)n n

n nk t nk t k k t f f ?==??==+-??∑∑

()1

(1)()

n

nk t n k f R t ==-+∑ (19)

其中

1

()12

(1)()(1)s n

s n nk t k s R t f s -∞

==-=-∑∑ 由(18)

2

()()121()111

()12

211n

n

s nk t n nk t k s k nk t f R t f f ∞

===-≤-=--∑∑

2

()1

1n

nk t k f =≤-∑()()11

max 11n

nk t nk t k n

k f f ≤≤=≤--∑;

但由(16)中第一个不等式及(10) 2

22

()()

1

1

12

2

n

n

nk t nk x k k t t f x dF +∞

-∞

==-≤

=∑

∑?

2

()1()max 12n nk t k n

t R t f ≤≤≤-

由(17)可见当n →∞时,关于任意有穷区间[],T T -中的t 均匀的有

()0n R t → (20) (乙)令

2()1()(1)2n itx

n nk x k t t e itx dF ρ+∞-∞

==+--∑?

由(15)得

2

()1

(1)()2n

nk t n k t f t ρ=-=-+∑. (21)

如果能够证明:对任意有穷区间[],T T -中的t 均匀的有

lim ()0n n t ρ→∞

=. (22)

那么以(21)代入(14)并联合(甲)中的结论即得证(13),而且(13)中的收敛对任意有穷区间内的t 均匀,从而定理得以完全证明.

今证(22),由(10)

2

2()1

()22n nk x k t itx dF +∞-∞==-∑? 对任意0ε>,

2()1()()12n

itx n nk x x k itx t e itx dF ερ≤=??

=---???

?∑? 22()112n

itx nk x x k t x e itx dF ε>=??+--+????

∑? 由(4)(5)得

3

32

2()()11

()6

n

n

n nk x nk x x x k k t t x dF t

x dF ε

ε

ρ≤>==≤

+∑∑?

?

3

22

2()()11

6n n

nk x nk x x x k k t x dF t x dF εεε≤>==≤+∑∑??

由(10)可见:对t T ≤,有

3

2

2()1

()6n

n nk x x k T t T x dF ερε>=≤+∑? (23)

对任意0η>,可选0ε>使

3

6

2

T η

ε<

又由(11),存在正整数(,,)N N T ηε=,使对此ε及n N ≥,有

2()2

1

2n

nk x x k x dF T ε

η

>=<

∑?

(24)

于是当n N ≥时,对一切[],t T T ∈-,有 ()n t ρη<

2.3.2李雅普诺夫中心极限定理

如对独立随机变数列{}k ξ,存在常数0σ>,使当n →∞时有 221

10n

k

k

k n E a B

σ

σ

ξ

++=+→∑ (25)

则(2)对x 均匀的成立.

证.只要验证林德贝格条件满足,由(25)

22

1

1

()()k n

n

k k x a B k n

x a dF x B τ->=-∑?

22

1

1

()()k n

n

k

k x a B k n x a dF x B B σ

σ

ττ+->=≤-∑?

221

11

0,()n

k

k

k n

E a n B σ

σσξ

τ++=≤

+→→∞∑

例3 一份考卷由99个题目组成,并按由易到难顺序排列.某学生答对第1题的概率为0.99;答对第2题的概率为0.98;一般地,他答对第i 题的概率为

1100,1,2,i i -=L .加入该学生回答各题目是相互独立的,并且要正确回答其中60个

题目以上(包括60个)才算通过考试.试计算该学生通过考试的可能性多大?

解 设

???=.01题,若学生答错第

题;,若学生答对第

i i X i

于是i X 相互独立,且服从不同的二点分布:

(1)1100,(0)1100,i i i i p X p i p X p i ===-==-= 1,2,,99i = 而我们要求的是

99

1

(60)i i p X =≥∑.

为使用中心极限定理,我们可以设想从100X 开始的随机变量都与99X 同分布.且相互独立.下面我们用1δ=来验证随机变量序列{}n X 满足李雅普诺夫条件(25),因为

1

1

()(1),()n n

n i

i

i

i i B Var X p p n ===

=-→+∞→+∞∑∑,

3

33()(1)(1)(1)i i i i i i i i E X p p p p p p p -=-+-≤-, 于是

3

1231111()0(1)n i i n i n i

i i E X p B p p ==-≤→??

-????∑∑ ()n →+∞, 即{}n X 满足李雅普诺夫条件(25),所以可以使用中心极限定理. 又因为

99

99

99

1

1

1()(1)49.5100

i i i i i i

E X p =====-

=∑∑∑ 99

99

299

1

1

()(1)()16.665100100

i i i i i B Var X ====-

=∑∑ 所以该学生通过考试的可能性为

99991149.56049.5(60)16.665

16.665i i i i X p X p ==??

-??-??

≥=≥????????∑∑

1(2.5735)0.005≈-Φ=.

由此看出:此学生通过考试的可能性很小,大约只有千分之五.

2.4本章小结

这一章从独随机变量之和的极限分布为正态分布的定理引入了中心极限定理的内容,可分为分独立同分布和不同分布两种情况下讨论随机变量的分布趋于正态分布的情况.由于极限定理的研究直接联系到大n 场合的二项分布的计算,所以我们也通

过一些例子来讨论二项分别的近似计算问题.最后通过举出反例,以及在相同条件下比较大数定律与中心极限定理,说明了中心极限定理在近似计算中更精确.至于中心极限定理名称的得来是由于随机变量和的分布收敛于正态分布的极限定理的研究在长达两个世纪的时间内成了概率论研究的中心课题,因此也得到了中心极限定理的名称.

3 中心极限定理在商业管理中的应用

3.1 水房拥挤问题

假设某高校有学生5000人,只有一个开水房,由于每天傍晚打开水的人较多,经常出现同学排长队的现象,为此校学生会特向学校后勤集团公司提议增设水龙头.假设后勤集团公司经过调查,发现每个学生在傍晚一般有1%的时间要占用一个水龙头,现有水龙头数量为45个,现在总务处遇到的问题是: (1)未新装水龙头前,拥挤的概率是多少?

(2)需至少要装多少个水龙头,才能以95%以上的概率保证不拥挤?

解:

(1)设同一时刻,5000个学生中占用水龙头的人数为X ,则

X ~B (5000,0.01)

拥挤的概率是

45

50005000

0(45)1(045)10.010.99k

k k k p p C ξξ-=>=-≤≤=-??∑ 直接计算相当麻烦,我们利用隶莫佛-拉普拉斯定理.已知n=5000,p=0.01,q=0.99,.04.7,50==npq np

()().

2389.01.771.004.750004.75045)450(=-Φ--Φ=???

??-Φ-??? ??-Φ≈≤≤ξP

从而 (45)10.23890.7611p ξ>=-=.怪不得同学们有不少的抱怨.拥挤的概率竟达到76.11%.

(2)欲求m ,使得

95.0)450(≥≤≤ξP

即 95

.004.750004.750≥???

??-Φ-??? ??-Φm 由于 ()0

09.704.7500≈-Φ=???

??-Φ

即 95

.004.750≥??? ??-Φm

查标准正态分布表,得 645

.104.750

≥-m

即 6.61≥m 故需要装62个水龙头. 问题的变形:

(3)需至少安装多少个水龙头,才能以99%以上的概率保证不拥挤? 解:欲求m ,使得

99.0)450(≥≤≤ξP

即 99.004.750004.750≥??? ??-Φ-??? ??-Φm

由于 ()009.704.7500≈-Φ=???

??-Φ.76

即 99.004.750≥??

?

??-Φm

查标准正态分布表,得

325.204

.750

≥-m 即 4.66≥m 故需要装67个水龙头.

(4)若条件中已有水龙头数量改为55个,其余的条件不变,1,2两问题结果如何?

解:(1)5550

(55)1()1(0.71)0.23897.04p ξ->=-Φ=-Φ=.

(2) 同上.

(5)若条件中的每个学生占用由1%提高到1.5%,其余的条件不变,则(1),(2)两问题结果如何?

解:(1) 设同一时刻,5000个学生中占用水龙头的人数为X ,则

X ~B (5000,0.015),

已知n=5000,p=0.015,q=0.985,.60.8,75==npq np

拥挤的概率是().149.3160.875451)45(≈-Φ-=??

? ??-Φ-=>ξP

拥挤的概率竟达到100%. (2) 欲求m ,使得

95.0)450(≥≤≤ξP

即 95.060.875060.875≥???

??-Φ-??? ??-Φm

由于 060.8750≈???

??-Φ

即 95.060.875≥??

?

??-Φm

查标准正态分布表,得

645.160

.875

≥-m 即 14.89≥m 故需要装90个水龙头.

3.2设座问题

甲、乙两戏院在竞争500名观众,假设每个观众完全随意地选择一个戏院,且观众之间选择戏院是彼此独立的,问每个戏院至少应该设多少个座位才能保证观众因缺少座位而离开的概率小于5%.

解: 由于两个戏院的情况相同,故只需考虑甲戏院即可.设甲戏院需设m 个座位,设

.5000,,3,2,1,0,1Λ=?

??=i i X i ,否则个观众选择甲电影院第

则 .5000,,1,1,5.0)0()1(Λ=====i X P X P i i 若用X 表示选择甲戏院的观众总数,则

∑==

5000

1

i i

X

X

问题化为求m 使

05.0)(≤≥m X P

即 .95.0)(≤≤m X P 因为 5.0)()(==i i X D X E

相关主题
文本预览
相关文档 最新文档