依概率收敛
- 格式:doc
- 大小:273.25 KB
- 文档页数:5
依概率收敛相加
依概率收敛相加是指根据不同事件发生的概率,将多个事件的结果进行加和的操作。
具体来说,设有一系列事件A_1, A_2, ..., A_n,它们可能相互独立,也可能有一定的相关性。
每个事件发生的概率分别为
P(A_1), P(A_2), ..., P(A_n)。
则依概率收敛相加的操作可以表示为:
P(A_1 ∪ A_2 ∪ ... ∪ A_n) = P(A_1) + P(A_2) + ... + P(A_n)
其中,∪表示求并集的操作,即事件A_1, A_2, ..., A_n中至少有一个事件发生的情况。
这个操作可以用于计算多个事件的联合概率,尤其适用于事件互斥的情况,即任意两个事件不可能同时发生的情况。
例如,如果有两个骰子,第一个骰子的点数为1、2、3,第二个骰子的点数为4、5、6,则它们的联合概率为:
P(第一个骰子为1或第二个骰子为4) = P(第一个骰子为1) + P(第二个骰子为4)
= 1/6 + 1/6
= 1/3
当然,如果事件之间有相关性,这个操作就不再适用,因为事
件的概率会相互影响。
在这种情况下,我们需要使用条件概率、贝叶斯定理等相关方法来计算联合概率。
§2 依概率收敛与弱大数定律一、依概率收敛 二、弱大数定律一、依概率收敛尽管分布函数完全反映了随机变量取值的分布规律, 但是两个不同的随机变量可以有相同的分布函数. 例如, 向区间[0,1]上随机等可能投点,ω表示落点的位置,定义ξω(),,=⎧⎨⎩10 ωω∈∈[,.](.,]005051ηω(),,=⎧⎨⎩01 ωω∈∈[,.](.,]005051. (1) 则ξ和η具有相同的分布函数F(x)=⎪⎩⎪⎨⎧,1,2/1,0 .1,10,0≥<≤<x x x(2)如果定义ξξn =, n ≥1, 则ξηn d−→−, 但||ξηn -≡1. 这表明分布函数收敛性并不能反映随机变量序列取值之间的接近程度. 为此需要引入另外的收敛性.定义1 设ξ和ξn 是定义在同一概率空间 (Ω,F, P)上的随机变量序列. 如果对任意ε>0,lim (||)n n P →∞-≥ξξε=0, (3)或lim (||)n n P →∞-<ξξε=1,')3(则称ξn 依概率收敛(convergence in probability)于ξ,记作ξn P−→−ξ. 注 定义1要求所有ξ和ξn 的定义域相同.ξn P−→−ξ可直观地理解为:除去极小的可能性,只要n 充分大,ξn 与ξ的取值就可以任意接近.从上面例子可以看出, 由ξn d −→−ξ并不能导出ξn P−→−ξ. 关于这两种收敛性之间的关系,我们有下面的定理.定理1 设ξ和ξn 是定义在概率空间 (Ω,F, P)上的随机变量序列.1. 如果ξn P −→−ξ, 则 ξn d−→−ξ. 2. 如果ξn dc −→−, c 为常数,则ξn Pc −→−. 证 1. 设F 和F n 分别是ξ和ξn 的分布函数,x 表示F 的连续点. 任意给定ε>0,(ξεξεξξεξ≤-=≤-≤≤->x x x x x n n )(,)(,)⊆≤-≥()()ξξξεn n x ,因此F(x -≤+-≥εξξε)()()F x P n n .令n →∞, 由于ξn P−→−ξ, 故P P n n ()(||)ξξεξξε-≥≤-≥→0, 从而 F(x-≤→∞ε)lim ()n n F x . (4)类似地()(,)(,)ξξξεξξεn n n x x x x x ≤=≤≤+≤>+⊆≤+-≥()()ξεξξεx n ,从而F x F x P n n ()()()≤++-≥εξξε.令n →∞, 得lim ()()n n F x F x →∞≤+ε. (5)连接(4) (5)两式,对任意ε>0, 有F(x-≤→∞ε)lim ()n n F x ≤lim ()()n n F x F x →∞≤+ε.由于F 在x 点连续,令ε→0, 就得lim ()()n n F x F x →∞=, 即ξn d−→−ξ. 2. 如果ξn dc −→−,则 lim (),,n n F x →∞=⎧⎨⎩01 x cx c <≥.因此对任意ε>0,有)()(1)()()|(|εξεξεξεξεξ-≤++<-=-≤++≥=≥-c P c P c P c P c P n n n n n=1-+-+-→F c F c n n ()(),εε00 (n →∞).定理证毕.例1 设{ξn }独立同分布,都为[0, a]上的均匀分布, ηξξξn n =max{,,,}12 .求证ηn Pa −→−.证 由定理1, 只须证明ηn 的分布函数G x D x a n W()()−→−-, 其中D(x-a)是在a 点的退化分布函数.从第二章知道:若ξk 的分布函数为F(x), 则ηn 的分布函数为G x F x n n ()[()]=. 现在ξk 的分布函数为F(x)=⎪⎩⎪⎨⎧,1,/,0a x .,0,0a x a x x ≥<≤<故G x x a n n (),(/),,=⎧⎨⎪⎩⎪01 x x a x a <≤<≥00 → D(x-a)=01,,⎧⎨⎩x ax a <≥(n →∞).证毕.依概率收敛有许多性质类似于微积分中数列极限的性质, 下面仅举两个例子说明这类问题的证题方法. 大部分性质放在习题中留给读者自己证明.例2 设ξ和ξn 是定义在概率空间 (Ω,F, P)上的随机变量序列. 求证:1. 若ξn P −→−ξ,ξn P−→−η, 则P(ξ=η)=1. 2. 若ξn P −→−ξ, f 是 (-∞, ∞) 上的连续函数,则f (ξn )Pf −→−()ξ. 证 1. 任意给定ε>0,我们有(|ξηεξξεξηε-≥⊆-≥-≥|)(||/)(||/)n n 22 ,从而P(|ξηεξξεξηε-≥≤-≥+-≥|)(||/)(||/)P P n n 22.由ξn P −→−ξ,ξn P−→−η, 并注意到上式左方与n 无关, 得P(|ξηε-≥|)=0. 进一步, P(|ξηξηξη->=-≥≤-≥=∞=∞∑|)((||/))(||/)01111P n P n n n =0,即P(ξ=η)=1.2. 任意给定εε,'>0,存在M>0, 使得P(|ξ|≥≤M)P(|ξ|≥<'M /)/24ε.(6)由于ξn P−→−ξ, 故存在N 11≥, 当n ≥N 1时, P (||/)/ξξεn M -≥<'24, 因此2/4/4/)2/|(|)2/|(|)|(|εεεξξξξ'='+'<≥+≥-≤≥M P M P M P n n (7)又因f (x) 在 (-∞,∞)上连续,从而在[-M, M]上一致连续. 对给定的ε>0, 存在δ>0, 当|x-y|<δ时,|f (x)-f (y)|<ε. 这样P(|()()|)(||)(||)(||)f f P P M P M n n n ξξεξξδξξ-≥≤-≥+≥+≥. (8)对上面的δ, 存在N 21≥, 当n ≥N 2时,P (||)/ξξδεn -≥<'4.(9)结合(6) (7) (8) (9)式, 当n ≥max(,)N N 12时,P(|f f n ()()|)///ξξεεεεε-≥<'+'+'='424,从而 f (ξn )Pf −→−()ξ. 为了进一步讨论依概率收敛的条件,我们给出下列切比雪夫不等式(第三章§2)的推广. 定理2 (马尔科夫不等式) 设ξ是定义在概率空间 (Ω, F, P)上的随机变量,f (x)是[0, ∞) 上非负单调不减函数,则对任意x >0,P(|ξ| > x)≤Ef f x (||)()ξ.(10)证 当Ef(|ξ|)=∞时,(10)式显然成立. 设Ef(|ξ|)<∞,ξ的分布函数为F(x). 因f (x) 单调不减,故 |y| >x 时, f(|y f x |)()≥,从而⎰⎰>>≤=>xy xy y dF x f y f y dF x P ||||)()(|)(|)()|(|ξ⎰+∞∞-≤)(|)(|)(1y dF y f x f)(|)(|x f Ef ξ=.定理3 ξn P−→−ξ 当且仅当 E ||||ξξξξn n -+-221→0. 证 充分性:注意到f (x)=x x 221+在[0, ∞]上非负单调不减, 对任意ε>0, 由定理2P(|ξξεεεξξξξn n n E ->≤+-+-|)||||112222→0,即ξnP−→−ξ.必要性:设ξn-ξ的分布函数是F xn(). 对任意ε>0,)(1)(1)(1||1||||22||222222xdFxxxdFxxxdFxxEnxnxnnn⎰⎰⎰≥<∞∞-+++=+=-+-εεξξξξ≤++≥⎰εεε221dF xnx()|\=εεξξε221++-≥Pn(||). (11)由于ξnP−→−ξ, 在(11)式两边先令n→∞, 再让ε→0,即得证E||||ξξξξnn-+-221→0.二、弱大数定律考虑随机试验E中的事件A,假设其发生的概率为p (0 < p <1), 现在独立重复地做试验n次——n重贝努里试验. 令ξi =⎧⎨⎩1,,次试验中不出现在第次试验中出现在第iAiA, 1≤≤i n.则P(ξi=1)=p, P(ξi=0)=1-p. S n iin==∑ξ1是做试验E n次后A发生的次数,可能值0,1,2,…,n, 视试验结果而定. 熟知E Snn=p. 在第一章§1中曾经指出: 当∞→n时频率nSn"稳定到"(在某种意义下收敛于)概率p. 我们想知道Snn与p之间的差究竟有多大.首先应该意识到不可能期望对任意给定的0<ε<1, 当n充分大时, |Snn-p|≤ε对所有试验结果成立. 事实上,当0 < p <1,P(Snn=1)=P(ξ1=1,…,ξn=1)=pn,P(Snn=0)=P(ξ1=0,…,ξn=0)=(1-pn),它们都不为零. 而在第一种情况,取ε<1-p,不论n多大,|Snn-p|=1-p >ε; 在第二种情况,取ε<p, 则有|Snn-p|= p >ε.然而,当n充分大后,事件{Snn=1}和{Snn=0}发生的可能性都很小. 一般来说,自然地希望当n充分大以后,出现{|Snn-p|≥ε}的可能性可以任意地小. 这一事实最早由贝努里发现.定理4 (贝努里大数定律) 设{ξn }是一列独立同分布的随机变量,P(ξn =1)=p, P(ξn =0)=1-p,0 < p <1, 记S n ii n==∑ξ1, 则S nnP p −→−. 继贝努里之后,人们一直试图对一般的随机变量建立类似的结果.定义2 设{ξn }是定义在概率空间 (Ω, F, P)上的随机变量序列,如果存在常数列{a n }和{b n }使得101a b n k n Pk n ξ-−→−=∑, (n →∞),(12)则称{ξn }服从弱大数定律( weak law of large numbers), 简称{ξn }服从大数定律.定理5 (切比雪夫大数定律) 设{ξn }是定义在概率空间 (Ω,F, P)上的独立随机变量序列,E ξn =μn , Var ξn =σn 2. 如果10221n k k n σ=∑→,则{ξn }服从弱大数定律,即11011n n k k n k Pk n ξμ-−→−==∑∑.证 考察随机变量11n k k n ξ=∑, 因E(11n k k n ξ=∑)=11n k k n μ=∑, Var(11n k k nξ=∑)=1221n kk n σ=∑,用第三章§2的切比雪夫不等式,得P(|11n k k k n ()|ξμ-=∑≥ε)≤12εVar(11n k k nξ=∑)=12ε(1221n k k n σ=∑)→0.此即所证.注1 贝努里大数定律是切比雪夫大数定律的特例.注2 如果条件“{ξn }独立”被“{ξn }两两不相关”所代替,定理5依然成立. 更一般地, 由该定理的证明容易看出:如果取消条件“{ξn }独立”,但条件“1221n k k n σ=∑→0”改为“12n Var(ξk k n =∑1)→0”, 则定理5的结论仍然成立, 称为“马尔科夫大数定律”.如果{ξn }不仅独立,而且同分布,则可以改进定理5如下:定理6(辛钦大数定律) 设{ξn }是定义在概率空间 (Ω, F, P)上的独立同分布随机变量序列,E|ξ1|<∞. 记E ξ1=μ,S n kk n==∑ξ1, 则{ξn }服从弱大数定律,即 S n n P−→−μ.证 分别令)(t f 与)(t f n 为ξ1与S n / n 的特征函数. 既然{ξn }相互独立同分布,那么)(t f n =n n t f ))/((. 另外, E 1ξ=μ, 所以由泰勒展开式知)(t f =1+i )(t o t +μ,t →0.(13)对每个t ∈R,)/(n t f =1+i )/1(/n o n t +μ, n →∞,(14))(t f n =(1+i )/1(/n o n t +μ)n i t e →μ, n →∞.由于ei tμ恰好是集中单点μ的退化分布的特征函数,运用第一节的逆极限定理即可知道S n n d /−→−μ. 再根据定理1得S n n P/−→−μ. 定理证毕.例2 设ξk 有分布列k k s s -⎛⎝ ⎫⎭⎪0505.., s<1 /2为常数,且{ξk }相互独立. 试证{ξk }服从弱大数定律. 证 已知ξk 有分布列k k s s -⎛⎝ ⎫⎭⎪0505..,所以E ξk =0, Var ξk =k s 2. 当s<1/ 2时, 121n Var k k n ξ=∑=11022221211n k n n n s sk n s k n <=→=-=∑∑.另外, {ξk }又是相互独立的,所以{ξk }服从切比雪夫大数定律,即11n k k nξ=∑P−→−0. 例3 设{ξk }相互独立, 密度都为 p(x)=20113/,,x x x ⎧⎨⎩≥<,求证{ξk }服从大数定律.证 {ξk }独立同分布, E ξk =xp x dx()-∞∞⎰=2, 所以{ξk }服从辛钦大数定律.例4 设{ξk }独立同分布, E ξk =μ, Var ξk =σ2. 令ξξn k k n n ==∑11, S n n k n k n 2211=-=∑()ξξ.求证: S n P22−→−σ. 证S n nk n k n 2211=-=∑()ξξ=121n k n k n (()())ξμξμ---=∑=---=∑1221n k n k n()()ξμξμ.(15)由辛钦大数定律知 ξμn P −→−,从而()ξμn P -−→−20. 再因{(ξμk -)2)独立同分布,E(ξμk -)2=Var ξk =σ2, 故{(ξμk -)2)也服从辛钦大数定律,即∑μ-ξ=n 1k 2k )(n 12P σ−→−. 由(15)式与依概率收敛的性质(习题18),S n P 22−→−σ.注 在数理统计中,ξn 称为样本均值,nn S n -12称为样本方差. 辛钦大数定律表明样本均值依概率收敛于总体均值. 上述例子则表明样本方差依概率收敛于总体方差.最后,给出随机变量序列的另一种收敛性概念.定义3 设ξ和n ξ, n ≥1, 是定义在同一概率空间(Ω,F, P)上的随机变量序列,E ||ξr<∞, E||ξn r<∞, n ≥1, 0 < r <∞. 如果 E ||ξξn r-→0,(16)则称{ξn } r-阶平均收敛(convergence in the mean of order r)于ξ,记作ξξn Lr−→−. 如果存在0< r <∞, ξξn L r −→−, 令rx x f ||)(=,并对ξξn -应用马尔科夫不等式,可推出ξξn P−→−. 然而下例说明其逆不成立. 例5 定义P(ξn =n) =13log()n +,P(ξn =0) =1-13log()n +, n=1,2,…. 易知,ξn P −→−0, 但对任何 0 < r<∞,E ||log()ξn rrn n =+→∞3, (n →∞).即0−→−rLn ξ不成立.。
频率依概率收敛于概率
频率依概率收敛是指在一个随机试验中,频率(即事件发生的相对次数)会逐渐接近真实概率。
根据概率的定义,对于一个随机事件A,其概率为P(A)。
如
果进行大量次数的实验,事件A发生的频率会逐渐趋近于概
率P(A)。
这意味着,当实验次数足够多时,事件A发生的次
数与总实验次数的比值会接近于概率P(A)。
举个例子,假设有一个标准的六面骰子,每个面的出现概率均等,为1/6。
如果进行大量次数的掷骰子实验,记录每次掷出
的数字,并统计每个数字出现的频率,最终我们会发现每个数字的频率接近于1/6。
这个收敛过程可以形象地表示为一个图表,横轴表示实验次数,纵轴表示事件发生的频率。
当实验次数增加时,频率会逐渐趋近于概率,最终收敛于该概率。
需要注意的是,频率依概率收敛并不意味着在有限次实验中频率一定会等于概率。
实际上,在有限次实验中,频率可能会显著偏离概率。
但是,当实验次数足够多时,频率会逐渐接近概率。
频率依概率收敛的概念在统计学中有着重要的应用,例如在大数定律和中心极限定理等方面。
这些定理说明了当实验次数趋于无穷时,频率的分布会趋近于某个特定的概率分布,例如正态分布。
证明经验分布函数依概率收敛到分布函数是概率论中一个重要的定理,也是推动概率论向前发展的基石。
该定理表明,当样本数量趋于无穷大时,每个样本的频率的期望值收敛到概率分布函数的期望值。
证明这一定理的关键在于,每个样本的频率服从参数为概率分布函数的标准误差函数,即每个样本的频率和概率分布函数的期望值之间的误差服从标准正态分布。
另外,为了证明该定理,我们还需要使用大数定律,根据大数定律,当样本数量趋于
无穷大时,每个样本频率的期望值将收敛到概率分布函数的期望值。
此外,还可以使用置信度定理和中心极限定理来证明该定理。
置信度定理表明,在一
定的置信水平下,样本的频率服从概率分布函数的期望值;而中心极限定理表明,当样本
数量趋于无穷大时,每个样本的频率的期望值收敛到概率分布函数的期望值。
综上所述,通过大数定律,置信度定理和中心极限定理,可以证明经验分布函数依概
率收敛到分布函数。
这一定理不仅在概率论中有重要意义,而且在实际应用中也具有重要
意义,可为各种统计分析提供有效的数据支持。
依均方收敛推出依概率收敛在概率论中,依均方收敛和依概率收敛是两种经常被使用的概念。
依均方收敛指的是当随机变量趋近于某个确定值时,它们的平方差逐渐减小,并且在充分大的样本下,这个平方差几乎都趋近于零。
而依概率收敛指的是当样本充分大时,随机变量以一定的概率趋近于某个确定值。
这两者之间的关系十分密切,本文将围绕依均方收敛推出依概率收敛展开讨论。
第一步:确定均方收敛的条件首先,我们需要知道的是依均方收敛的条件。
依据定义,对于随机变量{X_n}和它的极限X而言,若在平均意义下,随着n的增加,X_n与X的平方差趋近于零,则X_n以均方收敛于X。
即:lim E{(|X_n - X|)^2} = 0 (n->+∞)第二步:推出依概率收敛的定义接下来,我们需要将依均方收敛的条件转化为依概率收敛的条件。
从均方收敛的定义可知,对于任意的正数ε,都必定有:P{|X_n - X|^2 >ε} → 0 (n->+∞)即当样本充分大时,随机变量的平方差逐渐趋近于零,即逐渐以一定的概率收敛于某个确定值。
第三步:证明那么,如何证明均方收敛蕴含着概率收敛呢?我们不妨从概率的角度来看待这个问题。
设C={w|lim X_n(w)=X(w)},即C为X_n收敛于X的样本空间。
则可得出:P(|X_n - X|^2 >ε) = E(I_{|X_n - X|^2 > ε}) ≤ ε/E(|X_{n} - X|^2)其中I是指示函数,当|X_n - X|^2 >ε时,I_{|X_n - X|^2 > ε}=1,否则I_{|X_n - X|^2 > ε}=0。
根据Cauchy-Schwarz不等式,有:E(|X_n - X|^2)=E(|X_n - X|^2I_{C})+E(|X_n - X|^2I_{C^c})因为X_n以均方收敛于X,则有:E(|X_n - X|^2) → 0 (n->+∞)又因为对于所有的n,|X_n - X|^2I_{C^c} ≤ |X_n - X|^2所以可以得出以下不等式:E(|X_n - X|^2I_{C})≤E(|X_n - X|^2) → 0(n->+∞)同时有|X_{n} - X|^2I_{C^c} → 0(n->+∞)因此可以得出:P(|X_n - X|^2 >ε) ≤ E(|X_{n} - X|^2)/ε →0 (n->+∞)即对于任意给定的ε>0,都可以找到一个非常大的n,使得当n足够大时,P(|X_n - X|^2 >ε) 接近于0,即X_n以依概率收敛于X。
依概率收敛但不几乎处处收敛的例子概率收敛和几乎处处收敛是概率论中两个不同的概念。
前者是指一个随机序列在概率意义下趋向于某个随机变量,而后者是指该序列几乎所有值都趋向于该随机变量。
举个例子,我们考虑以下随机序列:$X_n$等于$n$,当$n$为奇数时,$X_n$等于1,当$n$为偶数时。
这个序列显然不是在几乎所有情况下收敛,因为当$n$为奇数时,$X_n$不会趋向于1,而是永远等于$n$。
然而,我们可以证明它在概率意义下收敛于1。
具体来说,我们需要证明对于任意的$\epsilon>0$,当$n$趋向于无穷大时,$\operatorname{Pr}( |X_n-1| \geq \epsilon )\rightarrow 0$。
显然,当$\epsilon\geq1$时,概率为0。
当$0<\epsilon<1$时,我们有:$$\begin{aligned}\operatorname{Pr}( |X_n-1| \geq \epsilon ) &=\operatorname{Pr}( X_n\geq1+\epsilon\text{ 或 } X_n\leq1-\epsilon ) \\&=\operatorname{Pr}( X_n \text{为奇数} )\\&= \frac{1}{2}.\end{aligned}$$因此,对于任意的$\epsilon>0$,$\operatorname{Pr}( |X_n-1| \geq \epsilon )$始终等于1/2,不趋向于0。
这说明$X_n$在概率意义下收敛于1,但不几乎处处收敛。
这个例子告诉我们,在研究随机序列的收敛性时,我们需要仔细区分概率收敛和几乎处处收敛的概念,并根据具体问题选择合适的概念。
此外,还需要根据定义进行具体的计算,以验证一个序列是否收敛于某个随机变量,并给出该随机变量的性质。
无偏估计和依概率收敛是统计学中的两个重要概念。
无偏估计是指估计量(或统计量)的均值(期望值)等于真实参数值。
无偏估计的意义在于,当一个统计量的均值与真实参数值相等时,我们就可以说这个统计量是一个无偏估计。
这意味着该统计量在多次重复试验中,其均值能够准确地估计出真实参数值。
依概率收敛是指当样本数量趋于无穷时,样本统计量以概率1收敛于真实参数值。
换句话说,随着样本数量的增加,样本统计量越来越接近真实参数值。
这种收敛可以看作是一种概率性质,即当样本数量足够大时,样本统计量几乎必然收敛于真实参数值。
需要注意的是,无偏估计不一定依概率收敛。
无偏估计强调的是估计量与真实参数值的均值相等,而依概率收敛强调的是随着样本数量的增加,
样本统计量接近真实参数值的概率越来越大。
因此,无偏估计和依概率收敛是两个不同的概念,它们之间没有必然的联系。
在实际应用中,我们通常会使用无偏估计来估计真实参数值,因为无偏估计具有更好的统计性质。
但是,在某些情况下,依概率收敛可能更加重要,因为它可以帮助我们确定样本数量的大小,以便使样本统计量能够足够接近真实参数值。
依分布收敛与依概率收敛
依分布收敛与依概率收敛是概率论和统计学中的两个重要概念,常
用于描述随机变量序列的收敛性质。
下面分别介绍这两种收敛的定义
和特点。
依分布收敛:
所谓依分布收敛,是指随机变量序列逐渐趋向于某个分布的过程。
具
体而言,对于一组随机变量序列{Xi}和分布函数F(x),如果对于任意
的x,当n趋向于无穷大时,有Fn(x)都趋向于F(x),则称{Xi}依分布
收敛于分布函数F(x),记作Xi~F(x)。
依分布收敛的特点是:
1. 收敛的结果是一个分布函数,可以通过累加分布函数来计算概率值。
2. 收敛的充分条件是连续的性质,具有普遍性。
3. 各种随机变量均可以进行依分布收敛。
依概率收敛:
依概率收敛是指随机变量序列以大概率趋近于某一常数的过程。
具体
而言,对于一组随机变量序列{Xi}和常数a,如果对于任意的小于等于ε(ε>0),有lim P(|Xi-a|>ε)=0,则称{Xi}依概率收敛于a,记作Xi→a (p)。
依概率收敛的特点是:
1. 收敛的结果是一个确定值,其概率趋向于1。
2. 收敛的充分条件是可测性的性质,具有更弱的条件限制。
3. 仅限于实数的随机变量序列(也可以进行有限维的推广)。
以上是依分布收敛与依概率收敛的定义和特点,两者之间存在差异,但都是表示随机变量序列逐渐趋向于某一结果的重要方法。
在实际应用中,需要根据具体问题和需求选择适合的方法进行处理。
随即变量序列两种收敛方式教程一:背景与定义 1、背景2、依概率收敛定义,随机变量序列 ,,,1n X X ,如果对于任何0>ε,()0||−−→−≥-∞→n nX XP ε,记X X n −→−Pr,等价于:对于任何0>ε,()0||−−→−>-∞→n n X X P ε,称随机变量序列 ,,,1n X X 依概率收敛于X 。
3、性质(1)b a Y X b Y a X Pn n P n P n +−→−+⇒−→−−→−,:证明{}{}⎭⎬⎫⎩⎨⎧≥-⎭⎬⎫⎩⎨⎧≥-⊂≥-+-⊂≥+-+2||2|)(||||)(||)()(|εεεεb Y a X b Y a X b a Y X n n n n n n()02||2|)(|2||2|)(||)()(|−−→−⎪⎪⎭⎫ ⎝⎛⎭⎬⎫⎩⎨⎧≥-+⎪⎪⎭⎫⎝⎛⎭⎬⎫⎩⎨⎧≥-≤⎪⎪⎭⎫⎝⎛⎭⎬⎫⎩⎨⎧≥-⎭⎬⎫⎩⎨⎧≥-≤≥+-+∞→n n nn n n n b Y P a XP b Y a X P b a Y X P εεεεε因此()0|)()(|−−→−≥+-+∞→n n nb a Y X P εba Y X Pn n +−→−+,同样可以证明(2)b a Y X b Y a X Pn n P n P n -−→−-⇒−→−−→−, (3)ab Y X b Y a X P n n P n P n −→−⇒−→−−→−, (4)b a Y X b b Y a X P n n P n P n //0,,−→−⇒≠−→−−→−4、,a X P n −→−函数()x g 在a 连续,则()()a g X g P n −→−. 证明:()x g 在a 连续,故,对于任何0>ε,存在0>δ,当δ≤-a x 时,一定有ε≤-)()(a g x g ,()()()()()()εδεδ≤-≤≤-⇒≤-⇒≤-a g X g P a X P a g X g a X n n n n ,现在,a X Pn −→−因此,对于任何0>δ ()1−−→−≤-∞→n n a X P δ,因此,∞→n 时()()()()11−−→−≤-≥≤-≥∞→n n n a X P a g X g P δε,()()()1−−→−≤-∞→n n a g X g P ε,()()()0−−→−>-∞→n n a g X g P ε,()()a g Xg Pn−→−二、切贝谢夫大数律n X X ,,1独立同分布,2)(,d X Var a EX i i ==,则anXX Pn−→−++ 1证明:特殊情况:贝努里大数律n X X ,,1独立同分布,()()p X P p X P i i ==-==1,10,则01−−→−⎪⎪⎭⎫ ⎝⎛>-++∞→n n p n X X P ε三、依分布收敛 1:背景和定义对于随机变量序列{},...2,1,=i X i 和某个随机变量X ,假定X 的cdf 为()x F ,若,对于()x F 得任何连续点x ,都成立()()x X P x X P ni ≤−−→−≤∞→,即 ()()x F x F n i −−→−∞→,则称随机变量序列{},...2,1,=i X i 依分布收敛到随机变量X。