第四章马尔可夫链
- 格式:ppt
- 大小:465.50 KB
- 文档页数:62
马尔可夫过程一类随机过程。
它的原始模型马尔可夫链,由俄国数学家A.A.马尔可夫于1907年提出。
该过程具有如下特性:在已知目前状态(现在)的条件下,它未来的演变(将来)不依赖于它以往的演变 ( 过去 ) 。
例如森林中动物头数的变化构成——马尔可夫过程。
在现实世界中,有很多过程都是马尔可夫过程,如液体中微粒所作的布朗运动、传染病受感染的人数、车站的候车人数等,都可视为马尔可夫过程。
关于该过程的研究,1931年 A.H.柯尔莫哥洛夫在《概率论的解析方法》一文中首先将微分方程等分析的方法用于这类过程,奠定了马尔可夫过程的理论基础。
目录马尔可夫过程离散时间马尔可夫链连续时间马尔可夫链生灭过程一般马尔可夫过程强马尔可夫过程扩散过程编辑本段马尔可夫过程Markov process1951年前后,伊藤清建立的随机微分方程的理论,为马尔可夫过程的研究开辟了新的道路。
1954年前后,W.费勒将半群方法引入马尔可夫过程的研究。
流形上的马尔可夫过程、马尔可夫向量场等都是正待深入研究的领域。
类重要的随机过程,它的原始模型马尔可夫链,由俄国数学家Α.Α.马尔可夫于1907年提出。
人们在实际中常遇到具有下述特性的随机过程:在已知它目前的状态(现在)的条件下,它未来的演变(将来)不依赖于它以往的演变(过去)。
这种已知“现在”的条件下,“将来”与“过去”独立的特性称为马尔可夫性,具有这种性质的随机过程叫做马尔可夫过程。
荷花池中一只青蛙的跳跃是马尔可夫过程的一个形象化的例子。
青蛙依照它瞬间或起的念头从一片荷叶上跳到另一片荷叶上,因为青蛙是没有记忆的,当现在所处的位置已知时,它下一步跳往何处和它以往走过的路径无关。
如果将荷叶编号并用X0,X1,X2,…分别表示青蛙最初处的荷叶号码及第一次、第二次、……跳跃后所处的荷叶号码,那么{Xn,n≥0} 就是马尔可夫过程。
液体中微粒所作的布朗运动,传染病受感染的人数,原子核中一自由电子在电子层中的跳跃,人口增长过程等等都可视为马尔可夫过程。
第四章 马尔可夫链随机过程在不同时刻下的状态之间一般具有某种关系,马尔可夫(Markov )过程就是描述一类状态之间具有某种特殊统计联系的随机过程.Markov 过程在近代物理学、生物学、管理科学、信息处理与数字计算方法等领域都有重要的应用.按其状态和时间参数是连续的或离散的,它可分为三类:(1)时间、状态都是离散的Markov 过程,称为Markov 链;(2)时间连续、状态离散的Markov 过程,称为连续时间的Markov 链;(3)时间、状态都连续的Markov 过程.本章主要讨论Markov 链,有关连续时间的Markov 链的相关理论将在下章讨论.4.1 马尔可夫链的概念和例子独立随机试验模型最直接的推广就是Markov 链模型,早在1906年俄国数学家Markov 对它进行研究而得名,以后Kolmogorov 、Feller 、Doob 等数学家发展了这一理论.4.1 .1 Markov 链的定义假设Markov 过程{,}n X n T ∈的参数集T 是离散时间集合,即{0,1,2,}T =,相应n X 可能取值的全体组成的状态空间是离散状态集012{,,,}I i i i =.定义 4.1 设有一随机过程{,}n X n T ∈,若对于任意整数n T ∈和任意011,,,n i i i I +∈,条件概率满足11001111{|,,,}{|}n n n n n n n n P X i X i X i X i P X i X i ++++=======则称{,}n X n T ∈为离散时间的Markov 链,简称Markov 链(Markov chains )或马氏链.从定义可以看出:Markov 链具有Markov 性(即无后效性),如果把时刻n 看作现在,那么,1n +是将来的时刻,而0,1,2,,1n -是过去的时刻.Markov 性表示在确切知道系统现在状态的条件下,系统将来的状况与过去的状况无关,而且Markov 链的统计特征完全由条件概率11{|}n n n n P X i X i ++==所决定. 因此,如何确定这个条件概率,是研究Markov 链理论和应用中十分重要的问题之一. 4.1.2 转移概率定义 4.2 称条件概率1(){|}ij n n p n P X j X i +=== (4.1)为Markov 链{,}n X n T ∈在时刻n 的一步转移概率,其中,i j I ∈,简称转移概率(transition probability ).一般地,转移概率()ij p n 不仅仅与状态,i j 有关,而且与时刻n 有关,如果()ij p n 不依赖时刻n 时,则称Markov 链具有平稳转移概率.定义 4.3 若对任意,i j I ∈,Markov 链{,}n X n T ∈的转移概率()ij p n 与n 无关,则称Markov 链是齐次的(或称时齐的)(time homogeneous -),并记()ij p n 为ij p . 下面只讨论齐次Markov 链,并且通常将“齐次”两字省去.定义 4.4 设P 表示一步转移概率ij p 所组成的矩阵,且状态空间{1,2,}I =,则1112121222...........................n n p p p P p p p ⎛⎫ ⎪= ⎪ ⎪⎝⎭称为系统状态的一步转移概率矩阵(transition probability matrix ),它具有性质: (1)0,,ij p i j I ≥∈; (2)1,ijj Ipi I ∈=∈∑.(2)式说明一步转移概率矩阵中任一行元素之和为1,通常称满足性质(1)(2)的矩阵为随机矩阵.定义 4.5 称条件概率(){|},n ij m n m p P X j X i +=== ,,0,1i j I m n ∈≥≥ (4.2)为Markov 链{,}n X n T ∈的n 步转移概率,并称()()()n n ij P p =为Markov 链{,}n X n T ∈的n 步转移矩阵.其中()()0,1n n ij ij j Ip p ∈≥=∑,即()n P 也是一个随机矩阵.特别地,当1n =时,(1)ij ij p p =,此时,一步转移矩阵(1)P P =.我们还规定(0)0,1,iji jpi j ≠⎧=⎨=⎩Markov 链n 步转移概率满足重要的Chapman Kolmogorov -方程(简称C K -方程)。
1第四章 马尔可夫过程内容提要1. 马尔可夫过程的概念 (1)马尔可夫过程给定随机过程{}(),X t t T ∈,如果对122,∀≥∀<<<∈n n t t t T ,有11221111{()|(),(),,()}{()|()}n n n n n n n n P X t x X t x X t x X t x P X t x X t x ----<====<=则称{}(),X t t T ∈为马尔可夫过程。
称(){}:,==∈E x X t x t T 为状态空间。
参数集和状态空间都是离散的马尔可夫过程称为离散参数马氏链. 参数连续、状态空间离散的马尔可夫过程称为连续参数马氏链. (2)k 步转移概率设{}(),0,1,2,=X n n 为离散参数马氏链,称()(),(,){|},0,1=+==≥≥i j p n k P X n k j X n i n k为{}(),0,1,2,=X n n 在时刻n 的k 步转移概率,称(),(,)((,)),P =∈i j n k p n k i j E为{}(),0,1,2,=X n n 在时刻n 的k 步转移概率矩阵. 特别地,当1k =时,在时刻n 的一步转移概率和一步转移概率矩阵分别简记为()ij p n 和()n P . (3)初始分布、绝对分布称((0)),,==∈i p P X i i E 为离散参数马氏链{}(),0,1,2,=X n n 的初始分布,记为0P ,称()(){},,==∈j p n P X n j j E 为马尔可夫链{}0n X n ≥的绝对分布,记为P n . (4)离散参数齐次马氏链设{}(),0,1,2,=X n n 是一离散参数马氏链,如果其一步转移概率()ij p n 恒与起始时刻n 无关,记为ij p ,则称{}(),0,1,2,=X n n 为离散参数齐次马氏链。
若{}(),0,1,2,=X n n2是离散参数齐次马氏链,则其k 步转移概率记为(),i j p k ,一步转移概率矩阵和k 转移概率矩阵分别记为P 和().P k(5) 离散参数齐次马氏链的遍历性离散参数齐次马氏链{X (n ) ,n=0,1,2… },若对一切状态i ,j ,存在与i 无关的极限()()lim 0,ij j n p n i j E →+∞=π>∈则称此马氏链具有遍历性.0,1j j j Ej E ππ∈>∈=∑若且则称{},j j E π∈为离散参数齐次马氏链{X (n ) ,n=0,1,2… }的极限分布,或称为最终分布,记为{},j j E ∏=∈π(6)离散参数齐次马氏链的平稳分布离散参数齐次马氏链{X (n ) ,n=0,1,2… },若存在{v j , j ∈E } 满足条件:1)0,2)13)j jj Ej i iji Ev j E vv v p ∈∈≥∈==∑∑则称此马氏链是平稳的,称 { v j , j ∈E } 为此马氏链的平稳分布。
第四章习题解答4.1Y1,Y2,···是来自总体Y的随机变量,与X0独立,h(x,y)是实函数.对于n 1,取X n=h(X n−1,Y n).设{X n}的状态空间为I,验证{X n}是马氏链,给出转移概率p ij.解:由题知,Y k与X1,···,X k−1独立,k 1,∀n,i,j,i1,...,i n−1∈I有,P(X n+1=j|X n=i,X n−1=i n−1, (X0)i0)=P(h(i,Y n+1)=j|X n=i,X n−1=i n−1,···,X0=i0)=P(h(i,Y n+1)=j|X n=i)=P(h(i,Y)=j)=P(h(i,Y1)=j|X0=i)=P(X1=j|X0=i).∴X n是马氏链,P ij=P(h(i,Y)=j).4.2设{X i,i 0}是取非负整数值的独立同分布的随机变量序列,V ar(X0)>0.验证以下随机序列是马氏链:(a){X n,n 0};(b){S n,n 0},其中S n=∑ni=0X i;(c){ξn,n 0},其中ξn=∑ni=0(1+X i).解:∀n,i,j,i0,···,i n−1∈N+,(a).P(X n+1=j|X n=i,X n−1=i n−1,···,X0=i0)=P(X n+1=j)= P(X n+1=j|X n=i)=P(X1=j)=P(X1=j|X0=i).1第四章离散时间马尔可夫链第四章离散时间马尔可夫链(b).P(S n+1=j|S n=i,S n−1=i n−1,···,X0=i0)=P(X n+1=j−i|X n=i−i n−1,···,X0=i0)=P(X n+1=j−i)=P(X n+1=j−i,S n=i|S n=i)=P(S n+1=j|S n=i)=P(X1=j−i)=P(X1=j−i|X0=i)=P(S1=j|S0=i).(c).P(ξn+1=j|ξn=i,ξn−1=i n−1,···,ξ0=i0)=P(X n+1=ji −1)=P(X n+1=ji−1|ξn=i)=P(ξn+1=j|ξn=i)=P(X1=ji −1)=P(X1=ji−1|X0=i)=P(ξ1=j|ξ0=i).4.3马氏链的状态空间是I=(1,2,3,4,5),转移概率矩阵P=0.20.80000.50.5000000.50.500.20.3000.500001界定马氏链的状态。
马尔可夫链的基本原理和使用方法马尔可夫链是一种随机过程,它的基本原理是当前状态的转移概率只依赖于前一个状态,和之前的状态无关。
这种特性使得马尔可夫链在许多领域都有着广泛的应用,比如金融、生态学、自然语言处理等。
在本文中,我们将探讨马尔可夫链的基本原理和使用方法。
1. 马尔可夫链的基本原理马尔可夫链的基本原理可以用数学公式来表达。
设有一个有限的状态空间S={1,2,...,n},则一个离散时间的马尔可夫链是一个序列X={X0, X1, X2, ...},其中Xi表示在第i个时刻系统所处的状态,且满足以下马尔可夫性质:P(Xi+1 = j | Xi = i0, Xi-1 = i1, ..., X0 = i0) = P(Xi+1 = j | Xi = i0)其中P(Xi+1 = j | Xi = i0)表示在当前状态为i0的情况下,下一个状态为j的概率。
这个条件概率只依赖于当前状态,和之前的状态无关,这就是马尔可夫性质。
2. 马尔可夫链的使用方法马尔可夫链在实际应用中有着广泛的用途,其中最常见的就是用来建模随机过程。
在金融领域,马尔可夫链被用来建立股票价格的模型,帮助投资者预测未来的股价走势。
在生态学中,马尔可夫链被用来研究物种的迁移和数量变化,从而帮助保护生物多样性。
在自然语言处理领域,马尔可夫链被用来建立文本生成模型,从而帮助计算机理解和生成自然语言。
除了建模随机过程外,马尔可夫链还被广泛用于解决一些特定的问题,比如:a. 随机游走随机游走是一种通过随机转移来描述某个随机过程的方法。
在数学上,随机游走可以用马尔可夫链来建模。
通过分析随机游走的性质,可以帮助我们理解和预测一些具有不确定性的现象,比如股票价格的波动、气候变化等。
b. 马尔可夫决策过程马尔可夫决策过程是一种用来描述决策问题的数学模型。
在马尔可夫决策过程中,决策者需要根据当前状态和可选的行动来选择最优的策略。
通过分析马尔可夫决策过程,可以帮助我们理解和优化一些具有随机性和不确定性的决策问题,比如供应链管理、资源分配等。