2010年5月苏北赛算法:马尔可夫链。适合很多题型
- 格式:doc
- 大小:526.00 KB
- 文档页数:14
用Python入门不明觉厉的马尔可夫链蒙特卡罗_光环大数据python培训在过去几个月里,我在数据科学的世界里反复遇到一个词:马尔可夫链蒙特卡洛(Markov Chain Monte Carlo , MCMC)。
在我的研究室、podcast和文章里,每每遇到这个词我都会“不明觉厉”地点点头,觉得这个算法听起来很酷,但每次听人提起也只是有个模模糊糊的概念。
我屡次尝试学习MCMC和贝叶斯推论,而一拿起书,又很快就放弃了。
无奈之下,我选择了学习任何新东西最佳的方法:应用到一个实际问题中。
通过使用一些我曾试图分析的睡眠数据和一本实操类的、基于应用教学的书(《写给开发者的贝叶斯方法》,我最终通过一个实际项目搞明白了MCMC。
《写给开发者的贝叶斯方法》和学习其他东西一样,当我把这些技术性的概念应用于一个实际问题中而不是单纯地通过看书去了解这些抽象概念,我更容易理解这些知识,并且更享受学习的过程。
这篇文章介绍了马尔可夫链蒙特卡洛在Python中入门级的应用操作,这个实际应用最终也使我学会使用这个强大的建模分析工具。
此项目全部的代码和数据:https:///WillKoehrsen/ai-projects/blob/master/bayesian/ bayesian_inference.ipynb这篇文章侧重于应用和结果,因此很多知识点只会粗浅的介绍,但对于那些想了解更多知识的读者,在文章也尝试提供了一些学习链接。
案例简介我的智能手环在我入睡和起床时会根据心率和运动进行记录。
它不是100%准确的,但现实世界中的数据永远不可能是完美的,不过我们依然可以运用正确的模型从这些噪声数据提取出有价值的信息。
典型睡眠数据这个项目的目的在于运用睡眠数据建立一个能够确立睡眠相对于时间的后验分布模型。
由于时间是个连续变量,我们无法知道后验分布的具体表达式,因此我们转向能够近似后验分布的算法,比如马尔可夫链蒙特卡洛(MCMC)。
选择一个概率分布在我们开始MCMC之前,我们需要为睡眠的后验分布模型选择一个合适的函数。
马尔可夫链模型(重定向自马尔可夫链)马尔可夫链模型(Markov Chain Model)[编辑]马尔可夫链模型概述马尔可夫链因安德烈·马尔可夫(Andrey Markov,1856-1922)得名,是数学中具有马尔可夫性质的离散时间随机过程。
该过程中,在给定当前知识或信息的情况下,过去(即当期以前的历史状态)对于预测将来(即当期以后的未来状态)是无关的。
时间和状态都是离散的马尔可夫过程称为马尔可夫链, 简记为。
马尔可夫链是随机变量的一个数列。
这些变量的范围,即他们所有可能取值的集合,被称为“状态空间”,而Xn的值则是在时间n的状态。
如果Xn + 1对于过去状态的条件概率分布仅是Xn的一个函数,则这里x为过程中的某个状态。
上面这个恒等式可以被看作是马尔可夫性质。
马尔可夫在1906年首先做出了这类过程。
而将此一般化到可数无限状态空间是由柯尔莫果洛夫在1936年给出的。
马尔可夫链与布朗运动以及遍历假说这两个二十世纪初期物理学重要课题是相联系的,但马尔可夫寻求的似乎不仅于数学动机,名义上是对于纵属事件大数法则的扩张。
马尔可夫链是满足下面两个假设的一种随机过程:1、t+l时刻系统状态的概率分布只与t时刻的状态有关,与t时刻以前的状态无关;2、从t时刻到t+l时刻的状态转移与t的值无关。
一个马尔可夫链模型可表示为=(S,P,Q),其中各元的含义如下:1)S是系统所有可能的状态所组成的非空的状态集,有时也称之为系统的状态空间,它可以是有限的、可列的集合或任意非空集。
本文中假定S是可数集(即有限或可列)。
用小写字母i,j(或S i,S j)等来表示状态。
2)是系统的状态转移概率矩阵,其中Pij表示系统在时刻t处于状态i,在下一时刻t+l处于状态i的概率,N是系统所有可能的状态的个数。
对于任意i∈s,有。
3)是系统的初始概率分布,qi是系统在初始时刻处于状态i的概率,满足。
[编辑]马尔可夫链模型的性质马尔可夫链是由一个条件分布来表示的P(Xn + 1 | X n)这被称为是随机过程中的“转移概率”。
南京邮电大学学位论文原创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。
尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。
与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。
本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。
研究生签名:_____________日期:____________南京邮电大学学位论文使用授权声明本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子文档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索;可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。
本文电子文档的内容和纸质论文的内容相一致。
论文的公布(包括刊登)授权南京邮电大学研究生院(筹)办理。
涉密学位论文在解密后适用本授权书。
研究生签名:____________导师签名:____________日期:_____________南京邮电大学硕士学位论文摘要学科、专业:理学、应用数学研究方向:应用概率与随机信息系统作者:2009级研究生温海彬指导教师:王友国教授题目:马尔可夫链预测模型及一些应用英文题目:The application on some predic t ion with Markov chain model主题词:转移概率;优化;马尔可夫链;加权马尔可夫链;灰色马尔可夫链Keywords:transition probability;optimization;Markov chain;weighted Markov chain;gray Markov chain摘要马尔可夫链是一种时间离散、状态离散、带有记忆情况的随机过程,是预测问中常用的一种数学模型。
本文基于马尔可夫链分别对安徽17个地级市人均GDP、东方6+1彩票和全国电信业务总量进行预测。
马尔可夫链的概念及转移概率第四章4.1 马尔可夫链的的概念及转移概率一、知识回顾二、马尔可夫链的的定义三、转移概率四、马尔可夫链的一些简单例子五、总结一、知识回顾1. 条件概率定义:设A,B为两个事件,且,称为事件A发生条件下B事件发生的条件概率。
将条件概率公式移项即得到所谓的乘法公式:2.全概率公式设试验E的样本空间为S,A为E的事件,若为S的一个完备事件组,既满足条件:1)两两互不相容,即2).,且有,则此式称为全概率公式。
3.矩阵乘法矩阵乘法的定义,如果那么矩阵C叫做矩阵A和B的乘积,记作4.马尔可夫过程的分类马尔可夫过程按其状态和时间参数是连续的或离散的,可分为三类:(1)时间、状态都是离散的马尔科夫过程,称为马尔可夫链;(2)时间连续、状态离散的马尔科夫过程称为连续时间的马尔可夫链的;(3)时间、状态都连续的马尔科夫过程。
二、马尔科夫链的定义定义4.1设有随机过程,若对于任意的整数和任意的,条件概率都满足(4.1.1) 则称为马尔科夫链,简称马氏链。
式(4.1.1)即为马氏链,他表明在状态已知的条件下,的条件概率与无关,而仅与所处的状态有关。
式(4.1.1)是马尔科夫链的马氏性(或无后效性)的数学表达式。
由定义知===可见,马尔科夫链的统计特性完全由条件概率所决定。
如何确定这个条件概率,是马尔科夫链理论和应用中的重要问题之一。
现举一例说明上述概念:例4.1.1 箱中装有c个白球和d个黑球,每次从箱子中任取一球,抽出的球要到从箱子中再抽出一球后才放回箱中,每抽出一球作为一次取样试验。
现引进随机变量序列为,每次取样试验的所有可能结果只有两个,即白球或黑球。
若以数代表白球,以数代表黑球则有由上所述的抽球规则可知,任意第n次抽到黑球或白球的概率只与第n-1次抽得球的结果有关,而与抽的球的结果无关,由此可知上述随机变量序列,为马氏链。
三、转移概率定义4.2称条件概率为马尔科夫链在时刻N的一步转移概率,其中,简称为转移概率。
用来干什么什么时候用二二、步骤,前因后果,算法的步骤,公式-三、程序四、举例五、前面国赛用到此算法的备注一下马氏链模型用来干什么马尔可夫预测法是应用概率论中马尔可夫链(Markov chain )的理论和方法来研究分析时间序列的变化规律,并由此预测其未来变化趋势的一种预测技术。
什么时候用应用马尔可夫链的计算方法进行马尔可夫分析,主要目的是根据某些变量现在的情况及其变动趋向,来预测它在未来某特定区间可能产生的变动,作为提供某种决策的依据。
马尔可夫链的基本原理我们知道,要描述某种特定时期的随机现象如某种药品在未来某时期的销售情况,比如说第n季度是畅销还是滞销,用一个随机变量X便可以了,但要描述未来所有时期的情况,则需要一系列的随机变量X i, X2,…,X n,….称{X,t € T,T是参数集}为随机过程,{ X t }的取值集合称为状态空间•若随机过程{ X n }的参数为非负整数,X为离散随机变量,且{ X n }具有无后效性(或称马尔可夫性),则称这一随机过程为马尔可夫链(简称马氏链)•所谓无后效性,直观地说,就是如果把{ X n }的参数n 看作时间的话,那么它在将来取什么值只与它现在的取值有关,而与过去取什么值无关.对具有N个状态的马氏链,描述它的概率性质,最重要的是它在n时刻处于状态i 下一时刻转移到状态j的一步转移概率:若假定上式与n无关,即卩门(0)卩门(1)P ij(n),则可记为p ij (此时,称过程是平稳的),并记P11口2p 1 Np 21p 22p 2N(1)Pp N 1p N 2p N N称为转移概率矩阵.转移概率矩阵具有下述性质:(1) P i j 0, i, j 1, 2, , N .即每个元素非负.N(2) P ij 1, i 1,2,, N •即矩阵每行的元素和等于1.j i如果我们考虑状态多次转移的情况,则有过程在 n 时刻处于状态i , n+k 时刻转移同样由平稳性,上式概率与n 无关,可写成pf .记(k) Jk)(k)P 11 p 12p 1 NJk)Jk)(k) P (k )p 21p 22p 2N(k) (k) (k)P N1 P N 2 P N N称为k 步转移概率矩阵.其中p (k )具有性质:一般地有,若P 为一步转移矩阵,则k 步转移矩阵(2)状态转移概率的估算在马尔可夫预测方法中,系统状态的转移概率的估算非常重要.估算的方法通常 有两种:一是主观概率法,它是根据人们长期积累的经验以及对预测事件的了解,对 事件发生的可能性大小的一种主观估计,这种方法一般是在缺乏历史统计资料或资料 不全的情况下使用.二是统计估算法,现通过实例介绍如下.(k) Jk)(k)P 11 p 12p 1 NJk)Jk)(k)p (k)p 21p 22p 2Np (k) p (k) p (k)p N1p N 2P N N(3)例3记录了某抗病毒药的6年24个季度的销售情况,得到表1 .试求其销售状态的转移概率矩阵.表1某抗病毒药24个季度的销售情况季度销售状态季度销售状态季度销售状态季度销售状态1 1 (畅销)7 1(畅销)13 1(畅销)19 2(滞销)2 1(畅销)8 1(畅销)14 1(畅销)20 1(畅销)3 2(滞销)9 1(畅销)15 2(滞销)21 2(滞销)4 1(畅销)10 2(滞销)16 2(滞销)22 1(畅销)5 2(滞销)11 1(畅销)17 1(畅销)23 1(畅销)6 2(滞销)12 2(滞销)18 1(畅销)24 1(畅销)分析表中的数据,其中有15个季度畅销,9个季度滞销,连续出现畅销和由畅销转入滞销以及由滞销转入畅销的次数均为7,连续滞销的次数为2.由此,可得到下面的市场状态转移情况表(表2).表2市场状态转移情况表现计算转移概率.以频率代替概率,可得连续畅销的概率:分母中的数为15减1是因为第24季度是畅销,无后续记录,需减1.同样得由畅销转入滞销的概率:滞销转入畅销的概率:连续滞销的概率:综上,得销售状态转移概率矩阵为:从上面的计算过程知,所求转移概率矩阵P的元素其实可以直接通过表2中的数字计算而得到,即将表中数分别除以该数所在行的数字和便可:Matlab 程序:format ratclca=[ 1 1 2 1 2 2 1 1 1 2 1 2,1 1 2 2 1 1 2 1 2 1 1 1];for i=1:2for j=1:2f(i,j)=le ngth(fi ndstr([i j],a));endendfni=(sum(f))'for i=1:2p(i,:)=f(i,:)/ni(i);endP由此,推广到一般情况,我们得到估计转移概率的方法:假定系统有m种状态S , S2,…,S rn,根据系统的状态转移的历史记录,得到表3的统计表格,以?ij表示系统从状态i转移到状态j的转移概率估计值,则由表3的数据计算估计值的公式如下:在马氏链模型中,随着时间的推移,系统的状态可能发生转移,这种转移常常会引起某种经济指标的变化•如抗病毒药的销售状态有畅销和滞销两种,在时间变化过程中,有时呈连续畅销或连续滞销,有时由畅销转为滞销或由滞销转为畅销,每次转移不是盈利就是亏本.假定连续畅销时盈「11元,连续滞销时亏本「22元,由畅销转为滞销盈利r i2元,由滞销转为畅销盈利 5元,这种随着系统的状态转移,赋予一定利润的 马氏链,称为有利润的马氏链•对于一般的具有转移矩阵例如,若抗病毒药畅销和滞销时的一步转移的期望利润分别为: 二步利润随机变量为:概率概率的马氏链,当系统由i 转移到j 时,赋予利润r j(i ,j=1, 2,…,N),则称「N1「12「1N(5)的转移矩阵,得到一步利润随机变量(1) x 1、: r 12 X^的概率分布分别为:r 21 r 22r 11概率P 11P 12概率P 21P22i =1,我们想知道,经过n 个季度以后,期望获得的利润是多少?为此,弓I 入一些计算公式.首先,定义v (n)为抗病毒药现在处于i (i 1, 2),经过n 步转移之后的总期望利润,步转移的期望利润为:其中E(X i ⑴)是随机变量X (1)的数学期望.步转移的期望利润为:其中随机变量x (2)(称为二步利润随机变量)的分布为:V 0称为亏本, 从而可得到一系列利润, 其概率关系由马氏链的转移概率决定. 其中 P 11+ P 12 = 1, P 21+ P 22 = 1 .如果药品处于畅销阶段,即销售状态为为系统的利润矩阵,r j >0称为盈利,r j 随着时间的变化,系统的状态不断地转移, 因而一系列的利润是随机变量, r ij = 0称为不亏不盈.由于状态的转移是随机的, 例如从抗病毒药的销售状态 则抗病毒药销售的一步利润随机变量:0.5 0.5 P 0.4 0.69 37抗病毒药畅销和滞销时的二步转移的期望利润分别为:一般地定义k步转移利润随机变量x(k) (i 1,2, N)的分布为:则系统处于状态i经过k步转移后所得的期望利润v(k)的递推计算式为:N N N(k 1) (1) (k 1)r ij P ij v j p ij V i v j p ij ( 6)j 1 j 1 j 1当k=1时,规定边界条件v(0)0 •称一步转移的期望利润为即时的期望利润,并记v(1) q i, i 1,2, N •可能的应用题型题型一、市场占有率预测例题1在购买该药的总共1000家对象(购买力相当的医院、药店等)中,买A B C三药厂的各有400家、300家、300家,预测A、B、C三个厂家生产的某种抗病毒药在未来的市场占有情况。
马尔可夫链专题马尔可夫链:)(),,,,(11211n n n n n x x P x x x x x P +-+=等式的意义:对于一个马尔可夫链来说,第n +1次的状态的结果,只跟上一次(也即第n 次)有关,与其他次无关。
马尔可夫链性质:无记忆性破题技巧:1.找到当下状态的“前一次”的所有可能情况;2.结合对应概率写出“前一次”所有可能中蕴含的数列递推关系;3.利用数列递推技巧求答案,例1.跳格游戏:如图,人从格外只能进入第1格,在格中每次可向前跳1格或2格,那么人从格外跳到第8格的方法种数为( C )A. 8种B. 13种C. 21种D. 34种【例2】质点在x 轴上从原点O 出发向右运动,每次平移一个单位或两个单位,且移动一个单位的概率为32,移动两个单位的概率为31,设质点运动到点)0,(n 的概率为n P . (1) 求1P 和2P ;(2) 求n P .【例3】为迅速抢占市场举行促销活动,销售公司现面向意向客户推出“玩游戏,赢大奖,送汽车模型”活动,客户可根据抛掷骰子向上的点数,遥控汽车模型在方格图上行进,若汽车模型最终停在“幸运之神”方格,则可获得购车优惠券2万元;若最终停在“赠送汽车模型”方格,则可获得汽车模型一个.方格图上标有第0格、第1格、第2格、……、第 20 格。
汽车模型开始在第0格,客户每掷一次骰子,汽车模型向前移动一次.若掷出 1,2,3,4点,汽车模型向前移动一格(从第k 格到第k +1格),若掷出5,6点,汽车模型向前移动两格(从第k 格到第k +2格),直到移到第 19 格(幸运之神)或第 20 格(赠送汽车模型)时游戏结束.设汽车模型移到第n (1≤n ≤19)格的概率为n P .则19P =_________.【例 4】【淮北高三二模T12】已知棋盘上标有第 0,1,2,.,100 站,棋子开始时位于第0站,棋手抛掷均匀硬币走跳棋游戏,若掷出正面,棋子向前跳一站:若掷出反面,棋子向前跳两站,直到跳到第 99 站(胜利大本营)或第 100 站(欢乐大本营)时,游戏结束.设棋子跳到第n 站的概率为n P . ( )A. 211=P B. 833=P C. )981(,212111≤≤+=-+n P P P n n n D. )211(32101100+=P赌徒问题(随机游走)例5:(2023·杭州市二模/湖南师大附中三模T21)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…X t-2, X t-1,X t, X t+1…,那么X t+1时刻的状态的条体概率仅依赖前一状态X t,即P(X t+1|… X t-2, X t-1,X t)=P(X t+1 |X t).现实生活中也存在着许多马尔科大链,例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为50%,每局赌赢可以赢得1元,每一局赌徒赌输的概率为50%,赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为A(A∈N*,A<B),赌博过程如图的数轴所示.当赌徒手中有n元(0≤n≤B,n∈N)时,最终输光的概率为P(n),请回答下列问题:(1)请直接写出P(0)与P(B)的数值;(2)证明{ P(n)}是个等差数列,并写出公差d;(3)当A=100时,分别计算B=200,B=1000时,P(A)的数值,并结合实际,解释当B→+∞时,P(A)的统计含义.例6:(2023·惠州一模T22改编)为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐(吐槽一下惠州学生命真苦啊……).已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复.(1)求该同学第二天中午选择米饭套餐的概率;(2)记该同学第n 天选择米饭套餐的概率为P n ;(i)求P n 表达式;(ii)证明:当n ≥2时,P n ≤512;并结合实际,说明当n →+∞时, P n 的实际意义.传球问题中的马尔可夫模型例7:三人互相传球,由甲开始发球,并作为第一次传球,每人得球后传球给其他人的可能性均相等.经过5次传球后,球仍回到甲手中,则不同的传球方式共有( )A .6种B .8种C .10种D .16种(例7升级Plus 版本):甲乙丙丁4人传接球训练,球从甲脚下开始,等可能地随机传向其余3人中的1人,接球者接到球后,再等可能地随机传向另外3人中的1人,依此类推.假设所有传出的球都能接住.记第n 次传球之前,球在甲脚下的概率为P n (n ∈N ∗) ,易知P 1=1 ,P 2=0.(1)推导P n 的表达式;(2)设第n 次传球之前,球在乙脚下的概率为Q n ,比较Q n 与P n ( n ≥3 )的大小; 并结合实际,解释当n→+∞时, P n 与Q n 的统计含义;(3) 假设经历了6次传球后,球依旧在甲的脚下,请问共有多少种不同的传球路径?【例 8】【武汉九调 T16】甲,乙,丙三人进行传球游戏,每次投掷一枚质地均匀的正方体骰子决定传球的方式:当球在甲手中时,若骰子点数大于3,则甲将球传给乙,若点数不大于3,则甲将球保留;当球在乙手中时,若骰子点数大于4,则乙将球传给甲,若点数不大于4,则乙将球传给丙;当球在丙手中时,若骰子点数大于 3,则丙将球传给甲,若骰子点数不大于 3,则丙将球传给乙.初始时,球在甲手中,投掷n 次骰子后(*∈N n ),记球在甲手中的概率为n P ,则3P =_____________;n P =____________ .【例9】【茂名高三&郴州高三二模 T22】马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第n +1次状态的概率分布只跟第n 次的状态有关,与第n -1,n -2,n -3,…次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行n (*∈N n )次操作后,记甲盒子中黑球个数为n X ,甲盒中恰有1个黑球的概率为n a ,恰有2个黑球的概率为n b 。
马尔可夫链在自然界与社会现象中,许多随机现象遵循下列演变规律,已知某个系统(或过程)在时刻0t t =所处的状态,与该系统(或过程)在时刻0t t >所处的状态与时刻0t t <所处的状态无关。
例如,微分方程的初值问题描述的物理系统属于这类随机性现象。
随机现象具有的这种特性称为无后效性(随机过程的无后效性),无后效性的直观含义:已知“现在”,“将来”和“过去”无关。
在贝努利过程(){},1X n n ≥中,设()X n 表示第n 次掷一颗骰子时出现的点数,易见,今后出现的点数与过去出现的点数无关。
在维纳过程(){},0X t t ≥中,设()X t 表示花粉在水面上作布朗运动时所处的位置,易见,已知花粉目前所处的位置,花粉将来的位置与过去的位置无关。
在泊松过程(){,0}N t t ≥中,设()N t 表示时间段[0,]t 内进入某商店的顾客数。
易见,已知时间段0[0,]t 内进入商店的顾客数()0N t ,在时间段()0[0,]t t t >内进入商店的顾客数()N t 等于()0N t 加上在时间段0(,]t t 内进入商店的顾客数()()0N t N t -,而与时刻0t 前进入商店的顾客无关。
一、马尔可夫过程定义:给定随机过程(){},X t t T ∈。
如果对任意正整数3n ≥,任意的12,,1,,n i t t t t T i n <<<∈= ,任意的11,,,n x x S -∈ S 是()X t 的状态空间,总有()()()1111|,n n n n P X x X t x X t x --≤==()()11|,n n n n n P X x X t x x R --=≤=∈ 则称(){},X t t T ∈为马尔可夫过程。
在这个定义中,如果把时刻1n t -看作“现在”,时刻n t 是“将来”,时刻12,,n t t - 是“过去”。
马尔可夫过程要求:已知现在的状态()11n n X t x --=,过程将来的状态()n X t 与过程过去的状态()()1122,,n n X t x X t x --== 无关。
这就体现了马尔可夫过程具有无后效性。
通常也把无后效性称为马尔可夫性。
从概率论的观点看,马尔可夫过程要求,给定()()1111,,n n X t x X t x --== 时,()n X t 的条件分布仅与()11n n X t x --=有关,而与()()12,,n X t X t - 无关。
二、马尔可夫链及其转移概率马尔可夫链是参数离散、状态离散的最简单的马尔可夫过程。
在马尔可夫链(){},X t t T ∈中,一般取参数空间{}0,1,2,T = 。
马尔可夫链的状态空间E 的一般形式是{}0,1,2,E = 。
1、马尔柯夫链定义:一个随机序列{X(t), t=1,2,3,…}取值于正整数空间E ={0,1,2,……},或者为E 的子集, 如果有:()()()()1111|,n n n n P X t x X t x X t x --===()()()11|n n n n P X t x X t x --=== x i ∈E ={0,1,2,……} ; i=1,2,…则称为序列(){},X t t T ∈为马尔柯夫(Markov)链。
这种序列具有马尔可夫性,也叫无后致性。
注意:t 和i 均取整数。
2、马尔柯夫链的含义:可以这样理解:序列(){}X t 的“将来”只与“现在”有关而与“过去”无关。
3、马尔柯夫链的状态:马尔柯夫链序列(){}X t 中的某一个符号X(t i )的数值一定为E 中的某一个元素x i (或x j ),这时,称x I (或x j )为随机序列的一个状态Si 。
4、马尔柯夫链的一步转移概率马尔柯夫(Markov)链的统计特性用条件概率(状态转移概率)来描述: 习惯上把转移概率记做()()()()()()()()(1)11|1|n n ij ij P X t x X t x P X t j X t i p t p t -+===+====这称为马氏链的一步转移概率。
为马尔柯夫链从状态i 变为状态j 的条件概率。
它满足:(概率的加法公式)p ij (1)(t)≥0 i j ∈E()1ij j Ep t i E ∈=∈∑5、马尔柯夫链的K 步转移概率:其k 步转移概率为:为马尔柯夫链从状态i 经过k 步(k 个单位时间)后变为状态j 的条件概率:()()()()()|k ij P X t k j X t i p t +===它满足:p (k)ij (t)≥0 i j ∈E()()1k ijj Ept i E ∈=∈∑6、平稳马尔柯夫链的性质:如果马尔柯夫链是平稳的,即与时刻无关,与t 无关,我们讨论的马尔柯夫链只是这种最简单的情况。
这种平稳马氏链称为齐次马氏链。
由于这种齐次马尔柯夫链的转移概率与时间无关,因此去掉其时间变量t ,其中的一步转移概率为()1ij ij p p =,k 步转移概率为()k ij p ,n 步转移概率为()n ij p 。
定义2:向量()12,,,n u u u u = 称为概率向量,如果u 满足: 10,1,2,,1nj ii u j nu=≥==∑定义3:若方阵P 的每行都为概率向量,则称此方阵为概率矩阵。
可以证明,如果矩阵A 和B 皆为概率矩阵,则,,kkAB A B 也都是概率矩阵(k 为正整数)由所有一步转移概率组成的矩阵称为一步转移概率矩阵表示为:111212122212n n n n nn p p p p p p P p p p ⎛⎫ ⎪⎪= ⎪ ⎪⎝⎭120.80.180.020.80.20.650.250.10.70.3001P P ⎛⎫⎛⎫ ⎪== ⎪⎪⎝⎭⎪⎝⎭转移矩阵必为概率矩阵,且具有以下两个性质: 1)()()1k k PP P -=2) ()k k PP =下面主要学习正则链和吸收链1、正则链:这类马氏链的特点是,从任意状态出发经过有限次转移都能达到另外的任意状态,有如下定义.定义4 一个有n 个状态的马氏链如果存在正整数N ,使从任意状态i 经过N 次转移都已大于零的概率到达状态(),1,2,,j i j n = ,则称为正则链。
正则链的判断方法:对于概率矩阵P ,若幂次方mP 的所有元素皆为正数(指mP 的每一元素大于零),则矩阵P 称为正规概率矩阵,此时马氏链称为正则链,或者称马氏链具有遍历性。
遍历性的直观含义:一个遍历的马尔可夫链经过相当长的时间后,它处于各个状态的概率趋于稳定,且概率稳定值与初始状态无关。
在工程技术中,当马尔可夫链的极限概率分布存在时,它的遍历性表示一个系统经过相当长时间后趋于平衡状态,这时,系统处于各个状态的概率分布即不依赖于初始状态,也不在随时间的推移而改变。
设系统的极限分布(也是稳态分布)用行向量()013,,,,n πππππ=来表示,一步转移概率矩阵为P ,则有P ππ=,且11ni i π==∑从而可以解出系统的极限分布(或稳态分布)从状态i 出发经k 次转移,第一次到达状态j 的概率称为i 到j 的首达概率,记做()ij f n , 于是 ()1ij iji nf n μ∞==∑为由状态i 第一次到达状态j 的平均转移次数,特别的,ii μ是状态i 首次返回的平均转移次数,ii μ与稳态概率ω有密切关系,即对于正则链,1/ii i μπ=马尔可夫链模型:设系统在0k =时所处的初始状态()()()()()00012,,,nS S S S = 为已知,经过k 次转移后所处的状态向量()()()()()()12,,,1,2,k kkk nSS S S k == ,则()()()11121002122212kn k n k n n nn p p p p p p SS P Sp p p ⎛⎫⎪ ⎪== ⎪⎪⎝⎭此式即为马尔可夫预测模型。
由上式可以看出,系统在经过k 次转移后所处的状态()k S只取决于它的初始状态()0S和转移概率P 。
因此对于马氏链模型最基本的问题是构造状态()X t 及写出转移矩阵P ,一旦有了P ,那么给定初始状态概率()0S就可以用上式计算任意时段的状态概率()k S。
2、 吸收链在马尔可夫链中,称1ij p =的状态i,j 为吸收状态。
如果一个马尔可夫链中至少包含一个吸收状态,并且从每一个非吸收状态出发,都可以到达某个吸收状态,那么这个马尔可夫链称为吸收链。
含有m 个吸收状态和(n-m)个非吸收状态的吸收链,其转移矩阵的标准形式为()()0m m n nn m n m I P R Q ⨯⨯-⨯-⎛⎫= ⎪ ⎪⎝⎭(1)其中矩阵R 中含有非零元素,m m I ⨯为m 阶单位矩阵。
Q 不是概率矩阵,它至少存在一个小于1的行和,且如下定理成立。
定理1 对于吸收链P 的标准形式(1),()I Q -可逆,()1s s M I Q Q ∞-==-=∑,记元素全为1的列向量()1,1,,1e '= ,则y Me =的第i 分量是从第i 个非吸收态出发,到某个吸收状态吸收的平均转移次数。
设状态i 是非吸收态,j 是吸收状态,那么首达概率()ij f n 实际上是i 经n 次转移被j 吸收的概率,而()1ij ij n f f n ∞==∑则是从非吸收状态i 出发终被吸收状态j 吸收的概率,记{}()ij k r rF f -⨯=,下面的定理给出了计算ij f 的方法。
定理2 设吸收链的转移矩阵P 表为标准形式(1),则F MR =例1、设马尔可夫链(){},0X t t ≥的状态空间{}1,2,3E =,一步转移概率矩阵为1/43/401/31/31/301/43/4P ⎛⎫ ⎪= ⎪ ⎪⎝⎭初始分布为()()01/4,1/2,1/4S=,即()()()()()()11101,02,03424P X P X P X ======则 ()()()220113/576,230/576,233/576P P P ==用Matlab 计算如下:s0=[1/4 1/2 1/4]; P=[1/4 3/4 0;1/3 1/3 1/3;0 1/4 3/4];S2=s0*P.^2=(0.0712 0.2118 0.1962)稳态分布 T=(t1,t2,t3),TP=T,变换后 (P ’-E)T ’=0 T=(0.16 0.36 0.48) 附程序:liyiw.m市场占有率模型设有甲、乙、丙三家企业,生产同一种产品,共同供应1000家用户,各用户在各企业间自由选购,但不超出这三家企业,也无新的客户。
假定在10月末经过市场调查得知,甲、乙、丙三家企业拥有的客户分别是:250户,300户,450户,而11月份用户可能的流动情况如表所示:假定该产品用户的流动按上述方向继续变化下去(转移概率不变),预测12月份三家企业市场用户各自的拥有量,并计算经过一段时间后,三家企业在稳定状态下该种产品的市场占有率。