数学建模 马氏链模型
- 格式:ppt
- 大小:1.21 MB
- 文档页数:45
马氏链模型教学目的:通过教学,使学生掌握马尔可夫链的基本知识,掌握建立马氏链模型的基本方法,能用马氏链模型解决一些简单的实际问题。
教学重点和难点:建立马氏链模型的基本思想和基本步骤。
教学内容:马尔可夫预测法是应用概率论中马尔可夫链(Markov chain )的理论和方法来研究分析时间序列的变化规律,并由此预测其未来变化趋势的一种预测技术.这种技术已在市场预测分析和市场管理决策中得到广泛应用,近年来逐步被应用于卫生事业管理和卫生经济研究中.下面扼要介绍马尔可夫链的基本原理以及运用原理去进行市场预测的基本方法.(1)马尔可夫链的基本原理我们知道,要描述某种特定时期的随机现象如某种药品在未来某时期的销售情况,比如说第n 季度是畅销还是滞销,用一个随机变量X n 便可以了,但要描述未来所有时期的情况,则需要一系列的随机变量 X 1,X 2,…,X n ,….称{ X t ,t ∈T ,T 是参数集}为随机过程,{ X t }的取值集合称为状态空间.若随机过程{ X n }的参数为非负整数, X n 为离散随机变量,且{ X n }具有无后效性(或称马尔可夫性),则称这一随机过程为马尔可夫链(简称马氏链).所谓无后效性,直观地说,就是如果把{ X n }的参数n 看作时间的话,那么它在将来取什么值只与它现在的取值有关,而与过去取什么值无关.对具有N 个状态的马氏链,描述它的概率性质,最重要的是它在n 时刻处于状态i 下一时刻转移到状态j 的一步转移概率:N j i n p i X j X P j i n n ,,2,1,)()|(1 ====+若假定上式与n 无关,即 ====)()1()0(n p p p j i j i j i ,则可记为j i p (此时,称过程是平稳的),并记⎪⎪⎪⎪⎪⎭⎫⎝⎛=N N N N N N p p p p p p p p p P212222111211(1) 称为转移概率矩阵.例1 设某抗病毒药销售情况分为“畅销”和“滞销”两种,以“1”代表“畅销”,“2”代表“滞销”.以X n 表示第n 个季度的销售状态,则X n 可以取值1或2.若未来的抗病毒药销售状态,只与现在的市场状态有关,而与以前的市场状态无关,则抗病毒药的市场状态{ X n ,n ≥1}就构成一个马氏链.设5.011=p , 5.012=p ,6.021=p , 4.022=p则转移概率矩阵为⎪⎪⎭⎫ ⎝⎛=4.06.05.05.0P这里5.011=p 表示连续畅销的可能性,5.012=p 表示由畅销转入滞销的可能性,6.021=p 表示由滞销转入畅销的可能性,4.022=p 表示连续滞销的可能性.这种状态转移的情况也可以用状态转移图来表示.转移概率矩阵具有下述性质: (1)N j i p j i ,,2,1,,0 =≥.即每个元素非负.(2)N i p Nj j i ,,2,1,11==∑=.即矩阵每行的元素和等于1.如果我们考虑状态多次转移的情况,则有过程在n 时刻处于状态i ,n +k 时刻转移到状态j 的k 步转移概率:N j i n p i X j X P k j i n k n ,,2,1,)()|()( ====+同样由平稳性,上式概率与n 无关,可写成)(k j i p .记⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=)()(2)(1)(2)(22)(21)(1)(12)(11)(k N N k N k N k N k k k N k k k p p p p p p p p p P(2) 称为k 步转移概率矩阵.其中)(k j i p 具有性质:N j i p k j i ,,2,1,,0)( =≥; N i p Nj k j i ,,2,1,11)( ==∑=.例2 求例1中抗病毒药的销售状态{X n }的二步转移矩阵P (2). 解 由例1知,其一步转移矩阵为:⎪⎪⎭⎫ ⎝⎛=4.06.05.05.0P若本季度抗病毒药的销售处于畅销(即处于状态“1” ),那么,经过两个季度以后,就经历了两次转移,可能转移到状态“2”,也可能保持状态“1”,这种转移的可能性的大小就是二步转移概率.)2(11p 表示抗病毒药的销售由畅销经两次转移后仍然是畅销的概率,由概率计算的全概率公式)1|1(13)2(11===X X P p)2|1()1|2()1|1()1|1(23122312====+=====X X P X X P X X P X X P 21121111p p p p +=55.06.05.05.05.0=⨯+⨯=同样可算得由畅销经两次转移到滞销的概率22121211)2(12p p p p p +=45.04.05.05.05.0=⨯+⨯=由滞销经两次转移到畅销和滞销的概率分别为54.06.04.05.06.021221121)2(21=⨯+⨯=+=p p p p p 46.04.04.05.06.022221221)2(22=⨯+⨯=+=p p p p p所以二步转移矩阵为⎪⎪⎭⎫⎝⎛=46.054.045.055.0)2(P由例2的计算过程知⎪⎪⎭⎫⎝⎛++++=⎪⎪⎭⎫ ⎝⎛=22221221212211212212121121121111)2(22)2(21)2(12)2(11)2(p p p p p p p p p p p p p p p p p p p p P22221121122211211P p p p p p p p p =⎪⎪⎭⎫ ⎝⎛⎪⎪⎭⎫ ⎝⎛=一般地有,若P 为一步转移矩阵,则k 步转移矩阵kk N N k N k N k N k k k N k k k P p p p p p p p p p P =⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=)()(2)(1)(2)(22)(21)(1)(12)(11)((3) (2)状态转移概率的估算在马尔可夫预测方法中,系统状态的转移概率的估算非常重要.估算的方法通常有两种:一是主观概率法,它是根据人们长期积累的经验以及对预测事件的了解,对事件发生的可能性大小的一种主观估计,这种方法一般是在缺乏历史统计资料或资料不全的情况下使用.二是统计估算法,现通过实例介绍如下.例3 记录了某抗病毒药的6年24个季度的销售情况,得到表1.试求其销售状态的转移概率矩阵.表1 某抗病毒药24个季度的销售情况季度 销售状态 季度 销售状态 季度 销售状态 季度 销售状态 1 1 (畅销) 7 1(畅销) 13 1(畅销) 19 2(滞销) 2 1(畅销) 8 1(畅销) 14 1(畅销) 20 1(畅销) 3 2(滞销) 9 1(畅销) 15 2(滞销) 21 2(滞销) 4 1(畅销) 10 2(滞销) 16 2(滞销) 22 1(畅销) 5 2(滞销) 11 1(畅销) 17 1(畅销) 23 1(畅销) 62(滞销)122(滞销)181(畅销)241(畅销)分析表中的数据,其中有15个季度畅销,9个季度滞销,连续出现畅销和由畅销转入滞销以及由滞销转入畅销的次数均为7,连续滞销的次数为2.由此,可得到下面的市场状态转移情况表(表2).表2 市场状态转移情况表现计算转移概率.以频率代替概率,可得连续畅销的概率:1170.5151p ===-连续出现畅销的次数出现畅销的次数分母中的数为15减1是因为第24季度是畅销,无后续记录,需减1.同样得由畅销转入滞销的概率:1270.5151p ===-畅销转入滞销的次数出现畅销的次数滞销转入畅销的概率:2170.789p ===滞销转入畅销的次数出现滞销的次数连续滞销的概率:2220.229p ===连续滞销的次数出现滞销的次数综上,得销售状态转移概率矩阵为:⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛=22.078.05.05.022211211p pp p P 从上面的计算过程知,所求转移概率矩阵P 的元素其实可以直接通过表2中的数字计算而得到,即将表中数分别除以该数所在行的数字和便可:77711+=p 77712+=p27721+=p77222+=p由此,推广到一般情况,我们得到估计转移概率的方法:假定系统有m 种状态S 1,S 2,…,S m ,根据系统的状态转移的历史记录,得到表3的统计表格,以j i pˆ表示系统从状态i 转移到状态j的转移概率估计值,则由表3的数据计算估计值的公式如下:表3 系统状态转移情况表例4 设某系统有3种状态S1,S2和S3,系统状态的转移情况见表4.试求系统的状态转移概率矩阵.表4 某系统状态转移情况表解由公式(4),得2.091566ˆ11=++=p,5.0915615ˆ12=++=p ,3.091569ˆ13=++=p2.021444ˆ21=++=p ,7.0214414ˆ22=++=p ,1.021442ˆ23=++=p3.04333ˆ31=++=p , 3.04333ˆ32=++=p ,4.04334ˆ33=++=p故系统的转移概率矩为⎪⎪⎪⎭⎫⎝⎛=4.03.03.01.07.02.03.05.02.0P(3)带利润的马氏链在马氏链模型中,随着时间的推移,系统的状态可能发生转移,这种转移常常会引起某种经济指标的变化.如抗病毒药的销售状态有畅销和滞销两种,在时间变化过程中,有时呈连续畅销或连续滞销,有时由畅销转为滞销或由滞销转为畅销,每次转移不是盈利就是亏本.假定连续畅销时盈r 11元,连续滞销时亏本r 22元,由畅销转为滞销盈利r 12元,由滞销转为畅销盈利r 21元,这种随着系统的状态转移,赋予一定利润的马氏链,称为有利润的马氏链.对于一般的具有转移矩阵⎪⎪⎪⎪⎪⎭⎫⎝⎛=N N N N N N p p p p p p p p p P212222111211的马氏链,当系统由i 转移到j 时,赋予利润r ij (i ,j =1,2,…,N ),则称⎪⎪⎪⎪⎪⎭⎫⎝⎛=N N N N N N r r r r r r r r r R212222111211(5) 为系统的利润矩阵,r ij >0称为盈利,r ij <0称为亏本,r ij = 0称为不亏不盈.随着时间的变化,系统的状态不断地转移,从而可得到一系列利润,由于状态的转移是随机的,因而一系列的利润是随机变量,其概率关系由马氏链的转移概率决定.例如从抗病毒药的销售状态的转移矩阵,得到一步利润随机变量)1(1x 、)1(2x 的概率分布分别为:其中 p 11+ p 12 = 1 ,p 21+ p 22 = 1.如果药品处于畅销阶段,即销售状态为i =1,我们想知道,经过n 个季度以后,期望获得的利润是多少?为此,引入一些计算公式.首先,定义)(n i v 为抗病毒药现在处于)2,1(=i i ,经过n 步转移之后的总期望利润,则一步转移的期望利润为:∑==+==212211)1()1()(j j i j i i i i i i i p r p r p r x E v其中)()1(i x E 是随机变量)1(i x 的数学期望.二步转移的期望利润为:∑=+=+++==21)1(2)1(221)1(11)2()2(][][][)(j j i j j i i i i i i i p v r p v r p v r x E v其中随机变量)2(i x (称为二步利润随机变量)的分布为:2,1,)()1()2(==+=j p v r x P j i j j i i例如,若⎪⎪⎭⎫ ⎝⎛=6.04.05.05.0P , ⎪⎪⎭⎫⎝⎛-=7339R则抗病毒药销售的一步利润随机变量:抗病毒药畅销和滞销时的一步转移的期望利润分别为:65.035.09)(12121111)1(1)1(1=⨯+⨯=+==p r p r x E v 36.074.03)(22222121)1(2)1(2-=⨯-⨯=+==p r p r x E v二步利润随机变量为:抗病毒药畅销和滞销时的二步转移的期望利润分别为:12)1(21211)1(111)2(1)2(1][][)(p v r p v r x E v +++==5.75.0)33(5.0)69(=⨯-+⨯+=22)1(22221)1(121)2(2)2(2][][)(p v r p v r x E v +++==4.26.0)37(4.0)63(-=⨯--+⨯+=一般地定义k 步转移利润随机变量),2,1()(N i x k i =的分布为:N j p v r x P ji k j j i k i ,2,1)()1()(==+=-则系统处于状态i 经过k 步转移后所得的期望利润)(k i v 的递推计算式为:j i k j Nj j i k i k i p v r x E v )()()1(1)()(-=+==∑∑∑∑=-=-=+=+=Nj j i k j i Nj j i k j Nj j i j i p v v p v p r 1)1()1(1)1(1(6)当k =1时,规定边界条件0)0(=i v .称一步转移的期望利润为即时的期望利润,并记N i q v i i ,2,1,)1(==.(4)市场占有率预测利用马尔可夫链,我们可以进行市场占有率的预测.例如,预测A 、B 、C 三个厂家生产的某种抗病毒药在未来的市场占有情况,其具体步骤如下:第一步 进行市场调查.主要调查以下两件事:(1)目前的市场占有情况.如在购买该药的总共1000家对象(购买力相当的医院、药店等)中,买A 、B 、C 三药厂的各有400家、300家、300家,那么A 、B 、C 三药厂目前的市场占有份额分别为:40%、30%、30%.称(0.4,0.3,0.3)为目前市场的占有分布或称初始分布.(2)查清使用对象的流动情况.流动情况的调查可通过发放信息调查表来了解顾客以往的资料或将来的购买意向,也可从下一时期的订货单得出.如从定货单得表5.表5 顾客订货情况表下季度订货情况 合计 来 自A B C A 160 120 120 400 B 180 90 30 300 C180 30 90 300 合计520240 2401000第二步 建立数学模型.假定在未来的时期内,顾客相同间隔时间的流动情况不因时期的不同而发生变化,以1、2、3分别表示顾客买A 、B 、C 三厂家的药这三个状态,以季度为模型的步长(即转移一步所需的时间),那么根据表5,我们可以得模型的转移概率矩阵:⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛=3.01.06.01.03.06.03.03.04.030090300303001803003030090300180400120400120400160333231232221131211p p p p p p p p p P 矩阵中的第一行(0.4,0.3,0.3)表示目前是A 厂的顾客下季度有40%仍买A 厂的药,转为买B 厂和C 厂的各有30%.同样,第二行、第三行分别表示目前是B 厂和C 厂的顾客下季度的流向.由P 我们可以计算任意的k 步转移矩阵,如三步转移矩阵:⎪⎪⎪⎭⎫⎝⎛=⎪⎪⎪⎭⎫ ⎝⎛==252.0244.0504.0244.0252.0504.0252.0252.0496.03.01.06.01.03.06.03.03.04.033)3(P P 从这个矩阵的各行可知三个季度以后各厂家顾客的流动情况.如从第二行(0.504,0.252,0.244)知,B 厂的顾客三个季度后有50.4%转向买A 厂的药,25.2%仍买B 厂的,24.4%转向买C 厂的药.第三步 进行预测. 设),,()(3)(2)(1)(k k k k p p p S =表示预测对象k 季度以后的市场占有率,初始分布则为),,()0(3)0(2)0(1)0(p p p S =,市场占有率的预测模型为P S P S S k k k ⋅=⋅=-)1()0()( (7)现在,由第一步,我们有)3.0,3.0,4.0()0(=S ,由此,我们可预测任意时期A 、B 、C 三厂家的市场占有率.例如,三个季度以后的预测值为:⎪⎪⎪⎭⎫⎝⎛=⋅==252.0244.0504.0244.0252.0504.0252.0252.0496.0)3.03.04.0(),,(3)0()3(3)3(2)3(1)3(P S p p p S )2496.02496.05008.0(=大致上,A 厂占有一半的市场,B 厂、C 厂各占四分之一.模型(7)可推广到N 个状态的情形:kN N N N N N Nkk k p p p p p p p p p pp p P SP SS⎪⎪⎪⎪⎪⎭⎫⎝⎛===-212222111211)0()0(2)0(1)0()1()(),,((8) 如果我们按公式(7)继续逐步求A 、B 、C 三家的市场占有率,会发现,当k 大到一定的程度,S (k )将不会有多少改变,即有稳定的市场占有率,设其稳定值为),,(321p p p S =,满足1321=++p p p .事实上,如果市场的顾客流动趋向长期稳定下去,则经过一段时期以后的市场占有率将会出现稳定的平衡状态,即顾客的流动,不会影响市场的占有率,而且这种占有率与初始分布无关.如何求出这种稳定的市场占有率呢?以A 、B 、C 三家的情况为例,当市场出现平衡状态时,从公式(7)可得方程S = S P ,即⎪⎪⎪⎭⎫⎝⎛=3.01.06.01.03.06.03.03.04.0),,(),,(321321p p p p p p 由此得⎪⎩⎪⎨⎧++=++=++=3213321232113.01.03.01.03.03.06.06.04.0pp p p p p p p p p p p 经整理,并加上条件1321=++p p p ,得⎪⎪⎩⎪⎪⎨⎧=++=-+=+-=++-1p p p 00.7p 0.1p 0.3p 00.1p 0.7p 0.3p 00.6p 0.6p 0.6p 321321321321 上方程组是三个变量四个方程的方程组,在前三个方程中只有二个是独立的,任意删去一个,从剩下的三个方程中,可求出唯一解:5.01=p , 25.02=p , 25.03=p这就是A 、B 、C 三家的最终市场占有率.一般N 个状态的稳定市场占有率(稳态概率)),,(21N p p p S =可通过解方程组⎪⎪⎪⎩⎪⎪⎪⎨⎧=⎪⎪⎪⎪⎪⎭⎫⎝⎛=∑=1),,(),,(12122221112112121Nk k N N N N N N NN p p p p p p p p p p pp p p p p(9) 求得,而(9)的前N 个方程中只有N -1个是独立的,可任意删去一个.(5)期望利润预测企业追逐市场占有率的真正目的是使利润增加,因此,竞争各方无论是为了夺回市场份额,还是为了保住或者提高市场份额,在制订对策时都必须对期望利润进行预测.预测主要分两步进行:①市场统计调查.首先调查销路的变化情况,即查清由畅销到滞销或由滞销到畅销,连续畅销或连续滞销的可能性是多少.其次统计出由于销路的变化,获得的利润和亏损情况.②建立数学模型,列出预测公式进行预测.例如,通过市场调查,我们得到如下的销路转移表(表6)和利润变化表(表7).由此,我们来建立数学模型.表6 销路转移表销路转移表说明连续畅销的可能性为50%,由畅销转入滞销的可能性也是50%,由滞销到畅销为40%,连续滞销的可能性为60%.利润表说明的是连续畅销获利900万元,由畅销到滞销或由滞销到畅销均获利300万元,连续滞销则亏损700万元.从而得到销售状态的转移矩阵P 和利润矩阵R 分别为:表7 利润变化表(单位:百万元)⎪⎪⎭⎫⎝⎛=⎪⎪⎭⎫ ⎝⎛=6.04.05.05.022211211p pp p P ⎪⎪⎭⎫⎝⎛-=⎪⎪⎭⎫ ⎝⎛=733922211211r rr r R P 和R 便构成一个有利润的马氏链.由前面所述的基本原理及公式(6)得下面的预测公式:即时期利润:2,121)1(===∑=i p r v q j ji j i i ik步以后的期望利润:2,121)1(21)1(21)(=+=+=∑∑∑=-=-=i p v q p v p r v j ji k j i j j i k j j j i j i k i将调查数据代入上公式则可预测各时期的期望利润值.如:65.035.091=⨯+⨯=q 36.074.032-=⨯-⨯=q由此可知,当本季度处于畅销时,在下一季度可以期望获得利润600万元;当本季度处于滞销时,下一季度将期望亏损300万元.同样算得: 5.7)2(1=v , 4.2)2(2-=v55.8)3(1=v , 44.1)3(2-=v由此可预测本季度处于畅销时,两个季度后可期望获利750万元,三个季度后可期望获利855万元;当本季度处于滞销时,两个季度后将亏损240万元,三个季度后亏损144万元.(6)应用举例例5 Markov模型在流行病监测中的应用Markov模型是用于描述时间和状态都是离散的随机过程的数学模型.应用其理论和方法,可以对疾病发病情况随时间序列的变化规律进行分析和研究,预测疾病的发展变化趋势,为预防和控制疾病提供依据.统计了某市1980年至1995年肾综合征出血热(HFRS)的发病率分别为(单位:1/10万):2.95、6.28、10.28、7.01、7.36、13.78、33.93、35.87、33.40、28.38、30.50、33.79、39.70、30.39、39.70、33.59(引自:李洪杰等. 龙泉市肾综合征出血热发病趋势的预测. 浙江预防医学,1997,02:44).下面进行建模预测.首先根据资料将发病率划分为四个状态,统计各数据的状态归属及各状态出现的频率(初始概率),得表8和表9.表8 某市HFRS流行状况年份发病率(1/10万) 状态年份发病率(1/10万) 状态1980 2.95 1 1988 33.40 4 1981 6.28 1 1989 28.38 3 1982 10.28 2 1990 30.50 4 1983 7.01 1 1991 33.79 4 1984 7.36 1 1992 39.70 4 1985 13.78 2 1993 30.39 4 1986 33.93 4 1994 39.70 4 1987 35.87 4 1995 33.59 4表9 各状态取值范围及初始概率状态发病率取值范围初始概率1 X≤10 4/162 10<X≤20 2/163 20<X≤30 1/164 X>30 9/16由表8可得各状态的转移频率即状态转移概率的估计值,从而得模型的一步转移概率矩阵:⎪⎪⎪⎪⎪⎭⎫ ⎝⎛=⎪⎪⎪⎪⎪⎭⎫⎝⎛--=875.0125.00010005.0005.0005.05.0)197)19(1001000210021004242P 可认为HFRS 下一年的发病率只与当年发病率有关,而与过去的发病率无关,且任意时期的一步转移概率矩阵不变,从而满足无后效性和平稳性的假设,因而可用初始分布为(4/16,2/16,1/16,9/16),转移概率矩阵为P 的马氏链模型来预测HFRS 发病率未来的情况.计算多步转移矩阵:⎪⎪⎪⎪⎪⎭⎫⎝⎛==8906.01094.00000.00000.08750.01250.00000.00000.04375.00625.02500.02500.02500.00000.02500.05000.02)2(P P⎪⎪⎪⎪⎪⎭⎫⎝⎛==8887.01113.00000.00000.08906.01094.00000.00000.05703.00547.01250.02500.03438.00312.02500.03750.03)3(P P ⎪⎪⎪⎪⎪⎭⎫⎝⎛==8889.01111.00000.00000.08887.01113.00000.00000.06162.00713.01250.01875.04570.00430.01875.03125.04)4(P P 计算极限nn P ∞→lim 或解方程1,),,,(),,,(4143214321==∑=k kp P p p p p p p p p ,得模型的极限概率分布(稳态分布):(0,0,1/9,8/9).分析预测:由于95年处于状态4,比较P 的第4行的四个数字知,875.044=p 最大,所以预测96年仍处于状态4,即发病率大于30/10万.同样,从二、三、四步转移矩阵知,依然是状态4转入状态4的概率最大,所以预测1996年至1999年该市的HFRS 发病率将持续在大于30/10万(高发区)水平,这提醒我们应该对此高度重视,采取相应对策.如果转移概率矩阵始终不变,从极限分布看,最终HFRS 发病率将保持在高发区水平,当然,这应该是不会符合实际情况的,因为随着各方面因素的改变,转移概率矩阵一般也会发生变化.所以Markov模型主要适用于短期预测.在用Markov模型进行预测的过程中,无后效性和平稳性是最基本的要求,而模型是否合理有效,状态的划分和转移概率矩阵的估算是关键,不同的状态划分可能会得到不同的结果,通常我们根据有关预测对象的专业知识和数据的多少及范围来确定系统状态.在卫生管理事业中,用Markov模型还可预测医疗器械、药品的市场占有率,药品的期望利润收益等.习题在钢琴销售模型中,将存贮策略修改为:(1)当周末库存量为0或1时,订购,使下周初的库存量达到3架;否则,不订购。
一、用法,用来干什么,什么时候用 二、步骤,前因后果,算法的步骤,公式 三、程序 四、举例五、前面国赛用到此算法的备注一下马氏链模型用来干什么马尔可夫预测法是应用概率论中马尔可夫链(Markov chain )的理论和方法来研究分析时间序列的变化规律,并由此预测其未来变化趋势的一种预测技术。
什么时候用应用马尔可夫链的计算方法进行马尔可夫分析, 主要目的是根据某些变量现在的情 况及其变动趋向,来预测它在未来某特定区间可能产生的变动,作为提供某种决策的依 据。
马尔可夫链的基本原理我们知道,要描述某种特定时期的随机现象如某种药品在未来某时期的销售情况,比如说第n 季度是畅销还是滞销,用一个随机变量X n 便可以了,但要描述未来所有时期的情况,则需要一系列的随机变量 X 1,X 2,…,X n ,….称{ X t ,t ∈T ,T 是参数集}为随机过程,{ X t }的取值集合称为状态空间.若随机过程{ X n }的参数为非负整数, X n 为离散随机变量,且{ X n }具有无后效性(或称马尔可夫性),则称这一随机过程为马尔可夫链(简称马氏链).所谓无后效性,直观地说,就是如果把{ X n }的参数n 看作时间的话,那么它在将来取什么值只与它现在的取值有关,而与过去取什么值无关.对具有N 个状态的马氏链,描述它的概率性质,最重要的是它在n 时刻处于状态i 下一时刻转移到状态j 的一步转移概率:N j i n p i X j X P j i n n ,,2,1,)()|(1若假定上式与n 无关,即 )()1()0(n p p p j i j i j i ,则可记为j i p (此时,称过程是平稳的),并记N N N N N N p p p p p p p p p P212222111211(1) 称为转移概率矩阵.转移概率矩阵具有下述性质:(1)N j i p j i ,,2,1,,0 .即每个元素非负.(2)N i p Nj j i ,,2,1,11.即矩阵每行的元素和等于1.如果我们考虑状态多次转移的情况,则有过程在n 时刻处于状态i ,n +k 时刻转移到状态j 的k 步转移概率:N j i n p i X j X P k j i n k n ,,2,1,)()|()(同样由平稳性,上式概率与n 无关,可写成)(k j i p .记)()(2)(1)(2)(22)(21)(1)(12)(11)(k N N k N k N k N k k k N k k k p p p p p p p p p P(2)称为k 步转移概率矩阵.其中)(k j i p 具有性质:N j i p k ji ,,2,1,,0)( ; N i p Nj k j i ,,2,1,11)( .一般地有,若P 为一步转移矩阵,则k 步转移矩阵)()(2)(1)(2)(22)(21)(1)(12)(11)(k N N k N k N k N k k k N k k k p p p p p p p p p P(3) (2)状态转移概率的估算在马尔可夫预测方法中,系统状态的转移概率的估算非常重要.估算的方法通常有两种:一是主观概率法,它是根据人们长期积累的经验以及对预测事件的了解,对事件发生的可能性大小的一种主观估计,这种方法一般是在缺乏历史统计资料或资料不全的情况下使用.二是统计估算法,现通过实例介绍如下.例3 记录了某抗病毒药的6年24个季度的销售情况,得到表1.试求其销售状态的转移概率矩阵.表1 某抗病毒药24个季度的销售情况季度销售状态季度销售状态季度销售状态季度销售状态1 1 (畅销) 7 1(畅销) 13 1(畅销) 19 2(滞销)2 1(畅销) 8 1(畅销) 14 1(畅销) 20 1(畅销)3 2(滞销) 9 1(畅销) 15 2(滞销) 21 2(滞销)4 1(畅销) 10 2(滞销) 16 2(滞销) 22 1(畅销)5 2(滞销) 11 1(畅销) 17 1(畅销) 23 1(畅销) 62(滞销)122(滞销)181(畅销)241(畅销)分析表中的数据,其中有15个季度畅销,9个季度滞销,连续出现畅销和由畅销转入滞销以及由滞销转入畅销的次数均为7,连续滞销的次数为2.由此,可得到下面的市场状态转移情况表(表2).表2 市场状态转移情况表现计算转移概率.以频率代替概率,可得连续畅销的概率:1170.5151p连续出现畅销的次数出现畅销的次数分母中的数为15减1是因为第24季度是畅销,无后续记录,需减1.同样得由畅销转入滞销的概率:1270.5151p畅销转入滞销的次数出现畅销的次数滞销转入畅销的概率:2170.789p滞销转入畅销的次数出现滞销的次数连续滞销的概率:2220.229p连续滞销的次数出现滞销的次数综上,得销售状态转移概率矩阵为:22.078.05.05.022211211p pp p P 从上面的计算过程知,所求转移概率矩阵P 的元素其实可以直接通过表2中的数字计算而得到,即将表中数分别除以该数所在行的数字和便可:77711p 77712p 27721p 77222p Matlab 程序:format rat clca=[ 1 1 2 1 2 2 1 1 1 2 1 2,1 1 2 2 1 1 2 1 2 1 1 1]; for i=1:2 for j=1:2f(i,j)=length(findstr([i j],a)); end end fni=(sum(f'))' for i=1:2p(i,:)=f(i,:)/ni(i); end p由此,推广到一般情况,我们得到估计转移概率的方法:假定系统有m 种状态S 1,S 2,…,S m ,根据系统的状态转移的历史记录,得到表3的统计表格,以j i pˆ表示系统从状态i 转移到状态j 的转移概率估计值,则由表3的数据计算估计值的公式如下:表3 系统状态转移情况表(3)带利润的马氏链在马氏链模型中,随着时间的推移,系统的状态可能发生转移,这种转移常常会引起某种经济指标的变化.如抗病毒药的销售状态有畅销和滞销两种,在时间变化过程中,有时呈连续畅销或连续滞销,有时由畅销转为滞销或由滞销转为畅销,每次转移不是盈利就是亏本.假定连续畅销时盈r 11元,连续滞销时亏本r 22元,由畅销转为滞销盈利r 12元,由滞销转为畅销盈利r 21元,这种随着系统的状态转移,赋予一定利润的马氏链,称为有利润的马氏链.对于一般的具有转移矩阵N N N N N N p p p p p p p p p P212222111211的马氏链,当系统由i 转移到j 时,赋予利润r ij (i ,j =1,2,…,N ),则称N N N N N N r r r r r r r r r R212222111211 (5) 为系统的利润矩阵,r ij >0称为盈利,r ij <0称为亏本,r ij = 0称为不亏不盈.随着时间的变化,系统的状态不断地转移,从而可得到一系列利润,由于状态的转移是随机的,因而一系列的利润是随机变量,其概率关系由马氏链的转移概率决定.例如从抗病毒药的销售状态的转移矩阵,得到一步利润随机变量)1(1x 、)1(2x 的概率分布分别为:其中 p 11+ p 12 = 1 ,p 21+ p 22 = 1.如果药品处于畅销阶段,即销售状态为i =1,我们想知道,经过n 个季度以后,期望获得的利润是多少?为此,引入一些计算公式.首先,定义)(n i v 为抗病毒药现在处于)2,1( i i ,经过n 步转移之后的总期望利润,则一步转移的期望利润为:212211)1()1()(j j i j i i i i i i i p r p r p r x E v其中)()1(i x E 是随机变量)1(i x 的数学期望.二步转移的期望利润为:21)1(2)1(221)1(11)2()2(][][][)(j j i j j i i i i i i i p v r p v r p v r x E v其中随机变量)2(ix (称为二步利润随机变量)的分布为:2,1,)()1()2( j p v r x P j i j j i i例如,若6.04.05.05.0P ,7339R则抗病毒药销售的一步利润随机变量:抗病毒药畅销和滞销时的一步转移的期望利润分别为:65.035.09)(12121111)1(1)1(1 p r p r x E v 36.074.03)(22222121)1(2)1(2 p r p r x E v二步利润随机变量为:抗病毒药畅销和滞销时的二步转移的期望利润分别为:12)1(21211)1(111)2(1)2(1][][)(p v r p v r x E v5.75.0)33(5.0)69(22)1(22221)1(121)2(2)2(2][][)(p v r p v r x E v4.26.0)37(4.0)63(一般地定义k 步转移利润随机变量),2,1()(N i x k i的分布为:N j p v r x P ji k j j i k i ,2,1)()1()(则系统处于状态i 经过k 步转移后所得的期望利润)(k iv 的递推计算式为:j i k j Nj j i k i k i p v r x E v )()()1(1)()(Nj j i k j i Nj j i k j Nj j i j i p v v p v p r 1)1()1(1)1(1(6)当k =1时,规定边界条件0)0( iv .称一步转移的期望利润为即时的期望利润,并记N i q v i i ,2,1,)1( .可能的应用题型题型一、市场占有率预测例题1在购买该药的总共1000家对象(购买力相当的医院、药店等)中,买A 、B 、C 三药厂的各有400家、300家、300家,预测A 、B 、C 三个厂家生产的某种抗病毒药在未来的市场占有情况。
[学习笔记]马⽒链模型引例:(带有反射壁的随机徘徊)如果在原点右边距离原点⼀个单位及距原点 s(s > 1)个单位处各⽴⼀个弹性壁。
⼀个质点在数轴右半部从距原点两个单位处开始随机徘徊。
每次分别以概率 p(0 < p < 1) 和 q(q = 1− p) 向右和向左移动⼀个单位;若在+1 处,则以概率 p 反射到 2,以概率q 停在原处;在 s 处,则以概率 q 反射到 s −1,以概率 p 停在原处。
由该例⼦可以看出,我们所做的,是根据质点的移动⽅向和⽅向对应的概率,对质点的运动⽅向进⾏预测。
在这背景下,球移动的⽅向与概率只与当前的点有关,与它历史运动轨迹⽆关。
因此,这种现象可以⽤⼀句话来概括:某⼀系统在已知现在情况的条件下,系统未来时刻的情况只与现在有关,⽽与过去的历史⽆直接关系。
描述这类随机现象的数学模型称为马⽒模型。
概念以及定理:时齐性:它的含义是:系统由状态i 到状态j 的转移概率只依赖于时间间隔的长短,与起始的时刻⽆关。
在此马⽒链假定都是时齐的,因此省略“时齐”⼆字。
n可以理解成起点的位置n=1,2… m表⽰从n开始的时间间隔,i与j分别表⽰n点的状态与n+m点的状态。
由式⼦可以看出,概率与n⽆关,只与起点状态,终点状态,以及两点之间的距离有关。
转移概率矩阵: m 步转移概率 p (m) ij 为元素的矩阵 为马尔可夫链的m 步转移矩阵。
当m = 1时,记 P(1) = P 称为马尔可夫链的⼀步转移矩阵,或简称转移矩阵。
(下⾯是⼀个转移矩阵)并且由上⾯的图可以看出⼀些性质:(1)上次购买的A对应下次购买的A、B、C的概率,每⼀个都在范⽂[0,1],⽽且总和是1.(2)当步数为0时,若前后状态相同,概率为1。
状态不同概率为0。
吸收链:如果马⽒链⾄少含有⼀个吸收状态,并且从每⼀个⾮吸收状态出发,都可以到达某个吸收状态,那么这个马⽒链被称为吸收链。
如图,当状态到4的时候就会停留到4,状态4也就被称为吸收状态。