马尔科夫链例题整理
- 格式:ppt
- 大小:1.26 MB
- 文档页数:61
马尔科夫链(与数列结合的概率递推问题)如果要评选出 2023 年各地模拟题中最“成功”的题目,我想非“马尔科夫链”莫属了,尽管2023 年新高考I 卷出乎了很多“命题专家”的意料,但第 21 题考察了马尔科夫链,可谓为广大“专家”“名卷”“押题卷”挽回了一些颜面。
2023年新高考I 卷第21题的投篮问题是马尔可夫链;再往前的热点模考卷中,2023年杭州二模第21题的赌徒输光问题是马尔可夫链,2023年茂名二模的摸球问题是马尔可夫链;再往更前的2019年全国I 卷药物试验也是马尔可夫链,在新人教A 版选择性必修三 P91 页 拓展探索中的第10题是传球问题,是马尔科夫链的典型模型,可以看出自从新教材引入全概率公式(新人教A 版选择性必修三 P49 页),可想而知,未来会有越来越多的递推型概率难题出现模考试题中!因此,在复习备考中全概率等系列内容需要格外关注马尔科夫链作为一种命题模型出现了,马尔科夫链在题中的体现可以简单的概括为全概率公式+数列递推,对于高中生而言,马尔科夫链其实也不难理解。
本文主要介绍了马尔科夫链和一维随机游走模型在高考中的几种具体的应用情形,希望对各位接下来的复习和备考有一些帮助。
基本原理虽然贝叶斯公式不做要求,但是全概率公式已经是新高考考查内容了,利用全概率公式,我们既可以构造某些递推关系求解概率,还可以推导经典的一维随机游走模型,即:设数轴上一个点,它的位置只能位于整点处,在时刻0=t 时,位于点)(+∈=N i i x ,下一个时刻,它将以概率α或者β(1),1,0(=+∈βαα)向左或者向右平移一个单位. 若记状态i t X =表示:在时刻t 该点位于位置)(+∈=N i i x ,那么由全概率公式可得:)|()()|()()(1111111+==++=−==+−==+⋅+⋅=i t i t i t i t i t i t i t X X P X P X X P X P X P另一方面,由于αβ==+==+−==+)|(,)|(1111i t i t i t i t X X P X X P ,代入上式可得:11−+⋅+⋅=i i i P P P βα.进一步,我们假设在0=x 与),0(+∈>=N m m m x 处各有一个吸收壁,当点到达吸收壁时被吸收,不再游走.于是,1,00==m P P .随机游走模型是一个典型的马尔科夫过程.进一步,若点在某个位置后有三种情况:向左平移一个单位,其概率为a ,原地不动,其概率为b ,向右平移一个单位,其概率为c ,那么根据全概率公式可得:11+−++=i i i i cP bP aP P2023·新高考Ⅰ卷T211.乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投籃,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5. (1)求第2次投篮的人是乙的概率; (2)求第i 次投篮的人是甲的概率; (3)已知:若随机变量i X 服从两点分布,且()()110,1,2,,i i i P X P X q i n ==−===⋅⋅⋅,则11n ni i i i E X q == = ∑∑.记前n 次(即从第1次到第n 次投篮)中甲投篮的次数为Y ,求()E Y . 【解析】(1)记“第i 次投篮的人是甲”为事件i A ,“第i 次投篮的人是乙”为事件i B ,所以,()()()()()()()21212121121||P B P A B P B B P A P B A P B P B B =+=+()0.510.60.50.80.6×−+×.(2)设()i i P A p =,依题可知,()1i i P B p =−,则()()()()()()()11111||i i i i i i i i i i i P A P A A P B A P A P A A P B P A B +++++=+=+,即()()10.610.810.40.2i i i i p p p p +=+−×−=+, 构造等比数列{}i p λ+,设()125i i p p λλ++=+,解得13λ=−,则1121353i i p p + −=−,又11111,236p p =−=,所以13i p−是首项为16,公比为25的等比数列,即11112121,365653i i i i p p −−−=×=×+. (3)因为1121653i i p − =×+,1,2,,i n =⋅⋅⋅, 所以当*N n ∈时,()122115251263185315nnn n n E Y p p p − =+++=×+=−+ − ,故52()11853nnE Y=−+.2019·全国Ⅰ卷2.为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1−分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1−分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列.(2)若甲药、乙药在试验开始时都赋予4分,)0,1,2,,8(i p i =⋅⋅⋅表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11()127i i i i p ap bp cp i ==++…-+,,,,其中)1(a P X ==-,(0)b P X == (1)c PX ==. 假设0.5α=,0.8β=. ①证明:1)0{,1,2,,}7(i i p p i−=⋅⋅⋅+为等比数列; ②求4p ,并根据4p 的值解释这种试验方案的合理性. 【解析】(1)X 的所有可能取值为-1,0,1.11()()P X αβ=−−=,()()()011P X αβαβ=+−−=,()1(1)P X αβ=−=, 所以X 的分布列为X -11P(1)αβ− )1((1)αβαβ+−− ()1αβ−(2)①证明 由(1)得0.4a =,0.5b =,0.1c =.因此110.40.50.1i i i i p p p p −+=++,故()()110.10.4i i i i p p p p −=−+-,则()114i i i i p p p p −=−+-.又因为1010p p p −≠=,所以1)0{,1,2,,}7(i i p p i−=⋅⋅⋅+为公比为4,首项为1p 的等比数列. ② 由①得()()()88877610087761001413p p p p p p p p p p p p p p p p −=−+−+…+−+=−+−+…+−+=⋅. 由于81p =,故18341p =−, 所以()()()()444332*********3257p p p p p p p p p p p −=−+−+−+−+==. 4p 表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为410.0039257p =≈,此时得出错误结论的概率非常小,说明这种试验方案合理.课本原题:人教A 版数学《选择性必修三》P913.甲、乙、丙三人相互做传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人.求n 次传球后球在甲手中的概率. 【解析】记第n 次传球后球在甲手中的概率为n P ,则第1n −次传球后球在甲手中的概率为1n P −, 开始时球在甲手中,则01P =.若第n 次传球后球在甲手中,则第1n −次传球后球不在甲手中,即第1n −次传球后球在乙或丙手中, 所以第1n −次传球后球不在甲手中的概率为11n P −−,又乙或丙在第n 次把球传到甲手上的概率为12, 于是有()1112n n P P −−=,即1111323n n P P − −=−− ,1n ≥, 于是数列13n P−是首项为0213P −=,公比为12−得等比数列, 所以121332nn P −=×−,所以()*211323nn P n =×−+∈ N .1.(2024届·武汉高三开学考)有编号为1,2,3,...,18,19,20的20个箱子,第一个箱子有2个黄球1个绿球,其余箱子均为2个黄球2个绿球,现从第一个箱子中取出一个球放入第二个箱子,再从第二个箱子中取出一个球放入第三个箱子,以此类推,最后从第19个箱子取出一个球放入第20个箱子,记i p 为从第i 个箱子中取出黄球的概率. (1)求23,p p ; (2)求20p . 【答案】(1)2815P =,33875P =;(2)201911652P =+⋅【分析】(1)分第一次取出黄球和绿球两种情况,再由互斥事件概率加法公式计算可得答案; (2)由题意可得()132155+=+−i i i P P P ,可得答案. 【详解】(1)从第二个箱子取出黄球的概率223128353515P =⋅+⋅=, 从第三个箱子取出黄球的概率3838238115515575P =⋅+−⋅= ; (2)由题意可知,()1321215555i i i i P P P P +=+−=+, 即1111252i i P P + −=− ,又123P = 1111111111,,,26265652i i i i P P P −− −=∴−=⋅∴=+ ⋅ 201911652P ∴=+⋅.重点题型·归类精讲【答案】(1)1942,1311776n n P −=−−(2)第二次,证明见解析【分析】(1)根据全概率公式即可求解2P ,利用抽奖规则,结合全概率公式即可由等比数列的定义求解, (2)根据1311776n n P −=−−,即可对n 分奇偶性求解.【详解】(1)记该顾客第()*N i i ∈次摸球抽中奖品为事件A ,依题意,127P =, ()()()()()22121121212119||1737242P P A P A P A A P A P A A ==+=×+−×= . 因为()11|3n n P A A −=,()11|2n n P A A −=,()n n P P A =,所以()()()()()1111||n n n n n n n P A P A P A A P A P A A −−−−=+,所以()111111113262n n n n P P P P −−−=+−=−+, 所以1313767n n P P − −=−−, 又因为127P =,则131077P −=−≠, 所以数列37n P−是首项为17−,公比为16−的等比数列,故1311776n n P −=−−.(2)证明:当n 为奇数时,1131976742n n P −<<⋅,当n 为偶数时,131776n n P −=+⋅,则n P 随着n 的增大而减小, 所以,21942n P P ≤=,综上,该顾客第二次摸球抽中奖品的概率最大.3.从甲、乙、丙等5人中随机地抽取三个人去做传球训练.训练规则是确定一人第一次将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人,每次必须将球传出. (1)记甲乙丙三人中被抽到的人数为随机变量X ,求X 的分布列;(2)若刚好抽到甲乙丙三个人相互做传球训练,且第1次由甲将球传出,记n 次传球后球在甲手中的概率为,1,2,3,n p n = ,①直接写出123p p p ,,的值;②求1n p +与n p 的关系式*()n N ∈,并求n p *()n N ∈. 【答案】(1)分布列见解析(2)①10p =,212p =,314p =;②111,1,2,322n n p p n +=−+=;11(1)132n n − −+ 【分析】(1)由离散型随机变量的分布列可解;(2)记n A 表示事件“经过n 次传球后,球在甲手中”,由全概率公式可求111,22n n p p +=−+再由数列知识,由递推公式求得通项公式.【详解】(1)X 可能取值为1,2,3,()1232353110C C p X C ===;()213235325C C p X C ===;()3032351310C C p X C === 所以随机变量X 的分布列为(2)若刚好抽到甲乙丙三个人相互做传球训练,且n 次传球后球在甲手中的概率为,1,2,3,n p n = , 则有10,p =2221,22p ==3321,24p == 记n A 表示事件“经过n 次传球后,球在甲手中”,111n n n n n A A A A A +++=⋅+⋅所以()()()11111n n n n n n n n n p P A A A A P A A P A A +++++=⋅+⋅=⋅+⋅ ()()()()()()111110122n n nn n n n n n P A P A A P A P A A p p p ++=⋅+⋅=−⋅+⋅=−∣∣ 即111,1,2,322n n p p n +=−+=, 所以1111323n n p p + −=−− ,且11133p −=− 所以数列13n p− 表示以13−为首项,12−为公比的等比数列,所以1111332n n p −−=−×−所以1111111132332n n n p −−=−×−+=−−即n 次传球后球在甲手中的概率是11(1)132n n −−+.2023届惠州一模4.为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐. 已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复. (1)求该同学第二天中午选择米饭套餐的概率 (2)记该同学第n 天选择米饭套餐的概率为n P(Ⅰ)证明:25n P −为等比数列;(Ⅱ)证明:当2n ≥时,512n P ≤. 【解析】(1)设1A =“第1天选择米饭套餐”,2A =“第2天选择米饭套餐”,则1A =“第1天不选择米饭套餐”,于是,()123P A =,()113P A =,()2114|P A A =,()2111122|P A A =−=, 由全概率公式()()()()()21211212111134323||P A P A P A A P A P A A =+=×+×=;(2)(Ⅰ)设n A =“第n 天选择米饭套餐”,则()n n P P A =,()1n n P A P =−,()14|1n n P A A +=,()11|1122n n P A A +=−=, ()()()()()()111111111424|2|n n n n n n n n n n n P P A P A P A A P A P A P P P A ++++==+=+−=−+, 所以1212545n n P P + −=−− ,25n P − 是以124515P −=为首项,14−为公比的等比数列。
马尔科夫计算例题
马尔科夫链蒙特卡洛(Markov Chain Monte Carlo,MCMC)是一种统计模拟方法,用于从复杂的分布中抽样。
以下是一个简单的马尔科夫链蒙特卡洛计算例题:
假设我们有一个随机变量 \(X\),其分布是 \(P(X)\)。
我们的目标是计算
\(P(X)\) 的期望值,也就是:
\(\text{E}[X] = \int x P(x) dx\)
但是,直接计算这个积分是非常困难的。
因此,我们使用马尔科夫链蒙特卡洛方法来近似这个积分。
步骤如下:
1. 初始化一个随机数 \(x_0\) 作为当前状态。
2. 生成一个随机数 \(r\) 服从均匀分布 \(U(0,1)\)。
3. 计算接受率 \(A = \min(1, \frac{P(x_i)}{P(x_j)})\),其中 \(j\) 是 \(r\) 落入的区间中的状态。
4. 以概率 \(A\) 接受 \(x_j\) 作为新的状态 \(x_{i+1}\)。
5. 如果接受,回到步骤 2;否则,令 \(i = i+1\) 并回到步骤 2。
6. 重复步骤 2-5,直到达到足够的样本数量。
然后,我们可以用这些样本的平均值来近似期望值。
这是一个简单的例子,实际上马尔科夫链蒙特卡洛方法可以用于更复杂的问题,如高维积分、优化问题等。
连续时间马尔可夫链连续时间马尔可夫链(Continuous-time Markov Chain)是马尔可夫链在连续时间下的一种模型。
它受到时间的连续性限制,可以用于描述一些随机过程。
马尔可夫链基本概念马尔可夫链是指具有“无记忆性”的随机过程。
在离散时间中,马尔可夫链指的是一个随机变量序列,其中每个随机变量的取值依赖于其前一时刻的取值。
这个过程可以用一个状态转移概率矩阵来描述。
在连续时间中,马尔可夫链则是一个具有无记忆性的连续随机过程。
与离散时间不同,连续时间马尔可夫链的状态在一定时间段内可以发生任意多次的改变。
连续时间马尔可夫链的定义连续时间马尔可夫链是一个随机过程,其状态空间为有限个数。
该过程在任意时刻处于某个状态,并且满足无记忆性的马尔可夫性质。
连续时间马尔可夫链的演变是通过指数分布来描述的。
在每个状态之间的转移时间服从指数分布,转移时间的参数与当前状态有关。
连续时间马尔可夫链的转移速率矩阵与离散时间马尔可夫链中的状态转移矩阵类似,连续时间马尔可夫链使用转移速率矩阵来描述状态之间的转换关系。
设连续时间马尔可夫链的状态空间为{1, 2, …, n},转移速率矩阵为Q。
矩阵Q的元素qij表示从状态i到状态j的速率,且满足以下条件:•qij≥0, i≠j;•对于每一个状态i,有qii = -∑qij(i≠j)。
在连续时间马尔可夫链中,从状态i到状态j的转移概率为pij(t),t表示时间。
转移概率在给定时间段内满足以下等式:equation1其中X(t)表示在时刻t的状态,P表示概率。
连续时间马尔可夫链的性质连续时间马尔可夫链有许多属性与离散时间马尔可夫链类似。
•遍历性:如果状态空间中的每一个状态在有限时间内是可达的,则称连续时间马尔可夫链是遍历的。
•稳态概率分布:马尔可夫链可能存在稳态概率分布,对于连续时间马尔可夫链也是如此。
稳态概率分布表示在长时间内各个状态的概率分布。
•等距离转换概率:等距离转换概率描述了在任意的相同时间间隔内,从一个状态转移到另一个状态的概率。
马尔可夫链专题马尔可夫链:)(),,,,(11211n n n n n x x P x x x x x P +-+=等式的意义:对于一个马尔可夫链来说,第n +1次的状态的结果,只跟上一次(也即第n 次)有关,与其他次无关。
马尔可夫链性质:无记忆性破题技巧:1.找到当下状态的“前一次”的所有可能情况;2.结合对应概率写出“前一次”所有可能中蕴含的数列递推关系;3.利用数列递推技巧求答案,例1.跳格游戏:如图,人从格外只能进入第1格,在格中每次可向前跳1格或2格,那么人从格外跳到第8格的方法种数为( C )A. 8种B. 13种C. 21种D. 34种【例2】质点在x 轴上从原点O 出发向右运动,每次平移一个单位或两个单位,且移动一个单位的概率为32,移动两个单位的概率为31,设质点运动到点)0,(n 的概率为n P . (1) 求1P 和2P ;(2) 求n P .【例3】为迅速抢占市场举行促销活动,销售公司现面向意向客户推出“玩游戏,赢大奖,送汽车模型”活动,客户可根据抛掷骰子向上的点数,遥控汽车模型在方格图上行进,若汽车模型最终停在“幸运之神”方格,则可获得购车优惠券2万元;若最终停在“赠送汽车模型”方格,则可获得汽车模型一个.方格图上标有第0格、第1格、第2格、……、第 20 格。
汽车模型开始在第0格,客户每掷一次骰子,汽车模型向前移动一次.若掷出 1,2,3,4点,汽车模型向前移动一格(从第k 格到第k +1格),若掷出5,6点,汽车模型向前移动两格(从第k 格到第k +2格),直到移到第 19 格(幸运之神)或第 20 格(赠送汽车模型)时游戏结束.设汽车模型移到第n (1≤n ≤19)格的概率为n P .则19P =_________.【例 4】【淮北高三二模T12】已知棋盘上标有第 0,1,2,.,100 站,棋子开始时位于第0站,棋手抛掷均匀硬币走跳棋游戏,若掷出正面,棋子向前跳一站:若掷出反面,棋子向前跳两站,直到跳到第 99 站(胜利大本营)或第 100 站(欢乐大本营)时,游戏结束.设棋子跳到第n 站的概率为n P . ( )A. 211=P B. 833=P C. )981(,212111≤≤+=-+n P P P n n n D. )211(32101100+=P赌徒问题(随机游走)例5:(2023·杭州市二模/湖南师大附中三模T21)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…X t-2, X t-1,X t, X t+1…,那么X t+1时刻的状态的条体概率仅依赖前一状态X t,即P(X t+1|… X t-2, X t-1,X t)=P(X t+1 |X t).现实生活中也存在着许多马尔科大链,例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为50%,每局赌赢可以赢得1元,每一局赌徒赌输的概率为50%,赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为A(A∈N*,A<B),赌博过程如图的数轴所示.当赌徒手中有n元(0≤n≤B,n∈N)时,最终输光的概率为P(n),请回答下列问题:(1)请直接写出P(0)与P(B)的数值;(2)证明{ P(n)}是个等差数列,并写出公差d;(3)当A=100时,分别计算B=200,B=1000时,P(A)的数值,并结合实际,解释当B→+∞时,P(A)的统计含义.例6:(2023·惠州一模T22改编)为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐(吐槽一下惠州学生命真苦啊……).已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复.(1)求该同学第二天中午选择米饭套餐的概率;(2)记该同学第n 天选择米饭套餐的概率为P n ;(i)求P n 表达式;(ii)证明:当n ≥2时,P n ≤512;并结合实际,说明当n →+∞时, P n 的实际意义.传球问题中的马尔可夫模型例7:三人互相传球,由甲开始发球,并作为第一次传球,每人得球后传球给其他人的可能性均相等.经过5次传球后,球仍回到甲手中,则不同的传球方式共有( )A .6种B .8种C .10种D .16种(例7升级Plus 版本):甲乙丙丁4人传接球训练,球从甲脚下开始,等可能地随机传向其余3人中的1人,接球者接到球后,再等可能地随机传向另外3人中的1人,依此类推.假设所有传出的球都能接住.记第n 次传球之前,球在甲脚下的概率为P n (n ∈N ∗) ,易知P 1=1 ,P 2=0.(1)推导P n 的表达式;(2)设第n 次传球之前,球在乙脚下的概率为Q n ,比较Q n 与P n ( n ≥3 )的大小; 并结合实际,解释当n→+∞时, P n 与Q n 的统计含义;(3) 假设经历了6次传球后,球依旧在甲的脚下,请问共有多少种不同的传球路径?【例 8】【武汉九调 T16】甲,乙,丙三人进行传球游戏,每次投掷一枚质地均匀的正方体骰子决定传球的方式:当球在甲手中时,若骰子点数大于3,则甲将球传给乙,若点数不大于3,则甲将球保留;当球在乙手中时,若骰子点数大于4,则乙将球传给甲,若点数不大于4,则乙将球传给丙;当球在丙手中时,若骰子点数大于 3,则丙将球传给甲,若骰子点数不大于 3,则丙将球传给乙.初始时,球在甲手中,投掷n 次骰子后(*∈N n ),记球在甲手中的概率为n P ,则3P =_____________;n P =____________ .【例9】【茂名高三&郴州高三二模 T22】马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第n +1次状态的概率分布只跟第n 次的状态有关,与第n -1,n -2,n -3,…次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行n (*∈N n )次操作后,记甲盒子中黑球个数为n X ,甲盒中恰有1个黑球的概率为n a ,恰有2个黑球的概率为n b 。
专题8-1 马尔科夫链(与数列结合的概率递推问题)如果要评选出 2023 年各地模拟题中最“成功”的题目,我想非“马尔科夫链”莫属了,尽管2023 年新高考I 卷出乎了很多“命题专家”的意料,但第 21 题考察了马尔科夫链,可谓为广大“专家”“名卷”“押题卷”挽回了一些颜面。
2023年新高考I 卷第21题的投篮问题是马尔可夫链;再往前的热点模考卷中,2023年杭州二模第21题的赌徒输光问题是马尔可夫链,2023年茂名二模的摸球问题是马尔可夫链;再往更前的2019年全国I 卷药物试验也是马尔可夫链,在新人教A 版选择性必修三 P91 页 拓展探索中的第10题是传球问题,是马尔科夫链的典型模型,可以看出自从新教材引入全概率公式(新人教A 版选择性必修三 P49 页),可想而知,未来会有越来越多的递推型概率难题出现模考试题中!因此,在复习备考中全概率等系列内容需要格外关注马尔科夫链作为一种命题模型出现了,马尔科夫链在题中的体现可以简单的概括为全概率公式+数列递推,对于高中生而言,马尔科夫链其实也不难理解。
本文主要介绍了马尔科夫链和一维随机游走模型在高考中的几种具体的应用情形,希望对各位接下来的复习和备考有一些帮助。
基本原理虽然贝叶斯公式不做要求,但是全概率公式已经是新高考考查内容了,利用全概率公式,我们既可以构造某些递推关系求解概率,还可以推导经典的一维随机游走模型,即:设数轴上一个点,它的位置只能位于整点处,在时刻0=t 时,位于点)(+∈=N i i x ,下一个时刻,它将以概率α或者β(1),1,0(=+∈βαα)向左或者向右平移一个单位. 若记状态i t X =表示:在时刻t 该点位于位置)(+∈=N i i x ,那么由全概率公式可得:)|()()|()()(1111111+==++=-==+-==+⋅+⋅=i t i t i t i t i t i t i t X X P X P X X P X P X P另一方面,由于αβ==+==+-==+)|(,)|(1111i t i t i t i t X X P X X P ,代入上式可得:11-+⋅+⋅=i i i P P P βα.进一步,我们假设在0=x 与),0(+∈>=N m m m x 处各有一个吸收壁,当点到达吸收壁时被吸收,不再游走.于是,1,00==m P P .随机游走模型是一个典型的马尔科夫过程.进一步,若点在某个位置后有三种情况:向左平移一个单位,其概率为a ,原地不动,其概率为b ,向右平移一个单位,其概率为c ,那么根据全概率公式可得:11+-++=i i i i cP bP aP P2023·新高考Ⅰ卷T211.乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投籃,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5.(1)求第2次投篮的人是乙的概率;(2)求第i 次投篮的人是甲的概率;(3)已知:若随机变量i X 服从两点分布,且()()110,1,2,,i i i P X P X q i n ==-===⋅⋅⋅,则11n ni i i i E X q ==⎛⎫= ⎪⎝⎭∑∑.记前n 次(即从第1次到第n 次投篮)中甲投篮的次数为Y ,求()E Y .2019·全国Ⅰ卷2.为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1-分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1-分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X .(1)求X 的分布列.(2)若甲药、乙药在试验开始时都赋予4分,)0,1,2,,8(i p i =⋅⋅⋅表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11()127i i i i p ap bp cp i ==++⋯-+,,,,其中)1(a P X ==-,(0)b P X == (1)c P X ==. 假设0.5α=,0.8β=.①证明:1)0{,1,2,,}7(i i p p i -=⋅⋅⋅+为等比数列;②求4p ,并根据4p 的值解释这种试验方案的合理性.课本原题:人教A 版数学《选择性必修三》P913.甲、乙、丙三人相互做传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人.求n 次传球后球在甲手中的概率.1.(2024届·武汉高三开学考)有编号为1,2,3,...,18,19,20的20个箱子,第一个箱子有2个黄球重点题型·归类精讲1个绿球,其余箱子均为2个黄球2个绿球,现从第一个箱子中取出一个球放入第二个箱子,再从第二个箱子中取出一个球放入第三个箱子,以此类推,最后从第19个箱子取出一个球放入第20个箱子,记i p 为从第i 个箱子中取出黄球的概率.(1)求23,p p ;(2)求20p .3.从甲、乙、丙等5人中随机地抽取三个人去做传球训练.训练规则是确定一人第一次将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人,每次必须将球传出.(1)记甲乙丙三人中被抽到的人数为随机变量X ,求X 的分布列;(2)若刚好抽到甲乙丙三个人相互做传球训练,且第1次由甲将球传出,记n 次传球后球在甲手中的概率为,1,2,3,n p n =,①直接写出123p p p ,,的值;②求1n p +与n p 的关系式*()n N ∈,并求n p *()n N ∈.2023届惠州一模4.为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐. 已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复.(1)求该同学第二天中午选择米饭套餐的概率(2)记该同学第n天选择米饭套餐的概率为n P(Ⅰ)证明:25nP⎧⎫-⎨⎬⎩⎭为等比数列;(Ⅱ)证明:当2n≥时,512nP≤.2023届佛山二模·165.有n 个编号分别为1,2,3,,n ⋅⋅⋅的盒子,第1个盒子中有2个白球1个黑球,其余盒子均为1个白球1个黑球,现从第1个盒中任取一球放入第2个盒子,再从第2个盒子中任取一球放入第3个盒子,以此类推,则从第2个盒子中取到白球的概率是 ,从第n 个盒子中取到白球的概率是 .2023·唐山调研6.甲、乙、丙三人玩传球游戏,第1次由甲传出,每次传球时,传球者都等可能地将球传给另外两人中的任何一人.设第k 次传球后球在甲手中的概率为*N k p k ∈,,则下列结论正确的有( )A. 10p =B. 213p = C. 121k k p p ++= D. 202313p >2024届武汉高三九月调研T167.甲,乙,丙三人进行传球游戏,每次投掷一枚质地均匀的正方体骰子决定传球的方式:当球在甲手中时,若骰子点数大于3,则甲将球传给乙,若点数不大于3,则甲将球保留;当球在乙手中时,若骰子点数大于4,则乙将球传给甲,若点数不大于4,则乙将球传给丙;当球在丙手中时,若骰子点数大于3,则丙将球传给甲,若骰子点数不大于3,则丙将球传给乙.初始时,球在甲手中,投掷n 次骰子后(),记球在甲手中的概率为,则 ; .2024届·湖北荆荆恩高三9月起点联考·218.甲、乙两个盒子中都装有大小、形状、质地相同的2个黑球和1个白球,现从甲、乙两个盒子中各任取一个球交换放入另一个盒子中,重复次这样的操作后,记甲盒子中黑球的个数为,甲盒中恰有2个黑球的概率为,恰有3个黑球的概率为.(1)求;(2)设,证明:;(3)求的数学期望的值.*n ∈N n p 3p =n p =()*n n ∈N n X n p n q 11,p q 2n n n c p q =+11233n n c c +=+n X ()n E X2023·济南开学考10.甲、乙两人进行抛掷骰子游戏,两人轮流地掷一枚质均匀的骰子.规定:先掷出点数6的获胜,游戏结束.(1)记两人抛掷骰子的总次数为X,若每人最多抛掷两次骰子,求比赛结束时,X的分布列和期望;(2)已知甲先掷,求甲恰好抛掷n 次骰子并获得胜利的概率.2023届·杭州二模11.马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习、自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…,2t X -,1t X -,t X ,1t X +,…,那么1t X +时刻的状态的条件概率仅依赖前一状态t X ,即()()t 1t 2t 1t t 1t ,,,X X X X X X P P +--+=∣∣. 现实生活中也存在着许多马尔科夫链,例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为50%,且每局赌赢可以赢得1元,每一局赌徒赌输的概率为50%,且赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B 元,赌徒停止赌博.记赌徒的本金为*(,)A A N A B ∈<元,赌博过程为如图所示的数轴.当赌徒手中有n 元()0,n B n N ≤≤∈时,最终输光的概率为()P n ,请回答下列问题:(1)请直接写出()0P 与()P B 的数值;(2)证明(){}P n 是一个等差数列,并写出公差d ;(3)当100A =时,分别计算200B =,1000B =时,()P A 的数值,并结合实际,解释当B →+∞时,()P A 的统计含义.12.校足球队中的甲、乙、丙、丁四名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能的将球传给另外三个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到。
马尔科夫链是一种随机过程,具有“马尔科夫性质”,即未来状态的概率仅仅取决于当前状态,而与过去状态无关。
转移概率是指从一个状态转移到另一个状态的概率。
下面是一个简单的马尔科夫链的例子,包含一些状态和它们之间的转移概率。
假设有三个天气状态:晴天(Sunny)、多云(Cloudy)和雨天(Rainy)。
状态之间的转移概率如下:
- 如果今天是晴天,明天是晴天的概率为0.7,多云的概率为0.2,雨天的概率为0.1。
- 如果今天是多云,明天是晴天的概率为0.3,多云的概率为0.4,雨天的概率为0.3。
- 如果今天是雨天,明天是晴天的概率为0.2,多云的概率为0.3,雨天的概率为0.5。
这些转移概率可以用矩阵表示,该矩阵称为转移矩阵。
假设状态按照晴天(S)、多云(C)、雨天(R)的顺序排列,则转移矩阵如下:
```
P = | 0.7 0.2 0.1 |
| 0.3 0.4 0.3 |
| 0.2 0.3 0.5 |
```
其中,P(i, j) 表示从状态i 转移到状态j 的概率。
如果当前是晴天,我们可以使用转移矩阵来计算明天各种天气的概率。
假设今天是晴天(S),我们想知道明天是晴天(S)、多云(C)或雨天(R)的概率,可以将转移矩阵与当前状态向量相乘:
```
State vector today: | 1 |
| 0 |
| 0 |
State vector tomorrow = P * State vector today
```
计算结果将给出明天各种天气的概率。
这个过程可以一直迭代下去,得到未来时间点的状态概率。