马尔科夫链例题整理
- 格式:ppt
- 大小:1.26 MB
- 文档页数:61
马尔可夫链例题讲解
马尔可夫链是一个数学模型,用于描述一系列状态之间的随机转移。
每个状态的未来只取决于其当前状态,而与过去的状态无关。
以下是一个马尔可夫链的简单例题及其讲解:
例题:求销售状态的转移概率矩阵
题目描述:记录了某抗病毒药的6年24个季度的销售情况,得到表1。
试求其销售状态的转移概率矩阵。
表1 某抗病毒药24个季度的销售情况
季度销售状态
Q1 畅销
Q2 畅销
Q3 畅销
... ...
Q24 畅销
分析表中的数据,其中有15个季度畅销,9个季度滞销,连续出现畅销和
由畅销转入滞销以及由滞销转入畅销的次数均为7,连续滞销的次数为2。
由此,可得到下面的市场状态转移情况表(表2)。
表2 市场状态转移情况表
下季度药品所处的市场状态 1(畅销) 2(滞销)本季度药品所处的市
场状态
1(畅销) 7 7 1(畅销)
2(滞销) 7 2 2(滞销)
现计算转移概率:以频率代替概率,可得连续畅销的概率:P(连续畅销) =
7/15。
同样得由畅销转入滞销的概率:P(畅销→滞销) = 7/15。
滞销转入畅销的概率:P(滞销→畅销) = 7/15。
连续滞销的概率:P(连续滞销) = 2/15。
综上,得销售状态转移概率矩阵为:P=(P(连续畅销) P(畅销→滞销) P(滞销→畅销) P(连续滞销))=(7/15 7/15 7/15 2/15)。
从上面的计算过程知,所求转移概率矩阵P的元素其实可以直接通过表2中的数字计算而得到,即将表中数分母中的数为15减1是因为第24季度是
畅销,无后续记录,需减1。
马尔科夫链(与数列结合的概率递推问题)如果要评选出 2023 年各地模拟题中最“成功”的题目,我想非“马尔科夫链”莫属了,尽管2023 年新高考I 卷出乎了很多“命题专家”的意料,但第 21 题考察了马尔科夫链,可谓为广大“专家”“名卷”“押题卷”挽回了一些颜面。
2023年新高考I 卷第21题的投篮问题是马尔可夫链;再往前的热点模考卷中,2023年杭州二模第21题的赌徒输光问题是马尔可夫链,2023年茂名二模的摸球问题是马尔可夫链;再往更前的2019年全国I 卷药物试验也是马尔可夫链,在新人教A 版选择性必修三 P91 页 拓展探索中的第10题是传球问题,是马尔科夫链的典型模型,可以看出自从新教材引入全概率公式(新人教A 版选择性必修三 P49 页),可想而知,未来会有越来越多的递推型概率难题出现模考试题中!因此,在复习备考中全概率等系列内容需要格外关注马尔科夫链作为一种命题模型出现了,马尔科夫链在题中的体现可以简单的概括为全概率公式+数列递推,对于高中生而言,马尔科夫链其实也不难理解。
本文主要介绍了马尔科夫链和一维随机游走模型在高考中的几种具体的应用情形,希望对各位接下来的复习和备考有一些帮助。
基本原理虽然贝叶斯公式不做要求,但是全概率公式已经是新高考考查内容了,利用全概率公式,我们既可以构造某些递推关系求解概率,还可以推导经典的一维随机游走模型,即:设数轴上一个点,它的位置只能位于整点处,在时刻0=t 时,位于点)(+∈=N i i x ,下一个时刻,它将以概率α或者β(1),1,0(=+∈βαα)向左或者向右平移一个单位. 若记状态i t X =表示:在时刻t 该点位于位置)(+∈=N i i x ,那么由全概率公式可得:)|()()|()()(1111111+==++=−==+−==+⋅+⋅=i t i t i t i t i t i t i t X X P X P X X P X P X P另一方面,由于αβ==+==+−==+)|(,)|(1111i t i t i t i t X X P X X P ,代入上式可得:11−+⋅+⋅=i i i P P P βα.进一步,我们假设在0=x 与),0(+∈>=N m m m x 处各有一个吸收壁,当点到达吸收壁时被吸收,不再游走.于是,1,00==m P P .随机游走模型是一个典型的马尔科夫过程.进一步,若点在某个位置后有三种情况:向左平移一个单位,其概率为a ,原地不动,其概率为b ,向右平移一个单位,其概率为c ,那么根据全概率公式可得:11+−++=i i i i cP bP aP P2023·新高考Ⅰ卷T211.乙两人投篮,每次由其中一人投篮,规则如下:若命中则此人继续投籃,若末命中则换为对方投篮.无论之前投篮情况如何,甲每次投篮的命中率均为0.6,乙每次投篮的命中率均为0.8.由抽签确定第1次投篮的人选,第1次投篮的人是甲、乙的概率各为0.5. (1)求第2次投篮的人是乙的概率; (2)求第i 次投篮的人是甲的概率; (3)已知:若随机变量i X 服从两点分布,且()()110,1,2,,i i i P X P X q i n ==−===⋅⋅⋅,则11n ni i i i E X q == = ∑∑.记前n 次(即从第1次到第n 次投篮)中甲投篮的次数为Y ,求()E Y . 【解析】(1)记“第i 次投篮的人是甲”为事件i A ,“第i 次投篮的人是乙”为事件i B ,所以,()()()()()()()21212121121||P B P A B P B B P A P B A P B P B B =+=+()0.510.60.50.80.6×−+×.(2)设()i i P A p =,依题可知,()1i i P B p =−,则()()()()()()()11111||i i i i i i i i i i i P A P A A P B A P A P A A P B P A B +++++=+=+,即()()10.610.810.40.2i i i i p p p p +=+−×−=+, 构造等比数列{}i p λ+,设()125i i p p λλ++=+,解得13λ=−,则1121353i i p p + −=−,又11111,236p p =−=,所以13i p−是首项为16,公比为25的等比数列,即11112121,365653i i i i p p −−−=×=×+. (3)因为1121653i i p − =×+,1,2,,i n =⋅⋅⋅, 所以当*N n ∈时,()122115251263185315nnn n n E Y p p p − =+++=×+=−+ − ,故52()11853nnE Y=−+.2019·全国Ⅰ卷2.为治疗某种疾病,研制了甲、乙两种新药,希望知道哪种新药更有效,为此进行动物试验.试验方案如下:每一轮选取两只白鼠对药效进行对比试验.对于两只白鼠,随机选一只施以甲药,另一只施以乙药.一轮的治疗结果得出后,再安排下一轮试验.当其中一种药治愈的白鼠比另一种药治愈的白鼠多4只时,就停止试验,并认为治愈只数多的药更有效.为了方便描述问题,约定:对于每轮试验,若施以甲药的白鼠治愈且施以乙药的白鼠未治愈则甲药得1分,乙药得1−分;若施以乙药的白鼠治愈且施以甲药的白鼠未治愈则乙药得1分,甲药得1−分;若都治愈或都未治愈则两种药均得0分.甲、乙两种药的治愈率分别记为α和β,一轮试验中甲药的得分记为X . (1)求X 的分布列.(2)若甲药、乙药在试验开始时都赋予4分,)0,1,2,,8(i p i =⋅⋅⋅表示“甲药的累计得分为i 时,最终认为甲药比乙药更有效”的概率,则00p =,81p =,11()127i i i i p ap bp cp i ==++…-+,,,,其中)1(a P X ==-,(0)b P X == (1)c PX ==. 假设0.5α=,0.8β=. ①证明:1)0{,1,2,,}7(i i p p i−=⋅⋅⋅+为等比数列; ②求4p ,并根据4p 的值解释这种试验方案的合理性. 【解析】(1)X 的所有可能取值为-1,0,1.11()()P X αβ=−−=,()()()011P X αβαβ=+−−=,()1(1)P X αβ=−=, 所以X 的分布列为X -11P(1)αβ− )1((1)αβαβ+−− ()1αβ−(2)①证明 由(1)得0.4a =,0.5b =,0.1c =.因此110.40.50.1i i i i p p p p −+=++,故()()110.10.4i i i i p p p p −=−+-,则()114i i i i p p p p −=−+-.又因为1010p p p −≠=,所以1)0{,1,2,,}7(i i p p i−=⋅⋅⋅+为公比为4,首项为1p 的等比数列. ② 由①得()()()88877610087761001413p p p p p p p p p p p p p p p p −=−+−+…+−+=−+−+…+−+=⋅. 由于81p =,故18341p =−, 所以()()()()444332*********3257p p p p p p p p p p p −=−+−+−+−+==. 4p 表示最终认为甲药更有效的概率.由计算结果可以看出,在甲药治愈率为0.5,乙药治愈率为0.8时,认为甲药更有效的概率为410.0039257p =≈,此时得出错误结论的概率非常小,说明这种试验方案合理.课本原题:人教A 版数学《选择性必修三》P913.甲、乙、丙三人相互做传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人.求n 次传球后球在甲手中的概率. 【解析】记第n 次传球后球在甲手中的概率为n P ,则第1n −次传球后球在甲手中的概率为1n P −, 开始时球在甲手中,则01P =.若第n 次传球后球在甲手中,则第1n −次传球后球不在甲手中,即第1n −次传球后球在乙或丙手中, 所以第1n −次传球后球不在甲手中的概率为11n P −−,又乙或丙在第n 次把球传到甲手上的概率为12, 于是有()1112n n P P −−=,即1111323n n P P − −=−− ,1n ≥, 于是数列13n P−是首项为0213P −=,公比为12−得等比数列, 所以121332nn P −=×−,所以()*211323nn P n =×−+∈ N .1.(2024届·武汉高三开学考)有编号为1,2,3,...,18,19,20的20个箱子,第一个箱子有2个黄球1个绿球,其余箱子均为2个黄球2个绿球,现从第一个箱子中取出一个球放入第二个箱子,再从第二个箱子中取出一个球放入第三个箱子,以此类推,最后从第19个箱子取出一个球放入第20个箱子,记i p 为从第i 个箱子中取出黄球的概率. (1)求23,p p ; (2)求20p . 【答案】(1)2815P =,33875P =;(2)201911652P =+⋅【分析】(1)分第一次取出黄球和绿球两种情况,再由互斥事件概率加法公式计算可得答案; (2)由题意可得()132155+=+−i i i P P P ,可得答案. 【详解】(1)从第二个箱子取出黄球的概率223128353515P =⋅+⋅=, 从第三个箱子取出黄球的概率3838238115515575P =⋅+−⋅= ; (2)由题意可知,()1321215555i i i i P P P P +=+−=+, 即1111252i i P P + −=− ,又123P = 1111111111,,,26265652i i i i P P P −− −=∴−=⋅∴=+ ⋅ 201911652P ∴=+⋅.重点题型·归类精讲【答案】(1)1942,1311776n n P −=−−(2)第二次,证明见解析【分析】(1)根据全概率公式即可求解2P ,利用抽奖规则,结合全概率公式即可由等比数列的定义求解, (2)根据1311776n n P −=−−,即可对n 分奇偶性求解.【详解】(1)记该顾客第()*N i i ∈次摸球抽中奖品为事件A ,依题意,127P =, ()()()()()22121121212119||1737242P P A P A P A A P A P A A ==+=×+−×= . 因为()11|3n n P A A −=,()11|2n n P A A −=,()n n P P A =,所以()()()()()1111||n n n n n n n P A P A P A A P A P A A −−−−=+,所以()111111113262n n n n P P P P −−−=+−=−+, 所以1313767n n P P − −=−−, 又因为127P =,则131077P −=−≠, 所以数列37n P−是首项为17−,公比为16−的等比数列,故1311776n n P −=−−.(2)证明:当n 为奇数时,1131976742n n P −<<⋅,当n 为偶数时,131776n n P −=+⋅,则n P 随着n 的增大而减小, 所以,21942n P P ≤=,综上,该顾客第二次摸球抽中奖品的概率最大.3.从甲、乙、丙等5人中随机地抽取三个人去做传球训练.训练规则是确定一人第一次将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人,每次必须将球传出. (1)记甲乙丙三人中被抽到的人数为随机变量X ,求X 的分布列;(2)若刚好抽到甲乙丙三个人相互做传球训练,且第1次由甲将球传出,记n 次传球后球在甲手中的概率为,1,2,3,n p n = ,①直接写出123p p p ,,的值;②求1n p +与n p 的关系式*()n N ∈,并求n p *()n N ∈. 【答案】(1)分布列见解析(2)①10p =,212p =,314p =;②111,1,2,322n n p p n +=−+=;11(1)132n n − −+ 【分析】(1)由离散型随机变量的分布列可解;(2)记n A 表示事件“经过n 次传球后,球在甲手中”,由全概率公式可求111,22n n p p +=−+再由数列知识,由递推公式求得通项公式.【详解】(1)X 可能取值为1,2,3,()1232353110C C p X C ===;()213235325C C p X C ===;()3032351310C C p X C === 所以随机变量X 的分布列为(2)若刚好抽到甲乙丙三个人相互做传球训练,且n 次传球后球在甲手中的概率为,1,2,3,n p n = , 则有10,p =2221,22p ==3321,24p == 记n A 表示事件“经过n 次传球后,球在甲手中”,111n n n n n A A A A A +++=⋅+⋅所以()()()11111n n n n n n n n n p P A A A A P A A P A A +++++=⋅+⋅=⋅+⋅ ()()()()()()111110122n n nn n n n n n P A P A A P A P A A p p p ++=⋅+⋅=−⋅+⋅=−∣∣ 即111,1,2,322n n p p n +=−+=, 所以1111323n n p p + −=−− ,且11133p −=− 所以数列13n p− 表示以13−为首项,12−为公比的等比数列,所以1111332n n p −−=−×−所以1111111132332n n n p −−=−×−+=−−即n 次传球后球在甲手中的概率是11(1)132n n −−+.2023届惠州一模4.为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐. 已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复. (1)求该同学第二天中午选择米饭套餐的概率 (2)记该同学第n 天选择米饭套餐的概率为n P(Ⅰ)证明:25n P −为等比数列;(Ⅱ)证明:当2n ≥时,512n P ≤. 【解析】(1)设1A =“第1天选择米饭套餐”,2A =“第2天选择米饭套餐”,则1A =“第1天不选择米饭套餐”,于是,()123P A =,()113P A =,()2114|P A A =,()2111122|P A A =−=, 由全概率公式()()()()()21211212111134323||P A P A P A A P A P A A =+=×+×=;(2)(Ⅰ)设n A =“第n 天选择米饭套餐”,则()n n P P A =,()1n n P A P =−,()14|1n n P A A +=,()11|1122n n P A A +=−=, ()()()()()()111111111424|2|n n n n n n n n n n n P P A P A P A A P A P A P P P A ++++==+=+−=−+, 所以1212545n n P P + −=−− ,25n P − 是以124515P −=为首项,14−为公比的等比数列。
离散时间马氏链例题离散时间马氏链(离散时间马尔科夫链)是一种随机过程,其中每个状态的未来转变仅依赖于其当前状态,而不依赖于过去的状态或转变。
以下是离散时间马氏链的一个简单例题:天气预报问题假设明天的天气仅与今天的天气有关,而与过去的天气无关。
如果今天下雨,那么明天下雨的概率为0.7;如果今天不下雨,那么明天下雨的概率为0.4。
我们要求出今天下雨并且四天后仍然下雨的概率(假设α=0.7,β=0.4)。
解:定义状态:我们可以定义两个状态,状态0表示不下雨,状态1表示下雨。
建立转移概率矩阵:根据题目描述,我们可以得到以下的转移概率矩阵P:P = [0.6 0.4; 0.3 0.7]其中,P(i, j)表示从状态i转移到状态j的概率。
3. 应用马氏链的性质:我们知道马氏链的性质是未来的状态只与当前状态有关,与过去的状态无关。
因此,我们可以使用转移概率矩阵来计算四天后仍然下雨的概率。
我们从今天下雨(状态1)开始,想要知道四天后仍然下雨的概率。
我们可以通过连续应用转移概率矩阵来计算这个概率:今天下雨并且四天后仍然下雨的概率= P(1, 1)^4但是这是错误的,因为我们不能直接取四次方。
正确的做法是,考虑所有可能的路径,即在这四天中,天气可能如何变化。
例如,它可能一直保持下雨,或者可能在中间某天下雨然后再次下雨等等。
我们需要考虑所有这些可能性。
但是,对于较大的n值,直接计算所有路径是不切实际的。
我们可以使用一种称为“稳态概率”的概念来简化计算。
稳态概率是指,当时间趋于无穷大时,马氏链处于某个特定状态的概率。
在这个例子中,我们可以计算出稳态概率,然后用它来估计四天后下雨的概率。
然而在这个特定的例子中,由于转移概率矩阵不是对称的,因此没有简单的公式可以直接计算出n步转移概率。
我们需要使用矩阵的n次幂来计算这个概率。
但是注意,我们不能简单地取P(1,1)的四次幂,因为那将假设每天都独立地下雨,而实际上每天的天气都依赖于前一天的天气。
连续时间马尔可夫链例题假设有一个连续时间马尔可夫链,描述一个人的健康状态。
该马尔可夫链包含三个状态:健康、生病和康复。
人的健康状态可以根据以下转移概率进行模拟:1. 在任何时间点,一个健康的人以0.1的速率生病。
2. 在任何时间点,一个生病的人以0.2的速率康复。
3. 在任何时间点,一个康复的人以0.05的速率重新生病。
现在假设一个人的初始状态是健康,我们可以使用连续时间马尔可夫链模型来模拟他的健康状态随时间的变化。
假设每个时间单位是一周,我们希望模拟他一年内的健康状态。
根据上面的转移概率,我们可以得到如下的转移矩阵:```| 健康 | 生病 | 康复 |----------------------------健康 | 0.9 | 0.1 | 0 |生病 | 0.05 | 0.75 | 0.2 |康复 | 0 | 0.05 | 0.95|```该矩阵中的每个元素表示从当前状态转移到下一个状态的概率。
例如,一个健康的人在一周后仍然健康的概率为0.9,在一周后生病的概率为0.1,在一周后康复的概率为0。
使用该转移矩阵,我们可以模拟一个人一年内的健康状态。
假设每个时间单位是一周,则一年共有52个时间单位。
我们可以使用随机数生成器来生成每个时间单位的状态。
假设生成的随机数在[0,1)之间,我们可以根据转移概率进行状态转移。
例如,如果生成的随机数小于0.9,则人在下一个时间单位仍然健康;如果生成的随机数介于0.9和0.95之间,则人在下一个时间单位康复;如果生成的随机数大于等于0.95,则人在下一个时间单位重新生病。
使用这种方法,我们可以模拟一个人一年的健康状态,并观察他在这段时间内的状态变化。
这可以帮助我们更好地了解和预测一个人的健康动向。
1.假设某地有1600户居民,某产品只有甲乙丙三家厂家在该地销售,经调查,8月份购买甲乙丙三层的户数分别为480,320,800. 9月份里,原买甲的有48户转买乙产品,有96户转买丙产品。
原买乙的有32户转买甲产品,有64户转买丙产品,原买丙的有64户转买甲产品,有32户转买乙产品。
用状态1,2,3分别表示甲乙丙三厂。
试求:
<!--[if !supportLists]-->a)<!--[endif]-->一步转移概率矩阵。
<!--[if !supportLists]-->b)<!--[endif]-->10月份市场占有率的分布。
<!--[if !supportLists]-->c)<!--[endif]-->稳定状态下的市场占有率的分布。
若甲厂考虑采用不同的策略来增加市场占有率,策略I为通过广告宣传等策略占领其他厂家的市场,则在原来的基础上改变为:原买乙的有45户转买甲产品,原买丙的有80户转买丙产品。
策略II为采用提高服务质量以挽留顾客减少顾客外流,则原买甲的减少为有40户转买乙产品,有50户转买丙产品。
采用这两种策略的成本分别为15万,和8万元。
请问甲厂为了在长期经营中获取最大利润,应采取哪种策略?假定策略一经采取就不再改变。
截止日期2014年12月17日下午11时59分00秒。
马尔可夫链的模型解概率题马尔可夫链是一种随机过程,它描述了一系列可能的状态,以及在每个状态之间转移的概率。
这种模型特别适用于那些下一个状态只依赖于当前状态的情况。
假设我们有一个天气模型,其中只有两种状态:晴天(S)和雨天(R)。
我们观察到,如果今天是晴天,那么明天还是晴天的概率是0.9,变成雨天的概率是0.1。
如果今天是雨天,那么明天还是雨天的概率是0.8,变成晴天的概率是0.2。
我们可以使用马尔可夫链来描述这个模型。
首先,我们需要一个状态转移矩阵,它描述了从一个状态转移到另一个状态的概率。
在这个例子中,状态转移矩阵可以写成:= [0.9 0.10.2 0.8],第一行表示如果今天是晴天,那么明天还是晴天的概率是0.9,变成雨天的概率是0.1。
第二行表示如果今天是雨天,那么明天变成晴天的概率是0.2,还是雨天的概率是0.8。
现在,假设我们想知道,如果今天是晴天,那么接下来三天都是晴天的概率是多少。
我们可以使用马尔可夫链的模型来解决这个问题。
首先,我们知道今天是晴天的概率是1,雨天的概率是0。
我们可以把这个概率分布表示为一个向量:接下来,我们可以使用这个向量和状态转移矩阵来计算明天是晴天的概率。
根据马尔可夫链的性质,我们可以通过乘以状态转移矩阵来得到下一个状态的概率分布:1 = π_0 * P = [1 0] * [0.9 0.10.2 0.8] = [0.9 0.1],是雨天的概率是0.1。
接下来,我们可以使用同样的方法来计算接下来两天的天气概率分布:0.1] * [0.9 0.10.2 0.8] = [0.83 0.17]今天是晴天,那么接下来两天都是晴天的概率是0.83,有一天是雨天的概率是0.17。
最后,我们可以计算接下来三天都是晴天的概率:_3 = π_2 * [1 0] = [0.83 0.17] * [1 0] = 0.83错误,我们不能直接这样计算。
实际上,我们应该再次使用状态转移矩阵:= π_2 * P = [0.83 0.17] * [0.9 0.10.2 0.8] = [0.767 0.233],即0.767。
概率与数列(含马尔可夫链问题)一、基本技能练1(2023·华师大附中压轴卷)长江十年禁渔计划全面施行,渔民老张积极配合政府工作,如期收到政府的补偿款.他决定拿出其中10万元进行投资,并看中了两种为期60天(视作2个月)的稳健型(不会亏损)理财方案.方案一:年化率2.4%,且有10%的可能只收回本金;方案二:年化率3.0%,且有20%的可能只收回本金;已知老张对每期的投资本金固定(都为10万元),且第一次投资时选择了方案一,在每期结束后,老张不间断地进行下一期投资,并且他有40%的可能选择另一种理财方案进行投资.(1)设第i次投资(i=1,2,3,⋯,n)选择方案一的概率为P i,求P4;(2)求一年后老张可获得总利润的期望(精确到1元).注:若拿1千元进行5个月年化率为2.4%的投资,则该次投资获利ω=2.4%×512×1000=10元.2(2023·杭州一模)中国男篮历史上曾12次参加亚运会,其中8次夺得金牌,是亚运会夺冠次数最多的球队.第19届亚运会将于2023年9月23日至10月8日在杭州举办.(1)为了解喜爱篮球运动是否与性别有关,某学校随机抽取了男生和女生各100名进行调查,得到2×2列联表如下:喜爱篮球不喜爱篮球合计男生6535100女生2575100合计90110200依据小概率值α=0.001的独立性检验,能否认为喜爱篮球运动与性别有关?(2)校篮球队中的甲、乙、丙三名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到,记开始传球的人为第1次触球者,第n次触球者是甲的概率记为P n,即P1=1.①求P3,P4,并证明:P n-1 3为等比数列;②比较第15次触球者是甲与第15次触球者是乙的概率的大小.参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.参考数据:α=P(χ2≥k)0.100.050.010.0050.001 k 2.706 3.841 6.6357.87910.8283(2023·惠州一模)为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐.已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复.(1)求该同学第二天中午选择米饭套餐的概率;(2)记该同学第n天选择米饭套餐的概率为P n.证明:①P n-2 5为等比数列;②当n≥2时,P n≤5 12.二、创新拓展练1(2023·荆州统测)为倡导公益环保理念,培养学生社会实践能力,某中学开展了旧物义卖活动,所得善款将用于捐赠“圆梦困境学生”计划.活动共计50多个班级参与,1000余件物品待出售.摄影社从中选取了20件物品,用于拍照宣传,这些物品中,最引人注目的当属优秀毕业生们的笔记本,已知高三1,2,3班分别有12,13,14的同学有购买意向.假设三个班的人数比例为6∶7∶8.(1)现从三个班中随机抽取一位同学:①求该同学有购买意向的概率;②如果该同学有购买意向,求此人来自2班的概率;(2)对于优秀毕业生的笔记本,设计了一种有趣的“掷骰子叫价确定购买资格”的竞买方式:统一以0元为初始叫价,通过掷骰子确定新叫价,若点数大于2,则在已叫价格基础上增加1元更新叫价,若点数小于3,则在已叫价格基础上增加2元更新叫价;重复上述过程,能叫到10元,即获得以10元为价格的购买资格,未出现叫价为10元的情况则失去购买资格,并结束叫价.若甲同学已抢先选中了其中一本笔记本,试估计其获得该笔记本购买资格的概率(精确到0.01).概率与数列(含马尔可夫链问题)一、基本技能练1(2023·华师大附中压轴卷)长江十年禁渔计划全面施行,渔民老张积极配合政府工作,如期收到政府的补偿款.他决定拿出其中10万元进行投资,并看中了两种为期60天(视作2个月)的稳健型(不会亏损)理财方案.方案一:年化率2.4%,且有10%的可能只收回本金;方案二:年化率3.0%,且有20%的可能只收回本金;已知老张对每期的投资本金固定(都为10万元),且第一次投资时选择了方案一,在每期结束后,老张不间断地进行下一期投资,并且他有40%的可能选择另一种理财方案进行投资.(1)设第i次投资(i=1,2,3,⋯,n)选择方案一的概率为P i,求P4;(2)求一年后老张可获得总利润的期望(精确到1元).注:若拿1千元进行5个月年化率为2.4%的投资,则该次投资获利ω=2.4%×512×1000=10元.【答案】解:(1)由题意知P i+1=(1-40%)P i+40%(1-P i)=25+15P i,整理得P i+1-12=15P i-12,其中P1=1,故数列P n-1 2是以P1-12为首项,15为公比的等比数列,则P n-12=12×15 n-1,即P n=12+12×15n-1,那么P4=63125.(2)当某期选择方案一时,获利期望值为W1=(1-10%)×2.4%×212×100000 =360元;当某期选择方案二时,获利期望值为W2=(1-20%)×3.0%×212×10000=400元;那么,在一年间,老张共投资了6次,获得的总利润的期望为W=[P1W1+(1-P1)W2]+[P2W1+(1-P2)W2]+⋯+[P6W1+(1-P6)W2]=(P1+P2+⋯+P6)W1+[(1 -P1)+(1-P2)+⋯+(1-P6)]W2≈2400-40×3+58=2255元.即一年后老张可获得的利润的期望约为2255元.2(2023·杭州一模)中国男篮历史上曾12次参加亚运会,其中8次夺得金牌,是亚运会夺冠次数最多的球队.第19届亚运会将于2023年9月23日至10月8日在杭州举办.(1)为了解喜爱篮球运动是否与性别有关,某学校随机抽取了男生和女生各100名进行调查,得到2×2列联表如下:喜爱篮球不喜爱篮球合计男生6535100女生2575100合计90110200依据小概率值α=0.001的独立性检验,能否认为喜爱篮球运动与性别有关?(2)校篮球队中的甲、乙、丙三名球员将进行传球训练,第1次由甲将球传出,每次传球时,传球者都等可能地将球传给另外两个人中的任何一人,如此不停地传下去,且假定每次传球都能被接到,记开始传球的人为第1次触球者,第n次触球者是甲的概率记为P n,即P1=1.①求P3,P4,并证明:P n-1 3为等比数列;②比较第15次触球者是甲与第15次触球者是乙的概率的大小.参考公式:χ2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d为样本容量.参考数据:α=P(χ2≥k)0.100.050.010.0050.001k 2.706 3.841 6.6357.87910.828【答案】解:(1)假设H0:喜爱足球运动与性别独立,即喜爱足球运动与性别无关,计算χ2=200×(65×75-25×35)2100×100×90×110≈32.323>10.828,根据小概率值α=0.001的独立性检验,我们推断H0不成立,即认为喜爱足球运动与性别有关,此推断犯错误的概率不超过0.001.(2)①由题意知,P1=1,P2=0,P3=12,P4=12×0+1-12×12=14.证明:第n次触球者是甲的概率记为P n,则当n≥2时,第n-1次触球者是甲的概率为P n-1,第n-1次触球者不是甲的概率为1-P n-1,则P n=P n-1×0+(1-P n-1)×12=12(1-P n-1),从而P n-13=-12P n-1-13,又P1-13=23,所以P n-1 3是以23为首项,公比为-12的等比数列.②第n 次触球者是甲的概率为P n =23×-12n -1+13,所以P 15=23×-1214+13=13×1213+13>13,第15次触球者是乙的概率为Q 15=12(1-P 15)=121-13×1213-13=13-13×1214<13,所以第15次触球者是甲的概率比第15次触球者是乙的概率大.3(2023·惠州一模)为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐.已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复.(1)求该同学第二天中午选择米饭套餐的概率;(2)记该同学第n 天选择米饭套餐的概率为P n .证明:①P n -25为等比数列;②当n ≥2时,P n ≤512.【答案】(1)解 设A 1=“第1天选择米饭套餐”,A 2=“第2天选择米饭套餐”,则A 1 =“第1天不选择米饭套餐”.根据题意P (A 1)=23,P (A 1)=13,P (A 2|A 1 )=14,P (A 2|A 1 )=1-12=12.由全概率公式,得P (A 2)=P (A 1)P (A 2|A 1)+P (A 1 )P (A 2|A 1 )=23×14+13×12=13.(2)证明 ①设A n =“第n 天选择米饭套餐”,则P n =P (A n ),P (A n)=1-P n ,根据题意P A n +1|A n )=14, P (A n +1|A n )=1-12=12.由全概率公式,得P n +1=P (A n +1)=P (A n )P (A n +1|A n )+P (A n )·P A n +1|A n )=14P n +12(1-P n )=-14P n +12.因此P n +1-25=-14P n -25.因为P 1-25=415≠0,所以P n -25 是以415为首项,-14为公比的等比数列.②由①可得P n =25+415-14n -1.当n 为大于1的奇数时,P n =25+41514 n -1≤25+415142=512.当n 为正偶数时,P n =25-41514n -1<25<512.因此当n ≥2时,P n ≤512.二、创新拓展练1(2023·荆州统测)为倡导公益环保理念,培养学生社会实践能力,某中学开展了旧物义卖活动,所得善款将用于捐赠“圆梦困境学生”计划.活动共计50多个班级参与,1000余件物品待出售.摄影社从中选取了20件物品,用于拍照宣传,这些物品中,最引人注目的当属优秀毕业生们的笔记本,已知高三1,2,3班分别有12,13,14的同学有购买意向.假设三个班的人数比例为6∶7∶8.(1)现从三个班中随机抽取一位同学:①求该同学有购买意向的概率;②如果该同学有购买意向,求此人来自2班的概率;(2)对于优秀毕业生的笔记本,设计了一种有趣的“掷骰子叫价确定购买资格”的竞买方式:统一以0元为初始叫价,通过掷骰子确定新叫价,若点数大于2,则在已叫价格基础上增加1元更新叫价,若点数小于3,则在已叫价格基础上增加2元更新叫价;重复上述过程,能叫到10元,即获得以10元为价格的购买资格,未出现叫价为10元的情况则失去购买资格,并结束叫价.若甲同学已抢先选中了其中一本笔记本,试估计其获得该笔记本购买资格的概率(精确到0.01).【答案】解:(1)①设事件A =“该同学有购买意向”,事件B i =“该同学来自i 班”(i =1,2,3).由题意可知P (B 1)=621,P (B 2)=721,P (B 3)=821,P (A |B 1)=12,P A |B 2)=13, P A |B 3)=14, 所以由全概率公式可得,P(A)=P(B1)·P(A|B1)+P(B2)·P(A|B2)+P(B3)·P(A|B3)=621×12+721×13+821×14=2263.②由条件概率可得P(B2|A)=P(B2A)P(A)=P(B2)·P(A|B2)P(A)=721×132263=722.(2)由题意可得每次叫价增加1元的概率为23,每次叫价增加2元的概率为1 3.设叫价为n(3≤n≤10)元的概率为P n,叫价出现n元的情况只有下列两种:①叫价为n-1元,且骰子点数大于2,其概率为23P n-1;②叫价为n-2元,且骰子点数小于3,其概率为13P n-2.于是得到P n=23P n-1+13P n-2(n≥3),易得P1=23,P2=23×23+13=79,由于P n-P n-1=-13P n-1+13P n-2=-13(P n-1-P n-2)(n≥3),于是当n≥2时,数列{P n-P n-1}是以首项为19,公比为-13的等比数列,故P n-P n-1=19×-13n-2(n≥2).于是P10=P1+(P2-P1)+(P3-P2)+⋯+(P9-P8)+(P10-P9)=23+19×1--1391--13=34+14×1310≈0.75,于是,甲同学能够获得笔记本购买资格的概率约为0.75.。
马尔可夫链专题马尔可夫链:)(),,,,(11211n n n n n x x P x x x x x P +-+=等式的意义:对于一个马尔可夫链来说,第n +1次的状态的结果,只跟上一次(也即第n 次)有关,与其他次无关。
马尔可夫链性质:无记忆性破题技巧:1.找到当下状态的“前一次”的所有可能情况;2.结合对应概率写出“前一次”所有可能中蕴含的数列递推关系;3.利用数列递推技巧求答案,例1.跳格游戏:如图,人从格外只能进入第1格,在格中每次可向前跳1格或2格,那么人从格外跳到第8格的方法种数为( C )A. 8种B. 13种C. 21种D. 34种【例2】质点在x 轴上从原点O 出发向右运动,每次平移一个单位或两个单位,且移动一个单位的概率为32,移动两个单位的概率为31,设质点运动到点)0,(n 的概率为n P . (1) 求1P 和2P ;(2) 求n P .【例3】为迅速抢占市场举行促销活动,销售公司现面向意向客户推出“玩游戏,赢大奖,送汽车模型”活动,客户可根据抛掷骰子向上的点数,遥控汽车模型在方格图上行进,若汽车模型最终停在“幸运之神”方格,则可获得购车优惠券2万元;若最终停在“赠送汽车模型”方格,则可获得汽车模型一个.方格图上标有第0格、第1格、第2格、……、第 20 格。
汽车模型开始在第0格,客户每掷一次骰子,汽车模型向前移动一次.若掷出 1,2,3,4点,汽车模型向前移动一格(从第k 格到第k +1格),若掷出5,6点,汽车模型向前移动两格(从第k 格到第k +2格),直到移到第 19 格(幸运之神)或第 20 格(赠送汽车模型)时游戏结束.设汽车模型移到第n (1≤n ≤19)格的概率为n P .则19P =_________.【例 4】【淮北高三二模T12】已知棋盘上标有第 0,1,2,.,100 站,棋子开始时位于第0站,棋手抛掷均匀硬币走跳棋游戏,若掷出正面,棋子向前跳一站:若掷出反面,棋子向前跳两站,直到跳到第 99 站(胜利大本营)或第 100 站(欢乐大本营)时,游戏结束.设棋子跳到第n 站的概率为n P . ( )A. 211=P B. 833=P C. )981(,212111≤≤+=-+n P P P n n n D. )211(32101100+=P赌徒问题(随机游走)例5:(2023·杭州市二模/湖南师大附中三模T21)马尔科夫链是概率统计中的一个重要模型,也是机器学习和人工智能的基石,在强化学习自然语言处理、金融领域、天气预测等方面都有着极其广泛的应用.其数学定义为:假设我们的序列状态是…X t-2, X t-1,X t, X t+1…,那么X t+1时刻的状态的条体概率仅依赖前一状态X t,即P(X t+1|… X t-2, X t-1,X t)=P(X t+1 |X t).现实生活中也存在着许多马尔科大链,例如著名的赌徒模型.假如一名赌徒进入赌场参与一个赌博游戏,每一局赌徒赌赢的概率为50%,每局赌赢可以赢得1元,每一局赌徒赌输的概率为50%,赌输就要输掉1元.赌徒会一直玩下去,直到遇到如下两种情况才会结束赌博游戏:一种是手中赌金为0元,即赌徒输光;一种是赌金达到预期的B元,赌徒停止赌博.记赌徒的本金为A(A∈N*,A<B),赌博过程如图的数轴所示.当赌徒手中有n元(0≤n≤B,n∈N)时,最终输光的概率为P(n),请回答下列问题:(1)请直接写出P(0)与P(B)的数值;(2)证明{ P(n)}是个等差数列,并写出公差d;(3)当A=100时,分别计算B=200,B=1000时,P(A)的数值,并结合实际,解释当B→+∞时,P(A)的统计含义.例6:(2023·惠州一模T22改编)为了避免就餐聚集和减少排队时间,某校开学后,食堂从开学第一天起,每餐只推出即点即取的米饭套餐和面食套餐(吐槽一下惠州学生命真苦啊……).已知某同学每天中午会在食堂提供的两种套餐中选择,已知他第一天选择米饭套餐的概率为23,而前一天选择了米饭套餐后一天继续选择米饭套餐的概率为14,前一天选择面食套餐后一天继续选择面食套餐的概率为12,如此往复.(1)求该同学第二天中午选择米饭套餐的概率;(2)记该同学第n 天选择米饭套餐的概率为P n ;(i)求P n 表达式;(ii)证明:当n ≥2时,P n ≤512;并结合实际,说明当n →+∞时, P n 的实际意义.传球问题中的马尔可夫模型例7:三人互相传球,由甲开始发球,并作为第一次传球,每人得球后传球给其他人的可能性均相等.经过5次传球后,球仍回到甲手中,则不同的传球方式共有( )A .6种B .8种C .10种D .16种(例7升级Plus 版本):甲乙丙丁4人传接球训练,球从甲脚下开始,等可能地随机传向其余3人中的1人,接球者接到球后,再等可能地随机传向另外3人中的1人,依此类推.假设所有传出的球都能接住.记第n 次传球之前,球在甲脚下的概率为P n (n ∈N ∗) ,易知P 1=1 ,P 2=0.(1)推导P n 的表达式;(2)设第n 次传球之前,球在乙脚下的概率为Q n ,比较Q n 与P n ( n ≥3 )的大小; 并结合实际,解释当n→+∞时, P n 与Q n 的统计含义;(3) 假设经历了6次传球后,球依旧在甲的脚下,请问共有多少种不同的传球路径?【例 8】【武汉九调 T16】甲,乙,丙三人进行传球游戏,每次投掷一枚质地均匀的正方体骰子决定传球的方式:当球在甲手中时,若骰子点数大于3,则甲将球传给乙,若点数不大于3,则甲将球保留;当球在乙手中时,若骰子点数大于4,则乙将球传给甲,若点数不大于4,则乙将球传给丙;当球在丙手中时,若骰子点数大于 3,则丙将球传给甲,若骰子点数不大于 3,则丙将球传给乙.初始时,球在甲手中,投掷n 次骰子后(*∈N n ),记球在甲手中的概率为n P ,则3P =_____________;n P =____________ .【例9】【茂名高三&郴州高三二模 T22】马尔可夫链是因俄国数学家安德烈·马尔可夫得名,其过程具备“无记忆”的性质,即第n +1次状态的概率分布只跟第n 次的状态有关,与第n -1,n -2,n -3,…次状态是“没有任何关系的”.现有甲、乙两个盒子,盒子中都有大小、形状、质地相同的2个红球和1个黑球.从两个盒子中各任取一个球交换,重复进行n (*∈N n )次操作后,记甲盒子中黑球个数为n X ,甲盒中恰有1个黑球的概率为n a ,恰有2个黑球的概率为n b 。
随机过程的马尔可夫链当然,请看以下的20道试题:1. 什么是马尔可夫链?- A. 一个随机过程- B. 一个确定过程- C. 一个线性过程- D. 一个非随机过程2. 马尔可夫链具有什么样的记忆特性?- A. 有限记忆- B. 无限记忆- C. 完全没有记忆- D. 部分记忆3. 马尔可夫链的状态空间是指什么?- 空格填空:__________4. 马尔可夫链状态的转移概率是指什么?- 空格填空:__________5. 马尔可夫链状态转移概率的性质是什么?- A. 非负性- B. 可加性- C. 归一性- D. 全部正确6. 马尔可夫链的平稳分布是指什么?- 空格填空:__________7. 马尔可夫链收敛到平稳分布的条件是什么?- A. 非周期性- B. 非简并性- C. 正常性- D. 所有选项都是8. 马尔可夫链的平稳分布可以通过什么方法求解?- 空格填空:__________9. 马尔可夫链的平稳分布与其初始分布之间的关系是什么?- A. 线性关系- B. 非线性关系- C. 比例关系- D. 无关系10. 马尔可夫链的遍历性质指的是什么?- 空格填空:__________11. 马尔可夫链的马尔可夫性质是指什么?- A. 状态的独立性- B. 未来状态只依赖于当前状态- C. 状态转移是确定的- D. 初始状态不影响最终状态12. 马尔可夫链的时间反转性质是指什么?- 空格填空:__________13. 马尔可夫链的条件转移概率公式是什么?- 空格填空:__________14. 马尔可夫链的转移概率矩阵具有什么性质?- A. 非负性- B. 可加性- C. 归一性- D. 所有选项都是15. 马尔可夫链的瞬时状态概率是指什么?- 空格填空:__________16. 马尔可夫链的延迟时间是指什么?- 空格填空:__________17. 马尔可夫链的重现时间是指什么?- 空格填空:__________18. 马尔可夫链的复发时间是指什么?- 空格填空:__________19. 马尔可夫链的周期性质是指什么?- A. 完全周期性- B. 非周期性- C. 部分周期性- D. 无关20. 马尔可夫链的平稳分布可以通过什么方法求解?- A. 特征向量法- B. 特征值法- C. 特征分布法- D. 特征过程法。