MCMC抽样-Metropolis算法

格式：pdf
大小：4.76 MB
文档页数：48

下载文档原格式

/ 48

MCMC算法

第7章MCMC算法本章将介绍的马氏链蒙特卡罗（MCMC）方法是用来生成近似服从f分布的随机变量X的样本，从而估计关于X的函数的期望。

7.1 Metropolis-Hastings 算法Metropolis-Hastings 算法是一种非常通用的构造马氏链的方法。

这个方法从t=0开始，取X(0)=x(0)，其中x(0)是从某个初始分布g中随机抽取的样本使得满足f(x(0))>0。

给定X(t)=x(t)，下面的算法用于产生X(t+1)。

(1)由某提案密度g(∙|x(0))产生一个候选值X∗.(2)计算Metropolis-Hastings比率R(x(t),X∗)，其中R(u,v)=f(v)g(u|v)f(u)g(u|v)(7.1) 注意R(x(t),X∗)总是有定义的，因为只有f(x(t))>0且g(x∗|x(t))>0时才有X∗=x∗。

(3)根据下式抽取X(t+1)：X(t+1)={X∗,以概率min{R(x(t),X∗),1},x(t),否则.(7.2)(4)增加t，返回第1步。

我们将第t步迭代称作产生X(t)=x(t)的过程。

通过Metropolis-Hastings算法构造得到的链满足马氏性，因为X(t+1)仅依赖于X(t)。

而是否是非周期不可约的则取决于提案分布的选取，需要自己去检验是否满足这些条件。

如果满足了，那么这样生成的链具有唯一的极限平稳分布。

7.1.1独立链假设选取Metropolis-Hastings算法的提案分布为某个固定的密度函数使得g(x∗|x(t))=g(x∗)。

此时Metropolis-Hastings比率为R(x(t),X∗)=f(X∗)g(x(t))（7.4）f(x(t))g(X∗)如果g(x)>0，则有f(x)>0，那么得到的马氏链就是非周期不可约的。

注：选择重要抽样包络的准则同样适用于选择提案密度。

提案密度g应与目标分布f近似，并在尾部包含f。

如何使用马尔可夫链蒙特卡洛进行贝叶斯网络推断(十)

马尔可夫链蒙特卡洛（Markov Chain Monte Carlo, MCMC）是一种用于进行贝叶斯网络推断的重要方法。

贝叶斯网络是一种表示变量之间依赖关系的概率图模型，它可以用于推断变量之间的关系，进行概率推理和预测。

而MCMC则是一种用来从复杂的概率分布中抽样的方法，它通过构建一个马尔可夫链，从而可以生成服从目标分布的样本。

本文将介绍如何使用MCMC进行贝叶斯网络推断。

首先，我们需要了解贝叶斯网络的基本概念。

贝叶斯网络由节点和边组成，节点表示随机变量，边表示节点之间的依赖关系。

每个节点都有一个条件概率分布，描述该节点在给定其父节点的取值情况下的条件概率。

通过这些条件概率分布，可以计算出给定一组证据时，其他节点的后验概率分布，从而进行推断。

在实际问题中，贝叶斯网络往往包含大量的节点和复杂的依赖关系，导致了概率分布的计算变得困难甚至不可行。

这时候，MCMC就可以发挥作用了。

MCMC通过构建一个马尔可夫链，从而可以生成服从目标概率分布的样本。

这就使得我们可以通过对样本的统计特征进行分析，来进行贝叶斯网络的推断。

MCMC的核心思想是通过一系列的状态转移来构建一个马尔可夫链，使得在经过足够长的时间后，链中的样本可以收敛到目标分布。

最常用的MCMC算法包括Metropolis-Hastings算法和Gibbs采样算法。

Metropolis-Hastings算法通过接受-拒绝的方式进行状态转移，而Gibbs采样算法则通过对每个变量进行条件抽样来进行状态转移。

这些算法可以在贝叶斯网络中得到广泛的应用，从而进行推断和预测。

在使用MCMC进行贝叶斯网络推断时，需要注意一些问题。

首先是收敛性的问题，MCMC算法只有在经过足够长的时间后才能收敛到目标分布，因此需要进行收敛诊断以保证收敛性。

其次是混合性的问题，即在马尔可夫链中进行状态转移需要足够的混合性，否则会导致样本的相关性增加，从而影响推断的准确性。

此外，还需要考虑如何选择合适的提议分布，以提高状态转移的效率。

MCMC方法研究

ｈｉｅｒ舡ｃｈｉｃａｌＢａｖｅｓｉａｎｎｌｏｄｅ．Ｔｈｅ矗ｒｓｔｓｅｃｔｉｏｎｎｌａｉｎｌｙｉｎｔｒｏｄｕｃｅｓｔｈｅｓｔ砒ｉｃｓｔａｔｅＭｏｎｔｅ
Ｃ盯ｌｏｍｅｔｈｏｄｓｍａｉｌｌｌｙｉｎｔｒｏｄｕｃｅｓｆｒｅｑｕｅｎｃｙＩＩｌｅｔｈｏｄｓａｎｄｅｘｐｅｃｔａｔｉｏＩｌｍｅｔｈｏｄｓａｌｓｏ
Ｃｈ咖，ｄｉｓｃｕｓｓａｎａｌｖｚｅｔｈｅｃｏＩｌｖｅｒｇｅｎｃｅｏｆｔｈｅＭａｒｋｏｖ
ｔｈｅｐｒｏｂｌｅｍｏｆａｓ８ｅｓｓｉｎｇｔｈｅ
ｅｒｒｏｒｏｆＭＣＭＣｍｅｔｈｏｄｓ。ＩｎｔｈｅｅｎｄｗｅｄｉｓｃｕｓｓｔｈｅａｐｐｌｉｃａｔｉｏｎｏｆＭＣＭＣｍｅｔｈｏｄｓｉｎ
丝丝关于学位论文使用授权的声明本人完全了解山东大学有关保留使用学位论文的规定同意学校保留或向国家有关部门或机构送交论文的复印件和电子版允许论文被查阅和借阅
山东大学硕士学位论文 MCMC方法研究姓名：赵琪申请学位级别：硕士专业：概率论与数理统计指导教师：嵇少林
20070428
ＭＣＭＣ方法研究
但是由此我们得到一个启示，即９（ｚ）与，（ｚ）越近似，估计的精确度越高。这就是重要
抽样法的基本思想。在实践中往往灵活地寻找常用的已知类型的密度ｇ，使它在峰值
附近与ｌ，（ｚ）Ｉ较接近，以便达到降低估计方差的目的。从直观上看（１１）式给出的Ｊ是
采用均匀抽样，诸ｑ对ｊ．的贡献是１ｉ同的，，（戤）大则贡献大。但在抽样时这种差别未
ａＩｌｄＧｉｂｂｓａｌｇｏｒｉｔｈｍ，ｉｎｃｌｕｄｅｔｈｅｄｅｔａｉｌｅｄｐｒｏｃｅ８ｓｏｆｔｈｅｓｅｄｇｏｒｉｔｈｍａＩｌｄｔ１１ｅｒｅｌａｔｉｏｎｏｆｔｈｅｓｅａｌｇｏｒ扎ｈＩｎ．ｗｅａｌｓｏｄｉｓｃｕｓｇｈｏｗｔｏｉｍｐｒｏｖｅｔｈｅｓｅａｌｇｏｒｉｔｈｎｌｉｎａｐｐｌｉｃａ上ｉｏｎＴｈｅｔｈｉＴｄｓｅｃｔｉｏｎｍａｉｎｌｙｍｔ∞ｄｕｃｅｓｔｈｒＥ！ｅａｓｐｅｃｔｏｆＭＣＭＣｍｅｔｈｏｄｉ．ｅ．ｃｏＩⅣｅｒｇｅｎｃｅ、ｅｒｒｏｒ

马尔可夫链蒙特卡洛算法

马尔可夫链蒙特卡洛算法
马尔可夫链蒙特卡洛算法（Markov Chain Monte Carlo，
MCMC算法）是一类经典的统计模拟方法，用于从复杂的概
率分布中进行抽样，以求解各种统计问题。

MCMC算法的核心是利用马尔可夫链的性质进行概率抽样。

具体步骤如下：
1. 确定目标分布：首先需要确定所要抽样的目标分布，通常是在计算困难的概率模型中计算概率密度（或概率质量）函数的常数比例。

2. 构建马尔可夫链：构建一个马尔可夫链，使得其平稳分布等于目标分布。

常见的马尔可夫链包括Metropolis-Hastings算法、Gibbs采样等。

3. 进行迭代抽样：从适当的初始状态开始，根据马尔可夫链的转移规则进行迭代。

每次迭代都根据当前状态和转移规则生成一个新的候选状态，接受或者拒绝该状态作为下一步的状态，通过计算接受概率等条件转移概率来决定是否接受。

4. 收敛检验：经过充分迭代后，进行收敛检验，判断抽样结果是否已经达到平稳分布，通常使用自相关函数等进行检验。

5. 统计分析：使用抽样结果进行统计分析，例如估计分布的均值、方差等参数。

MCMC算法具有广泛的应用，如蒙特卡洛积分、贝叶斯统计、马尔可夫链模型参数估计等。

但是，MCMC算法的主要困难
在于如何构建合适的马尔可夫链、如何设置收敛准则以及如何处理高维空间中的抽样问题。

mcmc原理

MCMC原理什么是MCMCMCMC（Markov Chain Monte Carlo）是一种用于从概率分布中抽样的算法。

它结合了马尔可夫链和蒙特卡洛方法，能够通过迭代的方式逼近目标分布。

MCMC在统计学和机器学习领域被广泛应用，特别是在贝叶斯推断中。

马尔可夫链为了理解MCMC的原理，首先需要了解马尔可夫链。

马尔可夫链是一个随机过程，具有马尔可夫性质，即当前状态的转移概率只依赖于前一个状态，与其他状态无关。

马尔可夫链可以用状态空间和转移概率矩阵来描述。

假设有一个状态空间S，包含所有可能的状态。

每个状态之间的转移由转移概率矩阵P决定，其中P(i,j)表示从状态i转移到状态j的概率。

马尔可夫链的特性是，经过足够多的转移后，状态会收敛到一个稳定的分布。

这个稳定的分布称为平稳分布，也被称为马尔可夫链的平稳分布。

蒙特卡洛方法蒙特卡洛方法是一种基于概率的数值计算方法，通过随机抽样来近似计算。

它的基本思想是，通过生成大量的随机样本，利用样本的统计特性来估计未知的数值。

蒙特卡洛方法的一个重要应用是计算积分。

假设要计算一个函数f(x)在区间[a,b]上的积分∫f(x)dx，可以通过在[a,b]上生成大量的随机样本x，然后计算这些样本对应的函数值f(x)，最后取这些函数值的平均值乘以区间长度(b-a)来近似计算积分的值。

MCMC的基本原理MCMC的基本原理是利用马尔可夫链来生成服从目标分布的样本。

具体来说，MCMC通过构建一个马尔可夫链，使得平稳分布就是目标分布。

然后，通过从初始状态开始，通过一系列的转移来逼近平稳分布。

MCMC的核心思想是通过状态转移概率来探索状态空间。

在MCMC算法中，每个状态的转移概率与其在目标分布中的概率成比例。

这样，经过足够多的转移后，马尔可夫链的状态会收敛到目标分布。

MCMC算法的基本步骤如下：1.选择一个初始状态作为马尔可夫链的起点。

2.根据当前状态，通过转移概率进行状态转移。

转移概率可以根据目标分布来确定。

MCMC方法介绍

MCMC方法介绍MCMC（Markov Chain Monte Carlo）方法是一种统计模拟方法，可用于高维参数空间中的复杂问题。

它结合了Markov链和Monte Carlo方法，通过生成一个与所需分布相关的马尔科夫链来近似分布的抽样。

MCMC方法的核心思想是利用马尔科夫链的收敛性质来模拟概率分布。

该方法通过选择一个合适的初试状态并定义一个状态跳转规则，使马尔科夫链足够接近所需分布，从而得到分布的近似抽样。

具体而言，MCMC方法通过以下几个步骤实现：1.选择一个初始状态：从分布中随机选择一个初始状态作为马尔科夫链的初始状态。

2. 定义状态跳转规则：定义一种状态跳转规则，使得从当前状态到下一个状态的转移满足其中一种概率分布。

常见的状态跳转规则有Metropolis-Hastings算法和Gibbs采样算法。

3.进行状态跳转：根据状态跳转规则，从当前状态跳转到下一个状态。

这个过程是基于马尔科夫链的收敛性质，在连续的状态跳转过程中逐渐逼近所需分布。

4.迭代状态跳转：迭代进行状态跳转，直到马尔科夫链收敛到稳定的状态。

稳定状态将近似表示所需分布。

1.贝叶斯推断：MCMC方法可用于贝叶斯推断中的参数估计和模型选择。

通过构建参数的后验概率分布，利用MCMC方法对参数空间进行抽样，可以获得参数的近似后验分布和模型的边缘似然分布。

2.隐马尔科夫模型：MCMC方法可以用于隐马尔科夫模型的参数估计和状态推断。

通过定义状态跳转规则和观测概率分布，MCMC方法可以从观测数据中推断出隐含的状态和模型参数。

3.概率图模型：MCMC方法在概率图模型中的应用比较广泛，如贝叶斯网络、马尔科夫随机场等。

通过定义状态转移规则和随机潜在变量的条件概率分布，MCMC方法可以从给定数据中对潜在变量进行抽样，从而进行模型推断和学习。

4.高维积分：MCMC方法可用于高维积分的近似计算，如计算多维积分、求解期望值等。

通过构建状态转移规则和定义目标概率分布，MCMC 方法可以将积分问题转化为马尔科夫链上的状态转移问题，从而使用蒙特卡洛方法进行近似计算。

氮素转化模型_mcmc算法_概述说明以及解释

氮素转化模型mcmc算法概述说明以及解释1. 引言1.1 概述在当今科学研究中，模型的应用已经成为一种普遍的方法，氮素转化模型是其中具有重要意义的一个领域。

氮素转化模型可以帮助我们更好地理解和预测氮素的转化过程，对于农业生产、环境保护和生态系统管理等方面具有重要的实际应用价值。

MCMC算法则是在统计建模和贝叶斯分析中常用的方法之一。

通过利用随机采样方式和马尔可夫链蒙特卡洛（MCMC）采样技术，MCMC算法可以对复杂的概率模型进行推断和参数估计。

在氮素转化模型中应用MCMC算法可以提供关键性的参数估计结果，并为进一步研究和改进提供基础。

本文旨在对氮素转化模型和MCMC算法进行综述，并详细解释了它们之间的关系以及如何应用于氮素转化模型中。

1.2 文章结构本文主要分为五个部分：引言、氮素转化模型、MCMC算法概述、氮素转化模型的MCMC算法解释以及结论部分。

在引言部分，我们将简要介绍本文的研究内容，包括对氮素转化模型和MCMC 算法的概述。

同时还将阐明文章的结构，以便读者更好地理解全文组织和内容安排。

在氮素转化模型部分，我们将详细定义和背景知识，介绍氮素转化模型的原理和应用领域。

通过深入了解氮素转化过程和相关模型，有助于读者对后续章节的理解和技术方法的应用。

在MCMC算法概述部分，我们将介绍MCMC的基本概念、算法步骤以及其在实际案例中的应用。

这一部分作为后续章节中MCMC算法与氮素转化模型结合的基础，将为读者提供必要的背景知识。

在氮素转化模型的MCMC算法解释部分，我们将详细探讨MCMC算法在氮素转化模型中的具体应用，并解释参数估计方法及实现过程。

此外，我们还将讨论该算法存在的优势和局限性。

最后，在结论部分，我们会对全文进行总结回顾，并展望未来研究中可能存在的发展方向和挑战。

1.3 目的本文的主要目的是概述氮素转化模型和MCMC算法，并解释它们之间的关系以及如何应用于氮素转化模型中。

通过本文的阐述，读者能够对氮素转化模型和MCMC算法有一个全面且深入的了解，并理解其在科学研究和实际应用中的重要性。

基于mcmc算法的贝叶斯统计方法-概述说明以及解释

基于mcmc算法的贝叶斯统计方法-概述说明以及解释1.引言1.1 概述概述部分是文章的引言部分，主要是对文章的主题和背景进行简要介绍，让读者对接下来的内容有一个整体的了解。

下面是可能的内容示例：概述贝叶斯统计方法是统计学中重要的分支之一，其核心概念是基于贝叶斯定理进行概率推断与参数估计。

与传统的频率派统计方法相比，贝叶斯统计方法具有更好的灵活性和鲁棒性，并且能够有效应对数据不完备或噪声较大的情况。

然而，由于贝叶斯统计方法中需要计算后验分布，往往需要面对复杂的高维积分问题，传统的数值计算方法往往无法直接求解，因此需要借助于一些基于概率抽样的算法。

本文的主要目的是介绍基于MCMC算法的贝叶斯统计方法。

MCMC （Markov Chain Monte Carlo）算法是一类基于马尔科夫链的随机抽样方法，通过构造一个马尔科夫链，从而得到一个与目标后验分布相符合的随机样本集合。

蒙特卡洛（Monte Carlo）方法则通过统计这些抽样样本的特征来获得对目标分布的估计结果。

在本文中，我们将首先对贝叶斯统计方法进行概述，介绍其基本原理和应用领域。

随后，我们将详细介绍MCMC算法的基本思想和常用的算法实现，包括Metropolis-Hastings算法和Gibbs采样算法等。

最后，我们将结合具体案例，展示如何基于MCMC算法应用于贝叶斯统计方法中，包括参数估计、模型比较和预测等方面。

通过本文的阅读，读者将能够全面了解贝叶斯统计方法和MCMC算法的基本原理，并具备在实际问题中应用这些方法的能力。

希望本文能为统计学和机器学习领域的研究者提供一些有益的参考和启示，开拓思路，推动相关领域的发展。

文章结构是整篇文章的骨架，它帮助读者了解文章的组织方式和内容安排。

本文的结构如下：1. 引言1.1 概述1.2 文章结构1.3 目的2. 正文2.1 贝叶斯统计方法概述2.2 MCMC算法介绍2.3 基于MCMC算法的贝叶斯统计方法3. 结论3.1 总结3.2 展望在本文的引言部分，我们首先对文章的主题进行了概述，介绍了贝叶斯统计方法以及MCMC算法的应用背景和重要性。

基于python的mcmc采样应用实例

基于python的mcmc采样应用实例基于python的MCMC采样应用实例概述：马尔可夫链蒙特卡洛(Markov Chain Monte Carlo，简称MCMC)是一种用于估计复杂概率分布的统计方法。

它利用马尔可夫链的性质，通过采样得到一系列样本，进而估计目标分布的特性。

Python作为一种通用且强大的编程语言，提供了许多库和工具用于实现MCMC算法。

在本文中，我们将展示如何使用Python实现MCMC算法，并且通过一个实际问题的例子来演示其应用。

1. 什么是MCMC？MCMC是一种用于近似复杂概率分布的方法，它基于马尔可夫链的理论。

马尔可夫链是一个随机过程，具有马尔可夫性质，即当前状态只依赖于前一状态。

利用马尔可夫链来模拟目标分布的性质，MCMC通过迭代生成样本，从而逼近目标分布。

MCMC背后的核心思想是使用马尔可夫链的遍历性质，确保生成的样本能够在整个状态空间上均匀分布，从而提供对目标分布的估计。

2. MCMC的步骤和算法：MCMC算法的基本步骤如下：- 初始化：选择一个初始状态- 生成：根据某种转移概率分布从当前状态生成一个新的候选状态- 接受/拒绝：根据接受概率决定是否接受新的候选状态作为下一步的状态- 迭代：重复步骤2和步骤3，直到达到采样次数或收敛其中，Metropolis-Hastings(MH)算法是最常用的MCMC算法之一，其具体步骤如下：1) 初始化：选择一个初始状态2) 生成候选状态：根据某种转移概率分布从当前状态生成一个候选状态3) 计算接受概率：根据候选状态和当前状态计算接受概率4) 决定是否接受：根据接受概率决定是否接受候选状态作为下一步的状态5) 迭代：重复步骤2到步骤4，直到达到采样次数或达到收敛3. MCMC在实际问题中的应用为了展示MCMC在实际中的应用，我们将使用一个经典的例子：拟合一条直线到一组散点数据。

假设我们有一组数据点(x, y)，我们希望找到一条最佳拟合直线y = mx + b，其中m是斜率，b是y轴截距。

马尔科夫链蒙特卡罗方法（MCMC）

马尔科夫链蒙特卡罗⽅法（MCMC）⼀.蒙特卡罗法的缺陷通常的蒙特卡罗⽅法可以模拟⽣成满⾜某个分布的随机向量，但是蒙特卡罗⽅法的缺陷就是难以对⾼维分布进⾏模拟。

对于⾼维分布的模拟，最受欢迎的算法当属马尔科夫链蒙特卡罗算法(MCMC)，他通过构造⼀条马尔科夫链来分步⽣成随机向量来逼近制定的分布，以达到减⼩运算量的⽬的。

⼆.马尔科夫链⽅法概要马尔科夫链蒙特卡罗⽅法的基本思路就是想办法构造⼀个马尔科夫链，使得其平稳分布是给定的某分布，再逐步⽣模拟该马尔科夫链产⽣随机向量序列。

其基本思路如下。

就像是普通的蒙特卡罗⽅法本质上依赖于概率论中的⼤数定理，蒙特卡罗⽅法的理论⽀撑是具有遍历性的马尔科夫链的⼤数定理。

马尔科夫链蒙特卡罗⽅法的⼤体思路如下：(1)给定某个分布p(x), 构造某个马尔科夫链\lbrace X_{t}\rbrace_{t\in\mathbb{N}}使得p是其平稳分布，且满⾜⼀定的特殊条件；(2)从⼀点x_{0}出发，依照马尔科夫链\lbrace X_{t}\rbrace_{t\in\mathbb{N}}随机⽣成向量序列x_{0},x_{1},...；(3)蒙特卡罗积分估计：计算E_{p}(f)\approx\sum_{t=1}^{N}f(x_{t})三.MCMC的数学基础——马尔科夫链的遍历性，⼤数定理MCMC为什么可以近似计算积分? 其实在数学上这是不太平凡的，下⾯简要介绍⼀下其数学理论依据。

3.1 马尔科夫链与其遍历性, 马尔科夫链的⼤数定理：所谓马尔科夫链通俗的说就是⼀个随机过程，其满⾜，t时刻的状态和t-1之前的状态⽆关。

我们⽤严格的测度论语⾔说就是：定义3.1：定义于概率空间(\Omega,\mathcal{G},P), 取值于\mathcal{Y}\in\mathbb{R}^{K}的随机向量序列\lbraceX_{t}\rbrace_{t\in\mathbb{N}}称为离散时间马尔科夫链(Markov Chain of discrete time)如果其满⾜：对于任意\mathcal{Y}的Borel集B\in \mathcal{B}_{\mathcal{Y}}P(X_{t+1}^{-1}(B)\mid X_{t},...,X_{1})=P(X_{t+1}^{-1}(B)\mid X_{t})进⼀步的，如果\lbrace X_{t}\rbrace_{t\in\mathbb{N}}还满⾜：\begin{equation}P(X_{t+1}^{-1}(B)\mid X_{t})=P(X_{1}^{-1}(B)\mid X_{0})\end{equation}我们称马尔科夫链\lbrace X_{t}\rbrace_{t\in\mathbb{N}}为时间齐次（time homogeneous)的，这时我们定义该马尔科夫链的转移核(transition kernel)$P_{t}: \mathbb{N}\times\mathcal{B}_{\mathcal{Y}}\longrightarrow [0,1]:$P_{t}(y,A)\triangleq P(X_{t}\in A\mid X_{0}=y),对任意t\in\mathbb{N}, 并且我们直接简记P(y,A)=P_{1}(y,A), 对y\in\mathcal{Y}, A\in\mathcal{B}_{\mathcal{Y}}。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

肖柳青上海交通大学数学系
• 显然，我们现在有两种方法来求不变分布：
• 一种是从任意概率向量出发迭代计算；
• 另一种是直接求转移概率矩阵的特征值为1
的左特征向量（还要归一化）；
• 我们推荐前一种方法! 因为这是一个迭代的
极限过程，可借助Matlab软件轻松获得其近
似解，人们不需要判别转移矩阵是否满足那
抽样分布。做到这点似乎相当复杂，但实际上
由于人们可以非常灵活地选择简单的转移概率
，所以构造该算法并不困难。
• Metropolis算法的动机是推广接受-拒绝抽样方
法。回忆在接受-拒绝抽样方法中，我们有目
标密度函数、建议密度函数和一个接受准则（
概率函数）。同样地我们假设：是全空间上的
离散概率密度函数，人们需要在上按照密度函
些存在不变分布的条件。
• 不难求得其结果是：
(0.3636,0.2397,0.3967)
肖柳青上海交通大学数学系
6.2 MCMC抽样
―Metropolis算法
• 马尔科夫链蒙特卡罗抽样方法（简
记为MCMC）的想法可追溯到1953
年N. Metropolis等人在研究关于原
子和分子的随机性运动问题时所引
肖柳青上海交通大学数学系
• 我们用图（见图6.2）来描述这个马尔科夫链
，其中节点表示那三个状态：涨（up）、持
平（same）和跌（down）；有向边和标出
的数值表示状态转移方向及其概率，即转移
概率矩阵为
0.3 0.2 0.5

P 0.4 0.2 0.4
0.4 0.3 0.3
态，分别以数字1，2，3表示之；假设其状态
转移的变化规律是：
• 如果股价今天是涨，那么明天再涨的概率是
0.3，持平的概率是0.2，而跌的概率是0.5；
• 如果股价今天是持平，那么明天上涨的概率是
0.4，再持平的概率是0.2，而跌的概率是0.4；
• 如果股价今天是跌，那么明天会涨的概率是
0.4，持平的概率是0.3，而再跌的概率是0.3。
肖柳青上海交通大学数学系
3
X (t )
…………
0
1 2 3
4
k k 1
肖柳青上海交通大学数学系
t
一些简单例子
假设甲乙两人以抛硬币的方式进行赌博，每次抛同
一枚硬币；若出现正面，则甲付给乙一元钱，若出
现反面，则乙付给甲一元钱.记 X (n)为第 n 局之后甲
赢的总数.则 { X (n)，n 0} 是马尔可夫链.
p
21

P

pn1
p22
pn 2
• 转移概率性质
(1)
pij 0, i, j
p1n

p2 n

pnn
p12
n
(2)
p
j 1
ij
1
肖柳青上海交通大学数学系
9
例如：
肖柳青上海交通大学数学系
• 这个拥有4个状态的马尔科夫链，其转移
情况由图5.1所示，则相应的转移矩阵为
6.3 几个MCMC的例子
6.4 为什么Metropolis算法能有效工作？
肖柳青上海交通大学数学系
6.1 马尔可夫链与转移概率
随机试验结果{Xt，tT }，
参数T={1,2,},状态空间 ={x1,x2,}
• 定义: 若随机过程{Xt，tT }，对任意tT和
x1,,xn+1 ，条件概率
• 我们选择初始状态0 = 1为例，程序运行结
果以各状态的出现频率的直方图形式呈示。
• 存在不变分布，那也被称为“稳定分布”。
程序给出的不变概率分布是：
p (0.36415,0.23950,0.39635)
• 结果：今后股价出现上涨的比例约为36%，
而出现下跌的比例却要高于上涨的，约为
40%。
肖柳青上海交通大学数学系
马尔科夫链的模型广泛应用性
• 例如，一个随时间变化的热力学系统；
• 改变一个物种的DNA序列的突变，蛋白
质分子一步一步折叠的序列；
• 一天又一天的股价波动；
• 一个赌徒的赌博资金等等。
肖柳青上海交通大学数学系
马尔可夫过程通常分为三类：
(1)时间、状态都是离散的，称为马尔可夫
• 这种对称性条件在大多数情况下可以很
自然地做到。当然它也可以稍微减弱成
下面的条件：
•
(|) > 0 ⇔ (|) > 0
• 即要求状态转移是可逆的。
肖柳青上海交通大学数学系
• 算法接下来要做的是，将选中的状态和当
前状态进行比较，以一定的概率接受其中
之一为随机序列链的下一状态。这里与接
随机模拟方法与应用
Stochastic Simulation
Methods and Its Applications
肖柳青博士
lucyxiao@
PUB:SSMA_xiao@
肖柳青上海交通大学数学系
第6章神奇的马尔科夫链
蒙特卡罗方法
6.1马尔科夫链
6.2 MCMC抽样―Metropolis算法
• 定义: 若对任意的i,j ，马尔可夫链
{Xn,nT }的转移概率pij(n)与n无关，则称
马尔可夫链是齐次的，并记pij(n)为pij。
• 齐次马尔可夫链具有平稳转移概率，
状态空间 ={1,2,3,}，一步转移概率为
肖柳青上海交通大学数学系
8
Pnn 一步转移概率矩阵：
p11
1]的哪个区间里？
• 则下一步状态就转移到它们分别对应的于状
态1、2或4。
• 依次类推不断地进行转移，则产生了该马尔
科夫链的一条状态演化路径。
肖柳青上海交通大学数学系
• 很显然，状态的演化是随机的!
• 我们以向量p = (1, 2, 3, 4)表示经过
步转移后状态的概率分布（注：这里用
数产生样本马尔可夫链.
肖柳青上海交通大学数学系
• 类似接受-拒绝抽样方法, 在当前状态 xt 下
产生下一个状态将分两个步骤进行：
• （1）从建议密度函数 g ( | xt )产生一个随
机数 y 作为建议的下一个状态；
• （2）然后按均匀分布产生一个随机数 r ，
如果 r h( x, y) , 则接受该建议的随机数，
入的随机模拟方法。该方法被命名
为“Metropolis模拟算法”。
• 事实上，这个算法已被列为影响科
学和工程技术的发展最伟大的十大
算法之首。
肖柳青上海交通大学数学系
• Metropolis算法是MCMC的核心。
• MCMC背后的基本思想是构造一个遍历的马
尔可夫链，使得其不变分布成为人们所需要的
p11
p
21

P
p31

p12
0
0
p23
0
0
0
p43
p14

0
p34

p44
• 我们设初始的状态是 x1 ，那么下一步的
状态将是哪个呢？
肖柳青上海交通大学数学系
• 生成服从均匀分布一个随机数 ∼ (0, 1)，
看落在[0, 11]、(11, 11 + 12] 或(11 + 12,
受-拒绝抽样方法的另一不同之处在于接受
概率不但取决于下一步状态而且还与当前
状态有关。所谓的Metropolis-Hastings算
法，该算法的接受概率定义为
f ( y) g ( x | y)
h( x, y) min 1,

f ( x) g ( y | x)
肖柳青上海交通大学数学系
（简单传染病模型）设 n 个人中有部分人感染了某种
传染病，假设：当一个病人接触了一个健康者时，
健康者被感染的概率为 p ；所有的接触都是两人之
间的接触；任意两个人的接触都是等可能的；在
一个单位时间内只有一次接触发生. 记 X (n)为时刻 n
时患病的人数，则 { X (n)，n 0} 是马尔科夫链.
• 对于一般的马尔可夫链，有迭代关系式：
pt 1 pt P
• 上式对取极限，假设概率向量 pt 的极限
存在并它设为，则就有
P
这个就被称为不变分布。
肖柳青上海交通大学数学系
定理6.1 (Perron–Frobenius)
• 如果概率转移矩阵具有 > > 0, ∀, ，则
肖柳青上海交通大学数学系
这例子有两个问题值得注意：
• 1. 人们如何获得转移概率？
• 2. 为什么要假设该马尔科夫链是
齐次的，即转移概率不随时间变
化？
肖柳青上海交通大学数学系
6.1.3 不变分布
• 上例让我们看到不变分布的出现，它是经
过长时间迭代后呈现出的一种不变性，也
就说，这是一个稳定的极限分布。
肖柳青上海交通大学数学系
• 模拟股市的变化状况:
• 首先需要给定一个起始状态: 可随机选择
或确定一个状态。
• 如果我们假定今天状态是“涨”，接下来
我们需要生成服从于转移概率分布的随机
变量， { p11 0.3, p12 0.2, p13 0.5}
• 为此，用均匀分布的随机数 ∼ (0, 1)来
行向量），这向量被称为概率向量。
• 概率向量 p0 (1,0,0,0) 就是初始时状
态处于状态1的概率分布。
• 根据概率公式，我们可得概率分布的转