当前位置:文档之家› 南水北调供水区水污染治理策略选择的演化博弈分析

南水北调供水区水污染治理策略选择的演化博弈分析

南水北调供水区水污染治理策略选择的演化博弈分析
南水北调供水区水污染治理策略选择的演化博弈分析

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

演化博弈论简介

演化博弈论简介 说明:这篇东西是我上周六在浙大思想讨论班上做演讲的讲稿和主要内容。讲完以后,叶航老师提出了很多宝贵的意见。我也正好乘这机会把没有讲或者没有讲清楚的东西梳理了一下。整理过程中还发现了了很多问题,请大家批评。 丁丁1994年有一篇重要的文章,介绍发展经济学的最新进展。他比较了诺斯(North)的制度变迁理论,罗默(Romer),卢卡斯(Lucas)等的内生增长理论,哈耶克的“自发秩序论”,重复博弈和演化博弈论等理论,这些理论的共同特点是“动态”(dynamic)。传统新古典经济学是静态的,重视均衡点,但很难进行历史的研究。正因为如此,这些新理论才显示出强大 的生命力,获得广泛运用。 我们这里讲演化博弈(evolutionary game theory),它显然有2条理论来源,一是演化理论,一是博弈论。 先来看演化理论,我首先要纠正一个常见的误解,即演化均衡是帕累托最优的,或者说最大化整个社群的福利。我们要注意到,演化均衡不等于一般均衡,等会我会给出一些严格的定义。从福利经济学第一定理可以得知,一般均衡必然是帕累托最优的,即所谓的看不见的手的含义,但是演化均衡并没有类似的定理。我们用常识来分析,如果演化均衡最大化社群的福利,那么什么是社群的福利呢?是个体的总数最大吗,是个体的多样性最多吗,抑或是个体预期存活概率最大?即使我们能为适应性(fitness)找出合适的测量方法,我们也无法保证演化是朝向个体适应性最大的方向演化。我这里用演化,避免用演进,可以减少误解。 演化理论中有两条最重要的机制。一个叫自然选择,即不是每种生物都有相同的概率在下一期存活。在这个世界上,有些生物个体(或者人)特别幸运,他们能活下去,但还有些个体就倒霉了,他们会被淘汰。我们今天都活着,可见我们的祖先都还是幸运的,他们有后代继承了他们的基因。我特别要强调自然选择,对于我们来说是被选择(be selected),我们能决定我们的行为和策略,但不能决定我们是否被选择,那是上帝的事情。严复说物竞天择,就是这个意思。 另一种机制叫突变机制(mutant),这保证了种群的变化。如果没有突变,那么这个世界上存活下来的物种就会越来越少,最后只剩下一种。对于突变机制,我也要强调它是没有方向性的,可能会提高个体的适应性,但更有可能降低个体的适应性。突变同样是上帝的选择,微观个体无能为力。 接下来,我们就可以回顾演化经济学的思想史了。我在幻灯片里给出了一长串人的名字,他们都可以看作是具有演化思想的经济学家,都是演化经济学的先驱。斯密,马克思,门格尔,马歇尔,凡勃仑,熊彼特,直到哈耶克。我尤其要强调雄彼特的贡献,他研究经济发展和经济周期,提出了著名的“创新”思想。这带有明显的动态的特征,并影响了随后的尼尔森和温特。 安德森把熊彼特以后,尼尔森-温特以前这段时间(1930-1970)比作黑暗时代(当然这仅指演化经济学而言,对于新古典经济学无疑是黄金时代呢),这段时间很少有人关心动态的演化的经济学理论。(阿尔奇安也许是个例外) 从70年代初开始,尼尔森和温特提出了一系列演化经济学模型。同时,梅纳德.史密斯在1973年提出了著名的演化稳定策略,奠定了演化经济学的基础。从此,演化经济学可以算真正诞生了。 尼尔森自称是熊彼特的忠实信徒,而温特是达尔文进化论的信徒,他们的演化理论非常鲜明地具有这些特征。计算机能够很好地模拟生态学上物种数量的演化,因而也被广泛地用于经济模型的演化模拟。尼尔森-温特的多数模型都很容易被改编成计算机模型,用现实数据进

博弈论战略分析入门

当当网购买 货到付款 点击查看详情 市场价:¥42.00 当当价:¥36.30 点击查看 本书简介 本书主要针对经济学专业入门课程和非经济专业学生编写,是一本全面介绍博弈论的具有指导意义的入门教材。 阐释清晰:本书以基础性知识作为重点,以清晰的思路和简洁明了的方法阐述了博弈论知识及其应用,并覆盖了所涉及的各个学科。全书讲解深入浅出,循序渐进,具有很强的逻辑性。每章开头的“预备知识”介绍了学习该章之前应该经已掌握的内容,增加了章节安排的灵活性;同样位于各章开头的“本章主要概念”介绍了该章将会出现的关键概念,以使学生对整章内容有所准备。 案例生动:案例是本书的一种重要讲解工具,涉及商业、拍卖、军事、生物学和博彩等方面,不仅使概念的引出更加出动,而且能够激发读者的全面思考。方便学生理解的应用实例及各章后面的“练习与讨论”,不仅进一步阐释了博弈理论,而且涉及不同的学科领域,既可以用来检验学生的

知识掌握程度,也可以作为教师的课堂问题。 结构科学:对一般的导论性教材中关未特别说明或不会涉及的概念、容易混淆的概念,本书也做了必要的解释。书中没有涉及过多、过于复杂的数学计算,而是设置了部分选修章节,介绍一些与概率相关的概念,详细分析解读,对于只想简单了解博弈论的读者来说,略去选修章节,其中,不会影响全书逻辑的连贯性。 目录 译者序 前言 第一部分 基本原理 第1章 冲突、战略与博弈 第2章 护展式博弈与标准式博弈 第二部分 标准式博弈的非合作均衡 第3章 占优战略与社会两难 第4章 纳什均衡 第5章 博弈论中的经典例子 第6章 三人博弈 第7章 概率与博弈论 第8章 混合战略纳什均衡 第9章 非合作均衡的深入讨论 第10章 双寡头垄断的战略与定价 第11章 多人博弈 第三部分 博弈的合作解 第12章 合作博弈的要素 第13章 核在经济学中的应用 第四部分 序贯博弈 第14章 序贯博弈 第15章 嵌套博弈 第16章 重要博弈 第17章 无限重要博弈 第五部分 博弈论的应用 第18章 博弈论、法律与社会机制设计 第19章 投票博弈 第20章 博弈与实验 第21章 拍卖 第22章 演进和有限理性学习 术语表 当当网购买 货到付款 点击查看详情

演化博弈论小结

演化博弈论和学习行为的小结 1.RD 模型 ()[()()]()s s x u x u x F s =-= 该模型的来源由Van Damme(1991)的基因复制动态过程的非代际交叠模型和Binmore(1992), Samue(1997)的基因复制动态过程的代际交叠模型分别得出。 2.ESS 的概念 定义:①(,(1))(,(1))u x x y u y x y εεεε-+>-+ ②(1)(,)(,)(1)(,)(,)u x x u x y u y x u y y εεεε-+>-+ ③(,)(,)u x x u x y >或者如果(,)(,)u x x u x y =那么有 EGT 其他引申出的均衡、定理等 ESS 概念 学习模型 模仿 信念学习 路径学习 RD 模型

(,)(,)u x y u y y > PS:NSS 就是在ESS 的定义中将大于号变为大于等于号。 3.其他引申出的一些均衡、均衡之间的关系以及一些定理 3.1 ①EE : 是演化动态过程的任一渐进稳定不动点。其判定方法可以如下: ()0F s =;()/0dF s ds <。 ②ES : (对称二人博弈中)如果x *是X 的子集,且满足条件: a 、x *中每个元素都是一个NSS b 、x X *∈,(,)(,)u x x u y x =且(,)(,)u x y u y y =,则有y X *∈。 ③REE 对称策略(x,x )是REE 充分必要条件是存在某个 ε∈(0,1),使如果x x '≠且 (0,)εε∈,有((1)x B R x x εε ''?+- ④EES x X '∈是EES 的充分必要条件是, 它是最小的非空子集使得:

历史的制度分析:博弈论分析方法

历史的制度分析:博弈论分析方法 把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。一种是“进化博弈论方法”(evolutionary game approach)。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为,社会制度并不是由什么人有意设计出来的,而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入,就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视,主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程,从而在纳什均衡的理性主义解释遇到理论困难时,显示出了通过进化机制实现纳什均衡的可能性。 应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”(repeated game approach),它运用更精细的均衡概念,如“子博弈精炼均衡”(subgame perfect equilibrium)来分析历史与现实中的制度选择与变迁过程。其中最具代表性的,就是格瑞夫进行的“历史的比较制度分析”。 所谓的重复博弈,实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同,它是由若干个阶段博弈(stage game)构成的一个完整的和相对长期的博弈过程。因此,在重复博弈中,各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益,而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时,他必须考察到其在当前阶段的博弈中所采取的策略,不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说,他不能像在一次性博弈中那样,毫不顾及其他博弈方的利益。有时,一方若作出一种合作姿态,可能会使其他博弈方在随后的阶段中也采取合作态度,从而实现共同的长远利益。这样,在重复博弈中就存在着比一次性博弈更大的合作的可能性,也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征,为它说明人类之间的合作行为,特别是说明历史与现实社会中体制与制度的演变过程,提供了强有力的支持。 在历史的比较制度分析那里,制度被定义为本身是“自我实施的对行为的非技术决定的约束” ,即所谓的自我实施制度(self-enforcing institution )。自我实施制度的一个最基本的特征,就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同,自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此,历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程,也就是制度博弈各方在特定的战略局势中,根据自己不同的目标自主地选择各自的最优策略与对手进行博弈,最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”,恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说,一个子博弈精炼均衡,必须是各博弈方在整个博弈的每个阶段(子博弈)都选择了不愿单独改变的策略(纳什均衡)的最终结果。如果我们从博弈论的角度来观察自我实施制度,就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说,自我实施制度所具有的自发产生和自我实施的基本属性,说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果,也即实现子博弈精炼均衡的结果。更直接地说,自我实施制度的产生,必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说,如果一个制度博弈实现了子博弈精炼均衡的结果,那它也应该是自我实施的。

演化博弈理论

演化博弈理论综述 班级:国贸112班 姓名:赵焌茗 学号:2011095012

第一部分概述 演化博弈理论至少自Lewontin(1960)用于解释生态现象就已经产生了,并被广泛应用于生态学、社会学及经济学等领域来研究群体行为的演化过程及其结果。进化博弈理论从有限理性的个体出发,以群体为研究对象,认为现实中个体并不是行为最优化者,个体的决策是通过个体之间模仿、学习和突变等动态过程来实现的。进化博弈理论强调系统达到均衡的动态调整过程,认为系统的均衡是达到均衡过程的函数,也就说均衡依赖于达到均衡的路径。动态概念在进化博弈理论中占有相当重要的地位,许多博弈理论家对群体行为调整过程进行了广泛而深入的研究,根据他们考虑问题的角度不同而提出了不同的动态模型,如Weibull(1995) 提出的模仿动态(Imitation Dynamics)模型;B?rgers and Sarin(1995,1997)等提出的强化动态1(Reinforcement Dynamics)模型等等。但到目前为止,在进化博弈理论中应用最多的还是由Taylor and Jonke r(1978)提出的模仿者动态(Replicator Dynamics)模型。模仿者动态是进化博弈理论的基本动态,它能较好地描绘出有限理性个体的群体行为变化趋势,由之得出的结论能够比较准确地预测个体的群体行为,因而倍受博弈论理论家们的重视。本文集中介绍确定性模仿者动态概念、模型及其与经典博弈动态概念的区别。 在传统博弈理论中,常常假定参与人是完全理性的,且参与人在完全信息条件下进行的,但在现实的经济生活中的参与人来讲,参与人的完全理性与完全信息的条件是很难实现的。在企业的合作竞争中,参与人之间是有差别的,经济环境与博弈问题本身的复杂性所导致的信息不完全和参与人的有限理性问题是显而易见的。 与传统博弈理论不同,演化博弈理论并不要求参与人是完全理性的,也不要求完全信息的条件。有限理性这一概念最早是由西蒙(Simon.H.A.)在研究决策问题时提出的,它是指人的行为只能是“意欲合理,但只能有限达到”。威廉姆森在研究影响交易费用的因素时,对有限理性的问题进行了归纳总结人的有限理性是由两方面的原因引起的:一方面是由于人的感知认识能力限制,它包括个人在获取、储存、追溯和使用信息的过程中不可能做到准确无误;人的有限理性的另一方面则是来自语言上的限制,因为个人在以别人能够理解的方式通过语句、数字或图表来表达自己的知识或感情时是有限制的(这或许是因为他们没有掌握到所必需的词汇,或许是因为这些词汇还不存在),不管多么努力,人们都将发现,语言上的限制会使他们在行动中感到挫折。从这两个方面而言,完全理性的人根本就不可能存在。 演化博弈论是把博弈理论分析和动态演化过程分析结合起来的一种理论。在方法论上,它不同于博弈论将重点放在静态均衡和比较静态均衡上,强调的是一种动态的均衡。演化博弈理论源于生物进化论,它曾相当成功地解释了生物进化过程中的某些现象。如今,经济学家们运用演化博弈论分析社会习惯、规范、制度或体制形成的影响因素以及解释其形成过程,也取得了令人瞩目的成绩。演化 1其实质就是个体与群体进行博弈,即个体通过对群体选择不同策略的个体数的观察来确定自己的选择。1Selten(1980)通过对个体引入角色限制,首次考察了非对称博弈中的均衡问题,并证明了“在非对称博弈中进化稳定均衡等价于严格纳什均衡”。

简述运筹学的起源与发展历程

简述运筹学的起源与发展历程——应用博弈论思想分析团队合作中个人理性和集体利益的关系 作者:张舒悦 日期:2015年1月19日 [摘要] 我们说理性表现为参与人为自己的目标进行推理或计算。因此·在博弈对峙的局面中,每个人的理性判断最终导致的行为选择,也许反而会使导致集体利益的最差,当然。也许两个参与者之间不能被看做集体,但是我们可以通过集体特点的分析,从而对每个人理性策略选择所构成的集体后果关联从而对个人理性与集体利益有一个更为全面的认识。 [关键词] 囚徒困境;集体;理性;利己主义 [正文] 一、运筹学科的起源发展与分支概括 运筹学的起源 运筹学(英国用operational research,美国用operations research,简称OR),从它的英文名称和中文翻译可以看出它与作战相关。中文“运筹”一词来源于《史记——留侯世家》,刘邦夸奖张良,“夫运筹帷幄之中,决胜千里之外,吾不如子房”。这一翻译不但传达了运筹学的渊源,而且反映了它的内涵,是翻译“信、达、雅”的最高境界。运筹学是一门内容广泛、应用广泛的交叉学科,它汇聚了数学、物理学、统计学、管理学、心理学、仿生学等众多的学科。有些分支的起源,如图论这一重要的分支的起源甚 至可以追溯到16世纪;即使是在现代通信领域广泛应用的排队论,也可以追溯到20世 纪初。但是,运筹学作为一门学科的出现确实要归功于第二次世界大战。 第二次世界大战是这样一个时期,科学发展从一门独立的学科发展向学科交叉发展,从“形而上学”的研究方法向系统综合研究的方向发展,系统科学、信息科学和计算机 科学开始了它的早期发展。这个良好的发展时期被第二次世界大战暂时中断,大量的科 学家为了国家利益投入到了为战争服务之中。在德国一方,科学家更多地投人各种杀伤 武器的研究;而在英美一方,科学家被组织成为作战研究小组,专门研究作战中的一些 特殊问题,这些问题需要数学模型和方法来解决。如雷达的部署问题、运输船队的护航 问题、反潜深水炸弹投掷问题、飞行员长机僚机配对问题、太平洋岛屿军事物资存储问题、项目管理问题等等。这些研究保障了英伦三岛免遭德军的蹂躏、美军在太平战争的 胜利。

演化博弈论

演化博弈论 演化博弈论(evolutionary stable strategy)整合了理性经济学与演化生物学的思想,不再将人模型化为超级理性的博弈方,认为人类通常是通过试错的方法达到博弈均衡的,与生物演化具有共性,所选择的均衡是达到均衡的均衡过程的函数,因而历史、制度因素以及均衡过程的某些细节均会对博弈的多重均衡的选择产生影响。在理论应符合现实意义上,该理论对于生物学以及各种社会科学尤其是经济学,均大有用场。 演化博弈理论最早源于Fisher,Hamilton,Tfive~等遗传生态学家对动物和植物的冲突与合作行为的博弈分析,他们研究发现动植物演化结果在多数情况下都可以在不依赖任何理性假设的前提下用博弈论方法来解释。但直到Smith and Price(1973)在他们发表的创造性论文中首次提出演化稳定策略(evolutionary stable strategy)概念以后,才标志着演化博弈理论的正式诞生。生态学家Taylor and Jonker(1978)在考察生态演化现象时首次提出了演化博弈理论的基本动态概念——模仿者动态(replicator dy—namic),这是演化博弈理论的又一次突破性发展。模仿者动态与演化稳定策略(RD&ESS)一起构成了演化博弈理论最核心的一对基本概念,它们分别表征演化博弈的稳定状态和向这种稳定状态的动态收敛过程,ESS概念的拓展和动态化构成了演化博弈论发展的主要内容。 编辑本段主要应用领域 演化证券学:演化证券学是运用生物进化原理系统阐释股市运行机理的新兴交叉学科,是证券投资研究的一个具有生命力和丰富内涵的新领域。与现代金融学的“理性人”、“有效市场”相关假设不同,演化证券学重视对“生物本能”和“竞争与适应”的研究,强调人性和市场环境在股市演化中的重要地位,是揭示股市生存法则最有潜力的前沿科学。其开山之作《股市真面目》颠覆了股市运行机理的传

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

博弈论蒋文华浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么! 行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的

策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉 特别提示: 如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢(大智若愚) 特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。 ----汉代刘向,《围棋赋》 二、西方的理解 game(规则) 费厄泼赖(fairplay)

第三节学习博弈论的收益 一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展 三、提出完善游戏规则(制度)的建议 第二章发展简史 第一节最初的探索和应用 一、古诺模型 参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。 二、伯川德模型 该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。 三、斯塔克尔伯格模型 该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B 可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。 第二节理论的诞生与发展 1、20世纪40年代的社会变化。 2、约翰·冯·诺依曼(JohnVonNeumann,1903-1957)的卓越贡献。1944

博弈论(生存智慧大全集)_中国古代博弈思想

作为一门学科,博弈论虽然只有几十年的历史,但在中国,博弈的思想可以追溯上千年。中国历史上虽然没有创造博弈论,但却无时无刻不在运用博弈论的原理。从田忌赛马到庞涓斗智,从运筹帷幄到韬光养晦,从击鼓论战到毛泽东关于打仗的十六字方针,中国人民对博弈论的发展做出了重要的贡献。具有灿烂文明的中国古代文化,是一座正待开发的宝藏,作为其中优秀成果的博弈思想,尽管我们可能只是窥及一角,但在今天看来仍有很多启迪意义。 在政治方面,一部中国史,上下五千年,其中有数不清的政治博弈,让人惊心动魄。不论忠奸善恶,每个人的命运都与形形色色的政治博弈拴在一起,所有身处其中的人或一举成名,或一夜暴富,或一败涂地。 中国王朝的年限少的只有数十年,如秦、隋等;多也不过三四百年,如汉、唐、宋、明等。尽管每一次改朝换代都会带来生灵涂炭,社会文化、经济则随之遭到严重破坏,但无可否认的是,历史在大踏步前进。有人将历史的精微幽深作一总结,得出了若干条中国式王朝衰败的法则,如武装积弱,中央对军队失控;吏乱坏纲,各级官吏腐败;国库断银,积贫致弱;人心向背是决定王朝兴衰的关键;领导者决策上的严重错误,致使无力回天;防御过度或乏力,导致在抵抗外患中走向式微;天灾人祸造成的储备一空;宫廷乱政,后院失火;各民族融合失衡,民族矛盾加剧等等。所有这些,其实都是政治博弈的失败。 对于每一个生活在本朝现实中的人来说,偌大一个国家的衰亡,绝非是一件人人都能承受得起的事件,尤其对于帝国的经营者来说。毛泽东曾对此发表见解说:“我们已经找到新路,我们能跳出这周期率。这条新路,就是民主。只有让人民来监督政府,政府才不敢松懈。只有人人起来负责,才不会人亡政息。”可惜的是,过往帝王们显然由于历史的局限性,都缺乏毛泽东的思想高度,他们没能幸运地找到基业长青的“新路”。相反的是,他们基本上都怀着虔诚之心,不自觉地走向了覆灭之路。 在经济方面,中国古代社会的经济交往,是在小农经济和自给自足的经济条件下进行的。每个人与不属于自己所熟悉的或所居住社会群体中的人进行重复经济交往,这个可能性是很小的。在这种情况下,每个人所关注的是一次性经济交易的结果,也就是行为的短期化。也就是说.经济中进行的还是大量的一次性博弈。只有当大量的一次性博弈重复进行,并经主体认识到短期行为对自己的损害时,诚信才可能最终形成。 当然,不可否定的是,中国历史上也曾有很多阶段有高速的经济增长,问题是不能持续。 信用程度是一个历史的发展过程。这一过程可能是漫长的,而且要付出巨大代价。要实现全社会信用的提升,必须在未来的历史中完成尽管这注定是一个漫长和痛苦的历程。 在军事方面,《孙子兵法》是“兵圣”孙武所著的世界上最早的军事博弈专著,在中国被奉为兵家经典,后世的兵书大多受到它的影响,对中国的军事学发展影响非常深远。它也被翻译成多种语言,在世界军事史上也具有重要的地位。 《孙子兵法》所阐述的博弈思想如谋略思想和哲学思想,被广泛地运用于军事、政治、经济等各领域中。其内容博大精深,思想精邃富赡,逻辑缜密严谨,历代兵学家、军事家无不从中汲取养料,用于指导战争实践和发展军事理论,成为进行军事博弈的典范之书。

博弈论的发展历程

博弈论的发展历程 虽然早在18世纪初以前便开始了对具有策略依存特点的决策问题的零星研究,但博弈论真正的发展还是在20世纪。20世纪初期是博弈论的萌芽阶段,其研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈,即二人零和博弈。这类博弈中不存在合作或联合行为,对弈两方的利益严格对立,一方所得必意味着存在另一方的等量损失。这符合下棋等二人室内游戏的情形,但应用在经济与政治上,则大多数情况并不合适。此时,关于二人零和博弈理论有丰硕的研究成果,尤其是提出了博弈扩展型策略、混合策略等重要概念,为日后研究对象范围的拓展与研究的深化奠定了基础。这一阶段最重要的成就是泽梅罗定理(1913)与冯·诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解法,同时对博弈论的发展产生了重大影响,例如非合作几人博弈中的基本概念——纳什均衡就是最小最大定理的延伸与推广。 1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。该巨著汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。 接下来的一段时期对合作博弈的研究有了长足进步。按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。如意愿表示不可强制执行,则为非合作博弈。非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。事实上,合作博弈可视为非合作博弈的特殊情况,它略去非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。由于省去从非合作到合作过程中繁复的难以尽述的细节,合作博弈能对合作问题有更清晰的把握。为了解决合作博弈中所遇到的问题,这一期间提出了联盟博弈、稳定集、解概念、可转移效用、核心等重要概念与思想。1950年代是博弈论的成长期,纳什为非合作博弈的一般理论奠定了基础,提出了博弈论中最为重要的概念——纳什均衡,开辟了一个全新的研究领域。非合作理论发展起来,如阿尔·塔克的囚徒困境、重复博弈概念等。合作博弈理论在这个阶段得到进一步发展,如沙普利值概念、核概念等。博弈论的研究队伍开始扩大,兰德公司在圣基尼卡开业,在随后的许多年里,这里成为博弈论的研究中心。此经济学逐渐成为博弈论最重要的应用领域。1960年代是博弈论的成熟期。不完全信息与非转移效用联盟博弈那样的扩充使理论变得更具广泛应用性。常识性的基本概念得到了系统阐述与澄清。博弈论成了完整而系统的体系。更重要的是,博弈论与数理经济及经济理论建立了牢固而持久的关系。例如,等价性原理说明博弈论与经济理论间存在竞争市场经济的价格均衡与相应博弈的重

演化博弈论(清华大学)

进化博弈 Evolutionary Games
第13章 Chapter 13
进化博弈 Evolutionary Games
目前为止我们学过了具有多种不同特征的博弈: We have so far studied games with many different features:
同时和序贯博弈 Simultaneous and sequential moves 零和与非零和博弈 Zero-sum and non-zero-sum payoffs 操纵未来博弈规则的策略性行动 Strategic moves to manipulate rules of games to come 一次性和重复博弈 One-shot and repeated play 许多人同时进行的集体博弈 Games of collective action in which a large number of people play simultaneously
Slide 2

进化博弈 Evolutionary Games
所有这些博弈中的参与者都是理性的:每个参 与者…… All the players in all these games are rational: each player……
……具有内在一致的价值体系 has an internally consistent value system ……能够计算其策略选择的后果 can calculate the consequences of her strategic choices ……作出最符合其利益的选择 makes choice that best favors her interests
Slide 3
进化博弈 Evolutionary Games
对理性可能的替代方法可以从生物学的进化和进化动 力学中找到,在那里…… One possible alternative to rationality can be found in the biological theory of evolution and evolutionary dynamics, where……
……好的策略可以得到更多的奖励 good strategies will be rewarded with higher payoffs ……参与者可以观察或模仿成功者并试验新的策略 players can observe or imitate success and experiment with new strategies ……随着参与者在参加博弈中获得经验,好的策略将会得到 更经常的使用,坏的策略得到更少的使用。 good strategies will be used more often and bad strategies less often, as players gain experience playing the game.
Slide 4

博弈论的发展历程

博弈论的发展历程 (下)(ZZ) 信息问题上的突破。古典经济模型几乎无一例外地假设,个人(或厂商)的资源与偏好情况不仅为自己,也为他们的竞争对手所知,即完全信息假设。这显然不符合实际。不过,这并非模型建立者本身所希望的,而只是因为缺乏解决不完全信息问题的工具而不得不做出的简化。博弈论的发展也遇到同样问题。由于对不完全信息问题一度苦无良策,博弈论曾受到严厉批评。因为局中人事实上不可能清楚关于对手决策的所有信息。由此导致博弈理论建模的应用范围也受到了限制。豪尔绍尼对这一问题的解决方法是将不完全信息建模为自然完成的一种抽彩。这种抽彩决定局中人的特征。而这些特征是局中人偏好与经验的总和,其中,每个局中人清楚自己的特征,但不知道别人的真实特征。即他对整个博弈局势只有不完全信息。据其特征,局中人可分为一些类型。每个局中人知道自己的类型,不知道别人的类型,但知道类型上的联合分布,从而能对其它局人的类型作出先验分布判断。不完全信息的这种博弈局势把实际中千变万化的不完全信息都№归结为局中人对他人的主观判断。这种方法成功地将不易建模的不完全信息转化为数学上可处理的不完善信息: 即局中人根据经验与知识对对手的类型得出关于可能性大小的主观判断,即数学上的一种先验分布。不完全信息博弈的解是由纳什均衡概念推广而来的。其均衡点(贝叶斯均衡点)是一个n重策略,每个局中人每种类型的个人策略均是对其它局中人的(n-1)重策略的那种类型的最佳应对。以类型为基础的不完全信息博弈是豪尔绍尼(1967~1968年)提出的。他运用这种方法来克服将局中人的信息与偏好以及他对其它局中人信息与偏好的了解进行建模时所遇到的复杂性。这一思路极富创造性,使不完全信息博弈成为解决经济问题的一个有力工具。其次是关于混合战略的解释。混合战略概念的传统解释是,局中人应用一种随机方法来决定所选择的纯战略。这种解释在理论与实际上均不能令人满意。豪尔绍尼对此提出杰出的解释方法。他说明在每一真实的博弈形势中,总受一些微小的随机波动因素影响。在一标准型博弈模型中,这些影响表现为微小的独立连续随机变量,每个局中人的每一策略均对应一个。这些随机变量的具体取值仅为相关局中人所知,这种知识即成为私有信息;而联合分布则是博弈者的共有信息。这称为变动收益博弈。变动收益博弈适用豪尔绍

博弈论思想进行激励过程的分析

内容摘要: 内容摘要:内容型激励理论是激励理论的基础和根本。本文应用博弈论思想进行激励过程的分析,指出内容型激励理论的不足,提出解决内容型激励中三大难点的策略:激励博弈中信息不对称的消减、代理人需求的有效补偿和代理人需求的主动激发。 内容摘要:内容型激励理论是激励理论的基础和根本。本文应用博弈论思想进行激励过程的分析,指出内容型激励理论的不足,提出解决内容型激励中三大难点的策略:激励博弈中信息不对称的消减、代理人需求的有效补偿和代理人需求的主动激发。 关键词:激励博弈信息不对称需求补偿需求主动激发 博弈论是研究决策主体在给定信息结构下如何决策以求最大化效用,以及不同决策主体之间决策的均衡。博弈论由三个基本要素组成:决策主体(player),又可以译为参与人或局中人;给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;效用(utility),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数。参与人,策略集和效用构成了一个基本的博弈。激励可以解释为:为了特定目的而去影响人们的内在需求或动机,从而强化、引导或改变人们的行为向有利于组织目标发展的行为过程。激励涉及的对象分别是委托人和代理人,而在现实管理实践中,委托人可以指所有者,相应的代理人可以指经营者;另外,委托人也可以指管理者,相应的代理人可以指一般员工;双方只要形成了委托代理关系即可。从博弈论角度看,他们就是决策的主体,即博弈的参与人;委托人和代理人双方在激励与被激励过程中有多种选择的策略和行动空间,这就形成了激励博弈的策略集;委托人和代理人双方在激励与被激励中各自获得各自的好处,这就构成了博弈双方的效用。通过上面分析可看出,激励已典型的具备了博弈所必需的三个基本要素。 从管理学视角来看,现有的激励理论共有三大分支:内容型激励理论、过程型激励理论和综合型激励理论。内容型激励理论是激励理论的基础和根本。本文应用博弈论的思想,重新解读和分析内容型激励理论,以期对该理论进行补充和完善。 博弈论视角下的内容型激励理论不足分析 内容型激励理论认为,需求是激励的基础和前提,所以激励的关键在于辨别人的需求并予以满足。马斯洛需求层次理论、erg理论、x和y理论、三种需求理论和双因素理论都属于内容型激励理论范畴。归总来看,上述的这些内容型激励理论都遵循着这样一条逻辑线:代理人(被激励者)确认自身的需求→委托人(激励者)识别→委托人(激励者)满足代理人(被激励者)的需求。内容型激励理论假设了如下两个条件:委托人一定能够识别代理人的真正需求;委托人能够和愿意满足代理人的需求。 从博弈论视角来审视这两个假设条件,可发现这两个条件都存在着一定的瑕疵。首先,委托人不一定能够识别代理人的真正需求。不能识别的原因有二:代理人本身不一定都能明确知道自己的真正需求是什么,因为人有些时候自己不知道自己真正需求什么;即使代理人能够明确自己的真正需求,但由于代理人并未向委托人传递需求信息或传递需求信息有误,导致委托人不一定就能够真正确认出代理人的需求。激励属于典型的博弈,博弈信息不完全也是一种博弈的常态。其次,委托人不一定能够和愿意满足代理人的需求。委托人有可能没有能够满足代理人需求的条件;委托人即使有满足代理人需求的条件,但也不一定就愿意满足代理人的需求。因为博弈双方在采取行动时都会考虑采取相应的策略会不会给自己带来较

博弈论 蒋文华 浙江大学

献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策

略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉 特别提示: 如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚) 特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示:

在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。----汉代刘向,《围棋赋》 二、西方的理解 game(规则) 费厄泼赖(fair play)

第三节学习博弈论的收益 一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展 三、提出完善游戏规则(制度)的建议

相关主题
文本预览
相关文档 最新文档