当前位置:文档之家› 2博弈论概述

2博弈论概述

2博弈论概述
2博弈论概述

第2章博弈论概述

2.1博弈论的概念

2.2博弈讨论的前提

2.3博弈研究的价值

2.4博弈的要素

2.5博弈的类型

2.1博弈论的概念

W:丰富多彩;弈:下棋、打牌等对抗性游戏。

博弈:丰富多彩的对抗性游戏

博弈——相关利益各方在竞争的情况下,通过行动、策略等的实施最终达到某种收

益的过程。

博弈论(Game Theory)

研究相关利益各方参与的情况下,如何决策以最大化自身收益,并最终达到一种均衡状态的理论。

2.2博弈讨论的前提

理性■经济人假设

相关利益假设

各参与者的策略具有相互依存性信息是不完全,不对称的

理性(rational)

理性包括三项内容:

(D存在一组可供选择的备选或替代方案;(2) 每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度;

(3) 人们总是选择那个能够带来最大预期净收益的方案。

(西蒙,1964)

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

耶鲁大学公开课 博弈论 原文讲稿仔细整理注释 第2讲

ECON-159: GAME THEORY Lecture 2 - Putting Yourselves into Other People's Shoes [September 10, 2007] Chapter 1.Recap of Previous Lecture: Prisoners' Dilemma and Payoffs [00:00:00] Professor Ben Polak: Okay, so last time we looked at and played this game. You had to choose grades, so you had to choose Alpha and Beta, and this table told us what outcome would arise. In particular, what grade you would get and what grade your pair would get. So, for example, if you had chosen Beta and your pair had chosen Alpha, then you would get a C and your pair would get an A. One of the first things we pointed out, is that this is not quite a game yet. It's missing something. This has outcomes in it, it's an outcome matrix, but it isn't a game, because for a game we need to know payoffs. Then we looked at some possible payoffs, and now it is a game. So this is a game, just to give you some more jargon, this is a normal-form game. And here we've assumed the payoffs are those that arise if players only care about their own grades, which I think was true for a lot of you. It wasn't true for the gentleman who's sitting there now, but it was true for a lot of people. We pointed out, that in this game, Alpha strictly dominates Beta. What do we mean by that? We mean that if these are your payoffs, no matter what your pair does, you attain a higher payoff from choosing Alpha, than you do from choosing Beta. Let's focus on a couple of lessons of the class before I come back to this. One lesson was, do not play a strictly dominated strategy. Everybody remember that lesson? Then much later on, when we looked at some more complicated payoffs and a more complicated game, we looked at a different lesson which was this: put yourself in others' shoes to try and figure out what they're going to do. So in fact, what we learned from that is, it doesn't just matter what your payoffs are -- that's obviously important -- it's also important what other people's payoffs are, because you want to try and figure out what they're going to do and then respond appropriately. So we're going to return to both of these lessons today. Both of these lessons will reoccur today. Now, a lot of today is going to be fairly abstract, so I just want to remind you that Game Theory has some real world relevance. Again, still in the interest of recapping, this particular game is called the Prisoners' Dilemma. It's written there, the Prisoners' Dilemma. Notice, it's Prisoners, plural. And we mentioned some examples last time. Let me just reiterate and mention some more examples which are actually written here, so they'll find their way into your notes. So, for example, if you have a joint project that you're working on, perhaps it's a homework assignment, or perhaps it's a video project like these guys, that can turn into a Prisoners' Dilemma. Why? Because each individual might have an incentive to shirk. Price competition -- two firms competing with one another in prices -- can have a Prisoners' Dilemma aspect about it. Why? Because no matter how the other firm, your competitor, prices you might have an incentive to undercut them. If both firms behave that way, prices will get driven down towards marginal cost and industry profits will suffer. In the first case, if everyone shirks you end up with a bad product. In the second case, if both firms undercut each other, you end up with low prices, that's actually good for consumers but bad for firms. Let me mention a third example. Suppose there's a common resource out there, maybe it's a fish stock or maybe it's the atmosphere. There's a Prisoners' Dilemma aspect to this too. You might have an incentive to over fish. Why? Because if the other countries with this fish stock--let's say the fish stock is the Atlantic--if the other countries are going to fish as normal, you may as well fish as normal too. And if the other countries aren't going to cut down on their fishing, then you want to catch the fish now, because there aren't going to be any there tomorrow.

浅谈博弈论中的囚徒困境的解决方法

浅谈博弈论中的囚徒困境的解决方法 摘要:囚徒困境是博弈论中的一个重要范例,这个问题涉及各个领域。本文通过三个简单的实例,来谈谈解决的方法。 案例一:一个面馆的囚徒困境 我曾经在路边一个小店里吃面,由于当时客人不是很多,就顺便与小老板聊了起来。通过老板的介绍听出了一些门道。以前面馆开店的时候请了一个师傅,开始的时候为了调动他的积极性他们采用按销售量分成,一碗面给5毛钱提成。这样的话,客人越多他挣得也就越多,为了吸引更多的顾客,他在碗里放很多的肉来吸引回头客,一碗面才6块钱,本来就靠薄利多销,他放的肉多,面馆自然也赚不到钱。后来呢,就换了一个结算方式,给厨师发固定的工资,这样客人多少跟他没有什么关系,但是新的问题又出现了,这次他在碗里放肉放很少,基本上把所有的客人都赶走了。客人少了,他就轻松了啊反正他拿的是固定的工资。通过这个案例我们可以了解到面馆的老板与厨师在工资的分配上存在一定的分歧,由于没有处理好,使得双方都处在不利的结局。 解决方法:面馆的老板应该对厨师明确,每碗面的元材料是固定的,大师傅的工资还是按照销售量提成走,但是前题是每个月使用的原材料不能超额,否则只有基本工资。或者就规定每碗面里就放多少克肉。此外,还有一个更简单的办法就是:面馆的小老板亲自放肉。因为关键的资源一定要掌握在关键的人手里。 经过以上的分析,我们可以得知解决的方法:1.工资加提成的制度确实能调动员工的积极性;2.权利下放可以,但是要有度;3.员工的工资提成不能只和销量挂钩,应该和老板的利润挂钩。4.有效的沟通、激励,平时给员工传达精神的奖励,让员工认为自己也是公司的主人。 案例二:小餐馆的囚徒困境 在天津新建的一片经济适用房社区里有两家小餐馆,他们都是经营当地的家常炒菜及快餐。因为这里是新开发的经济适用房,而周边像小饭馆这样的生活配套设施很缺乏,所以附近的建筑工人都是在这两家小饭馆解决三餐。 这两家餐馆因为在口味、价格、菜的品种等都基本相同,所以一直以来这两家面对都是这些人,营业额都差不多,而附近的建筑工人们对于吃饭也没有什么特殊的爱好。好景不长,就在今年的夏天,两家餐馆的其中一家,暂且称为A

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考 二、囚徒困境的解释 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑8年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。 实际上囚徒困境在我们的实际生活中也有很多,下面举两个进行说明

三、经济学例子:关税战 两个国家,在关税上可以有以两个选择: 提高关税,以保护自己的商品。(背叛) 与对方达成关税协定,降低关税以利各自商品流通。(合作) 当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会作出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后二国又重新达成关税协定。(重复博弈的结果是将发现共同合作利益最大。) 四、商业例子:广告战 商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。 两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。 此二公司可以有二选择: 互相达成协议,减少广告的开支。(合作) 增加广告开支,设法提升广告的质量,压倒对方。(背叛) 若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 除了这些还有的很多类似的例子,比如说公共产品的提供,商家的价格战等等,在这里就不多赘述了。 五、“囚徒困境”现象的意义和启示 通过以上几个关于囚徒困境的例子,特别是作为经济管理学院的学生,我们可以将博弈论的一些知识运用好,更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中,我们应该认识到“看不见的手”还有更多内涵,有待我们去发掘。 本文主要通过对该理论的分析,从中发现对企业经营管理活动的有义启示。 第一,在市场竞争过程中,一名优秀的经营者,无论做任何决策还是考虑问题应该有战略眼观,特别是在做出对企业乃至行业今后发展的竞争策略时,从长远出发,做正确的决断。 第二,保存对手就是保存自己。在市场竞争中,让竞争对手发展就是自己发展,本着求同存异的思想,共谋发展,避免恶性竞争,避免两败俱伤的情况。 第三,市场竞争不是纯粹的竞争,在义和利之间应该如何取舍,是一位有战略眼观的企业家该做的第一个选择。 2杜兰:走出“囚徒困境”《通信企业管理》[J] 2003年第4期,第31页

《博弈与信息—博弈论概论》odd12

ODD Answers to Odd-Numbered Problems,4th Edition of Games and Information, Rasmusen PROBLEMS FOR CHAPTER12:Bargaining .26March2005.11November2005.Erasmuse@https://www.doczj.com/doc/fe11012101.html,.https://www.doczj.com/doc/fe11012101.html,. This appendix contains answers to the odd-numbered problems in the fourth edition of Games and Information by Eric Rasmusen,which I am working on now and perhaps will come out in2006.The answers to the even-numbered problems are available to instructors or self-studiers on request to me at Erasmuse@https://www.doczj.com/doc/fe11012101.html,. Other books which contain exercises with answers include Bierman&Fernandez (1993),Binmore(1992),Fudenberg&Tirole(1991a),J.Hirshleifer&Riley(1992),Moulin (1986),and Gintis(2000).I must ask pardon of any authors from whom I have borrowed without attribution in the problems below;these are the descendants of problems that I wrote for teaching without careful attention to my sources.

博弈论第二章

2 完全信息的动态博弈 2.1完全和完美信息的动态博弈 动态博弈(dynamic game):参与人在不同的时间选择行动。 完美信息(perfect information): 在博弈的每次行动的参与人完全知道博弈的历史。 2.1.A 理论: 逆向归纳法 简单的完全和完美信息博弈: 1. 参与人 1 选择行动a 1 2. 参与人 2 观察a 1,然后选择a 2 3. 收益是 u 1(a 1, a 2)和u 2(a 1, a 2) 求解博弈: 逆向归纳法 (backward induction) 1. 求解第二个阶段,对于a 1,求a 2 2 2max A a ∈u 2(a 1,a 2) 其解: a 2= R 2(a 1) ---- 反应函数 2. 求解第一个阶段 1 1m a x A a ∈ u 1(a 1,R 2(a 1)) 其解: a *1 逆向归纳解(outcome): (a *1, R 2(a *1) ) 注意: 在动态博弈中,行动与战略是不同的概念; 逆向归纳解与纳什均衡是不同的概念。

关于逆向归纳法的理性假定 例1 1 L R 2 2 0 L'R' 1 1 1 L''R'' 3 0 0 2 用逆向归纳法: 第3步:参与人1 选择L''; 第2步:参与人2 选择L'; 第1步:参与人1 选择L 逆向归纳解: L(在第一个阶段结束)。 如果博弈在第一个阶段中不结束,可能原因是什么? 2.1.B Stackelberg 模型 二个企业,生产产量: q1, q2 市场需求: P = a–Q, 其中Q = q1 + q2 成本: C i (q i) = cq i, i = 1, 2. 利润:πi (q1, q2) = Pq i–C i (q i) = (a– (q1 + q2))q i–cq i, 博弈的顺序: (1) 企业1 选择q1≥ 0; (2) 企业2 观察q1然后选择q2≥ 0;

博弈论之囚徒困境

博弈论之囚徒困境 阿普顿是普林斯大学的高材生,毕业后被安排在爱迪生身边工作,他对依靠自学而没有文凭的爱迪生很不以为然。一次,爱迪生要阿普顿算出梨形玻璃泡的容积,阿普顿点点头,心想:这么简单的事一会几就行了。只见他拿来梨形玻璃泡,用尺上下量了几遍,再按照武样在纸上画好革田,列出了一道算式,算来算去,算得满头大汗仍没算出来。一连换了几十个公式,还是没结果,阿普顿惠得满脸通红,狼狈不堪。爱迪生在实验室等了很久,觉得奇怪,便走到阿普顿的工作问,看到几张白纸上密密麻麻的算式.便笑荚说:“您这样计算太浪费时间了。”只见爱迪生将一杯水倒连玻璃泡内,交给阿普顿说:“再找个量筒来就知道答案了。”阿普顿茅塞顿开,终于对爱迪生敬服.最后成为爱迪生事业上的好助手。有时候。科学并不一定意味着烦琐的计算与剥量,而是一种有浓厚艺术气息的思维方式。前者固然可以得出正确的结论,但是后者同样可以用一种出入意表的方式曲径通幽。这种方式,与我们在生活中运用博弈科学有异曲同工之妙。大量的教学模型吓不倒我们,因为我们可以对它们置之不理。有一个脑筋息转弯问题是这样的:在什么情况下零大干二,二大干五,五又大干零’答案是:在玩“石头.剪刀.布”游戏的时候。 博弈.就是用这种游戏思维来突破看似无法改变的局面,解决现实的严肃问题的策略。在博弈中,每个参与者都在特定条件下争取其最大利益,强差一者来必胜券在握,弱者也未必永无出头之日。因为在博弈中,特别是多十参与者的博弈中,结果不仅取决干参与者的实

力与策略,而且还取决于其他参与者的制约和策略。事实上,博弈过程本来就不过是一种日常现象。我们在日常生活中经常薷要先分析他人的意田从而做出合理的行为选择,而所谓博弈就是行为者在一定环境条件和规则下,选择一定的行为或策略加以实施并取得相应结果的过程。 博弈论首先是我们思索现实世界的一套逻辑,其次才是把这套逻辑严密化的数学形式。博弈论的目的在于巧妙的策略,而不是解法。我们学习博弈论的目的.不是为了享受博弈分析的过程,而在于赢得更好的结局。说到底,博弈论毕竟只是一个分析问题的工具,用这个工具来简化问题,使问题的分析清晰明了也就够了。博弈的思想既然来自现实生活,它就既可以高度抽象化地用教学工具来表述,也可以用日常事例来说明,并运用到生活中去。 在斯大林时代的苏联,有一位乐队指挥坐火车前往下一个演出地点。正当他在车看当晚就要指挥演奏的作品乐谱时。两名克格勃(KGB,苏联国家安全警察。实际是政治特务将他作为间谍逮捕了。他们以为那乐谱是某种密码,这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲,却无济于事。在乐队指挥被投入牢房的第二天,审问者自鸣得意地走进来说:“我看你最好还是老实招了吧,我们已经抓住你的朋友柴可夫斯基了.他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了,只判你10年。”笑过之后,每个人都会思考其中所蕴涵的东西。但是如果认为这个笑话仅仅讽刺了克格勃特务的无知与无耻,那是不够的。事实上,克格勃们的花招,是想运

博弈论 蒋文华 浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉

如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚)特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。

----汉代刘向,《围棋赋》二、西方的理解 game(规则) 费厄泼赖(fairplay) 第三节学习博弈论的收益一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道,不选择严格劣势策略,因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道,理性选择导致次优的结果(协商难以达成目的的原因不是因为缺少沟通,而是没有强制力)。 3.通过愤怒天使博弈模型可以知道,汝欲得之,必先知之;永远选择优势策略,选择非劣势策略,损失小,如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢,就应该站在别人的立场去分析他们会怎么做。 第二讲学会换位思考 1.构成博弈要素包括,参与人,参与人的策略以及收益。 2.所谓严格优势策略,就是指不论对方采取什么策略,采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果,因为对手不会选择劣势策略;同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考,同时也是作为一个理性参与人的选择。 第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中,通过不断地迭代以及剔除来决定策略,由此,我们得到了一种新的选择策略的方法:迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差,主要是因为:①现实中选民并不是均匀分布的;②选民通常根据候选人的性格而非政治立场来进行投票,而政治立场只是单一维度;③只适用于只有两个候选人的情况;④同时存在弃权票;⑤选民未必相信候选人所声明的立场。 3.建立模型,是为了更好的描述事实以激发灵感,模型是有重要的事是抽象而来,逐步增加约束条件完善模型观察结果,比较分析结果的变化。 第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们,不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策:①参与人针对对手策略的定义:参与人i的策略s^i(简写成BR)是对手策略S-i的最佳对策,如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`,这对参与人i的所有Si`都适用,则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益;②最佳对策广义定义:参与人i的策略S^i是最佳策略(你对其他参与人可能采取的策略持信念P时的最佳策略),在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高(对于所有可选的Si`均成立)即Eu(S^i,P)≥Eu(Si`,P) Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。 第五讲坏风气与银行挤兑 1.纳什均衡,即对任意一个此博弈内的参与者A,他所选择的策略是其他参与人所选策略的最佳策略。

生活中的博弈论感悟(优.选)

《生活中的博弈论》学习感悟 第一讲初试博弈论 生活中的资源是有限和稀缺的,于是就产生了竞争,这种竞争就需要一种形式把大家聚在一起,这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用,其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧,还体现在我们生活中的种种小事中,如双方互拨打电话,放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手,但人的决策又具有有限理性,因此博弈论也不是万能的。 第二讲纳什均衡 在某一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。

囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析,可以发现合作是可以实现双赢的。如:两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加广告开支,设法提升广告的质量,压倒对方。(背叛)若二公司不信任对方,无法合作,背叛成为支配性策略时,二公司将陷入广告战,而广告成本的增加损害了二公司的收益,这就是陷入囚徒困境。在现实中,要二互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。 第四讲斗鸡博弈 所谓“斗鸡博弈”就是两只公鸡面对面斗争,继续斗下去,两败俱伤;一方退却便意味着认输。在这样的博弈中,要想取胜,就要在气势上压倒对方,至少要显示出破釜沉舟、被谁一站的决心来,以迫使对方退却。但到最后的关键时刻,必有一方要退下来,除非真正抱定鱼死网破的决心。学习了知识,就要善于联想,善于联系生活。在很多的时候我们都可能是在不知不觉中就使用了或者是接触到了博弈论,就像是平常我们和其他人之间的争执问题,每次都可能弄得脸红脖子粗的,双方都不服气,最终的结果是有一个人妥协,然后彼此达成一致;冷战期间的美苏两大军事集团的争斗也是一种“斗鸡博弈”。

博弈论与策略行为

博弈论与策略行为 G a m e T h e o r y a n d S t r a t e g y B e h a v i o r 蔡继明 教授/主任 清华大学政治经济学研究中心 Center for Political Economy at Tsinghua University CPET

目录 第一讲:导论 一、博弈论的研究对象 第二讲:占优战略与社会两难第三 讲:纳什均衡和双人博弈第四讲:三 人博弈与n人博弈第五讲:纯战略和 混合战略第六讲:博弈的合作解第 七讲:序贯博弈与子博弈完美均衡第 八讲:重复博弈第九讲:企业经营决 策的博弈分析第十讲:企业内部组织 分析第十一讲:政府行为分析 第一讲 导论 博弈论是研究理性的决策主体在其行为发生直 接的相互作用时的策略选择及策略均衡的理论。 博弈分析的关键步骤是找出在别人选择既定的情况 下自己的最优反应策略(给自己带来最大 收益的策略)。 二、博弈论的产生和发展 博弈又称博戏,是一门古老的游戏。 1. 博弈在中国《学弈》(《孟子 ?告 子》):弈秋,通国 之善弈也。使弈秋侮 二人 弈,其一人专心致志,惟 弈秋之为听;一人虽 听之,一心以为有鸿 鹄将至,思援弓缴而射 之。虽与之俱学,弗若 之矣。为是其智弗若 与?吾曰:非然也。 《世本》说,“乌曹作博”,乌曹乃是 夏代著名之能工巧匠。千百年来,博 弈更是与人们的生活紧紧相连,从博 棋到牌戏,从斗戏到彩票,中华民族 的历史长河中就这样形成了别具风情 的博弈文化 从孙子兵法到三十六计 从田忌赛马到孙庞斗智 从运筹帷幄到韬光养晦 从曹刿论战到论持久战

1

博弈论中经典案例--“囚徒困境”

博弈论中经典案例--“囚徒困境” 博弈论中有一个经典案例--“囚徒困境”。两个共谋犯罪的人被关入监狱,不能互相沟通情况。如果两个人都不揭发对方,则由于证据不确定,每个人都坐牢一年;若一人揭发,而另一人沉默,则揭发者因为立功而立即获释,沉默者因不合作而入狱十年;若互相揭发,则因证据确实,二者都判刑八年。由于囚徒无法信任对方,因此倾向于互相揭发,而不是同守沉默。囚犯可以做出如下选择:1、供出他的同伙(即与警察合作,从而背叛他的同伙),2、保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。囚徒困境模型的几个现实例子囚徒困境的例子在现实生活中很多。比如国家与国家之间的军备竞赛,显然,各国都不把大量的财富花在可能永远都用不上的军备上是最佳选择。可是,如果别的国家不把钱花在军备上,我们花,那么我们会在两国外交和贸易中占得优势,拥有国际影响力,在未来战争中赢得胜利。如果别国把钱花在军备上,我们也花,那么我们至少可以不吃亏。所以,不管别的国家把钱花不花在军备上,我们把大把大把的钱花在军备上都是优势选择。所以,我们会把钱花在军备上。显然,别国也会这样想。结果是各国都会把大把大把的钱花在军备上,而且还互相攀比,想要胜过对方,占得优势,以便给对方造成压力。这就造成了军备竞赛,你花一百亿,我花一百五十亿。你花一百五十亿啊,那么我花两

博弈论复习大纲下

博弈论第六讲--第九讲复习大纲 第六讲声誉和对称信息重复博弈 1、重复博弈(Repeated Game):是动态博弈的一种特殊情况。在重复博弈里,完全相同的环境一次次重复出现,参与人在重复出现的相同环境中做出决策。重复博弈是一类很重要的动态博弈。 2、有限次重复博弈例子:连锁店悖论:现象---博弈的重复进行对进入威慑博弈和囚徒困境的结果基本上没有影响;结论---在位者在包括第1个市场的所有市场上都将选择合谋。这个结论称为连锁店悖论。 通过对连锁店悖论的分析,得出结论:如果当事人完全理性,有限次重复博弈的均衡解和一次博弈没有区别。把这个结论推广到囚徒困境博弈中,就是说,尽管两个人都选择不坦白是集体最优的,但如果同样的博弈重复有限次,这个重复博弈的均衡仍然是(坦白,坦白)。 重复博弈比不重复进行的一次性博弈要复杂得多。在现实中,如果当事人不那么理性,或者看起来不那么理性,那么有限次重复博弈的结果有可能和一次博弈不同。那么在有限次博弈的囚徒困境中,就有可能实现(抵赖、抵赖)的结果。 3、无名氏定理:重复博弈中最重要也是最有名的结果是“无名氏定理”,该定理认为,只要局中人有足够的耐心,那么任何理性的可行盈利都可以在均衡中得以实施。换句话说,只要局中人的耐心足够地大,一次博弈中可行的理性结局总是可以与重复博弈中某均衡结局相一致。 无名氏定理告诉我们:在无限次重复博弈中声称完美均衡导致了某一特定的行为是没有意义的。 4、声誉:在重复进行的囚徒困境博弈里,只有博弈将重复进行无限次时,参与人才会选择合作。这是声誉的一个大问题。因为每个人都知道一个参与人将在最后一期选择坦白,那么为什么他们还要假设这个参与人会在目前建立起自己的声誉呢? 声誉应用: 5、折现率的概念以及无限次重复博弈中合作条件的推导,以产量卡特尔为例。 6、价格竞争对制造商的影响 7、进化与囚徒困境,鸽鹰博弈

相关主题
文本预览
相关文档 最新文档